- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘CHAPTER数据挖掘应用及发展趋势
数据挖掘的应用和发展趋势 “有哪些突出的例子能够说明数据挖掘在科学和商业领域中的应用?数据挖掘未来向何处去?”在阅读了本书的前面一些章节后,这些问题可能是大家最为关心的。在这最后一章中,我们将讨论一下数据挖掘的应用,并对购买数据挖掘软件系统应注意的问题给出一些建议。另外介绍一下数据挖掘中的其他一些主题,如视频和音频挖掘,数据挖掘的统计方法,数据挖掘的理论基础,以及通过引入数据挖掘技术支持智能查询应答等。数据挖掘的的社会影响和未来趋势也在本章讨论之中。 10.1 数据挖掘的应用 在本书的前面章节中,我们主要讨论了对关系数据,数据仓库,和复杂数据类型(包括空间数据,多媒体数据,时序数据,文本数据,和Web数据)的挖掘原理和方法。由于数据挖掘是一门具有广泛应用的新兴学科,数据挖掘的一般原理与针对特定应用领域需要的有效数据挖掘工具之间,还存在不小的距离。本节我们分析几个应用领域,讨论如何为这些应用定制专门的数据挖掘工具。 10.1.1 针对生物医学和DNA数据分析的数据挖掘 在过去的十年里,生物医学研究有了迅猛的发展,从新药物的开发和癌症治疗的突破,到通过大规模序列模式和基因功能的发现,进行人类基因的识别与研究。由于目前生物医学的大量研究都集中在DNA数据的分析上,这里我们重点研究此应用的情况。近期DNA分析的研究成果已经导致了对许多疾病和残疾的基因成因的发现,以及对疾病的诊断,预防,和治疗的新药物、新方法的发现。 基因研究中的一个重要关注点是DNA序列的研究,因为这种序列构成了所有活的生物体的基因代码的基础。所有的DNA序列由四个基本的构块(称为核苷)组成:腺嘌呤(A),胞核嘧啶(C),鸟嘌呤(G),胸腺嘧啶(T)。这四个核苷组合构成很长的序列或链,类似一个双绞旋梯。 人类有约100,000个基因。一个基因通常由成百个核苷按一定次序组织而成。核苷按不同的次序和序列可以形成不同的基因,几乎是不计其数。具有挑战性的问题是从中找出导致各种疾病的特定基因序列模式。由于在数据挖掘中已经有许多有意思的序列模式分析和相似检索技术,因此数据挖掘成为DNA分析中的强有力工具,并在以下方面对DNA分析起着不小的贡献: 异构、分布基因数据库的语义集成:由于广泛多样的DNA数据高度分布、无控地生成与使用,对这种异构和广泛分布的基因数据库的语义集成就成为一项重要任务,以便于对DNA数据库进行系统而协同的分析。这促进了集成式数据仓库和分布式联邦数据库的开发,用于存储和管理原始的和导出的基因数据。数据挖掘中的数据清洗和数据集成方法将有助于基因数据集成和用于基因数据分析的数据仓库的构造。 DNA序列间相似有哪些信誉好的足球投注网站和比较:我们已经研究过时序数据挖掘中的相似有哪些信誉好的足球投注网站方法。在基因分析中一个最为重要的有哪些信誉好的足球投注网站问题是DNA序列中的相似有哪些信誉好的足球投注网站和比较。对分别来自带病和健康组织的基因序列,进行比较以识别两类基因间的主要差异。做法可以是首先从两类基因中检索出基因序列,然后找出并比较每一类中频繁出现的模式。通常,在带病样本中出现频度超出健康样本的序列,可以认为是导致疾病的基因因素;另一方面,在健康样本中出现频度超出带病样本的序列,可以认为是抗疾病的因素。注意,虽然基因分析需要相似有哪些信誉好的足球投注网站,但这里所需要的技术与时序数据中使用的方法截然不同。例如,数据变换的方法如伸缩,规范化,和窗口缝合等,这些是在时序数据分析中经常用到的方法,对基因数据而言是无效的,因为基因数据是非数字的,其内部的不同种类核苷间的精确交叉起着重要的功能角色。另一方面,频繁序列模式的分析在基因序列相似与非相似分析中非常重要。 关联分析:同时出现的基因序列的识别:目前,许多研究关注的是一个基因与另一个基因的比较。然而,大部分疾病不是由单一基因引起的,而是由基因组合起来共同起作用的结果。关联分析方法可用于帮助确定在目标样本中同时出现的基因种类。此类分析将有助于发现基因组和对基因间的交叉与联系的研究。 路径分析(path analysis):发现在疾病不同阶段的致因基因:引起一种疾病的基因可能不止一个,不过不同基因可能在疾病的不同阶段起着作用。如果能找到疾病发展的不同阶段遗传因素序列,就有可能开发针对疾病不同阶段的治疗药物,从而取得更为有效的治疗效果。在遗传研究中路径分析会起到重要的作用。 可视化工具和遗传数据分析:基因的复杂结构和序列模式通常可以由各种可视化工具以图,树,方体(cubiods),和链的形式展现。这种可视化的结构和模式方便了模式理解,知识发现,和数据交互。可视化因此在生物医学的数据挖掘中起着重要的作用。 10.1.2 针对金融数据分析的数据挖掘 大部分银行和金融机构都提供丰富多样的储蓄服务(如支票,存款,和商业及个人用户交易),信用服务(如交易,抵押,和汽车贷款),和投资服务(如共有基金(mutual funds))。有些还提供
您可能关注的文档
- 排水管头塑料模具设计及制造.doc
- 探索玉溪生态城建设及旅游发展互动关系措施.doc
- 挖掘机结构设计及研究.doc
- 排洪沟施组方案.doc
- 接触网技术课程设计报告高速电气化铁道接触网无交叉线岔分析及研究.doc
- 控制电机课程设计.doc
- 捷达轿车电控燃油喷射系统.doc
- 推进我国城化进程若干问题研究.doc
- 提供最强大最具权威蓄热式加热炉技术支持.doc
- 掺杂氮后对TiO薄膜光学性质影响.doc
- 战略解码第三天Final.pptx
- 市场部(品牌)李文霞PPC.pdf
- AI赋能环保教育中小学教案:AI环境监测培养环保意识(1).docx
- 2025年无人机驾驶员执照不同类型无人机(固定翼_多旋翼_直升机)气动特性对比专题试卷及解析.pdf
- 2025年拍卖师拍卖与科技跨界融合创新专题试卷及解析.pdf
- 2025年拍卖师拍卖行业数字化转型路径与挑战专题试卷及解析.pdf
- 2025年互联网营销师精准营销中的数据隐私保护专题试卷及解析.pdf
- 2025年房地产经纪人行业自律公约与监督检查专题试卷及解析.pdf
- 2025年演出经纪人演出技术中的知识产权保护(音乐版权、设计版权)专题试卷及解析.pdf
- 2025年互联网营销师经典社群营销案例拆解(小米_蔚来)专题试卷及解析.pdf
最近下载
- 台州利欧环保新材料有限公司年产10万平方米碳化硅陶瓷膜、30套碳化硅陶瓷膜过滤装置、2000套碳化硅陶瓷膜净水器技改项目环评报告.doc VIP
- (2025秋新版)苏教版科学三年级上册全册教案.docx
- 高二体育课题广播体操放飞理想教案.docx VIP
- 全民所有自然资源资产清查实物信息核查技术规程.pdf VIP
- 劳技课洗碗课件.pptx VIP
- 新版中华民族共同体概论课件第十六讲文明新路与人类命运共同体-2025年版.pptx VIP
- 环境影响评估软件:One Click LCA二次开发_(10).数据库管理与优化.docx VIP
- 4护理三基判断复习题.docx VIP
- 2025年全球RPG市场研究报告.pdf
- 老年心理照护-老年人心理健康诊断老年人心理健康判定与诊断.pptx VIP
有哪些信誉好的足球投注网站
文档评论(0)