- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 装 ┊ ┊ ┊ ┊ ┊ 订 ┊ ┊ ┊ ┊ ┊ 线 ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 毕业设计(论文)报告纸 共 43 页 第 PAGE 42 页 第一章 绪论 1.1 数据挖掘的研究背景 随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。正是在这种需求的强烈驱动下,数据挖掘技术应运而生了。 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在联系,从而促进信息的传递。现在数据挖掘技术在商业应用中已经可以马上投入使用,因为对这种技术进行支持的三种基础技术已经发展成熟,他们是: 海量数据搜集 强大的多处理器计算机 数据挖掘算法 数据挖掘的方法有很多种,包括分类、预测、聚类、关联规则挖掘、序列模式挖掘等,其中分类是被广泛研究的课题之一。分类是指对给定的一组输入的属性向量,用归纳的方法将数据项映射到一个事先定义的类中的学习过程。其目标是建立一个分类模型,在构造分类模型时需要知道训练集中每个样本所属的类,因此是有指导的学习方法。用于分类挖掘技术的方法有很多,如决策树方法、遗传算法、贝叶斯网络、粗糙集、k-最临近方法、关联规则方法等等。在这其中,决策树方法以其算法容易被人理解、易转换成IF-THEN 分类规则、效率较高等优点被广泛研究与应用,使得它在数据挖掘领域中有着重要的地位。目前决策树方法中比较流行的算法有ID3、C4.5、CART、SLIQ、SPRINT等。分类研究在国外发展很快,已有很多成型的算法和模型,而我国发展相对滞后。因此数据挖掘分类算法的研究对数据挖掘技术有很大的意义。 1.2 数据挖掘及决策树的研究现状和发展趋势 1.2.1 数据挖掘的研究现状和发展趋势 从数据库中发现知识(KDD)一词首次出现在1989年举行的第十一届国际联合人工智能学术会议上,到目前为止,由美国人工智能协会主办的KDD国际研讨会已经召开了8次,规模由原来的专题讨论会发展到国际学术大会,研究重点也逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。1999年,亚太地区在北京召开的第三届PAKDD会议收到158篇论文,空前热烈。IEEE的Knowledge and Data Engineering会刊率先在1993年出版了KDD技术专刊。并行计算、计算机网络和信息工程等其他领域的国际学会、学刊也把数据挖掘和知识发现列为专题和专刊讨论,甚至到了脍炙人口的程度。 与国外相比[1],国内对DMKD的研究稍晚,没有形成整体力量。1993年国家自然科学基金首次支持我们对该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造;南京大学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及Web数据挖掘。 目前对数据挖掘的研究主要集中在分类、聚类、关联规则挖掘、序列模式发现、异常和趋势发现等方面,其中分类挖掘在商业等领域中的成功应用使它成为数据挖掘中最活跃、最成熟的研究方向,并且分类算法是数据挖掘中最重要的技术之一,是数据挖掘中的一个重要的课题。许多分类算法已经被机器学习、专家系统、统计学和神经生物学方面专家学者提出。数据挖掘中分类计数很多,常用的主要有决策树分类、贝叶斯分类、贝叶斯网络、神经网络、K-最临近分类、粗糙集和模糊逻辑技术。 1.2.2 决策树的研究现状和发展趋势 目前决策树技术己经在许多数据挖掘系统应用中得到了研究者和软件公司的极大关注,国内外很多公司均推出了自己的数据挖掘系统,其中很多都采用了决策树方法,而Microsoft、SGI、SAS在己推出的数据挖掘系统中,首选的方法都是决策树方法。 决策树算法的研究成果颇多,主要有1986年
您可能关注的文档
最近下载
- 2025年湖北省武汉市中考英语试题(附答案和音频).pdf VIP
- 高教社2025马工程教育学原理第二版教学课件第6章 学校教育制度.pptx VIP
- 2025喀什经济开发区兵团分区招聘(10人)笔试备考题库及答案解析.docx VIP
- 2024《南京地土建四工区施工组织设计》开题报告文献综述7100字.docx VIP
- 借 条(标准版)模板.pdf VIP
- 济源市建筑垃圾绿色低碳资源化利用项目环评报告表.pdf VIP
- [英语]动词的种类.ppt VIP
- 钢结构设计基础钢檩条设计檩条的布置连接与构造檀秋芬04课件讲解.pptx VIP
- 动词的种类动词的种类.ppt VIP
- 西门子S7-1500通过报文111实现对汇川SV660F伺服驱动器位置控制.docx VIP
有哪些信誉好的足球投注网站
文档评论(0)