数据挖掘技术毕业的设计.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术毕业的设计

目 录 摘要 iii Abstract iv 第一章 绪论 1 1.1 数据挖掘技术 1 1.1.1 数据挖掘技术的应用背景 1 1.1.2数据挖掘的定义及系统结构 2 1.1.3 数据挖掘的方法 4 1.1.4 数据挖掘系统的发展 5 1.1.5 数据挖掘的应用与面临的挑战 6 1.2 决策树分类算法及其研究现状 8 1.3数据挖掘分类算法的研究意义 10 1.4本文的主要内容 11 第二章 决策树分类算法相关知识 12 2.1决策树方法介绍 12 2.1.1决策树的结构 12 2.1.2决策树的基本原理 13 2.1.3决策树的剪枝 15 2.1.4决策树的特性 16 2.1.5决策树的适用问题 18 2.2 ID3分类算法基本原理 18 2.3其它常见决策树算法 20 2.4决策树算法总结比较 24 2.5实现平台简介 25 2.6本章小结 29 第三章 ID3算法的具体分析 30 3.1 ID3算法分析 30 3.1.1 ID3算法流程 30 3.1.2 ID3算法评价 33 3.2决策树模型的建立 34 3.2.1 决策树的生成 34 3.2.2 分类规则的提取 37 3.2.3模型准确性评估 38 3.3 本章小结 39 第四章 实验结果分析 40 4.1 实验结果分析 40 4.1.1生成的决策树 40 4.1.2 分类规则的提取 40 4.2 本章小结 41 第五章 总结与展望 42 参考文献 44 致谢 45 附录 46 摘要:信息高速发展的今天,面对海量数据的出现,如何有效利用海量的原始数据分析现状和预测未来,已经成为人类面临的一大挑战。由此,数据挖掘技术 应运而生并得到迅猛发展。 数据挖掘是信息技术自然演化的结果,是指从大量数据中抽取挖掘出来隐含未知的、有价值的模式或规律等知识的复杂过程。 本文主要介绍如何利用决策树方法对数据进行分类挖掘。文中详细的阐述了决策树的基本知识和相关算法,并对几种典型的决策树算法进行了分析比较,如:核心经典算法——ID3算法;能够处理不完整的数据、对连续属性的数据离散化处理以及克服了ID3算法偏向于选择取值较多的属性作为测试属性的缺点的C4.5算法;利用GINI系数判别数据集中的分裂属性并形成二叉树的CART算法;使数据的分类不受机器主存的限制,有着良好的伸缩和并行性的SLIQ和SPRNIT算法。ID3算法是最核心的技术,所以本文主要对它进行了研究和设计实现。 第四章在JAVA编译器上实现ID3算法,并对结果进行分析,决策树生成,分类规则的提取,以便于以后直接使用这一规则进行数据分析。在论文的最后一章介绍了目前数据挖掘技术的研究前景。 关键词:数据挖掘;决策树;ID3算法;信息增益;熵值 Abstract: Today, the massage is passed very quickly. How to investigate current status and forecast the future with good use of tremendous original Data has been becoming the big challenge to human beings when facing the emergence of mass Data in information era. Consequently, Data mining technology emerge and boom quickly. Data mining, is the product of the evolution of information technology, which is a complex process excacting the implicated and valuable pattens, knowledge and rules from a large scale of dataset. This paper mainly introduces the decision tree algorithm for classification. Firstly, the basic knowledge about decision tree and some representative algorithms for inducing decision tree are discussed, including ID3,which is classical;C4.5,which can deal with continuous attributes and some empty attribute ,at the same time, it can o

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档