判定树在学生成绩分析的应用 application of decision tree in students performance analysis.pdfVIP

判定树在学生成绩分析的应用 application of decision tree in students performance analysis.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
判定树在学生成绩分析的应用 application of decision tree in students performance analysis

判定树在学生成绩分析的应用 何雪清 (广州市商贸职业学校,广东广州510163) [摘要]教据挖掘是一种新的信息处理技术,其主要特点是对数据库中的大量数据进行抽取、转换、分析和其他模型化 处理,并从中提取辅助决策的关键性数据。其中,判定树以其出色的数据分析效率、直观易懂的结果展示等特点,倍受广大用 户的关注。本文将讨论数据挖掘中的判定树在学生成绩分析的应用。 [关键词]数据挖掘;判定树;信息增益度 集NE的大小分别为P,n,ID,基于如下两种假设:①在向量 1.前言 上间E上的一棵正确决策树,对任意例子的分类概率同E 随着信息技术的迅速发展,数据库的规模不断扩大,从 中正、反例的概率一致。②一棵决策树对一例子做出正确类 而产生了大量的数据。为了能给决策者提供一个统一的全 别判断所需的信息量为: 局视角,在许多领域建立了数据仓库,海量数据收集、存放在 o) 大型和大量数据库中。但大量的数据往往使人们无法辨别隐 I(p,n)一-mP--lo—g,面P一斋1啦击 藏在其中的能对决策提供支持的信息,理解它们已经远远超 如果属性A作决策树的根,A具有v个值{v。,v2,…, 出了人的能力;而传统的查询、报表工具无法满足挖掘这些 信息的需求。因此,需要一种新的数据分析技术处理大量数 个正例和N。个反例,那么子集Ei所需的期望信息是I(pi, nil,以属性A为根分类所需的期望熵是: 据,并从中抽取有价值的潜在知识,数据挖掘(DamMining) 由此应运而生。数据挖掘技术也正是伴随着数据仓库技术 的发展而逐步完善起来的。 E(A)-;皆I(pi㈣(2) 2.判定树简介 判定树是一个类似于流程图的树结构,其中每个内部节 根结点,对A·的不同取值对应的E的v个子集Ei递归调 点表示在一个属性上的测试,每个分支代表一个测试输出, 用上述过程生成A·的子结点B。,B:,…,Bv。 而每个树叶节点代表类或类分布。判定树由决策结点、分支 4.利用判定树技术研究学生考试成绩与其科目之间的 和叶子组成。判定树中最上面的结点为根结点,每个分支是 关系 一个新的决策结点,或者是树的叶子。每个决策结点代表一 个问题或决策,通常对应于待分类对象的属性。每一个叶子 4.1数据实例 结点代表一种可能的分类结果。沿判定树从上到下遍历的 本校职中一年级会计专业的学生期末考试成绩数据库, 过程中,在每个结点都会遇到一个测试,对每个结点上问题 数据库(已经导出到EXCEL文件)中的数据按照一定格式 的不同的测试输出导致不同的分支,最后会到达一个叶子 排列显示,其中的属性有:学号、姓名、班级、语文、数学、英 结点,这个过程就是利用判定树进行分类的过程。 语、政治、会计基础、计算机、体育、总分、名次。 判定树已经在广泛的应用领域对数据进行分类,以此达 4.2研究步骤 到预测的目的。用于创建判定树模型而被分析的数据元组称 首先,对数据进行规范处理。从数据库导出的原始记录 为训练数据集,判定树方法先根据训练数据集形成判定树, 表中,包含有五个班共262条记录,从原始记录表中选取了 如果该树不能对所有对象给出正确的分类,那么选择一些 姓名、班级、语文、数学、英语、政治、会计基础、计

您可能关注的文档

文档评论(0)

hello118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档