实验三：分类算法实验.docVIP

下载本文档

18
0
约 14页
2017-07-28 发布于浙江
举报
版权申诉

实验三：分类算法实验.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

实验三：分类算法实验

HUNAN UNIVERSITY 人工智能实验报告题目实验三：分类算法实验学生姓名蒙寿伟学生学号 201408070120 专业班级智能科学与技术1401班指导老师袁进日期 2017年5月15日一．实验目的 1.了解朴素贝叶斯算法和决策树算法的基本原理； 2.能够使用朴素贝叶斯算法或者决策树算法对数据进行分类 3.学会对于分类器的性能评估方法二、实验的硬件、软件平台硬件：计算机软件：操作系统：WINDOWS?2000? 应用软件：C,Java或者Matlab 实验相关知识贝叶斯定理： P(A)是 A 的先验概率，之所以称为“先验”是因为它不考虑任何 B 方面的因素。 P(A|B)是已知 B 发生后 A 的条件概率，也由于得自 B 的取值而被称作 A 的后验概率。 P(B|A)是已知 A 发生后 B 的条件概率，也由于得自 A 的取值而被称作 B 的后验概率。 P(B)是 B 的先验概率，也作标淮化常量（normalizing constant）。以第一条数据为例：vhigh,vhigh,2,2,small,low,unacc ClassValues: unacc, acc, good, vgood 对应P(Bi)。（i=0,1,2,3）分别算出取其中的最大值，其中，P(A)的值相同，可以不算出来。 If(P(B|A)最大 == 测试样例.ClassValues) return true; Else return false; 实验内容及步骤实验内容：利用贝叶斯算法或者决策树算法进行数据分类操作数据集：汽车评估数据集(见附录) 实验步骤： 1．仔细阅读并了解实验数据集； 2．使用任何一种熟悉的计算机语言(比如C,Java或者matlab)实现朴素贝叶斯算法或者决策树算法； 3．利用朴素贝叶斯算法或者决策树算法在训练数据上学习分类器,训练数据的大小分别设置为：前100个数据，前200个数据，前500个数据，前700个数据，前1000个数据，前1350个数据； 4．利用测试数据对学习的分类器进行性能评估； 5．统计分析实验结果并上交实验报告； 1定义和初始化变量 2统计并计算条件概率P(Ai|Bi),(i=0,1,2,3），当训练数据比较小时会出现Bi等于0的情况，这时P(Ai|Bi)=nan,所以可以加一个判断，当P(Ai|Bi)0或 P(Ai|Bi)1时，让P(Ai|Bi)=0. 3计算（四个里面取最大） 4实验结果四、思考题： 1. 两种算法在训练数据集和测试数据集上的性能一致吗？哪个比较好？ ? 决策树（decision tree）是一个树结构（可以是二叉树或非二叉树）。其每个非叶节点表示一个特征属性上的测试，每个分支代表这个特征属性在某个值域上的输出，而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始，测试待分类项中相应的特征属性，并按照其值选择输出分支，直到到达叶子节点，将叶子节点存放的类别作为决策结果。 ????? 不同于贝叶斯算法，决策树的构造过程不依赖领域知识，它使用属性选择度量来选择将元组最好地划分成不同的类的属性。所谓决策树的构造就是进行属性选择度量确定各个特征属性之间的拓扑结构。决策树的成功率为： 61.80372%相比贝叶斯算法，决策树的优势在于构造过程不需要任何领域知识或参数设置，因此在实际应用中，对于探测式的知识发现，决策树更加适用。 P（Ai）六个属性相互独立：P(A0|B0)*P(A1|B0)*......P(A5|B0) = P(A|B0) 。。。。。。