- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验三:分类算法实验 实验三:分类算法实验 P(Ai)六个属性相互独立:P(A0|B0)*P(A1|B0)*......P(A5|B0) = P(Ai) 六个属性相互独立:P(A0|B0)*P(A1|B0)*......P(A5|B0) = P(A|B0) 。。。。。。 分别算出 取其中的最大值,其中,P(A)的值相同,可以不算出来。 If(P(B|A)最大 == 测试样例.ClassValues) return true; Else return false; 实验内容及步骤 实验内容: 利用贝叶斯算法或者决策树算法进行数据分类操作 数据集:汽车评估数据集(见附录) 实验步骤: 1.仔细阅读并了解实验数据集; 2.使用任何一种熟悉的计算机语言(比如C,Java或者matlab)实现朴素贝叶斯算法或者决策树算法; 3.利用朴素贝叶斯算法或者决策树算法在训练数据上学习分类器,训练数据的大小分别设置为:前100个数据,前200个数据,前500个数据,前700个数据,前1000个数据,前1350个数据; 4.利用测试数据对学习的分类器进行性能评估; 5.统计分析实验结果并上交实验报告; 1定义和初始化变量 2统计并计算条件概率P(Ai|Bi),(i=0,1,2,3),当训练数据比较小时会出现Bi等于0的情况,这时P(Ai|Bi)=nan,所以可以加一个判断,当P(Ai|Bi)0或 P(Ai|Bi)1时,让P(Ai|Bi)=0. 3计算(四个里面取最大) 4实验结果 四、思考题: 1. 两种算法在训练数据集和测试数据集上的性能一致吗?哪个比较好? ? 决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。 ????? 不同于贝叶斯算法,决策树的构造过程不依赖领域知识,它使用属性选择度量来选择将元组最好地划分成不同的类的属性。所谓决策树的构造就是进行属性选择度量确定各个特征属性之间的拓扑结构。 决策树的成功率为: 61.80372% ,贝叶斯成功率为:68.7831% (贝叶斯更好一点) 相比贝叶斯算法,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。 2. 提出一种提高分类器性能的方法并通过实验验证。 实验心得 通过这次实验加深了我对朴素贝叶斯的认识,学会了用朴素贝叶斯算法解决具体的问题。朴素贝叶斯分类是一种十分简单的分类算法,对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就觉得此待分类项属于哪个类别。朴素贝叶斯的原理决定了其成功率不可能太高,但是朴素贝叶斯的简单易用性使得其在一些日常生活中应用广泛。 附件(代码) #includeiostream #includecstdlib #includecstring #includevector #includefstream #includestdio.h using namespace std; int countTrain = 0;//训练样本数目 int countTest = 0;//测试样本数目 int countTestSuc = 0;//测试样本正确的数目 int countF=100; //训练和测试的分界 string CVname[4]={unacc,acc,good,vgood}; int ClassValues[4]; //unacc, acc, good, vgood int buying[4][4]; //vhigh, high, med, low. int maint[4][4]; // vhigh, high, med, low. int doors[4][4]; //2, 3, 4, 5more. int persons[4][4]; //2, 4, more. int lug_boot[4][4]; //small, med, big. int safety[4][4]; //low, med, high. float ClassValuesL[4]; //unacc, acc, good, vgood float buyingL[4][4]; //vhigh, high, med, low. float maintL
您可能关注的文档
最近下载
- 工学一体化课程《小型网络管理与维护》任务4单元4教学单元活动方案.docx VIP
- 铜矿开采施工人员培训方案.docx
- 配电架空线路通道内树木砍伐修剪施工方案.docx VIP
- 中文网络成瘾量表修订版(CIASR).docx VIP
- 如何正确上颌架?.pptx VIP
- 《燕尾型配合工件说》课件.pptx VIP
- ISO 4210-8-2023中文+英文-自行车–自行车的安全要求-第8部分.pdf
- 超星尔雅学习通《中华民族共同体概论(云南大学)》章节测试答案.docx VIP
- T∕ZZB 1228-2019 强制式简易升降机.pdf VIP
- (正式版)S-H-T 3551-2024 石油化工仪表工程施工及验收规范.docx VIP
有哪些信誉好的足球投注网站
文档评论(0)