- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据十大经典算法NveByes讲解PPT6
朴素贝叶斯算法Na?ve Bayes 李旺鹏 杜豪杰 刘承全 汤 翔 * 贝叶斯定理: * 关于分类: * 关于分类: 重点是,分类问题采用的是经验性的方法来构造映射规则,所以分类问题缺少足够的信息来构造100%正确的映射规则。通过对已有数据的学习实现一定概率意义上的正确分类。所以构造出的分类器不能把每个待分类项 正确的归类。 分类器的质量也与分类器的构造方法、待分类数据的特性以及训练样本数量等诸多因素有关系。 * 关于分类: * 朴素贝叶斯算法原理: * 朴素贝叶斯算法原理: * 朴素贝叶斯算法原理: * 朴素贝叶斯算法原理: * 朴素贝叶斯算法原理: * 贝叶斯算法处理流程: * 贝叶斯算法的处理流程: 第一阶段——准备阶段: 该阶段为朴素贝叶斯分类做必要的准备。主要是依据具体情况确定特征属性,并且对特征属性进行适当划分。然后就是对一部分待分类项进行人工划分,以确定训练样本。 这一阶段的输入是所有的待分类项,输出时特征属性和训练样本。分类器的质量很大程度上依赖于特征属性及其划分以及训练样本的质量。 * 贝叶斯算法处理流程: 第二阶段——分类器训练阶段: 主要工作是计算每个类别在训练样本中出现频率以及每个特征属性划分对每个类别的条件概率估计。输入是特征属性和训练样本,输出是分类器。 第三阶段——应用阶段: 这个阶段的任务是使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。 * 购买电脑实例: * 购买电脑实例: * 购买电脑实例: (2)计算每个特征属性对于每个类别的条件概率: P(age=“30”|buys_computer=“yes”)=2/9=0.222 P(age=“30”|buys_computer=“no”)=3/5=0.600 P(income=“medium”|buys_computer=“yes”)=4/9=0.444 P(income=“medium”|buys_computer=“no”)=2/5=0.400 P(student=“yes”|buys_computer=“yes”)=6/9=0.667 P(student=“yes”|buys_computer=“no”)=1/5=0.2 P(credit_rating=“fair”|buys_computer=“yes”)=6/9=0.667 P(credit_rating=“fair”|buys_computer=“no”)=2/5=0.400 * 购买电脑实例: * 购买电脑实例: P(X | buys_computer = “no”) P(buys_computer = “no”) = 0.019×0.357 = 0.007 因此,对于样本X,朴素贝叶斯分类预测buys_computer =” yes” * 总结 朴素贝叶斯算法的优点: a. 算法逻辑简单,易于实现; b. 分类过程中时空开销小; c. 算法稳定,对于不同的数据特点其分类性能 差别不大,健壮性比较好。 * 总结 那么“贝叶斯分类法的效率如何呢?” 该分类法与决策树和神经网络分类法的各种比较试验表明,在某些领域,贝叶斯分类法足以与它们相媲美。理论上讲,与其他所有分类算法相比,贝叶斯分类具有最小的错误率,然而,实践中并非总是如此。这是因为对其使用的假定(如类条件独立性)的不正确性,以及缺乏可用的概率数据造成的。 贝叶斯分类法还可以用来为不直接使用贝叶斯定理的其他分类法提供理论判定。例如,在某些假定下,可以证明:与朴素贝叶斯分类法一样,许多神经网络和曲线拟合算法输出的最大的后验假定。 * 总结: * 扩展: * 扩展: 对于第二个问题:朴素贝叶斯算法是在假定各个特征属性相互独立的情况下提出来,这在现实生活中是很难实现的,所以针对这个问题人们做了大量工作解决这个缺点。 (1)如果特征属性之间是有联系的,并且是一个有向 无环图,可以采用另一个相关的贝叶斯分类算法——贝叶斯网络。在此不再介绍。 (2)除了贝叶斯网络还有kononenko提出的semi-na?ve bayesian 算法,称为半朴素贝叶斯算法, * 扩展: 该算法就是将特征相关的属性分成一组,然后假设不同组中的属性是相互独立的,同一组中的属性是相互关联的。 (3)还有一种具有树结构的TAN(tree augmented na?ve Bayes)分类器,它放松了朴素贝叶斯中的独立性假设条件,允许每个属性结点最多可以依赖一个非类结点。TAN具有较好的综合性能。算是一种受限制的贝叶
有哪些信誉好的足球投注网站
文档评论(0)