- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进加权贝叶斯分类算法在空间数据中应用
基于改进加权贝叶斯分类算法在空间数据中应用 摘要: 朴素贝叶斯算法是一种简单而高效的分类算法,但它的属性独立性假设,影响了它的分类性能。针对这个问题,提出一种基于属性约简的PLS加权朴素贝叶斯分类算法。该算法首先分析属性之间的相关性,通过属性约简选择一组近似独立的属性约简子集,提出改进的偏最小二乘回归加权朴素贝叶斯分类算法,实验结果表明,改进算法具有较高的分类准确度。并将改进的算法应用于边坡识别问题中。 Abstract: Naive bayesian algorithm is a simple and effective classification algorithm, but its attribute independence hypothesis, influence its classification performance. According to this problem, the paper proposes a kind of attribute reduction based on PLS weighted simple bayesian classification algorithm. This algorithm firstly analyzes the relationship between attribute, through attribute reduction choose a set of approximate independent attribute reduction subset, put forward the improvement of the partial least-squares regression weighted simple bayesian classification algorithm, experimental results show that the improved algorithm has higher classification accuracy. And the improved algorithm is applied to slop identification. 关键词: 加权朴素贝叶斯分类;属性约简;偏最小二乘回归;边坡识别 Key words: Weighted Naive Bayes;attribute reduction;partial least squares;slope identification 中图分类号:TP391 文献标识码:A 文章编号:1006-4311(2012)36-0201-03 0 引言 朴素贝叶斯分类器(Naive Bayesian Classifier,NBC)是一种简单而有效的概率分类方法,由于其计算高效、精确度高,并具有坚定的理论基础得到了广泛应用。然而,朴素贝叶斯分类方法基于条件独立性假设,即假设一个属性对给定类的影响独立于其他属性,而这在现实问题中往往并不成立。 文献[1]给出了基于偏最小二乘回归(PLS)的属性求解算法。该算法用回归系数度量了条件属性与决策属性之间的相关程度。但忽略了冗余属性对回归分析的影响,为此,本文在分析属性相关性度量的基础上,通过属性约简的方法找出一组最近似独立的属性约简子集,从而删除冗余属性和无关属性,弱化了朴素贝叶斯分类器的独立性假设条件的限制。在约简的数据集上,在条件属性与决策属性之间建立基于属性约简的偏最小二乘回归方程,以回归系数作为条件属性的权值,进一步改进朴素贝叶斯的分类测试能力。并通过实验与朴素贝叶斯分类器进行比较。 1 朴素贝叶斯分类及加权贝叶斯分类模型 1.1 朴素贝叶斯分类算法 贝叶斯分类是一种基于统计方法的分类模型,贝叶斯定理是贝叶斯学习方法的理论基础。朴素贝叶斯分类模型在贝叶斯定理的基础上,通过条件独立性假设,降低计算开销,预测未知数据样本属于最高后验概率的类。 设每个数据样本用一个n维特征向量X={x1,x2,…,xn}表示,分别描述对n个属性A1,A2,…An样本的n个度量。假定有m个类C1,C2,…,Cm,给定一个未知的数据样本X,分类法将预测X属于具有最高后验概率的类。即朴素贝叶斯分类将未知的样本分配给类Ci,当且仅当P(Ci│X)>P(Cj│X),1?燮j?燮m,j≠i,这样,最大化P(Ci│X)。其中P(Cj│X)最大的类Ci称为最大后验假定。根据贝叶斯定理得:P(Ci│X)=■。 由于P(X)为常数,只需P(X│Ci)P(Ci)最大即可。给定具有许多属性的数据集,计算P(X│Ci)的开销可能非常大。为降低计算P(X│Ci)的开销,可以做类条
文档评论(0)