处理缺失数据的朴素贝叶斯分类增量算法.pdfVIP

处理缺失数据的朴素贝叶斯分类增量算法.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
处理缺失数据的朴素贝叶斯分类增量算法.pdf

V01.8No.14 2008 第8卷第14期2008年7月 科学技术与工程 July Science and 1671-1819(2008)14—3812—04 TechnologyEngineering @2008Sei.Tech.Engng. 处理缺失数据的朴素贝叶斯分类增量算法 蒋望东 陆小艺1林士敏2 (湖南财经高等专科学校信息管理系,长沙410205;广西桂能软件有限公司1,南宁530023; 广西师范大学计算机科学系2,桂林541004) 摘要在具有缺失数据的数据集的分类过程中,缺失的数据中蕴含着有用的信息未被考虑的情况会引起分类精度的下降。 增量式的学习能够利用不断加入的信息更新学习模型,并充分利用先验信息求解当前问题。给出了一个利用朴素贝叶斯分 类模型实现对缺失数据的增量分类的算法。该算法在增量学习的过程中考虑了缺失数据和先验信息对分类器的影响。 关键词增量学习 朴素贝叶斯 缺失数据 中图法分类号Tit391.75; 文献标志码A 在实际的应用中,由于获取数据的渠道以及对 定很大程度上限制了它的应用,但目前许多研究和 数据建模的差异等原因,造成所得的数据通常并不 应用都表明,即使违背这种假定,简单贝叶斯也表 完全符合已经定义好的便于处理的格式,这种不符 现出很强的鲁棒性旧J.本文给出了一个利用朴素贝 合定义格式的数据称为缺失数据或者是不完整 叶斯分类模型实现对缺失数据的增量分类的算法。 数据。 该算法在增量学习的过程中考虑了缺失数据和先 大部分的分类系统能够有效地学习是基于这 验信息对分类器的影响。 样一个前提:用于训练和测试的数据集是完整的, 1 贝叶斯分类增量模型 或者只有很少的特征值是不完整的,而且这些缺失 值均匀分布于样本中。事实上,由于各种原因,在 样本空间S由特征空间I和类别空间C组成: 许多现实数据库中都存在丢失数据的现象,并且丢 失值并不是均匀分布的。数据的缺失可能与某些 性的笛卡尔积:,=A,,A2,.,A。,特征属性 属性特征值的状态有关,这时缺失的数据中蕴含着 A。取离散值{a札};类别属性取1个离散值C= 有用的信息。 {c。,c:’’.一,c,}。分类问题的实质是找出实例空间 增量式的学习能够利用不断加入的信息更新 到类别空间的映射厂,使得对任一实例茹=(a。, 学习模型,并充分利用先验信息求解当前问题。贝 a2,.“,a1)∈,,存在唯一的cf∈C与之对应.类 叶斯推理模型以其坚实的数学基础和丰富的概率 标签应该满足: 表达能力,越来越受到人工智能界的重视…,尤其 I石) (1) cw=argmaxq=cP(c=ci 是它能充分利用先验信息的特性,使之成为增量学 根据贝叶斯公式及条件独立性假设可得: 习中的最佳选择模型。简单贝叶斯模型假定所有 的条件属性相对于分类类别是独立的,尽管这一假 P(c=ci

文档评论(0)

我的文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档