一种基于Rough Set数据挖掘算法模型.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于Rough Set数据挖掘算法模型.pdf

第9卷 第6期 滁 州 学 院 学 报 Vo1.9 No.6 2007年 l1月 j0URNAL OF CHULq{OU UNIVERSrrY NOV.2o07 一 种基于Rough Set数据挖掘算法模型 葛 浩1,2 赵晓静 (1安徽大学 计算机学院,安徽 合肥 230039;2滁州学院 电子信息工程系,安徽 滁州 239012; 3安庆师范学院 计算机与信息学院,安徽 安庆 24601 1) 摘 要:提出了一种基于粗糙集理论的数据挖掘算法模型,该模型可以直接将发现的知识转化为可用的规划, 并通过实例验证了该方法的有效性。 关键词:粗糙集;数据挖掘;属性约简 中图分类号:TP181 文献标识码:A 文章编号:1673—1794(2007)06—0029—04 作者简介:葛 浩(1976--),男,安徽明光人,讲师,安徽大学计算机学院2004级硕士研究生,滁州学院电子信 息工程系。 1引言 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中 的,人们事先不知道的,但又是潜在有用的信息和知识的过程【l】。 粗糙集(Rough Set)121理论是由波兰数学家Z.Pawlak于1982年提出的一种处理不确定性问题的数学工 具。能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐 含的知识,揭示潜在的规律。其主要研究内容是基于决策表的数据处理,包括:数据预处理,即对有缺省值的 决策表进行完备化和离散化;在保持决策表决策属性和条件属性之间的依赖关系不变的前提下对决策表进 行化简;利用等价关系进行分类;通过推理获取决策规则等。 2粗糙集基本知识131 决策表信息系统是Rough Set理论的主要研究对象。 2.1决策信息系统 定义1 一个决策表信息系统可以定义为: S=(U,A,V, 其中,U为论域,是对象的集合,U={xl,x2,…Xltl:A为属性集,A=缸1,a2,…,跏},A由两个部分组成A:cUD 且CnD=①,C为条件属性集,D为决策属性集;V为属性的值域, :{ ,V ,…, }:/为信息函数,对于 VaEA, E U,有,【 ,0)E Va。 定义2对于知识系统s:(u,A),令尺 A,ind(尺)={ ,巧)lf(xi,6) ,6),V beR}称为s的不可区分关 系。显然不可区分关系为一个等价类,含 的等价类记为 ] 。 1.2粗糙集 定义3对于知识系统s=(u,A),令尺 A,尺』: ∈U{ 】 )称为 的尺下近似集:R X=lx E U1 枷n ≠ l称为 的尺上近似集;POSk(X)=R_X称为 的尺的正域,NEGk(X)=U-R X称为 的尺的负域; 剧 X-R X称为 的尺边界。 基金项目:安徽省高校省级自然科学研究项目(KJ2007B237);滁州学院自然科学项盟(2007KY044) 收稿日期:2007—07—28 — 29— 2.3简约和核 定义4 设R为一等价关系簇,则r ER,当ind(R)=ina(R一{r)),则称在R中是不必要的;否则,r是必要 的。若rER都为R中必要的称R是独立的;否则R是依赖的。 定义5设Q P,若Q是独立的,且ind(Q)=ind(P),则称Q是P一个约简,记为red(p)。P可以有多个约简, 则core(尸)=n red(P)为核。 2.4区分矩阵 定义6 设决策系统s=( ,CUD,v,j9,慨表示辨识距阵中第 行第 列的元素,则可辨识距阵可以定义为: ∈c Ja(xi)≠口( )}D(xi)≠D(xj) 。, 2.5依赖性

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档