数据挖掘原理与SPSSClementine应用宝典第11章粗糙集理论教学幻灯片讲义.pptVIP

数据挖掘原理与SPSSClementine应用宝典第11章粗糙集理论教学幻灯片讲义.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
教学课件课件PPT医学培训课件教育资源教材讲义

命题11-1 从信息系统的决策表中将属性集P中逐一移去, 每移去一个属性即刻检查其决策表, 如果不出现新的不一致, 则属性是可被约去的;否则属性不能约去。 命题11-2  全体不可约去属性集称为核集。 属性集合的约简和核的关系如下: 式中red(P)表示P的所有约简。core(P)含有P的全部约简中共同的等价关系,是属性集合P中不可缺少的重要属性集。 11.2.4 属性值约简 属性约简只是在一定程度上去掉了决策表中冗余属性,还是没有充分去掉决策表中的冗余信息。在判断某个对象属于某类时,其属性的取值不同,对分类产生的影响也不同。 例如,判断人的体形(瘦、中、胖)时,体重是主要属性。但若体重属性值为75Kg时,此人的体形要结合其身高、性别等属性才能确定。如果体重属性值为160Kg时,几乎肯定其体形为胖,这时身高、性别已不重要。 命题11-3 设 →是决策表上的一条决策规则, 属性值v 是一可被约去当且仅当 , 其中 和 均为决策表上的逻辑公式[8]。 11.2.5 决策规则[6] 决策表包含了某一领域的大量数据,是领域的样本数据库。它记录了大量样本的属性值和决策情况,是领域知识的载体。 知识获取的目的就是要通过分析这个实例库来得到该领域中有用的、规律性知识。 从决策表分析得到的规律性知识,通常采用决策规则的形式记录下来。下面给出决策规则的形式化描述。 定义11-13定义公式如下: (1)(a,v)(或写为av,a∈A,v∈Va,表示属性a的取值为v)是公式且是原子公式。 (2)如果A和B都是公式,那么 ,A→B都是公式。 (3)只有按定义(1)和(2)所组成的式子是公式。 对于决策表 是决策表,A=C∪D属性集合,子集 和 分别为条件属性集和决策属性集,有关决策规则的定义如下: 定义11-14 公式 称为P基本公式,这里 , ∈P, 。 定义11-15[11] 公式 称为Q基本公式,这里 , 。 定义11-16[11] 公式A→B为决策规则,如果A是P基本公式且B是Q基本公式,则A→B是基本决策规则。 11.2.6 基于可辨识矩阵属性约简算法[6] 可辨识矩阵(也称分明矩阵)是由波兰数学家Skowron.A教授提出的。 定义11-17 设相容决策表T=U,A,V,f,A=C∪D, 和D={d}分别为条件属性集和决策属性集, 是论域, 是样本 在属性上的取值。 表示可辨识矩阵中第i行j列的对象,则可辨识矩阵定义为: 其中, 由上述定义可以看出,可辨识矩阵是一个对称矩阵。当两个样本的决策属性取同时,对象值为0;当两个样本的决策属性不同且可以通过某些条件属性的取值加以区分时,对象值为这两个样本属性值不同的条件属性集合。 一个数据集的所有约简可以通过构造可辨识并且化简由可辨识矩阵导出的区分函数而得到,所有的蕴含式包含的属性就是决策表的所有约简集合。 算法11-1 可辨识矩阵属性约简算法 输入:相容决策表DT=U,A,V,f,A=C∪D是属性集合; 输出:约简的属性集。 步骤: Step1计算决策表的可辨识矩阵 ;//根据分辨矩阵的定义求元素 Step 2对于可辨识矩阵中所有取值为非空集合的对象 ,建立相应的析取逻辑表达式, , ; Step 3将所有的析取逻辑表达式 进行合取运算,得一个合取范式T,即 ; Step 4将合取范式L转换为析取范式的形式,得 ; Step 5输出属性约简结果。 基于可辨识矩阵和逻辑运算的属性约简算法可以得到决策表的所有可能的属性约简结果,它实际上是将对属性组合情况的有哪些信誉好的足球投注网站演变成为逻辑公式的简化 11.2.7 信息熵的属性约简 信息熵是信息论的核心内容,它最早应用于通信领域。由于信息熵可以刻画信息划分粒度的大小,也被广泛应用于信息不确定性的度量。 设U为一个论域,可以认为U上任一属性集合(知识、等价关系簇)是定义在U上的

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档