第2章数据挖掘可挖掘的知识类型讲述.pptVIP

第2章数据挖掘可挖掘的知识类型讲述.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章数据挖掘可挖掘的知识类型讲述

数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编  邓 松 李文敬 刘海涛 编著 电子工业出版社 2.1 概念/类描述 概念/类描述就是通过对某类对象关联数据的汇总、分析和比较,用汇总的、简洁的、精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。 概念描述分为特征性描述和区别性描述。 特征性描述是指从与某类对象相关的一组数据中提取出关于这些对象的共同特征。生成一个类的特征性描述只涉及该类对象中所有对象的共性。 区别性描述描述两个或更多个不同类对象之间的差异。生成区别性描述则涉及目标类和对比类中对象的共性。 2.1 概念/类描述 数据特征的输出可以用多种形式提供。包括饼图、条图、曲线、多维数据方和包括交叉表在内的多维表。结果描述也可以用泛化关系或规则(称作特征规则)形式提供。 例如:利用面向属性的归纳方法(AOI),在一个商场数据库(2000销售)中进行属性归纳操作,获得了如下的归纳结果: 表2-1 AOI方法挖掘结果表格表示示意描述 2.1 概念/类描述 对于以上结果,也可以用组合表(crosstab)或其他图表的形式来加以描述。数据分析中可视化图示非常普遍。 表2-2 对应表2-1的组合表表示描述 图2-1 对应表2-2棒图表示描述 2.1 概念/类描述 图2-2 对应表2-1(部分数据)的饼图表示描述 2.1 概念/类描述 区别性描述是将目标类对象的一般特性与一个或多个对比类对象的一般特性比较。这种比较必须是在具备可比性的两个或多个类之间进行。 例如,对某校讲师和副教授的特征进行比较,可能会得到这样一条规则: “讲师:(78%)(paper3)and (teaching course2)”, 而 “副教授:(66%)(paper=3)and (teaching course=2)”; 该对比规则表示该校讲师中约有四分至三的人发表论文少于三篇且主讲课程不超过一门;而对比之下该校副教授中约有三分至二的人发表论文不少于三篇且主讲课程不少于一门。 2.2 关联模式 关联模式挖掘旨在从大量的数据当中发现特征之间或数据之间的相互依赖关系。这种存在于给定数据集中的频繁出现的关联模式,又称为关联规则。关联可分为简单关联、时序关联、因果关联等。这些关联并不总是事先知道,而是通过数据库中数据的关联分析获得的,其对商业决策具有重要价值。因而关联分析广泛用于市场营销、事务分析等应用领域。 挖掘关联知识的一个典型应用实例就是市场购物分析。根据被放到一个购物袋的(购物)内容记录数据而发现的不同(被购买)商品之间所存在的关联知识无疑将会帮助商家分析顾客的购买习惯。发现常在一起被购买的商品(关联知识)将帮助商家指定有针对性的市场策略。 比如:顾客在购买牛奶时,是否也可能同时购买面包或会购买哪个牌子的面包,显然能够回答这些问题的有关信息肯定回有效地帮助商家进行有针对性的促销,以及进行合适的货架商品摆放。如可以将牛奶和面包放在相近的地方或许会促进这两个商品的销售。 2.2 关联模式 根据关联规则所涉及变量的多少,可以分为多维关联规则和单维关联规则。通常,关联规则具有:X ? Y的形式,即”A1 ?...? Am ? B1 ?...? Bn”的规则;其中, Ai (i?{1,...,m}), Bj (j?{1,...,n})是属性-值对。关联规则X ? Y解释为“满足X中条件的数据库元组多半也满足Y中条件”。 例如:一个数据挖掘系统可以从一个商场的销售(交易事务处理)记录数据中,挖掘出如下所示的关联规则: age(X,”20-29”)∧income(X,”20K-30K”) ?buys(X,”mp3”)[support=2%,confidence=60%] 上述关联规则表示:该商场有的顾客年龄在20岁到29岁且收入在2万到3万之间,这群顾客中有60%的人购买了MP3,或者说这群顾客购买MP3的概率为六成。这一规则涉及到年龄、收入和购买三个变量(即三维),可称为多维关联规则。 2.2 关联模式 对于一个商场经理,或许更想知道哪些商品是常被一起购买,描述这种情况的一条

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档