关联分析(Association Analysis).pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关系数 对于两个变量X 和Y, 相关系数公式为 假设 X 和 Y 是二元变量,表1 给出了关于变量X 和 Y 的信息。表中的单元格代表X 和 Y 的可能组合,每一种组合有关的频数列在表中 表 1, 2×2 列连表 相关系数 相关系数公式为 相关系数 0.5 被认为大, 0.3 适中, 0.1 小 关于这个句子的详细解释如下:大于0.5的相关系数 被认为关系强, 0.5-0.3 关系适度, 0.3-0.1 关系弱,小于0.1 的关系无关紧要,或者不值得关注。 相关系数 逆关联分析 例子. 表2 的数据来自一个商店的100个购物篮。其中“organic” 表示该购物篮包括有机蔬菜, “?organic”表示该购物篮不包括有机蔬菜 organic ?organic total non-organic 20 60 80 ?non-organic 20 0 20 total 40 60 100 Table 2, Market Basket Information 关联法则: “non-organic → organic” 支持度是 20%,可信度为 25% (supp (non-organic, organic)/ supp (non-organic)). “organic → non-organic”支持度是 20%,可信度为 50% (supp (non-organic, organic)/ supp (organic)). 逆关联分析 对于第二个法则,虽然支持度和可信度较高,但我们有?=-0.61. 说明两种物品是负相关的。因此这个关联法则是误导人的。 * A transaction T = {西红柿, 黄瓜, 洋香菜} T contains X = {西红柿, 黄瓜} An association Rule: X ? Y {西红柿, 黄瓜} ? {洋香菜, 洋葱} X = {西红柿, 黄瓜} Y = {洋香菜, 洋葱} Transactions that contain X are {1,2,3,4,7} Transactions in X that also contain Y are {1,3} Confidence of the rule: 2/5=0.4, c = 40. Transactions in D that contain X?Y = {西红柿, 黄瓜, 洋香菜, 洋葱} = {1, 3} Support of the rule= 2/8 = 0.25, s = 25 * * 1) itemset: set of items. The support for an itemset: number of transactions that contain the itemset. Itemsets with minimum support are called large itemsets. Others are called small itemsets 2) Straightforward algorithm to generate the association rules. All non-empty subsets of l should be found. * Example: {黄瓜, 洋葱, 西红柿} is large. Support = 3/8 All of its subsets are large as well: {黄瓜, 西红柿}, support = 5/8 {洋葱, 西红柿}, support = 4/8 ... -----------------------Assume minsup = 20% Start with {西红柿, 洋葱}, try {西红柿, 洋葱, 黄瓜}, s =3/8, generate try {西红柿, 洋葱, 洋香菜}, s=2/8 , generate try {{西红柿, 洋葱, 橄榄}, s=1/8, don’t generate. * Assume s=30% 面包: 4/8=0.5 0.3, 包括 黄瓜: 5/8=0.625 0.3, 包括 洋葱: 4/8 =0.5 0.3, 包括 洋香菜: 3/8=0.375 0.3, 包括 西红柿: 6/8=0.75 0.3, 包括 黄油: 1/8=0.125 0.3, 排除 奶酪: 2/8=0.25 0.3, 排除 橄榄: 1/8=0.125 0.3, 排除 食盐: 2/8=0.25 0.3, 排除 L1 = {{面包}, {黄瓜}, {洋葱}, {洋香菜}, {西红柿}} I

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档