4+Association-Pattern-联合分析的商业运用.pptVIP

4+Association-Pattern-联合分析的商业运用.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4Association-Pattern-联合分析的商业运用

关联模式分析(Association Pattern Analysis): 概述 关联模式分析: 概述 关联模式分析 (association pattern analysis): 从一系列过去的交易中发现有兴趣的“共发项”,每一笔交易都包含一个或多个产品项 零售交易分析 (例如:从零售商那里购买的物品) 识别那些产品可能被同时购买 共发数据模式 在货架摆放和促销方面有商业价值;例如:婴儿纸尿布和啤酒;薯片和软饮料;面包、牛奶和黄油 关联分析: 市场购物篮数据 关联分析: 市场购物篮数据表示法 关联分析: 项集和势 关联分析: 支持度 X?Y 的支持度:目标数据中,同时包含X与Y的交易数除以交易总数 N: 目标数据中所包含的交易总数 n(X∩Y): 目标数据中同时包含X和Y的交易数 关联分析: 可信度 X?Y 的可信度:在目标数据中,同时包含X与Y的交易数除以包含X的交易总数 n(X): 目标数据中包含X 的交易数 n(X∩Y):目标数据中同时包含X和 Y的交易数 关联定义: 支持度和可信度 衬衫 ? 领带, 支持度 = 13.5% ,可信度 = 70% 关联分析: 范例 关联分析: 范例 关联分析: 复杂性 假定公司销售100种产品 关联分析:挑战 可能的项集数目随着给定项集势的增长而成指数增长 因为关联分析的复杂性,计算所有可能项集支持度的代价非常高昂(比如:所需时间和计算量) 为了高效地执行关联分析(满足指定的最低支持度和可信度的关联关系),修剪策略可以被用来减少值得考虑项集的数目 基于测量支持度的向下闭包性质,最低支持度修剪可以被用来快速地挖掘关联模式 关联分析:向下的支持度闭包性质 如果关联模式 A和B和C? D 存在, 那么它的支持度 必须超过最低指定支持度 (s%)。也就是, 关联分析:向下的支持度闭包性质 关联分析:向下的支持度闭包性质 反向地, 关联分析: 向下的支持度闭包性质 Apriori 算法 Apriori 算法: 范例 假设: 最低支持度 s=30% 最低可信度 c=60% Apriori 算法: 范例 第一步: 产生频繁1-项集 Apriori 算法: 范例 第二步:产生候选2-项集 Apriori 算法: 范例 第三步:产生频繁2-项集 Apriori 算法: 范例 第四步: 从频繁2-项集中寻找关联模式 Apriori 算法:范例总结 关联模式分析 (Association Pattern Analysis) 找出多个目标/事件之间的重要关联 例: 一个顾客买了笔记本电脑,同时可能买一个无线局域网卡; 例如, 2- 项集 笔记本电脑 -- 无线局域网卡 无线局域网卡 笔记本电脑 {面包、牛奶、尿布、可乐} 5 {面包、牛奶、尿布、啤酒} 4 {牛奶、尿布、啤酒、可乐} 3 {面包、尿布、啤酒、鸡蛋} 2 {面包、牛奶} 1 项目/购买项目 标识 TID 1 0 0 1 1 1 5 0 0 1 1 1 1 4 1 0 1 1 1 0 3 0 1 1 1 0 1 2 0 0 0 0 1 1 1 可乐 鸡蛋 啤酒 尿布 牛奶 面包 标识 项集 (itemset): 一个或一群项的集合; 例如: {鸡蛋、牛奶} 项集的势 (大小, cardinality) : 一个项集所包含项的数目 在目标数据中,包含目标项集的交易数与交易总数之间的比率称之为该项集的支持度 (support of the itemset) 1. 当一个顾客购买衬衫时, 在 70% 的情况下,他或者她将购买领带! 2. 我们发现这种关联模式在整体交易中发生的概率是13.5% 可信度 支持度 例: 交易 客户 代码 代码 商品 价格 时间 101 201 Computer 1500 1/4/99 101 201 MS Office 300 1/4/99 101 201 MCSE Book 100 1/4/99 102 201 Hard disk 500 1/8/99 102 201 MCSE Book 100 1/8/99 103 202 Computer 1500 1/21/99 103 202 Hard disk 500 1/2199 103 202 MCSE Book 100 1/2199 项集 {Computer, Hard disk}的支持度 是 1/3=33.3%. 项集 {Computer}的支持度是多少? 关联: {Computer}? {Hard disk} 支持度: 1/3=33.3%, 可信度: 1/2=50% {Computer}? {M

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档