基于关联规则客户识别应用研究.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则客户识别应用研究

基于关联规则客户识别应用研究   摘要:当今,竞争日益激烈,企业面临着前所未有的挑战。如何识别客户成为企业竞争发展的一项重要课题。基于关联规则的客户识别将有利于传统企业管理思想的创新。一个有效的客户识别方法应该可以进行探索性的数据分析,提高企业客户识别能力,发现更有趣的、更实用的和更特别的数据之间的关联规则。   关键词:客户关系管理系统,数据挖掘,分类,聚类,关联规则      随着经济的全球化趋势,市场竞争日益激烈。客户识别正是顺应这种发展的需求而出现的一种以客户为中心的新型商业模式。越来越多的企业将客户作为一切工作的出发点,比以往更加重视客户的满意度、忠诚度和客户利润贡献率的提升,客户识别日益得到了广泛重视和长足发展。进行有效的客户识别,就是要从储存大量客户信息的数据仓库中经过深层分析,使用关联规则,获得有利于商业运作、提高企业市场竞争力的有效信息。关联规则的支持,使客户识别的理念和目标得以实现,满足现代电子商务时代的需求和挑战。   1. 关联规则   关联规则的概念由美国r的Agrawal等人在1993年提出,是数据挖掘中一种简单而实用的规则。假设I是项的集合。给定一个交易数据库,其中每个事务(Transaction)t是I的非空子集,即,每一个交易都与一个唯一的标识符TID(Transaction ID)对应。关联规则在D中的支持度(support)是D中事务同时包含X、Y的百分比,即概率;置信度(confidence)是包含X的事务中同时又包含Y的百分比,即条件概率。关联规则是有趣的,如果满足最小支持度阈值和最小置信度阈值。这些阈值是根据挖掘需要人为设定。   1.1 什么是关联规则   在描述有关关联规则的一些细节之前,先来看一个有趣的故事:“尿布与啤酒”的故事。在一家超市里,有一个有趣的现象:尿布和啤酒竟然摆在一起出售。但是,这种奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购了深层分析,想??解顾客经常一起购买的商品都有哪些。沃尔玛数据仓库里集中了其各门店的详细的原始交易数据。在这些原始交易数据的基础上,沃尔玛利用关联规则对这些数据进行分析和挖掘。得出了一个令人意外的发现:“跟尿布一起被购买最多的商品竟是啤酒!”经过大量实际调查和分析,揭示了一个隐藏在“尿布与啤酒”背后的美国人的一种行为模式:在美国,一些年轻的父亲下班以后要经常到超市去买婴儿尿布,而他们中有30%~40%的人同时也会为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。   按照常规思维模式,尿布与啤酒风马牛不相及,若不是借助关联规则进行挖掘和分析,沃尔玛是不可能发现数据之间存在的这一有价值的规律。   1.2关联规则在客户识别中的应用   传统企业的信息管理系统由于缺乏数据挖掘功能,最多只能统计一些数据,从表面上似乎合理,但实际上根本不能反映出本质的情况,例如,通过传统的信息管理系统,我们得出某一种红酒在超市的销售额排名倒数第一位,按照以往的做法,该红酒肯定会停止销售,但是通过对所有销售数据进行关联分析,我们会发现消费额最高的客户中有25%常常买这种红酒,如果停止出售这种红酒,必然会引起这些高端客户的不满。   关联分析就是发现交易数据库中不同商品之间的内在的联系,利用关联规则找出顾客购买行为模式,如购买了某一商品对其它商品的影响。例如,它能发现数据库中如“90%的顾客在一次购买活动中购买商品X的同时购买商品Y”之类的问题。发现这样的规则可以应用于商品货架设计、库存安排以及根据购买模式对用户进行分析等。   用于关联规则发现的主要对象是事务型数据库,其中针对的应用则是商品销售数据。如果对这些历史数据进行分析,则可以对顾客的购买行为提供极有价值的信息。例如,可以帮助商家如何摆放货架上的商品,如何帮助商家规划市场等。总之,从事务数据中发现关联规则,对于改进商业活动的决策非常重要。   1.3实证研究   以超市的购物系统为例,阐述关联规则在客户识别中的具体应用。某超市货架上有许多货物,例如,牛奶、水果、可乐等,我们应用关联规则就是为了发现当一个人已经购买了牛奶时,那他有多大可能还会买水果呢?一种简单的方法就是利用概率计算,其定义如下:设A, B是两个事件,且P(A) 0称P(B|A) =P (AB)|P(A)为在事件A发生的条件事件B发生的条件概率。   首先,设定最小支持度为40%,假设该超市数据库中共有5条记录,如表1-1所示:(记录中1代表购买,0代表

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档