DM案例-4 客户信用度分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2001/08/30 TeradataTM Warehouse Miner Training Workshop 案例-4 客户信用度分析 CMCC HQ ZhangLei Sunstone.Zhang@TERADATA-NCR.COM 专题概要 客户信用度是指根据客户在网时间、缴费情况、客户积分等相关要素对集团客户和个人客户进行评分,用于衡量客户缴费行为的好坏。 它由两部分组成:历史信用度+下月缴费可能性。 历史信用度根据用户近6月的欠费情况(欠费天数、欠费次数)和缴费情况(是否及时缴费、未及时缴费次数)来计算 下月缴费可能性则是考察其它相关因素,利用回归方法来计算客户下月及时缴费的可能性 这两部分的加权求和就构成了客户的信用度评分 客户信用度分析专题主要用于制定合适的催欠策略,对于信用度高的客户适当延长催欠时间,对于信用度极低的客户则及时停机以避免更大的损失,同时客户信用度也是计算客户价值时的要素之一 业务问题定义 客户信用度模型与客户价值模型类似,信用度由两部分组成: 历史信用度 下月及时缴费可能性 客户信用度评分 =历史信用度*系数X+下月及时缴费可能性*系数Y 目标客户范围 非特殊客户(公免、测试、员工等) 当前状态为在网 业务问题定义 (续) 历史信用度 从不欠费 1.0 近6月从不欠费(近6月平均欠费天数=0) 欠费后及时交费 (0.6,0.9) (近6月平均欠费天数0且近6月未及时缴费次数=0) 0.9 - 0.3*(R6M_OWE_DURATION/30) 欠费后不及时交费 (0.3,0.6) (近6月平均欠费天数0且近6月未及时缴费次数0) 0.6 - 0.3*R6M_OWE_CNT 欠费后逃费(这批客户已经被排除) 0 (当前状态=b,本月被局拆) 下月缴费可能性则是通过数据探索,选取与客户缴费行为有关的各种属性,然后用回归方法计算得到客户下月缴费的可能性历史信用度 数据准备 数据准备阶段包括: 数据清洗和预处理 建立物理数据模型(PDM) 数据的抽取转换和加载(ETL) 选择与抽样 使用物理数据模型作为选取和测试数据的依据,从数据仓库收集全部的各类数据,更好地了解客户. 物理数据模型设计 基表-总表(All items table) 客户基本资料 客户缴费资料 客户投诉资料 客户帐单资料 客户通话资料 根据客户编号和帐务年月进行连接形成总表。 派生变量-总表视图 在总表的基础上,进一步派生出比率字段形成视图。 在此基础上,一方面利用公式计算出客户的历史信用度,另一方面用回归方法计算出客户下月缴费的可能性 数据的抽取、转换与加载 尽管数据仓库中已经对原始的业务数据进行了清洗、转换和集成,仍然需要按照挖掘任务的要求生成挖掘专用的数据集市,并将数据从数据仓库抽取过来。 选择与抽样 选择和信用度分析有关的信息组成客户价值分析总表。 从总表中各抽取600000作为训练和测试集合,抽样比例约为总样本的28%左右。 探索型数据分析 采用可视化的工具或统计分析等方法来展示及探索各个变量对客户流失的影响,包括: 柱状图 频数分析 相关分析 值分析 … 探索型数据分析 值分析:通过值分析对数据进行基本的探查,包括空值数目、唯一值数目、空字符串数目、零值、最大值、最小值的统计,舍弃一些几乎全部是零值的变量。 相关分析:通过相关分析发现并找出与客户欠费标志(目标变量)相关性较强的客户属性 ,去掉和客户欠费标志相关的变量和相关系数小于0.1的变量,剩下的变量作为回归客户下月缴费可能性时的自变量。 建模 通过探索型数据分析,把所有数据准备好之后,就可以选用适当的数据挖掘工具及数据挖掘技术来建立客户信用度分析模型。 历史信用度的定义 从不欠费 1.0 近6月从不欠费(近6月平均欠费天数=0) 欠费后及时交费 (0.6,0.9) (近6月平均欠费天数0且近6月未及时缴费次数=0) 0.9 - 0.3*(R6M_OWE_DURATION/30) 欠费后不及时交费 (0.3,0.6) (近6月平均欠费天数0且近6月未及时缴费次数0) 0.6 - 0.3*R6M_OWE_CNT 欠费后逃费(这批客户已经被排除) 0 (当前状态=b,本月被局拆) 下月缴费可能性 首先把客户进行适当的分群,即下月欠费天数少于30天的客户定义为及时缴费客户,高于该值为未及时缴费客户;定义及时缴费客户为回归时的目标客户群 对目标客户群使用回归算法建立预测模型,抽取600000条记录作为训练数据集 采用所得回归模型计算每位客户下月缴费可能性的概率得分值 客户信用度评分 合并客户的历史信用度和下月缴费可能性,计算出最终的客户信用度评分: 客户信用度评分= (1000*历史贡献度)*0.8

文档评论(0)

好文精选 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档