Python数据分析与挖掘实战 第6章 信用卡高风险客户识别.ppt

Python数据分析与挖掘实战 第6章 信用卡高风险客户识别.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * 2. 属性构建 数据预处理 在信用卡相关的征信工作中,主要从以下三个方向判定客户的信用等级,他们所包含的变量如下。 2. 属性构建 数据预处理 对这3个方向所包含的变量进行打分,并赋予相应的权重,得到相加后的总分,得分越高,则风险越高。 呆账 瑕疵户 逾期 强制停卡记录 退票 拒往记录 1 属性值 得分 1 2 0 2. 属性构建 数据预处理 得分 否 0 1 月刷卡额≤个人月收入 个人月收入 月刷卡额≤家庭月收入 月刷卡额家庭月收入 借款余额是否800万元 是 否 1 2 是 2 4 是 否 个人月开销月刷卡额 个人月开销月刷卡额 1 0 2 1 2. 属性构建 数据预处理 住家 职业 年龄 属性值 得分 =2 1 =3 0 =7|19|21 2 =8=11 1 =12=18|20|22 0 1,2,6 1 3,4,5 0 2. 属性构建 数据预处理 变量名称 历史信用 经济风险 收入风险 最小值 0 0 0 最大值 15 5 4 新属性构建后,对每个新属性的数据分布情况进行分析,其数据取值范围如下表所示。从数据中可以发现,3个新属性的取值范围差异比较大,为了消除取值差异带来的影响,需要对数据进行标准差标准化处理。 分析与建模 构建信用卡高风险客户识别模型步骤 对K-Means聚类算法进行参数寻优,确定合适的聚类数目。 在确定好聚类数目后根据构建的3个指标对客户进行聚类分群。 结合业务对每个客户群进行特征分析,分析其风险,并对每个客户群进行风险排名。 分析与建模 1. 聚类参数寻优 在K-Means聚类算法中,最关键的一个参数是k值,选择一个合适的k值有助于对数据进行更准确的分析。在评估Python聚类分群质量的指标中,当未知真实类别标签时,可以通过轮廓系数(Silhouette Coefficient)和簇内误差平方和(SSE)可以确定K-Means聚类算法中k的取值。 分析与建模 1. 聚类参数寻优 通过轮廓系数值图和簇内误差平方和图可以看出,聚类数目为2至3和3至4时平均畸变程度较大,簇内误差平方和的值也在聚类数目为3和4时出现了较大的拐点,再结合信用卡客户类型的实际业务情况,认为将聚类数目定为4时比较合适。 分析与建模 2. 构建信用卡高风险客户识别模型 采用K-Means聚类算法进行客户分群,聚成4类,得到聚类分群的结果如下表。 聚类类别 类别个数 聚类中心 历史信用风险 经济风险情况 收入风险情况 类别1 26856 -0 0-0类别2 3010 430类别3 20419 -001类别4 9134 -0-1-0分析与建模 3. 信用卡客户风险分析 根据每种客户的类型特征,对每类客户进行归类,绘制信用卡客户分析的雷达图。 4个类别在雷达图中按照面积的大小排序,从高到底依次是类别2、类别3、类别1和类别4。而面积越大代表着风险综合值越高,说明越容易发生信用卡违约情况。 分析与建模 客户类别 显著特征 类别1 经济风险 收入风险 类别2 历史信用风险 经济风险 收入风险 类别3 收入风险 历史信用风险 类别4 经济风险 历史信用风险 3. 信用卡客户风险分析 总结出每个客户类型的显著特征如下表。 *注:加粗字体表述最大值,斜体表示最小值,正常字体为次大值 分析与建模 通过上述特征分析的图表说明,每个客户类型都有显著的不同特征。基于该特征描述本案例的挖掘目标,定义客户类型为禁入类客户、高风险客户、潜在高风险客户、一般风险客户、一般客户,具体解释如下。 禁入类客户。这类客户历史信用糟糕,在历史信用风险上得分最高,且经济情况不佳,目前的经济收入稳定情况也不好。他们是银行的禁入客户,不少客户曾有过呆账、强制停卡记录,给银行的信用卡工作开展带来了麻烦,甚至造成了直接损失。 高风险客户。这类客户经济状况糟糕,历史行为中或多或少有瑕疵,收入稳定情况一般。因经济状况糟糕,这类客户可能无法按时按量还款,有极大的可能性给银行带来坏账或者逾期的情况。 3. 信用卡客户风险分析 分析与建模 潜在高风险客户。这类客户收入稳定情况糟糕,信用风险中等,经济状况中等。这一类客户因收入稳定性糟糕,缺乏稳定的收入来源,一旦发生工作变动,房屋变动,自身的资金无法周转开来就可能发生逾期,给银行信用卡工作开展造成一定的麻烦。 一般风险客户。这类客户的经济风险偏高,收入风险中等,是银行的关注对象,在某些特殊情况,例如,当资金周转困难时,有可能会导致延迟还款或逾期。 一般客户。这类客户历史行为记录

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档