- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
·
综合 2012 年第11 期(下)
基于ERFM 和二元logistic 的商业银行零售客户流失模型研究*
曹 国 许 娟 沈利香
(常州工学院 江苏 常州 213002)
摘要:本文利用 RFM模型和人口统计变量建立了 多维商业银行客 户流失预测指标,利用二元 logistic模
型构建商业银行零售客 户流失预警模型,结合案例银行进行了 实证研究 。结果表明:交易频率、最近交 易时
间、性别、以及年龄对商业银行零售客 户流失具有统计学意义,其 中交易频率、最近交易时间影响最为显著。
关键词:客 户流失 扩展 RFM模型 人口统计变量 二元 logistic模型
一、引言
随着外资银行的进入以及网上银行和电子金融的发展,银行面临着来自国内外同行业以及非同行业更加激烈的竞争,客户忠诚
度越来越低,进而导致客户流失率越来越高。客户流失直接关系到银行的发展前景和市场竞争力的强弱。因此,综合相关因素来分析
如何减少客户流失对于银行来说有着重大的意义,直接关系到商业银行在本行业中竞争的优势地位。当前,众多学者对客户流失进
行了研究。徐草、李敏(2010)针对移动用户的情况,在传统的贝叶斯分类器的基础上通过模糊算子法,将用户满意度转换成模糊数,
再通过相关计算化为精确数,提高了模型预测的正确性。翟顺平、朱美林(2008)利用神经网络错误率低对数据的噪音有很强的承受
能力等特点建立起SOM客户流失预测模型,为客户保持提供决策支持。钱苏丽、何建敏、王纯麟(2007)在建立支持向量机模型的客户
流失预测模型的时候由于考虑到代价敏感学习理论,并对模型进行改进,改进之后的模型与原来的相比预测的正确性以及稳定性都
得到了提高;蒋国瑞、司学峰(2009)通过与传统的SVM和ANN对比分析,最终得出基于代价敏感SVM的电信客户流失预测研究在精
确度、命中率、覆盖率上均有所改善,并且解决了数据集的非平衡性的问题,是有效的预测方法。
通过合并比较两种不同的神经网络混合模式,对所测试的数据集进行筛选并对模型验证,得出人工神经网络和人工神经网络模型与
其他混合模型相比表现出明显的优势。CataldoZuccaro(2010)通过人口统计学特征,比较二元logistic回归分析、人工神经网络、决策树
等方法,分析结构性特征对各种模型的分类以及正确率的影响。本文的目的在于通过分析现有的客户的历史数据,对客户的交易特
征和人口统计特征进行分析,并利用数据挖掘技术中logistic回归分析的方法,通过相关软件预测出流失的群体,从大量的客户数据
中找出内在规律性,预测出将来流失的客户,从而根据分析得出的结论,采用针对性的措施针对目标客户进行挽留。
二、研究设计
(一)变量选取 传统的RFM指标体系主要是依据客户的最近交易日、交易频率、交易金额来判断该客户是企业的黄金客户还是潜
在客户或是即将流失的客户。RFM模型由于其思想比较简单,又能刻画客户的交易行为,因此很早就在许多公司中获得了应用。但是,
理论界对此的关注却大大晚于实务界,直到信息技术的发展使得数据库营销技术得到大力发展的时候,该模型才开始得到广泛的研究
和应用。考虑到RFM模型较为简单,本文采用RFM模型并结合人口统计变量作为商业银行客户流失预测指标。样本数据中的因素包括
离上次购买的时间间隔、每月的消费金额、购买的次数、是否有小孩、性别、年龄。在模型建立前因变量与各个自变量之间的关系还不确
定,所以首先将各个变量都看成是因变量的影响因素,通过软件计算出各变量的偏回归系数,以及显著性检验水平检验剔除那些不符
合模型的变量。剔除那些没有统计学意义的变量之后再用逐步回归的方法,得出自变量与因变量之间的关系。例如根据常识,客户去某
一银行的频率越多那么他流失的可能性较小;再如客户是否有小孩对客户流失有何影响,假设有小孩的客户他们一般不会轻易地改
变,选择某一家银行服务之后长时间内不会改变他们的选择,那他们流失的可能性就比较小。假设的自变量和因变量之间的关系如图
(1)所示。其中+表示自变量和因变量之间是正相关的关系,“—”则表示因变量和自变量之间是负相关的关系。在上文中,只是各个自
您可能关注的文档
最近下载
- 【社会层面】社会主义核心价值观.ppt VIP
- 回话有招高情商回话术书本.doc VIP
- 【社会层面】社会主义核心价值观精品课件.ppt VIP
- 沪教8AUnit6Ancientstories more practice-The story of 100,000 arrows 公开课优质课教案教学设计.doc
- 小学《科学》新教材培训研讨会:技术与工程领域总体介绍.pptx
- 2024年中考英语复习 并列复合句 讲义学案(解析版).pdf VIP
- 血常规结果解释ppt课件.pptx VIP
- 第16课 课件 2022-2023学年高中新经典日本语基础教程第二册.pptx VIP
- 软件工程专业生涯发展展示.pptx
- 成人脑室外引流护理——中华护理学会团体标准解读.pptx
文档评论(0)