- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
本文格式为Word版,下载可任意编辑
第
第PAGE1页共NUMPAGES1页
CART算法对航空企业客户流失应用
为了减少客户流失导致企业巨大损失,构建了客户流失模型。通过航空企业客户信息、数据预处理、属性规约、数据离散化以及样本选用构建数据集,并运用CART算法进行客户流失预测,运用混淆矩阵和ROC曲线评估模型性能,证明该模型可行性和良好性,为航空企业开展持续改善营销活动提供参照。
客户流失;分类预测;混淆矩阵;ROC曲线;CART算法
1引言
伴随大数据时代到来,航空企业掌握隐藏在数据有价值信息成为获取商机关键原因,客户流失是导致企业利润损失重要原因。客户与企业保持关系越良好,带给企业利润就越高。不过不少客户成为新客户同步,又有一大批客户流失,一种老客户关系维护比获取一种新客户成本更小[1]。这就需要预测措施,怎样在客户即将流失前有效地发现,并对客户特征进行精确分析,从而协助营销部门确定也许流失目客户群体,制定有针对性方略是关重视点。基于决策树建立航空企业客户流失模型,将具有不一样特征客户划分为不一样客户类型,分析不一样客户群体特征,为制定营销方略提供参照。
2准备工作
2.1客户流失类型
由于不一样业务所对应客户流失定义不一,这里对客户流失类型定义:把客户类型MEMBER_TYPE分为三类。第一类:次年飞行次数和第一年飞行次数比例不小于或者等于90%客户为未流失客户,标识为0;第二类:次年飞行次数和第一年飞行次数比例不小于或者等于50%不不小于90%客户为准流失客户,标识为1;第三类:次年飞行次数和第一年飞行次数比例不不小于50%客户为已流失客户,标识为2.
2.2预测客户流失重要性
获得新客户,一般需要在销售、市场、广告和人力等方面花费诸多,然而大多数新客户白喉产生利润往往不如流失老客户。然而,在航空市场竞争日益剧烈今天,航空企业在客户流失方面应当引起自购重视,怎样改善流失问题,深入提高客户满意度。忠诚度是航空企业保持自身关键竞争力一大关键原因。因此,航空企业要做好客户流失预测工作。
2.3CART决策树
决策树是由内部节点、分支和叶子构成一种树状构造。由根节点开始,叶节点结束。决策树在数据分类和预测中是最简单易懂数据挖掘措施,同步也是一种非常有效分类算法。CART算法可用于分类和回归,相对ID3算法和C4.5算法应用愈加广泛,目前已经成功应用于医学疾病预测[2,3]、鱼种丰富度预测[4]、客户流失分析[5-7]、土壤湿度分析[8]等多种领域。
3分析措施与过程
大数据时代迅猛发展,使得企业客户数据呈数量级增长,怎样迅速并有效地发掘隐藏在数据价值,是企业必抓重点之一。目前航空企业客户数据重要体现出为数据量大、属性多而余。由于客户信息包括了MEMBER_NO、GFFP_TIER、SUM_YR_1、SUM_YR_2等44个属性。从系统中直接抽取数据不能直接表达客户流失特征,需要对样本数据进行探索性分析与预处理,包括数据缺失值与异常值探索行分析,数据属性构造、清洗和变换等、对已完毕预处理数据进行建模,构建客户流失模型、评估模型性能、调用模型实现实时诊断,逐渐完善该模型。
3.1数据来源
从某个航空企业抽取了-04-01至-03-31客户数据,共有62,988条记录,其中包含了44个属性,由于篇幅限制,给出部分属性名称以及阐明如表1所示。
3.2数据探索性分析
原始数据中存在大量缺失值与异常值,需要分析数据分布规律。数据探索成果如表3所示。原始数据中存在票价为空值,最小票价为0,最小票价折扣率为0,总飞行公里数不小于0状况。票价是空值也许是客户没有乘机记录,其他也许是客户乘坐免费机票或者积分兑换导致。原始数据中某些属性数据取值范围差异比较大,为了消除数量级数据导致影响以及数据变换属性取值分级,因此需要对数据进行离散化(3.3.2小节提及)。
3.3数据预处理
客户流失分析一般是针对老客户而言,这里定义飞行次数FIGHT_COUNT不小于6次客户为老客户。由于客户类型MEMBER_TYPE是由次年飞行次数以及第一年飞行次数比例确定,则第一年飞行次数等于0记录不满足分母不为零条件。发现数据中存在缺失值,原始数据中存在票价为空值,最小票价为0,最小票价折扣率为0,总飞行公里数不小于0状况。由于原始数据量很大,此类数据占比比较小,对于问题分析影响很小,因此对这些记录直接删除,即删除票价为空记录;删除票价是0、平均折扣率是0、总公里数不小于0数据。通过数据简单处理后,剩余数据是31,272条记录。3.3.1属性规约原始数据
您可能关注的文档
- 2025年护师终的工作总结与护师上岗培训工作总结范文.doc
- 2025年陕西省实验幼儿园大班综合练习试卷含答案.doc
- 汽车行业战略规划攻略.pptx
- 2025年实验幼儿园中班上学期期中考试试卷含答案.doc
- 2025年重点小学六年级语文下册强化训练试题长春版附答案.doc
- 2025年家具厂厂长个人年终总结与家具销售工作总结.doc
- 2025年大班保育员学期工作计划与大班保育员工作总结.doc
- 2025年重点小学六年级语文下学期全真模拟考试试题湘教版附解析.doc
- 2025年培训部主管就职致辞与培训部员工工作总结.doc
- 2025年综合管理科半年工作报告半年工作总结与综合管理科半年工作报告.doc
- 2025年团委编辑部述职述廉汇报与团工委志愿者调研报告.doc
- 2025年福建省小升初数学提升训练试题附解析.doc
- 2025年新版春季版幼儿园学前班下学期开学模拟考试试卷含答案.doc
- 2025年文艺部工作计划书新选与文艺部工作计划书素材.doc
- 2025年谁动了我的奶酪初中读后感.docx
- 2025年英语演讲稿写作格式范本与英语演讲稿常用的万能句型.doc
- 2025年三年级作文欢度六一.docx
- 2025年施工员终工作总结和工作计划范文与施工技术人员第三季度工作计划.doc
- 2025年各部门明年工作计划开头与合作医疗个人工作计划.doc
- 2025年大班毕业班教师演讲稿与大班第一学期保育员工作计划.doc
最近下载
- 黑龙江省中药炮制规范及标准 2012年版.pdf VIP
- 2025消防安全知识培训考试试题附答案.docx VIP
- 免维护铅酸蓄电池安装施工方案.pdf VIP
- 2024年新北师大版7年级上册数学课件 第5章 3 第1课时 以几何图形为背景.pptx VIP
- GB50341-2014 立式圆筒形钢制焊接油罐设计规范.docx
- 2.1确定主题 精有哪些信誉好的足球投注网站(课件)-七年级信息科技上册(川教版2024).pptx VIP
- 项目档案管理措施和方法.docx VIP
- 2024年南京社区工作者考试真题及答案.docx
- 导游证考试少数民族知识点整理.pdf VIP
- 2.2在线协作 选素材(课件)-七年级信息科技上册(川教版2024).pptx VIP
有哪些信誉好的足球投注网站
文档评论(0)