- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
什么是数据挖掘? 数据挖掘的技术思路 数据挖掘在移动中的应用之一 ——流失问题研究 Email:peter@ Tel8003 2002年11月11日 钟云飞 大纲 数据挖掘概述 数据挖掘方法论概述——CRISP-DM 如何应用Clementine对移动行业的流失问题进行数据挖掘 第一部分 数据挖掘概述 数据挖掘就是从杂乱无章的数据中找出规律 数据挖掘是把数据转化为信息的一个过程 没有相应的技术手段不可能达到这个目的 什么是数据挖掘? 在数据中发现有价值的规则或者模式 女性对市场活动做出回应,男性对市场活动不做出回应,和年龄无关 什么是数据挖掘? 数据变的复杂会如何? 女性对市场活动做出回应,老年男性也可能对市场活动做出回应 什么是数据挖掘? 数据挖掘可以从异常复杂的数据中发现规律 通过数据挖掘发现回应的5条规则: 1、如果收入大于29622,有孩子,并且孩子的数量小于等于2,那么对市场活动会回应 …… 通过数据挖掘发现不回应的5条规则: 1、如果收入小于12640.3,并且有一个孩子,那么对市场活动不会回应 …… 数据挖掘收益分析 向60%的客户发信,得到了90%的收益 数据挖掘的意义 数据挖掘收益分析 $85,000 $40,000 $125,000 ($125,000) $0 (1,000) ($250,000) (250,000) 差别 $335,000 40,000 $375,000 $1,125,000 $125 9,000 $750,000 750,000 数据挖掘以后 $250,000 0 $250,000 $1,250,000 $125 10,000 $1,000,000 1,000,000 数据挖掘以前 建模的费用 最终的利润 净利润 总收入 每个响应的收入 响应的数量 成本 发信的数量 目的:发现新客户(使响应率从1%提高到1.2%) 更好的数据挖掘结果 ! 知识 商业问题 ? 行业经验 数据挖掘的商业思路 ? 商业问题 数据挖掘问题 ! 商业问题解决方案 数据挖掘问题类型分类——商业角度 电信行业:流失、交叉销售、欠费模式发现、客户分群、客户价值评估…… 金融行业:贷款偿还预测、客户信用政策分析、客户分群、金融犯罪的发现…… 零售业:促销活动有效性分析、顾客忠诚度分析、购买推荐…… 政府行业:欺诈发现…… 电子商务:网络日志分析…… ……………………………… 返回 数据挖掘问题类型分类——技术角度 数据描述和汇总(Data description and sumarization) 细分(Segmentation) 概念描述(Concept descriptions) 分类(Classification) 预测(Prediction) 相关分析(Dependency analysis) 返回 一个演示—客户价值评估 ——数据挖掘更多的时候是一种理念,而不是表现在复杂的方法 商业问题: 微软公司提供的例子数据库——罗斯文商贸公司,如何对客户价值进行评估 数据挖掘问题: (1)如何描述客户价值?——购买总金额?购买频次?平均每次购买金额?最近购买金额?它们的线性组合? (2)需要什么样的数据挖掘方法?——描述汇总?分类?预测?概念描述?细分?相关分析? 商业问题解决方案 从所有客户中找出最有价值的10个客户,将名单发给市场部门,让其对这些客户进行更多的关注 关于数据挖掘工具的调查 2002年6月17日由调查, /polls/data_mining_tools_2002_june2.htm 第二部分 数据挖掘方法论概述——CRISP-DM 数据挖掘方法论 ——项目顺利实施的保证 商业理解 数据理解 数据准备 建立模型 模型评估 模型发布 关于数据挖掘方法论的调查 2002年8月7日由调查, /news/2002/n15/1i.html 商业 理解 数据 理解 数据 准备 建立 模型 模型 评估 结果 发布 确定商业 目标 形势评估 确定数据 挖掘目标 制定项目 计划 背景 商业目标 成功标准 拥有资源 需求、假定 和限制 风险和 偶然性 专业 术语 成本和 收益 数据挖掘 目标 数据挖掘 成功标准 项目计划 工具和方法 评估 CRISP-DM各个阶段的内容(1) 商业 理解 数据 理解 数据 准备 建立 模型 模型 评估 结果 发布 收集原始 数据 数据描述 数据探索 性分析 数据质量 描述 数据收集 报告 数据描述 报告 探索性数据 分析报告 数据质量 报告 CRISP-DM各个阶段的内容(2) 商业 理解 数据 理解 数据 准备
您可能关注的文档
- 2008软件测试技术-chap4白盒测试方法.ppt
- 大科学家牛顿.ppt
- 优质工程汇报材料编制(原创).ppt
- 岛津GC-2010维护操作指南.ppt
- 移动家校互联业务培训文档(2).ppt
- 高二历史 第5课 西方人文主义思想的起源.ppt
- 京石高铁乳化沥青技术-CA砂浆.ppt
- 大学物理(一)总复习.ppt
- 20100522伊泰·府利美2010年营销提案报告.ppt
- 新产品消费者需求调研报告-第一期-end.ppt
- 吉林软件水平考试考试考前冲刺试卷.docx
- 河南省洛阳市嵩县2024-2025学年八年级上学期期中考试地理试题(含答案).pdf
- 河南省部分重点中学2024-2025学年高三上学期11月质量检测生物试题(含解析).pdf
- 吉林设备监理师考试模拟试卷(6).docx
- 河南省洛阳市嵩县2024-2025学年七年级上学期期中考试地理试题(含答案).pdf
- 吉林司法考试考试考前冲刺试卷(1).docx
- 河北省秦皇岛市部分学校2024-2025学年高三上学期11月期中考试语文试题(无答案).pdf
- 河北省秦皇岛市青龙满族自治县部分学校2024-2025学年高二上学期11月期中考试数学试题(含答案).pdf
- 项目合作框架性协议书律师版(八篇) .pdf
- 专题五:情景默写-【一轮备战】2024年高考语文一轮总复习精讲精练(北京专用)(原卷版).docx
文档评论(0)