- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
洞察先机——市场数据挖掘clementine软件基础部分_张辰
卖鞋 这里的人不穿鞋,原因是他们脚上长有脚疾 他们也想穿鞋,过去不需要我们公司生产的鞋,因为我们的鞋太窄。我们必须生产宽鞋,才能适合他们对鞋的需求 这里的部落首领不让我们做买卖,除非我们借助于政府的力量和公关活动搞大市场营销 我们打开这个市场需要投入大约1.5 万美元。这样我们每年能卖大约2 万双鞋 在这里卖鞋可以赚钱,投资收益率约为15% 截至6月底3G用户数量 中国移动用户数量为1046万人 中国联通756万人 中国电信大概718万人 目录 入门篇 认识洞察力营销(IDM) 数据挖掘软件Clementine基础 进阶篇 上市前产品营销思路和建模实操(P0-P3) 上市后产品营销思路和建模实操(P4-P6) 什么是洞察力营销(IDM)? 洞察力营销在电信业的考察维度 洞察力营销的支撑形式 工欲善其事 必先利其器 Clementine—数据挖掘 器 在Gartner的客户数据挖掘工具评估中,仅有两家厂商被列为领导者:SAS和SPSS。 SAS在市场执行、推广、认知方面有最佳表现;而SPSS在技术创新方面遥遥领先。 VS Clementine基础 Clementine 概览 数据读取 数据质量 数据间关系 数据整理 建模 结果与发布 Clementine 概览 鼠标应用 双键鼠标 拖动 删除 Del 节点编辑 双击 右键 节点改名 注解 Clementine基础 Clementine 概览 数据读取 数据质量 数据间关系 数据整理 建模 结果与发布 源 Clementine可以读取的数据格式 Excel,csv格式 文本格式数据 SPSS/SAS数据 Access/dBase/Foxpro/Oracle/SQL Server/DB2等数据库 用户输入数据 数据读取-Excel 1源excel.xls 数据读取-可变文件 2收入.csv Clementine基础 Clementine 概览 数据读取 数据质量 数据间关系 数据整理 建模 结果与发布 数据质量 数据质量评价 缺失值 节点介绍 -分布 -直方图 -统计量 数据质量评价 在数据挖掘之前,理解数据的取值范围及数值分布是非常重要的 直方图、分布、统计量 数据质量越高,挖掘结果准确性越高 数据审核 缺失值 数据集中未知、未收集或输入不正确的值。 缺失值(续) Clementine 可识别的缺失值类型: 无效值或系统缺失值 空字符串和空白 空值或用户定义的缺失值 缺失值处理方法 排除带有缺失值的字段或记录 使用各种方法插补、简单替换或强制替换缺失值 节点介绍-分布 光明政企主表.xls 节点介绍-直方图 光明政企主表 节点介绍-统计量 光明政企主表 Clementine基础 Clementine 概览 数据读取 数据质量 数据间关系 数据整理 建模 结果与发布 数据间关系-节点 统计量 研究连续型字段间线性相关关系 矩阵 研究字符型字段间关系 网络 研究字符型字段间关系 图 研究连续型字段间关系 直方图 研究连续型字段与字符型字段的关系 节点介绍-统计量(续) 宝安政企主表 节点介绍-矩阵 宝安政企主表 节点介绍-网络 宝安政企主表 节点介绍-图(散点图) 宝安政企主表 Clementine基础 Clementine 概览 数据读取 数据质量 数据间关系 数据整理 建模 结果与发布 数据整理-节点 记录选项 选择节点 汇总节点 合并节点?? 追加节点 ?? 字段选项 类型节点 过滤节点 导出节点 排序类节点 字段重排、排序、分箱节点 节点介绍-选择 光明政企主表,总收入30000 选择节点-函数输入 节点介绍-汇总 利用关键字段对数值字段进行汇总 光明政企主表,根据中心计算总收入 节点介绍-合并 根据多个表内相同的关键字段进行匹配并合并(vlookup) 节点介绍-合并(续) 4种匹配方式的不同 节点介绍-过滤 过滤字段Vs数据源过滤 节点介绍-追加 拼接结构相同的不同数据源 节点介绍-类型 导入或创建字段时为字段指定存储类型、字段格式和其他元数据 节点介绍-类型(续) 范围 数字值,如范围 0 - 100 或 0.75 - 1.25 离散 字符串值 标志 具有两个不同值的数据 集(集合) 具有多个不同值的数据 有序集合 具有顺序固定的不同值的数据。例如工资类别或满意度排序 无类型 不属于上述任何类型的数据或包含过多成员的集合类型 节点介绍-导出 生成新字段 对字段进行同一转换 光明政企主表 节点介绍-分箱、排序、字段重排 Clementine基础 Clementine 概览 数据读取 数据质量 数据间关系 数据整理 建模 结果与发布 Clementine基础 Clementine 概览 数据读取
您可能关注的文档
最近下载
- 八年级物理上册第二章第四节噪声的危害和控制.pptx VIP
- 13.3-导游的权利义务及执业管理制度(第7版).pptx VIP
- 智能运维在城市轨道交通供电系统的应用-2022.6.10-高剑锋.pdf VIP
- 北斗系统在交通运输行业应用现状及展望.pptx VIP
- 2025(必威体育精装版)国家开放大学电大本科《公共行政学》机考复习资料 .pdf VIP
- 人教版七年级上册《第一单元 生活中的音乐》大单元整体教学设计.docx
- 25春七下人教版生物默写小纸条--默写版.docx
- 【清华附中】小升初分班考真题-语文.doc VIP
- 六西格玛绿带模拟题复习试题.doc VIP
- 11.1概述(政策与法律法规 第五版).pptx VIP
文档评论(0)