- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
直接数据挖掘i
已经介绍的数据挖掘技术 直接数据挖掘 分类:神经网络,决策树 预测:神经网络,回归分析 非直接数据挖掘 聚类分析 可视化 关联分析 * 请分别给出直接数据挖掘和非直接数据挖掘在公共管理中应用的例子。 * 谢谢参与! * * * * 组织记忆:(1)以员工为载体的知识积累;(2)文档的记载;(3)由长期传承的办事方式、习惯而构成的组织文化。 * 结构化与非结构化的区别 * 直接数据挖掘和非直接数据挖掘的区别? * * * * * * * * * 决策树与神经网络的区别:解释能力; 在数据准备都很充分的情况下,对应用方而言决策树的使用难度更大,因为要设计决策树的节点。 * * * 聚类分析相对于数据立方体的多维分析的优点是更为直观,因为在数据立方体里的数据是按照各个维度特定序列规则进行的,从而无法达到可视化的效果。 * * * * * * * * 多维数据分析:数据仓库的基本应用 Online Analytical Processing (OLAP) 从不同的维度和视角对大量的数据进行分析。 * PRODUCT LOCATION SALES Soda Northeast 80 Soda Midwest 40 Soda West 70 Soda Southwest 75 Soda Southeast 65 Diet Soda Northeast 110 Diet Soda Midwest 90 Diet Soda West 55 Diet Soda Southwest 85 Diet Soda Southeast 45 PRODUCT LOCATION SALES Lime Soda Midwest 50 Lime Soda West 60 Lime Soda Southwest 45 Lime Soda Southeast 85 Orange Soda Northeast 25 Orange Soda Midwest 30 Orange Soda West 35 Orange Soda Southwest 45 Orange Soda Southeast 60 数据间关系的基本表达方式 * Product Location Soda Diet Soda Lime Soda Orange Soda Northeast 80 110 60 25 Midwest 40 90 50 30 West 70 55 60 35 Southwest 75 85 45 45 Southeast 65 45 85 60 数据间关系的二维表达 * 三维表达:数据立方 * 切片操作 专注于维度的子集,如1/1/2000。 * 切块操作 将维度替换为其维度的子集 * * 数据仓库 将当前和历史数据存储起来 围绕分析和决策的需要来整理数据 * 两层结构 * 数据挖掘与数据集市 数据挖掘 分析大量数据集合的工具 探索和分析的过程,为了发现有价值的、不明显的模式以及隐藏在数据库中的联系,它们对于提升业务的效率与效益有着极大的潜力 对于数据仓库而言最重要的应用 数据集市 数据仓库的子集 为特定的功能或者用户群体而对部分数据高度关注 * 三层结构 * 数据挖掘的类型 假设检验 保险推销员的年龄会影响他的业绩吗? 直接数据挖掘——当我们希望在数据中预测或估计某种模式时使用; 什么类型的顾客忠诚度较低? 非直接数据挖掘——当我们希望系统在数据中寻找模式时使用; 哪些服务之间的需求是互相联系的? * 直接数据挖掘I:分类 神经网络 决策树 * * * * * 训练网络 随机设定权重的初始值; 将训练数据提供给网络; 在训练中将外来的正确模式与神经网络的输出结果进行比较; 运用规则来调整权重; 通过调整权重来减少误差; 反馈调节权重直到所有的训练模式都被正确识别; 信息处理的过程就是模式识别的过程。 * 神经网络 * * * 直接数据挖掘II:预测 发掘一组自变量的值以预测因变量的值; 用每年时间和温度的数据来预测空调的销售情况。 技术: 多元回归; 神经网络。 * 非直接数据挖掘技术 聚类分析 可视化 关联分析 * 聚类分析 将数据点分组的过程,从而使得同一组内的数据点类似。 检查一大群最初没有差异的顾客,看看能否把它们分在自然形成的组内。 聚类不同于分类的区别在于结果是分析出来的而不是事先预定的。 没有预先制定的设想,希望数据挖掘工具能够揭示某些有意义的结构。 * * 聚类的例子 客户细分 收集客户在地理位置以及生活方式中的各种属性,找到具有类似客户属性的群体。观察不同群体中的客户购买方式差异。 电信公司服务网点的规划 * 关联分析 在一组记录中存在的某些内容意味着在该记录中同时存在另一些内容; 用于设计促销计划的超市购物篮分析。 啤酒和尿布 啤酒
您可能关注的文档
最近下载
- 方剂配伍理论智慧树知到课后章节答案2023年下浙江中医药大学.docx VIP
- 数控编程与仿真实训(第5版)——电子全套PPT教学课件.ppt
- 沪教牛津版英语4A-M3U1-In-our-school:animal-school公开课课件.pptx VIP
- 急性荨麻疹-洞察与解读.pptx
- 融资分红合同协议.docx VIP
- 草莓状血管瘤血管瘤-洞察与解读.pptx
- 皮肤念珠菌病念珠菌病-洞察与解读.pptx
- 荨麻疹型药疹药疹-洞察与解读.pptx
- DB5305T 78-2022保山市牛油果园水肥一体化技术规程.docx VIP
- DB53_T 1089-2022鳄梨品种'哈斯'生产技术规程.docx VIP
文档评论(0)