数据挖掘01-概论教材课程.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘01-概论教材课程.ppt

* SAS Enterprise Miner * SPSS Clementine 以PMML(Predictive Model Markup Language)的格式提供与预测模型系统的接口 * DBMiner WEKA Waikato Environment for Knowledge Analysis 免费/非商业化 公开的数据挖掘工作平台 数据预处理 分类 回归 聚类 关联规则 * WEKA * WEKA WEKA Waikato Environment for Knowledge Analysis 区域1:挖掘任务面板 区域2:常用按钮 区域3:数据筛选或者数据变换 区域4:数据集的基本情况 区域5:数据集的所有属性 区域6:区域5中选中属性的摘要 区域7:区域5中选中属性的直方图 区域8:状态栏 * * * * * * * * 意大利,超市 37家连锁店,75天的会员消费记录 467200余条记录,涉及5000多类商品 选出最常购买的20多个商品, 46万多相关记录 * 意大利,超市 37家连锁店,75天的会员消费记录 467200余条记录,涉及5000多类商品 选出最常购买的20多个商品, 46万多相关记录 * * * * * * * * * * * * * * * 生物医学数据挖掘 Biomedical Data Mining 上海交通大学医学院 生物信息学平台 龚著琳 * 课程简介 课程目的 教学要求 教学方法 * 课程简介 教学参考书 生物医学数据挖掘,上海科学技术出版社 Intorduction to Data Mining. 人民邮电出版社. Pangning Tan, Michael Steinbach. 2006 Data Mining: Concepts and Techniques (Second Edition). 机械工业出版社, Jiawei Han, Micheline Kamber著. 范明, 孟小峰 等译. 2007 相关网站或期刊 * 次 内容 一 数据挖掘概论 二 数据采集与准备 三 数据预处理 四 回归1 五 回归2 六 分类1 七 分类2 八 聚类分析/关联规则 九 综合应用报告 十 考试 教学安排 * 课程简介 课程评价、考核 综合应用报告:30分 书面考试:开卷 70分 * 一、什么是数据挖掘 背景 * 进化阶段 商业问题 特点 数据搜集 (60年代) 过去五年中我的总收入是多少? 提供历史性的、静态的数据信息 数据访问 (80年代) 在北京的分部去年三月的销售额是多少? 在记录级提供历史性的、动态数据信息 数据仓库 决策支持 (90年代) 在北京的分部去年三月的销售额是多少?上海据此可得出什么结论? 在各种层次上提供回溯的、动态的数据信息 数据挖掘 (正在流行) 下个月上海的销售会怎么样?为什么? 提供预测性的信息 从商业数据到商业信息的进化 * 实例 案例1:购物篮分析(关联规则) 超市 案例2:客户信用评价 银行放贷 * 案例3:致病相对危险因子评价 哪类患者服用ACEI会引起血管性水肿? 案例4:大规模临床调查 危险因素与心肌梗死的关系 案例5:胃癌患者手术治疗的预后分析 * 归纳 需求的迫切性 实施的可行性 * 定义 1995年在加拿大蒙特利尔召开学术会议 1997年《 Knowledge Discovery and Data Mining 》:该领域第一本学术刊物 数据挖掘(Data Mining): 从大量的数据中,提取隐含在其中的、有用的信息和知识的过程。 一、什么是数据挖掘 * 数据挖掘 数据库技术 统计学 其他学科(医学) 信息科学 机器学习 可视化 和相关学科关系 * 和相关学科关系 数据库管理系统(DBMS) 统计学 * 数据挖掘与医学 课程属于方法论 生物医学数据的特殊性 生物医学人员的作用 * 第一章 概论 一、什么是数据挖掘 二、数据挖掘的过程 三、数据挖掘方法的分类 四、数据挖掘性能评价 * 二、数据挖掘的过程 * 二、数据挖掘的过程 明确目的 确定目标才能得到正确的结果 采集和组织数据(第二章) 既有的-数据库 数据预处理 控制数据质量 * 二、数据挖掘的过程 建立模型(第三~八章) 表达现象的规律 评价解释 评价模型的性能 应用 直接应用 间接应用 * 第一章 概论 一、什么是数据挖掘 二、数据挖掘的过程 三、数据挖掘方法的分类 预测型 描述型 四、数据挖掘性能评价 * 特点:预测 有指导(监督)学习 特征间存在因果关系 方法 回归分析(线性回归、神经网络、回归树、…) 分类(决策树、粗糙集、模糊集、…) 时间序列 …… 例:P3 预测型数据挖掘 * 特点:描述现状,

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档