海量数据智能处理-数据挖掘.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课程讲授介绍 三个部分  数据挖掘介绍  频繁模式分析和关联规则挖掘  流数据挖掘 印鉴 中山大学信息科学与技术学院 2010年7月21 日星期三 1 一、数据挖掘介绍  动机: 为什么要数据挖掘?  什么是数据挖掘?  数据挖掘: 在什么样的数据上挖掘?  数据挖掘功能 2010年7月21 日星期三 2 为什么要数据挖掘?  数据的爆炸性增长: 从TB到PB  数据收集和数据可用性  自动的数据收集工具, 数据库系统, Web, 计算化的社会  丰富数据的主要来源  商业: Web, 电子商务, 事务, 股票, …  科学: 遥感, 生物信息学, 科学仿真, …  社会: 新闻, 数码相机,  我们正淹没在数据中, 但却渴望知识!  ―需要是发明之母‖—数据挖掘— 自动化的大规模数据集的分析 2010年7月21 日星期三 3 什么是数据挖掘?  数据挖掘(从数据中发现知识)  从海量数据中提取感兴趣(重要的, 隐含的, 以前未知的和潜在有 用的)模式或知识  数据挖掘: 用词不当?  其他的名称  数据库中的知识发现(挖掘) (KDD), 知识提取, 数据/模式分析, 数 据考古学, 数据捕捞, 信息收割, 商业智能等.  当心: 所有的都是―数据挖掘”么?  简单的有哪些信誉好的足球投注网站和查询处理  (演绎的) 专家系统 2010年7月21 日星期三 4 数据挖掘: 多种技术的汇合 数据库技术 统计学 机器学习 数据挖掘 可视化 模式识别 其他技术 算法 2010年7月21 日星期三 5 为什么不是传统的数据分析?  庞大的数据  算法必须能够高度可伸缩以便处理TB数量级的数据  高维度的数据  Micro-array 可能有成千上万个维度  数据的高复杂性  数据流和传感器数据  时间序列数据, 时间数据, 序列数据  结构数据, 图, 社会网络和多链接数据  异构数据库和遗产数据库  空间, 时空, 多媒体, 文本和Web 数据  软件程序, 科学仿真  新的和复杂的应用 2010年7月21 日星期三 6 数据

文档评论(0)

ze122230743 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档