- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
教学课件课件PPT医学培训课件教育资源教材讲义
;第一章 数据仓库与数据挖掘概述;1.1.1 为什么要建立数据仓库;1.1.2 什么是数据仓库;数据仓库的定义;2.与数据仓库相关的几个概念
数据(data)是一组表示数量、行动和目标的非随机的可以鉴别的符号,是对客观事物记录下来的,可以鉴别的符号。这些符号包括数字、字符、文字、图形、图像、声音。
操作数据
原子数据
汇总数据
特定查询响应
;数据类型的分类
元数据是指用来描述数据仓库数据库内容的数据。以后将详细讨论元数据。
数据库是一组内部相关联的数据集合。其中关系数据库是表的集合,每个表都有惟一的名字,且每个表都由一组字段(属性)所存放的记录组成。
数据库管理系统(DBMS)是用来管理和存取数据库的一组软件。该软件具有如下机制:数据库结构定义,数据的存储、并发、共享或分布的数据访问,数据的一致性和安全性。
数据库系统是一个由硬件、软件、数据库和管理人员组成的复杂系统。随着信息技术不断的发展,对数据处理的技术和人们对数据的需求也在不断的进化,如图1.2所示的数据库系统及相关技术的演化。
数据集市(data marts)通常是指较为小型化、针对特定目标且建设成本较低的一种数据仓库。为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subject data)。;数据库系统及相关技术的演化 ;数据仓库技术从本质上讲,是一种信息集成技术,它从多个信息源中获取原始数据,经过加工处理后,存储在数据仓库的内部数据库中。为了使数据仓库用户能有效地使用数据仓库中的信息,进行深层次的综合分析和决策,数据仓库系统要向用户提供一整套数据访问和分析工具。通过所提供的访问工具,为数据仓库的用户提供统一、协调和集成的信息环境,支持企业全局的决策过程和对企业经营管理的深入综合分析。;1.1.3 数据仓库的特点;;3.数据挖掘对企业的影响
;1.2.2 什么是数据挖掘;2.数据挖掘的分类
;3.与数据挖掘相关的几个概念
1)直接数据挖掘
利用可用的数据建立一个模型,模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述,分类、估值、预言属于直接数据挖掘。
2)间接数据挖掘
不是选出某一具体的变量用模型进行描述;而是在所有的变量中建立起某种关系。相关性分组或关联规则、聚集、描述和可视化属于间接数据挖掘。
3)描述式数据挖掘
以简洁概要的方式描述数据,并提供数据的有意义的一般知识。
4)预测式数据挖掘
分析数据,建立一个或一组模型,并试图预测新数据集的行为。
;3.与数据挖掘相关的几个概念(续)
5)数据库查询工具和数据挖掘工具之间的差异
查询工具能帮助用户从数据库数据中找到新的、有意义的事实。这类问题是查询所要访问的是对象是否在某一特定的位置。这与目前数据库系统中大部分的查询操作是相似的。通过这类问题使你可以确定对象将到达的位置。
6)信息
7)知识(knowledge)
8)数据、信息与知识的转化关系;1.2.3 数据挖掘的特点;1.2.4 数据挖掘的基本过程与步骤;;1.2.5 分析数据挖掘的内容;1.3 数据挖掘与数据仓库的关系;用户包括偶然用户(casual user)、高级用户(power user)和专家(expert)。
查询协同管理包括一些访问工具和系统管理工具,为用户访问数据仓库和其他系统提供手段。
数据仓库管理包括安全和特权管理,跟踪数据的更新,数据质量检查,管理和更新元数据,审计和报告数据仓库的使用和状态,删除数据,复制、分割和分发数据,备份和恢复,存储管理。
信息发布系统即把数据仓库中的数据或其他相关的数据发送给不同的地点或用户。 ;1.4.1 数据挖掘在零售业的应用;1.4.2 数据挖掘技术在商业银行中的应用;;1.4.3 数据挖掘在电信部门的应用;1.4.4 数据挖掘在贝斯出口公司的应用;1.4.5 数据挖掘如何预测信用卡欺诈;1.4.6 数据挖掘在证券行业的应用;第二章 数据仓库的分析 ;2.1 影响数据仓库成功的因素;影响数据仓库成功的因素 ;2.2.1 数据仓库计划与准备阶段;数据仓库的生命周期 ;2.2.2 数据仓库的其他阶段;2.3 数据仓库的基本体系结构 ;客户应用,是供用户访问查询,并以直观方式展示分析结果;
数据仓库,是存储不同程度的数据和元数据;
集成器,是将从运作数据库中提取的数据经过转换、计算、综合等操作,集成到数据仓库中;
监视器,是负责感知数据源发生的变化,并按需求提取数据;
数据源,是为DW提供最底层的运作数据库系统及外部数据。;2.4.1 数据仓库中的粒度;2.4.2 数据仓库中的数据分割;2.4.3 数据仓库中的数据组织;2.4.4 数据仓库中的快照;2.4.5 数据仓库中的元数据;第三章 数据仓库的设计与
您可能关注的文档
最近下载
- 《肛瘘中西医结合诊疗指南》-公示稿.pdf
- 《立式圆筒形钢制焊接油罐施工及验收规范》GB50128-2014附表.docx VIP
- 新版抖音内衣泳衣类目准入考试抖音达人内衣报白考试题库.docx VIP
- 公笃相法陈公笃.pdf VIP
- JC∕T 566-2022 吸声用穿孔纤维水泥板.pdf
- 北师大版 四年级数学下册《四边形分类》教学设计.doc VIP
- 碳素纤维复合材料可行性研究报告.doc VIP
- DL5009.3-2013 电力建设安全工作规程 第3部分:变电站.docx VIP
- 高等教育心理学知识点总结(张积家)华南师范大学.pdf VIP
- 药店库存盘点与库存管理培训.pptx VIP
文档评论(0)