10客户管理.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
10客户管理

第十章 数据仓库 学习目标 通过本章的学习了解数据仓库的产生过程,掌握数据仓库的定义及特点。了解数据仓库的体系结构。了解数据仓库中的数据抽取、数据清理、数据转化、外部数据、历史数据、元数据等相关概念。了解数据集市和操作数据存储的概念及应用。了解多维数据库的相关概念,重点掌握多维数据模型上的OLAP分析动作。了解数据仓库模型设计的过程,重点了解数据仓库企业模型的设计。了解数据仓库的应用,掌握数据仓库投资效益分析的方法。 10.1 数据仓库基本概念 10.1.1 数据仓库的产生 随着数据库技术的广泛应用,企业拥有了越来越多的数据。如何高效、快速地使用这些数据,并从中得到有价值的信息已成为信息技术需要解决的一个问题。 而目前的情况是,企业建立了企业级数据库,各部门针对自己关心的问题,又在企业级数据库中抽取相关的数据组成部门级数据库。随着数据的逐层抽取,数据访问变的错综复杂。由于各部门分别抽取数据,针对同一问题抽取的数据内容也不尽相同,若他们均以自己抽取的数据进行分析,得到的结论也会产生差异甚至截然相反。可见,传统的关系型数据库无法满足分析数据、支持决策的需求。这势必要求分析型数据环境的产生。数据仓库就是在此时产生的。 数据仓库的产生将企业的数据处理分为两部分。传统的关系数据库处理企业的日常事务,数据仓库则用于分析数据中隐含的信息,以支持决策。 10.1.2数据仓库与数据库的区别 数据仓库与传统数据库在许多方面有很大的差异。通过对数据仓库和数据库的对比也更易理解数据仓库的含义。表10-1体现了数据仓库和数据库的区别,从表中我们可以看到,数据库只存储当前数据,而数据仓库存放历史数据;数据库主要面向业务操作,而数据仓库面向数据分析和决策支持;数据库中的数据是动态变化的,随时刷新,而数据仓库中的数据是静态的,一般不会改变;数据库的使用频率比数据仓库使用的频率高,数据访问量少,且要求的响应时间短。 表10-1数据仓库和数据库的区别 特性 数据库 数据仓库 数据 当前数据 历史数据 面向 业务操作 数据分析 存取 读写操作 多为只读 使用频率 高 较低 数据访问量 少 多 要求的响应时间 较短 可以很长 关注 数据输入 信息输出 10.1.3数据仓库的定义 著名的数据仓库专家W.H.Inmon在《Building the Data Warehouse》一书中给数据仓库的定义是:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、非易失的(Non-Volatile)、随时间变化的(Time Variant)数据集合,用于支持管理决策。该定义指出了数据仓库的四个特性:面向主题、集成性、非易失性和时变性。 面向主题的特性 在数据仓库中,所有的数据都是围绕一定的主题进行组织的。在关系数据库,针对同一主题的数据分布在相关的各个数据表中,而在数据仓库中,针对同一主题的数据存放在同一数据表中,这样,在分析数据时管理者可以在数据仓库中方便的找到包含他关心的主题的所有数据。这就是数据仓库面向主题的特性。 集成性 数据仓库中的数据都是经过清洗、过滤、转换的。它们有统一的格式、表示方式、代码含义、相同的单位表示。消除了源数据中结构、表示方式、含义的不一致性,数据仓库中的数据具有集成性。 非易失性 关系数据库中的数据是实时更新的,需要经常进行添加、更改,而且它只能保存短期内的数据。对于支持决策,历史数据是非常重要的。而数据仓库中的数据一旦写入,几乎就不再更改了,除非数据有错误,而对数据仓库进行的主要操作只是数据追加,因此数据仓库中的数据相对是稳定的,而且提供了足够的数据。因此说数据仓库中的数据是非易失的,或者说是稳定的。 时变性 数据仓库中的数据只增不删的,所以它记录了从开始使用数据仓库起的所有数据,它能反映企业各个时期的信息,也可以说它反映的是企业数据的动态变化。这对于决策分析也是至关重要的。 数据仓库的四个特性也从各自的角度反映了数据仓库利于决策分析的特点。 10.2数据仓库的基本原理 10.2.1数据仓库的体系结构 数据仓库的体系结构可以用图10-1来表示。由于数据库和数据仓库应用的出发点不同,因此数据仓库与业务数据库系统是相互独立的,但是数据仓库又同业务数据库密切相关。 图10-1数据仓库的体系结构 从数据仓库的体系统结构图中可以看到,数据仓库不是简单地对数据进行存储,而是对数据进行“再组织”。 10.2.2数据仓库的相关概念 要了解数据仓库,首先要了解数据仓库中的数据抽取、数据清理、数据转化、外部数据、历史数据、元数据等相关概念。 数据抽取 数据提取是指从外部数据源中收集数据。它提供建立数据仓库所需要的数据。数据仓库是在数据库的基础上建立起来的,但数据仓库

文档评论(0)

asd522513656 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档