数据仓库课件3.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库课件3

第3章数据仓库开发应用过程 数据仓库的开发应用像生物一样具有其特有的、完整的生命周期,数据仓库的开发应用周期可以分成:数据仓库规划分析阶段、数据仓库设计实施阶段以及数据仓库的使用维护三个阶段。 这三个阶段是一个不断循环、完善、提高的过程。在一般情况下数据仓库系统不可能在一个循环过程中完成,而是经过多次循环开发,每次循环都会为系统增加新的功能,使数据仓库的应用得到新的提高。 3.1数据仓库开发应用的特点 3.1.1 数据仓库开发应用的阶段性 数据仓库的开发应用过程划分为: 1、创始阶段:往往是为了满足一种明确的商业需求,倾向于建立一个小型数据仓库来提供管理报表和决策查询。这些数据仓库只能称之为数据集市,这种数据仓库的开发方法会限制企业各个部门今后的信息分享。 2、成长阶段:在这个阶段,为更多的应用开始建立更多的数据仓库。随着多个部门分散数据仓库的建立开始引发大量的问题。 3、控制阶段:在这个阶段需要用控制和整合的方法将各个主题数据仓库整合,从而将多个数据仓库结合起来形成一个决策支持环境。 4、成熟阶段 :成熟的数据仓库具有以下特征:企业聚焦于集成的信息、大量的来源和不断发展的主题领域、有多种用途的单一业务模型、数据的快速采集与加入、广泛的交易采集和使用、以客户为中心、惟一的真实版本、广泛的访问和管理安全、跨部门的应用、从属的数据集市或从属的数据仓库、使用数据仓库支持管理决策活动。 3.1.2 数据仓库的螺旋式开发方法 3.2 数据仓库的规划 3.2.1 选择数据仓库实现策略 3.2.2 确定数据仓库的开发目标和实现范围 3.2.3 数据仓库的结构 3.2.4 数据仓库使用方案和项目规划预算 3.3 数据仓库的概念模型设计 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.2 概念模型的定义 3.3.3 概念模型的分析 3.3.3 概念模型的分析 3.3.4 概念模型的设计 3.3.5 概念模型文档与评审 3.4 数据仓库的逻辑模型设计 3.4.1 分析主题域 3.4.2 粒度层次和聚集的确定 3.4.3 确定数据分割策略 3.4.4 关系模型定义 3.4.5 数据仓库的实体定义 3.4.5 数据仓库的实体定义 3.4.5 数据仓库的实体定义 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.6 数据仓库的数据抽取模型 3.4.7 数据仓库的元数据模型建立与应用 3.4.8 逻辑模型的评审 3.5 数据仓库的物理模型设计 3.5.1 数据仓库设计的规范 3.5.2 确定数据结构的类型 3.5.3 数据仓库索引的创建 3.5.4 确定数据存放位置 3.5.5 确定存储分配 3.5.6 数据仓库物理模型的评审 3.6 数据仓库的实施 3.6.1 数据仓库与业务处理系统接口的设计 3.6.2 数据仓库的创建 3.6.3 数据仓库的数据加载、复制与发行 3.6.4 数据仓库的中间件设计 3.6.5 数据仓库的测试 3.7 数据仓库的应用、支持和增强 3.7.1 数据仓库的用户培训及支持 3.7.2 数据仓库的使用方式 3.7.3 数据仓库使用中的数据刷新 3.7.4 数据仓库的增强 练 习 1.为什么说数据仓库的开发是一个不断循环、逐步提升的开发过程? 2.数据仓库的生命周期应该包含哪几个阶段?需要完成哪些工作? 3.在数据仓库的需求分析中需要对哪些人员进行需求调查,应该调查哪些内容? 4.数据仓库的设计包含那些内容? 5.怎样通过数据仓库的应用来增强数据仓库的功能与作用? 练 习 6.请为购买商品趋势分析设计一个数据仓库的星型模型,并给出维表的层次结构。 7.请为航空公司的航班分析数据仓库确定其主题的详细描述。 8.为航空公司的航班分析数据仓库设计一种数据抽取和转换方案,并提出选择此方案的理由。 9.在数据仓库的开发过程中需要对哪些模型进行评审,不同模型的评审内容有哪些? 3.数据仓库的数据清理转换方法 (1)类型转换。数据类型的转换,主要是将同一含义不同格式的数据转换成同样格式的数据类型。例如,将业务处理系统中客户性别0和1值改变为数据仓库中的布尔值。 (2)串操作。在数据清理中,有时需要将两个以上列的值裁剪、并接为一个列的值。例如,将客户的所在省、市、街道并接为一个完整的客户通讯地址。 (3)数

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档