数据仓库设计与开发.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库设计与开发

粗略估算 粗略估算数据仓库中将来的数据行数和所需D A S D是粒度确定的起点; 数量级上的估计 双重或单一粒度 根据数据仓库环境中将具有的总的行数的大小,确定双重或单一粒度 确定粒度的级别 以猜测作为开端 以一定数量的反复分析来改进这个猜测 确定数据分割策略 把逻辑上整体的数据分割成较小的、可以独立管理的物理单元进行存储 。 便于数据的重构、重组和恢复,以提高创建索引和顺序扫描的效率 数据分割标准: 1.数据量 2.数据分析处理的对象 3.粒度分割的策略 定义关系模式 在概念模型设计时,我们就确定了数据仓库的基本主题,并对每个主题的公共码键、基本内容等做了描述。 在这一步里,我们将要对选定的当前实施的主题进行模式划分,形成多个表,并确定各个表的关系模式。 “商品”主题 公共码键:商品号。 商品固有信息: 商品表(商品号、商品名、类型、颜色)——细节级 商品销售信息: 销售表1(商品号、客户号、销售量、…)——细节级 销售表2(商品号、时间段1、销售量、…)——综合级 …… 销售表n(商品号、时间段n、销售量、…)——综合级 定义记录系统 定义记录系统是建立数据仓库中的数据以源系统中的数据的对照记录。 记录系统的定义要记入数据仓库的元数据。 商品主题的记录系统在元数据中可描述如表 主题名 属性名 数据源系统 源表名 源属性名 商品 商品 商品 商品 商品 商品 商品 商品 商品 商品号 商品名 类别 客户号 销售日期 售价 销售量 库存量 库存号 库存子系统 库存子系统 库存子系统 销售子系统 销售子系统 销售子系统 销售子系统 库存子系统 库存子系统 商品 商品 商品 客户 销售 销售 销售 库存 仓库 商品号 商品名 类别 客户号 日期 单价 数量 库存量 仓库号 4.3.4 物理模型设计 物理模型设计因素: I/O存取时间 空间利用率 维护的代价 主要工作: 全面了解所选用的数据库管理系统,确定一个最适合应用要求的物理结构,特别是存储结构和存取方法。 了解数据环境、数据的使用频率、使用方式、数据规模以及响应时间要求等。 了解外部存储设备的特征。 确定一个最适合应用要求的物理结构 (1)估计存储容量 对每一个数据库表确定数据量 对所有的表确定索引 估计临时存储 (2)确定数据的存储计划 建立聚集(汇总)计划 确定数据分区方案 建立聚类选项 (3)确定索引策略 在数据仓库中由于数据量很大,需要对数据的存取路径进行仔细设计和选择,建立专用的复杂的索引,以获得最高的存取效率。 (4)确定数据存放位置 (5)确定存储分配 (4)确定数据存放位置 在物理设计时,我们常常要按数据的重要程度、使用频率以及对响应时间的要求进行分类,并将不同类的数据分别存储在不同的存储设备中。 重要程度高、经常存取并对响应时间要求高的数据就存放在高速存储设备上,如硬盘; 存取频率低或对存取响应时间要求低的数据则可以放在低速存储设备上,如磁盘或磁带。 (5) 确定存储分配 物理存储中以文件、块和记录来实现。一个文件包括很多块,每个块包括若干条记录。 文件中的块是数据库的数据和内存之间I/O传输的基本单位,在那里对数据进行操作。 用一个简例来说明逻辑模型和物理模型的内容,见下图所示。 名称 类型 长度 注释 产品维表 包括公司所有产品的信息 Product-Key integer 10 主键 Product-Name char 25 产品名称 Product-SKu char 20 库存单位 销售员维表 包括不同地区的所有销售员信息 Salpers-Key integer 15 主键 Salpers-Name char 30 销售员姓名 Territory char 20 销售员所在区域 Region char 20 所在地区 订单事实表 包括公司收到的所有订单 Order-Key integer 10 订单键 Order-Name char 20 订单名称 Product-ref integer 10 参考产品主键 Salpers-ref integer 15 参考销售员主键 Order-Amount Num 8,2 销售额 Order-Cost Num 8,2 订单成本 逻辑模型 产品维表 产品键 产品名 库存单位 品牌 订单事实表 订单键 订单名 产品键 销售员键 销售额 订单成本 销售员维表 销售员键 姓名 地域 地区 4.4 数据仓库的实施 实施过程中需要完成的工作: 建立数据仓库与业务处理系统的接口 数据仓库的体系结构建立 实现数据仓库物理仓库与元数据库 进行数据仓库的数据初次加载 完成数据仓库的中间件设计 进行数据仓库的测试。 数据仓库与业务处理系统的接口 接口应该具有这样一些功能: 从面向应用和操

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档