第二章:数据仓库.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章:数据仓库

北方工业大学信息工程学院 数据仓库的设计步骤 逻辑模型设计 确定数据分割策略 综合考虑数据量、数据分析处理的实际情况以及粒度划分策略等 数据分割必须是自然的,易于实施和理解的 北方工业大学信息工程学院 数据仓库的设计步骤 逻辑模型设计 定义关系模式 对在概念模式设计时确定的当前实施的主题域进行模式划分,以便形成多个表,并确定各个表的关系模式 每个主题由多个表来实现 这些表之间依靠主题的公共键码联系在一起 北方工业大学信息工程学院 数据仓库的设计步骤 逻辑模型设计 定义关系模式 如商场数据仓库的商品主题域 公共键码:商品号 商品固有信息:商品表 商品采购信息:采购表1,2,3..按不同时间段的综合表 商品销售信息:同上 商品库存信息:同上 其他导出数据:其他数据表 北方工业大学信息工程学院 数据仓库的设计步骤 逻辑模型设计 定义记录系统 将记录系统的定义记入数据仓库的元数据中 在将外部数据装载到数据仓库中时,必须选择最完整、最及时、最准确和最接近的数据作为记录系统 北方工业大学信息工程学院 数据仓库的设计步骤 逻辑模型设计 定义记录系统 如商品主题域 相关数据分散在采购、库存、销售子系统中 有关商品的信息有相交的部分,可能存在不一致性 需要从记录系统的要求出发,选择分散数据库中最完整、及时、准确和接近外部实体的数据定义为数据仓库的记录系统 记录主题名、属性名、数据源系统、源表名、源属性名等项 北方工业大学信息工程学院 数据仓库的设计步骤 物理模型设计 确定数据的存储结构 确定索引策略 考虑 速度 非常重要 确定数据存放位置 不同的物理介质 是否会在不同的表之间进行合并操作 确定存储分配 缓冲区大小 元数据 北方工业大学信息工程学院 数据仓库的设计步骤 数据仓库的生成 接口设计 从面向应用和操作的环境生成完整的数据 数据的转换 数据的计算与综合 对现有记录系统的有效扫描,以便以后进行追加 北方工业大学信息工程学院 数据仓库的设计步骤 数据仓库的生成 数据装入 确定数据装入的次序 清除无效或错误数据 数据粒度管理 数据刷新 北方工业大学信息工程学院 数据仓库的设计步骤 数据仓库的使用和维护 开发DSS应用 与传统DSS的区别 DW中开发DSS应用是从数据出发 DW中DSS应用的需求不能再开发初期完全了解 DW中DSS应用的开发是 一个不断循环的过程,是启发式的开发 例行分析处理:重复进行的分析处理,如部门统计分析、报表分析等 启发式分析处理:企业经营者受到某种信息启发而进行的一些分析处理,随机性较大 北方工业大学信息工程学院 数据仓库的设计步骤 数据仓库的使用和维护 开发DSS应用 开发步骤 合并数据:多个数据源 例行化:不断积累例行处理,形成一个大的集合,在以后进行同样的分析处理时,可以简化 北方工业大学信息工程学院 数据仓库的设计步骤 数据仓库的使用和维护 进一步理解需求,改善系统,维护数据仓库 维护内容 管理日常数据的装入 刷新数据仓库的当前详细数据 将过时数据转化成历史数据 清除不再使用的数据 管理数据仓库的元数据等 北方工业大学信息工程学院 数据仓库的设计步骤 Inmon 《构建数据仓库》 北方工业大学信息工程学院 利用SQL Server2005构建数据仓库 SQL Server 2005负责底层的数据库和数据仓库管理 SQL Server 2005集成服务(SSIS)负责数据的抽取、转换和装载(ETL) SQL Server 2005分析服务负责OLAP分析和数据挖掘 SQL Server 2005报表服务(SSRS)负责前端展示 北方工业大学信息工程学院 利用SQL Server2005构建数据仓库 数据源 数据源视图 表 视图 多维数据集 属性 层次 事实表 维度 度量值 北方工业大学信息工程学院 数据仓库的体系结构 粒度 按时间段综合数据的粒度 年月日时分秒 按采样率高低划分的样本数据库的粒度 根据一定的需求从源数据中的一个抽样 样本数据可以代替源数据进行模拟分析 可以大大降低实际分析的数据量,提高分析速度 如源数据量的1/100或1/1000 得出的分析结果误差极小,能建立起模型或反映趋势即可 样本数据库是建立在不同时点上的粒度 北方工业大学信息工程学院 数据仓库的体系结构 分割问题 将数据分散到各自的物理单元中,以便能独立处理,以提高数据处理效率 数据分割后的数据单元称为分片 将具有相关性的数据组织在一起,就会提高效率 如某一时间,某一时段的数据,某一地区的数据,特定业务领域的数据 北方工业大学信息工程学院 数据仓库的体系结构 分割问题 分割的优越性 容易重构 自由索引 顺序扫描 容易恢复 容易监控 北方工业大学信息工程学院 数据仓库的体系结构 分割问题 分割的标准 时间 商业领域 地

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档