第3章__数据仓库系统的设计与开发.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章__数据仓库系统的设计与开发

数据仓库与数据挖掘 第3章 数据仓库系统的设计与开发 3.1 数据仓库系统的设计与开发概述 建立一个数据仓库系统的参考步骤 数据仓库系统的生命周期 创建数据仓库系统的两种思维模式 数据仓库数据库的设计步骤 建立一个数据仓库系统的参考步骤 收集和分析业务需求步骤 建立数据模型和数据仓库的物理设计 定义数据源 选择数据仓库技术和平台 从操作型数据库中抽取、清洗及转换数据到数据仓库 选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件 更新数据仓库 数据仓库系统的生命开发周期 创建数据仓库系统的两种思维模式 自顶向下(Top-down) 自底向上(Bottom-Up) 数据仓库数据库的设计步骤 3.2 基于SQL Server的数据仓库数据库设计过程详解 分析组织的业务状况及数据源结构 组织需求调研,收集业务需求 采用信息包图法进行数据仓库的概念模型设计 利用星形图进行数据仓库的逻辑模型设计 数据仓库的物理模型设计 MS SQL Server 2005的数据仓库架构 分析组织的业务状况及数据源结构 开发的第一步是要了解和理解组织的业务状况,对于企业来说,也就是要熟悉企业的生产经营流程,同时初步获取在这些流程中的分析需求,为最终确定用户需求做好准备 ; 对数据源结构的分析与理解 组织需求调研,收集业务需求 关于用户需求的调研 对用户需求调研结果的分析 采用信息包图法进行数据仓库的概念模型设计 利用星形图进行数据仓库的逻辑模型设计 根据分析需求与信息包图制作星形图 数据仓库的物理模型设计 物理模型设计的主要工作 物理存储结构设计的原则 数据仓库索引设计的特殊性 存储优化与存储策略 3.3 使用SQL Server 2005建立多维数据模型 SQL Server 2005示例数据仓库环境的配置与使用 基于SQL Server 2005示例数据库的多维数据模型的建立与应用 。 3.3 使用SQL Server 2005建立多维数据模型 在SQL Server 2005数据库环境中安装数据仓库组件、示例和工具 利用示例数据仓库(AdventureWorks DW)环境及帮助系统学习 3.3 使用SQL Server 2005建立多维数据模型 创建一个新的数据仓库分析项目 定义数据源 定义数据源视图 定义多维数据集 部署“销售分析示例”项目 浏览已部署的多维数据集 提高多维数据集的可用性和易用性 * * 物理模型 星型、雪花模型 物理数据模型 概念模型 逻辑模型 面向用户的需求 细 化层次 更详细的 技术细节 信息包图 信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。 信息包图法简介 工作: 确定系统边界:决策类型、需要的信息、原始信息 确定主题域及其内容:主题域的公共键码、联系、属性组 确定维度:如时间维、销售位置维、产品维、组别维等 确定类别:相应维的详细类别 确定指标和事实:用于进行分析的数值化信息 信息包图的建立 信息包: 维度 类别 指标和事实 〖例〗试画出销售分析的信息包图。 解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实: (1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)等。 (2)类别:确定各维的详细类别,如:日期维包括年(5)、季度(20)、月(60)、日(1800),括号中的数字分别指出各类别的数量;区域维包括国家(10)、省州(100)、城市(500)、销售点(8000),括号中的数字同样分别指出各类别的数量;类似地,可以确定产品维、客户维、广告维等的详细类别。 (3)指标和事实:确定用于进行分析的数值化信息,包括实际销售额、计划销售额和计划完成率。 销售分析的信息包图 指标和事实:实际销售额、计划销售额、计划完成率 销售点(8000) 日1800) 信用组(2) 城市(500) 月(60) 收入分组(8) 产品名称(9000) 省州(100) 季度(20) 广告费分组(2) 年龄分组(7) 产品类别(500) 国家(10) 年度(5) 广告维(待用) 客户维 产品维 区域维 日期维 信息包: 销售分析 维度 类别 设计基于主题域的概念模型 供应商 ID 相关 信息 有关信息 商品信息 供应商 供应商主题 顾客 顾客ID

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档