- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简化直接文件 它类似于简单堆积文件,但它是间隔一定时间的数据库快照,比如每隔一星期或一个月作一次。 连续文件 它类似于简单堆积文件,但它是间隔一定时间的数据库快照,比如每隔一星期或一个月作一次。 11.2. 2 数据仓库的数据组织 ③ 数据仓库的数据模型 数据模型是对现实世界进行抽象的工具,抽象的程度不同,就形成不同抽象级别层次上的数据模型。通常,数据数据可以分为三个层次:高层数据模型(ER图,实体关系层)、中间层模型(DIS,数据项集)、底层数据模型(物理模型)。 ③数据仓库的数据模型 高层数据模型 高层建模以实体和关系为特征,实体处于最高抽象层,由“集成范围”这个术语表示的内容来决定哪些实体属于模型范围。集成范围定义了数据的边界,而且集成范围需在建模之前进行定义。这个范围由系统的建模者、管理人员和最终用户共同确定。如果范围没有预先确定,建模过程就很有可能一直持续下去。写出来的集成范围应该尽量简短,而且应该使用业务人员可以理解的语言。 高层数据模型对数据抽象程度最大,表达工具为E-R图。 中间层模型 对高层数据模型中标识的每个主要的主题域或实体,都要建一个中间层数据模型。中间层数据模型4种基本构造,见图13-10: 联接数据组:本主题域与其他主题域间的联系,一个主题的公共码键。 基本数据组:属于基本不会发生变化的项。 二次数据组:基本不变化,但又存在变化的可能的数据项。 类型数据组:经常变化的数据项。 底层模型 它是从中间层数据模型创建而来的,建立物理模型只需扩展中间层模型,使模型中包含有关键字和物理特性就可以实现。其中物理特性设计需包括: 确定数据的粒度和分区。当然关键字结构得发生改变,以便能加入与每一个数据单元都相关的时间元素。 数据库设计者需要在物理上组织好数据、保证执行一次物理I/O能够返回最大数量的记录。 因为数据仓库中的数据一般不更新,可以考虑一些在经常更新情况下不能使用的物理设计。 上述三个层次的数据模型对应到传统操作型数据库建模中即为:概念模型、逻辑模型和物理模型。在数据仓库的设计中同样存在着这样的模型。数据模型既适用于现有的系统环境也适用于数据仓库中的环境。但数据仓库的数据模型与操作型数据库的三级数据模型又存在着一定的区别: 数据仓库的数据模型中不包含纯操作型的数据; 数据仓库的数据模型扩充了码结构,增加了时间属性作为码的一部分; 数据仓库的数据模型中增加了一些导出数据。 11.2. 2 数据仓库的数据组织 ④数据仓库的数据追加方式 常用的技术和方法有: 时标方法 DELTA文件 前后映象文件的方法 日志文件 11.2. 3 数据仓库的体系结构 数据仓库系统是以数据仓库为基础,通过集成工具、查询工具和分析工具完成对数据的转换和对信息提取的系统。通常采用如图11-2所示的体系结构:数据源、数据存储和管理、数据分析以及数据展示。其中,元数据库是对数据的一种描述,贯穿整个系统的各个部分。 图11-2 数据仓库系统的体系结构 数据仓库的数据一般分为操作数据库源数据和外部源数据两部分。 操作数据源包括各种生产系统数据库、联机事务处理系统的操作数据库等; 外部源数据一般来自企业的外部信息,如市场调查与分析及各类文档等。 导入的源数据形成了数据仓库的原始数据,然而源数据只是数据仓库的一部分,但不是全部。由于需要数据仓库进行OLAP分析和数据挖掘,因此需要在原始数据的基础上增加冗余信息,比如进行大量的预运算,建立多维数据库,以求得到更好的分析结果。 数据的存储与管理是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行抽取、清理,并有效集成,按照主题进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据(具体包括数据仓库的数据字典、记录系统定义、数据转换规则、数据加载频率以及业务规则等信息)。 数据访问和分析工具不但要提供一般的数据访问功能,如查询、汇总、统计等,还要提供对数据的深入分析功能,即数据挖掘的功能,如数据的比较、趋势分析、模式识别等。 数据展示将应用结果,特别是分析、决策结果以多种媒体形式表示。 11.2. 4 数据仓库的基本框架 数据仓库提供了有效地存取和管理大量数据的理想环境,而数据仓库系统的建立是一个由数据驱动、以技术支撑并满足应用需求的不断增长和完善的开发过程。因此数据仓库的设计可以从数据、技术和应用三方面展开,其基本框架如图11-3所示 图11-3 数据仓库设计的基本框架 基本框架的各部分描述如下: 项目计划。项目计划是指定义创建数据仓库的项目目标和确定项目范围,包括对项目计划的评估
您可能关注的文档
- 西安邮电大学电子工程学院光纤传输技术课件第三章 无源器件技术.ppt
- 西安邮电大学电子工程学院光纤传输技术课件第四章 有源器件技术.ppt
- 西安邮电大学电子工程学院光纤传输技术课件第一章 光纤技术.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第1章.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第2章.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第3章.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第4章.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第5章.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第6章.ppt
- 西安邮电大学电子工程学院基于Verilog HDL的FPGA设计基础课件 第7章.ppt
- 西安邮电大学经济与管理学院物流学课件第八章 包装.ppt
- 西安邮电大学经济与管理学院物流学课件第二章 物流理论.ppt
- 西安邮电大学经济与管理学院物流学课件第九章 装卸搬运.ppt
- 西安邮电大学经济与管理学院物流学课件第六章 仓储管理.ppt
- 西安邮电大学经济与管理学院物流学课件第十二章 国际物流.ppt
- 西安邮电大学经济与管理学院物流学课件第十三章 企业物流.ppt
- 西安邮电大学经济与管理学院物流学课件第十五章 第三方物流.ppt
- 西安邮电大学经济与管理学院物流学课件第十一章 物流信息系统.ppt
- 西安邮电大学经济与管理学院物流学课件第十章 流通加工.ppt
- 西安邮电大学经济与管理学院物流学课件第四章 供应链管理下物流.ppt
最近下载
- TSGZ8001—2019特种设备无损检测人员考核规则(去水印版).pdf VIP
- 企业工会助推企业高质量发展.docx VIP
- 圆明园的毁灭观后感.docx VIP
- 《新能源汽车驱动电机及控制技术》 课件 3.1 电机控制器检测与故障诊断.pptx
- GB∕T 5777-2019 无缝和焊接(埋弧焊除外)钢管纵向和∕或横向缺欠的全圆周自动超声检测(含2021年第一号修改单).pdf
- 汽修安全培训课件.ppt VIP
- 网络改造设计方案.doc VIP
- 《圆明园的毁灭》课文读后感.docx VIP
- 旅游大数据(北京第二外国语)中国大学MOOC慕课 章节测验期末考试答案.docx VIP
- 统编版四年级语文上册课件《西门豹治邺》.pptx VIP
文档评论(0)