- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与OLAP 郑国禹 zhengguoyu@126.com 黑龙江科技学院 计算机学院 什么是数据仓库 以1992年W H Inmon出版 《Building the Data Warehouse》为标志,数 据仓库发展速度很快。W. H .Inmon被誉为数据仓库 之父。 W. H. Inmon对数据仓库所 下的定义:数据仓库是面向 主题的、集成的、稳定的、 随时间变化的数据集合,用 以支持管理决策的过程。 事务型处理 事务型处理:即操作型处理,是指对数据库的 联机操作处理OLTP。事务型处理是用来协助 企业对响应事件或事务的日常商务活动进行处 理。它是事件驱动、面向应用的,通常是对一 个或一组记录的增、删、改以及简单查询等 (大量、简单、重复和例行性)。 在事务型处理环境中,数据库要求能支持日常 事务中的大量事务,用户对数据的存取操作频 率高而每次操作处理的时间短。 分析型处理 分析型处理:用于管理 人员的决策分析,例如 DSS 、 EIS(经理信息系 统 )和多维分析等。它 帮助决策者分析数据以 察看趋向、判断问题。 分析型处理经常要访问 大量的历史数据,支持 复杂的查询。 分析型处理过程中经常 用到外部数据,这部分 数据不是由事务型处理 系统产生的,而是来自 于其他外部数据源。 数据库系统的局限性 1、数据库适于存储高度结构化的日常事务细节数据, 而决策型数据多为历史性、汇总性或计算性数据, 多表现为静态数据,不需直接更新,但可周期性刷 新。 2、决策分析型数据是多维性,分析内容复杂。 3、在事务处理环境中,决策者可能并不关心具体的 细节信息,在决策分析环境中,如果这些细节数据 量太大一方面会严重影响分析效率,另一方面这些 细节数据会分散决策者的注意力。 数据库系统的局限性 4、当事务型处理环境和分析型处理环境在同一 个数据库系统中,事务型处理对数据的存取操 作频率高,操作处理的时间短,而分析型处理 可能需要连续运行几个小时,从而消耗大量的 系统资源。 5、决策型分析数据的数据量大,这些数据有来 自企业内部的,也有来自企业外部的。来自企 业外部的数据又可能来自不同的数据库系统, 在分析时如果直接对这些数据操作会造成分析 的混乱。对于外部数据中的一些非结构化数据, 数据库系统常常是无能为力。 多库系统的限制 可用性:源站点或通信网络故障将导致系统瘫 痪, 源站点不能通过网络在线联入多库系统。 响应速度:全局查询多级转换和通信传输, 延 迟和低层效率影响响应速度。 系统性能:总体性能取决于源站点中性能最低 的系统, 影响系统性能的发挥; 系统开销:每次查询要启动多个局部系统, 通 信和运行开销大。 实施数据仓库的条件 数据积累已达到一定规模 面临激烈的市场竞争 在IT方面的资金能得到保障 操作型数据与分析型数据 操作型数据与分析型数据区别 数据仓库的发展 自从NCR公司为Wal Mart建立了第一个数据仓库。 1996年,加拿大的IDC公司调查了62家实现了数据仓库的 欧美企业,结果表明:数据仓库为企业提供了巨大的收益。 早期的数据仓库大都采用当时流行的客户/服务器结构。 IBM的实验室在数据仓库方面已经进行了10多年的研究, 并将研究成果发展成为商用产品。 其他数据库厂商在数据仓库领域也纷纷提出了各自的解决 方案。 BI系统VS决策盲点 某大型国有企业老总当他查看近十年企业的生产和运 营数据时,手边得到了各种各样不同的数据报表。这些数 据报表大致可以分成两种类型:一种是两年前、即ERP上 线之前的,这是一些简单、杂乱而又
文档评论(0)