数据仓库技术白皮书之二.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库技术白皮书之二

目录 1 从数据库到数据仓库 2 2 何谓数据仓库? 3 3 数据仓库主要的作用 4 4 数据仓库的体系结构 5 5 OLAP与数据仓库技术 6 6 数据挖掘与OLAP 7 7 数据仓库和数据挖掘技术离我国企业有多远? 8 8 总结 10 从数据库到数据仓库 您听说过数据仓库吗?您知道为什么要建立和使用数据仓库呢?您想知道您的企业是否适合使用数据仓库吗?您想了解数据仓库技术吗? 让我们先来看一些统计数字。1994年,一份由META小组对2000家企业的CIO所作的调查表明,百分之九十以上的企业都计划在1994年至1996年之间实现数据仓库。百分之九十的大公司计划在1996年采用数据仓库技术。而IDC在1996年的一次对90年代前期进行的62个数据仓库项目的调查结果表明:进行数据仓库项目开发的公司在平均2.73年的时间内获得了平均为321%的投资回报率。实际上,正是使用数据仓库所产生的巨大效益刺激了对数据仓库技术的需求,使得数据仓库的研究和应用迅速发展起来。 应该说,数据仓库技术是信息工程实践的必然产物,是人们对信息处理的客观要求。一直以来,如何有效地管理企业在运营过程中所产生的大量数据和信息是信息技术人员面临的重要课题。70年代出现并被广泛应用的关系型数据库技术为这一问题的解决提供了强有力的工具。然而从80年代中期开始,信息系统的用户已经不满足于用计算机仅仅去管理日常的生产数据,他们更需要的是信息——支持决策制定过程的信息,也就是说,他们需要从大量的业务数据中探索业务活动的规律性及市场的运作趋势,并从中得到参与市场竞争所必需的决策。这种需求既要求联机服务,又涉及大量用于决策的数据,而传统的数据库系统已无法满足这种需求。这具体体现在以下三个方面: 历史数据量很大。全球范围内数据库中存储的数据量急剧增大,有些公司经过长年累月积聚下来的商业数据目前已经超过几百万条记录。虽然数据库系统提供了对这些数据的管理和简单的处理功能,人们可以在这些数据之上进行商业分析和科学研究,但如此庞大的数据对人工处理来说是非常困难的。 辅助决策信息涉及许多部门甚至企业外部的数据,而不同系统的数据难以集成。尽管大多数的企业中已经有了成功的MIS系统、CMIS系统、或是有了大量卓有成效的过程控制系统,其中的数据体系对应着一项项业务处理和一个个控制环节,它们能完善地支持其原有的工作。但当从企业级的角度去审视,并想进一步分析处理时,这些数据又往往过于分散,数量越来越大,并难以集成。这些数据适合原有的工作任务,但不适合现在的要求。要支持企业级的决策,就是需要从“洪水般的数据”中进行面向企业级的工作任务进行重组,对分散在多个事务处理应用中的相关数据进行集成,以向分析人员提供统一的数据视图。 由于访问数据的特性不同,它对大量数据的访问性能明显下降。在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短,因此,系统可以允许按分时方式使用系统资源,同时保持较短的响应时间。而在分析处理环境中,用户的行为模式与此完全不同,某个决策支持应用程序可能需要连续运行几个小时,从而消耗大量的系统资源。将具有如此不同处理特性的两种应用放在同一个环境中运行显然是不适当的。 另一方面,进入八十年代以后,新的客户机/服务器技术和并行可扩展体系结构数据库技术得到了迅猛发展,企业大型联机事务处理技术走向成熟,解决了企业实时业务交易的应用需求。同时,也使得企业的运作上升到一个电子化、信息化的环境。 总之,企业竞争对于决策信息的需求以及相关技术的成熟最终孕育了数据仓库技术。那么,到底什么是数据仓库呢? 何谓数据仓库? 90年代初期,美国著名信息工程学家W.H.Inmon博士在《建立数据仓库》一书中提出了“数据仓库的概念:“数据仓库(data warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持经营管理中的决策制定过程。” 所谓主题,是指用户使用数据仓库进行决策时所关心的重点方面,如销售情况、人事情况、整个企业的利润状况等;所谓面向主题,是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。 所谓集成的,是指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,是经过系统加工、汇总和整理,保证数据仓库内的信息是关于整个企业的一致的全局信息。 所谓稳定的,是指一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的插入和查询操作,但修改和删除操作很少。 所谓包含历史数据的,是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势作出定量分析和预测。 举个例子来说,银行的信贷业

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档