DB2 OLAP SERVER理论知识.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DB2 OLAP SERVER理论知识.doc

DB2 OLAP Server理论知识 前言 本文将讨论DB2 OLAP 服务器和 Essbase 方面的重要理论,涵盖OLAP 的数据立方体存贮原理,设计要点到OLAP。本文中的OLAP服务器是指IBM DB2 OLAP Server 版本 7(包含多维存储选项)和 Hyperion Essbase OLAP Server 版本 6.0。 下表 1 列出 IBM DB2 OLAP Server 和 Hyperion Essbase OLAP Server 的版本。 Hyperion IBM Essbase Server 5.0 DB2 OLAP Server 1.0 Essbase Server 5.0.2 DB2 OLAP Server 1.1 Essbase Server 6.0 DB2 OLAP Server 7.1 DB2 OLAP简介 多维数据库 多维数据库(Multi-Dimensional Database)可以简单地理解为:将数据存放在一个n维数组中,而不是像关系数据库那样以记录的形式存放。因此它存在大量稀疏矩阵,人们可以通过多维视图来观察数据。多维数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数据处理速度,加快反应时间,提高查询效率。 目前有两种MDD 的OLAP产品:基于多维数据库管理系统的MOLAP和基于关系数据库管理系统的ROLAP。DB2 OLAP Server(Hyperion Essbase OLAP Server)是一种典型的MOLAP。 DB2 OLAP Server结构 DB2 OLAP Server客户-服务结构支持企业分析应用。 服务器端:所有的OLAP应用组件,包括多维数据库大纲,计算脚本,规则文件和数据库信息都存在服务器端。OLAP Server通常运行在UNIX服务器上。 客户端:DB2 OLAP客户端从服务器上分析和返回数据主要是通过几种方式来实现的:Lotus 1-2-3,Microsoft Excel,客户应用程序接口和各种专业的前端展现工具如Hyperion Analyzer、BO、Brio、Cognos Powerplay等。 DB2 OLAP提供丰富的API,开发人员可以用VB,VC和C等语言访问OLAP的API实现用户的各种需求,如自动调度,用户权限等任务。 DB2 OLAP多维数据库的存贮原理 DB2 OLAP 存储结构作为矩阵实施数据存储的概念也许是DB2 OLAP 开发人员应该学习的最为重要的概念。对矩阵管理的完全了解包括理解稀疏性的推论概念。也就是说,添加到矩阵中的维越多,矩阵中实际包含值的单元所占比例就越小。 将二维数组的商业示例看作是含有“度量”维的三个成员,分别称为销售额、销售成本及利润(销售额减销售成本),按照“时间”(第二个维)每天进行记录,持续一年。随着时间的推移(日复一日),我们通常能够直观地测量销售额和销售成本,并生成利润。此模型会有1,095 个交点(365 天乘以3 个度量)。“日”和“度量”紧凑迁移的描述十分容易理解。对于给定日期,如果有一个销售额数字,您可能也有销售成本信息,并可因此计算出利润度量。除非有销售信息季节波动剧烈,否则多数时间里都会有销售信息。因此,可能在所有时间内矩阵被“紧凑”填充以进行“度量”。 图1. 交点数量—— 示例 当我们添加更多维时,就会涉及到稀疏性这一概念。例如,试图将“客户”(数量为100,000)和“产品”(数量为50)的维添加到该模型。通常很容易想到,这些维中将存在许多不包含数据的交点。并非所有客户都会在一年中的每一天购买所有产品。随着每个维所有成员的笛卡尔乘积般的增加,交点的数目也随之增加。我们的模型就从1095 个单元增加到5,475,000,000 (365*3*50*100,000)个单元。 仅通过将数据存储为销售事件结果,关系数据库便可处理数据稀疏性。这些数据库将记录实际销售额。然后,可以使用结构化查询语言(SQL)询问和分析数据以回答类似的以下问题:哪些产品在规定时间内销售额最少?此答案是由程序派生的。关系数据库一般不存储(许多)客户没有购买(许多)产品这一事实的表。但矩阵则会。 矩阵会为每个产品和每个客户保存所有时间内销售额和销售成本的各种可能组合。其中许多单元不包含数据。关系数据库中包含哪些产品在所有时间内均具有最少销售额的答案,并且只在检索相关交点以及检查其内容时,才显示此答案。数据块和索引的两种存储结构实际上是由Essbase 的设计人员开发而来的,目的是为了处理稀疏性这一现实问题。 数据块和索引说明 请看以下包含21,370,660,375,680 个交点的数组说明:DIM (172, 21, 27, 32, 209, 32765)。Arbor E

文档评论(0)

基本资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档