数据仓库和OLAP技术在商业中应用研究.docVIP

数据仓库和OLAP技术在商业中应用研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库和OLAP技术在商业中应用研究

数据仓库和OLAP技术在商业中应用研究   [摘要] 目前商业领域中交易电子化是发展趋势。为了解客户购物行为特征并进行有效决策,本文提出一种基于数据仓库和OLAP技术的解决方案,通过建立商品销售数据仓库,利用联机分析的快速数据统计为商业企业提供决策支持。   [关键词] 数据仓库 OLAP 商业      一、引言      在当今日益激烈的竞争环境下,企业要生存、发展,就必须具有能对不断变化的商业环境进行分析、预测并做出快速反应的能力。要做到这一点,企业的决策分析人员能否及时地从大量的原始数据中提取更多、更准确、更有效的信息是关键。企业传统的OLTP(联机事务处理)系统不能满足人们对数据做深层次分析的要求。因此,数据仓库和OLAP(联机分析处理)技术便应运而生了。      二、数据仓库技术      数据仓库是在关系数据库、并行处理和分布式技术的飞速发展基础上提出的,是解决信息技术在发展中存在的拥有大量数据却有用信息贫乏这一问题的综合解决方案。各家学说对于什么是数据仓库都有自己的定义,但内容是见仁见智。经典的数据仓库概念是由美国著名信息工程学家 W.H.Inmon 在他的 《Building the Data Warehouse》一书给出的:“数据仓库(Data Warehouse,DW)是面向主题的、集成的、时变的、非易失性的数据集合,用于支持管理层的决策过程。”      三、联机分析处理技术      联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的要求,SQL对大数据库的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询结果并不能满足决策者提出的需求。因此,Codd提出了多维数据库和多维分析的概念,即OLAP。   OLAP是一种决策分析工具,它可以根据决策分析者的需要将数据进行分类和运算,对大量数据进行复杂的查询处理,并以直观的、易理解的形式将查询结果提供给决策分析者,以便他们准确掌握企业(公司)的经营状况,了解市场需求,制定正确营销方案,增加效益。      ??、商业销售数据仓库的总体设计      1.数据仓库系统结构   本文背景是某大型电器卖场,通过综合考虑原系统的数据环境和卖场管理决策者的需求,设计商业销售数据仓库系统。系统结构如图1所示。开发该系统大致分为三个阶段:数据抽取、转换和加载阶段、多维数据结构的创建管理阶段和 OLAP 应用系统开发阶段。      商业销售数据仓库系统的数据处理流程为:数据采集系统根据已确定的主题域,采集原有OLTP数据库中的相关业务数据,重整后归类存放到数据仓库,然后通过OLAP工具将数据仓库的数据多层次分类汇总,从而建立多维数据模型,并存储在OLAP服务器中,最后结合报表软件开发OLAP应用系统将数据灵活地呈现给用户。   本系统采用Microsoft 的数据仓库解决方案,Microsoft 的数据仓库解决方案为创建数据仓库系统的每个部分都提供了所需的工具,使快速开发数据仓库系统成为可能。   2.数据抽取、转换和加载(ETL)   数据仓库中的数据是面向主题组织的,首先根据商业销售的特点和卖场决策人员的需求,可以确定主题域为商品销售。根据确定的主题域和信息分析需求,从原有OLTP数据库中抽取相关数据,进行净化、转换和聚合,最后存放于商业销售数据仓库中。由于数据仓库   的设计直接影响到能否方便地设计和构造多维数据结构来满足用户多层次,多角度的决策分析,因此在抽取、转换和加载过程中还要根据将要建立的多维结构特性对部分数据进行调整。本系统采用Microsoft SQL Server 2005 提供的Integration Services工具来实现数据转换。   3.多维数据结构创建和管理   在多维数据结构创建和管理阶段,根据卖场中高层管理人员分析的自然方式建立数据模型,将数据仓库中的数据按照一定的层次进行聚合、汇总,构成信息分析的多维视图,最后选择一定的存储模式,将这些多维视图存储在OLAP服务器中。   (1)数据仓库的存储和多维数据模型的建立   基于关系表的存储方式有两种模型:星型模型和雪花模型。商业销售数据仓库采用星型模型。图2为商品销售的星型模型。该模型的商品销售事实表连接了4个维度表:时间维度表,产品维度表,员工维度表,供货商维度表。通过这4个维度表的主键将事实表和维表连接一起,形成了星型模型。所以只要扫描事实表就可以查询,而无需把多个庞大的表连结起来。同时维度表一般比较小,与事实表连接时其速度较快,这样就大大加快了查询速度。  

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档