- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维数据集的构建及其数据仓库olap
多维数据集的构建及其数据仓库OLAP
071070012 李骁
数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境,用以支持经营管理中的决策支持过程,数据模型是数据仓库研究的核心问题之一,由于传统数据模型不能有效地表示数据仓库的数据结构和语义,也难以有效地支持OLAP,因此,需要建立多维数据模型来支持分析。
本报告创建了多维数据模型,定义了数据仓库的度量和维度结构,并以此为基础,进行了简单的OLAP操作并得到了相关结论。由于数据仓库操作面向的是大量的、各阶段的详细数据,直接创建是不现实的,这里直接采用了SQL Server自带的Foodmart 2000数据源作为操作基础。
数据仓库包含了4个层次的体系结构,分别是数据源、数据的存储和管理、OLAP服务器和前端工具。报告只深入到基于数据的存储和管理的简单OLAP服务分析,microsoft的Analysis server在人性化方便做得很好,容易上手,基本不存在较大的操作问题。
(一)建立用于OLAP的数据库及数据源连接
本次作业是在系机房的windows server 2003系统环境中完成的,建立数据源连接首先单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源 (ODBC)”。在弹出的“ODBC数据源管理器”中选定“系统DSN”选项卡,单击“添加”添加数据源,由于本人并没有好的数据源,因此直接采用系统数据库中的样本作为数据源对象。
具体操作是在随后弹出的“ODBC Microsoft Access安装”中命名并找到样本数据库(windows server 2003在D盘),点击“确定”即可
在SQL Server2000中,右击数据库名,建立新数据库如下:
建立好数据库后,在 Analysis Manager 树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。
在随后弹出的“数据链接属性”对话框中,单击“Microsoft OLE DB Provider for ODBC Drivers”。
单击“下一步”(自动跳到“连接”选项卡),将数据源名称中选定“lixiao_DW”:
单击“测试连接”以得到“测试连接成功”的对话框,说明连接成功。在消息框中单击“确定”按钮。单击“确定”按钮关闭“数据链接属性”对话框。
这样,OLAP的准备工作就完成了。
(二)构建多维数据集
构建多维数据集是要构建一种数据的多维结构,多维数据集由维度和度量值的集合进行定义,因此在具体操作时应建立多种维度表,包括时间维度、客户维度、产品维度、机构维度等等。在之前,需向多维数据集添加度量值,度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。
在之前建立的数据库中,右击“多维数据集”,选到“向导”,如下图:
在“从数据源中选择事实数据表”中,选择合适的事实表,这个数据源中共有5个事实表,为简单起见,选定sales_fact_1997事实表作为分析对象:
单击“浏览数据”按钮可以查看“sales_fact_1997”表中的数据,其中数据量相当大,关闭“浏览数据”窗口,然后单击“下一步”按钮。
在弹出的向导中,选择类型为数值的后三项为数据集度量值:
在下一步中就可以建立具体的维度了,前面已经提过需要建立时间维度、客户维度、产品维度、机构维度等等。首先单击“新建维度”命令。此操作将调用维度向导:选择OLAP较为常用的星型架构,之后选择“time_by_day”表(先建立时间维度):
单击“下一步”按钮,选择“时间维度”:
仔细观察“time_by_day”表可以发现,数据分得很细,每一天都有新事件,从分析角度来看,以月为计量单位较为合适,点击“下一步”后,选择时间级别到“月”即可,
随后的操作按过程来,最后用“time”作为维度名,其维度级别依次为“年”、“季度”、“月”。
时间维度创建好后,以相似的方法创建好关于该表的客户维度与商店维度,在操作上,在“选择维度表”步骤,单击“customer”,然后单击“下一步”按钮。 定义维度的级别中按顺序双击“Country”、“State_Province”、“City”和“lname”列确定粒度。将其名称定义为“customer”。
商店维度:选择“store”表作为维度表,其粒度级别按照“store_country”列、“store_state”列、“store_city”列和“store_name”列降次。 以“store”作为维度名,并保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。
随后的产品维度表,由于产品表从多个联接的表内选择一列,所以这里采用雪花模型更为方便,produc
您可能关注的文档
- 调盘问卷中多项选择题处理方法商量.doc
- 调漂图解合集(精髓帖).doc
- 调试-水泵-西方泵业水泵、操纵柜的装置应用说明.doc
- 定积分导数.doc
- 东华理工大学论文封面.doc
- 东京.doc
- 东三校2013年高三第二次联合模拟测验语文.doc
- 东周青铜剑的铸制工艺.doc
- 杜曼闪卡实际产品应用方法教授教化要点介绍.doc
- 度量空间和线性赋范空间.doc
- 幼儿园大班数学课教案必威体育精装版6篇.docx
- 2025年农业系统职称考试全真模拟模拟题附答案详解【B卷】.docx
- 生产运作管理说课课件.pptx
- 2025年农业系统职称考试全真模拟模拟题附完整答案详解(全优).docx
- 浙江省温州市2025届高三语文2月学业水平评估试卷(含答案).pdf
- 2025年农业系统职称考试全真模拟模拟题附完整答案详解(典优).docx
- 2025年农业系统职称考试全真模拟模拟题附完整答案详解【必刷】.docx
- 直动式高性能比例方向阀:基于虚拟样机的仿真解析与试验验证.docx
- 登山的教案7篇.docx
- 2025年农业系统职称考试全真模拟模拟题附完整答案详解(名师系列).docx
文档评论(0)