- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
校园数据仓库的设计与实现傅国强(深圳市职业技术学院信息中心,广东深圳 518055)摘要本文结合学校管理的一些特性,将数据仓库和数据挖掘技术引入学校信息管理与决策支持系统中,分析在校园事务管理内设计和实现数据仓库的具体问题,给出一个系统实现的设计思路。关键词数据仓库(DW),数据挖掘(DM),联机处理(OLAP),校园(Campus)中图分类号TP311.132.4文献标识码A文章编号44-1572/2(2002)01-014-061引言随着我国加入 WTO,各行各业都面临来自国际同行的强大挑战,学校同样也面临许多来自国外学校的竞争,尤其是大学,许多在管理上等方面有明显的优势,国际名牌大学也将加入在我国的教育竞争。如何提高管理水平和办学效率,是很多大学要考虑的问题。建立学校的数据仓库,将已有的一些管理数据转化为可供使用决策使的基础数据,提高学校管理决策的科学性,是可行的措施。本文结合学校管理的具体情况,分析探讨了学校数据仓库的设计与实现。2数据仓库与决策支持数据仓库是 20 世纪 90 年代初由 Inmon 首次提出,根据 Inmon 的定义,数据仓库是面向主题的、集成的、稳定的、不同时间的数据的集合,用于支持经营管理中的决策过程。最终用户可在数据仓库的基础上进行数据的深层挖掘、多维数据分析、动态查询和动态报表等。其主要作用是为用户提供决策支持。数据仓库是一种新型的数据库,具有数据库的特征,但数据仓库的主要特点是具有预测、分析、决策功能,能利用一系列方法对其中数据进行数据挖掘。许多发达国家已有很多公司企业利用数据仓库成功的例子,他们利用数据仓库从大量的历史数据中挖掘出有价值的信息,供决策、分析人员使用,提高企业的利润。3校园数据仓库系统的总体架构现在很多大学在校学生人数都已超过万人,甚至十几万,教职工人数也是达几千或上万,各类数据日积月累,已形成拥有庞大数据的各类数据库。一般都建有学籍管理、学生成绩、人事管理、教务管理、教师教学科研工作量管理,等数据库系统。利用数据仓库的傅国强,男,深圳市职业技术学院信息中心高级实验师(518055)14思想,对学校管理历史数据重新利用,可为学校管理提供决策支持。系统通过数据采集加工系统将数据源中数据加载到数据仓库中,用户利用数据挖掘 DM 和在线分析(OLAP)使用数据仓库的数据。其实现过程如下图 1 所示:应用 1数据源 1数 据4数据采集加工数据源 n图1校园数据仓库的设计数 据仓 库数据仓库系统总体结构图挖 掘在 线分 析应用 2应用 1传统的数据库系统与数据仓库不同,数据仓库中的数据是面向主题进行组织的。主题对应企业中某一宏观分析领域所涉及的分析对象。数据仓库的数据结构,与传统的 OLTP数据库具有很大的不同,这主要是由于二者的技术目标完全不同。OLTP 数据库主要处理事务级的请求,基本操作是插入、删除、修改等记录级的操作,特点是事务量大,但每个事务所涉及的数据量小;而数据仓库通常需要从历年积累的历史数据中获取有价值的信息,因此涉及的查询数据量比较大,而查询处理请求的数量相对于 OLTP 数据库来说比较小。4.1 数据仓库主要包括:4.1.1 事实(Facts) 如学生所学课程成绩、学生分配、招生数、学生缴费等;对教师,有教师科研,所学课程,出勤情况等。这些数据是实际分析的基础数据,它们日积月累,数量庞大。4.1.2 维(Dimensions) 它是事实信息的属性,如学生基本情况、考试时间、系、专业,教师基本情况、系、专业, 课程类别等。它们一般变化不大,数量也相对较小。.4.1.3 粒度(Units) 它是维划分的单位,如时间维可按日计,也可按周、按学期、按年计;如学生维,可明细到性别、年龄、系、专业、班级等来统计。这些信息一般没有变化。在设计数据仓库时通过使用的方法有两种: 1)星型模型, 2)雪花模型,都包括“事实表”和“维度表”。星型模式通过使用一个包括主题的事实表和多个包含带头的非正规化描述的维度表来执行典型的决策扶持查询。星型模式是一种关系数据库结构,在该模式的中间是事实表,周围是次要的维度表,数据在事实表中维护,维度数据在维度表中维护。每一个维度表通过一个关键字直接与事实表关联。维度是组织数据仓库数据的分类信息,例如时间,位置等。15( (维度表维度表事实表维度表维度表图2星型模式结构示意图维度表雪花模型是星型模式的一种扩展形式,在这种模式中,维度表存储了正规化数据,这种结构通过减少读磁盘的数量而提高查询性能。维度表分解成与事实表直接关联的主维度表和与主维度表关联的次维度表,次维度与事实表间接关联。维度表维度表事实表维度表维度表维度表图3维度表雪花模式结构示意图维度表学校以培养学生为主,所以对于学校可将培养的学生似比企业产品。数据仓库中的数据是面向主题进行组织的。主题对
您可能关注的文档
最近下载
- 中小学高级职称英语全英答辩题(1).docx VIP
- ASUS华硕主板大师系列Z97-A 用户使用手册 (繁体中文).pdf
- 第二十二期在线培训-finereport打印专题1 15finereport打印专题fr打印专题.pptx VIP
- 报表导出属性finereport.pdf VIP
- 搞笑相声剧本《我是歌王》台词完整版 张番刘铨淼.doc
- 2025年份贵州省普通高中学业水平考试真题技术试卷及答案 .pdf VIP
- bedford百德福B601 单相系列 智能恒压变频水泵控制器 使用说明书 V1.1.1.pdf
- 成都班培训材料模板finereport.pptx VIP
- coc新手模组复足.docx VIP
- 高二语文2025年上学期高考模拟冲刺押题试卷.docx VIP
文档评论(0)