- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库和数据挖掘试题(11年)答案--南京理工研究生
数据仓库与数据挖掘
选择题,为每个问题选择最合适的答案(10×2%=20%)
数据仓库上的业务处理称作__。
联机事务处理
联机分析处理
联机输入处理
联机查询处理
在自然演化体系结构中,关于导致数据缺乏可信性的原因的说法哪个不正确?
数据无时基
抽取程序的算法有差异
抽取的层次不同
缺乏集成性
下面哪项关于OLTP与OLAP访问特点的说法是不正确的。
OLTP和OLAP对于响应时间的要求都高
OLTP访问频率高,OLAP访问频率低
OLAP访问大量的历史,执行大量统计操作
OLTP数据处理具有并发性
下面关于数据仓库中数据的说法错误的是?
数据越详细,粒度越小,层次级别就越高。
在估计直接存储设备数时,如数据超过1000万行必须强制采取双重粒度级。
数据仓库大部分分析是针对被压缩的、存取效率高的轻度级数据进行的。数据分割便于数据的重构、重组和恢复,以提高创建索引和顺序扫描的效率。下面关于数据仓库的数据存储方式的说法哪个是不正确的?
虚拟存储方式中,数据仓库的数据仍然在源数据中。
星型模式下的维表规范化的,而雪花模式下的不需要规范化
在查询效率方面,星型模式效率更高
在事实星座模式中有多个事实表,且它们共享相同的维表
下面关于星型模型的说法哪个是不正确的?
有一个包含大量数据的事实表
有一组小的附属表,称为维表,每维一个。
事实表的每个字段都是事实度量字段事实中每条元组都含有指向各个维表的外键和一些相应的度量数据。下面关于数据仓库的数据追加的说法哪个是不正确的?
时标法需要为记录数据增加一个时间标志。
前后映像文件方法需要扫描整个数据库,占用较多资源,对性能有较大影响
DELTA不需要扫描整个数据库,效率较高,应用普遍
日志文件法也不需要扫描整个数据库,是固有机制。
假设收入属性的最小与最大分别是10000和0000,现在想把当前值30000映射到区间[0,1],若采用最大-最小数据规范方法,计算结果是多少?
0.25
0.375
0.125
0.5
下面关于维的概念哪个是不正确的?
维是人们观察数据的特定角度。
维的层次性是由观察数据细致程度不同造成的。
“某年某月某日”是时间维的层次。
“月、季、年”是时间维的层次。
数据仓库开发应用周期可分为三个阶段,下列哪项不是其中某个阶段?
规划分析阶段
体系结构设计阶段
设计实施阶段使用维护阶段在现实世界的数据中,元组在某些属性上缺少值是常有的,描述处理该问题的方法?
人工填写空缺值
使用一个全局常量填空
使用属性的平均值填充空缺值
使用与给定元组属同一类的所有样本的平均值
使用最可能的值填充空缺值
简述数据仓库的四个基本特征?
面向主题,集成的,非易失的,随时间改变的
简述轮转综合数据存储的过程?
数据用与前面相同的处理方法从操作型环境输入到数据仓库环境中,只是在轮转综合文件中的数据才被输入到不同的结构形式中。
简述数据库数据与数据仓库数据的异同
II. 设计题 (5×12%=60%)
假定大学的数据仓库包含4个维{student学生、course课程、semester学期、instructor教师},2个度量count和avg_grade。在最低的概念层(例如对于给定的学生、课程、学期和教师组合),度量avg_grade存放学生的实际成绩。在较高概念层,avg_grade存放给定组合的平均成绩。
a)为数据仓库画出雪花模式图b)由基本立方体{学生、课程、学期、教师}开始,列出大学每个学生的“计算机导论”课程的平均成绩,应当使用哪些OLAP操作(如由学期上卷到年)?假定数据仓库包含4个维date, spectator观众, location地区和game,2个度量count和charge。其中,chage是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老人,每类观众有不同的收费标准。
a)画出该数据仓库的星形模式图
b)由基本立方体[date,spectator,location,game]开始,为列出20年观众在GM-Place的总付费,应当执行哪些OLAP操作? 3.4假定BigUniversity的数据仓库包含如下4个维:student(student_name, area_id, major, status, university),course(course_name, department),semester(semester, year)和instructor(dept, rank);2个度量:count和avg_grade。
在最低概念层,度量avg_grade存放学生的实际课程成绩。在较高概念层,avg_grade存放给定组合的平均成绩。
(a) 为该数据仓库画出雪花形模式图。
(b) 由基本方体[student, course, semeste
您可能关注的文档
最近下载
- (正式版)SH∕T 3553-2024 石油化工汽轮机施工及验收规范.pdf VIP
- 电气专项施工方案.doc VIP
- 个人简历——【标准模板】.doc VIP
- 软件开发工具unsp ide使用说明书.pdf VIP
- 【课堂新坐标(教师用书)高中英语 Unit 3 Period V Culture Corner & Bulletin Board课件 北师大版必修1.ppt VIP
- 老年病多学科诊疗模式.pptx VIP
- GPX 生产手册.pdf VIP
- 老年病多学科诊疗模式.pptx VIP
- 【课堂新坐标(教师用书)高中英语 Unit 1 Lifestyles单元归纳提升课件 北师大版必修1.ppt VIP
- 新课标高中英语 教师用书配套资料 Unit1~2 阶段综合检测 北师大版必修1.doc VIP
文档评论(0)