- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
数据仓库综合应用能力模拟测试题
一、单选题(每题2分,共20题)
背景:某电商公司希望搭建数据仓库,支持全国30家分店的商品销售数据分析,涉及数据量约500GB/天,数据更新频率为每小时。
1.在设计数据仓库的维度表时,以下哪种方式最适合描述“商品类别”这一概念?
A.事实表
B.退化维度表
C.轻量级维度表
D.星形模式中的事实表
2.若某业务场景需要计算“近30天各城市用户购买商品的平均客单价”,以下哪种聚合方式最合适?
A.分组聚合(GROUPBY)
B.连接聚合(JOIN+AGG)
C.窗口聚合(OVER)
D.子查询聚合(WITH)
3.在数据ETL过程中,若某条记录因为字段缺失导致清洗失败,以下哪种处理方式最合理?
A.直接丢弃该记录
B.用默认值填充缺失字段
C.记录异常日志并跳过该记录
D.重新调度整个ETL任务
4.某企业采用Snowflake数据仓库,其数据压缩率通常能达到50%以上,主要得益于以下哪种技术?
A.行式存储
B.列式存储
C.压缩算法(如LZ4)
D.分区分桶
5.在设计数据仓库的慢查询优化时,以下哪种策略最有效?
A.增加索引
B.优化SQL语句
C.数据分区
D.以上都是
6.若某业务场景需要计算“每个用户的最近3次购买行为”,以下哪种SQL窗口函数最合适?
A.ROW_NUMBER()
B.RANK()
C.DENSE_RANK()
D.LEAD()
7.在数据仓库分层设计中,以下哪个层次主要负责存储明细数据?
A.ODS层
B.DWD层
C.DWS层
D.ADS层
8.若某企业使用AmazonRedshift搭建数据仓库,其性能瓶颈通常出现在以下哪个环节?
A.数据存储
B.数据计算
C.数据传输
D.数据压缩
9.在数据质量监控中,以下哪种指标最能反映数据的完整性?
A.重复值比例
B.缺失值比例
C.数据一致性
D.格式规范性
10.若某业务场景需要计算“每个店铺的日活用户数”,以下哪种方式最合适?
A.直接统计UV
B.用窗口函数计算
C.通过事实表关联维度表
D.以上都对
二、多选题(每题3分,共10题)
背景:某金融机构希望搭建数据仓库,支持信贷业务的风险评估,涉及数据源包括交易系统、征信系统、客服系统。
11.在设计数据仓库的维度表时,以下哪些属于维度表的属性?
A.时间戳
B.商品编号
C.用户等级
D.交易金额
12.在数据ETL过程中,以下哪些属于数据清洗的常见任务?
A.去重
B.格式转换
C.缺失值填充
D.异常值检测
13.若某业务场景需要计算“每个用户的信贷额度与收入比”,以下哪些方式可以实现?
A.事实表关联维度表
B.窗口函数计算
C.自连接查询
D.子查询计算
14.在数据仓库分层设计中,以下哪些层次属于数据加工层?
A.ODS层
B.DWD层
C.DWS层
D.ADS层
15.在数据仓库性能优化中,以下哪些策略最有效?
A.数据分区
B.索引优化
C.查询缓存
D.分表分库
16.若某业务场景需要计算“每个用户的近7天活跃时长”,以下哪些方式可以实现?
A.窗口函数计算
B.自连接查询
C.标量子查询
D.临时表计算
17.在数据质量监控中,以下哪些指标属于数据一致性范畴?
A.字段值匹配
B.逻辑校验
C.重复值比例
D.缺失值比例
18.若某企业使用Hive搭建数据仓库,其优势包括哪些?
A.支持SQL查询
B.高扩展性
C.低延迟
D.成本较低
19.在数据仓库的元数据管理中,以下哪些属于元数据的范畴?
A.数据字典
B.数据血缘
C.数据模型
D.数据质量规则
20.在数据仓库的运维监控中,以下哪些指标需要重点关注?
A.查询性能
B.容量使用率
C.数据延迟
D.异常日志
三、判断题(每题1分,共10题)
背景:某零售企业希望搭建数据仓库,支持门店销售数据的分析。
21.数据仓库中的事实表通常包含大量维度属性。(×)
22.数据ETL过程中,数据清洗的顺序是:去重→格式转换→缺失值填充。(×)
23.Snowflake数据仓库的压缩率通常低于传统数据仓库。(×)
24.数据分区可以显著提升数据查询性能。(√)
25.数据质量监控只需要关注数据的完整性。(×)
26.数据仓库中的维度表通常需要预先设计好所有属性。(√)
27.数据血缘主要用于追踪数据来源和去向。(√)
28.Hive数据仓库的性能通常优于Redshift。(×)
29.
有哪些信誉好的足球投注网站
文档评论(0)