- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据考试试题及答案
单项选择题(每题2分,共10题)
1.以下哪种存储适合大数据?
A.磁带B.硬盘C.HBaseD.软盘
答案:C
2.大数据4V特征不包括?
A.大量B.高速C.高价D.多样
答案:C
3.以下哪个是分布式计算框架?
A.SparkB.ExcelC.PhotoshopD.Word
答案:A
4.数据清洗的目的不包括?
A.去除重复数据B.增加数据量C.处理缺失值D.纠正错误数据
答案:B
5.以下哪种算法属于聚类算法?
A.K近邻B.决策树C.K-MeansD.逻辑回归
答案:C
6.大数据分析流程第一步是?
A.数据收集B.数据分析C.数据可视化D.数据存储
答案:A
7.Hadoop核心组件不包括?
A.HDFSB.MapReduceC.YARND.SQL
答案:D
8.以下哪个工具常用于数据可视化?
A.PythonB.RC.TableauD.Java
答案:C
9.数据挖掘任务不包括?
A.关联规则挖掘B.数据加密C.分类D.预测
答案:B
10.以下哪个不是NoSQL数据库类型?
A.键值数据库B.关系型数据库C.文档数据库D.图形数据库
答案:B
多项选择题(每题2分,共10题)
1.大数据处理的关键技术有?
A.数据采集B.数据存储C.数据分析D.数据传输
答案:ABC
2.以下属于机器学习算法的有?
A.支持向量机B.朴素贝叶斯C.梯度下降D.快速排序
答案:ABC
3.Hadoop生态系统包含?
A.HiveB.PigC.FlumeD.Kafka
答案:ABCD
4.数据质量评估指标有?
A.准确性B.完整性C.一致性D.及时性
答案:ABCD
5.以下哪些是大数据的应用领域?
A.金融B.医疗C.教育D.交通
答案:ABCD
6.分布式文件系统的优点有?
A.高可扩展性B.容错性强C.数据冗余D.存储成本低
答案:ABC
7.数据预处理包括?
A.数据标准化B.数据离散化C.特征选择D.数据采样
答案:ABCD
8.以下属于NoSQL数据库的有?
A.RedisB.MongoDBC.CassandraD.MySQL
答案:ABC
9.大数据分析常用编程语言有?
A.PythonB.JavaC.ScalaD.C++
答案:ABC
10.数据可视化的作用有?
A.快速理解数据B.发现数据规律C.展示分析结果D.数据加密
答案:ABC
判断题(每题2分,共10题)
1.大数据就是数据量特别大的数据。(×)
2.Spark比MapReduce计算速度慢。(×)
3.数据仓库是面向事务处理的。(×)
4.聚类算法是无监督学习算法。(√)
5.HDFS适合存储小文件。(×)
6.机器学习一定需要大量的标注数据。(×)
7.数据可视化能完全替代数据分析。(×)
8.分布式计算能提高计算效率。(√)
9.关系型数据库适合存储大数据。(×)
10.数据清洗对数据分析结果影响不大。(×)
简答题(每题5分,共4题)
1.简述大数据4V特征。
答案:4V特征指大量(Volume),数据量巨大;高速(Velocity),数据产生和处理速度快;多样(Variety),数据类型繁多;价值(Value),数据价值密度低但总体价值大。
2.简述MapReduce工作原理。
答案:MapReduce分Map和Reduce阶段。Map阶段将输入数据切分成多个分片,对每个分片进行映射处理,输出键值对;Reduce阶段对Map输出的键值对按键进行归约处理,得到最终结果。
3.数据挖掘主要有哪些任务?
答案:主要任务有分类,将数据划分到不同类别;聚类,把相似数据归为一类;关联规则挖掘,发现数据间关联关系;预测,根据现有数据预测未来值。
4.简述HBase特点。
答案:HBase是分布式、面向列的开源数据库。具有高可靠性、高性能、可伸缩性强等特点,适合存储海量稀疏数据,读写性能好,能应对大规模数据的实时读写需求。
讨论题(每题5分,共4题)
1.讨论大数据在医疗领域的应用及面临的挑战。
答案:应用:辅助疾病诊断、疾病预测、药物研发等。挑战:数据隐私与安全
您可能关注的文档
- 安全生产实务试题及答案.doc
- 化学检验工试题及答案.doc
- 手卫生规范试题及答案.doc
- 学前比较教育试题及答案.doc
- 临床检验基础试题及答案.doc
- 儿科试题库及答案.doc
- 国际商法期末试题及答案.doc
- 招标师模拟试题及答案.doc
- 农业推广学试题及答案.doc
- 化学新课标试题及答案.doc
- 2022-2023学年江苏省常州市溧阳市四年级下学期期中数学真题及答案.pdf
- 2022-2023学年江苏盐城建湖县五年级上册语文期末试卷及答案.pdf
- 2021-2022学年河南省卫辉市人教版三年级上册期末考试数学试卷及答案.pdf
- 2022-2023学年浙江杭州萧山区五年级下册语文期中试卷及答案.pdf
- 2022-2023学年江苏省淮安市二年级下学期数学月考试题及答案.pdf
- 2021年山西公务员申论考试真题及答案-乡镇.pdf
- 2021年普通话考试内容题库必威体育精装版版.pdf
- 2021-2022年江苏苏州太仓市六年级上册期中语文试卷及答案(部编版).pdf
- 2022-2023学年山东省滨州市博兴县四年级下学期期末数学真题及答案.pdf
- 2021年四川内江小升初语文真题及答案.pdf
最近下载
- 2025-2030中国靛蓝染料行业市场发展趋势与前景展望战略研究报告.docx
- DGTJ08-2299-2019 型钢混凝土组合桥梁设计规范.pdf VIP
- 班主任带班育人方略PPT课件.pptx VIP
- 2024年山东省日照市中考生物真题卷(含答案与解析).pdf VIP
- 小学六年级上学期美术《第12课 走向明天》教学课件.pptx VIP
- 科斯定理_反思与拓展_兼论中国农地流转制度改革与选择_罗必良.pdf VIP
- catia电气设计操作手册.pdf VIP
- 八下《卖炭翁》选择题专练-冲刺2024年中考语文古代诗歌课内篇目常考题型专练(统编版六册)(解析版).docx VIP
- 2025年国开电大机考网考-经济学基础-真题(2).docx
- 广东省深圳市南山区2024-2025学年上学期期末教学质量监测七年级英语试题(含答案).pdf VIP
文档评论(0)