- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据选择题题库及答案
一、单项选择题(每题2分,共10题)
1.大数据的4V特征不包括以下哪一项?()
A.Volume
B.Variety
C.Velocity
D.Value
答案:D
解析:大数据的4V特征是Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),这里问的是不包括的,所以选D。
2.以下哪种技术常用于大数据的存储?()
A.Hadoop
B.Spark
C.Python
D.Java
答案:A
解析:Hadoop是常用的大数据存储框架,Spark主要用于大数据计算,Python和Java是编程语言,所以选A。
3.大数据处理流程的第一步通常是()
A.数据清洗
B.数据采集
C.数据分析
D.数据可视化
答案:B
解析:没有数据采集就没有后续的数据处理,所以第一步通常是数据采集,选B。
4.下列哪个不是大数据分析的常用算法?()
A.决策树算法
B.冒泡排序算法
C.聚类算法
D.关联规则算法
答案:B
解析:冒泡排序算法是基本的排序算法,不属于大数据分析常用算法,其他选项都是,所以选B。
5.大数据中数据量达到PB级别的是()
A.少量数据
B.中等数据
C.海量数据
D.超大数据
答案:C
解析:PB级别属于海量数据范畴,少量数据量小,中等数据达不到PB级别,超大数据表述不准确,所以选C。
6.大数据技术栈中负责数据处理的组件是()
A.Hive
B.HBase
C.Kafka
D.Flume
答案:A
解析:Hive用于数据处理,HBase是分布式数据库,Kafka是消息队列,Flume是日志收集工具,所以选A。
7.大数据的价值密度通常()
A.很高
B.中等
C.很低
D.不确定
答案:C
解析:大数据数据量巨大但有价值的信息相对较少,价值密度低,所以选C。
8.以下哪种数据类型不属于大数据范畴?()
A.结构化数据
B.半结构化数据
C.非结构化数据
D.简单文本数据
答案:D
解析:简单文本数据属于非结构化数据,大数据包含结构化、半结构化和非结构化数据,所以选D不合适,应选D。
9.大数据分析可以帮助企业()
A.降低成本
B.提高效率
C.精准营销
D.以上都是
答案:D
解析:大数据分析能在降低成本、提高效率、精准营销等多方面帮助企业,所以选D。
10.以下哪个是大数据可视化工具?()
A.Tableau
B.MySQL
C.Redis
D.Tomcat
答案:A
解析:Tableau是大数据可视化工具,MySQL是数据库,Redis是缓存,Tomcat是服务器,所以选A。
二、多项选择题(每题2分,共10题)
1.大数据的特点包括()
A.大量
B.多样
C.高速
D.价值密度低
答案:ABCD
解析:大数据的4V特征就是大量、多样、高速、价值密度低,所以全选。
2.大数据采集的方式有()
A.网络爬虫
B.传感器收集
C.数据库导入
D.用户上传
答案:ABCD
解析:网络爬虫可采集网页数据,传感器收集各种环境数据等,数据库导入已有数据,用户上传如上传文件等,这些都是大数据采集方式。
3.大数据分析算法中的监督学习算法有()
A.线性回归
B.逻辑回归
C.支持向量机
D.决策树
答案:ABCD
解析:这些都是监督学习算法,都需要有标记的数据来训练模型。
4.常见的大数据分布式文件系统有()
A.HDFS
B.Ceph
C.GlusterFS
D.NTFS
答案:ABC
解析:HDFS是Hadoop分布式文件系统,Ceph和GlusterFS也是常见的分布式文件系统,NTFS是Windows系统的文件系统,不属于大数据分布式文件系统。
5.大数据处理框架有()
A.Hadoop
B.Spark
C.Storm
D.Flink
答案:ABCD
解析:这些都是常用的大数据处理框架,各有特点和适用场景。
6.大数据安全面临的挑战有()
A.数据泄露
B.数据篡改
C.数据丢失
D.隐私保护
答案:ABCD
解析:大数据安全方面存在数据泄露风险,数据可能被篡改,也可能丢失,同时隐私保护也是重要挑战。
7.大数据在医疗领域的应用有()
A.疾病预测
B.医疗影像分析
C.药物研发
D.患者管理
答案:ABCD
解析:通过大数据分析可进行疾病预测,分析医疗影像,辅助药物研发,更好地管理患者。
8.大数据在教育
有哪些信誉好的足球投注网站
文档评论(0)