南开大学2022年9月《大数据开发技术》作业考核试题及答案参考4.pdfVIP

南开大学2022年9月《大数据开发技术》作业考核试题及答案参考4.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

南开大学2022年9月《大数据开辟技术》作业考核试题及答案参考

1.如果numPartitions是分区个数,那末Spark每一个RDD的分区ID范围是()

A.[0,numPartitions]

B.[0,numPartitions-1]

C.[1,numPartitions-1]

D.[1,numPartitions]

参考答案:B

2.MapReduce设计的一个理念就是(),因为挪移数据需要大量的网络传输开

销。

A.数据向计算靠拢

B.计算向数据靠拢

C.计算向网络靠拢

D.计算与数据并行

参考答案:B

3.Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处

理嵌套列表的函数,然后把返回结果连接起来。()

A.正确

B.错误

参考答案:A

4.Spark中DataFrame的()方法是进行分组查询

A.orderby

B.groupby

C.selectby

D.sortby

参考答案:B

5.实现大整数的乘法是利用()的算法。

A.贪心法

B.动态规划法

C.分治策略

D.回溯法

参考答案:C

6.Scala中数组的第一个元素索引为1。()

A.正确

B.错误

参考答案:B

7.回溯法有哪些信誉好的足球投注网站解空间树时,常用的两种剪枝函数为约束函数和限界函数。()

A.错误

B.正确

参考答案:B

8.以深度优先方式系统有哪些信誉好的足球投注网站问题解的算法称为回溯法。()

A.错误

B.正确

参考答案:B

9.以下哪种数据库适合于批量数据处理和即席查询()

A.MySQL

B.Oracle

C.Hbase

D.NosSQL

参考答案:C

10.以下哪个不是Scala的数据类型()

A.Int

B.ShortInt

C.Long

D.Any

参考答案:B

11.以下哪个方法可以创建RDD()

A.parallelize

B.makeRDD

C.textFile

D.loadFile

参考答案:ABC

12.Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。()

T.对

F.错

参考答案:F

13.()可解决HDFS中名称节点运行期间EditLog不断变大的问题

A.NameNode

B.SecondaryNameNode

C.DataNode

D.Block

参考答案:B

14.分支限界法与回溯法的求解目标相同。()

A.错误

B.正确

参考答案:A

15.Scala列表与数组非常相似,列表的所有元素可具有不同的类型。()

T.对

F.错

参考答案:F

16.内存级分析合用于总数据量在集群内存的最大级别以内的情况,使用内部数据

库技术,适合实时业务分析需求。()

A.对

B.错

参考答案:A

17.RDD的mapPartitions操作会导致Partitions数量的变化。()

A.正确

B.错误

参考答案:B

18.Scala中合并两个数组的方法是()

A.line

B.add

C.append

D.concat

参考答案:D

19.()是Spark的数据挖掘算法库

A.SparkCore

B.BlinkDB

C.GraphX

D.Mllib

参考答案:D

20.()是MicrosoftOffice的核心组件。

A.SQL

B.WORD

C.PPT

D.EXCEL

参考答案:D

21.PairRDD中()函数可以进行分组

A.mapValues

B.groupBy

C.groupByKey

D.reduceByKey

参考答案:BC

22.以下属于Hadoop的安装方式的有()。

A.单机模式

B.多机模式

C.分布式模式

D.并行模式

E.伪分布式模式

参考答案:ACE

23.下面哪种函数是回溯法中为避免无效有哪些信誉好的足球投注网站采取的策略

文档评论(0)

137****1559 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档