2024年大数据分析与应用1+X证书初级考试(含答案解析).docxVIP

2024年大数据分析与应用1+X证书初级考试(含答案解析).docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2024年大数据分析与应用1+X证书初级考试(含答案解析)

第一部分:单项选择题(共20题,每题1分)

1、结构化数据的典型存储形式是?

A非文本文件

B二维表格

C音频片段

D图像文件

答案:B

解析:结构化数据通常以行和列的二维表格形式存储(如Excel、数据库表),便于计算机识别和处理。非文本文件、音频、图像多为非结构化数据,故ACD错误。

2、数据清洗的核心目的是?

A提升数据质量

B增加数据量

C生成可视化图表

D训练预测模型

答案:A

解析:数据清洗通过处理缺失值、纠正错误、删除重复值等操作提升数据质量。增加数据量(B)需采集而非清洗;可视化(C)和建模(D)是后续分析步骤,故BCD错误。

3、Excel中计算数值总和的函数是?

AAVERAGE

BSUM

CCOUNT

DMAX

答案:B

解析:SUM函数用于计算数值总和;AVERAGE求均值,COUNT计数,MAX求最大值,故ACD错误。

4、Python中表示列表的符号是?

A{}

B[]

C()

D

答案:B

解析:列表使用方括号[]定义;{}是字典,()是元组,无特殊含义,故ACD错误。

5、用于展示数据分布特征的图表是?

A柱状图

B折线图

C直方图

D饼图

答案:C

解析:直方图通过矩形面积展示数据分布频率;柱状图比较类别值(A),折线图显示趋势(B),饼图展示占比(D),故ABD错误。

6、数据质量的基本维度不包括?

A完整性

B准确性

C复杂性

D一致性

答案:C

解析:数据质量通常包含完整性(无缺失)、准确性(无错误)、一致性(格式统一),复杂性(C)是数据特征而非质量维度,故错误。

7、数据库表中“行”的另一种称谓是?

A字段

B记录

C索引

D视图

答案:B

解析:数据库表中,行表示一条完整的信息记录;列称为字段(A),索引(C)用于加速查询,视图(D)是虚拟表,故ACD错误。

8、统计中“中位数”指的是?

A数据的平均值

B出现次数最多的值

C按序排列后的中间值

D最大值与最小值之差

答案:C

解析:中位数是数据按大小排序后的中间数值;均值(A)、众数(B)、极差(D)分别对应不同统计量,故ABD错误。

9、处理缺失值的常见方法是?

A直接删除含缺失值的记录

B增加新数据字段

C绘制散点图分析

D建立分类模型

答案:A

解析:删除含缺失值的记录或填充是常见处理方式;增加字段(B)、绘图(C)、建模(D)不直接解决缺失问题,故BCD错误。

10、CSV文件的核心特征是?

A二进制存储格式

B行列用逗号分隔

C支持图形嵌入

D自带数据加密

答案:B

解析:CSV(逗号分隔值)文件以逗号分隔行列数据,是纯文本格式;二进制(A)、图形(C)、加密(D)均非其特征,故ACD错误。

11、Python中输出内容的函数是?

Ainput()

Bprint()

Cdef()

Dclass()

答案:B

解析:print()函数用于输出内容;input()获取输入(A),def定义函数(C),class定义类(D),故ACD错误。

12、数据采集的主要目的是?

A消除数据矛盾

B获取原始数据

C生成分析报告

D优化存储结构

答案:B

解析:数据采集是从源头获取原始数据的过程;消除矛盾(A)是清洗任务,生成报告(C)是分析结果,优化存储(D)是处理步骤,故ACD错误。

13、标准化处理数据的主要原因是?

A减少数据量

B统一量纲影响

C增加数据维度

D提升可视化效果

答案:B

解析:标准化通过转换数据尺度消除不同量纲(如厘米与千克)的影响;减少数据量(A)需抽样,增加维度(C)需特征工程,可视化(D)与标准化无关,故ACD错误。

14、用于检测数据异常值的工具是?

A箱线图

B折线图

C词云图

D热力图

答案:A

解析:箱线图通过四分位数间距识别异常值;折线图显示趋势(B),词云图展示文本频率(C),热力图显示矩阵数据(D),故BCD错误。

15、数据库中主键的核心作用是?

A加速数据查询

B存储大量数据

C唯一标识记录

D分类数据类型

答案:C

解析:主键通过唯一约束确保每条记录的唯一性;加速查询(A)是索引功能,存储(B)是表的基本作用,分类(D)需字段设计,故ABD错误。

16、Excel中“自动填充”功能适用于?

A合并多个单元格

B快速复制规律数据

C计算复杂公式

D删除重复行

答案:B

解析:自动填充可快速复制序列(如日期、序号)或规律数据;合并单元格(A)用“合并后居中”,复杂计算(C)需公式,删除重复(D)用数据工具,故ACD错误。

17、Python中字符串的定义符号是?

A[]

B{}

C或

D()

答案:C

解析:字符串需用单引号或双引号包裹;[]是列表(A),{}是字典(B),()是元组(D),故ABD错误。

18、数据仓库的核心特点是

您可能关注的文档

文档评论(0)

小Tt + 关注
实名认证
文档贡献者

一级建造师持证人

繁华落幕

领域认证 该用户于2023年11月03日上传了一级建造师

1亿VIP精品文档

相关文档