湛江科技学院《多元数据分析》2023-2024学年第一学期期末试卷.docVIP

湛江科技学院《多元数据分析》2023-2024学年第一学期期末试卷.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

装订线

装订线

PAGE2

第PAGE1页,共NUMPAGES3页

湛江科技学院

《多元数据分析》2023-2024学年第一学期期末试卷

院(系)_______班级_______学号_______姓名_______

题号

总分

得分

批阅人

一、单选题(本大题共20个小题,每小题1分,共20分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、在对一组数据进行统计分析时,发现其中有一个异常值。以下哪种方法处理异常值比较合适?()

A.直接删除

B.用均值替代

C.用中位数替代

D.根据具体情况判断

2、如果一个数据集中存在极端值,以下哪种集中趋势的度量更具有代表性?()

A.均值B.中位数C.众数D.几何平均数

3、在进行因子分析时,如果提取的公共因子能够解释原始变量总方差的80%以上,说明什么?()

A.因子分析效果不好

B.提取的公共因子数量过多

C.提取的公共因子能够较好地反映原始变量的信息

D.原始变量之间的相关性较弱

4、为研究不同年龄段人群对某种新产品的接受程度,随机抽取了三个年龄段的人群进行调查。如果要检验不同年龄段之间的接受程度是否有显著差异,应采用哪种方法?()

A.单因素方差分析

B.双因素方差分析

C.多因素方差分析

D.卡方检验

5、某地区的房价数据存在极端值,为了更稳健地描述房价的平均水平,应采用以下哪种统计量?()

A.均值

B.中位数

C.众数

D.几何平均数

6、某班级学生的身高数据近似服从正态分布,要估计身高在170cm以上的学生所占比例,应使用哪种统计方法?()

A.标准正态分布表B.t分布表C.F分布表D.卡方分布表

7、为了评估一个分类模型的性能,除了准确率外,还可以使用以下哪个指标?()

A.召回率

B.F1值

C.混淆矩阵

D.以上都是

8、对某批产品进行质量检验,随机抽取200个产品,其中不合格产品有20个。以95%的置信水平估计这批产品的不合格率,其置信区间为()

A.(0.06,0.14)B.(0.07,0.13)C.(0.08,0.12)D.(0.05,0.15)

9、在一项关于城市居民消费水平的调查中,随机抽取了500个家庭,记录了他们每月的消费支出。若要估计该城市所有家庭平均每月消费支出的95%置信区间,以下哪种抽样方法更合适?()

A.简单随机抽样

B.分层抽样

C.整群抽样

D.系统抽样

10、在一项市场调研中,比较了三个品牌的产品满意度得分,得分数据为有序分类数据。要检验三个品牌的满意度是否有显著差异,应采用哪种非参数检验方法?()

A.Kruskal-Wallis检验

B.Mann-WhitneyU检验

C.Wilcoxon符号秩检验

D.Friedman检验

11、在一次关于大学生就业意向的调查中,共发放问卷1000份,回收有效问卷800份。在有效问卷中,有400人表示希望毕业后进入国有企业工作。以95%的置信水平估计大学生中希望毕业后进入国有企业工作的比例的置信区间为()

A.(0.45,0.55)B.(0.47,0.53)C.(0.48,0.52)D.(0.49,0.51)

12、某工厂生产的零件尺寸服从正态分布,规定尺寸在[10±0.5]范围内为合格品。随机抽取一个零件,其尺寸为9.8,计算该零件为合格品的概率是?()

A.0.6826

B.0.9544

C.0.3413

D.0.8185

13、已知某时间序列的自相关函数在滞后1期的值为0.8,滞后2期的值为0.5。这说明该时间序列具有什么特征?()

A.短期相关性强B.长期相关性强C.无相关性D.无法确定

14、在进行假设检验时,如果p值小于给定的显著性水平,我们应该做出怎样的决策?()

A.拒绝原假设B.接受原假设C.无法确定D.重新进行检验

15、已知某地区的人口增长率在过去5年分别为2%、3%、1%、4%、2%,采用几何平均法计算这5年的平均人口增长率约为()

A.2.4%B.2.5%C.2.6%D.2.7%

16、对于一个包含多个变量的数据集,若要降低变量维度同时保留大部分信息,以下哪种方法较为常用?()

A.因子分析

B.聚类分析

C.对应分析

D.典型相关分析

17、某企业为了分析产品质量与生产工艺之间的关系,收集了大量数据。经过分析发现,产品质量得分与生产工艺复杂度之间的相关系数为-0.6。这说明两者之

文档评论(0)

182****1805 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档