- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项是监督学习的典型任务?
A.降维(如PCA)
B.分类(如预测邮件是否为垃圾邮件)
C.聚类(如用户分群)
D.关联规则挖掘(如购物篮分析)
答案:B
解析:监督学习需要标签数据,核心任务是从输入到输出的映射。分类任务(如垃圾邮件识别)需要标注好的“垃圾/非垃圾”标签,属于监督学习。A(降维)、C(聚类)、D(关联规则)均为无监督学习任务,无需标签数据。
支持向量机(SVM)的核心思想是?
A.最小化训练误差
B.最大化类别间隔(Margin)
C.构建多棵决策树并集成
D.通过梯度下降优化交叉熵损失
答案:B
解析:SVM的核心是找到一个超平面,使得两类样本到超平面的最小距离(间隔)最大化,从而提高模型泛化能力。A是经验风险最小化的一般目标;C是随机森林的思想;D是神经网络等模型的优化方式。
以下哪种指标最适合评估类别高度不平衡的分类任务?
A.准确率(Accuracy)
B.F1分数(F1-score)
C.均方误差(MSE)
D.R2分数(R-squared)
答案:B
解析:类别不平衡时,准确率会被多数类主导(如99%负样本时,全预测负样本准确率99%但无意义)。F1分数是精确率和召回率的调和平均,能综合反映少数类的识别能力。C是回归任务指标,D是回归模型拟合优度指标。
以下哪种方法最常用于解决过拟合问题?
A.增加训练数据量
B.减少特征数量
C.提高模型复杂度
D.降低学习率
答案:A
解析:过拟合的本质是模型对训练数据过度学习,泛化能力差。增加训练数据量可提供更多样本多样性,缓解过拟合。B(减少特征)可能丢失有用信息;C(提高复杂度)会加剧过拟合;D(降低学习率)影响优化速度,与过拟合无直接关联。
特征工程中,“将年龄字段从连续值转换为‘青年/中年/老年’分桶”属于?
A.特征提取
B.特征选择
C.特征离散化
D.特征归一化
答案:C
解析:特征离散化是将连续特征划分为离散区间(如年龄分桶),可降低噪声影响并提升模型鲁棒性。A(提取)指从原始数据生成新特征(如图像像素转HOG特征);B(选择)是筛选重要特征;D(归一化)是将特征缩放到同一尺度(如0-1或Z-score)。
模型部署时,“将训练好的PyTorch模型转换为ONNX格式”主要目的是?
A.提高模型准确率
B.减少模型参数量
C.增强模型可解释性
D.实现跨框架推理(如TensorRT/OpenVINO)
答案:D
解析:ONNX(开放神经网络交换格式)是模型序列化的标准协议,支持不同框架(PyTorch/TensorFlow)间的模型迁移和推理部署。A(准确率)由训练决定;B(参数量)需通过剪枝/量化实现;C(可解释性)需SHAP/LIME等方法。
逻辑回归(LogisticRegression)的损失函数通常是?
A.均方误差(MSE)
B.交叉熵损失(Cross-Entropy)
C.绝对误差(MAE)
D.Hinge损失
答案:B
解析:逻辑回归用于二分类,输出概率值,交叉熵损失能衡量预测概率与真实标签的差异(标签为0/1时,损失函数为-ylog(p)-(1-y)log(1-p))。A是回归任务损失;C是鲁棒回归损失;D是SVM的损失函数。
以下哪种梯度下降变体的计算效率最高?
A.批量梯度下降(BatchGD)
B.随机梯度下降(SGD)
C.小批量梯度下降(Mini-batchGD)
D.动量梯度下降(MomentumGD)
答案:B
解析:SGD每次仅用1个样本计算梯度,更新速度最快(但噪声大)。A(批量GD)需遍历所有样本,计算成本高;C(小批量)是折中的常用方法;D(动量)是优化策略,不改变计算效率。
集成学习中,随机森林(RandomForest)属于?
A.Bagging方法
B.Boosting方法
C.Stacking方法
D.梯度提升树(GBT)
答案:A
解析:随机森林通过自助采样(Bootstrap)生成多棵决策树,每棵树独立训练后投票(分类)或平均(回归),是典型的Bagging(自助聚合)方法。B(Boosting)如Adaboost/XGBoost是串行训练,关注前序模型的错误样本;C(Stacking)是多层模型堆叠;D(GBT)是Boosting的一种。
深度学习中,ReLU激活函数的主要优点是?
A.避免梯度消失
B.输出值范围在(-1,1)
C.计算复杂度高
D.适合所有层的激活
答案:A
解析:ReLU(RectifiedLinearUnit)在输入0时梯度为1,避免了Sigmoid/Tanh在饱和区的梯度消失问题,加速训练。B是T
您可能关注的文档
- 2025年BIM工程师资格认证考试题库(附答案和详细解析)(1026).docx
- 2025年房地产估价师考试题库(附答案和详细解析)(1029).docx
- 2025年执业医师资格考试考试题库(附答案和详细解析)(1028).docx
- 2025年智能制造工程师考试题库(附答案和详细解析)(1021).docx
- 2025年智能家居工程师考试题库(附答案和详细解析)(1016).docx
- 2025年注册交互设计师考试题库(附答案和详细解析)(1015).docx
- 2025年注册公用设备工程师考试题库(附答案和详细解析)(1028).docx
- 2025年注册展览设计师考试题库(附答案和详细解析)(1026).docx
- 2025年注册岩土工程师考试题库(附答案和详细解析)(1027).docx
- 2025年注册资产管理师(CAMA)考试题库(附答案和详细解析)(1026).docx
- 2025年边缘计算工程师考试题库(附答案和详细解析)(1020).docx
- 2025年项目管理专业人士(PMP)考试题库(附答案和详细解析)(1028).docx
- 交通事故调解协议效力.docx
- 人工智能在保险市场精算建模中的应用.docx
- 人工智能在资产风险分级评估中的应用.docx
有哪些信誉好的足球投注网站
文档评论(0)