机器学习基础复习提纲(信息填充).docxVIP

机器学习基础复习提纲(信息填充).docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机 器学习基础复习提纲 目录 翻译 3 Python 语法: 3 Numpy 语法: 3 matplotlib 画图: 3 机器学习模型 3 1、选择题(16 分)和 2、是非题(14 分) 4 Python 语言的特点:动态类型,交互式,解释型,面向对象,多继承,函数返回值,函数作为参数,变长参数,缺省参数,命名参数 4 三种for,for 和while 中的 break, continue, else 5 List, Tuple, Dictionary, set 5 range()函数产生List 7 numpy.min, max, sort, argmin, argmax, argsort, flipud, [::-1] 7 scatter, plot, bar, box,绘制多轴图,subplot(numRows, numCols, plotNum) 8 机器学习的一般慨念,比如:有监督的机器学习、无监督的机器学习、强化学习等 9 机器学习模型评价方法和评价性能指标及其在 sklearn 中相关的函数 10 属性的类型,数据预处理技术(如 sklearn.preprocessing.StandardScaler, preprocessing.scale , preprocessing.MinMaxScaler() , preprocessing.normalize , processing.Normalizer()),过拟合和欠拟合,过拟合处理技术,参数和超参数 13 各个机器学习算法的基本性质 15 3、简答题(8 题 40 分)(录音 08.25-) 18 学过的机器学习算法相关类的作用及其构造函数主要参数的意义; 18 与超参数调整相关类的使用 19 数据预处理的方法, 如独热编码 preprocessing.OneHotEncoder() , sklearn.feature_extraction.DictVectorizer , 线 性 回 归 特 征 扩 展 方 法preprocessing.PolynomialFeatures , 文 本 处 理sklearn.feature_extraction.text.CountVectorizer 19 各种性能指标的计算,如二类分类问题的混淆矩阵、accuracy、precision、recall、f1、P-R 曲线和ROC 曲线,回归问题的 R-squared,聚类问题的关联矩阵、Rand index 和Jaccard Index 20 多类分类(Multi-class classification)问题的各种处理策略(PPT05-2 P17) 22 多标签分类(Multi-label classification)问题的各种处理策略(PPT05-2 P32) 22 学习过的主要集成机器学习算法的基本原理 22 主要机器学习算法的具体实现,如决策树如何选择属性,朴素贝叶斯方法如何预测,k-means 算法的 2 个主要步骤,层次聚类如何选择合并的簇 23 Python 语言lambda 表达式、filter、map 和reduce 的具体设计 24 4、算法设计题 26 用伪代码描述学习过的机器学习算法,如决策树、k-means、层次聚类、DBSCAN、强化学习算法(如 K-摇臂赌博机 ε-贪心法和Softmax 算法,Q-learning)、 集成学习算法等 26 用 python 语言实现上述算法 29 用给定的机器学习方法解决问题,通常会要求根据性能指标重复多次寻找最 优的超参数,将结果用曲线、柱状或者箱线图表示出来(主要类会给出) 30 翻译 Python 语法: List(列表), Tuple(元组), Dictionary(字典), set(集合) Numpy 语法: arg 基于下表 flipud(上下翻转) matplotlib 画图: scatter(散点图),plot(二维线画图),bar(直方图) box(箱线图),subplot(绘制多轴图) label(标签) 机器学习模型 评价方法(Evaluation Methods) Holdout Method(留出法) K-fold Cross-validation(K 折交叉验证法) Bootstrapping(自助法) 性能指标(Metrics for Binary Classification) 二类分类问题 Accuracy(准确率) Precision(查准率) Recall(查全率,召回率) 聚类分类 算法 LinearRegression(线性回归) Decision Tree(决策树) SVM(S

文档评论(0)

暗伤 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档