- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;;;基于数据的机器学习是现代智能技术的重要方面,研究从观测数据出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。而在第八章节中我们就对SVM有了基本的了解,学会了如何对数据集进行训练与预测,在本章节中我们将进行学习OpenCV中的机器学习概念。
本章节中我们将对人工神经网络(ANN)的概念进行学习,并采用OpenCV中的人工神经网络进行对数据的训练与预测。
;人工神经网络(ANN,ArtificialNeuralNetwork)是一种由大量的神经元互相连接所组成的复杂网络结构,它是一种模拟生物神经网络、或是动物的大脑组织结构或者功能的模拟。;神经元模型是一个包含输入,输出与计算功能的模型。如图11-1中,是一个典型的神经元模型。;如下图,该图为可视化的神经网络结构,如图中的节点为神经元,连接线为神经元之间的连接,每条连接线对应一个不同的权重。为了区分各个神经层,一个经典的神经网络包含三个层次,分别为输入层(InputLayer)、隐藏层(HiddenLayer)、输出层(OutputLayer)。;(1) 输入层:输入层表示神经网络的输入数目。如该网络需要进行判断是否为人,则该属性会有人的五官、四肢、体重、身高等,如果有5个属性则需要5个输入节点。
(2) 隐藏层:隐藏层负责输入层的加工处理。类似于人的感知神经,需要经过人的神经传递加工才能衍生出对感知的理解。隐藏层可以拥有多层,但是大多数情况只需要一层,要确定隐藏层的神经元数,则需要使用不同的设置方法进行测试,以选择最优的数目。隐藏神经元数目的选择原则:
神经元数目应该介于输入层的大小与输出层的大小之间。
如果输入层与输出层两者之间大小差距很大,则神经元数目应该选择与输出层大小更接近。
如果输入层的大小相对较小,则神经元数目最好是输入层和输出层大小之和的三分之二,或者小于输入层大小的两倍。
(3) 输出层:输出层表示信息在神经元中传递和中转、分析、权衡形成输出的结果,通过输出的结果就可以直接看出计算机对事物的认知。
;在后续的训练过程中,我们在训练集上训练出了最优的训练集,但是当我们将其使用在测试集中,会发现测试的误差很大,这时候有可能会出现一种特别常见且重要的现象——过拟合现象(Overfitting)。如下图中,则为分类问题中的过拟合现象,模型拟合程度过高,数据距离拟合曲线近。;对于如何解决过拟合现象,常用的有以下四种办法:
1.添加更多的训练数据
当训练数据更多时,泛化能力自然也越好,但该方法在很多情况下我们无法获取更
多的数据,当没有更多数据时采用其他方法。该方法为最优解决方法。
2.减小网格大小
减小模型大小,即减少模型中可学习参数的个数。
3.添加权重正则化
强制让模型权重只能取较小的值,从而限制模型的复杂度,这使得权重值的分布更
加规则,简单模型比复杂模型更不容易过拟合。
4.添加dropout正则化
在对某一层使用dropout,就是在训练过程中随机对该层的一些输出特征舍弃。
;欠拟合(Underfitting)与过拟合的区别在于,在使用已经训练完成的模型中,进行训练集的测试表现很差,并且在测试集的测试表现也很差,这种现象有可能就是欠拟合现象所导致的。如下图中,则为分类问题中的欠拟合现象,模型拟合程度不高,数据距离拟合曲线较远,或指模型没有很好地捕捉到数据特征,不能够很好地拟合数据。;对于如何解决欠拟合现象,常用的有以下四种办法:
1.添加新的特征项
有时候我们模型出现欠拟合的时候是因为特征项不够导致的,可以添加其他特
征项来很好地解决。
2.添加多项式特征
例如将线性模型通过添加二次项或者三次项使得模型的泛化能力更强。
3.减少正则化参数
正则化的目的是用来防止过拟合的,但是现在模型出现了欠拟合,则需要减少
正则化参数。
;在人工神经网络的学习算法分类中,主要分成有监督学习、无监督学习、半监督
您可能关注的文档
- Python 编程测试卷(二).docx
- Python 编程测试卷(三).docx
- Python 编程测试卷(一).docx
- Python 综合测试卷(四-难度中等).docx
- Python 综合测试卷(五-爬虫+数据库,难度高).docx
- Python基础与大数据应用(第2版)(微课版) 试卷及答案1.docx
- Python基础与大数据应用(第2版)(微课版) 试卷及答案2.docx
- Python基础与大数据应用(第2版)(微课版) 试卷及答案3.docx
- Python基础与大数据应用(第2版)(微课版) 试卷及答案4.docx
- Python基础与大数据应用(第2版)(微课版) 试卷及答案5.docx
最近下载
- YAESU八重洲FT-8800R中文使用说明书 2014-05-05.pdf
- 小学体育教学课件:走进体育与健康的世界——常见运动损伤的预防和处理.pptx
- 2023-2024学年福建省厦门一中七年级(上)入学数学试卷(含答案).pdf VIP
- 3.1.1 椭圆及其标准方程 课件(共37张ppt) ——高二数学人教A版(2025)选择性必修第一册(含音频+视频).pptx VIP
- 2025江苏财经职业技术学院第二批招聘24人短期笔试模拟试题及答案解析.docx VIP
- 教师职称晋升教育教学能力水平测试复习资料.pdf VIP
- 天津大学《工程经济学》内部题库练习期末真题汇编及答案.pdf
- 2024年海南省中考地理试题卷(含答案解析) +2023年中考地理及答案.docx
- APQC跨行业流程分类框架(PCF)[必威体育精装版V7.4版-2024年8月21日版-雷泽佳编译).docx VIP
- 肿瘤患者预防跌倒公休会ppt.pptx
文档评论(0)