深度学习及自动驾驶应用 课件 第4章 网络优化与正则化.pptx

深度学习及自动驾驶应用 课件 第4章 网络优化与正则化.pptx

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Chapter4网络优化与正则化第四章DeepLearningAndAutonomousDriving深度学习与自动驾驶应用

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第2页4.4数据预处理4.1网络优化4.3参数初始化方法4.2优化方法4.5逐层归一化目录Content4.6超参数优化4.7网络正则化

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第3页深度学习的矛与盾正则化优化降低模型复杂度经验风险最小

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第4页4.1网络优化结构差异大没有通用的优化算法超参数多非凸优化问题参数初始化逃离局部最优梯度消失(爆炸)问题

平坦最小值(FlatMinima)一个平坦最小值的邻域内,所有点对应的训练损失都比较接近大部分的局部最小解是等价的局部最小解对应的训练损失都可能非常接近于全局最小解对应的训练损失DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第5页4.1网络优化高维空间的非凸优化问题鞍点(SaddlePoint)驻点(StationaryPoint):梯度为0的点

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第6页4.1网络优化VISUALIZINGTHELOSSLANDSCAPEOFNNwithoutskipconnectionswithskipconnectionsLiH,XuZ,TaylorG,etal.Visualizingthelosslandscapeofneuralnets[C]//AdvancesinNeuralInformationProcessingSystems.2018:6389-6399.

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第7页4.1网络优化神经网络优化的改善方法更有效的优化算法来提高优化方法的效率和稳定性动态学习率调整梯度估计修正更好的参数初始化方法、数据预处理方法来提高优化效率修改网络结构来得到更好的优化地形优化地形(OptimizationLandscape)指在高维空间中损失函数的曲面形状好的优化地形通常比较平滑使用ReLU激活函数、残差连接、逐层归一化等使用更好的超参数优化方法

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第8页4.2优化方法随机梯度下降

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第9页4.2优化方法小批量随机梯度下降minibatch?几个关键因素:小批量样本数量梯度学习率

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第10页4.2优化方法批量大小的影响批量大小不影响随机梯度的期望,但是会影响随机梯度的方差批量越大,随机梯度的方差越小,引入的噪声也越小,训练也越稳定,因此可以设置较大的学习率而批量较小时,需要设置较小的学习率,否则模型会不收敛4种批量大小对应的学习率设置不同,因此并不是严格对比小批量梯度下降中,每次选取样本数量对损失下降的影响

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第11页4.2优化方法改进方法标准的(小批量)梯度下降学习率学习率衰减AdagradAdadeltaRMSprop梯度Momentum计算负梯度的“加权移动平均”作为参数的更新方向Nesterovacceleratedgradient梯度截断Adamisbetterchoice!Adam梯度方向实际更新方向

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第12页4.2优化方法学习率的影响

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第13页4.2优化方法学习率的衰减梯级衰减(stepdecay)线性衰减(LinearDecay)衰减示意图

DeepLearningAndAutonomousDriving深度学习与自动驾驶应用第14页4.2优化方法周期性学习率的调整

DeepLearningAndAutonomousDriving

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档