手把手教你用深度学习做物体检测5-YOLOv2.docxVIP

手把手教你用深度学习做物体检测5-YOLOv2.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

手把手教你用深度学习做物体检测(六):YOLOv2介绍

本文接着上一篇《手把手教你用深度学习做物体检测(五):YOLOv1介绍》文章,介绍YOLOv2在v1上的改进。有些性能度量指标术语看不懂没关系,后续会有通俗易懂的关于性能度量指标的介绍文章。

YOLOv2

论文:《?YOLO9000:Better,Faster,Stronger》

地址:??/pdf/1612.08242v1.pdf

yolov2和v1的区别

引入了BatchNormalization?

有一定的正则化效果,可以减轻过拟合,这样就不用使用dropout等优化方法了。BN归一化了激活函数的输入值,加快了隐藏层单元的学习速度。可以抑制covariateshift现象对深层网络较深的层的影响(covariateshift是指训练样本和测试样本分布不同导致的训练模型在测试数据上表现不佳的问题)。

HighResolutionClassifier(采用高分辨率的分类器)

这里是指在ImageNet上训练的时候就用到了448*448的分辨率(先224*224训练160个epochs,然后就调整到了448*448,再跑10个epochs),而yolov1时采用的224*224。

ConvolutionalWithAnchorBoxes(采用锚盒)

引入AnchorBoxes后,每个格子预测9个边界框,比v1多了,结果是准确率下降0.3%,召回率提升7%。?因为可以通过进一步的工作来加强准确率,所以说改进空间提高了。

DimensionClusters(维度聚类)

anchorboxes需要是精选的先验框,也就是说一开始的anchorboxes如果比较好,网络就更容易学到准确的预测位置。这里作者使用了k-means的方法来选择anchorboxes.需要注意的是,计算过程中作者用IOU得分代替了欧氏距离的方法,使得boxes的聚类是受IOU的影响。k值的选择,作者经过实验确定为5。

Directlocationprediction?

为了解决预测的边界框坐标不稳定,anchor可能预测很远处的格子(gridcell)的问题,作者利用logistic回归函数把anchor的偏移量限制在了0到1之间,使得anchor只用于预测其周围的边界框。该方法使mAP获得了5%的提升。

Fine-GrainedFeatures(浅层纹理特征)

为了在小尺度物体检测上表现的好,作者添加了一个passthrough?layer(转移层),就是把浅层纹理特征拼接到深层特征图,这波操作?使得模型的性能获得了1%的提升。

Multi-Scaletraining(多尺度训练)因为去掉了全连接层,任意输入维度都可以在网络中运行,所以作者每10个batches就随机选择一个新的size进行输入,YOLO网络使用的降采样参数为32,即使用32的倍数进行尺度池化{32*10,32*11,…,32*19}。最终最小的尺寸为320*320,最大的尺寸为608*608。这种机制使得网络可以更好地预测不同尺寸的图片,意味着同一个网络可以进行不同分辨率的检测任务,在小尺寸图片上YOLOv2运行更快,在速度和精度上达到了平衡。在小尺寸图片检测中,YOLOv2的mAP堪比FasterR-CNN。在大尺寸图片检测中,YOLOv2在VOC2007上mAP为78.6%,仍然高于平均水准。

Darknet-19

yolov2使用了Darknet-19这个新的网络结构作为特征提取部分,输入大小变为416*416。

另外,作者提出了一种可以同时在?COCO和fulllImageNet(前9000类)数据集中进行训练的方法,训练出的模型可以?实现9000种物体的实时检测(具体内容建议看原论文)。用作者的话说就是:使用这个联合训练方法,YOLO9000使用COCO的检测数据来学会找到图片中的物体,使用ImageNet中的数据来学会给这些找到的物体分类。

总结一下:

YOLOv2在学习速度、准确度、对小目标的检测、对不同尺度图片的检测上都有提升。

YOLOv2的改进就介绍到这里啦,下一篇文章《手把手教你用深度学习做物体检测(七):YOLOv3》中,我们会介绍v3做了哪些新的改进。

文档评论(0)

133****2256 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档