从模糊到卓越检测:基于 YOLO 的超分辨率空中物体检测-计算机科学-神经网络-机器学习.pdfVIP

从模糊到卓越检测:基于 YOLO 的超分辨率空中物体检测-计算机科学-神经网络-机器学习.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

从模糊到卓越检测:基于YOLO的超分辨率

空中物体检测

RagibAminNihal,BenjaminYen,TakeshiAshizawa,KatsutoshiItoyama,andKazuhiroNakadai

SystemsandControlEngineering,InstituteofScienceTokyo,Japan

RIKEN,Japan

表I

摘要—空中物体检测面临小型物体尺寸、高密度聚类以及由

自然数据集与空中数据集之间的性能差异。一些统计数据来源于[13]。

于距离和运动模糊导致的图像质量退化带来的挑战。这些因素造

成了信息瓶颈,其中有限的像素表示无法编码足够的判别特征。DatasetSSDYOLOv3RefineDetFaster-RCNNRetinaDet

B2BDet通过两阶段框架解决了这一问题,在推理过程中应用MS-COCO[4]26.8133.0341.7941.4839.13

VisDrone2018[3]2.5220.0321.0721.3431.88

特定领域的超分辨率处理,然后使用增强的YOLOv5架构进行

域图像则包含较小、密集排列的物体,具有更大的尺度

本检测。与训练时间的超分辨率方法不同,我们的方法从每张输入变化和复杂的环境条件。

图像中恢复视觉信息。该方法结合了针对航空优化的SRGAN

译微调以及架构创新,包括高效的注意力模块(EAM)和跨层特近期的方法通过专门的架构[5],[6],[7]、注意力机制[8]

中征金字塔网络(CLFPN)。在四个航空数据集上的评估显示了和多尺度特征融合[9],[10]来解决空中检测挑战。这些

2性能提升,在VisDrone数据集中仅使用27.7M参数就实现方法专注于架构改进,但并未解决根本问题:小且模糊

v了52.5%的mAP。消融研究表明,超分辨率预处理带来了

1+2.6%的mAP改进,而架构改进增加了+2.9%,总共比的对象中视觉信息不足。这些方法可以改善特征提取,

6基线YOLOv5提高了+5.5%。该方法在计算效率上实现了但无法恢复输入图像中缺失的细节。

6

453.8%的参数减少,同时实现了强大的小型物体检测性能。超分辨率(SR)技术可以解决这一信息瓶颈。张等人[11]

1

.通过训练时间超分辨率引导开发了SR辅助检测,在训

1I.介绍练过程中一个SR分支指导骨干网络的学习,但在推理

0

4空中物体检测对于监控、农业、城市规划和灾害应时为了计算效率而被丢弃。他们的方法在VEDAI数据

2

:对应用至关重要[1]。与传统的地面级图像相比,空域图集[12]上实现了73.61%的准确率,并且比YOLOv5x少

v

i像带来了独特的挑战:物体显得更小(通常占图像区域用18.1倍的GFLOPs,通过增强学习到的特征表示而不

x

r的%),存在运动模糊和大气影响,并且存在于复增加推理开销。然而,在训练时间使用SR的方法有一

a

杂的背景中[2]。个限制:它们可以增强学习到的表示,但无法恢复低分

这些挑战影响了可供检测算法使用的视觉信息。当物体辨率测试图像中缺失的视觉信息。

在空域图像中仅占据50-100个

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档