不同目标先验下的视频目标分割及其对抗攻击算法研究.pdfVIP

下载本文档

1
0
约24.19万字
约 105页
2025-11-17 发布于广东
举报
版权申诉

不同目标先验下的视频目标分割及其对抗攻击算法研究.pdf

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

视频目标分割任务旨在从给定视频中获取感兴趣目标的像素区域，可应用于自动

驾驶、视频会议、视频编辑、人机交互等多个实际场景。根据指定目标的方式即目标

先验的不同，视频目标分割可以分为对于自主定位目标的无监督视频目标分割、利用

目标相关的语句描述指定目标的参考语句视频目标分割、给定视频首帧像素级别标注

的半监督视频目标分割等设置。然而现有方法存在诸如分割目标未指定、处理速度慢、

候选目标交互复杂、生成候选掩膜相似等问题。同时，现有视频目标分割算法缺乏对

安全性的关注。为解决上述问题，本文围绕无监督视频目标分割与参考语句视频目标

分割展开研究，并从对抗攻击角度探讨现有视频目标分割算法的安全性。本文主要的

贡献阐述如下：

（1）针对分割目标未指定与处理速度慢的问题，提出基于高效长短期时序注意

力的无监督视频目标分割方法（LSTAN）。首先，针对分割目标未指定，提出了长期

时序记忆与短期时序注意力模块，分别捕捉持续存在的物体与移动的物体作为目标；

然后对编码持续存在物体与移动物体的特征表示进行融合，以准确定位目标所在像素

区域；另外，所提出的两个模块分别引入正交随机投影与基于局部性的滑动窗口机制

获得线性复杂度，最终获得实时分割速度。

（2）针对视频内候选目标交互复杂、候选目标掩膜相似的问题，提出基于完全

转换器的参考语句视频目标分割方法（FTEA）。首先，对于候选目标间交互复杂的

问题，提出完全转换器模型，该模型利用了转换器模块从视频与描述语句中学习视觉

文本特征表示，提出堆叠转换器模块从目标级别学习空间上下文，然后将解码的视觉

特征为对应准确的候选目标掩膜；其次，对于候选目标缺乏监督信息造成的生成候选

目标掩膜外观相似问题，提出了针对候选目标掩膜的多样性损失，鼓励候选目标掩膜

之间的差异，使得生成的候选目标掩膜尽可能覆盖所有真实候选目标，最终获得准确

的所指目标掩膜。

（3）针对视频目标分割算法的安全问题，提出了基于困难区域学习的视频目标

分割对抗攻击方法（ARA）。首先，针对现有视频目标目标分割算法，首次研究噪声

扰动对分割性能的影响，表明现有基于深度神经网络的方法存在安全缺陷；其次提出

对抗区域攻击方法，通过学习视频帧中难以被分割算法判别的像素区域，即困难区域，

来生成特定的噪声扰动加入至原始视频，增强对分割算法的攻击能力，从而有效降低

被攻击模型的准确率。

对于研究工作（1），在视频目标分割数据集DAVIS2016、YouTube-Objects和

FBMS上做了大量定量、定性以及消融实验。依据评价指标FPS，区域相似度与轮廓

准确率，所提方法LSTAN具有优越的分割速度与性能。对于研究工作（2），在视频

目标分割数据集A2D-Sentences、JHMDB-Sentences和Ref-YouTube-VOS上做了大量

定量、定性以及消融实验。依据评价指标OverallIoU、MeanIoU、Precision@X、mAP、

JMean、FMean，所提出的方法FTEA具有优越的分割性能。对于研究工作（3），

在视频目标分割数据集DAVIS2016、DAVIS2017、YouTube-VOS和A2D-Sentences

上进行了大量实验，所获得的定量和定性结果证明提出的对抗区域攻击方法能够有效

降低分割算法准确率。另一方面表明分割算法对噪声干扰的鲁棒性较差。

关键词：视频目标分割，时序注意力，堆叠转换器，对抗攻击

Abstract

Videoobjectsegmentationaimstoobtainthepixel-wiseobjectregionsofinterest

fromagivenvideo.Itcanbewidelyusedinautomaticdriving,videoconference,

videoeditingandhuman-computerinteraction.Accordingtothedifferentmethodsof

objectassignment,i.e.,objectpri

您可能关注的文档

文档评论（0）

n1u1 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

不同目标先验下的视频目标分割及其对抗攻击算法研究.pdfVIP