基于实例筛选和非对称多层次结构的自监督预训练方法研究.pdfVIP

基于实例筛选和非对称多层次结构的自监督预训练方法研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

随着社会信息化的高速发展,计算机科学研究需要处理的数据的规模日益增大,人

工的数据标注是越来越昂贵而费时。自监督方法可以通过无需人工标注的方式,从数据

本身挖掘信息,通过设计合适的辅助任务来为特征提取器学习有区分度的视觉数据表征。

目前的自监督方法在单实例标志性数据集中预训练取得有效的进展。但针对目前运用越

来越广泛的多实例非标志性数据集,由于它们具有不同尺度的多个实例及大量的无效背

景信息,直接进行自监督预训练的效果则难以提升。

为了能直接在不具有任何人工标注的多实例数据集中进行预训练,也能得到有效的

特征提取器,本文提出了基于实例筛选和非对称多层次结构的自监督预训练模型。本文

的研究工作主要为:

(1)为了提取数据集中含有实例信息的局部区域,提出了无监督实例区域筛选模块。

该模块通过LC显著性检测和局部RGB信息熵两种指标,创新性地进行了一种二次筛

选的过程,利用自身的数据特点在无监督环境下高效地对局部实例区域进行筛选。

(2)提出了非对称的自监督对比学习框架。构建了非对称的局部对比尺度和非对称

的随机大小裁剪增强范式,从而提升了预训练过程中对比表征的区分度。

(3)基于全局-局部层次以及高分辨率-低分辨率层次两种多层次的范式,研究了综合

层次的自监督模型,通过不同层次的对比损失函数对图像表征进行了综合的对比学习。

实验表明本文提出的自监督模型能有效提升特征提取器在下游任务中的表现,具有

一定的理论和工程应用价值。

关键词:深度学习,自监督学习,预训练模型,对比学习

Abstract

Withtherapiddevelopmentofinformationtechnology,thescaleofdatathatcomputer

visionneedstodealwithisincreasing.Manualdataannotationisbecomingmoreandmore

expensiveandtime-consuming.Self-supervisedmethodscanmineinformationonlyfromthe

originaldatawithoutemployingexpensiveannotations.Itletthefeatureextractorlearns

discriminativevisualdatarepresentationsbydesigningappropriateauxiliarytasks.Currentself-

supervisedmethodshaveachievedsignificantsuccessinpre-trainingoniconicsingle-instance

datasets.Nevertheless,itisdifficulttogettheidealperformancepre-trainingdirectlyonthe

increasinglyusednon-iconicmulti-instancedatasets.Thesedatasetscontainseveralmulti-scale

instancesandalargeamountofbackgroundnoise.

Inordertopre-trainingonnon-iconicmulti-instancedatasetswithoutanymanual

annotationeffectively,thisthesisproposesanovelself-supervisedmodelbasedontheinstance

selectionmoduleandasymmetricmulti-levelstructure.Themaincontributioncanbe

summarizedas:(1)Anunsupervisedpatchselectionmoduleisproposedtoextractloca

文档评论(0)

精品资料 + 关注
实名认证
文档贡献者

温馨提示:本站文档除原创文档外,其余文档均来自于网络转载或网友提供,仅供大家参考学习,版权仍归原作者所有,若有侵权,敬请原作者及时私信给我删除侵权文

1亿VIP精品文档

相关文档