网站大量收购独家精品文档,联系QQ:2885784924

基于多尺度特征的开放世界半监督学习方法.pdf

基于多尺度特征的开放世界半监督学习方法.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于多尺度特征一致性的开放世界半监督学习

摘要

半监督学习(Semi-supervisedlearning,SSL)被用于解决监督学习高人工标注成本的

SSL

问题,研究如何同时利用有标记样本和无标记样本改进学习性能。近年,方法可以

有效地利用伪标签和一致性正则化提高性能,同时使用少量的有标记数据作为锚点纠正

模型。但这建立在一个被称为封闭世界的假设下,在封闭世界中未标注数据具有相似的

分布结构,这和大多数现实情况不符。在现实环境下数据会受到各种约束条件限制,例

如数据稀缺、数据分布不均匀以及数据含有未见过类等。为解决上述问题,研究人员引

入一个新概念开放世界SSL。在开放世界SSL中,目标是识别已知类的样本,同时检测

SSL

和分类未标记数据中出现的新类样本。本文对现有的开放世界技术进行了研究和分

SSLSSL

析,总结以下两点开放世界当前面临的挑战,一是开放世界难以兼顾已见过类

和新类的识别准确率;二是开放世界SSL方法在复杂数据集的新类识别性能上表现较差。

针对以上问题,本文的研究工作如下:

1

()本文针对兼顾已见过类和新类的识别准确率问题提出了基于同源特征一致性

的开放世界半监督学习模型(HomologousFeatureConsistency,HFC)。HFC分为半监

HFC

督模块和新类发现模块,在半监督模块中,通过伪标签和一致性正则化实现半监

HFC

督学习;在新类发现模块中,结合标记数据和未标记数据的图像特征和语义标签,

利用它们的成对相似性发现新类,使模型在获得新类知识的同时仍关注已见过类的知

HFC

识。使用半监督模块生成的不同增强版本的特征和语义标签作为新类发现模块的

输入项,计算它们的一致性来优化模型,提高了网络的分类准确率。

(2)本文针对开放世界SSL在复杂数据集上新类识别能力较差的问题,提出了基

Multi-ScaleEnhancedFeatureMSEF

于多尺度增强特征的开放世界半监督学习模型(,)。

不同于HFC的弱扰动增强方式,MSEF使用弱扰动、强扰动和特征扰动相结合的数据增

强方式,其中弱扰动增强分支用于监督其他增强分支进行训。然而,更复杂的数据增

强会使伪标签的可靠性变低,MSEF使用不确定性引导的温度系数缩放方法提高了伪标

签的可靠性。MSEF的多尺度增强方式使模型能探索更广泛的扰动空间,增强网络对新

类特征的泛化能力,进而提高了网络的分类准确率。

6CIFAR-10CIFAR-100TinyImageNetOxford-IIITPet

本文在个数据集、、、、

FGVC-AircraftStanford-CarsSSL

和上进行了充分的实验,比目前最优的开放世界方法在

已见过类和新类的综合性能上提升了1%,在新类的性能上提升了1.5%。

哈尔滨工程大学硕士学位论文

实验证明,本文提出的方法有效地提高了分类的准确率,相较于现有的开放世界

半监督学习方法,取得了较好的分类效果,可适用于缺乏大量数据标签且数据分布模

糊的数据集。

关键词:半监督学习;开放世界;新类发现;图像分类

基于多尺度特征一致性的开放世界半监督学习

您可能关注的文档

文档评论(0)

n1u。 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档