- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于聚类的难样本挖掘用于监督对比说话人验证
PiotrMasztalski,MichałRomaniuk,JakubŻak,MateuszMatuszewski,Konrad
Kowalczyk
SamsungRDInstitutePoland,
AGHUniversityofKrakow,Poland
{p.masztalski,m.romaniuk2,j.zak,m.matuszews2}@,konrad.kowalczyk@.pl
Abstract其中一些报告了与基于分类的方法相当甚至更好
的性能[7,8,9]。说话人验证中的对比方法主要是
在说话人验证中,对比学习作为一种替代传统的
在自监督学习(SSL)中探索的[10,11,12,13,14]。
基于分类的方法而越来越受欢迎。对比方法可以
大多数SSL方法都是基于从图像表示学习中适应
受益于有效使用困难负样本对,这些不同类别的
过来的SimCLR框架[15],该框架通过最大化同一
样本由于其相似性特别具有挑战性,对于验证模
样本的不同增强视图之间的协议(正对),同时最
型来说难以区分。本文提出了一种基于聚类的困
本大化不同样本之间的距离(负对)。训练目标是使
难负采样方法CHNS,专门用于监督对比说话人
译用归一化的温度缩放交叉熵(NTXent)损失实现
表征学习。我们的方法将相似说话人的嵌入进行
中的,该损失将一对正样本的相似性与一批中的锚
聚类,并调整批量组成以在计算对比损失时获得
1点和负例之间的相似性进行对比。由于基于SSL
v困难和简单负样本的最佳比例。实验评估显示,的SV缺乏类别标签,正对通常通过增强同一音
0CHNS优于基线监督对比方法(无论是否使用基
4频话语来构建,这可能会导致模型学习频道特征
5于损失的困难负采样)以及最先进的基于分类的
7(例如录音设备、声学环境),而不是语音依赖特性
1.说话人验证方法,在VoxCeleb数据集上使用两种[10]。此外,对于SSL的一个必要假设是当随机抽
7轻量级模型架构时相对EER和minDCF最多提取两个音频话语时总是获得来自两位不同说话人
0高了18%。
5的片段,但这并不总成立,并可能导致在损失计算
2IndexTerms:说话人验证,监督对比学习,硬
:中注入错误的负样本。
v负例采样,聚类
i监
您可能关注的文档
最近下载
- 防盗门破拆应用技术课程介绍讲解.docx VIP
- 1.2.1学习使用显微镜课件-人教版生物七年级上册 (1).pptx VIP
- 海水 G-F-降B-降E-降A调正谱 虎门销烟 刘岩.pdf VIP
- 超快闪蒸焦耳加热合成方法和用于实施其的系统.pdf VIP
- 高频热电场皮肤治疗仪产品技术要求.docx VIP
- 英语国家概况Unit14_Post-WWII_American_Foreign_Policy.ppt VIP
- 《建设工程监理规范》GB-T50319-2024版-附.pptx VIP
- 入党积极分子培训心得体会.docx VIP
- 2024河南平顶山市叶县招才引智卫生系统事业单位人才引进拟引进人员笔试备考试题及答案解析.docx VIP
- 超快闪蒸焦耳加热合成方法和用于实施其的系统.pdf VIP
文档评论(0)