- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
探索高效的定向和距离线索
用于区域语音分离
YihengJiang,HaoxuWang,YafengChen,GangQiao,BiaoTian
TongyiLab,AlibabaGroup,China
{jiangyiheng.jyh,tianbiao.tb,chenyafeng.cyf,wanghaoxu.whx,songjiang.qg}@
Abstract
在本文中,我们介绍了一种基于神经网络的区域
语音分离方法,使用麦克风阵列。该方法利用新
颖的空间线索从指定方向以及定义的距离内提取
声源信号。具体来说,我们的方法采用改进的延
本迟求和技术来获得方向性提示,显著增强了来自
译目标方向的信号。我们进一步通过将直达声与混图1:区域语音分离的示例。蓝色区域代表目标距
响比纳入输入特征中来增强分离效果,使模型能
中够更好地区分在指定距离内外的声源。实验结果离范围,橙色区域表示目标方向范围,它们的重叠
1表明,我们提出的方法在多个客观指标上取得了部分定义了目标语音区域。“干扰源”用“Interf.”
v
3显著提升。此外,在记录了真实世界对话场景的表示。
6
5CHiME-8MMCSG数据集上,我们的方法实现了于空间信息的语音分离鲁棒性中。例如,[13]的研
7
0最先进的性能,强调了其在实际应用中进行语音究利用神经网络从不同方向区域的干扰源中隔离
8.分离的有效性。目标语音,使用线性麦克风阵列。在[14]中,作者
0IndexTerms:麦克风阵列,区域语音分离,方训练网络隐式估计距离线索,在无噪声条件下分
5
2向和距离提示离指定范围内的语音。此外,一种称为Re-Zero[15]
:
v的方法利用两个级联的神经网络分别捕获方向和
i
x1.介绍距离线索,使用圆形麦克风阵列在空间区域内实
r
a现语音分离。此外,还有一些基于方向的语音分离
语音分离,即在嘈杂环境中从多个说话者中研究如[2,16],而基于距离的分离研究则因在噪
隔离目标语音,对于实际应用至关重要。这项技术声和动态环境中的距离线索估计挑战而较为有限
的进步极大地改善了一系列用途,包括选择性收[14]。
听、助听器和会议系统[1,2]。
当前的语音分离方法可以分为几类。一些方我们的研究,如图1所示,专注于基于神经网
法是为单通道分离设计的,从深度聚类[3]或置络的区域语音分离(RSS),使用麦克风阵列,其
换不变训练[4]开始。其他方法利用个性化特征中该区域由指定的距离和方向范围定义。传统的
来提取目标说话人的声音,并可能需要额外的模波束成形方法,例如DAS,在复杂环境中仅实现
块来生成说话人嵌入[5,6]。此外,像延迟求和适度的初始信号增强[17],但它们提供了至关重
(DAS)[7,8]、最小方差无失真响应(MVDR)[9,10]要的方向线索,神经网络可以利用这些线索来提
以及广义旁瓣抑制器(GSC)[11,12]这样的波束形
您可能关注的文档
- DiffVC-OSD:一步扩散感知神经视频压缩框架.pdf
- 使用时频回归和运动-顶叶网络整合改进 EEG 连续抓取力解码.pdf
- Ethics2vec: 自动代理与人类偏好的对齐.pdf
- GraphCoT-VLA:一种用于处理模糊指令的机器人操作的三维空间感知推理视觉语言动作模型.pdf
- LaRender:通过潜在渲染在图像生成中实现无训练遮挡控制.pdf
- 利用基于图的空域异常检测与纠正增强静态环境中的自我中心对象检测.pdf
- SOFA:用于模拟和优化房颤消融的深度学习框架.pdf
- 牙科锥束计算机断层扫描中带有截断视野的迭代重建方法.pdf
- HGMF:用于模型上下文协议中可扩展工具调用的分层高斯混合框架.pdf
- MSPT:一种基于多阶段渐进训练的轻量级人脸图像质量评估方法.pdf
- 高考是生物一轮复习 核酸.pptx
- 第13课 现代战争与不同文化的碰撞和交流(课件)高二历史下册课件(选择性必修3).pptx
- 《英语》(新标准)小学修订版三年级下册Unit 1分层教学设计.docx
- 《英语》(新标准)小学修订版三年级下册Unit 6分层教学设计.docx
- 《英语》(新标准)小学修订版三年级下册Unit 2分层教学设计.docx
- 《英语》(新标准)小学修订版三年级下册Unit 3分层教学设计.docx
- 《英语》(新标准)小学修订版三年级下册Unit 5分层教学设计.docx
- 2.3.3 真菌(第二课时)七年级生物上册课件(人教版2024).pptx
- 《英语》(新标准)小学修订版三年级下册Unit 4分层教学设计.docx
- 6.3价值的创造和实现 高中政治课件.pptx
最近下载
- 批灰工程合同5篇.docx VIP
- 上海交大匡震邦非线性连续介质力学课后习题答案.pdf VIP
- 迪士尼神奇英语单词汇总.pdf VIP
- 2013款北京现代胜达_汽车使用手册用户操作图解驾驶车主车辆说明书电子版.pdf
- 病情证明医院证明(标准模板).docx VIP
- 科拓前置式超声波车位引导系统调试手册V2.0.doc VIP
- 外研版(2025)必修第一册Unit 4 Friends Forever Developing ideas After twenty years 课件(共16张PPT)(含音频+视频).pptx VIP
- Unit4DevelopingideasAfterTwentyYears课件高中英语外研版必修第一册(完整版).pptx
- 从知识走向思维:小学数学结构化教学的“破与立”.pdf VIP
- 经皮冠状动脉介入治疗指南(2025).pdf VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
有哪些信誉好的足球投注网站
文档评论(0)