- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2025IEEEINTERNATIONALWORKSHOPONMACHINELEARNINGFORSIGNALPROCESSING,AUG.31–SEP.3,2025,ISTANBUL,TURKEY
语言对早期通过语音检测帕金森病
有影响吗?
PeterPlantingaBriacCordelleDominiqueLouërMircoRavanaelliDeniseKlein
McGillUniversityCentreforResearchonBrain,Language,andMusic
Mila-QuebecArtificialIntelligenceInstituteConcordiaUniversity
ABSTRACT虽然有一些研究表明可解释的语音测量可能足够
本使用语音样本作为生物标志物是检测和监测帕金森病准确,可以用作检测系统[2],但方法论错误[3]和
译(PD)进展的一种有前景的方法,但文献中对于如何较小的评估集已经对这类结果的普遍适用性产生了质
中最好地收集和分析这些数据存在相当大的分歧。早期疑[4]。最近的研究表明,音频基础模型可能会提供
从语音中检测PD的研究使用了持续元音发音(SVP)一个更具普遍性的基础[5]。
1任务,而一些最近的研究则探索了更具有认知要求的更好地理解影响基础模型的因素对于支持任何希
v
2任务的录音。为了评估语言在PD检测中的作用,我望使用这些系统的临床医生来说是必要的。传统的可
3
8们测试了具有不同数据类型和预训练目标的预训练模解释性技术无法检测PD[6],因此我们尝试改变录音
6型,并发现:(1)仅文本模型与语音特征模型的表现相中的信息内容、编码器的类型以及语言组件,以了解
1
7.当,(2)多语言Whisper优于自监督模型,而单语言音频基础模型关注的是哪些语音属性。
0Whisper表现较差,以及(3)AudioSet预训练在SVP本工作的贡献在于从几个不同的角度突出了语言
5
2上提高了性能,但在自发言语中没有。这些发现共同的作用。更具体地说:
:
v强调了语言对于早期检测帕金森病的关键作用。
i1.我们通过两种方式将语音变化的影响与语言变
x
rIndexTerms—语音生物标志物,帕金森病,多化的影响分开。在一个实验中,我们将音频编码
a
语言模型,自发性言语,语言标记器在SVP任务(主要是语音线索)上的准确性与
文本编码器在图片描述任务(主要是语言线索)
1.介绍上的准确性进行比较。在另一个实验中,我们将
在相同图片描述任务(DPT)上语音编码器的准
帕金森病(PD)影响了全世界数百万人[1].不幸
确性与文本编码器的准确性进行比较。在这两种
的是,诊断和监测这种疾病可能既昂贵又耗时。然而,
情况下,文本编码器至少和音频及语音编码器一
越来越多的证据表明,通过使用语音样本可以帮助临
样准确。
床医生的努力,因为这些样本便宜且易于收集。这项
研究必须面对两个主要困难:第一个是从小语料库中2.我们比较了冻结的
您可能关注的文档
- AURA:一个用于理解、推理与注释的多模态医疗代理-计算机科学-AI 代理-视觉-语言基础模型.pdf
- 不定最小二乘问题的参数块分裂预条件子-计算机科学-机器学习-算法.pdf
- 快速配电网拓扑估计通过子集和问题-计算机科学-机器学习-配电网格-图论-电力网络拓扑.pdf
- LinkedIn 中的薄弱环节:在大语言模型时代提升假档案检测能力-计算机科学-大语言模型-虚假档案检测-对抗训练.pdf
- SIA:通过意图感知增强视觉语言模型的安全性-计算机科学-视觉-语言模型-人工智能.pdf
- 面向具有几何先验的准确单目三维人体姿态估计实时框架-计算机科学-机器学习-单目 3D 姿态估计-实时推断.pdf
- 面向工业级 CRM 系统的弱监督技术以提升 ASR 模型性能-计算机科学-自动语音识别-数据增强-模型微调.pdf
- 评估语音转文本 × 大语言模型 × 文本转语音组合在 AI 面试系统中的应用-计算机科学-大语言模型-语音转文本.pdf
- 面向牙买加帕图瓦音乐转录的鲁棒语音识别-计算机科学-深度学习-自动语音识别-音乐转录.pdf
最近下载
- 医院室外管网景观绿化施工组织设计概述.doc VIP
- NB∕T 11080-2023 光伏组件电致发光(EL)检测技术规范.pdf
- FLNG丙烷预冷双氮膨胀天然气液化工艺及动态特性研究.pdf
- 三、案例分析题(共5题,(一)、(二)、(三)题各20分,(四)、(五)题各30分)(一.doc VIP
- 2024智慧矿山矿用车辆自动驾驶协同作业系统第5部分:测试方法及要求.docx VIP
- 商铺推广合同协议.docx VIP
- 心脏起搏器ppt课件完整版.pptx VIP
- 大型球铁铸件浇冒口设计原理.pdf VIP
- 医院室外管网景观绿化施工组织设计.pdf VIP
- 牛津译林版八年级英语下册1-8单元单词默写表.pdf VIP
文档评论(0)