- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
如何评估自动语音识别:比较不同的性能和偏差度量方法
TanvinaPatel,WiebkeHutiri,AaronYiDing,OdetteScharenborg
DelftUniversityofTechnology,TheNetherlands
SonyAI,Switzerland
t.b.patel@tudelft.nl,wiebke.hutiri@,aaron.ding@tudelft.nl,o.e.scharenborg@tudelft.nl
Abstract和代表性不足的群体[10]等因素,在商用语音识
别系统中存在性能不均和偏见。这些发现共同强
越来越多的证据表明,自动语音识别(ASR)系统
调了研究自动语音识别(ASR)中的偏见的需求。
对不同的说话人和说话人群体存在偏见,例如由
ASR系统的性能差异可能源自不同的已知和未知
于性别、年龄或口音。关于ASR中偏见的研究到
来源:训练数据的偏差及其中的文化细微差别、人
目前为止主要集中在检测和量化偏见以及开发缓
类转录的一致性问题、所使用的神经网络架构类
解方法上。尽管有了这些进展,但仍有一个开放性
本型,以及已经提到的与说话人相关的特征(年龄、
问题是如何衡量系统的性能和偏见。在这项研究
译说话风格、口音、情绪和短期健康状况)[5,11]和
中,我们比较了来自文献中的不同性能和偏见度
中与说话人无关的因素(环境、录音技术及应用场
量方法,并提出了一些新的措施来评估最先进的
1景)[12]。量化并解决性能差异对于缓解语音识别
v端到端ASR系统对荷兰语的表现。我们的实验使中的偏见和促进公平至关重要。偏见测量(或公平
5用了几种偏见缓解策略来解决针对不同说话人群
8性标准)用于量化和测量偏见的指标是从统计基
8体的偏见问题。发现表明,平均错误率(在ASR
5础指标中计算得出的。在ASR中,主要的基础度
0.研究中的一项标准)单独并不足以衡量系统性能,量是词错误率(WER)、音素错误率(PER)和字符
7还需要补充其他度量方法。本文最后提出了一些
0建议,以更好地报告ASR系统的性能和偏见,从错误率(CER),偶尔会进行一些修改,例如排除
5删除[13],困惑度来评估语言模型[7],以及置信
2而更准确地反映该系统对多样化说话人群体的表
:分数来估计输出的概率而不完全依赖于地面真实
v现以及整体的系统偏见。
i转录[11]。偏
您可能关注的文档
- 团队 Unibuc - 在 SemEval-2025 任务 11 中的 NLP:少量样本文本情绪检测-计算机科学-大语言模型-少量样本-情感检测.pdf
- MusiScene:利用 MU-LLaMA 进行场景想象和增强视频背景音乐生成-计算机科学-音乐语言模型-视频背景音乐生成.pdf
- CogniPlay:一个正在进行中的人类样模型用于通用游戏 playing-计算机科学-类人人工智能-认知心理学-蒙特卡洛树有哪些信誉好的足球投注网站.pdf
- 评估零速鳍片滚转阻尼的线性控制策略-计算机科学-机器学习-船舶运动控制.pdf
- 关于动态高维数据学习索引的成本与收益:扩展版本-计算机科学-学习索引-动态数据集-最近邻有哪些信誉好的足球投注网站.pdf
- 不精确概率的属性提取-计算机科学-属性提取-多分布学习.pdf
- 中国早产保温箱行业市场规模及未来投资方向研究报告.pdf
- 中国早强型水泥行业市场规模及未来投资方向研究报告.pdf
- 中国早幼教行业市场规模及未来投资方向研究报告.pdf
- 中国早园笋行业市场规模及未来投资方向研究报告.pdf
文档评论(0)