评估基于 Logit 的 GOP 分数以检测误读-计算机科学-发音良好度-发音错误检测.pdf

评估基于 Logit 的 GOP 分数以检测误读-计算机科学-发音良好度-发音错误检测.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

评估基于Logit的GOP分数以检测误读

AdityaKamleshParikh,CristianTejedor-Garcia,CatiaCucchiarini,HelmerStrik

CentreforLanguageStudies,RadboudUniversity,theNetherlands

aditya.parikh@ru.nl,cristian.tejedorgarcia@ru.nl,catia.cucchiarini@ru.nl,helmer.strik@ru.nl

Abstract可用工具和资源有限而进一步加剧。

为了解决这些挑战,计算机辅助发音训练

发音评估依赖于发音良好度(GOP)分数,这些

(CAPT)系统变得越来越受欢迎[5,6]。这些系

分数传统上由基于softmax的后验概率得出。然

统的关键组成部分是误发音检测与诊断(MDD),

而,后验概率可能受到过度自信和音素分离不良

它帮助学习者实时识别并纠正发音错误[7]。特别

的影响,限制了它们的有效性。本研究比较了基于

是音素级评估比更广泛的单词或句子级别评估提

logit的GOP分数与基于概率的GOP分数在误读

本供了更精确的反馈,使学习者能够专注于特定的

检测中的应用。我们在两组非英语母语人士(荷兰

译改进领域[8]。用于检测音素级误发音最常用的方

语和普通话使用者)说的英语语音数据集上进行

中法之一是发音优度(GOP)分数[9]。

了实验,评估分类性能并与人类评分的相关性。基

2GOP最初被引入作为发音质量的衡量标准,

v于logit的方法在分类方面优于基于概率的GOP,

7但它们的效果取决于数据集特征。最大logitGOP估计音素的概率,并将其与预定义的阈值进行比

6较以标记误读[10]。随着时间的推移,一些改进措

0与人类感知最为一致,而不同GOP分数的组合则

2施提高了其准确性。加权GOP[11]根据语言和声

1平衡了概率和logit特性。研究结果表明,结合不

.学因素调整音素得分,优先考虑容易误读的音素。

6确定性建模和音素特定加权的混合GOP方法可

0以改善发音评估。基于格图的GOP[12]使用音素格图考虑多种发音

5可能性,从而产生更稳健的信心分数。上下文感

2IndexTerms:GOP,基于logit的GOP,发音

:知GOP[13]结合了音素转换和持续时间以更好地

v错误检测,发音评估,softmax后验概率

i捕捉自然发音的变化。最近,引入了多维GOP特

x

r

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档