利用韵律信息的chmm连续数字语音识别 a study of connected digit speech recognition based chmm with prosodic information.pdfVIP

利用韵律信息的chmm连续数字语音识别 a study of connected digit speech recognition based chmm with prosodic information.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用韵律信息的chmm连续数字语音识别 a study of connected digit speech recognition based chmm with prosodic information

第32卷第12期 电子工量师 V01.32No.12 2006年12月 ELEC7IRONICENGINEER Dec.20D6 利用韵律信息的CHMM连续数字语音识别 张静亚1,俞一彪2 (1.常熟理工学院物理与电子科学系,江苏省常熟市215500; 2.苏州大学电子信息学院,江苏省苏州市215021) 摘要:提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于cHMM 续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级 对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数 字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。 关键词:语音识别;连续隐马尔可夫模型(CHMM);韵律信息 中图分类号:TN912.34 O引言 连续数字语音识别应用于电话语音拨号、声控留 言、电话卡业务、数据库信息查询等领域。但相对于英 口13 啦4 口35 6l(x) 62(X) 63(x) 64(X) 65(X) 语连续数字语音识别来说,汉语连续数字语音识别的 图1 5状态的len-to·r噎曲tCIIMM模型 误识率还不高,主要困难是:汉语是单音节字,而英语 则是多音节的,实验表明,音节越少,语音间混淆程度 模型的具体参数为: 就越大…;汉语连续数字的发音连续程度高于英语; 汉语连续数字中数字间协同发音现象较多。 Is2,s,,|s。,S5},t时刻的状态表示为g。。 目前,国内外实现语音识别主要采用两种技术:一 种是在识别阶段进行动态分割,直到动态路径有哪些信誉好的足球投注网站完 毕后,再进行路径回溯才能确定切分点并得到识别结 _,i+2。 果,如Level-building算法心】,但是这种算法不能解决 _】|f 解码时状态序列的错位问题以及由语速差异等造成的 模型不匹配问题,并且算法运算量大;另一种是采用预 切割,即预先将识别单元一个个分割,再进行识别,这 方差为U的多维高斯概率密度函数,M表示混合数, 种技术的关键是进行切割的准则。我们采用第2种识 c璃是状态_『第.j}个混合元的混合系数。 别技术,因为我们的识别目标是具有小词汇识别任务 1.2 CI删训练 的连续数字语音,因此切割准则的确立具有可实现性; 另外,第2种识别技术比第1种识别技术具有明显的 低运算量,对于语音识别的实时性有很大帮助。 l CIIMM训练及基于CHMM的连续数字语 A={A,C,肛,U}。 音识别基本算法 1.3 基于cI蹦M的连续数字语音识别基本算法 1.1 CHA曰讧 基于切割一识别方案的连续数字语音识别主要包 系统cHMM(连续隐马尔可夫模型)采用有跨越 括连续数字预切割、特征提取、模式匹配以及判决输 由左向右混合高斯型概率密度模型∞J,如图l所示。 出。各部分具体如下: a)连续数字预切割:利用语音信号的能量、过零 收稿日期:2006旬3.14 率等时域参

您可能关注的文档

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档