基于B_W算法训练连续语音的关键技术.pdfVIP

基于B_W算法训练连续语音的关键技术.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
石油、天然气工业

维普资讯 大 庆 石 油 学 院 学 报 第 29卷 第4期 2005年 8月 JOURNAIOFDAQINGPETROLEUM INSTITUTE Vo1.29 No.4 Aug. 2005 基于 B—W 算法训练连续语音的关键技术 李 军 ,刘晓明,李 龙 (大庆石油学 院 计算机与信息技术学院,黑龙江 大庆 163318) 摘 要:B W 算法是基于隐含马尔可夫模 型连续语音建模所采 用的技术 探讨了基于 B w 算法 的连续语音 建模 的关键技术——计算溢出及训练样本差异 问题 ,提出了解决方法 :对计算溢 出可采用对数变换 的方法扩展计算机所 能表 示的数值范围给 以解决 ;差异样本训练可在训练 中消除将定样句子单元信息予以解决. 关 键 词 :语音识别;B w 算法 ;计算溢出;模型参数 中图分类号 :TN912.34 文献标识码 :A 文章编号 :1000一l89l(2005)04—012l—O3 0 引言 语音建模是开发语音识别系统的重要技术.建模通常可分为两大类 :一是基于规则的语音建模,其具 有局限性,应用并不普遍 ;二是基于统计的语音建模 ,这是根据大量的语音训练样本确定统计参数的建模 方法 ,只要有较多具有代表性的样本 ,并且模型足够精细 ,统计建模通常能获得较好的结果.目前最常用 的是基于隐含马尔可夫模型 (HMM)的统计建模方法,其又可细分为离散 HMM(DHMM)、连续 HMM (CHMM)和半连续 HMM(SCHMM).为提高语音建模精度,以SCHMM[1为例 ,探讨建立语音模型的关 键技术 . 1 语音建模方法及 问题 基于 HMM 的语音建模过程可以采用 B w 算法[2]实现 ,但使用该算法建立语音模型应注意 : (1)计算溢出问题.采用 B~w算法计算前后项系数时,状态转移概率介于 0~1,而概率密度输 出函 数值通常小于 1,如果初始模型和训练语音存在较大偏差,概率密度输 出函数结果将远小于 1.因此经过 多次递推的结果是前 、后项系数非常小 ,以至超出计算机所能表示数值范围的下限,将本来非 0的数值置 为机器 0,造成计算下溢,导致归一化结果 出现错误 3【]. (2)训练样本差异问题.在连续语音训练中,要评估的语音单位参数是嵌在长短各异 、内容千差万别 的句子中,而B w 算法是从总体上评估语音帧序列对各状态的影响.因此 ,对于不 同训练样本,计算 出的 同一语音单位参数必然存在差异 ].如果不采取适 当的措施解决此 问题,就无法训练出准确的语音模型 参数. 2 计算溢 出的解决方法 . 以基于SCHMM 训练码本高斯均值为例 ,探讨在 B—W 算法中解决计算溢出问题.为便于讨论 ,只使 用单模型和单样本训练. 设模型有 L个状态 5一S ,训练样本帧数为 N,记为 l,一 {Y,Y。,…,Y),码本数为-,,输入语音的状 态序列为X,“,为第z个状态的初始状态概率 ,A 为 “状态向 状态的转移概率 ,P ()为z状态的概率密 度函数 ,£为 l状态第 个高斯函数的权重. 根据 HMM参数的定义 ,计算高斯均值M,的B w 算法步骤为 收稿 日期:2004—12—18;审稿人 :李从信 ;编辑:陆雅玲 作者简介:李 军 (1969一),男 ,硕士,讲师 ,主要从事语音技术及其应用方面的研究 维普资讯 大 庆 石 油 学 院 学 报 第 29卷 2005年 (1)对模型参数评估得到一定的初值 ,这些初值可能是粗糙的. (2)利用前、后项算法求前项因数a(z)和后项因数 (z),递推公式为 z) {∑

文档评论(0)

fengbing + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档