- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
石油、天然气工业
维普资讯
大 庆 石 油 学 院 学 报 第 29卷 第4期 2005年 8月
JOURNAIOFDAQINGPETROLEUM INSTITUTE Vo1.29 No.4 Aug. 2005
基于 B—W 算法训练连续语音的关键技术
李 军 ,刘晓明,李 龙
(大庆石油学 院 计算机与信息技术学院,黑龙江 大庆 163318)
摘 要:B W 算法是基于隐含马尔可夫模 型连续语音建模所采 用的技术 探讨了基于 B w 算法 的连续语音 建模
的关键技术——计算溢出及训练样本差异 问题 ,提出了解决方法 :对计算溢 出可采用对数变换 的方法扩展计算机所 能表
示的数值范围给 以解决 ;差异样本训练可在训练 中消除将定样句子单元信息予以解决.
关 键 词 :语音识别;B w 算法 ;计算溢出;模型参数
中图分类号 :TN912.34 文献标识码 :A 文章编号 :1000一l89l(2005)04—012l—O3
0 引言
语音建模是开发语音识别系统的重要技术.建模通常可分为两大类 :一是基于规则的语音建模,其具
有局限性,应用并不普遍 ;二是基于统计的语音建模 ,这是根据大量的语音训练样本确定统计参数的建模
方法 ,只要有较多具有代表性的样本 ,并且模型足够精细 ,统计建模通常能获得较好的结果.目前最常用
的是基于隐含马尔可夫模型 (HMM)的统计建模方法,其又可细分为离散 HMM(DHMM)、连续 HMM
(CHMM)和半连续 HMM(SCHMM).为提高语音建模精度,以SCHMM[1为例 ,探讨建立语音模型的关
键技术 .
1 语音建模方法及 问题
基于 HMM 的语音建模过程可以采用 B w 算法[2]实现 ,但使用该算法建立语音模型应注意 :
(1)计算溢出问题.采用 B~w算法计算前后项系数时,状态转移概率介于 0~1,而概率密度输 出函
数值通常小于 1,如果初始模型和训练语音存在较大偏差,概率密度输 出函数结果将远小于 1.因此经过
多次递推的结果是前 、后项系数非常小 ,以至超出计算机所能表示数值范围的下限,将本来非 0的数值置
为机器 0,造成计算下溢,导致归一化结果 出现错误 3【].
(2)训练样本差异问题.在连续语音训练中,要评估的语音单位参数是嵌在长短各异 、内容千差万别
的句子中,而B w 算法是从总体上评估语音帧序列对各状态的影响.因此 ,对于不 同训练样本,计算 出的
同一语音单位参数必然存在差异 ].如果不采取适 当的措施解决此 问题,就无法训练出准确的语音模型
参数.
2 计算溢 出的解决方法 .
以基于SCHMM 训练码本高斯均值为例 ,探讨在 B—W 算法中解决计算溢出问题.为便于讨论 ,只使
用单模型和单样本训练.
设模型有 L个状态 5一S ,训练样本帧数为 N,记为 l,一 {Y,Y。,…,Y),码本数为-,,输入语音的状
态序列为X,“,为第z个状态的初始状态概率 ,A 为 “状态向 状态的转移概率 ,P ()为z状态的概率密
度函数 ,£为 l状态第 个高斯函数的权重.
根据 HMM参数的定义 ,计算高斯均值M,的B w 算法步骤为
收稿 日期:2004—12—18;审稿人 :李从信 ;编辑:陆雅玲
作者简介:李 军 (1969一),男 ,硕士,讲师 ,主要从事语音技术及其应用方面的研究
维普资讯
大 庆 石 油 学 院 学 报 第 29卷 2005年
(1)对模型参数评估得到一定的初值 ,这些初值可能是粗糙的.
(2)利用前、后项算法求前项因数a(z)和后项因数 (z),递推公式为
z) {∑
文档评论(0)