基于HMM模型进行语音识别的基本思路.docVIP

基于HMM模型进行语音识别的基本思路.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 基于HMM模型进行语音识别的基本思路 摘要:本文对隐马尔科夫模型(HMM)HMM模型进行语音识别这一方法的基本思路进行了简单的介绍。 关键字: 隐马尔可夫(HMM),模型,语音识别 1 知识背景 隐马尔可夫模型作为语音信号的一种统计模型,在语音处理各个领域中广泛 的应用,它的理论基础是在1970年前后由Buam等人建立起来的,随后由CMU的Baker和BIM的eJhnek等人将其应用到语音识别之中。由于贝尔实验室Rbainer等人在20世纪80年代中期对HMM的深入浅出的介绍,才逐渐使HMM为世界各国从事语音处理研究人员所了解和熟悉,进而成为公认的有效的语音识别方法。 (1)统计模型方法 (2)基于声道模型和语音知识的方法 (3)模式匹配的方法 (4)人工神经网络的方法 基于声道模型和语音知识的方法起步较早,没有达到实用的阶段。目前常用的方法是后三种方法,目前它们都已达到了实用阶段。 隐马尔可夫模型(HMM) 是常见的统计型模型方法,本文主要介绍经典的隐马尔可夫模型及其在语音识别中的应用。 2 隐马尔可夫模型 马尔可夫过程(或马尔可夫链)直观解释是: 在已知系统目前的状态(现在)的条件下,“将来”与“过去”无关。这种过程也称为无记忆的单随机过程。如果这种单随机过程的取值(状态)是离散的,我们又可以将它称作无记忆的离散随机过程。 假设有一个系统,它在任何时间可以认为处在有限多个状态的某个状态下。在均匀划分的时间间隔上,系统的状态按一组概率发生改变(包括停留在原状态),这组概率值和状态有关,而且这个状态对应于一个可观测的物理事件,因此称之为可观测马尔可夫过程。 不可测(随机)的双随机过程只能通过另一组随机过程才能观测到,另一组随机过程产生出观测序列(行为),而这组行为是可见不可测的。因此,这种双随机过程称为隐马尔可夫模型(或隐马尔可夫过程)。通常,HMM对应的状态被假设为离散的,且其演变是无记忆的,因而,HMM也被称为无记忆的离散双随机过程。 一个隐马尔可夫模型由下列参数来决定: (1) N—模型的状态数目。 状态的集合表示为 (2) N—观测符号数。 即每个状态可能输出的观测符号的数目。 观测符号集合表示为 (3) A—状态转移概率分布。 状态转移概率构成的矩阵为 B—状态的观测符号概率分布。 (5) (—初始状态分布。 为了完整地描述一个隐马尔可夫模型,应当指定状态数N,观测符号数M,以及三个概率密度A、B和( 。这些参数之间有一定的联系,因此为了方便,HMM常用 来简记。 给定HMM的形式后,为了将其应用于实际,必须解决以下三个基本关键问题: (1) 已知观测序列和模型,如何有效的计算在给定模型条件下产生观测序列O的概率 。 (2) 已知观测序列和模型 ,如何选择在某种意义上最佳的状态序列。 (3) 给定观测序列,如何调整参数使条件概率最大。 2.1 第一个问题的求解 这是一个评估问题,即已知模型和一个观测序列,怎样来评估这个模型(它与给定序列匹配得如何),或怎样给模型打分,这个问题通常被称为“前向-后向”的算法解决。 (一)前向算法 首先要定义一个前向变量: 即在给定模型条件下,产生t以前的部分观测符号序列,且t时刻又处于状态的概率。 以下是前向变量进行迭代计算的步骤: (1) 初始化 (2) 迭代计算 (3) 最后计算 其中 为状态转移矩阵中的元素, 为观测符号矩阵中的元素。 (二)后向算法 同理,可以类似地定义后向变量: 即在给定模型及时刻处于状态的条件下,产生t以后的部分观测符号序列的概率。 后向变量也可以用迭代法进行计算,步骤如下: 初始化 (2) 迭代计算 (3) 最后计算 前向和后向算法对于求解问题2和问题3也是有帮助的。 由于表示t时刻处于状态且部分观测序列为,而表示t时刻处于状态且剩下部分的观测序列为,因而 、表示产生整个观测序列O且t时刻处于状态的概率,即 那么,问题1也可以通过同时使用前向后向概率来求解,即 2.2 第二个问题的求解 这个问题是求取伴随给定观测序列产生的最佳状态序列。这一最佳判据,目的就是要使正确的状态数目的期望值最大。它通常用Viterbi算法解决,用于模型细调。 首先定义变量: 它是在给定观测序列O和模型的条件下,t时刻处在状态的概率。 可用前后向变量表示为: 由于 所以有 且 从而可求出在各个时刻所处的

文档评论(0)

2011doc66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档