第12章语音识别资料.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第12章语音识别资料

* * 似然函数是指在参数条件下检测到数据的概率 * * * * * * * * 当词汇表较小,各个词条不易混淆时,DTW取得了很大成功。 * * * * viterbi算法是已知模型和观测序列,求最可能的状态序列。 * * FSVQ是一种有记忆的多码本的VQ技术。它不仅计算量小,而且适用于与上下文有关的语音识别。适合于特定人或非特定人、孤立词或连续语音识别。 LVQ(LearningVQ)即学习矢量量化,是由神经网络的并行分布来实现普通VQ的串行有哪些信誉好的足球投注网站,其运行速度远高于VQ。LVQ是通过有监督的学习来改进网络对输入矢量分类的正确率。 LVQ2是对LVQ的改进,因为LVQ在某些情况下对模式识别的分类效果不够稳定。LVQ2是带学习功能的矢量量化法,它在训练时采用适应性法,在满足一定条件的情况下,将错误的参考矢量移至离输入矢量更远些,而将正确的参考矢量移至离输入矢量更近些,以此来提高识别率。 13.2语音识别原理 * 专家知识库 存储各种语言学知识; 判决 根据各种距离测度选择适当的门限值; 检验结果 识别率 13.2语音识别原理 语音识别原理框图 * 更一般的语音识别系统 13.2语音识别原理 * 动态时间规整DTW 动态时间规整DTW(dynamic time warping)曾经是语音识别的一种主流方法。 其思路是:由于语音信号是一种具有相当大随机性的信号,即使相同说话者对相同的词,每一次发音的结果都是不同的,也不可能具有完全相同的时间长度。因此在与已存储模型相匹配时,未知单词的时间轴要不均匀地扭曲或弯折,以使其特征与模板特征对正。用时间规整手段对正是一种非常有力的措施,对提高系统的识别精度非常有效。 动态时间规整DTW是一个典型的优化问题,它用满足一定条件的的 时间规整函数W(n)描述输入模板和参考模板的时间对应关系,求解两模板匹配时累计距离最小所对应的规整函数。 13.3动态时间规整 * DTW的基本思想: 将时间规整与距离测度结合起来,采用动态规划技术,比较两个大小不同的模式,解决语音识别中语速多变的难题; 一种非线性时间规整模式匹配算法; 13.3动态时间规整 * 动态时间规整 语音识别模式匹配的问题:时间对准 同一个人在不同时刻说同一句话、发同一个音,也不可能具有完全相同的时间长度; 语音的持续时间随机改变,相对时长也随机改变; 端点检测不准确; 方法1:线性时间规整,均匀伸长或缩短 依赖于端点检测(经常采用时域分析方法,进行检测的主要依据是能量、振幅和过零率。 ); 仅扩展时间轴无法精确对准; 方法2:动态时间规整 DTW-Dynamic Time Warping; 60年代Itakura提出来的; 13.3动态时间规整 * 动态时间规整法 j B i A j i O w (i) 模板 输入 * 动态规划算法基本思想是将待求解问题分解成若干个子问题 动态规划算法总体思想 n T(n/2) T(n/2) T(n/2) T(n/2) T(n) = 13.3动态时间规整 * 但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常只有多项式量级。求解时,有些子问题被重复计算了许多次。 动态规划算法总体思想 n T(n) = n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) 13.3动态时间规整 * 如果能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,就可以避免大量重复计算,从而得到多项式时间算法。 动态规划算法总体思想 n = n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 n/2 T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) T(n/4) T(n) 13.3动态时间规整 * 动态规划基本步骤 找出最优解的性质,并刻划其结构特征。 递归地定义最优值。 以自底向上的方式计算出最优值。 根据计算最优值时得到的信息,构造最优解。 13.3动态时间规整 * 动态时间规正法(DTW)的计算实例 ck=(ik, jk) (ik, jk-1) (ik-1, jk) min 2 1 7 5 1 5 1 6 4 7 2 4 5 2 4 3 3 4 8 2 2 1 5 1 19 20 23 26 17 22 16 22 16 18 15 19 12 11 15 16 7 9 17

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档