第12章语音识别资料.pptVIP

下载本文档

3
0
约9.08千字
约 61页
2017-06-18 发布于湖北
举报
版权申诉

第12章语音识别资料.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第12章语音识别资料

* * 似然函数是指在参数条件下检测到数据的概率 * * * * * * * * 当词汇表较小，各个词条不易混淆时，DTW取得了很大成功。 * * * * viterbi算法是已知模型和观测序列，求最可能的状态序列。 * * FSVQ是一种有记忆的多码本的VQ技术。它不仅计算量小，而且适用于与上下文有关的语音识别。适合于特定人或非特定人、孤立词或连续语音识别。 LVQ(LearningVQ)即学习矢量量化，是由神经网络的并行分布来实现普通VQ的串行有哪些信誉好的足球投注网站，其运行速度远高于VQ。LVQ是通过有监督的学习来改进网络对输入矢量分类的正确率。 LVQ2是对LVQ的改进，因为LVQ在某些情况下对模式识别的分类效果不够稳定。LVQ2是带学习功能的矢量量化法，它在训练时采用适应性法，在满足一定条件的情况下，将错误的参考矢量移至离输入矢量更远些，而将正确的参考矢量移至离输入矢量更近些，以此来提高识别率。 13.2语音识别原理 * 专家知识库存储各种语言学知识；判决根据各种距离测度选择适当的门限值；检验结果识别率 13.2语音识别原理语音识别原理框图 * 更一般的语音识别系统 13.2语音识别原理 * 动态时间规整DTW 动态时间规整DTW(dynamic time warping)曾经是语音识别的一种主流方法。其思路是：由于语音信号是一种具有相当大随机性的信号，即使相同说话者对相同的词，每一次发音的结果都是不同的，也不可能具有完全相同的时间长度。因此在与已存储模型相匹配时，未知单词的时间轴要不均匀地扭曲或弯折，以使其特征与模板特征对正。用时间规整手段对正是一种非常有力的措施，对提高系统的识别精度非常有效。动态时间规整DTW是一个典型的优化问题，它用满足一定条件的的时间规整函数W(n)描述输入模板和参考模板的时间对应关系，求解两模板匹配时累计距离最小所对应的规整函数。 13.3动态时间规整 * DTW的基本思想：将时间规整与距离测度结合起来，采用动态规划技术，比较两个大小不同的模式，解决语音识别中语速多变的难题；一种非线性时间规整模式匹配算法； 13.3动态时间规整 * 动态时间规整语音识别模式匹配的问题：时间对准同一个人在不同时刻说同一句话、发同一个音，也不可能具有完全相同的时间长度；语音的持续时间随机改变，相对时长也随机改变；端点检测不准确；方法1：线性时间规整，均匀伸长或缩短依赖于端点检测(经常采用时域分析方法，进行检测的主要依据是能量、振幅和过零率。 )；仅扩展时间轴无法精确对准；方法2：动态时间规整 DTW－Dynamic Time Warping； 60年代Itakura提出来的； 13.3动态时间规整 * 动态时间规整法 j B i A j i O w (i) 模板输入 * 动态规划算法基本思想是将待求解问题分解成若干个子问题动态规划算法总体思想 n T(n/2) T(n/2) T(n/2) T(n/2) T(n) = 13.3动态时间规整 * 但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常只有多项式量级。求解时，有些子问题被重复计算了许多次。动态规划算法总体思想 n T(n) = n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) 13.3动态时间规整 * 如果能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，就可以避免大量重复计算，从而得到多项式时间算法。动态规划算法总体思想 n = n/2 T(n/4) T(n/4) T(n/4) T(n/4) n/2 n/2 T(n/4) T(n/4) n/2 T(n/4) T(n/4) T(n/4) T(n/4) T(n/4) T(n) 13.3动态时间规整 * 动态规划基本步骤找出最优解的性质，并刻划其结构特征。递归地定义最优值。以自底向上的方式计算出最优值。根据计算最优值时得到的信息，构造最优解。 13.3动态时间规整 * 动态时间规正法(DTW)的计算实例 ck=(ik, jk) (ik, jk-1) (ik-1, jk) min 2 1 7 5 1 5 1 6 4 7 2 4 5 2 4 3 3 4 8 2 2 1 5 1 19 20 23 26 17 22 16 22 16 18 15 19 12 11 15 16 7 9 17