7第七章语音信号识别.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7第七章语音信号识别

A B j i j i 时间规整函数 j=w(i) 为了使T(测试)的第i个样本与R(参考)的第j个样本对正,其对应的点不在直线对角线上,得到一条弯曲的曲线j=w(i) 。j=w(i)称为规整函数。 时间规整的依据 设 T={a1 , a2 , …… , ai , …… , aI} i=1~I R={b1 , b2 , …… , bj , …… , bJ} j=1~J I≠J 时间规整要解决的问题是使元素a和元素b之间匹配,使每对匹配样本之间的差别最小,达到欧氏距离最小。 时间规整就是按照两模式之间的所有矢量帧间的距离D最小(代价函数最小)的原则,不断计算两模式间的距离,以寻找最优的路径,一般应使规整函数w(i)满足下列条件:规整函数w(i)在A和B的端点必须匹配,有: 起点:i(k)=j(k)=1 终点:i(k)=I j(k)=J 为了防止漫无目的从(1,1)有哪些信誉好的足球投注网站到(I,J),因此对两点之间路径的斜率予以规定,最大为2,最小为1/2。 时间规整过程 i j J I 1 1 (1,1) (I,J) j-J=(i-I)/2 j-J=2(i-I) j=i/2 j=2i 全局最优 动态时间规正法(DTW)的具体解法--行进方向 ck=(i,j) (i,j-1) (i-1,j-1) (i-1,j) (i-2,j-1) (i-1,j-2) i j 2 2 2 1 1 2 1 2 2 1 行进方向的另一种解释 d(T(i),R(j)) d(T(i),R(j-1)) g(i-1,j-2) i j 2 1 g(i,j) g(i-1,j-1) i j 2 d(T(i),R(j)) g(i,j) d(T(i),R(j)) d(T(i-1),R(j)) g(i-2,j-1) i j 2 1 g(i,j) 由规定的行进方向可知在任意一点(i,j),其g(T(i),R(j))=g(i,j)(代价函数值)可由它前面的点g(i-1,j-2)或g(i-1,j-1)或g(i-2,j-1)按下式计算: 最佳匹配失真测度/距离 D(T,R)= g(I,J)/(I+J) 每一个点的总代价函数是前一点总代价函数和到达该点的代价函数之和的最小值。 总代价函数 时间规整,它把1个k个阶段的决策,化为单个k个阶段的决策过程,这种决策过程称为动态规划计划。 动态时间规正法(DTW)的计算实例1 设待识语音模式为T=acc, 参考模式为R=cbac, 若a、b 、 c之间的距离分别为 d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、 d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=d(c,c)=0 试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R)。 2 T a c c a c b c R 3 1 i j 1 2 3 4 (c,c) (a,c) g(3,4) g(1,1)=d(a,c)=3 标号 标号 2 T a c c a c c b R 3 1 i j 1 2 3 4 (c,c) (a,c) g(2,2) g(2,3) g(1,3) g(3,4) 2 2 2 2 T a c c a c c b R 3 1 i j 1 2 3 4 (c,c) (a,c) g(1,3) 2 T a c c a c c b R 3 1 i j 1 2 3 4 (c,c) (a,c) g(2,2) 2 T a c c a c c b R 3 1 i j 1 2 3 4 (c,c) (a,c) g(2,3) √ R g(1,2) * * * * * * * 第七章 语音识别 7.1 语音识别技术的一般概念 7.2 语音识别原理和识别系统的组成 7.3 动态时间规整 7.4 说话人识别 一、语音识别的定义 语音识别是指从语音到文本的转换,即让计算机能够把人发出的有意义的话音变成书面语言。通俗地说就是让机器能够听懂人说的话。 所谓听懂,有两层意思,一是指把用户所说的话逐词逐句转换成文本;二是指正确理解语音中所包含的要求,作出正确的应答。 第七章 语音识别 7.1语音识别技术的一般概念 二、语音识别的应用 语音识别技术是以语音为研究对象,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域。 随着语音识别技术的逐渐成熟,语音识别技术开始得到广泛的应用,涉及日常生活的各个方面如电信、金融、新闻、公共事业等各个行业,通过采用语音识别技术,可以极大的简化这些领域的业务流程以及操作;提高系统的应用效率。 7.1语音识别技术的一般概念 1.

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档