4.基于模式匹配方式的语音识别技术.pptVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.基于模式匹配方式的语音识别技术

语音识别基础 上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel:第四章 基于模式匹配方式的 语音识别技术 4.1 语音短点检测* 4.2 失真侧度* 4.3 动态时间规正法* (DTW:Dynamic Time Warping) 4.4 基于DTW技术的语音识别方案* 4.1 语音端点检测 4.1.1 语音端点检测的困难性 - 语音端点检测:从包含语音的一段信 号中确定出该语音的起始点及终止点。 - 由于背景噪声或人为呼吸等原因产生 的杂音,使得语音的端点比较模糊。 4.1.2 采用能量及过零数参数的检测法* 4.2 失真侧度 4.3 动态时间规正法(DTW) 4.4 基于DTW技术的语音识别方案 采用能量及过零数参数的检测法 几种典型的失真侧度 不同音长的匹配距离(D3D2D1) 动态时间规正法(DTW)的原理 动态时间规正法(DTW)的具体解法 动态时间规正法(DTW)的计算实例 * * 第四章 基于模式匹配方式的 语音识别技术 设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b 、 c之间的距离分别为 d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、 d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0 时, 1)试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R); 2)根据1)的结果,试用线条画出与之间的对应关系。 提交时间: 第四章 回家作业 4.2.1 距离侧度与失真侧度 - 数学上的距离 (1)正值性 d(x,y)≥0;当x=y时,有d(x,y)=0; (2)对称性 d(x,y)= d(y,x); (3)三角形不等式性 d(x,y)= d(x,z)+ d(z,y)。 - 失真侧度 (1)正值性 D(x,y)≥0;当x=y时,有D(x,y)=0; (2)在频域中应具有物理意义。 (3)在实际工程中能有效地计算。 4.2.2 几种典型的失真侧独* 4.3.1 语音模式匹配的问题点 - 匹配时音长不一致问题 - 线性匹配与非线性匹配* 4.3.2 DTW的原理* 4.3.3 DTW的具体解法* 词 汇 表:W(n), n=1,2,…,N 参考模式:R(k), k=1,2,…,N 待识模式:T - 利用DTW算法,计算所有Dk(T,R(k))。 - 对所有Dk(T,R(k))求其最小值,该最小失真度所对应的下标 n 就为识别结果。 n=argmin{Dk} k 时间 ETL ETU ZT N1 N2 NB NE 过 零 数 Zj 能量 Ej N’1 N1-25 时间 (1)欧氏距离 D (x,y)={∑|x – y |r}/N, (0≤1≤N-1) -均方误差 -绝对值平均误差 (2)对数频谱距离 V(w)=log(f(ω))-log(g(ω)) D (g,f)={∫|V(w)|r dw}/2π (3)倒谱距离 D (x,y)=∑(c – c )2, (1≤n≤p) r i i cep r -π π (f) (g) n n 待测模式T 参考模式R t t t t t 直接匹配D1(T,R) 线性匹配D2(T,R) 非线性匹配D3(T,R) Ck=(ik, jk) C1=(1, 1) CK=(I, J) j = i - r j = i + r 时间伸缩函数 F 匹配窗 i j t1 t2 t3 ti tI T R r1 r2 rj rJ (1)时间伸缩函数 F F ={c1,c2,…,cK} ck=(ik,jk) (2)F 的累加距离 D(F) D(F)= ∑{d(ck)wk} k ∑wk k d(ck)=d(ik,jk) (3)最佳匹配失真侧度D(T,R) D(T,R)=min{D(F)} F ck=(ik, jk) (ik, jk-1) (ik-1, jk) r4 r3 r2 r1 t1 t2 t3 t4 t5 min g(i-1, j)+ d(i, j) g(i-1, j-1)+2d

您可能关注的文档

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档