- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.基于模式匹配方式的语音识别技术
语音识别基础 上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel:第四章 基于模式匹配方式的 语音识别技术 4.1 语音短点检测* 4.2 失真侧度* 4.3 动态时间规正法* (DTW:Dynamic Time Warping) 4.4 基于DTW技术的语音识别方案* 4.1 语音端点检测 4.1.1 语音端点检测的困难性 - 语音端点检测:从包含语音的一段信 号中确定出该语音的起始点及终止点。 - 由于背景噪声或人为呼吸等原因产生 的杂音,使得语音的端点比较模糊。 4.1.2 采用能量及过零数参数的检测法* 4.2 失真侧度 4.3 动态时间规正法(DTW) 4.4 基于DTW技术的语音识别方案 采用能量及过零数参数的检测法 几种典型的失真侧度 不同音长的匹配距离(D3D2D1) 动态时间规正法(DTW)的原理 动态时间规正法(DTW)的具体解法 动态时间规正法(DTW)的计算实例 * * 第四章 基于模式匹配方式的 语音识别技术 设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b 、 c之间的距离分别为 d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、 d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0 时, 1)试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R); 2)根据1)的结果,试用线条画出与之间的对应关系。 提交时间: 第四章 回家作业 4.2.1 距离侧度与失真侧度 - 数学上的距离 (1)正值性 d(x,y)≥0;当x=y时,有d(x,y)=0; (2)对称性 d(x,y)= d(y,x); (3)三角形不等式性 d(x,y)= d(x,z)+ d(z,y)。 - 失真侧度 (1)正值性 D(x,y)≥0;当x=y时,有D(x,y)=0; (2)在频域中应具有物理意义。 (3)在实际工程中能有效地计算。 4.2.2 几种典型的失真侧独* 4.3.1 语音模式匹配的问题点 - 匹配时音长不一致问题 - 线性匹配与非线性匹配* 4.3.2 DTW的原理* 4.3.3 DTW的具体解法* 词 汇 表:W(n), n=1,2,…,N 参考模式:R(k), k=1,2,…,N 待识模式:T - 利用DTW算法,计算所有Dk(T,R(k))。 - 对所有Dk(T,R(k))求其最小值,该最小失真度所对应的下标 n 就为识别结果。 n=argmin{Dk} k 时间 ETL ETU ZT N1 N2 NB NE 过 零 数 Zj 能量 Ej N’1 N1-25 时间 (1)欧氏距离 D (x,y)={∑|x – y |r}/N, (0≤1≤N-1) -均方误差 -绝对值平均误差 (2)对数频谱距离 V(w)=log(f(ω))-log(g(ω)) D (g,f)={∫|V(w)|r dw}/2π (3)倒谱距离 D (x,y)=∑(c – c )2, (1≤n≤p) r i i cep r -π π (f) (g) n n 待测模式T 参考模式R t t t t t 直接匹配D1(T,R) 线性匹配D2(T,R) 非线性匹配D3(T,R) Ck=(ik, jk) C1=(1, 1) CK=(I, J) j = i - r j = i + r 时间伸缩函数 F 匹配窗 i j t1 t2 t3 ti tI T R r1 r2 rj rJ (1)时间伸缩函数 F F ={c1,c2,…,cK} ck=(ik,jk) (2)F 的累加距离 D(F) D(F)= ∑{d(ck)wk} k ∑wk k d(ck)=d(ik,jk) (3)最佳匹配失真侧度D(T,R) D(T,R)=min{D(F)} F ck=(ik, jk) (ik, jk-1) (ik-1, jk) r4 r3 r2 r1 t1 t2 t3 t4 t5 min g(i-1, j)+ d(i, j) g(i-1, j-1)+2d
您可能关注的文档
- 2013-2014学年高中物理鲁科版选修3-16-1探究磁场对电流的作用.ppt
- 2013-2014学年高二语文同步课件诗歌1-1长恨歌(新人教版选修《中国古代诗歌散文欣赏》).ppt
- 2011版语文全程学习方略课件(必修1)谈读书(山东人民版)(共48张).ppt
- 2013届高三物理一轮复习课件欧姆定律电阻定律电功和电功率焦耳定律(鲁科版).ppt
- 2013届高考复习物理分子动理论.ppt
- 2013届高三英语一轮复习课件Module2MyNewTeachers(外研版必修1.ppt
- 2013-2014学年高中语文苏教版选修《史记》选读10管仲列传.ppt
- 2013届高三历史一轮复习方案(人民版)君主专制的演进与强化和专制时代晚期的政治形态.ppt
- 2011必威体育精装版版初中全程复习方略课件中华文化与民族精神(人教实验版)(共89张).ppt
- 2013-2014学年高中语文粤教版选修《唐诗宋词元散曲选读》3-16辛弃疾词三首.ppt
- 地图在初中地理教学中的个性化教学研究教学研究课题报告.docx
- 小学科学教育探索:校园植物四季变化观察与生态教育创新教学研究课题报告.docx
- 数字化教育环境中数字公民素养评价模式探究教学研究课题报告.docx
- 基于生成式AI的高中生物课堂学习共同体构建策略教学研究课题报告.docx
- 《血液透析患者动静脉内瘘并发症的护理干预对生活质量的影响分析》教学研究课题报告.docx
- 基于国家智慧教育云平台的初中生物实验资源整合与共享策略分析教学研究课题报告.docx
- 《软件项目开发过程中风险管理与企业风险管理教育》教学研究课题报告.docx
- 小学数学思维训练多媒体素材的智能编辑与合成策略研究教学研究课题报告.docx
- 高中物理实验:校园雨水收集系统对建筑能耗的影响分析教学研究课题报告.docx
- 《虚拟现实在教育学教育中的应用:用户体验优化与教育理念创新研究》教学研究课题报告.docx
最近下载
- 项目一 任务三 旅游的本质属性(教案)-《旅游概论》 (高教社第二版)同步精品课堂.docx VIP
- 仓库管理员培训(完整版).ppt VIP
- 特斯拉供应商手册.pdf
- 青光眼-精品课件.ppt VIP
- 基础承台土开挖方案(最终).doc VIP
- 2025年云南省能源投资集团有限公司人员招聘笔试备考题库.docx VIP
- 医疗器械监督管理条例.ppt VIP
- 广东省实验中学白云校区2020-2021学年七年级上学期10份月考语文试卷(有答案).docx
- 2025年云南省能源投资集团有限公司招聘笔试备考题库及答案解析.docx VIP
- 项目一 任务一、二 旅游的产生、定义和内容(教案)-《旅游概论》 (高教社第二版)同步精品课堂.docx VIP
文档评论(0)