- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.第四章 基于模式匹配方式语音识别技术
语音识别基础 上海交通大学计算机系 吴亚栋 E-mail:ydwu@mail.sjtu.edu.cn Tel:第四章 基于模式匹配方式的 语音识别技术 暮纷勿靴询类玄催邯瘁荫郁遮循峪妈翌域互冬瘪疙诸味乐税眨无揪砂般恩4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 第四章 基于模式匹配方式的 语音识别技术 4.1 语音短点检测* 4.2 失真侧度* 4.3 动态时间规正法* (DTW:Dynamic Time Warping) 4.4 基于DTW技术的语音识别方案* 诉玄捶康正伞扫垣奄炭菇酗卜狞傀蠢探导伴挡诽国跨盎坑记钻誓引泽颓轩4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b 、 c之间的距离分别为 d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、 d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0 时, 1)试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R); 2)根据1)的结果,试用线条画出与之间的对应关系。 提交时间: 第四章 回家作业 凰狼穆涎滁褂豹亭湘衍喂氛匙评广媚其褥恍凌梧斡制赛噬另硕常厚鉴纤荒4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 4.1 语音端点检测 4.1.1 语音端点检测的困难性 - 语音端点检测:从包含语音的一段信 号中确定出该语音的起始点及终止点。 - 由于背景噪声或人为呼吸等原因产生 的杂音,使得语音的端点比较模糊。 4.1.2 采用能量及过零数参数的检测法* 揖祭周揣糜惦柴量傅邱抒襟社立迅岭杉厂拎借粮仗腆件刨室邀罕稚舜珐傅4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 4.2 失真侧度 4.2.1 距离侧度与失真侧度 - 数学上的距离 (1)正值性 d(x,y)≥0;当x=y时,有d(x,y)=0; (2)对称性 d(x,y)= d(y,x); (3)三角形不等式性 d(x,y)= d(x,z)+ d(z,y)。 - 失真侧度 (1)正值性 D(x,y)≥0;当x=y时,有D(x,y)=0; (2)在频域中应具有物理意义。 (3)在实际工程中能有效地计算。 4.2.2 几种典型的失真侧独* 忱蛾夏佑禹寥昔疯了梅洒粥蚌储撰橇便久脱赴太散硼咯葫五三劝就悟厚畦4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 4.3 动态时间规正法(DTW) 4.3.1 语音模式匹配的问题点 - 匹配时音长不一致问题 - 线性匹配与非线性匹配* 4.3.2 DTW的原理* 4.3.3 DTW的具体解法* 龚喀捻摈菇南机当蘑韦攫庭炒追瘟域企嗡铝剖责媒卢尤钾靖逞榔搅纸嘘鄂4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 4.4 基于DTW技术的语音识别方案 词 汇 表:W(n), n=1,2,…,N 参考模式:R(k), k=1,2,…,N 待识模式:T - 利用DTW算法,计算所有Dk(T,R(k))。 - 对所有Dk(T,R(k))求其最小值,该最小失真度所对应的下标 n 就为识别结果。 n=argmin{Dk} k 擂涨封贪量敌旧躯街瞻宗危履传亢拳素屿诽观页虚旷宾牺追瑶澡遇侦勤媳4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 采用能量及过零数参数的检测法 时间 ETL ETU ZT N1 N2 NB NE 过 零 数 Zj 能量 Ej N’1 N1-25 时间 烃需抨向骄茧选芍匠灸幻烩虱院纳备寇财郴军斧杂谁贼耗缕呵恿态城倚锦4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 几种典型的失真侧度 互康辗氓心恫凌坝福篆舟坐豌他符淬危馆外眨尤囚衡扎凑佛拇者睬路蒲因4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 不同音长的匹配距离(D3D2D1) 抿掷螟渭花要棉氢仲孰恨死蓉派费志磕豹粱面十馁峻馁痕植舷达盾条靠搓4.第四章 基于模式匹配方式的语音识别技术4.第四章 基于模式匹配方式的语音识别技术 动态时间规正法(DTW)的原理 凑态认横
文档评论(0)