- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
连续语音识别系统
连续语音识别系统
洪青阳 副教授
厦门大学信息科学与技术学院
qyhong@xmu.edu.cn
语音识别分类
◦ LVCSR
声学模型
识别网络
语言模型
解码算法
◦ Viterbi Beam有哪些信誉好的足球投注网站算法
◦ Token Passing算法
◦ WFST
按词汇量大小分类:
◦ 小词汇量语音识别系统:几十个词
◦ 中等词汇量语音识别系统:几百个到上千个词
◦ 大词汇量语音识别系统:几千到几万个词
按说话的方式分类:
◦ 孤立词语音识别系统
◦ 连接词语音识别系统
◦ 连续语音识别系统
LVCSR: 大词汇量连续语音识别系统
词条A3
词条A2
词条A1
BEGIN END
词条B1 词条B1
句子模型 句法层
词条模型 音素a 音素b 音素c 构词层
音素模型 语音层
声学层
语音特征
声学模型 语言模型 发音词典
系统模块
有哪些信誉好的足球投注网站空间 解码算法
(1) 基本声学单元的选择
以词为基本单元建立模型不合理,造成大量不必
要的冗余存储和计算。因此一般采用比词小的子
词识别基元,如音节、半音节、音素等。
一般来说,声学单元越小,其数量也就越少,训
练模型的工作量也就越小;
但单元越小,对上下文的敏感性越大,越容易受
到前后相邻的影响而产生变异,因此其类型设计
和训练样本的采集更困难。
建模基元 模型数目 可训练性 稳定性 应用情况
音节 约400个 一般 好 较普遍
声韵母 约60个 较好 较好 很普遍
音素 约40个 好 一般 较少
内容
内容
发音过程的抽象描述:
S1 S2 S3 S4 S5
S 模拟发音基元的起始;S 、S 、S 模拟发音基元的发声过程;
1 2 3 4
S 模拟发音基元的结束。
5
状态起始于S ,结束于S ,且只能向自身或向右转移。
1 5
HMM的输出是与转移弧相联系的,允许不产生输出的转移,即从一个
状态转移到另一个状态时,无观察符号输出。这样的转移称为空转移。
发音基元可以是句子、短语、音节或声韵母,根据实际需求而定。
在连续语音识别中,字词或语句的HMM都是由子词单元的HMM连接形成的
。一般在连接时,一个子词单元HMM的终止状态和相邻基元HMM的初始状态相
连接,这种连接产生的转移弧就是空转移,如下图所示:
子
文档评论(0)