- 1、本文档共50页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别输入系统设计.
目 录
目 录 1
第一章 语音识别简介 3
1.1 语音识别的研究历史及现状 3
1.2 语音识别系统的分类 4
1.3 语音识别系统的基本原理 4
1.4 语音识别的基本构成 5
1.5 语音识别的几种基本方法 5
1.5.3 改进的HMM-DDBHMM 6
1.5.4 人工神经元网络(ANN) 7
1.6 语音识别技术面临的技术难点及对策 7
第二章 语音信号的预处理 8
2.1 概述 8
2.2 分帧 10
2.3 预加重 11
2.4 加窗 12
2.4.1 窗函数的定义 12
2.4.2 窗函数的三种主要类型 12
2.4.3 窗函数的选择 13
第三章 端点检测 14
3.1 端点检测概述 14
3.2 短时能量 15
3.3 短时过零率 15
3.4 双门限端点检测 16
3.5 程序实现 17
3.5.1 计算短时过零率 17
3.5.2 计算短时能量 17
3.5.3 端点的截取 18
第四章 语音识别参数提取 22
4.1 LPC和LPCC系数 22
4.1.1 lpc及lpcc系数的简介 22
4.1.2 lpc系数的基本计算原理 23
4.2 MFCC系数 24
第五章 DTW算法实现 27
5.1 模式的匹配 27
5.2 DTW算法原理 28
5.3 DTW算法改进 30
5.3.1有哪些信誉好的足球投注网站宽度限制 30
5.3.2放宽端点限制 30
第六章 matlab编程结果 32
6.1 实验程序文件 32
6.2 语音识别仿真结果 32
结 论 34
致 谢 35
参考文献 36
附 录 37
1.DTW程序 37
2.DTWTEST程序 40
3.MFCC程序 41
4.TRAIN程序 43
5.VAD程序 44
6.ENFRAME函数程序 49
引言
语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。其研究目标是让计算机听懂人类口述的语言这是人类自计算机诞生以来梦寐以求的想法。随着计算机软硬件和信息技术的飞速发展,这种想法更加明显,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。
语音识别起源于20世纪50年代AT&T贝尔实验室的Audry 系统, 它第一次实现了10 个英文数字的语音识别,这是语音识别研究工作的开端。60 年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划和线性预测分析技术(LP),其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响。70 年代,语音识别领域取得了突破。LP 技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论, 并实现了基于线性预测倒谱和DTW 技术的特定人孤立语音识别系统。80 年代,实验室语音识别研究产生了巨大突破,一方面各种连接词语音识别算法被开发,例如多级动态规划语音识别算法;另一方面语音识别算法从模板匹配技术转向基于统计模型技术,研究从微观转向宏观,从统计的角度来建立最佳的语音识别系统。进入90 年代以后, 人工神经网络技术的应用成为语音识别的一条新途径, 它具有自适应性、并行性、非线性、鲁棒性、容错性和学习特性,在结构和算法上都显示出了很大的潜力,而且还在细化模型的设计、参数提取和优化,以及系统的自适应技术上取得了关键进展。语音识别技术进一步成熟,语音识别系统从实验室走向实用。
语音识别技术是非常重要的人机交互技术,应用语音的自动理解和翻译,可消除人类相互交往的语言障碍。国外已有多种基于语音识别产品如声控拨号电话、语音记事本等已经应用,基于特定任务和环境的听写机也已经进入应用阶段,这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大的便利。
第一章 语音识别简介
1.1 语音识别的研究历史及现状
语音识别的研究工作始于20世纪50年代,1952年Bell实验室开发的Audry系统是第一个可以识别10个英文数字的语音识别系统。1959 年,Rorgie和Forge采用数字计算机识别英文元音和孤立词,从此开始了计算机语音识别。60年代,苏联的Matin等提出了语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk提出了动态编程,这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决了语音信号的特征提取和不等长语音匹配问题同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
80年
您可能关注的文档
- 计算机软件论文基于GTS901A的测量机器人变形监测自动化软件的开发..doc
- 解析几何中数形结合思想方法的挖掘与呈现探究..doc
- 计算机网络实习报告..doc
- 计量经济学软件应用实验报告..doc
- 计算题机械设计基础..doc
- 让五官年轻10岁的方法..doc
- 让Oracle跑得更快Oracle 10g性能分析与优化思路..doc
- 计量课程论文-恩格尔系数影响因素研究..doc
- 计算机辅助设计(减速器三维造型)..doc
- 论中国人口老龄化现状与相应社会经济改进措施..doc
- 课堂100条教学方法改革思路..doc
- 课堂教学即时评价..doc
- 说服心理学如何影响他人按你的方式思考(完整版)..doc
- 课时跟踪检测(七) 全球气候变化和气候类型的判读(人教版)..doc
- 课时跟踪检测(三十二) 流域的综合开发以美国田纳西河流域为例(人教版)..doc
- 课时跟踪检测(三十四) 区域工业化与城市化以我国珠江三角洲地区为例(人教版)..doc
- 课时跟踪检测(二十一) 工业的区位选择(人教版)..doc
- 课时跟踪检测(二十二)_化学平衡常数与化学平衡的计算..doc
- 课时跟踪检测(二十九) 荒漠化的防治以我国西北地区为例(人教版)..doc
- 课时跟踪检测(二十八) 地理信息技术在区域地理环境研究中的应用(人教版)..doc
文档评论(0)