- 1、本文档共857页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
语音信号处理;;课程性质;;课程重点;课程难点;
;;语音信息的交换大致上可以分为三大类:;第1章绪论;;车载语音控制;1.1语音信号处理的发展;1.1.1语音合成;1.1.1语音合成;1.1.2语音编码;;;语音识别研究领域包括:
;第1章绪论;1.2语音信号处理的应用;1.语音识别技术的应用
;声控智能玩具;2.语音合成的应用;2.语音合成的应用;录音笔(语音存储);二、语音信号处理的新方向
(1)基于语音的信息检索
(2)基于语音识别的广播新闻的自动文摘技术的研究
;二、语音信号处理的新方向
(3)VoIP技术
(4)语音训练与校正技术
;二、语音信号处理的新方向
(5)语种识别。
(6)基于语音的情感处理研究。;第1章绪论;图1.1信号处理和加工的一般示意图;语
音
“
我
到
北
京
去
”;;2.基础理论、算法研究及实现;2.基础理论、算法研究及实现;(3)硬件系统:主要体现在内存容量和计算速度上
运算速度:10~20MIPS(MillionInstructionsPerSecond),有的可达50MIPS或100MIPS
内存容量:对语音识别要求的存贮量达到若干MB
实时语音语音处理系统的两种实现方式:
A.?主从式:主机内插上一块或多块DSP处理板
B.??脱机工作方式:通用DSP芯片及辅助芯片构成
生产DSP的几大公司:TI、AD、ATT等。;第1章绪论;1.4MATLAB在数字语音信号处理中的应用;MATLAB在数字语音信号中的几方面应用:;1.4MATLAB在数字语音
信号处理中的应用;1.4MATLAB在数字语音
信号处理中的应用;1.4MATLAB在数字语音
信号处理中的应用;总结;第二章语音信号的数字模型;
;2.1语音的发声机理
;本章重点介绍语音信号产生的数字模型,对语音信号的特性和听觉特性做一般介绍。
;;2.功能;“十二五”普通高等教育本科国家级规划教材;“十二五”普通高等教育本科国家级规划教材;口腔包括:上下唇、上下齿、上下齿龈、上下腭、舌和小舌等部分。
上腭又分为:硬腭和软腭两部分;
舌又分为:舌尖、舌面和舌根三部分。;图2.3声道纵剖面图;右图为语音生成其机理模型。空气由肺部排入喉部,经过声带进入声??,最后由嘴辐射出声波,这就形成了语音。在声门(声带)以左,称为“声门子系统”,它负责产生激励振动;右边是“声道系统”和“辐射系统”。;;2.1.2语音生成;基音频率是由声带张开闭合的周期所决定的:
;“十二五”普通高等教育本科国家级规划教材;2、清音;共振峰频率或共振峰;2.2语音的听觉机理;2.2.1听觉器官
人的听觉器官包括:外耳、中耳和内耳;1.外耳
外耳由耳廓(耳翼)、外耳道和耳鼓(鼓膜)组成。
2.中耳
组成:包括三块听小骨:锤骨,砧骨和镫骨。
作用:阻抗匹配和限幅
外耳和中耳的综合作用相当于一个介于500Hz到6kHz之间的平滑的带通滤波器,可以用有限冲激响应(FIR---FiniteImpulseResponse)滤波器来模拟。
;3.内耳
内耳是一个充满液体的骨质结构,由前庭、圆形窗、卵形窗及耳蜗组成。;人耳听觉界限的频率范围大约为20Hz-20kHz。;掩蔽效应;;2.2.4耳蜗的信号处理机制
;;图2.7基底膜上六个不同点的频率响应;2.2.5语音信号听觉模型;“十二五”普通高等教育本科国家级规划教材;“十二五”普通高等教育本科国家级规划教材;2.3语音信号的
线性模型;有三部分作用施加在语音的声波上:
;2.3.1激励模型;;单个斜三角波的频谱G(ejω)表现出一个低通滤波器的特性。其z变换的全极点形式为:;浊音激励模型可表示为
清音可以模拟成随机白噪声。;典型的声道模型有两种:无损声管模型和共振峰模型。无损声管模型比较复杂,故本节只介绍共振峰模型。
共振峰模型:
当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,一般把它叫作共振峰。;;实践表明,用前三个共振峰代表一个元音足够了。多个Vi叠加可以得到声道的共振峰模型:
;图2
文档评论(0)