第五章语音增强技术语音信号处理课件教学讲义.pptVIP

下载本文档

57
0
约3.48千字
约 64页
2018-05-22 发布于天津
举报
版权申诉

第五章语音增强技术语音信号处理课件教学讲义.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第五章语音增强技术语音信号处理课件教学讲义.ppt

第5章语音增强技术;§5.1 语音增强技术的概念和研究的意义;一、语音增强的定义语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。一句话，从含噪语音中提取尽可能纯净的原始语音。;二、语音增强的意义;（3）窃听技术中需要语音增强（4）语音识别技术需要语音增强在实际生活中，语音信号无时无地不受各种噪声干扰。人们正常的生活环境就是一个声级为50dB左右的噪声环境。被强噪声污染的场合，噪声达50dB以上。; 按产生原因和按噪声性质分类。（1）产生原因：产生于物理系统外部，并以声、光、电、机械等方式作用于物理系统，称为外部噪声；物理系统内部产生的噪声称为内部噪声，例如量子噪声等。;（2）按性质分为：脉冲噪声（爆炸、撞击和放电）和连续噪声；周期性周期（如交流电的干扰）和非周期性噪声；按统计特性分为：平稳噪声（如白噪声）和非平稳噪声（如色噪声）；按噪声和信号相关的性质分为加性噪声和乘性噪声。我们研究的噪声是声音的一种，它具有声波的一切特性，称之为声噪声。;3.噪声的度量 ;噪声源和噪声环境; 声压和声压级表征声音在物理上的强弱，它是对噪声的客观评价，不能表征人对声音的主观感觉。响应级和响度是人耳对噪声的主观评价的基本量之一。响度的单位为宋（Sone）响度级的单位为方（phon），在数值上等于1kHz纯音的声强级。噪声度量的另一个参数就是信噪比。 SNR=SNRout/SNRin;二、噪声的特性;§5.3 语音增强的原理和方法 ;; 1. 谱相减法（Spectral Subtraction）的基本原理描述 ;; 2. 谱相减法的数学推导首先假设语音和噪声信号是线性叠加的，且噪声是平稳的，噪声与语音信号不相关。 ; 对上式两边取数学期望有： E[ |X(w)|2 ]= E[ |S(w)|2 ] + E[ |D(w)|2 ] + E[ S(w) ? D*(w) ] + E[ S*(w) ? D (w) ] 由于噪声与语音信号不相关，且傅立叶变换不会改变信号之间的相关性，上式中，最后两项均为0。则上式简化为： E[ |X(w)|2 ]= E[ |S(w)|2 ] + E[ |D(w)|2 ]; 利用语音信号的短时平稳性，加之噪声信号的平稳性??由于傅立叶变换不会改变信号的统计特性，在一帧中，X(w) 、S(w)和D(w)都是平稳的。因此，在一帧内可用单个值来代替均值。 |X(w)|2 ＝|S(w)|2 + |D(w)|2 利用有声/无声判决的纯噪声信号d(n)与d(n)不完全一致，因此： |S(w)| 2 ＝|X(w)|2 －|D(w)|2 ＝|S(w)|2 + |D(w)|2 －|D(w)|2 s(n) =IDFT[ |S(w)| ejarg(X(jw)) ]; 3. 谱相减法的特点;(2) 需要无声和有声判决，在信噪比大的情况下，使用短时平均能量等参数可达到效果。 (3)由于该方法存在的前提条件要求噪声平稳，因此当噪声特性变化时，消噪效果可能会变差，这时需要重新拾取噪声特性。 ; (4)由于噪声的随机分布的范围广，因此相减时，若该帧某频率点上的噪声谱幅度分量大时，就会有很大一部分残留，在频谱上呈现随机起伏的尖峰。在听觉上形成有节奏的类似音乐的残留噪声，又称为背景音乐噪声。背景音乐噪声损伤了语音的质量，降低了可懂度和清晰度，是该类方法最大的缺点。;蓝色为原始含噪语音黄色为谱相减处理的结果;二、时域语音增强技术; 主话筒和参考话筒获得的信号是语音和噪声在话筒处迭加后的混合信号。; 主信号s+n0，为有用信号s（来自信号源）和一个与它不相关的噪声信号的混合而成。 n1为另外拾取的噪声参考信号，与n0相关。; 将参考信号n1通过自适应滤波器后，得到信号n’(n)，此信号与n0(n)基本一致。 x(n)-n’(n)=s(n)+n0(n)-n’(n)=s(n)+e(n)=s’(n) s’(n)中仍然包含部分噪声(e(n))，要使这部分噪声小，达到完全消除噪声的目的(e(n)=0)，则n’(n) 尽可能与n0(n)一致。;滤波器为FIR滤波器，其直接结构为：; 如何更新滤波器的系数，采用e(n)的均方误差最小的准则，形成LMS（Least mean Square）算法。为了便于讲解，将第n个时刻的所有滤波

您可能关注的文档

文档评论（0）

yuzongxu123 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第五章语音增强技术语音信号处理课件教学讲义.pptVIP