- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理第三章
第三章 语音信号分析 语音信号分析? 语音信号分析的目标是从语音信号中提取出一个或多个能够描述语音信号的参数,以便在语音编码、语音合成和语音识别等应用。 语音信号分析的目的就是在于方便有效地提取并表示语音信号所携带的信息,是语音信号处理的前提和基础,只有分析出可表示语音信号特征的参数,才有可能利用这些参数进行高效的语音通信,语音合成和语音识别等处理。 一般而言,语音处理的目的有两种: 对语音信号进行分析,提取特征参数。如:语音编码中需要判断语音的清浊音特性并提取浊音的基音周期;语音识别中需要提取符合人耳听觉特性的Mel倒谱参数等。 加工语音信号。如:语音增强中对含噪语音进行背景噪声抑制,以获得相对干净的语音;在语音合成中需要对分段语音进行拼接平滑,获得主观音质较好的合成语音。 根据所分析出的参数性质的不同可以分为:时域分析、频域分析、倒谱域分析、线性预测分析等; 根据分析方法的不同:模型分析方法和非模型分析方法。 不论分析怎么样的参数以及采用什么分析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化,语音信号的端点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。 语音信号的数字化和预处理? 语音信号的数字化(数字系统具有高速、低成本、低功耗、通用的特点)一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码): 语音信号的数字化过程框图 预处理一般包括预加重、加窗和分帧等。 在分析处理之前必须把要分析的语音信号部分从输入信号中找出来,这项工作叫做语音信号的端点检测。 预滤波的目的有两个: 抑制输入信号各频域分量中频率超过的所有分量()为采样频率,以防止混叠干扰(高频成分产生失真)。 抑制50Hz的电源工频干扰。(市电电压的频率为50Hz,它会以电磁波的辐射形式,对人们的日常生活造成干扰,这种干扰称为工频干扰) 这样,预滤波器必须是一个带通滤波器,设其上、下截止频率分别是和,则对绝大多数语音译码器:,,采样频率,要求较高的场合:,,采样频率。 语音信号经过预滤波和采样后,由A/D转换器变换为二进制数字码。 A/D变换中要对信号进行量化,量化不可避免地会产生误差。量化后的信号值与原信号值之间的差值称为量化误差,又称为量化噪声。(所谓量化,就是把经过抽样得到的瞬时值将其幅度离散,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。均匀量化:输入动态范围被均匀划分为份;非均匀量化:动态范围划分不均匀,一般用类似指数的曲线进行量化。量化级:将标称幅度划分为若干份,称为量化级,一般为2的整数次幂。把落入同一级的样本值归为一类,并给定一个量化值。量化级数越多,量化误差越小,质量就越好。) 若信号波形的变化足够大,或量化间隔足够小,可以证明量化噪声符合具有下列特征的统计模型: 它是平稳的白噪声过程; 量化噪声与输入信号不相关; 量化噪声在量化间隔内均匀分布,即具有等概率密度分布。 若用表示输入语音信号的方差,表示信号的峰值,表示量化字长,表示噪声序列的方差,可以证明量化信噪比SNR(信号与噪声的功率比)为: 其中,。() 推导过程: 假设语音信号的幅度符合Laplacian分布(拉普拉斯分布,容易让人联想到正态分布,但正态分布是用相对于平均值的差的平方来表示,而拉普拉斯分布则用相对于平均值的差的绝对值来表示。因此,拉普拉斯分布的尾部比正态分布更加平坦。),此时信号幅度超过的概率较小,只有0.35%,因而可取,则 上式表明量化器中的每bit字长对SNR的贡献率为6dB。当,,此时量化后的语音质量能满足一般通信系统的要求。然而研究表明,语音信号的动态范围达到,故应取以上。为了在语音信号变化的范围内保持的信噪比,常用来量化,其中附加的用于补偿左右的输入动态范围的变化。 A/D转换器分为线性和非线性两类。目前线性A/D转换器绝大多是是12位,非线性则是8位的,它与12位线性等效。 预处理 已数字化的语音信号序列将依次存入一个数据区,在语音信号处理中一般用循环队列的方式来存储这些数据,以便用一个有限容量的数据区来应付数量极大的语音数据,已处理完提取出了语音特征参数的一个时间段的语音数据可以依次抛弃,让出存储空间来存储新数据。 由于语音信号的平均功率谱受声门激励和口鼻辐射影响,高频端大约在800Hz以上按6dB/倍频程(倍频程:若使每一频带的上限频率比下限频率高一倍,即频率之比为2,这样划分的每一频程称为1倍频程)跌落,所以求语音信号的频谱时,频率越高相应的成分越小,高频部分的频谱比低频部分难求,要在预处理中进行预加重处理。 预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便
您可能关注的文档
最近下载
- CNAS-CC02_2013《产品、过程和服务认证机构要求》(2019-2-20第二次修订清稿).pdf VIP
- JJF1376-2012箱式电阻炉校准规范.pdf VIP
- 人教版六年级上册数学第三单元《解决实际问题例5》名师教学设计.doc VIP
- SCR脱硝催化剂体积及反应器尺寸计算表.xlsx VIP
- 房地产市场的数字化转型.pptx VIP
- 妇联换届宣讲培训.pptx VIP
- 穴位埋线疗法治疗失眠的临床观察及效果评价.pptx VIP
- iSecure Center综合安防管理平台 安装部署手册 V1.7.0(1).pdf VIP
- 中级经济师《经济基础》思维导图新版、曲线汇总.pdf VIP
- 动火作业专项培训.pptx
文档评论(0)