- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.1 语音编解码技术;3.1 语音编解码技术;国际上语音编码技术的两个主要研究方向:
降低语音编码速率
提高语音质量
语音编码技术是将语音波形通过采样、量化,然后利用二进制码表示出来,即是将模拟信号转变为数字信号,然后在信道中传输;语音解码技术是上述过程的逆过程。语音编解码技术要尽可能地使语音信号的原始波形在接收方无失真地恢复,主要分为:
波形编码
参数编码
混合编码;1.波形编码
波形编码技术基于时域模拟话音的波形,按一定的速率采样、量化,对每个量化点用代码表示。解码是相反过程,将加收的数字信号序列经解码和滤波后恢复成模拟信号。
波形编码能提供很好的话音质量,但编码速率较高,一般应用在对信号带宽要求不高的通信中。
常见的波形编码技术包括有脉冲编码调制(PCM)、增量调制(DM)、差分脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)、自适应增量调制(ADM)、自适应传输编码(ATC)等。;2.参数编码
参数编码又称声源编码,该技术基于发音模型,从模拟话音中提取各个特征参量并进行量化编码,可实现低速率语音编码,但话音质量只能达到中等。常见的线性编码技术包括线性预测(LPC)声码器和余弦声码器等。
;声码器定义
声码器在发送端对语言信号进行分析,提取出语言信号的特征参量加以编码和加密,以取得和信道的匹配,经信息道传递到接受端,再根据收到的特征参量恢复原始语言波形。它主要用于数字电话通信。
;原理
人讲话时,气流经过喉头形成声源信号,然后激励由口、鼻腔构成的声道,产生话音信号。声码器发信端的分析器首先对话音信号进行分析,提取主要话音参数:①声源特性,如声带“振动-不振动”(浊-清音)、声带振动时的基本频率(基频);②声道传输声源信号的特性。这些话音参数变化很慢,它们所占的总频带比话音本身的频带窄得多,因而对这些参数采样编码时总数码率只有几千甚至几百比特/秒,只有直接 由话音信号采样编码的数码率的十几分之一,可以通过一个普通电话信道来传输。收信端的合成器利用这些参数来合成话音。;3.混合编码
混合编码是将波形编码和参量编码结合起来,吸收有波形编码的高质量和参数编码的低速率这两者的优点。常见的混合编码技术有基于线性预测技术的分析-合成编码算法,如泛欧GSM系统的规则脉冲激励-长期预测编码(RPE-LTP)混合编码方案等。
;3.1.1 GSM语音编解码技术简介;线性预测分析是LPC中的关键,线性预测分析的基本概念是一个语音抽样能够用过去若干个语音抽样的线性组合来逼近。通过使在有限时间内的实际语音抽样与线性预测抽样之间的差值平方和最小,能够唯一确定一组预测器参数。这里预测器参数实际就是线性组合中所用的加权系数。
利用LPC技术能有效地降低声码器的编码速率,但质量不尽如人意。对此可以采用声激励声码器来构成更精确的激励模型。
;混合编码:一条路径产生并传送线性预测参数(线性滤波器数目和增益等);另一路径是滤出波形信号低频部分,并传送波形编码。在接收端的话音合成器中,将收到的低频话音信号经过适当组合以及平滑处理后,作为激励信号输入到数字滤波器中以恢复话音,而数字滤波器由接收到的预测参数所确定。这种改进的线性预测编码,同时对话音信号的特征参数和原信号的部分波形进行了编码。
; GSM数字移动通信系统采用13 kbit/s 的“规则脉冲激励长期预测编码(RPE-LTP)”语音编码技术,它包括预处理、线性预测编码(LPC)分析、短时分析滤波、长时预测和规则码激励编码等5个主要部分,如图3-1所示。 ;图3-1 RPE-LTP编码示意图;(1)预处理
主要完成两件工作,离散语音信号和高频预加重。
先用8kHz采样频率对输入的模拟语音信号进行采样得到离散语音信号S0(n),滤除S0(n)中的直流分量,得到S0f(n);
再采用一阶有限冲激响应(FIR)滤波器进行高频预加重,得到信号S(n);加重的目的是加强语音谱中的高频共振峰,从而提高谱参数估值的精确性。;(2)LPC分析
;(3)短时分析滤波
主要用于滤除语音信号样点之间的短时相关性,它让信号S(n)经过8级格型滤波器,产生一个短时LP余量信号d(n)。; 由于共振峰可以识别音素,而一个音素持续的时间相对较短(音节时间),因此我们说频谱包络反映了话音的短时相关性。 人类的语音有一定的周期特征,对应人的发生结构的基音频率的变化比较缓慢,因此需要较细致的刻画,因此可以说频谱的精细结构反映了话音的长时相关性,这同样反映了时频矛盾的问题。 ;(4)长时预测
长时预测是为了除去语音信号相邻基音周期之间的长时相关性,以便压缩编码速率。长时预测按子帧处理,每一帧分成4个子帧。长时预测使用过去子帧中经过处理
文档评论(0)