- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章语音编码技术-Read.ppt
* 第三章 语音编码技术 3.1话音编码概要 3.1.1话音信号压缩的主要依据 一、语音信息冗余度 ???????? 1、时域信息冗余度 ????? 2、幅度非均匀分布 3、样本间的相关性 ????? 4、周期之间的相关性 ???? 5、基音之间的相关性 6、静止系数(话音间隙) ? 7、长时自相关函数 ??????? 二、频域信息冗余度 ????? 1、非均匀的长时功率谱密度 ?? 2、语音特有的短时功率谱密度 第三章 语音编码技术 二、人的听觉感知机理 ??????? 1、人的听觉具有掩盖效应 ??????? 2、人耳对不同频率声音的敏感程度不同,对低频率比较敏感 3、人耳对对语音信号的相位变化不敏感 3.1.2 三种话音编译码器 通常把已有的话音编译码器分成以下三种类型:波形编译码器(waveform codecs),音源编译码器(source codecs)和混合编译码器(hybrid codecs)。一般来说,波形编译码器的话音质量高,但数据率也很高;音源编译码器的数据率很低,产生的合成话音的音质有待提高;混合编译码器使用音源编译码技术和波形编译码技术,数据率和音质介于它们之间。图3-01表示了目前这三种编译码器的话音质量和数据率的关系。 第三章 语音编码技术 图3-01 普通编译码器的音质与数据率 图3-01-2 常见的音频数据压缩方法 无损压缩 有损压缩 哈夫曼编码 算术编码 行程编码 波形编码 音源编码 混合编码 PCM DM、ADM DPCM、ADPCM 子带编码 失量编码 LPC 第三章 语音编码技术 MPE、RPE、CELP、MP-LPC 第三章 语音编码技术 表3-01 部分编码器的MOS分 ? 编 码 器 MOS分 64 kb/s脉冲编码调制(PCM) 4.3 32 kb/s自适应差分脉冲编码调制(ADPCM) 4.1 16 kb/s低时延码激励线性预测编码(LD-CELP) 4.0 8 kb/s码激励线性预测编码(CELP) 3.7 3.8 kb/s码激励线性预测编码(CELP) 3.0 2.4 kb/s线性预测编码(LPC) 2.5 第三章 语音编码技术 3.2 脉冲编码调制(PCM) 3.2.1 PCM的概念 脉冲编码调制(pulse code modulation,PCM)是概念上最简单、理论上最完善的编码系统,是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。 PCM的编码原理比较直观和简单,它的原理框图如图3–03所示。在这个编码框图中,它的输入是模拟声音信号,它的输出是PCM样本。图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”,“量化器”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。 声音数字化有两个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值。量化有好几种方法,但可归纳成两类:一类称为均匀量化,另一类称为非均匀量化(μ律压扩(companding)算法,另一种称为A律压扩算法。)。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法。 第三章 语音编码技术 图3-03 PCM编码框图 第三章 语音编码技术 3.3 PCM在通信中的应用 PCM编码早期主要用于话音通信中的多路复用。一般来说,在电信网中传输媒体费用约占总成本的65%,设备费用约占成本的35%,因此提高线路利用率是一个重要课题。提高线路利用率通常用下面两种方法: (1) 频分多路复用 (frequency-division multiplexing,FDM) 这种方法是把传输信道的频带分成好几个窄带,每个窄带传送一路信号。例如,一个信道的频带为1400 Hz,把这个信道分成4个子信道(subchannels):820~990 Hz, 1230~1400 Hz, 1640~1810 Hz和2050~2220 Hz,相邻子信道间相距240 Hz,用于确保子信道之间不相互干扰。每对用户仅占用其中的一个子信道。这是模拟载波通信的主要手段。 (2) 时分多路复用(time-division multiplexing,TDM) 这种方法是把传输信道按时间来分割,为每个用户指定一个时间间隔,每个间隔里传输信号的一部分,这样就可以使许多用户同时使用一条传输线路。这是数字通信的主要手段。例如,话音信号的采样
文档评论(0)