- 1、本文档共78页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 音频媒体及其应用
数字化音频:信号变化过程图示 数字化音频:离散时间信号图示 数字化音频:离散幅度信号图示 均匀量化和非均匀量化 如果采用相等的量化间隔对采样所得信号作量化,则这种量化称为均匀量化或线性量化。 若量化间隔不相等则为非均匀量化。 量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声。 音频编码的分类 波形编码 音源编码 基于人的听觉特性进行编码 脉冲编码调制(PCM) 脉冲编码调制概念上最简单、理论上最完善,最早研制成功、使用最广,但数据量也最大。 PCM的原理框图如图所示。 脉冲编码调制(PCM)— 均匀量化和非均匀量化 均匀量化、非均匀量化和量化误差 非线性量化的基本思想 在非线性量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,这是基于对语音信号的统计分析后由CCITT建议的: m 律压扩算法和A律压扩算法 PCM示意图 自适应脉码调制概念 APCM是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。自适应可以是: 瞬时自适应 音节自适应 APCM的量化阶 改变量化阶大小的方法有两种: 前向自适应 根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息(side information)传送到接收端。 后向自适应 APCM示意图 插入林图3-13APCM方块图 差分脉码调制(DPCM) DPCM的思想: 根据过去的样本去估算下一个样本信号的幅度大小(称为预测值),然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。DPCM原理示意图 DPCM示意图 插入林图3-14DPCM方块图 自适应差分脉码调制 ADPCM的核心思想: 自适应量化:利用自适应的思想改变量化阶的大小; 自适应预测:使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。ADPCM框图。 ADPCM示意图 插入林图3-15ADPCM方块图 ADPCM解码器示意图 插入林图3-16b.ADPCM解码器 子带编码(SBC) 子带编码的基本思想: 使用一组带通滤波器(band-pass filter,BPF)把输入音频信号的频带分成若干个连续的频段,每个频段称为子带。 对每个子带中的音频信号采用单独的编码方案去编码。 在信道上传送时,将每个子带的代码复合起来。 在接收端译码时,将每个子带的代码单独译码,然后把它们组合起来,还原成原来的音频信号。子带编码的方块图如图3-17所示,图中的编码/译码器,可以采用ADPCM,APCM,PCM等。 LD_CELP 低延时-码激励线性预测编码 是以美国ATT公司贝尔实验室提出的LD_CELP(低延时码激励线性预测)算法为基础,它充分考虑了听觉特性。其基本思想如下: DL_CELP编码思想(a) 1. 语音输入每帧5个取样值,并附上10bit的描述激励信号波形与增益的信息; 2. 编码时用事先准备好的激励矢量的所有组合去合成语音; DL_CELP编码思想(b) 3. 将合成结果与输入信号相比较,选出听觉加权后距离最小的码元作为信息传输; 4. 解码端将发送端制定的激励矢量、3 bit增益码以及自身已经合成过的语音波形一起合成为语音。 MPEG中的音频编码器 MPEG中的音频编码层次 MPEG声音标准提供三个独立的压缩层次:层1、层2和层3 后继层次的压缩比更高,编码解码器也更复杂 每层都自含SBC编码器,高层的SBC可以使用低层SBC的声音数据 MPEG中的音频编码层次1 层1包括将数字音频变成32个子带的基本映射。将数据格式化成块的固定分段。决定自适应位分配的心理声学模型。利用块压扩合格石化的量化器。 编码/解码理论延时最小为19ms,数据传输率384kb/s。 MPEG中的音频编码层次2 层2提供了位分配,缩放因子和抽样的附加编码。使用了不同的帧格式。 理论上最小编解码延时35ms,数据传输率256kb/s~192kb/s。用于数字广播、CD-I、VCD等。 MPEG中的音频编码层次3 层3采用混合带通滤波器以提高频率分辨率。增加了差值量化、自适应分段和量化值的熵编码。 理论上最小编解码延时59ms,数据传输率64kb/s。用于ISDN上的声音传播。 MPEG的声音压缩率 MPEG中的音频解码 解码器按编码器定义的语法接受压缩的音频数据流,按解码部分的方法解出数据元素,按滤波器的规定用这些数据产生数字音频输出。 MPEG音频解码结构框图 DOLBY AC-3编码和解码 由美国DOLBY实验室开发 提供5.1声道从20Hz~20KHz的平滑带宽(图) 将六个声道压缩成一个通道 数据率320Kbps AC-3的应用范围 制作影碟、CD、VHS录像带 数字广播、有线电视 直播
文档评论(0)