第四章音频媒体及其应用.ppt

下载文档 降价啦

15
0
约1.05万字
约 78页
2018-06-10 发布于河南
举报
版权申诉
保障服务

第四章音频媒体及其应用.ppt

1、本文档共78页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第四章音频媒体及其应用

数字化音频：信号变化过程图示数字化音频：离散时间信号图示数字化音频：离散幅度信号图示均匀量化和非均匀量化如果采用相等的量化间隔对采样所得信号作量化，则这种量化称为均匀量化或线性量化。若量化间隔不相等则为非均匀量化。量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声。音频编码的分类波形编码音源编码基于人的听觉特性进行编码脉冲编码调制(PCM) 脉冲编码调制概念上最简单、理论上最完善，最早研制成功、使用最广，但数据量也最大。 PCM的原理框图如图所示。脉冲编码调制(PCM)— 均匀量化和非均匀量化均匀量化、非均匀量化和量化误差非线性量化的基本思想在非线性量化中，采样输入信号幅度和量化输出数据之间定义了两种对应关系，这是基于对语音信号的统计分析后由CCITT建议的： m 律压扩算法和A律压扩算法 PCM示意图自适应脉码调制概念 APCM是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。自适应可以是：瞬时自适应音节自适应 APCM的量化阶改变量化阶大小的方法有两种：前向自适应根据未量化的样本值的均方根值来估算输入信号的电平，以此来确定量化阶的大小，并对其电平进行编码作为边信息(side information)传送到接收端。后向自适应 APCM示意图插入林图3-13APCM方块图差分脉码调制(DPCM) DPCM的思想: 根据过去的样本去估算下一个样本信号的幅度大小(称为预测值)，然后对实际信号值与预测值之差进行量化编码，从而就减少了表示每个样本信号的位数。DPCM原理示意图 DPCM示意图插入林图3-14DPCM方块图自适应差分脉码调制 ADPCM的核心思想：自适应量化：利用自适应的思想改变量化阶的大小；自适应预测：使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。ADPCM框图。 ADPCM示意图插入林图3-15ADPCM方块图 ADPCM解码器示意图插入林图3-16b.ADPCM解码器子带编码(SBC) 子带编码的基本思想：使用一组带通滤波器(band-pass filter，BPF)把输入音频信号的频带分成若干个连续的频段，每个频段称为子带。对每个子带中的音频信号采用单独的编码方案去编码。在信道上传送时，将每个子带的代码复合起来。在接收端译码时，将每个子带的代码单独译码，然后把它们组合起来，还原成原来的音频信号。子带编码的方块图如图3-17所示，图中的编码/译码器，可以采用ADPCM，APCM，PCM等。 LD_CELP 低延时-码激励线性预测编码是以美国ATT公司贝尔实验室提出的LD_CELP（低延时码激励线性预测）算法为基础，它充分考虑了听觉特性。其基本思想如下： DL_CELP编码思想(a) 1. 语音输入每帧5个取样值，并附上10bit的描述激励信号波形与增益的信息; 2. 编码时用事先准备好的激励矢量的所有组合去合成语音； DL_CELP编码思想(b) 3. 将合成结果与输入信号相比较，选出听觉加权后距离最小的码元作为信息传输； 4. 解码端将发送端制定的激励矢量、3 bit增益码以及自身已经合成过的语音波形一起合成为语音。 MPEG中的音频编码器 MPEG中的音频编码层次 MPEG声音标准提供三个独立的压缩层次：层1、层2和层3 后继层次的压缩比更高，编码解码器也更复杂每层都自含SBC编码器，高层的SBC可以使用低层SBC的声音数据 MPEG中的音频编码层次1 层1包括将数字音频变成32个子带的基本映射。将数据格式化成块的固定分段。决定自适应位分配的心理声学模型。利用块压扩合格石化的量化器。编码/解码理论延时最小为19ms，数据传输率384kb/s。 MPEG中的音频编码层次2 层2提供了位分配，缩放因子和抽样的附加编码。使用了不同的帧格式。理论上最小编解码延时35ms，数据传输率256kb/s~192kb/s。用于数字广播、CD-I、VCD等。 MPEG中的音频编码层次3 层3采用混合带通滤波器以提高频率分辨率。增加了差值量化、自适应分段和量化值的熵编码。理论上最小编解码延时59ms，数据传输率64kb/s。用于ISDN上的声音传播。 MPEG的声音压缩率 MPEG中的音频解码解码器按编码器定义的语法接受压缩的音频数据流，按解码部分的方法解出数据元素，按滤波器的规定用这些数据产生数字音频输出。 MPEG音频解码结构框图 DOLBY AC-3编码和解码由美国DOLBY实验室开发提供5.1声道从20Hz~20KHz的平滑带宽（图）将六个声道压缩成一个通道数据率320Kbps AC-3的应用范围制作影碟、CD、VHS录像带数字广播、有线电视直播

您可能关注的文档

文档评论（0）

asd522513656 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第四章音频媒体及其应用.ppt