L)宽带音频压缩编码.ppt

下载文档 降价啦

3
0
约3.93千字
约 32页
2015-12-27 发布于湖北
举报
版权申诉
保障服务

L)宽带音频压缩编码.ppt

1、本文档共32页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

L)宽带音频压缩编码.ppt

第十一讲 (续) 宽带音频压缩技术及标准一、概述 1.1 宽带音频编码特点宽带音频覆盖了人类听力所能接受的频率范围： 20Hz－20 k Hz ; 并且通常具有环绕立体声效果，这种高质量声音信号能给人一种身处其境的真实感觉。为了能够比较真实地再现自然界的各种声音，在对宽带音频数据进行压缩时，必须研究和利用人的听觉系统的特性，建立心理声学模型 ( psycho-acoustic model )，即采用所谓的“感知声音编码”（perceptual audio coding ）技术。自 20世纪 80 年代以来，人们在这方面已取得了很大进展，先后制定了一系列宽带音频压缩编码标准。 1.2 宽带音频编码标准目前国际上比较成熟的高质量声音压缩标准为 MPEG 音频，此外，还有美国杜比(Dolby)公司制定的高保真立体声音频压缩系列标准，如AC-3。 MPEG 音频编码标准主要包括： MPEG –1 Audio 、 MPEG –2 Audio 、 MPEG –2 AAC、MPEG-4 Audio等，它们处理 10 – 20000Hz 范围内的声音数据，并且根据人耳的听觉特性，使用“心理声学模型”（psycho – acoustic model）来达到压缩声音数据的目的。 1.3 MPEG 音频编码 MPEG Audio 采纳了两种感知编码：感知子带编码 (perceptual subband coding) Dolby AC –3 编码感知子带编码基于心理声学模型，该模型涉及到两个基本概念：听觉阈值电平听觉掩蔽特性 1.4 杜比 AC-3 编码二、MPEG – 1 音频编码 2.1 简介 MPEG－l Audio 简介 MPEG－l Audio ( ISO/IEC 11172－3 )压缩算法是世界上第一个高保真声音压缩国际标准。 MPEG编码器输入为线性 PCM 信号、采样率为32、44.1 或 48 kHz；输出速率为 32 ～ 384 kbps。　　　 MPEG－l Audio标准不是一种压缩算法，而是包含 3 种音频压缩编码方案，分为：层1、层2、层3。 2.2 编码层次 MPEG-1的三种编码方案：随着层数的增加，算法的复杂度也增大。各层性能不同：压缩率不同，解压缩恢复后的音质也有差别。注：MP3 就是指采用 MPEG-1音频编码的第3层方案进行压缩的数字化宽带波形音频，其压缩率大、而音质又好。所有3层都分级兼容；最复杂的层3 音频解码器也可对层l或层2的码流进行解码。 2.2 编码层次 MPEG –1 音频编码层次：层 1: 每帧 12 x 32 = 384 样本, 压缩率为 4:1, 输出数据率为 384 kbps，主要用于小型数字盒式磁带。层 2: 每帧 36 x 32 = 1152 样本, 压缩率为 8-6:1, 输出数据率为 256 - 192 kbps，主要用于数字音乐、数字声音广播、CD-I 和 VCD 等。层 3: 每帧 36 x 32 = 1152 样本, 压缩率为 12-10:1, 输出数据率为 128 - 112 kbps，甚至更低; 其中,64kb/s可用于在 ISDN 上传输声音。 2.3 MPEG-1音频编码原理 MPEG－l Audio 编码原理所有3层都运用同一原理：变换编码和子带编码。输入声音信号由时域变换到频域；声音频谱被分为 32 个子带；用心理声学模型确定各子带样本的量化精度。子带编码 (SBC) 的理论依据是：听觉系统的掩蔽特性 (主要是频域掩蔽特性)。层 l、2 和 3主要在子带分割与量化方式上有所区别，各层的算法复杂度不同。 2.3.1 编解码基本原理 2.3.2 子带分割方法子带分割：有两种方法（线性 / 非线性）; 用多相滤波器来划分（线性）: 层1、层2 以“临界频带”来划分 (非线性) : 层3 2.3.3 心理声学模型心理声学模型：计算以频率为自变量的噪声掩蔽阈值；查看输入信号和各子带信号，以确定每个子带中的信号能量与掩蔽阈值的比率，简称信掩比（SMR）再由SMR决定分配给各子带信号的量化位数，使量化噪声低于掩蔽阈值。 2.3.3 心理声学模型 2.3.3 心理声学模型 2.3.4 层1/2编解码原理 2.3.5 层3编解码原理 2.4 数据流格式 MPEG –1 音频编码数据流格式 (略) 三、MPEG – 2 音频编码 3.1 简介一、