- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
L)宽带音频压缩编码.ppt
第十一讲 (续) 宽带音频压缩技术及标准 一、概 述 1.1 宽带音频编码特点 宽带音频覆盖了人类听力所能接受的频率范围: 20Hz-20 k Hz ; 并且通常具有环绕立体声效果,这种高质量声音信号能给人一种身处其境的真实感觉。 为了能够比较真实地再现自然界的各种声音,在对宽带音频数据进行压缩时,必须研究和利用人的听觉系统的特性,建立心理声学模型 ( psycho-acoustic model ),即采用所谓的“感知声音编码”(perceptual audio coding )技术。 自 20世纪 80 年代以来,人们在这方面已取得了很大进展,先后制定了一系列宽带音频压缩编码标准。 1.2 宽带音频编码标准 目前国际上比较成熟的高质量声音压缩标准为 MPEG 音频,此外,还有美国杜比(Dolby)公司制定的高保真立体声音频压缩系列标准,如AC-3。 MPEG 音频编码标准主要包括: MPEG –1 Audio 、 MPEG –2 Audio 、 MPEG –2 AAC、MPEG-4 Audio等,它们处理 10 – 20000Hz 范围内的声音数据,并且根据人耳的听觉特性,使用“心理声学模型”(psycho – acoustic model)来达到压缩声音数据的目的。 1.3 MPEG 音频编码 MPEG Audio 采纳了两种感知编码: 感知子带编码 (perceptual subband coding) Dolby AC –3 编码 感知子带编码 基于心理声学模型, 该模型涉及到两个基本概念: 听觉阈值电平 听觉掩蔽特性 1.4 杜比 AC-3 编码 二、MPEG – 1 音频编码 2.1 简介 MPEG-l Audio 简介 MPEG-l Audio ( ISO/IEC 11172-3 )压缩算法是世界上第一个高保真声音压缩国际标准。 MPEG编码器输入为 线性 PCM 信号、采样率为32、44.1 或 48 kHz;输出速率为 32 ~ 384 kbps。 MPEG-l Audio标准不是一种压缩算法,而是包含 3 种音频压缩编码方案,分为:层1、层2、层3。 2.2 编码层次 MPEG-1的三种编码方案: 随着层数的增加,算法的复杂度也增大。 各层性能不同:压缩率不同,解压缩恢复后的音质也有差别。 注:MP3 就是指采用 MPEG-1音频编码的第3层方案进行压缩的数字化宽带波形音频,其压缩率大、而音质又好。 所有3层都分级兼容;最复杂的层3 音频解码器也可对 层l或层2的码流进行解码。 2.2 编码层次 MPEG –1 音频编码层次: 层 1: 每帧 12 x 32 = 384 样本, 压缩率为 4:1, 输出数据率为 384 kbps,主要用于小型数字盒式磁带。 层 2: 每帧 36 x 32 = 1152 样本, 压缩率为 8-6:1, 输出数据率为 256 - 192 kbps,主要用于数字音乐、数字声音广播、CD-I 和 VCD 等。 层 3: 每帧 36 x 32 = 1152 样本, 压缩率为 12-10:1, 输出数据率为 128 - 112 kbps,甚至更低; 其中,64kb/s可用于在 ISDN 上 传输声音。 2.3 MPEG-1音频编码原理 MPEG-l Audio 编码原理 所有3层都运用同一原理:变换编码和子带编码。 输入声音信号由时域变换到频域; 声音频谱被分为 32 个子带; 用心理声学模型确定各子带样本的量化精度。 子带编码 (SBC) 的理论依据是:听觉系统的掩蔽特性 (主要是频域掩蔽特性)。 层 l、2 和 3主要在子带分割与量化方式上有所区别,各层的算法复杂度不同。 2.3.1 编解码基本原理 2.3.2 子带分割方法 子带分割:有两种方法(线性 / 非线性); 用多相滤波器来划分(线性): 层1、层2 以“临界频带”来划分 (非线性) : 层3 2.3.3 心理声学模型 心理声学模型: 计算以频率为自变量的噪声掩蔽阈值; 查看输入信号和各子带信号,以确定每个子带中的信号能量与掩蔽阈值的比率,简称信掩比(SMR) 再由SMR决定分配给各子带信号的量化位数,使量化噪声低于掩蔽阈值。 2.3.3 心理声学模型 2.3.3 心理声学模型 2.3.4 层1/2编解码原理 2.3.5 层3编解码原理 2.4 数据流格式 MPEG –1 音频编码数据流格式 (略) 三、MPEG – 2 音频编码 3.1 简介 一、
您可能关注的文档
- HWS静压造型的排气塞功能和作用.doc
- HW系列变速器使用说明及备件图册.doc
- HXC冷水机组说明书.doc
- HXDC制动及供风系统说明.ppt
- HXDC季检工艺.doc
- HXDC机车详细介绍.ppt
- HXDD客运电力机车转向架培训教材.ppt
- HXDD机车网络控制系统主变压器应急处理大连机车王乐民.ppt
- HXD型交流传动电力机车.ppt
- HXD型机车故障处理.ppt
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)