- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音频压缩原理及AC-3编码流程分析
安徽广播电视台 梁彦
摘要:
本文从音频压缩原理和人耳声学特性的出发,讲述了声音的主要声学现象及其成因和音频信号压缩的主要思路,跟着详细描述了AC-3多通道编码器的信号处理流程,最后总结了AC-3编码取得高效压缩编码效果使用的主要方法,对读者进一步了解当前主流的多通道音频压缩编码算法有积极的意义。
关键字:AC-3、编码流程、音频压缩
1引言
随着听众对音质和声音环境要求的越来越高,5.1声道的音频节目已经开始进入电影院和家庭。这同时也伴随着声音信号的传输。对于电视台来说,如何将制作好的音频节目,完整的传递给观众成为广播电视工程人员的考虑问题。而音频压缩又是音频节目传输环节中的重中之重,因此本文主要通过简单介绍音频压缩原理和主流的多声道压缩算法AC-3工作流程,给广大电视工程工作者提供有益的参考资料。
2音频压缩原理和人耳声学特性
音频的压缩编码一般分为 有损压缩和无损压缩两种,无损压缩一般使用霍夫曼编码或游程编码,有损压缩一般伴随着域变换和量化,根据人耳的听觉掩蔽效应特性,去掉声音中人耳听不到的或可以忽略的数据从而达到压缩的目的。听觉掩蔽效应主要分为时域掩蔽和频域掩蔽,时域中强声音信号分量可掩蔽附近(该时间点前后)弱的声音分量,而且这种效应随着信号的频率而变化。在频域中,强信号可以掩蔽某一极限带宽内的弱信号。
一般而言, 人耳的听觉像20Hz~20kHz 带通滤波器, 它对不同频率的信号有不同的感知辨别率。相对于高频而言, 低频的声音更易被人耳感知, 其中尤以对2kHz~4kHz 的信号最为敏感, 因而形成了图1 中的绝对可闻阈曲线。绝对可闻阈是指寂静时听觉可听到的各频段的最低音量。但遮蔽效应对于听觉特性有着很大的影响。遮蔽分为同时性的遮蔽和非同时性的遮蔽。前者是频域下的一种现象, 指在相近的频率下, 强度较大的信号会遮蔽较小的信号。后者也称时间的遮蔽性, 是指在短暂的时间间隙内, 强度大的信号遮蔽较小的信号, 它又分为前遮蔽和后遮蔽。前遮蔽是指强度大的信号遮蔽发生较早的小信号, 后遮蔽则是强度大的信号遮蔽发生较晚的小信号。通常前遮蔽的持续时间为20ms, 对之前的声音的影响几乎可以忽略; 而后遮蔽所产生的效应相对大而且持久, 一般可达100~200ms ,所以应用更为广泛。典型的听觉心理特性如图1 所示的频率特性(左)和时间特性(右)。
图1 中, 噪声A 因在绝对可闻阈以上而可闻, 但噪声C 因在绝对可闻阈以下, 故听不到。如左图所示, 当有黑线所示的某频率信号存在时, 靠近它的本来可以听见的噪声B 就变得听不见了, 这种现象就是同时性遮蔽效应。而如右图所示, 当某时刻有黑线所示的信号存在时, 尽管前面的噪声D还可以听到,但位于其后面的比它小一些的本来可听见的噪声E 也变得听不见了, 这种现象称为非同时性遮蔽效应。两种效应合成的结果形成了实际的可闻阈。
3 AC-3压缩编码流程分析
AC-3多通道自适应变换编码根据心理声学模型将多个声道编码成一个声道,并保持较低的码率,在同等质量和码率下其音频质量要比同样数量的多通道声音单独编码的质量要好。虽然AC-3编码的标准配置是SMPTE推荐的5.1声道(全频段左中右左环绕右环绕加LFE低频段),但是AC-3的算法本身和声道数无关。除了5.1声道的标准配置外,AC-3编码还支持单声道、双声道、立体声、3/0(左、中、右)、2/1(左、右、环绕)、3/1(左、中、右、环绕)、2/2(左、右、左环绕、右环绕)、3/2(左、中、右、左环绕、右环绕)多种音频通道模式,上述模式中LFE(Low-frequency effects )声道并不包含在内,但任何一种模式都可以附加LFE声道。AC-3编码输出的比特率范围可以从32kbps~640kbps,而采用5.1标准模式时,根据实际应用情况统计,320kbps~384kbps的码率就可以获得一个高压缩比、高保真的音频效果。同时AC-3数据流中可携带多种元数据,可以实现音频动态范围压缩,对白标准化、节目间电平匹配、下混合、版权信息等功能。
下面就详细介绍编码器和解码器的主要功能模块和信号流程。
3.1编码器工作流程[1]
输入缓冲器
AC-3是分块编码器,因此需要一个缓冲器来存储时域采样的bit流,一般每个块包含512个样点,每个样点的字长最多可达24bit。
输入滤波器
受到人耳听觉频率特征的影响,时域波形在处理以前需要经过滤波去除直流信号,5个全频段信号经过一个3Hz的高通滤波器,1个低音信号经过一个120Hz的低通滤波器。
瞬时检测
为了避免瞬时的信号出现在块的边缘,避免掩蔽效应,防止声音信号被忽略,编码器使用一个高频带通滤波器来检测瞬时现象,检测信息将提供给TDAC滤波器组调节相应块的大小。
TDAC(
您可能关注的文档
最近下载
- 基于51单片机的智能台灯设计.doc
- 幼儿园课件:小老鼠和泡泡糖最终.pptx
- 2024必威体育精装版国开《个人理财》形考题库.docx VIP
- 国家开放大学学前教育专业+毕业作业(幼儿园教学活动设计与指导)9.doc
- 第18课 从九一八事变到西安事变(课件).pptx VIP
- 酒店装配式装修技术规程.pdf VIP
- 2023年中国汉字听写大赛全部试题库及答案.pdf VIP
- 2024中国铁路成都局集团限公司招聘高校毕业生998人高频考题难、易错点模拟试题(共500题)附带答案详解.docx
- 人文英语3--An-absence-excuse-letter完整版.docx
- 神经工程学(天津大学)大学MOOC慕课 客观题答案.docx
文档评论(0)