- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
音频压缩的成功者——感知编码
2004年中南地区省级电视台技术年会论文二等奖
近年来,随着现代通信的发展,数字化日益渗透人们的日常生活,人们对各种多媒体业务的需求日益增长,我们正享受着数字化带来的方便和快捷,卫星电视、数字电视、各种数码音乐产品正改变着我们的生活。于是便要求得到更多更好的音频产品和服务。数字声音作为一种存储、处理和传输高保真声音的方法,在消费电子、专业声音等众多领域已得到广泛应用。但是如果没有通用有效的高质量音频编解码方案,数字存储和传输技术的进一步发展将会受到严重的束缚。在音频数字压缩技术中,当前比较成功的编码方式被称为“感知型编码(PerceptualCoding)”,现在比较常用的MP3、MD等都是感知编码原理。
一般来说,数据压缩有两种方法。一种方法是利用信号的统计性质,完全不丢失信息的高效率编码法,称为平均信息量编码或熵编码。第二种方法是利用接收信号的人的感觉特性,省略不必要的信息,压缩信息量,这种方法称为感觉编码。
因为熵编码可通过解码完全再现编码前的数据,故应用范围广泛,例如可用于磁盘压缩、文件压缩等,在保存信息方面,完全不用担心劣化。不过遗憾的是,仅依靠熵编码不能将音频信号进行大幅度的数据压缩。这是因为在音频信号中会有白噪声信号,这种完全随机的信号,根据信息论是决不能用熵编码进行压缩的。因此在音频压缩中,必须同时采用感知编码。
感知编码是利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性)、人耳对信号幅度、频率、时间的有限分辨能力,凡是人耳感觉不到的成分不编码,不传送,即凡是对人耳辨别声音信号的强度、音调、方位有贡献的部分(称为不相关部分或无关部分)都不编码和传送。对感觉到的部分进行编码时,允许有较大的量化失真、并使其处于听阈以下,人耳仍然感觉不到。简单的说感知编码是建立在人类听觉系统的心理声学原理为基础,只记录那些能被人的听觉所感知的声音信号,从而达到减少数据量而又不降低音质的目的。
目前音频压缩编码已成为标准的是MPEG-1(ISO/IEC11172-3)、MPEG-2(ISO/IEC13818-3)和美国大联盟的AC-3。他们都是感知编码。
一、为什么压缩
了解数字音频首先要提到脉冲编码调制PCM(PulseCodeModulation),它是概念上最简单、理论上最完善的编码系统,是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。PCM指模拟音频信号只经过采样、量化、编码,模数转换成PCM信号,得到标准的数字音频码流,而未经过任何编码和压缩处理。
根据奈奎斯特采样定律,通常其采样频率至少应当是信号中的最高频率分量的两倍。对于高质量的音频信号,其频率范围是从20Hz~20kHz。所以其采样频率必须在40kHz以上。在CD中采用了44.1kHz的采样频率。普通CD线性PCM的取样频率为44.1kHz,量化精度为16bit,动态范围为98db。(在对模拟信号采样以后,还必须对其幅度上加以分层。在CD中,其分层以后的幅度信号用16bit的二进制信号来表示,也就是把模拟的音频信号在幅度上分为65536(216)层。这样,它的动态范围就可以达到96分贝(6分贝/比特)。)
PCM的编码原理比较直观和简单,它的原理框图如图所示。
在这个编码框图中,它的输入是模拟声音信号,它的输出是PCM样本。图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”,“量化器”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。
那么这种未经压缩的PCM信号的数据量具体有多大呢?以CD音质的信号为例,它的单通道的采样率是44.1kHz,每个样值是16bit的量化,而立体声CD音质信号,有两个通道,它每秒的码流是44.1K×16×2≈1.4Mbit/s。(数字信号传输率=取样频率×量化比特×通道数)一张CD唱片的容量约为680MB,可以容纳约1小时的双声道PCM数字音频节目,由于这种编码方式所产生的数据量太大,存储和传输都既不方便也不经济,有时甚至是行不通的。对于电视广播来说,数据传输速率越高,每套节目所需的频宽就越大,在频带资源日趋紧张的今天,过宽的频带是不能允许的,同时对于有形载体(激光碟、磁带等),每种载体的记录密度都是有限的(受当时技术发展程度的制约),增大数据量就意味着缩短节目长度。因此需要开发一种新的编码方式,它应该使用较少的数据量,而又不会导致音质的主观听感有明显的下降。
二、感知编码原理
1、理论基础——闻域和临界频段
音频压缩理论是建立在心理声学模型基础上,从研究人耳的听感系统开始的。
人耳实际上可看成一个多频段的听感分析器,在接收端的最后,它对瞬间的频谱功率进行了重新分配,这就为音频的数据压缩提供了依据。
众
您可能关注的文档
- 优势病种临床路径实施方案.doc
- 用于螺旋输送机的一级圆柱齿轮减速器.doc
- 用耳机的好处.doc
- 泳池热泵参数.doc
- 永和镇卫生院乙肝、梅毒、艾滋病母婴传播工作总结.doc
- 永川豆豉胰蛋白酶抑制剂的分离纯化及其降糖活性研究.doc
- 庸俗还是通俗.doc
- 应用主动抗阻运动疗法预防、治疗康复颈椎病.doc
- 应用神经阻滞绝缘针注射A型肉毒毒素治疗痉挛性脑瘫.doc
- 影响激光焊接质量的主要因素.doc
- ADS—B技术在空管中的应用分析 .pdf
- LTR对J亚群禽白血病病毒感染的影响 .pdf
- LED显示屏项目可行性研究报告范本参考2020 .pdf
- LED光伏太阳能照明系统设计毕业论文 .pdf
- PHP开发工程师的岗位职责(真题27篇) .pdf
- dy某生物技术有限公司年产3000吨饲用酶制剂项目环境影响报告书(155页W.pdf
- 《城市供水水质标准》CJ-T206-2005讲读 .pdf
- 《匆匆》课例比较研究——以特级教师薛法根、孙双金、支玉恒、何捷的课.pdf
- 【原创】2020年必威体育精装版《保险资产管理产品管理暂行办法》知识培训试题及答.pdf
- “家校社”协同育人研究评述与问题前瞻 .pdf
最近下载
- 视觉与艺术智慧树知到期末考试答案章节答案2024年西安交通大学.docx
- 2024年四川省安全员《B证》考试题库及答案.doc VIP
- 《全国统一电力市场发展规划蓝皮书》.pdf
- 黄冈360°定制密卷一年级上册数学人教版.pdf
- 工程量清单编制中存在问题剖析.doc VIP
- 13SR425 室外热力管道检查井.docx VIP
- 山东省实验中学2024—2025学年高二上学期期中考试语文试题(解析版).docx VIP
- 石油和天然气的开采安全知识培训说课课件PPT.pptx VIP
- 综合管理部年度工作总结PPT.pptx VIP
- 大学日语 发展篇(西安交通大学)中国大学MOOC慕课章节测验答案(课程ID:1206146813).pdf
文档评论(0)