- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音频编码标准和音频文件格式 视讯系统常用的音频编码标准为G.711A/U、G.721、G.722、G.723、G.723.1、G.728、G.729、MP3、AAC等 G.711A/U: 制定者:ITU-T 带宽:64Kbps 特性:都能提供较好的语音质量,占用带宽较高,U律在美国、日本、加拿大等国使用,A律主要在欧洲使用。 分析:都能达到CD级音质,也能达到长途电话的音质 音频编码标准和音频文件格式 G.721: 制定者:ITU-T 带宽:32Kbps 特性:压缩比较高,能够提供2:1的压缩 分析:声音质量一般 G.722: 制定者:ITU-T 带宽:64Kbps 特性:能提供高保真的语音质量 分析:音质好,带宽要求高 音频编码标准和音频文件格式 G.723.1:双速率语音编码算法 制定者:ITU-T 带宽:5.3Kbps 特性:静音压缩技术,能对音乐和语音信号进行压缩 分析:语音质量一般,占用带宽较低 G.723:低码率语音编码算法 制定者:ITU-T 带宽:5.3或6.3Kbps 特性:语音质量接近良,带宽要求低,高效实现 分析:应用于IP电话或语音压缩存储 音频编码标准和音频文件格式 G.729: 制定者:ITU-T 带宽:8Kbps 特性:比特误码、帧丢失和多次转接情况下稳健性良好 分析:语音质量良,应用领域广泛 G.728: 制定者:ITU-T 带宽:8-16Kbps 特性:比其他编码器都要复杂 分析:应用IP电话、卫星通信、语音存储 AAC:先进的音频编码 制定者:MPEG 带宽:96Kbps 特性: 支持1-48路之间任意数目的音频声道组合 分析:支持多种音频声道组合,提供优质的音质 MP3: 制定者:MEPG 带宽:48Kbps 特性:编码复杂,用于高质量声音的传输 分析:支持5.1声道和7.1声道的环绕立体声 音频编码标准和音频文件格式 如需了解更多, 请浏览 Thanks… * 响度的大小决定于发声体振动的振幅,音调的高低决定于发声体振动的频率,音色的不同取决于不同的泛音,每一种乐器、不同的人以及所有能发声的物体发出的声音,除了一个基音外,还有许多不同频率的泛音伴随,正是这些泛音决定了其不同的音色,使人能辨别出是不同的乐器甚至不同的人发出的声音。? (1)低于20 Hz的声音称为次声 (2)频率范围在20?Hz~20?kHz范围的可听声称为音频 (3)频率高于20 kHz的称为超音频(或超声) 人的发音器官发出的声音频段在80Hz到3400Hz之间,人说话的信号频率在300到3000Hz,有的人将该频段的信号称为语音信号。 音频(Audio)是指频率在20Hz~20kHz范围内的可听声音,是多媒体信息中的一种媒体类型——听觉类媒体。目前多媒体计算机中的音频主要有波形音频、CD音频和MIDI音乐3种形式(这3种形式全部都是数字音频,因为计算机所能处理的只有数字信号,所以只能以数字化的方式存储音频数据,如果是模拟式的声音,要首先经过抽样、量化和压缩编码等过程形成数字化音频,再由计算机进行存储及其他操作等)。 反映数字化音频的质量的因素有采样频率、量化位数和声道数3个参数决定。声道个数是指记录声音时,如果每次生成一个声波的数据,称为单声道;每次生成二个声波数据,称为双声道(立体声);每次生成二个以上声波数据,称为多声道(环绕立体声)。 * 采样是每间隔一段时间读取一次声音信号幅度,使声音信号在时间上被离散化。 采样频率:是指将模拟声音波形数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是kHz(千赫兹)。一般来讲,采样频率越高声音失真越小,用于存储数字音频的数据量也越大。奈奎斯特(Nyquist)采样定律:采样频率不应低于声音信号最高频率的两倍,就能把以数字表达的声音还原成原来的声音。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz;高质量声音采样频率为44.1kHz。 量化:就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化。量化位数是每个采样点能够表示的数据范围,常用的有8位、12位和16位。 编码:音频数据压缩编码的方法有多种,可分为无损压缩和有损压缩两大类。无损压缩主要包含各种熵编码;而有损压缩则可分为波形编码、参数编码、感知编码和同时利用多种技术的混合编码,图给出了音频数据压缩编码的主要方法。 波形编码是在模拟音频数字化(抽样和量化)的过程中,根据人耳的听觉特性进行编码,并使编码后的音频信号与原始信号的波形尽可能匹配,实现数据的压缩。 参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,且对这些信息编码,最后在输出端合成原始信号。 混合编码介于波形编码和参数编码之间,集中了这两种
文档评论(0)