音频技术探析.ppt

下载文档 降价啦

32
0
约9.9千字
约 26页
2017-09-21 发布于河南
举报
版权申诉
保障服务

音频技术探析.ppt

1、本文档共26页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

音频编码标准和音频文件格式视讯系统常用的音频编码标准为G.711A/U、G.721、G.722、G.723、G.723.1、G.728、G.729、MP3、AAC等 G.711A/U：制定者：ITU-T 带宽：64Kbps 特性：都能提供较好的语音质量，占用带宽较高，U律在美国、日本、加拿大等国使用，A律主要在欧洲使用。分析：都能达到CD级音质，也能达到长途电话的音质音频编码标准和音频文件格式 G.721：制定者：ITU-T 带宽：32Kbps 特性：压缩比较高，能够提供2：1的压缩分析：声音质量一般 G.722：制定者：ITU-T 带宽：64Kbps 特性：能提供高保真的语音质量分析：音质好，带宽要求高音频编码标准和音频文件格式 G.723.1：双速率语音编码算法制定者：ITU-T 带宽：5.3Kbps 特性：静音压缩技术，能对音乐和语音信号进行压缩分析：语音质量一般，占用带宽较低 G.723：低码率语音编码算法制定者：ITU-T 带宽：5.3或6.3Kbps 特性：语音质量接近良，带宽要求低，高效实现分析：应用于IP电话或语音压缩存储音频编码标准和音频文件格式 G.729：制定者：ITU-T 带宽：8Kbps 特性：比特误码、帧丢失和多次转接情况下稳健性良好分析：语音质量良，应用领域广泛 G.728：制定者：ITU-T 带宽：8-16Kbps 特性：比其他编码器都要复杂分析：应用IP电话、卫星通信、语音存储 AAC：先进的音频编码制定者：MPEG 带宽：96Kbps 特性: 支持1-48路之间任意数目的音频声道组合分析：支持多种音频声道组合，提供优质的音质 MP3：制定者：MEPG 带宽：48Kbps 特性：编码复杂，用于高质量声音的传输分析：支持5.1声道和7.1声道的环绕立体声音频编码标准和音频文件格式如需了解更多，请浏览 Thanks… * 响度的大小决定于发声体振动的振幅，音调的高低决定于发声体振动的频率，音色的不同取决于不同的泛音，每一种乐器、不同的人以及所有能发声的物体发出的声音，除了一个基音外，还有许多不同频率的泛音伴随，正是这些泛音决定了其不同的音色，使人能辨别出是不同的乐器甚至不同的人发出的声音。? （1）低于20 Hz的声音称为次声（2）频率范围在20?Hz～20?kHz范围的可听声称为音频（3）频率高于20 kHz的称为超音频（或超声）人的发音器官发出的声音频段在80Hz到3400Hz之间，人说话的信号频率在300到3000Hz，有的人将该频段的信号称为语音信号。音频（Audio）是指频率在20Hz～20kHz范围内的可听声音，是多媒体信息中的一种媒体类型——听觉类媒体。目前多媒体计算机中的音频主要有波形音频、CD音频和MIDI音乐3种形式（这3种形式全部都是数字音频，因为计算机所能处理的只有数字信号，所以只能以数字化的方式存储音频数据，如果是模拟式的声音，要首先经过抽样、量化和压缩编码等过程形成数字化音频，再由计算机进行存储及其他操作等）。反映数字化音频的质量的因素有采样频率、量化位数和声道数3个参数决定。声道个数是指记录声音时，如果每次生成一个声波的数据，称为单声道；每次生成二个声波数据，称为双声道（立体声）；每次生成二个以上声波数据，称为多声道（环绕立体声）。 * 采样是每间隔一段时间读取一次声音信号幅度，使声音信号在时间上被离散化。采样频率：是指将模拟声音波形数字化时，每秒钟所抽取声波幅度样本的次数，其计算单位是kHz(千赫兹)。一般来讲，采样频率越高声音失真越小，用于存储数字音频的数据量也越大。奈奎斯特(Nyquist)采样定律：采样频率不应低于声音信号最高频率的两倍，就能把以数字表达的声音还原成原来的声音。例如，电话话音的信号频率约为3.4kHz，采样频率就选为8kHz；高质量声音采样频率为44.1kHz。量化：就是把采样得到的声音信号幅度转换为数字值，是声音信号在幅度上被离散化。量化位数是每个采样点能够表示的数据范围，常用的有8位、12位和16位。编码：音频数据压缩编码的方法有多种，可分为无损压缩和有损压缩两大类。无损压缩主要包含各种熵编码；而有损压缩则可分为波形编码、参数编码、感知编码和同时利用多种技术的混合编码，图给出了音频数据压缩编码的主要方法。波形编码是在模拟音频数字化（抽样和量化）的过程中，根据人耳的听觉特性进行编码，并使编码后的音频信号与原始信号的波形尽可能匹配，实现数据的压缩。参数编码把音频信号表示成某种模型的输出，利用特征提取的方法抽取必要的模型参数和激励信号的信息，且对这些信息编码，最后在输出端合成原始信号。混合编码介于波形编码和参数编码之间，集中了这两种