多媒体技术第二章数字声音教案详解.ppt

下载文档 降价啦

12
0
约8.85千字
约 63页
2017-08-25 发布于湖北
举报
版权申诉
保障服务

多媒体技术第二章数字声音教案详解.ppt

1、本文档共63页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章数字声音 2.1 数字声音基础 2.1.1 音频信号的特征声音信号由不同的振幅与频率合成而成，称为复音。复音包括基频和谐音，两者决定声音的音质和音色。规则音频分为语音、音乐和音效。声音三要素：音调、音强和音色。基频与音调谐波与音色幅度与音强频带与音宽 2.1.2 声音信号数字化模拟信号模拟信号是指幅度随时间连续变化的信号。数字信号数子信号是指时间和幅度都是离散的信号，即离散信号，通常是仅含高低电平的“方波”信号。模拟信号的数字化 PCM(pulse code modulation 脉冲编码调制）采样：将时间连续信号变为时间不连续信号。量化：将幅度变为某一最小量的整数倍，即将幅值离散化，量化过程必定产生量化误差。编码：按一定规律产生二进制位流输出信号。数字化过程两个主要参数：采样频率：采样频率遵从采样定理 fs = 2f 或者 Ts= T/2 量化精度：取决于表示一个采样样本值的二进制位数，位数越多，精度越高。声音 20-20kHz 话音 300-3000Hz 采样频率越高，量化精度越高，声道越多，则声音质量越好，而数字化后的数据量也越大。每秒声音所占数据量为采样频率*量化位数*声道数 2.1.3 音频的主要技术参数声音质量与数据率 44.100次/秒的采样频率值根据以下的原则确定: 人耳能够听见的最高声音频率为20kHz,为了避免高于20 kHz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20 kHz处大约有10％的衰减,因此再将其提高10％成为22kHz。这个值再乘以2就得到 44kHz的采样频率。但是,为了能够与电视信号同步,PAL电视的场扫描为 50 Hz,NTSC电视的场扫描为 60 Hz,所以取50和60的整数倍,选用了44,100Hz(或44.1 kHz)作为激光唱盘声音的采样标准。采样率为 1,000 Hz、量化等级为 10的采样量化过程经过D/A转换器得到的信号波形有较大的失真采样率为2000 Hz、量化等级为40的采样量化过程采样率为4000 Hz、量化等级为40的采样量化过程采样频率、量化位数设置 PCM编码 PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。如果采用相等的量化间隔对采样得到的信号做量化,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化。改进PCM编码技术的一个方法是采用非均匀量化,即让量化级高度随信号幅度而变化。信号幅度小,则缩小量化级高度,信号幅度大时,则增大量化级高度。这样就可以在满足精度要求的情况下用较少的位数实现编码。在声音数据还原时,采用相同的规则。在非均匀量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为μ律(μ-Law)压(缩)扩(展)算法,另一种称为A律(A-Law )压(缩)扩(展)算法。这两种算法主要用于数字电话通信中。音频压缩编码的标准国际电信联盟(ITU,原 CCITT)先后提出了一系列有关语音压缩编码的建议。 1972年制定了G.711,采用的是μ律或A律的PCM编码技术.数据速率为64 kb/s。 1984年.公布G.721标准.它来用的是ADPCM编码技术.数据速率为32kb/s。以上两个标准均适用于300Hz--3,400Hz窄带语音信号.也可用于公用电话网。针对宽带语音信号(50Hz--7kHz),ITU制定了G.722编码标准,它的数据速率为64kb/s,用此标准编码,可在ISDN(综合业务数据网)的B通道上传输音频数据。 ISO(国际标准化组织)也制定了一系列的相应的标准其运动图像专业组(MPEG)在制定运动图像编码标准的同时,制定了高保真立体声音频压缩标准“MPEG音频”。虽然MPEG声音标准是MPEG标准的一部分,但它同时也完全可以独立应用。MPEG声音压缩算法是第一个高保真声音数据压缩的国际标准。 MPEG音频根据不同的算法分为3个层次。层次1与层次2具有大致相同的算法。MPEG音频的层次3进一步引入了辅助子带、非均匀量化和熵编码等技术,可以进一步提高压缩率。立体声信号的编码也可以在MPEG音频中作为附加功能实现。MPEG音频压缩技术的传输速率为每声道32 kb/s--448kb/s。 2.1.5 数字音频的文件格式 MP3是Internet上流行的音乐格式 MP3 为MPEG Audio Layer 3的缩写，是由ISO/MPE