- 1、本文档共63页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数字声音 2.1 数字声音基础 2.1.1 音频信号的特征 声音信号由不同的振幅与频率合成而成,称为复音。复音包括基频和谐音,两者决定声音的音质和音色。 规则音频分为语音、音乐和音效。 声音三要素:音调、音强和音色。 基频与音调 谐波与音色 幅度与音强 频带与音宽 2.1.2 声音信号数字化 模拟信号 模拟信号是指幅度随时间连续变化的信号。 数字信号 数子信号是指时间和幅度都是离散的信号,即离散信号,通常是仅含高低电平的“方波”信号。 模拟信号的数字化 PCM(pulse code modulation 脉冲编码调制) 采样:将时间连续信号变为时间不连续信号。 量化:将幅度变为某一最小量的整数倍,即将幅值离散化,量化过程必定产生量化误差。 编码:按一定规律产生二进制位流输出信号。 数字化过程两个主要参数: 采样频率:采样频率遵从采样定理 fs = 2f 或者 Ts= T/2 量化精度:取决于表示一个采样样本值的二进制位数,位数越多,精度越高。 声音 20-20kHz 话音 300-3000Hz 采样频率越高,量化精度越高,声道越多,则声音质量越好,而数字化后的数据量也越大。 每秒声音所占数据量为 采样频率*量化位数*声道数 2.1.3 音频的主要技术参数 声音质量与数据率 44.100次/秒的采样频率值根据以下的原则确定: 人耳能够听见的最高声音频率为20kHz,为了避免高于20 kHz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20 kHz处大约有10%的衰减,因此再将其提高10%成为22kHz。这个值再乘以2就得到 44kHz的采样频率。但是,为了能够与电视信号同步,PAL电视的场扫描为 50 Hz,NTSC电视的场扫描为 60 Hz,所以取50和60的整数倍,选用了44,100Hz(或44.1 kHz)作为激光唱盘声音的采样标准。 采样率为 1,000 Hz、量化等级为 10的采样量化过程 经过D/A转换器得到的信号波形有较大的失真 采样率为2000 Hz、量化等级为40的采样量化过程 采样率为4000 Hz、量化等级为40的采样量化过程 采样频率、量化位数设置 PCM编码 PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。 如果采用相等的量化间隔对采样得到的信号做量化,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化。 改进PCM编码技术的一个方法是采用非均匀量化,即让量化级高度随信号幅度而变化。信号幅度小,则缩小量化级高度,信号幅度大时,则增大量化级高度。这样就可以在满足精度要求的情况下用较少的位数实现编码。在声音数据还原时,采用相同的规则。 在非均匀量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为μ律(μ-Law)压(缩)扩(展)算法,另一种称为A律(A-Law )压(缩)扩(展)算法。这两种算法主要用于数字电话通信中。 音频压缩编码的标准 国际电信联盟(ITU,原 CCITT)先后提出了一系列有关语音压缩编码的建议。 1972年制定了G.711,采用的是μ律或A律的PCM编码技术.数据速率为64 kb/s。 1984年.公布G.721标准.它来用的是ADPCM编码技术.数据速率为32kb/s。 以上两个标准均适用于300Hz--3,400Hz窄带语音信号.也可用于公用电话网。 针对宽带语音信号(50Hz--7kHz),ITU制定了G.722编码标准,它的数据速率为64kb/s,用此标准编码,可在ISDN(综合业务数据网)的B通道上传输音频数据。 ISO(国际标准化组织)也制定了一系列的相应的标准 其运动图像专业组(MPEG)在制定运动图像编码标准的同时,制定了高保真立体声音频压缩标准“MPEG音频”。虽然MPEG声音标准是MPEG标准的一部分,但它同时也完全可以独立应用。MPEG声音压缩算法是第一个高保真声音数据压缩的国际标准。 MPEG音频根据不同的算法分为3个层次。层次1与层次2具有大致相同的算法。MPEG音频的层次3进一步引入了辅助子带、非均匀量化和熵编码等技术,可以进一步提高压缩率。立体声信号的编码也可以在MPEG音频中作为附加功能实现。MPEG音频压缩技术的传输速率为每声道32 kb/s--448kb/s。 2.1.5 数字音频的文件格式 MP3是Internet上流行的音乐格式 MP3 为MPEG Audio Layer 3的缩写,是由ISO/MPE
您可能关注的文档
最近下载
- 中控视频会议室设计方案书.pdf VIP
- 2010年3月北京润枫欣尚项目价格及推售方案.ppt
- 2023年成都理工大学工程技术学院软件工程专业《计算机组成原理》科目期末试卷B(有答案).docx VIP
- 《四肢骨折经典》课件.ppt
- 成都理工大学工程技术学院《线性代数》2018-2019学年第一学期期末试卷.doc VIP
- (必威体育精装版)24年秋统编一年级语文上册口语交际:我会想办法教学设计【精品】.docx
- 胜利油田CCUS技术及应用.docx
- 成都理工大学工程技术学院《线性代数》2021-2022学年第一学期期末试卷.pdf VIP
- 度量衡完整版.ppt
- 成都理工大学工程技术学院《线性代数》2020-2021学年第一学期期末试卷.pdf VIP
文档评论(0)