第二章 数字声音及话音编码教材课程.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数字声音及话音编码教材课程.ppt

第二章 数字声音与话音编码;主要内容;导语: 声音是携带信息的极其重要的媒体。 声音的种类繁多。 声音有共同的特性,也有各自的特性。 我们将研究声音的基础知识,掌握声音数字化的两个最基本的概念;了解基本的音频信号编码技术。;声音是通过空气传播的一种连续的波,叫声波。 声音的强弱(音强) 音调的高低(频率) 声波的特性 反射 (reflection)、折射 (refraction)和衍射 (diffraction);声音信号由许多频率不同的信号组成。 带宽: 它用来描述组成复合信号的频率范围。; 人可以从声波中判断出声音的来源、强度以及声音的特殊空间效果。 人是根据三个现象来确定声音的方向: (a)声音在时间上的差别(相位) (b)声音强弱的差别(音量) 声音衰减;声音频率对声音的强度差别有影响。 (c)声音的遮挡效果(阴影) 头部与障碍物的遮挡。 判别声源的其他方法:视觉帮助、声音知识、耳廓等。 声音的方向性是产生立体声效果和空间效果的基础。;音 乐;音强中分贝的定义;声音质量的度量;2.1.2 声音信号数字化;采样(sampling):将声音信号在时间上离散化,比如,每隔相等的一段时间抽取一个信号样本。(均匀采样);;量化(quantization):将连续的信号幅度离散化。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。;采样频率 奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。 f s = 2 f max 例:话音信号最高频率约为3.4kHz,所以采样频率取为8kHz。;采样精度 两种表示方法: 1、每个声音样本的数字化位数反映了声音波形幅度的采样精度。;;人-机通信 计算机接收音频信号。获取、语音识别与理解。 机-人通信 计算机输出音频。音频合成;声音重构、模拟。产生真实感的声音。 人-机-人通信 人通过网络进行语音通信,需要的处理包括:语音采集、编码解码、传输、检索,识别。;  1. 数字音频信号的获取 音频信号的获取框图如下所示。 ;图4-6 音频信号的回放框图;关于信号的几个问题;音频信号处理的流程;2.1.4 电子乐器数字接口系统MIDI ;MIDI标准的特点;MIDI音乐合成方法;由以下五部分组成: 数字载波器 调制器 声音包络发生器 数字运算器 模数转换器;乐音样本合成法;乐音样本合成器的工作原理:;主流的音频格式:; WAV文件   又称波形文件,是Microsoft公司的音频文件格式。Microsoft将WAV文件作为标准格式的文件,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。 WAV文件来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值转换成二进制数。 ;   WAV声音文件是使用RIFF(资源交换文件)的格式描述的,RIFF格式文件是一种带有标记的文件结构,它由文件头和波形音频文件数据块组成。文件头包括标志符、语音特征值、声道特征以及PCM格式类型标志等。数据块是由数据子块标记、数据子块长度和波形音频数据3个数据子块组成。 Wave格式支持MSADPCM、CCITT A_Law、 CCITT μ_Law和其他压缩算法,支持多种音频位数、采样频率和声道。;特点:音质非常好,被大量软件所支持。 缺点:wav文件占用很大的贮存空间。 16bit、44.1Khz采样精度录制的《My heart will go on》为例,5分10秒的长度需要占用近55M的空间 。 适用于:多媒体开发、保存音乐和音效素材; MPEG音频文件——.MP1/.MP2/.MP3 这里指的是MPEG标准中的音频部分,即MPEG音频层(MPEG Audio Layer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层,分别对应MP1、MP2和MP3这三种声音文件; MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1 也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。;MP3;MP3PRO;OGG;WMA;APE; RealAudio文件——.RA/.RM/.RAM RealAudio文件是Real

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档