第二讲音频处理技术基础辩析.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音频处理技术 1.2 多媒体特性与关键技术 声学基本知识 物理学意义上的声音 心理学与生理学意义上的声音 声音信号的数字化过程 采样 量化 数据压缩算法简介 相关标准简介 音频文件格式 音频处理软件 1.1 物理学意义上的声音 声音的本质 声音是由于物体的振动产生的机械波 1.1 物理学意义上的声音 声音的频率 20Hz——20kHz:声波(人耳可闻) 20kHz以上:超声波 20Hz以下:次声波 声音的强度:与声波的振幅成正比 声波在单位时间内作用在与其传递方向垂直的单位面积上的能量 声音的种类 纯音:振幅和频率均为常数的声音 复音:多种不同频率和振幅的混合声音 基音:复印中频率最低的声音,复音的基调 泛音、谐音:其他频率声音的统称 噪音:多频率、多强度的无规律声音 1.1 物理学意义上的声音 声音强度的计量 声强(物理学上常用) 声强是指单位时间(1秒钟)内声音通过垂直于声音传播方向单位面积(cm2)的声能量。 声压(听觉生理学上常用) 声音在空气中传播而改变了空气原来的恒定静压力,导致了原有静压力的微小增加。 1.1 物理学意义上的声音 1 .2 生理及心理学意义上的声音 人耳听到的声音≠自然界的声音 听域(Auditory Area):人耳可闻的声音范围 频率范围:20Hz-20kHz 强度范围:可用声压、声压级、声强、声强级表示 听阈(Auditory Threshold):人耳可闻的最小强度 痛阈:引起人耳疼痛的最小强度 声强与响度的关系 声强:声音强度的客观度量(概念与度量前面已述) 响度:声音强度的主观感受 响度:声音强度的主观感受 响度与声强不是线性关系 声音能量(强度)增加近4倍,主观感觉响度增加1倍 响度与声音能量是一种近似对数关系 响度与频率有关:1000~4000Hz的声音人耳听起来最响 响度的单位为宋(sone) 频率1000Hz,强度为听阈以上40dB(感觉级)的纯音所产生的响度为1sone。 绝对听觉阈限 指一个人在没有噪声的环境下,能够产生听觉,感知到一个纯音信号(某各频率点)的最小能量幅度。通常绝对听觉门限用声压级表示(dB) 人耳的等响度曲线 音调:声音频率的主观感受 音调的高低与频率的高低一致 频率不变,强度的变化对音调稍有影响。 强度增大时,低频率音调显得更低, 而高频率音调显得更高。 音色:人耳对复合音中各种谐音成分总和的主观印象 人耳通过音色区分不同的乐器,如: 基音为100Hz的钢琴声与基音100Hz的黑管声音的 基音频率相同 钢琴有15个泛音(谐音) 黑管有10个泛音(谐音) 声音的掩蔽效应 当两个响度不等的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感知 同时掩蔽(频域掩蔽) 掩蔽声音与被掩蔽声音同时出现 当两个或更多的音频信号到达人内耳时,掩蔽声与被掩蔽声同时作用发生掩蔽效应,就称同时掩蔽。 即在一个临界频带内,一个大的信号可以掩蔽掉若干小的信号,无论这个信号是音调还是噪音。 25个临界频带 异时掩蔽(时域掩蔽) 掩蔽声音与被掩蔽声音不同时出现 一个强音频信号可以掩蔽到之前若干时间和之后若干时间的音频信号的感知,即导前掩蔽或滞后掩蔽 对之前音频信号的掩蔽效应衰减的很快,大概只能掩蔽到几毫秒 对之后音频信号的掩蔽可以持续到最长200ms的时间。 2. 声音信号的数字化过程 从声波到数字音频文件的过程 采样与量化:模数转换的核心 采样(Sampling) 采样:把模拟信号在时间域上以固定的时间间隔对波形的值进行抽取,再用若干位二进制数表示 采样周期:两个取样点之间的间隔称为 采样频率:采样周期的倒数 采样定理:当采样频率大于信号最高频率的两倍时,在采样过程中就不会丢失信息,能不失真地还原出原始的声音信号 若超过此取样频率,就会包含冗余的信息 若低于此频率,则将产生不同程度的失真 对于音频,最常用的采样频率有三种: 44.1KHz 22.05 KHz 11.025 KHz 哪种采样频率产生的数字音频音质最佳?Why? 声道数:声音通道的个数,指一次采样的声音波形个数。 单声道一次采样一个声音波形 双声道一次采样两个声音波形,又称为“立体声”。 量化(Quantity) 量化的目的是将采样后的信号波形的幅度值(样本)进行离散化处理,样本从模拟量转化成了数字量。 量化位数(量化级):用于表示幅度值(样本)的二进制位数 量化位数越多,所得到的量化值越接近原始波形的采样值。 一个量化器就是将整个信号的幅度值分成若干个有限的区间,并且把落入同一个区间的样本点都用同一个幅度值来表示,这个幅度值称为量化值。 均匀量化 非均匀量化 数据率的概念 数据率(比特率): 一秒钟的数字音频信号所需的二进制位数 单位:bp

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档