- 1、本文档共89页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
03 speechAndAudio
第三章 数字声音及MPEG声音 3.1 声音与听觉器官 声音是通过空气传播的连续的波,叫声波。 声音信号的两个基本参数:频率和幅度。 声音信号是由许多频率不同的信号组成,这个信号称为复合信号,而单一频率的信号称为分量信号。 人的发音器官的发音频率范围大约是80~3400Hz,人说话的信号频率范围通常为300~3000Hz。 频率在20~20KHz的信号称为音频信号,是耳朵可以听到的,小于20Hz的信号称为亚音信号(次音信号),大于20KHz的称为超声波信号。 声音的分类 声音被分为无规则的噪音和有规则的音频信号 有规则音频信号是一种连续变化、周期性的模拟信号,可用一条连续的曲线来表示,称为声波。 波形文件:包括了所有的声音文件。 语音:是波形文件,是一种特殊媒体。 音乐:规范的符号化了的声音,这种符号就是乐谱。 音频的三要素 音调 :声音的高低叫做音调(pitch)。音调与声音的频率有关。 音色 :与波形相关,取决于声波的频谱,即由混入基音的泛音所决定的。 音强 :即声音的响亮程度,与声音信号的幅度成正比。用声音信号幅度取对数后再乘20所得值来描述声强,以分贝(dB)为单位,此时称为音量。 音频质量的度量 客观质量度量——即音频信号的技术指标,如:频带宽度、动态范围和信噪比; 主观质量度量 在音频评价过程中,主观的质量评价较客观的质量评价更为恰当。 客观评价指标 (1)频带宽度 声音信号是由许多频率不同的分量信号组成的复合信号。复合信号的频率范围称为频带宽度。 频带越宽,包含的音频信号越丰富。 客观评价指标 (2)动态范围 音频信号的最大强度与最小强度之比。 D = lg(Power_max/Power_min)*20 动态范围越大,说明音频信号的相对变化范围大,则音响效果越好。 客观评价指标 (3)信噪比 有用信号与噪声之比的简称。 噪音可分为环境噪音和设备噪音 通常信噪比分为系统输入信号的信噪比SNR(in)和系统输出信号的信噪比SNR(out)。 信噪比越大,声音质量越好。 主观度量法 3.2 数字声音 声音信号数字化 实际上就是采样和量化 音频信号数字化 数字化过程:模拟数字转换(A/D)。 采样(sampling):时间上进行离散化处理,即每隔相等的一段时间在声音信号波形曲线上采集一个信号样本。 量化 (quantization):对采样后的声音信号幅值进行离散化处理。如果幅度的划分是等间隔的。 编码:将采样和量化后的数字化声音信息以二进制形式并按照一定的数据格式进行表示。 3.2 数字声音 声音数字化需要回答两个问题: 每秒钟需要采集多少个声音样本,也就是采样频率(f)是多少, 每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。 数字化音频的技术指标 (1)采样频率 单位时间内的采样次数。 奈奎斯特(Harry Nyquist)采样理论:只要采样频率f(1/T)高于输入信号最高频率的两倍,则经过采样后的采样信号能够包含原模拟信号的全部信息,且经过反变换和低通滤波后可不失真地恢复原模拟信号。 电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。CD 激光唱盘采样频率为44.1KHz,可记录的最高音频为22.05KHz。 数字化音频的技术指标 (2)量化精度 对模拟音频信号的幅度进行数字化二进制表示的位数,决定模拟信号数字化后的动态范围。 一般的量化精度为8位或16位。 量化位数越高,信号的动态范围越大,量化精度越高,但所需要的存贮空间也越大。 数字化音频的技术指标 (3)声道数 声道数指的是一次同时产生的声波组数。 1)单声道 缺乏位置感 2)立体声 声音在录制过程中被分配到两个独立的声道,但所占空间比单声道多一倍。 这种技术在音乐欣赏中尤为有用, 依然是许多产品遵循的技术标准。 3)四声道环绕 规定了4个发音点:前左、前右,后左、后右,同时建议增加一个低音音箱,以加强对低频信号的回放处理(4.1声道音箱系统广泛流行的原因)。 4)5.1声道 运用于各类传统影院和家庭影院中,一些知名的声音录制压缩格式,都以5.1声音系统为技术蓝本的。 增加了一个中置单元,负责传送低于80Hz的声音信号,在欣赏影片时有利于加强人声,把对话集中在整个声场的中部,增加整体效果。 5)7.1声道 它在5.1的基础上增加了中左和中右两个发音点。当然由于成本比较高,趋于流行还有待时日。 3.2 数字声音 声音质量与数据率 3.2 数字声音 声音文件的存储格式 Page12 数字音频的文件格式 WAV文件 又称波形文件,是微软公司的音频文件格式。WAV文件来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值转换成二进制数,保存形成波形文件。 使用资源交换文件R
您可能关注的文档
最近下载
- 《膳食营养与肥胖症》课件.pptx VIP
- 2025年佛山市中考英语试题卷(含答案解析).docx
- 燃气公司安全知识安全生产管理人员试题及答案.docx VIP
- 2023年江苏省省级机关医院病案室岗位招聘笔试参考题库含答案详解.pdf VIP
- Unit1+Helping+at+home+Part+B+(5)+Let's+learn+~+Listen+and+chant(课件)-2025-2026学年人教PEP版(2024)英语四年级上册.pptx VIP
- 【劳务派遣人员服务项目】对本项目理解和认识.doc VIP
- 人教版高中生物必修2遗传与进化教材习题答案.pdf VIP
- 2024年普通高中物理课程标准解读.pptx VIP
- 海南省建筑施工现场安全生产-管理资料(一册和二册) .pdf VIP
- 水利水电工程危险源辨识与风险评价导则.pdf VIP
文档评论(0)