- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章-音频信息处理.ppt
第2章 音频信息处理 2.1 音频处理基础 2.2 音频处理软件Adobe Audition 2.3 音频处理综合应用案例 (2)声音信号的心理学特征 人们感知到的声音特征称为心理学特征。 音调:在音乐中又叫音高,是由发声物体的振动频率决定,振动越快(即频率越大),音调越高,振动越慢,音调越低。音调的高低与声音基频的对数(20*log)成线性关系。基频越低,给人的感觉是声音越低沉,基频频率增加一倍,在音乐上就叫升高了一个八度。 音色:这是一个主观评价声音的量,声音的音色取决于声音的频谱结构,一般高次谐波越丰富,音色越明亮并具有穿透力。 响度:人耳对声音强弱的感觉程度,主要取决于振幅和声压。通常振幅越大声音越响,其次人耳距离声源越远,声音越小。 (3)声音质量的评价 声音质量与带宽有关,频率范围越宽,声音质量越高。 1)声音质量分级:按照声音信号的频率范围将声音质量分为5级。 声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的,属于模拟信号。 (1)采样 声音信号在时间轴上的离散化,即每隔相等的一段时间抽取一个信号样本。 采样频率:每秒采样的次数。 奈奎斯特理论(Nyquist theory):采样频率不应低于声音信号最高频率的两倍,这样就能把以数字声音还原成原来的声音,称为无损数字化。 f s = 2 f max 电话话音信号的最高频率约为3.4kHz,所以采样频率取为8kHz。 (2) 量化 将连续的声音信号的幅度离散化。 也就是采样过程中对每一个采样点的幅度值用数字量来表示。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。 采样精度:即量化的位数,位数越多量化等级数也越多,所能表示的声波幅度的动态范围也越大,当然需要的存储空间也越大。 (3) 编码 就是用一组二进制码组来表示每一个有固定电平的量化值,或者说将量化值转换成二进制码组。 典型的音频编码方法:脉冲编码调制法(PCM)。 (4)数字音频的数据量 数据量 = 采样频率* 采样精度* 采样时间* 声道数 / 8 (字节数) 单声道:一次只产生一组声波数据, 立体声:一次产生两组声波数据,分别送往左声道和右声道,根据声音到达人耳的时间差产生空间立体效果,因此立体声声波数据所需存储空间是单声道的一倍。 例2.1 计算一分钟未压缩的高保真立体声数字声音数据的大小。 60 * ( 44100 * 16 * 2 ) / 8 = 10.09 MB 一首未经压缩的4分钟的歌曲文件的大小约为40MB,那么一个容量为512MB的MP3播放器也只能播放12首这样的歌曲。 (1)电话质量的语音压缩标准 (2)调幅广播语音压缩标准:G.722 (3)高保真立体声的宽带音频压缩标准 1.WAV文件:波形文件,微软开发,需要的存储量大,多用于存储简短的声音片段和旁白。 2.MIDI文件:记录的是生成音乐的指令,MIDI文件短小。由于MIDI记录的并不是真正的声音,所以不同的声卡,不同软波表,不同硬件音源的音色是不相同的,相同的MIDI文件在不同的设备上播放也会有不同的效果。MIDI文件适合作为背景音乐来播放。 3.MP3文件:是MPEG音频第3层的简称,有损压缩,压缩比达12:1。MP3利用人耳的掩蔽特性,削减音频中人耳听不到的成分,同时尽可能地维持原来的声音质量。 4.RA文件:属于Real Media的音频部分,采用流式传输方式,可以在非常低的带宽下提供足够好的音质让用户能在线聆听。 5.WMA 文件:Windows Media的音频部分。无损压缩,支持多声道编码。 6.AC3文件:又叫杜比数码环绕立体声,压缩比10:1,提供的环绕声系统由5个全频域声道和1个超低音声道组成,称为5.1声道,一般作为DVD的伴音。 1. 数字音频技术 是一门结合数字技术和计算机技术而实现传统音频处理的技术。 (1) 特点 1)处理长样本文件的能力,录音时间只受硬盘本身大小的限制。 2)随机存取编辑 3)无损编辑 (2)应用 1)声音剪辑和CD刻录。 2)日常音乐录制。 3)大规模音乐录音和混音。 4)影视音乐的制作与合成。 5)多媒体音乐制作与合成。 2)语音识别系统分类 对说话人说话方式的要求 孤立字(词)语音识别系统 连接字语音识别系统 连续语音识别系统。 对说话人的依赖程度 特定人语音识别系统 非特定人语音识别系统 词汇量大小 小
您可能关注的文档
- 电化学分析法 2.ppt
- 电化学原理及应用 2.ppt
- 电化学基础 4.ppt
- 电化学研究方法-005-6.ppt
- 电化学阻抗谱分析 2.ppt
- 电子对抗技术1.ppt
- 电工电子实验及测量实训指导书第一篇.pptx
- 电流变-磁流变.pptx
- 电除尘运行维护和检修-1.ppt
- 界面化学第五章.ppt
- 2025年数字化背景下的乡村生态养殖合作社发展策略报告.docx
- 《会展服务企业品牌建设中的品牌忠诚度培养策略创新与优化策略研究》教学研究课题报告.docx
- 线上职业技能培训平台用户增长与留存策略分析.docx
- 员工管理三类人员试题.pdf
- 第三单元测评卷(单元测试)2024-2025学年四年级数学下册人教版.docx
- 2025年低空经济政策对航空维修行业市场结构的影响报告.docx
- 餐饮门店品牌建设与运营效率分析报告2025.docx
- 2025年跨境电商数据合规性标准与规范研究报告.docx
- 基于科学探究的小学化学实验课程改革探索论文.docx
- 2025年体育产业与文化体育健身服务融合发展的创新实践报告.docx
文档评论(0)