数字音频技术基础.pptVIP

下载本文档

2
0
约1.67万字
约 127页
2024-11-02 发布于北京
举报
版权申诉

数字音频技术基础.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

***音频编码的分类（1）基于音频数据的统计特性进行编码典型技术：波形编码目标：重建语音波形保持原波形的形状。编码方法时域法：以下均为预测编码PCM（脉冲编码调制）、DPCM（差分脉冲编码调制）APCM（自适应脉冲编码调制）、ADPCM（自适应差分脉冲编码调制）等。频域法（变换编码）：SBC（子带编码）、ATC（自适应变换编码）、小波编码等。特点：适应性强，音频质量好，但压缩比不高，因而数据率较高音频编码的分类（2）基于音频的声学参数进行参数编码原理：从语音波形信号中提取参数，通过语音生成模型重构语音。目标：保持原音频的特性。常用参数：共振峰、线性预测系数、滤波器组等。特点：数据率低，必威体育官网网址性好（用于军事）；还原信号质量较差，自然度低。混合编码：结合（1）和（2）特点：能在较低的码率上得到较高的音质。方法：AbS（时域合成－分析编译码器）、MPE（多脉冲激励编译码器）、RPE（等间隔脉冲激励）CELP（码本激励线性预测编码）、MPLPC（多脉冲激励线性预测编码）音频编码的分类（3）基于人的听觉特性进行编码原理：从人的听觉系统出发，利用掩蔽效应，设计心理学模型，从而实现更高效率的数学音频的压缩。方法：从MPEG标准中的高频编码、DolbyAC－3CCITT(国际电报电话顾问委员会)、ISO（国际标准化组织）分类算法名称数据率标准应用质量波形编码PCM均匀量化公共网ISDN配音4.0-4.5?(A)?(A)64kb/sG.711APCM自适应量化DPCM差分量化ADPCM自适应差分32G.721SB-ADPCM子带－自适应差分64G.7225.3/6.3G.723参数编码LPC线性预测2.4必威体育官网网址话声2.3-2.5混合编码CELPC码激励LPC4.6移动通信4.0-4.7VSELP矢量和激励LPC8语音邮件RPE-LTP长时预测规则码激励13.2ISDNLD-CELP低延时码激励LPC16G.728/9MPEG多子带感知128CD5.0听觉编码AC-3感知编码音响5.0音频编码标准音频压缩技术标准分类标准说明电话语音质量G.711采样8kHz，量化8bit，码率64kbpsG.721采用ADPCM编码，码率32kbpsG.723采用ADPCM有损压缩，码率24kbpsG.728采用LD-CELP压缩技术，码率16kbps调幅广播质量G.722采样16kHz，量化14bit，码率224(64)kbps高保真立体声MPEG音频采样44.1kHz，量化16bit，码率705kbps(MPEG三个压缩层次，384-64kbps)语音合成技术指利用计算机合成语音的一种技术，使计算机能够产生高清晰度、高自然度的连续语音，具有类似于人一样的说话的能力。语音合成技术可以通过将预先录制并存储的语音信号重新播放来实现，或者采用数字信号处理的方法，生成各种音调的语音。文字到语音的合成（Text-To-Speech）概念到语音的合成（Concept-To-Speech）意向到语音的合成（Intention-To-Speech）常用的语音合成方法参数合成法通过调整合成器参数实现语音合成。基音同步叠加法对时域波形拼接实现语音合成，在音色和自然度方面相比参数合成法有很大程度提高基于数据库的语音合成方法采用预先录制各种可能语境下的语音单元并保存在数据库中，建立一个庞大的语音数据库。再从数据库中选择并拼接出各种语音内容。由于声音来源于自然音，因此清晰度和自然度都非常高。语音合成的技术方式波形编辑合成参数分析合成规则合成语音合成技术特点自然度清晰度表现力复杂度语音识别技术语音识别的发展历史1952：Bell实验室研制可识别十个英文

数字的语音识别器-Audry系统。60-80:动态规划(DP)、线性预测(LP)、

矢量量化(VQ)、隐马尔可夫模型、

人工神经元网络(ANN)。1988：卡内基-梅隆大学研制SPHINX系统

非特定人、大词汇量、连续语音。1997：IBM公司开发出汉语ViaVoice语音

识别系统。ViaVoice98-地方口音语音识别技术语音识别的基本原理三、语音识别系统的分类1.根据词汇量大小小词汇量语音识别系统：几十词中词汇量语音识别系统：几百词大词汇量语音识别系统：几千-几万词语音识别技