- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音编码总结教程
语音编码总结
一、历史与概念
1、模拟的声音信号
话音信号:(口语发声的)200Hz~3400Hz
调幅广播信号:(无线广播)50Hz到7000Hz
调频广播信号:(无线广播)20Hz到16000Hz
激光唱机信号(CD):10Hz~20000Hz
2、话音编码技术的历史回顾
话音编码研究的历史表明,这一领域的研究成果直接为通信产业发展提供了源动力。目前IP电话所用的编码的标准有G.723.1, G.728, G.729。具有低延迟、低码率、低复杂性、高音质的话音编码算法将是未来IP电话网络的奠基石。
3、若干概念术语
(1)数字信号:标称的不连续信号。它可以用离散的步差从一个状态转变到另一个状态。
(2)采样:按周期T对模拟信号进行测量,称为采样。采样频率Fs=1/T.在满足奈奎斯特定理时,从采样值可准确的恢复原信号。
(3)量化
用数字信号表示话音的过程称为量化。
(4)非均匀量化
非均匀量化可以兼顾动态范围和小信号的系统精度。Reeves提出概念。即对大信号取较大的量化步长。对小信号取较小的量化步长。
二、矢量量化
将k个样点构成的有序集(信源矢量集合)映射为M个恢复失量构成的有限集A(码书,码本)中的某个矢量Yi(码字,码元)的映射,称为矢量量化,它是对标量量化在K维空间的一个推广。
标量量化?矢量量化?量化对象?单个采样点?K个采样点?集合划分?在一维幅度轴上划分有限个区间?1=[a0?a1)…?n=[an-1?an)在k维空间里,划分成有限个子空间S={Si|i=1,2,…M}?量化过程?在每个区间里,选一个代表值?fi??i??I=1,2,…n在每个子空间里,选一个代表矢量Yi={Yi1,Yi2,Yii}??Yi??{Si}??i=1,2,…M量化方法?对任一模拟信号,当其标称?值?属于区间?i时,就用数字信号fi代表值?对任一k维模拟信号的矢量。?当其标称值属于子区间Si时,就用代表矢量Yi去量化之。?码本设计的LBG方法
(1)在矢量空间X中,进行最佳划分,即,把X划分成M个子空间Si i=,1.2….m 使平均失真最小。
(2)对划分后的子空间Si求出其形心作为新的最佳代表矢量Yi,从而构成新的码本。将上述步骤反复迭代,最终求出最佳码本和量化器。(3)初始码本的选择:
A、随机选取,迭代时间较长
B、分裂法
(4)LBG方法不是最优化方法,即迭代过程不能保证收敛到全局最小值。 后来有人提出模拟退火法,将LBG方法收敛到局部最小值时,采用某种扰动将迭代过程继续进行下去。
2、空间分布对矢量量化的影响
LBG算法把问题简化为:在矢量空间中,样点的分布是均匀的。但实际的应用场合往往不满足这个前提。因此应考虑空间分布,空间分布对量化值的选择有很重要的影响。对矢量的情况,影响依然存在。
3、语音编码方案的三种类型
语音编码的主要任务:对量化的话音信号施加某种数字变化,使其具有适于数字信道传输的形式,同时尽可能多信号所承载的信息。话音信号的剩余度主要表现在三个方面:
(1)相邻样点存在较强的相关性
(2)对浊音信号存在周期(准周期)性
(3) 信号短时平稳,时不变性
此外,人类听觉对话音有选择效应,即当一个强音与一个弱音同时存在时,人类听觉能够自动抑制弱音的效果,称为人耳的“掩蔽效应”。这些是话音压缩编码的出发点。
3.1 波型编码:对话音信号的每一个样点进行量化、编码和传输。 因此,波型编码是没有延迟的话音编码方案。
3.1.1 差值脉码调制(DPCM和△-调制)
一位的DPCM系统成为△-调制或增量调制DM。流程图如下:
这里,^表示对应的量化值,上标 ~ 表示对应的预测值,用 ei 表示差值di的量化误差。收端恢复的量化信号只与差值信号的量化误差有关,而与预测器性质无关。
(1)当信号变化快时,恢复波形跟不上信号的变化,称为”斜率过载“
(2)对于零信号,DM方法交替输出一串0和1,这种随机交变电平成为“颗粒噪声”。解决办法是在量化器引入自适应阶矩调整机制(ADM)。如果自适应调整依据输入信号,称为前向自适应。如果自适应调整依据是量化器输,称为后向自适应。前向自适应将导致延迟的产生,后向自适应有可能不稳定。
3.1.2 连续可变斜率增量调制(CVSD)
其原理可用下图说明:
当反馈回路中,出现连续四个“1”或连续四个“0”时,表明系统出现斜率过载的情况,此时或门输出一个高电平,驱动触发器改变量化的阶矩的大小,以便适应输入信号的变化。
3.1.3 自适应差值脉码调制(ADPCM)
PCM:非均匀量化。D:调制。差值调制。CVSD:自适应概念
将脉码调制、差值调制和自适应技术三者结合起来。使编码算法不仅适
您可能关注的文档
- 计算机化系统验证及验证文件示例教程.docx
- 设计开发程序和设计开发记录表样教程.doc
- 设计一个异步四位二进制计数器实验报告捞金版教程.doc
- 设计心理学2教程.docx
- 设计施工材料及木地板材料教程.doc
- 设计资格行业认定延期复审申请表教程.doc
- 设计输出轴零件的机械加工工艺规程及钻10×Ф20孔工序的专用夹具教程.doc
- 设计计算书_刘攀_2013010558教程.docx
- 设计说明书-MZ机制101-郜涛-1061401117教程.doc
- 2015必威体育精装版版最思修第六章课件-学习法律.ppt要点.ppt
- 2023年度安全员考试题库检测试题打印附答案详解(达标题).docx
- 2023年度安全员考试题库检测试题打印(实用)附答案详解.docx
- 2023年度安全员考试题库检测试题打印附完整答案详解【名师系列】.docx
- 2023年度安全员考试题库检测试题打印及答案详解【考点梳理】.docx
- 2023年度安全员考试题库检测试题打印附完整答案详解【各地真题】.docx
- 2023年度安全员考试题库检测试题打印附参考答案详解【完整版】.docx
- 2023年度安全员考试高分题库含答案详解(精练).docx
- 2023年度安全员考试高分题库及参考答案详解【能力提升】.docx
- 2023年度安全员考试高分题库附答案详解【典型题】.docx
- 2023年度安全员考试高分题库及参考答案详解(培优B卷).docx
文档评论(0)