第三章 语音信号分析频域倒谱线性预测 语音信号处理 课件培训讲解.ppt

第三章 语音信号分析频域倒谱线性预测 语音信号处理 课件培训讲解.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 语音信号分析频域倒谱线性预测 语音信号处理 课件培训讲解.ppt

§3.4 语音信号的频域分析;一、短时傅立叶变换求语音的短时谱;2.短时谱的卷积形式; 为了使 能够与 具有相同的性质,则要求 是一个冲激函数。窗长N越长, 的主瓣越狭窄尖锐,则 越逼近于 。但窗长N太大,窗选信号不满足语音的短时平稳特性, 不能正确反映短时语音的频谱了。为此,必须要合理选择窗长N。;3.短时功率谱和短时谱的关系;汉宁窗;矩形窗;矩形窗;; 从短时频谱图中可知: (1)快速变化,由激励信号引起的; (2)慢速变化,声道滤波器的共振峰特性引起的; (3)采用汉明窗得到的短时频谱较矩形窗平滑,因而在语音分析中汉明窗用得较普遍。;(1). 可以得到基频、共振峰频率等物理量; ;(2). 利用短时功率谱的统计进行有声和无声的检测;;2.临界带频谱特征矢量的求法;;第1临界带;§3.5 语音信号的倒谱分析 ;一、同态信号处理的基本原理; 语音信号x(n)可视为声门激励信息u(n)及声道响应脉冲响应h(n)的卷积:x(n)=u(n)*h(n) 通过处理可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期。;Av;2.同态信号处理的基本原理 ;(2)逆特征系统D*-1[] ,恢复为卷积性信号。;a.第一步和第三步的运算相同。 b.第二步不同,前者是对数运算,后者是指数运算。;特征系统 D*[];线性系统;;(2)第二个子系统对加性信号进行所需要的线性处理(满足线性叠加原理等);二、复倒谱和倒谱;;特征系统;;特征系统;DTFT;2. 倒谱;;3.复倒谱和倒谱的关系;;;; 复倒谱和倒谱具有线性关系。;三、语音信号两个卷积分量的复倒谱;时变数字 滤波器(h(n));(1)发清音时,声门激励是频谱均匀的白噪声。(2)发浊音时,声门激励是以基音为周期的冲激序列。 主要考察浊音时的声门激励信号的复倒谱。;M,r均为正整数;(1)对u(n)进行Z变换;(2)对U(z)取对数,并进行泰勒级数展开;; 结论:一个有限长的周期冲激序列,其复倒谱也是一个周期冲激序列,其周期不变,只是序列变为无限长。同时其振幅随着k的增大而衰减,衰减速度比原序列要快。;n;2.声道冲激响应序列;(2)对H(z)取对数,并进行泰勒级数展开;;(3)对 进行逆Z变换,求得h(n)的复倒谱;; (3)复倒谱衰减速度快,更集中于原点附近,具有短时性 ,用短时窗函数提取声道响应序列的复倒谱是很有效的。 (4)如果h(n)是最小相位序列,即bk=0和dk=0,则复倒谱序列为因果稳定序列。因此,最小相位序列的复倒谱是因果稳定序列。相反,可以得出,最大相位序列的复倒谱是稳定反因果序列。;四、语音信号的倒谱; 由于倒谱和复倒谱之间的线性关系,因此有: (1)ch(n)的性质与h(n)的复倒谱性质一致,主要集中于原点附近。 (2)cu(n)的性质与u(n)的复倒谱性质一致,呈现周期性,并且逐渐衰减。;Np;浊音信号; 图为一帧浊音信号的倒谱。一般人的基音周期的变化范围为2.2ms至20ms之间。若采样频率为22.05kHz,则对应的样点数为:49~441。;清音信号;图为一帧清音信号的倒谱; 由于ch(n)随n增大而迅速递减,在n的间隔很少的值之外已经非常小,如采样频率10kHz, ch(n)在间隔为[-25,25]之外的值已经很小,可忽略。因此,基音信息和声道信息可以认为是分离的。;DTFT;倒谱;Ln|H(ejw)|; 如果h(n)是最小相位序列,即bk=0和dk=0,则复倒谱 序列为因果稳定序列。如果已知ch(n),可以求出 。;逆特征系统 D*-1[]; 倒谱的作用: (1)区分清/浊音 (2)求浊音的基音周期, 可以得到浊音的激励信号。 (3)得到声道的冲激响应h(n); 同态声码器:;Exercises 1.画出语音生成的数学模型,给出相应的表达式,并简单阐述。 2.结合窗函数,说明语音的短时分析技术。 3.常用的基音周期检测的方法有哪些?它们的基本原理是什么? 4.常用的清/浊音判别方法有哪些?它们的基本原理是什么? 5.设序列 (1)求x(n)的复倒谱;(2)大致画出x(n)的倒谱。;DTFT;;五、MEL频率倒谱参数(MFCC);线性频率f; Mel频率带宽随频率的增长而变化,在1000Hz以下,大致呈线性分布,带宽为100Hz左右,在1000Hz以上呈对数增长。将

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档