数字语音处理_短时频域分析教程文件.pptVIP

数字语音处理_短时频域分析教程文件.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字语音处理_短时频域分析教程文件.ppt

第4章 语音信号短时频域分析 ;4.1 概述;定义:短时傅立叶变换也叫短时谱(加窗的方式) 短时谱的特点: 1)时变性:既是角频率ω的函数又是时间n的函数 2)周期性:是关于ω的周期函数,周期为2π;短时傅里叶变换是窗选语音信号的标准傅里叶变换。下标n区别于标准的傅里叶变换。w(n-m)是窗口函数序列。不同的窗口函数序列,将得到不同的傅里叶变换的结果。 短时傅里叶变换有两个自变量:n和ω,所以它既是关于时间n的离散函数,又是关于角频率ω的连续函数。;;; 根据功率谱定义,可以写出短时功率谱与短时 傅里叶变换之间的关系;设信号序列和窗口序列的标准傅里叶变换为 ;用波形乘以窗函数,不仅为了在窗口边缘两端不引起急剧变化,使波形缓慢降为零,而且还相当于对信号谱与窗函数的傅里叶变换进行卷积。 窗函数应具有如下特性: ① 频率分辨率高,即主瓣狭窄、尖锐??(矩形窗) ② 通过卷积,在其他频率成分产生的频谱泄漏少,即旁瓣衰减大。(海明窗) ; 窗口宽度N、取样周期T、频率分辨率Δf三者之间存 在下列关系;窗函数及窗口长度对短时傅里叶变换的影响;其中图(a)是海明窗的窗选信号,图(b)是其对数功率谱;图 (c)是矩形窗下的窗选信号,图(d)是其对数功率谱。 从图 (a)可以明显看出时间波形的周期性,此周期性同样在图(c)中表现出来。图中基频及其谐波在频谱中表现为等频率间隔的窄峰。图(b)中的频谱大约在300~400Hz附近有较强的第一共振峰,而约在2000Hz附近有一个对应于第二、三共振峰的宽峰。此外,还能在3 800Hz附近看到第四个共振峰。最后,由于声门脉冲谱的高频衰减特性,频谱在高频部分表现出下降的趋势。;将图(b)和图(d)比较可看出它们在基音谐波、共振峰结构以及频谱粗略形状上的相似性,同样也能看到其频谱之间的差别。 最明显的是图(d)中基音谐波尖锐度增加,这主要是由于矩形窗频率分辨率较高。 另一差别是矩形窗较高的旁瓣产生了一个类似于噪声的频谱。这是由于相邻谐波的旁瓣在谐波间隔内的相互作用(有时加强有时抵消),因而在谐波间产生了随机变化。这种相邻谐波间不希望有的“泄漏”抵消了其主瓣较窄的优点。;N=50的比较结果(取样率为10KHz,因而窗口持续时间为5ms)。 由于窗口很短,因而时间序列(图(a)和(c))及信号频谱(图(b)和(d))均不能反映信号的周期性。 图中大约在400、1 400及2 200Hz频率上有少量较宽的峰值。比较(b)及(d)的频谱后,再次表明矩形窗可以得到较高的频率分辨率。; 窗口宽度与短时傅里叶变换特性之间的关系: 用窄窗可得到好的时间分辨率; 用宽窗可以得到好的频率分辨率; 但由于采用窗的目的是要限制分析的时间以使其中波形的特性没有显著变化,因而要折衷考虑。 ;x(n)------滤波器的输入 -----该滤波器的输出 w(n) ----------一个滤波器的单位函数响应;图4-4 短时傅里叶变换滤波器解释的第一种形式(a)复数运算;4.3 滤波器的解释一; 令m=n-m′ ; 为窄带低通滤波器。第一种形式为低通滤波器; 由于第二种形式中的滤波器单位函数响应为 ,所以它为带通滤波器。 ; 如果将w(n)的滤波运算除外,短时傅里叶变换实际上是对信号的幅度调制。 第一种形式是在输入端进行调制,x(n)乘以 相当于将x(n)的频谱从ω移到零频处;而w(n)(直角窗或海明窗等)为窄带低通滤波器。 后一种形式是在输出端进行调制,此时先对信号进行带通滤波,滤波器的单位函数响应为w(n) ,而调制后输出的是中心频率为ω的短时谱。; 恢复出x(n)的过程称为短时傅里叶反变换,是由短时谱合成语音信号的问题。 由于 是n和ω的二维函数,因而必须对 在所涉及的两个变量,即时域及频域内进行取样,取样率的选取应保证 不产生混叠失真,从而能够恢复原始语音信号x(n)。 ;当ω为固定值时, 是一个单位函数响应为w(n)的低通滤波器的输出。设低通滤波器的带宽为BHz,则 具有与窗相同的带宽。根据取样定理, 的取样率至少为2B才不致混叠。 低通滤波器的带宽由w(n)的傅里叶变换 的第一个零点位置ω01决定,因而B值取决于窗的形状与长度。 ;直角窗和海明窗的傅里叶变化对应的第一个零点位置分别为: 数字角频率ω与模拟频率F之间的关系为 其中T是信号取样周期,fs是采样率;因而用模拟频率表示的 的带宽为:;

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档