言语科学基础第二章 语音的时域分析.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
上图绘制的是女声“他去无锡市”的短时能量函数随矩形窗的变化曲线,帧之间无交叠。(采样频率Fs=11025Hz) 2.2 清浊音判别 如图所示,N=50时,短时能量曲线的幅度信息保留较多,不能较好的反映短时能量曲线的包络,而N=400时,短时能量曲线的幅度信息出现损失。 N取值在100-200之间,能够较好的提取短时能量函数曲线的包络,同时,幅度信息的缺失也比较少。 2.2 清浊音判别 结果表明,浊音段的能量En明显高于清音段。 通过设置一个能量门限值,可以大致判定浊音变为清音、清音变为浊音的时刻,同时也可以大致划分浊音区间和清音区间。 2.2 清浊音判别 在信噪比较高的情况下,短时能量还可以作为区分有声和无声的依据。(信噪比:信号和噪声的能量之比。) 在实际应用中,往往采用语音的多个特征参数进行综合判决,其他常用的参数有短时平均幅度、短时平均过零率等。 2.2 清浊音判别 常用的言语分析工具中,一般使用红色来绘制浊音的波形,而清音波形则使用绿色绘制。 清浊音判别结果的表示:浊音的数值为1,清音数值为0;或者浊音的数值为2,清音数值为1,静音(无声)的数值为0。 2.3 基音周期(频率)估计 基音周期估计有很多方法,但是,对各种说话人、不同环境和不同应用领域都能够给出满意结果的估计方法还没有出现。 基音周期估计的困难主要在于语音变化的不确定性和变化性。 2.3 基音周期(频率)估计 这些不确定性和变化性具体表现为(三点): (1)语音常根据不同的发音而发生变化,降低了连续语音段的相关性,特别是在清浊音的过渡段以及基音周期发生抖动的过程,语音波形变化更为剧烈,加上无周期性的清音段语音和背景噪声的影响,给基音周期的检测造成了许多障碍。 2.3 基音周期(频率)估计 (2)即使发音稳定的时候,通过声门的声波幅度大小还是有区别的,如此一来,语音信号相当于进行了调幅处理,也给基音周期的检测带来困难。(这里的调幅是指声门波的幅度被改变。) 2.3 基音周期(频率)估计 (3)不同的人说话的基音频率分布有所不同,男性主要分布在60-200Hz范围内,女性和小孩主要分布在200-450Hz范围内,基音检测所跨频率范围比较大,必然会降低基音检测的准确性。 2.3 基音周期(频率)估计 本节介绍的是采用短时自相关函数来估计基音周期的方法。 自相关函数用于衡量信号自身时间波形的相似性。浊音的时间波形呈现一定的周期性,波形之间的相似性较好;清音的时间波形呈现出随机噪声的特性,采样点之间的相似性较差,因此,可用短时自相关函数来测定语音的相似特性。 2.3 基音周期(频率)估计 对于时间离散确定信号,自相关函数定义为: 自相关函数具备以下性质,这些性质在语音的时域分析中经常用到: (1)周期性。周期为Np的信号,其自相关函数是一个周期相同的周期函数,即 2.3 基音周期(频率)估计 (2)对称性。 (3)存在最大值。对所有k有: (4)对确定信号,R(0)值等于信号能量。 2.3 基音周期(频率)估计 结合前面提到的语音短时处理方法: 这里T[ ]为自相关计算,那么得到的Qn就是短时自相关函数: 2.3 基音周期(频率)估计 上式可以理解为,求解位于n点的窗函数选取的短时语音x(m)ω(n-m)的自相关值,就是 Rn(k)。 研究表明,短时自相关函数在基音周期的整数倍位置存在较大的峰值。如果找出第一个最大峰值所在的位置就可以估计出基音周期。 2.3 基音周期(频率)估计 值得注意的是,窗函数的窗长N选取对基音周期估计的结果影响很大。 一方面,窗长N取的太小,无法覆盖一个完整的语音周期,也就得不到预期的基音周期;另一方面,窗长N取的太大,自相关函数会将多个基音周期作平均计算,从而模糊语音的短时特性。 因此,实际应用中常使用修正的短时自相关函数,原理基本类似,只是窗函数的选取原则更为复杂。 作业 (1)设序列x(n)的短时能量定义为: 其中,窗函数表示为 ,试求En的一个递推公式,用 和输入x(n)表示En(写出推导过程) 作业 (2)浊音和清音的短时能量、短时自相关函数有什么差异?导致这些差异的根本原因是什么? Thank you! 言语科学基础 二零一三年 五月 司博宇 华东师范大学言语听觉科学专业 第二章 语音的时域分析 语音分析的常见图谱 语音/a/的波形图 语音分析的常见图谱 语音/a/的清浊音判别 语音分析的常见图谱 语音/a/的基频曲线 语音分析的常见图谱 语音/a/的强度曲线 语音分析的常见图谱 语音/a/的语谱图 学习目标 语音短时分析 清浊音判别 基音周期(频率)估计 2.1 语音短时分析 语音是一种非平稳的时变信号。语音分析方法可以分为时域和变换域(频域、倒谱域)等处理方法。 其中,时域方法是

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档