语音信号处理 第4版 课件 第5章:语音信号特征提取技术.pptx

语音信号处理 第4版 课件 第5章:语音信号特征提取技术.pptx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

南京邮电大学通信与信息工程学院第5章语音信号特征提取技术

端点检测基音周期估计共振峰估计

5.1端点检测—概述端点检测:从一段语音信号中准确找出语音信号的起始点和结束点。目的:为了使有效的语音信号和无用的噪声信号得以分离,在语音识别、语音增强、语音编码等系统中得到了广泛应用。主要方法:(1)基于阈值的方法:根据语音信号和噪声信号的不同特征,提取每一段语音信号的特征,然后把这些特征值和设定的阈值进行比较,已到达检测目的。(2)基于模式识别的方法:需要估计语音信号和噪声信号的模型参数来检测。本章主要探讨基于阈值的方法。

5.1端点检测—双门限法复习:短时能量与短时过零率双门限法的基本思想:根据语音的统计特性,可以把语音段分为清音、浊音、静音(包括背景噪声);短时能量可以较好地区分浊音和清音。对于清音,由于其能量较小,在短时能量检测中会因为低于能量门限而被误判为静音;短时过零率则可以从语音中区分静音和清音。将两者结合起来,就可以检测出语音段(清音和浊音)及静音段。首先为短时能量和过零率分别确定两个门限,一个为较低门限,对信号的变化比较敏感,另一个是较高门限。当低门限被超过时,很可能是由于很小的噪声引起的,未必是语音的开始,当高门限被超过并且在接下来的时间段内一直超过低门限时,则意味着语音信号的开始。

5.1端点检测—双门限法双门限法的步骤:(1)计算信号的短时能量和短时平均过零率;(2)根据语音能量的轮廓选取一个较高的门限T2,语音信号的能量大部分都在此门限之上,可进行一次初判。语音起止点位于该门限与短时能量包络交点N3和N4所对应的时间间隔之外。

5.1端点检测—双门限法双门限法的步骤:(3)根据背景噪声的能量确定一个较低的门限T1,并从初判起点往左,从初判终点往右有哪些信誉好的足球投注网站,分别找到语音轮廓与门限T1相交的两个点N2和N5;(4)以短时平均过零率为准,从N2点往左和N5点往右有哪些信誉好的足球投注网站,找到短时平均过零率低于某个阈值T3的两个点N1和N6,作为语音段的起止点。需要注意门限的选取方法

5.1端点检测—自相关法自相关的步骤:(1)计算语音信号的短时自相关函数(2)将自相关函数进行归一化处理:(3)由于语音和噪声两种信号的自相关函数存在极大差异,可以利用这种差异来提取语音端点:根据噪声的情况,设置阈值T1和T2,当相关函数最大值大于T2时,判断为语音;当相关函数最大值大于或小于T1时,判定为语音信号端点。噪声信号及其自相关函数含噪语音及其自相关函数

5.1端点检测—谱熵法熵:衡量信息的有序程度。一个信息源发出的信号以信息熵来作为信息选择和不确定性的度量。语音的熵和噪声的熵存在较大差异,二者在整个信号段中的分布概率不同。谱熵法端点检测就是通过检测谱的平坦程度,达到语音端点检测的目的。谱熵的特点:(1)语音与噪声的谱熵不同;(2)语音谱熵随语音随机性而变化,与能量特征相比,谱熵变化较小;(3)谱熵对噪声具有一定的稳健性。同一语音信号当信噪比降低时,语音信号的谱熵值的形状大体保持不变;(4)语音谱熵只与语音信号随机性有关,而与语音信号的幅度无关。

5.1端点检测—谱熵法谱熵的定义:设加窗分帧处理后的第n帧语音信号为xn(m),其FFT表示为Xn(k),其中k表示为第k条谱线。该语音帧在频域中的短时能量为:而对于某一谱线k的能量谱为,则每个频率分量的归一化谱概率密度函数定义为:该语音帧的短时谱熵定义为

5.1端点检测—谱熵法谱熵法的步骤:(1)对语音信号进行分帧加窗,取FFT点数;(2)计算每一帧的谱的能量;(3)计算每一帧中每个样本点的概率密度函数;(4)计算每一帧的谱熵值;(5)设置判决门限;(6)根据各帧的谱熵值进行端点检测。每一帧的谱熵值为:H(i)计算是基于谱的能量变化而不是谱的能量。

端点检测基音周期估计共振峰估计

5.2基音周期估计概述:基音:发浊音时声带振动所引起的周期性;基音周期:声带振动频率的倒数;声调:基音的变化模式,携带具有辨意作用的信息;人的声道易变性及其声道特征因人而异,基音周期的范围宽,同一个人在不同情态下发音的基音周期也不同,基音周期受单词发音音调影响。基音周期的提取存在困难:(1)声门激励信号不是一个完全周期的序列,有些清音和浊音的过渡帧很难判断其周期性;(2)声道共振峰会严重影响激励信号的谐波结构,因而从语音中直接取出仅和声带振动有关的激励信号并不容易;(3)语音信号本身是准周期性的(音调有变化),其波形的峰值点或过零点受共振峰的结构、噪声等影响;(4)基音周期变化范围大,从老年男性的50Hz到儿童和女性的450Hz。

5.2基音周期估计—自

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档