语音信号处理 第4版魏昕 拓展实验.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

MACROBUTTONMTEditEquationSection2SEQMTEqn\r\hSEQMTSec\r1\hSEQMTChap\r4\h实验一语音信号的端点检测实验

一、实验目的

1)了解语音端点检测的重要性和必要性。

2)掌握基于双门限法、相关法、谱熵法、比例法的语音端点检测原理。

3)编程实现基于双门限法、相关法、谱熵法、比例法的语音端点检测函数。

二、实验原理

1.基于双门限法的端点检测原理

语音端点检测本质上是根据语音和噪声的相同参数所表现出的不同特征来进行区分。传统的短时能量和过零率相结合的语音端点检测算法利用短时过零率来检测清音,用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。算法以短时能量检测为主,短时过零率检测为辅。根据语音的统计特性,可以把语音段分为清音、浊音以及静音(包括背景噪声)三种。

(1)短时能量

设第帧语音信号的短时能量用表示,则其计算公式如下:

,

是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即对高电平非常敏感(因为它计算时用的是信号的平方)。

(2)短时过零率

短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。对于连续语音信号,过零即意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值改变符号则称为过零。因此,过零率就是样本改变符号的次数。

定义语音信号的短时过零率为

式中,sgn[·]是符号函数,即,

(3)双门限法

在双门限算法中,短时能量检测可以较好地区分出浊音和静音。对于清音,由于其能量较小,在短时能量检测中会因为低于能量门限而被误判为静音;短时过零率则可以从语音中区分出静音和清音。将两种检测结合起来,就可以检测出语音段(清音和浊音)及静音段。在基于短时能量和过零率的双门限端点检测算法中首先为短时能量和过零率分别确定两个门限,一个为较低的门限,对信号的变化比较敏感,另一个是较高的门限。当低门限被超过时,很有可能是由于很小的噪声所引起的,未必是语音的开始,当高门限被超过并且在接下来的时间段内一直超过低门限时,则意味着语音信号的开始。双门限法是利用二级判决来实现端点检测的,如图1-1所示。

图1-1双门限法端点检测的二级判决示意图

a)语音波形b)短时能量c)短时过零率

双门限法进行端点检测步骤如下:

1)计算信号的短时能量和短时平均过零率。

2)根据语音能量的轮廓选取一个较高的门限,语音信号的能量包络大部分都在此门限之上,这样可以进行一次初判。语音起止点位于该门限与短时能量包络交点和所对应的时间间隔之外。

3)根据背景噪声的能量确定一个较低的门限,并从初判起点往左,从初判终点往右有哪些信誉好的足球投注网站,分别找到能零比曲线第一次与门限相交的2个点和,于是段就是用双门限法所判定的语音段。

4)以短时平均过零率为准,从点往左和往右有哪些信誉好的足球投注网站,找到短时平均过零率低于某阈值的两点和,这便是语音段的起止点。

注意:门限值要通过多次实验来确定,门限都是由背景噪声特性确定的。语音起始段的复杂度特征与结束时的有差异,起始时幅度变化比较大,结束时幅度变化比较缓慢。在进行起止点判决前,通常都要采集若干帧背景噪声并计算其短时能量和短时平均过零率,作为选择和的依据。

2.基于相关法的端点检测原理

(1)短时自相关

自相关函数具有一些性质(如它是偶函数;假设序列具有周期性,则其自相关函数也是同周期的周期函数等)。对于浊音语音可以用自相关函数求出语音波形序列的基音周期。此外,在进行语音信号的线性预测分析时,也要用到自相关函数。

语音信号的短时自相关函数的计算式如下:

这里是最大的延迟点数。

为了避免语音端点检测过程中受到绝对能量带来的影响,把自相关函数进行归一化处理,即用进行归一化,得到

(2)自相关函数最大值法

图1-2和图1-3分别是噪声信号和含噪语音的自相关函数。从图可知,两种信号的自相关函数存在极大的差异,因此可利用这种差别来提取语音端点。根据噪声的情况,设置两个阈值和,当相关函数最大值大于时,便判定是语音;当相关函数最大值大于或小于时,则判定为语音信号的端点。

图1-2噪声信号的自相关函数

a)噪声波形b)噪声的自相关函数

3.基于谱熵的语音端点检测

(1)谱熵特征

所谓熵就是表示信息的有序程度。在信息论中,熵描述了随机事件结局的不确定性,即,一个信息源发出的信号以信息熵作为信息选择和不确定性的度量,是由Shannon引用到信息理论中来的。1998年,ShneJL首次提出基于熵的语音端点检测方法,Shne在实验中发现语音的熵和噪声的熵存在较大的差异,

文档评论(0)

yuzuzou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档