语音信号处理 第4版 第5章 语音信号特征提取技术 思考题答案.docx

语音信号处理 第4版 第5章 语音信号特征提取技术 思考题答案.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第五章语音信号特征提取技术思考题答案

为什么要进行端点检测?端点检测容易受什么因素影响?

语音端点检测是指从一段语音信号中准确地找出语音信号的起始点和结束点,它的目的是为了使有效的语音信号和无用的噪声信号得以分离,因此在语音识别、语音增强、语音编码、回声抵消等系统中得到广泛应用。目前端点检测方法大体上可以分成两类,一类是基于阈值的方法,该方法根据语音信号和噪声信号的不同特征,提取每一段语音信号的特征,然后把这些特征值与设定的阈值进行比较,从而达到语音端点检测的目的。该方法原理简单,运算方便,所以被人们广泛使用。另一类方法是基于模式识别的方法,需要估计语音信号和噪声信号的模型参数来进行检测。由于基于模式识别的方法自身复杂度高,运算量大,因此很难被人们应用到实时语音信号系统中去。

常用的端点检测算法有哪些?各有什么优缺点?

(1)双门限法:在双门限算法中,短时能量检测可以较好地区分出浊音和静音。对于清音,由于其能量较小,在短时能量检测中会因为低于能量门限而被误判为静音;短时过零率则可以从语音中区分出静音和清音。将两种检测结合起来,就可以检测出语音段(清音和浊音)及静音段。在基于短时能量和过零率的双门限端点检测算法中首先为短时能量和过零率分别确定两个门限,一个为较低的门限,对信号的变化比较敏感,另一个是较高的门限。当低门限被超过时,很有可能是由于很小的噪声所引起的,未必是语音的开始,当高门限被超过并且在接下来的时间段内一直超过低门限时,则意味着语音信号的开始。

(2)自相关法:由于噪声信号和含噪语音的自相关函数存在极大的差异,因此可利用这种差别来提取语音端点。根据噪声的情况,设置两个阈值T1和T2,当相关函数最大值大于T2时,便判定是语音;当相关函数最大值大于或小于T1时,则判定为语音信号的端点。

(3)谱熵法:语音信号的谱熵不同于噪声信号的谱熵。与能量特征相比,谱熵的变化是很小的。语音谱熵只与语音信号的随机性有关,而与语音信号的幅度无关,理论上认为只要语音信号的分布不发生变化,那么语音谱熵不会受到语音幅度的影响。另外,由于每个频率分量在求其概率密度函数的时候都经过了归一化处理,所以从这一方面也证明了语音信号的谱熵只会与语音分布有关,而不会与幅度大小有关。

什么叫基音和声调,它们对汉语语音处理有何重要意义?常用的基音周期检测方法有哪些?叙述它们的工作原理和框图。

基音是指发浊音时声带振动所引起的周期性,而基音周期是指声带振动频率的倒数。

基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码、发音系统疾病诊断、听觉残障者的语言指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带非常重要的具有辨意作用的信息。

常用的基音周期检测方法有:自相关法,平均幅度差法,倒谱法,简化逆滤波法。具体请参见教材5.2节各个部分。

为什么要进行基音检测的后处理?在后处理中常用的有哪几种基音轨迹平滑方法?

无论采用哪一种基音检测算法都可能产生基音检测错误,使求得的基音周期轨迹中有一个或几个基音周期估值偏离了正常轨迹(通常是偏离到正常值的2倍或1/2)。这种偏离点称为基音轨迹的“野点”。

为了去除这些野点,可以采用各种平滑算法,其中最常用的是中值平滑算法和线性平滑算法。

为什么共振峰检测有重要意义?常用的共振峰检测方法有哪些?叙述它们的工作原理。

声道可以看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰参数包括共振峰频率和频带宽度,它是区别不同韵母的重要参数。共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。

常用的检测方法包括:带通滤波器组法,倒谱法,线性预测法。具体请参见教材5.3节各个部分。

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档