基于DSP的语音分析系统.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.2.1原始声音以及预处理 语音处理的音源,也是整个系统的输入部分。就当前来说语音处理汉字比较多。 对音源进行必要和适当的处理。一般来说这个部分包括,高、低通的滤波电路和反混叠带通滤波、模数变换、分帧、预加重处理等目的为了消除外部环境对音源带来的干扰;另外预处理还包含了A/D转换部分,以及语音端点检测等。 计算机分析人的语音,需要将通过话筒中传来的语音信号转换成计算机所能处理处理的数字信号;根据采样定理,信号的采样频率要求大于信号带宽的两倍以上 即可保证信号的采集不会丢失信息。 低通滤波器的作用是除去语音信号中频分量超过采样频率一半()的那部分,其目的是为了防止采样信号的混叠。具体实现方式我们可以设计一个16阶FIR 有限冲激响应 滤波器来实现对语音信号的滤波。关于滤波部分将在后面章节具体介绍。 2.2.2语音信号的特征提取 特征提取是运用语音分析的方法对输入的原始声音进行分析得到一个矢量序列,并用这个矢量序列去代替原始的语音信号所携带的信息。其中包括一些常用的参数:比如短时能量、频谱参数、自相关参数等等。 原始语音信号不能直接用语模板训练和模式匹配,这是因为:1、原始语音信号数据量太大,系统的运算和存储负担过重;2、原始语音信号包含太多的随机因素,极大的影响了系统的识别处理率。 语音处理系统进行模板训练和匹配的数据是从预处理后的语音信号中提取的特征参数。通过预处理和特征参数提取技术,一方面使得进行模板训练和模式匹配的数据特征明显,提高了系统的识别处理率;另一方面进行了信息压缩,降低了系统的运算和存储量;特征参数提取就是从语音信号提取 或测量 有代表性的、合适的特征参数,同时进行适当的数据压缩;时域参数的优点是计算量比较少,对于区别语音段和静音段及清/浊音段比较方便,效果也比较明显;但由于人的耳朵对声音的频域特性比较敏感,时域参数不能恰当的反映这种特征。 线性预测分析法是目前很有效的语音分析技术之一,它在语音处理、合成等方面都得到了成功的应用。 线性预测分析所包括的基本概念是,一个语音抽样能够用过去若干个语音抽样的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的平方和 在一个有限间隔上 达到最小值,能够决定唯一的一组预测器系数。 LPC倒谱系数也就是是复倒谱。复倒谱是信号通过Z变换以后取对数,再求反Z变换而得到的;线性预测分析方法是一种谱估计的方法,而且其声道模型系统函数H Z 反映了声道的频率响应和原始信号的谱包络,因此用logH z 做反Z变换即可求出其复倒谱系数。该复倒谱系数是根据线性预测模型直接得到的,因此又称之为LPC倒谱系数 LPCC 。 基于LPC分析的倒谱存在一种非常简单有效的递推求解方法;也就是说,线性预测系数可以用递推公式求出响应的倒谱系数。 2.2.3线性预测分析的基本原理 假若一个随机过程用一个P阶的全极点系统受白噪声激励而产生的输出来模拟,设这个系统的传递函数为: (2-19) 其中G为常数,S z 和V z 分别为输出信号s H 和输入信号u n 的z变换, 那么S n 和u n 的关系可以表示为差分方程: (2-20) 我们可以把式 2-20 中与有关的部分理解为有用信号的p个样本来预测当前样本,即定义预测器: (2-21) 由于预测系数a。在预测过程中看作常数,所以它是一种线性的预测器,这种线性预测最早是用于语音编码的,因此人们也常常称之为LPC 即Linear Predictive Coding ,这个线性预测器的系统函数为: (2-22) 显然,如果信号s n 能精确的符合 2-19 和 2-20 所描述的模型假定,那么用公式 2-21 所示的线性预测器信号s n 的预测误差应为: 2-23 但是,实际信号未必能精确的符合这个假定,因此实际的预测误差应为: 2-24 表明预测误差序列是信号S n 通过一个具有如下系统函数的系统产生的输出: (2-25) 比较式 2-21 和 225 可以看出,预测误差滤波器爿 z 是系统H z 的逆滤波器,其中可以表示成: 2-26 线性预测分析的基本问题是由语音信号直接决定~组预测器系数,它的原则是通过应用式 2-26 可对语音谱的性质得到良好的估计。由于语音信号的时变特性,预测器系数的估值必须在一段语音信号中进行。基本的途径是求出一组预测器系数使得在一段短时语音波形中均方预测误差最小。所得到的参数就被“认为”是语音产生模型中系统函数H z 的参数。 由于给定的只有信号和一个

文档评论(0)

文彩飞扬 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档