《数字语音处理及MATLAB仿真》课程设计报告.doc

《数字语音处理及MATLAB仿真》课程设计报告.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数字语音处理及MATLAB仿真》 课程设计报告 院 系:电气与信息工程学院 专业班级: 通信工程0902班 学 号: 1 3 姓 名: 齐 泽 建 指导教师: 李 晋 二012年5月27日 目 录 一.实验目的 2 二.实验内容简介 2 三.课程设计原理 2 四.实验步骤 4 五. 实验结论分析 4 六.实验心得 5 一.实验目的 1.学会MATLAB的使用,掌握MATLAB的程序设计方法。 2.掌握语音处理的基本概念、基本理论和基本方法。 3.掌握基于MATLAB编程实现带噪语音信号端点检测MATLAB对信号进行分析和处理。 二.实验内容简介 1. 采集一段语音信号,采样率为8KHZ,量化精度为16比特线性码; 2. 分析帧长30ms(或10ms~50ms); 利用公式分别计算这段语音信号的短时能量、短时平均幅度、短时过零率曲线; 利用(3)中的结果画出短时零能比曲线;(零能比: 即同一时间段内的过零率和能量的比值) 根据上述结果判断找出其中的一帧浊音信号和一帧清音信号,分别计算他们的短时自相关函数和平均幅度差函数; 调整能量门限,设置参数。实现语音端点的检测。 三.课程设计原理 端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果,因此端点检测方法的研究一直是语音信号处理中的热点。传统的短时能量和过零率相结合的语音端点检测算法利用短时过零率来检测清音.用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。算法对于输入信号的检测过程可分为短时能量检测和短时过零率检测两个部分。算法以短时能量检测为主,短时过零率检测为辅。根据语音的统计特性,可以把语音段分为清音、浊音以及静音(包括背景噪声)三种。在本算法中,短时能量检测可以较好地区分出浊音和静音。对于清音,由于其能量较小,在短时能量检测中会因为低于能量门限而被误判为静音;短时过零率则可以从语音中区分出静音和清音。将两种检测结合起来,就可以检测出语音段(清音和浊音)及静音段为: 式中N为窗长,可见短时平均能量为为一帧样点值的甲醛平方和。特殊地,当窗函数为矩形窗时,有 2.短时过零率 过零就是指信号通过零值。过零率就是每秒内信号值通过零值的次数,对于离散时间序列,过零则是指序列取样值改变符号,过零率则是每个样本的改变符号的次数。对于语音信号,则是指在一帧语音中语音信号波形穿过横轴的次数。可以用相邻两个取样改变符号的次数来计算。 如果窗的起点是n=0,短时过零率Z为波形穿过横轴(零电平)的次数 短时过零可以看作信号频率的简单度量,浊音的短时平均幅度最大,无声的短时平均幅度最小,清音的短时过零率最大,无声居中,浊音的短时过零率最小。 短时自相关函数 1)、是偶函数; 2)、s(n)是周期的,那么R(k)也是周期的; 3)、可用于基音周期估计和线性预测分析 4、判断语音信号的起点和终点 利用短时平均幅度和短时过零率可以判断语音信号的起点和终点。语音端点检测方法可采用测试信号的短时能量或短时对数能量、联合过零率等特征参数,并采用双门限判定法来检测语音端点,即利用过零率检测清音,用短时能量检测浊音,两者 配合。首先为短时能量和过零率分别确定两个门限,一个是较低的门限数值较小,对信号的 变化比较敏感,很容易超过;另一个是比较高的门限,数值较大。低门限被超过未必是语音 的开始,有可能是很短的噪声引起的,高门限被超过并且接下来的自定义时间段内的语音超 首先,可根据浊语音情况下短时平均幅度M的概率密度函数P(M/V)确定一个阈值参数MH, MH的值定得比较高。当一帧输入信号的M值超过MH时,就可以十分肯定该帧语音信号不是无声,而有相当大的可能性是浊音由N1’向前和N2’向后继续用短时过零率Z进行有哪些信誉好的足球投注网站。根据无声情况下短时过零率Z的均值,设置一个参数Z0,如果由N1’向前有哪些信誉好的足球投注网站时Z始终大于Z0的3倍,则认为这些信号仍属于语音段,直至Z突然下降到低于3Z0值时,这时可以确定语音的精确起点(为了保证可靠,由N1’ 向前有哪些信誉好的足球投注网站时间不超过25ms)。对终点做同样的处理。采取这一算法的原因在于, N1’以前可能是一段清辅音段(如f,s),它的能量相当弱,依靠能量不可能把他们与无声段区别开,而他们的过零率明显高于无声,因而能用这个参数来精确的判断二者的分割点,也就是语音真正的起点。 四.实验步骤: 1. 用cooledit录了一段音,是我自己说的。采样率为8KHZ,量化精度为16比特线性码。 利用滤波器对信号进行带通滤波,这样可除去大部分共振峰的影响 利用公式分别编程计算这段语音信号的短时能

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档