- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号的端点检测
实验一 语音信号的端点检测 一、实验目的 1、掌握短时能量的求解方法 2、掌握短时平均过零率的求解方法 3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。 二、仪器设备 HP计算机、Matlab软件 三、实验原理 3.1、短时能量 3.1.1、原理:语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。 语音信号的短时能量定义: 3.1.2、短时能量序列反映了语音振幅或能量随着时间缓慢变化的规律。从原始语音信号图中可以看到语音信号幅度随时间有相当大的变化,特别是清音段的幅度一般比浊音段的幅度小很多,语音信号的短时能量给出了反映这些幅度变化的一个合适的描述方法。 短时平均幅度函数和能量函数的作用 (1)区分清/浊音。 En、Mn大,对应浊音; En、Mn小,对应清音。 (2)在信噪比高的情况下,能进行有声/无声判决。 无声时,背景噪声的En、Mn小; 有声时,En、Mn显著增大。判决时可设置一个门限。 大致能定出浊音变为清音的时刻,或反之。 短时过零 窄带信号,平均过零数作为信号频率的一种简单度量是很精确的,语音信号序列是宽带信号, 则不能简单用上面的公式,但是可以用短时平均过零数来得到频谱的粗略估计。 3.2.2、短时过零分析的意义: 可以区分清音与浊音:浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。 利用它可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。 在背景噪声较小时用平均能量识别较为有效,而在背景噪声较大时用平均过零数识别较为有效。 浊音的短时平均幅度最大,过零率最低 (2)无声的短时平均幅度最低,过零率居中 (3)清音短时平均幅度居中,过零率最高 实验程序: 端点检测: [x,fs,nbits]=wavread(1.wav);%语音信号的端点检测matlab实现 x = x / max(abs(x));%幅度归一化到[-1,1] %参数设置 FrameLen = 256; %帧长 inc = 90; %未重叠部分 amp1 = 10; %短时能量阈值 amp2 = 2; zcr1 = 10; %过零率阈值 zcr2 = 5; minsilence = 6; %用无声的长度来判断语音是否结束 minlen = 15; %判断是语音的最小长度 status = 0; %记录语音段的状态 count = 0; %语音序列的长度 silence = 0; %无声的长度 %计算过零率 tmp1 = enframe(x(1:end-1), FrameLen,inc); tmp2 = enframe(x(2:end) , FrameLen,inc); signs = (tmp1.*tmp2)0; diffs = (tmp1 -tmp2)0.02; zcr = sum(signs.*diffs,2); %计算短时能量 amp = sum((abs(enframe(filter([1 -0.9375], 1, x), FrameLen, inc))).^2, 2); %调整能量门限 amp1 = min(amp1, max(amp)/4); amp2 = min(amp2, max(amp)/8); %开始端点检测 for n=1:length(zcr) goto = 0; switch status case {0,1} % 0 = 静音, 1 = 可能开始 if amp(n) amp1 % 确信进入语音段 x1 = max(n-count-1,1); % 记录语音段的起始点 status = 2; silence = 0; count = count + 1; elseif amp(n) amp2 || zcr(n) zcr2 % 可能处于语音段 status = 1; count = count + 1; else % 静音状态 status = 0; count = 0; end case 2, % 2 = 语音段 if amp(n) amp2 ||zcr(n) zcr2 % 保持在语音段
您可能关注的文档
最近下载
- CJ_T 123-2016 给水用钢骨架聚乙烯塑料复合管.docx VIP
- 哲学与人生第5课第二框课件《用发展的观点处理人生的问题》.pptx VIP
- 双梁桥式起重机结构设计--毕业论文设计.doc VIP
- 2025年保安员(初级)证考试试题库(答案+解析).docx
- 中医科会诊单.docx VIP
- 《猜猜他是谁》三年级作文,300字的优秀作文.doc VIP
- 课题申报书:基于项目化学习的小学劳动教育跨学科实施研究.docx
- 《石灰工业大气污染物排放标准》DB13 1641-2025.docx VIP
- 绿色水浒传之鲁智深人物介绍PPT模板.pptx
- 招商银行2025秋招笔试真题试卷及答案解析 .pdf VIP
文档评论(0)