计算一段语音能量.docVIP

下载本文档

126
0
约2.64千字
约 6页
2017-12-06 发布于江西
举报
版权申诉

计算一段语音能量.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算一段语音能量

%计算一段语音能量 [x,fs,bit]=wavread(d:\voice\daxue.wav); framelength=100; framenumber=fix(length(x)/framelength); for i=1:framenumber; E(i)=0; for j=(framelength*(i-1)+1):1:framelength*(i); E(i)=E(i)+x(j)*x(j); end; end; totaltime=length(x)/fs; for i=1:length(x); pointtime(i)=totaltime*i/length(x); end for i=1:framenumber; frametime(i)=totaltime*i/framenumber; end subplot(2,1,1) plot(pointtime,x); subplot(2,1,2) plot(frametime,E); %计算一段语音的短时过零率 [x,fs,bit]=wavread(d:\voice\daxue.wav); framelength=100; framenumber=fix(length(x)/framelength); for i=1:1:framenumber; Z(i)=0; for j=1:framelength; y(j)=x(framelength*(i-1)+j); end for j=1:framelength-1; Z(i)=Z(i)+sign(y(j+1)-y(j)); end end; totaltime=length(x)/fs; for i=1:length(x); pointtime(i)=totaltime*i/length(x); end for i=1:framenumber; frametime(i)=totaltime*i/framenumber; end subplot(2,1,1) plot(pointtime,x); subplot(2,1,2) plot(frametime,Z); 修正 [x,fs,bit]=wavread(d:\voice\daxue.wav); framelength=100; framenumber=fix(length(x)/framelength); T=x(1); for i=1:1:framenumber; Z(i)=0; for j=1:framelength; y(j)=x(framelength*(i-1)+j); end for j=1:framelength-1; Z(i)=Z(i)+abs(sign(y(j+1)-T)-sign(y(j)-T))+... abs(sign(y(j+1)+T)-sign(y(j)+T)); end end; totaltime=length(x)/fs; for i=1:length(x); pointtime(i)=totaltime*i/length(x); end for i=1:framenumber; frametime(i)=totaltime*i/framenumber; end subplot(2,1,1) plot(pointtime,x); subplot(2,1,2) plot(frametime,Z); 采用联合参数进行端点检测的方案：混叠信号进行分帧处理，求取每一帧的短时能量（M），过零率（Z）以及短时能量与过零率的乘积（MZ）。对信号分帧后求得的所有MZ系数进行如下处理：求取每一帧MZ系数与其相邻的前一帧、后一帧的MZ系数的比值，将两个比值中较大的一个值保留，这一值（K）将作为浊音/非浊音的判别依据。获得所有帧的K系数后，发觉在浊音/非浊音的分割区间该参数会有一个很高的峰值，检测出峰值点后，就检测出了分割端点，参考各端点区域内的短时能量作出清/浊音判定。为了提高分割的精度，再进行如下修正：当某帧被检测为有声区间的起始点后，从该帧的前一帧开始，加入10个动态帧（帧间间隔90%），再重复上述过程。（精度的提高可通过加大帧间间隔来达到目的）。设输入语音分割成M帧，每帧N点，每一短时帧Si，i=1，2，…M。则短时能量：；（3.1）短时平均过零率：；（3.2）短时能量与短时平均过零率的乘积：；（3