- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引言
语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和频域等处理方法。语音信号可以认为在短时间内(一般认为在 10~30ms 的短时间内)近似不变, 因而可以将其看作是一个准稳态过程, 即语音信号具有短时平稳性。任何语音信号的分析和处理必须建立在“ 短时” 的基础上, 即进行“ 短时分析”。
时域分析:直接对语音信号的时域波形进行分析,提取的特征参数有短时能量,短时平均过零率,短时自相关函数等。
频域分析:对语音信号采样,并进行傅里叶变换来进行频域分析。主要分析的特征参数:短时谱、倒谱语谱图
图1.1时频域分析设计图
图1.2加噪滤波分析流程图
第二章 语音信号时域分析
语音信号的时域分析可直接对语音信号进行时域波形分析,在此只只针对语音信号的短时能量、短时平均过零率、短时自相关函数进行讨论。
2.1窗口选择
由人类的发生机理可知,语音信号具有短时平稳性,因此在分析讨论中需要对语音信号进行加窗处理进而保证每个短时语音长度为10~30ms。通常选择矩形窗和哈明窗能得到较理想的“短时分析”设计要求。两种窗函数的时域波形如下图2.1所示:
图 矩形窗和Hamming窗的时域波形矩形窗的定义:一个N点的矩形窗函数定义为如下
窗的定义:一个N点的窗函数定义为如下
这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图.2):矩形窗的主瓣宽度小(4*pi/N),具有较高的频率分辨率,旁瓣峰值大(-13.3dB),会导致泄漏现象;明窗的主瓣宽8*pi/N,旁瓣峰值低(-42.7dB),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用明窗,在计算短时能量和平均幅度时通常用矩形窗。表.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。
图.2 矩形窗和窗的频率响应表.1 矩形窗和窗的主瓣宽度和旁瓣峰值
窗函数 主瓣宽度 旁瓣峰值 矩形窗 4*pi/N 13.3dB 8*pi/N 42.7dB
2.2短时能量
短时能量主要分析语音信号能量随时间的变化,由于语音信号的清音和浊音之间能量有较大的差距,进而可通过短时能量对语音的清浊音进行分析。
定义短时能量为 (2.3)
其中N为窗长,当选用矩形窗时则有:
(2.4)
由式(2.3)能量函数反应语音信号的幅度,同时由图2.3~2.4可知窗长对能量函数起着决定性作用。窗长太大,不能反应能量的变化,窗长太小,不能得到平滑的能量函数。
短时能量函数的应用:1)可用于区分清音段与浊音段。值大对应于浊音段,值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据值的变化趋势)。3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,值很小,有语音信号时,能量显著增大。图.3 不同矩形窗长的短时能量函数图.4 不同窗长的短时能量函数短时过零率可以粗略估计语音的频谱特性。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系清音的过零率高,浊音的过零率低。
定义短时平均过零率:
(2.5)
其中为符号函数。在矩形窗条件下,可以简化为 (2.6)
图2.5 矩形窗条件下的短时平均过零率
为某一语音在矩形窗条件下求得的短时能量和短时平均过零率。分析可知:清音的短时能量较低,过零率高,浊音的短时能量较高,过零率低。清音的过零率为0.5左右,浊音的过零率为0.1左右,两但者分布之间有相互交叠的区域,所以单纯依赖于平均过零率来准确判断清浊音是不可能的,在实际应用中往往是采用语音的多个特征参数进行综合判决短时平均过零率的应用:1)区别清音和浊音。例如,清音的过零率高,浊音的过零率低。此外,清音和浊音的两种过零分布都与高斯分布曲线比较吻合。2)从背景噪声中找出语音信号。语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。
自相关函数自相关函数用于衡量信号自身时间波形的相似性。浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,样点间的相似性较差。因此,我们用短时自相关函数来测定语音的相似特性。短时自相关函数定义为:
(2.7)
令,并且,可以得到:
您可能关注的文档
最近下载
- 历史:第4课 经济大危机 课件(人教版九下) (13).ppt VIP
- 上海工程技术大学2020-2021学年度第1学期《概率论与数理统计》期末考试试卷(A卷)及参考答案.docx
- 大理石项目可行性研究报告(参考).docx
- 斜拉桥特大桥监理细则.pptx
- 短视频制作项目教程 课件全套 徐鉴 项目1--7 全面认识短视频 ---原创短视频制作.pptx
- 盆底重建术后护理查房.pptx VIP
- 1.医院社区卫生服务中心全员安全生产责任制(范本).pdf VIP
- 血液灌流采用甲磺酸萘莫司他的抗凝使用.docx VIP
- 原料物性表原料物性表.pdf VIP
- 1.社区卫生服务中心全员安全生产责任清单(完整版).pdf
文档评论(0)