- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
谱分析的工程应用
学院:浙江大学生物医学工程与仪器科学学院
学 号 学 生 姓 名 :吕志锋
2010年月
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。
声学特征指的是从语音信号中提取出来的某方面的特征或者数值,它能客观的反应语音在某方面的信息或者语音某几方面的相互关系。
声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分语音信息。
在语音以及语音情感识别中使用的特征参数有基频(Pitch)、能量(Energy)、语速(Speech Rate)、共振峰频率(Formant)、单个音节的持续时间(Duration)、音节之间的停顿时间(Pause)、线性预测系数(LPC)、Mel倒谱系数(MFCC)等,以及它们的各种变化形式,如最大值、最小值、均值、范围、变化率等等。这些参数主要体现的是人体的声门和声道的特征,因此和人的生理构造有着密切的关系,在不同的个体上显现出较强的相异性。
1.2 基音检测
人在发浊音(m, n, l ,r等声母, 所有韵母)时,气流通过声门使声带产生张弛振荡式振动,产生一股周期脉冲气流,这一气流激励声道就产生浊音,又称有声意淫,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期称为基音周期。它的大小语音与个人声带的长短、厚薄、韧性和发音习惯有关,还与发音者的年龄、性别、发音力度以及情感有关,是语音识别中的重要参数之一。
基音检测是语音识别的重要方法,它的最终目标是找出与声带振动频率完全一致或者尽量吻合的基音周期变化轨迹曲线。它也广泛应用于其它语音信号的处理过程,比如语音压缩编码和解码、语音情感识别等等。
2 小波检测的基音检测原理
2.1 小波变换
2.1.1一维连续的小波变换
设定义关于的连续小波变换为 (2.1)
定义相应的逆变换为
(2.2)
等式(2.3)右端前面的尺度因子保证小波基函数的范数(norms)全都相等。因为
(2.3)
2.1.2等价形式的小波变换
对于, 定义其小波变换为:
(2.4)
其中 ,s为尺度因子。
如果记 ,取,
则有 成立。其中是符号函数,即当时, =1;当时,=0;当时,=-1。所以这里和式(2.1) 的定义是一致的。但后者可以把小波变换看作输入时系统的响应,而为系统的冲激响应函数。
若取尺度(为整数),则函数在尺度和位置上的小波变换为
(2.5)
其中。
2.1.3 小波变换的优点
(1)小波分解可以覆盖整个频域(提供了一个数学上完备的描述)。
(2)小波变换通过选取合适的滤波器(相对带宽恒定),可以极大的减小或去除所提取得不同特征之间的相关性。
(3)小波变换具有“变焦”特性,在低频段可用高频率分辨率和低时间分辨率(宽分析窗口),在高频段,可用低频率分辨率和高时间分辨率(窄分析窗口)。
2.2突变检测
一个实函数 θ(x) ,我们称为光滑函数,只要满足
O(x)表示x的阶数。光滑函数的能量通常集中在低频段,因此θ(x)也可看成一个低通滤波器的冲激响应。
如果选择小波为光滑函数的一阶导数,即
同样取
则小波变换可以写成
即小波变换Wsf(x)可表示成信号f(x)在尺度s被θs(x)平滑后的一阶导数。由图比较可知小波变换可以有效检测信号f(x)的突变点。
图2 小波突变检测信号突变点
2.3小波变换检测基音周期
2.3.1小波变换检测基音周期原理
人发音时,在声门闭合瞬间,气流会急剧增加,对于在语音波形上即为在该瞬间又一个明显的跳变,可认为是信号的奇异点。每相邻两次声门闭合时间间隔即为瞬态基音周期,而大量瞬态基音周期的均值即为基音周期。
小波变换为检测这类信号突变提供了强有力的工具。由信号的突变检测原理可知,可选择光滑函数的
文档评论(0)