基于多维参数的语音身份认证系统研究.docVIP

基于多维参数的语音身份认证系统研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多维参数的语音身份认证系统研究

基于多维参数的语音身份认证系统研究 第22卷第4期 2006年7月 齐齐哈尔大学 JournalOfQiqiharUniversity Vo1.22.No.4 July,2006 基于多维参数的语音身份认证系统研究 苗凤娟,陶佰睿 (齐齐哈尔大学通信与电子工程学院.黑龙江齐齐哈尔161006) 摘要:本文研究了与文本相关说话人语音通过多维参数的语音身份认证系统进行身份认证的过程.重点研究T:b 波降噪,语音增强,辅助加权MFCC语音特征提取.混合I-IMM语音辨识的算法及实现问题.试验表明该技术在 认证效率,准确度,自适应性方面有较好表现. 关键词:说话人认证;小波降噪;小波语音增强;特征向量提取;加权MFCC;混合HMM 中图分类号:TPgl1.6文献标识码:A文章编号:1007—984X(2oo6)o4-oo44—03 说话人身份认证是利用表征此人声纹个陛特征参数的一种生物识别技术.它的发展离不开芯片技术, 互联网技术,信号处理及语音技术等的发展,在社会很多行业和部门有广泛应用,但目前成熟的产品比较 少见.更加安全便捷,低廉高效的身份认证方法是目前的研究重点.为此本文在提高系统认证速度,准确 度,自适应性和鲁棒性及并发认证总数方面进行了多种融合算法和实现方面的研究,其工作流程如图1. 涸 1说话人语音预处理 说话人认证系统 图l语音认证系统工作流程 待认证说话人语音拾取环境与语音特征参考模板提取的环境相比有更大的不确定噪声,加上网络传输 的噪声,到服务器解析出来供嵌入式系统识别的数字语音必须经降噪,增强处理才能提高辨识效率.如果 把语音信号短时域能量定义为,短时越零率为,则有: = ∑();=∑Isgn)]一sgn—1)1(疗)m=-8,一8 为短时域能量,为语音信号,m为加窗位置,疗为窗个数,)选择Hanuning窗.在此基础上利用正 交小波基对具有非平稳l生的语音信号实施变换处理,使语音高频部分具有较高的时间分辨率和低频部分有 较大的滤波尺度,结合语音信号功率谱分布的统计自适应地进行清,浊音和噪声的判别,达到语音增强和 降噪的目的.在一定意义上语音降噪与增强也是一种在噪声背景中辨识说话人的技术. 2说话人语音特征提取 说话人身份认证关键是获取能表征个性特征的参数.语音产生的声学模型表明,语音是声源的激励信 号经过声道共鸣最后通过13与腔鼻腔的共鸣辐射生成的.根据汉语特点,普通话中只有2种鼻音声母m和 /I,在全部的4O0多个音节中含有m和/I的分别为53和48个,声调有阴平,阳平,上声,去声和轻声. 因此,本文取含有上述特点并包含说话人基本信息的语音片断作为参考模型库的素材.而认证的文本随机 收稿Et期:2006--04-13 作者简介:苗风娟(1982一).女.黑龙江省齐齐哈尔人.在读硕士研究生.研究方向为Mc,电波与天线,数字信号处理等. 第4期基于多维参数的语音身份认证系统研究 取自该库的某个组合片断.这种方法简化了特征提取时的训练难度,提高了参数的稳定性. MFCC(Me1一FmquencvCepstrumCoemcients)是在Me1标度频域提取的倒谱系数,它与频率的关系可表 示:Me1(7)=l125ln(1+.//700);较好描述了人耳对频率感知的非线性特陛和低频声道的脉冲响应特征,实践表 明大部分隋况下它是一种较好反映语音的特征参数.其特征提取一般分为预加重,分帧(短时平稳10— 30mS1,加窗(Hamming),特征参数,倒谱均值归一化几个步骤.在嵌人系统中,滤波器的个数取Ⅳ,其中 每个i角滤波器的中心频率 Mel(f[i+1])一Mel0C[i]):Mel(f[iJ)一Mel(f[i一1] 通道能量 (N/21.I S[K]=∑[_/]?E[j]k=0,1,2,…,一1 』_U M】C为 , : m ∑-I1g(㈣-c0s(),n:0,1,2,…,一1 k=O1g/ 帧能量:E=ln(Z(x[n卜);帧问动态参数:一阶差分AS,--S,+-—?;二阶差分:△=一, n=0 则特征参数由倒谱系数,帧能量,一二阶差分参数等构成,最后把倒谱均值归一化矢量 = 舯=压 作为说话人语音参考模版数据的主要部分,另一部分为前面小波分析的功率普密度分布数据. 3说话人特征识别 一 个HMM是离散时域有限状态自动机,南许多状态和状态之间的转移弧组成,一般假设内部状态的转 移只与上一状态有关及输出值只与当前状态(或当前的状态转移)有关.它是用双随机过程来描述一个模 式:Marko链,这是基本随机过程,它描述模式内部状态序列;另一随机过程描述状态值和观测值之间的 关系运用HMM模型时要确定链中状态数目Ⅳ,每个状态对应的观测值M,t时刻的观测值0,起始状态分 布概率1『,状态转移概率,观测值概率矩阵.可表示为《m仆D

文档评论(0)

aena45 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档