- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
噪声环境下的鲁棒性说话人识别系统研究 姚强* (北京邮电大学信息与通信工程学院,北京 100876) 5 10 15 20 25 摘要:在实际应用中,噪声或信道干扰导致说话人识别( SR) 识别性能急剧下降,针对该问 题,本文提出了一种维纳滤波和倒谱均值归一化(CMN)作为语音信号前端处理,以 MFCC 声道特征及其一阶二阶差分作为特征分别进行高斯混合模型(GMM)训练,再对其融合的方 法来提高说话人识别系统的鲁棒性。实验结果表明,维纳滤波和倒谱均值归一化能够有效地 消除噪声带来的影响,而 MFCC 参数混合建模能够更好地区分说话人,使得噪声环境下系统 能够具备较高的鲁棒性,综合性能得到很大的提高。 关键词:模式识别与智能系统;说话人识别;维纳滤波;倒谱均值归一化;特征混合;鲁棒 性 中图分类号:TN912.3 Robust speaker recognition system in noisy environment Yao Qiang (School of Information and Communication Engineering, Beijing University of Posts and Telecommunications, Beijing 100876) Abstract: In practical applications, noise or channel interference resulted in great degradation in the performance of Speaker Recognition (SR) system,to solve this problem, we proposed a system design which use Wiener filter and cepstral mean normalization (CMN) in the front-end of the SR system. Regard MFCC and firstsecond order MFCC as different features of voice,use the Gaussian mixture model (GMM) train them separately and combined the final score to identify the speaker. The experimental results show that the Wiener filter and cepstral mean normalizationcan effectively weaked the impact of noise, hybrid modeling of the MFCC parameters can help distinguish the speakers better and increase the robustness of the system under noisy environment , the overall performance has been greatly improved. Keywords: Pattern Recognition and Intelligent Systems; speaker recognition; Wiener filter; cepstrum mean normalization; feature fusing; robustness 30 0 引言 对于低噪声环境下的语音,目前说话人识别已能达到较高识别率,但实际应用中,噪声 或者信道干扰会大大降低说话人识别的性能,提高说话人识别系统的鲁棒性至关重要。目前 常用于提高说话人识别性能和鲁棒性的算法可分为三类:语音增强[1]、模型补偿[2]和抗噪声 35 40 的语音特征[3]。其中,语音增强是将噪声环境下的语音进行恢复,尽可能得到受噪声污染前 的语音。模型补偿是根据噪声本身特征,对纯净语音模型参数进行修正,以补偿训练环境与 工作环境之间的差异, 使修正后的语音模型与带噪语音的实际分布尽量接近。抗噪声的语 音特征是指提取对噪声不敏感的说话人识别特征,特征本身就具备一定的鲁棒性,从而能够 在训练后得到较为准确的模型,从而提高最后识别的准确度。本文从语音增强和语音特征融 合两个方面入手,提出来在前端用维纳滤波和倒谱均值归一化(CMN)方法进行语音增强, 去除噪声影响;特征提取部分在已有 Mel 频率倒谱系数(MFCC)基础上加上谱动态特征, 即一阶和二阶 MFCC,得到的特征较传统 MFCC 在噪声环境下具备更高的鲁棒性。并使用 863 语音库和噪
您可能关注的文档
- (1+2)维热非局域介质中表面孤子的研究.doc
- 4.6kPa下乙二醇-三乙二醇二元体系的汽液平衡数据测定及其关联.doc
- 4-RRS冗余球面并联机构的运动学与刚度分析.doc
- Azurin荧光探针的构建、表达及性质研究.doc
- CD44单克隆抗体A3D8通过抑制ERK1_2上调Bim诱导HL-60细胞早期凋亡.doc
- CO2重整CH4反应镍基催化剂稳定性研究进展.doc
- Fe2O3 纳米磁流体热疗治疗小鼠结肠癌实验研究.doc
- Fe-Mn二元复合离子液体协同催化氧化去除二氧化硫的研究.doc
- FQ-PCR同步检测HCV以及HBV方法的建立及应用.doc
- Gouy相位对破缺涡旋光场衍射的影响.doc
最近下载
- (100分)中国石油大学2022秋《红楼梦研究第二阶段在线作业.doc VIP
- 第7节货场平面布置及配置图.PDF VIP
- 8.1功与功率 (教学课件)-高中物理人教版(2019)必修第二册 .pptx VIP
- 海浦蒙特MTCC-V2A经典系列别墅电梯控制柜用户手册-中-V1.0.pdf VIP
- 塔里木油田超深气井产出剖面解释方法研究.pdf
- 2025年上海市青少年活动中心(上海市青年发展服务中心)工作人员公开招聘(第二批)笔试备考题库及答案解析.docx VIP
- 2025北京市公安局公共交通安全保卫总队勤务辅警招聘70人笔试备考试题及答案解析.docx VIP
- BRCGS 包装材料(第七版)文件清单.xlsx VIP
- 生物多样性保护与监测.pdf VIP
- 《探寻非遗漆扇之美》课件.pptx VIP
文档评论(0)