- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于声音的说话人身份识别技术研究毕业论文
数 字 信 号 处 理 课程设计报告 题目: 基于声音的说话人身份识别技术研究 学院: 信息工程学院 专业: 通信工程 指导教师: XXX 指导时间: 2014.12.22-2014.12.28 目录 一、背景 1 二、设计目的 1 三、设计基本原理 2 1.说话人识别的分类 2 2.说话人识别的基本原理和系统结构 3 四、模式匹配与特征提取 4 1.模式匹配使用方法: 4 2.特征提取 5 2.1 常用的特征参数 5 2.2语音的倒谱分析(MFCC)简介 5 2.3 MFCC倒谱系数及其提取算法 6 2.4 求取MFCC系数的具体算法和步骤 8 五、模式识别及算法优化 11 1. GMM模型的基本概念 11 2. GMM模型的参数估计 12 2.1 EM算法的计算 13 3. 算法优化(MFCC中加入能量信息) 15 六、实验代码及设计分析 16 1.实验代码 16 2.设计分析 16 2.1 问题的分析 17 七、 实验体会及总结 17 八、参考文献 18 一、背景 伴随着全球化、网络化、信息化、数字化时代的到来,我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。传统的以密码为特征的身份认证技术暴露出巨大的弊端,很难满足高安全性和长效安全性的要求,而在生物学和信息科学高度发展的今天,生物认证技术作为一种便捷、先进的信息安全技术已经在现实生活中得到广泛的应用。这是根据人体自身的生理特征(指纹、手形、脸部、虹膜)和行为特征(声音、签名)来识别身份的技术,它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。在信号检测与处理、模式识别、人工智能、机器学习等理论与技术迅速发展的推动下,不久的将来,生物认证技术必将进入一个光辉的时代。比尔盖茨曾经预言“以人类生物特征进行身份验证的生物识别技术,在今后数年内将成为IT产业最为重要的技术革命。” 语音是人的自然属性之一,由于说话人发声器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有特征,不会丢失或遗忘;语音信号的采集方便,系统设备的成本低;另外利用电话网还可以实现远程客户服务等等。近年来,利用语音特征进行身份鉴别的说话人识别(也叫说话人识别)在生物认证技术领域中越来越受到研究者的关注。 二、设计目的 说话人识别(Speaker Recognition),是近年来兴起的一种生物识别技术,说话人识别以其独特的方便性、经济性和准确性等优势受到世人瞩目。近年来,随着科学技术的发展,说话人识别技术已经得到了极大的发展,它在公安侦察、声控系统、医疗诊断、电子金融等行业和领域有着极其广阔的市场应用前景。说话人识别根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份。与语音识别不同,说话人识别技术并不注意语音信号中的语义内容,而是希望从语音信号中提取出个人的信息特征。 说话人识别有几个关键技术:首先是特征选取的问题,从声学或者统计学的角度从声音信号中提取某些特征参数,用这些特征参数来描述说话人的声音特征。其次是识别模型,用机器学习模型去学习、记忆说话人特征,从而达到识别的目的。基于基本说话人识别理论和技术的研究,本文基于Mel倒谱系数(MFCC)语音特征参数,采用人工神经网络作为识别模型,研究设计了一个说话人识别的原型系统。MFCC是目前使用最广泛的语音特征之一,具有计算简单、区分能力好等突出的优点. 三、设计基本原理 1.说话人识别的分类 说话人识别按其最终完成的任务可以分成两类:说话人确认(Speaker Verification,简称SV)和说话人辨识(Speaker Identification,简称SI) 。本质上它们都是根据说话人所说的测试语句或关键词,从中提取与说话人本人特征有关的信息,再与存储的参考模型比较,做出正确的判断。不过说话人确认是确认一个人的身份,只涉及一个特定的参考模型和待识别模式之间的比较,系统只作出“是”或“不是”的二元判决,如下第一幅图所示,可表示为:f(X,i)={0,1 };而对于说话人辨识,系统则需要在一个指定人群当中,确定某测试语音是其中哪一个说话人发出的,有时还要对这个人以外的语音做出拒绝的判别。如下第二幅所示,可表示为:f(x)={ 1,2,......,N},由于需要比较和判决,所以说话人辨识的误识率要说话人确认,并且随着数量的增加,
有哪些信誉好的足球投注网站
文档评论(0)