数字信号处理课程设计基于声音说话人身份识别技术研究.docVIP

数字信号处理课程设计基于声音说话人身份识别技术研究.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字信号处理课程设计基于声音说话人身份识别技术研究

数 字 信 号 处 理 课程设计报告 题目: 基于声音的说话人身份识别技术研究 学院: 信 息 工 程 学 院 专业: 通 信 工 程 指导教师: 指导时间: 2014.12 目录 1、背景 - 4 - 2、设计目的 - 4 - 3、设计原理 - 5 - 3.1 语音识别技术的分类 - 5 - 3.2 Mel频率倒谱系数 - 6 - 3.2.1 Mel频率倒谱系数基本原理 - 6 - 3.2.2 MFCC的提取流程 - 7 - 3.3 矢量量化 - 9 - 3.3.1 矢量量化的简单介绍 - 9 - 3.3.2 矢量量化的定义 - 9 - 3.3.3 矢量量化的基本原理 - 10 - 3.4 矢量量化的失真测度 - 11 - 3.4.1 欧氏距离--均方误差 - 11 - 3.5 识别失真度 - 12 - 4、设计过程 - 13 - 4.1、实验技术路线图 - 13 - 4.2、实验结果测试图 - 14 - 5、实验代码与结果分析 - 15 - 5.1、MATLAB源程序 - 15 - GUI界面: - 15 - 测试程序 - 17 - Mel倒频谱系数函数 - 18 - 库函数 - 19 - 滤波程序 - 20 - 录音程序 - 20 - 5.2、实验结果分析 - 21 - 6、实验体会和总结 - 22 - 7、文献 - 23 - 1、背景 随着信息化的迅速发展,人们对身份识别技术的需求越来越多,并对其安全性和可靠性的要求也越来越高。基于传统密码认证的身份识别技术在实际信息网络应用中已经暴露出许多不足之处,而基于生物特征辨别的身份识别技术近年来也日益成熟并在实际应用中展现出极大的优越性。作为生物特征认证的一个重要分支,语音识别同指纹识别、人脸识别、虹膜识别一样,一直以来都是研究者们关注和探索的热点之一。 语音识别技术也成为了近年的研究热点,有不少实用化的技术成果被商家成功推向了市场,让人们看到了它在PDA、智能家电、工业控制等领域的广阔发展前景。例如现在国内在语音方面做的最好的就是科大讯飞股份有限公司,?科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。语音识别技术有很大可能产生新的服务,给人们的工作和生活带来非常可观的方便。 我国语音识别研究工作起步于五十年代。近年来国内研究水平也从实验室逐步走向实用。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。 2、设计目的 每个人都有自己特有的发音器官和特有的说话习惯,这些差异都式反映在说话人语音信号的波形中,且比较复杂,使得每个人的发音都伴有浓重的个人色彩,这是说话人识别得以实现的客观保证。说话入识别涉及到人的发音器官、说话习惯、语言构造和发声原理等多方面的内容,它综合了生理学、语音学、数字信号处理、模式识别、人工智能等学科知识,有着广阔的市场应用前景。通过说话人识别技术,可以实现用语音信息进行说话人的身份鉴别。利用说话人识别技术还可以通过语音实现对一些服务的控制,例如语音拨号、电话银行、数据库访问服务、信息服务和计算机的远程访问等等。而且,说话人识别技术有很大可能产生新的服务,给人们的工作和生活带来非常可观的方便,本次试验主要目的为提出和设计开发能够快速准确识别不同个体的可行方案。 3、设计原理 3.1 语音识别技术的分类 语音识别系统可以根据对输入语音的限制加以分类。 从说话者与识别系统的相关性考虑 可以将识别系统分为3类: 特定人语音识别系统:仅考虑对于的音进行识别; 非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习; 多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对识别的那组人的语音进行训练。 从说话的方式考虑 也可以将识别系统分为3类: 孤立词语音识别系统:孤立词识别系统要求输入每个词后要停顿; 连接词语音识别系统:连接词输入系统要求对每个词都清楚发音,一些连音现象开始出现; 连续语音识别系统:连续语音输入是自然流利的连续语音输入,大量连音和变音会出现。Mel频率倒谱系数(MFCC),Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)是利用它们

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档