南京邮电大学毕业设计(论文)开题报告：基于刻意伪装语音的说话人识别技术研究.docVIP

下载本文档

44
0
约7.97千字
约 8页
2016-09-17 发布于广东
举报
版权申诉

南京邮电大学毕业设计(论文)开题报告：基于刻意伪装语音的说话人识别技术研究.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

南京邮电大学毕业设计(论文)开题报告题目基于刻意伪装语音的说话人识别技术研究学生姓名班级学号专业电子信息科学与技术 1 对课题任务的学习理解人的声音中包含了各种信息。“说话人识别”是从说话人发出的语音信号中自动提取出说话人信息，并对说话人进行识别的研究领域。换句话说，“说话人识别”是从说话人所发语音中提取出说话人是谁的信息的过程，为此需从各个说话人的发音中找出说话人之间的个性差异，它涉及到说话人发音器官上的个性差异、发音声道之间的个性差异、发音习惯之间的个性差异等不同级别上的差异，因此，说话人识别是交叉运用心理学、生理学、语音信号处理、模式识别与人工智能的综合行研究课题。语音识别（Speech Recognition）和说话人识别（Speaker Recognition）是语音信号处理中的两个重要分支，语音识别是识别出说话人所说的话的过程，而说话人识别则是通过对说话人语音信号的分析和特征提取，自动的确定说话人是否在所登记的说话人集合中，以及说话的人是谁的过程。说话人识别与语音识别的区别在于，它并不注意语音信号中的语意内容，而是希望从语音信号中提取出人的特征。从这点上说，说话人识别是企求挖掘出包含在语音信号中的个性因素，而语音识别是企求从不同人的词语信号中寻找共同因素。在处理方法上，说话人识别力图强调不同人之间的差别，而语音识别则是力图对不同人说话的差别加以归一化。说话人识别又可以分为两个范畴，即说话人辨认（Speaker Identification）和说话人证实（Speaker Verification）。正如图1-1所示，前者是把未标记的语句判定为属于N个参考说话人之中的某一个所说，是一个多者择一的问题；后者则是二者择一问题，根据说话人的语句确定是否能够与其所发出声音的参考说话人相符，这种确认只有两种可能，或是肯定（得到确认），或是否定（拒绝承认）。显然，说话人证实是一个严格的二元判决问题，即回答是还是不是这一说话人的发音，而说话人辨认则是一个多元判决问题，即要回答是哪一位说话人的发音。未知说话人语音未知说话人语音 (a)说话人辨认 (b)说话人证实图1-1 说话人识别的分类预先确定识别用发音内容的说话人识别称为与文本有关的（text-dependent）说话人识别；不预先确定发音内容，无论说什么话都可以进行的说话人识别，称为与文本无关（text-independent）说话人识别。“与文本有关”，即是说话人按规定的文本发音或者按提示发音，这样会使问题大为简化。目前对于与文本无关的说话人辨认在实用性上还有一定的距离，因为其应用环境难以控制。其中也包括如何从说话人自由说的语音信号中提取合适的特征这一困难。现在研究的方法多数采用各个说话人说出惯用的关键词句（口令、暗号、姓名等），因为不同的关键词句也能作为线索使用，在实用性方面容易得到比较高的识别率。尽管说话人识别有一定的难度，但语音中所包含的个性信息一般有两种，一种是由声道长度、声带等先天放音器官的个人差异产生的，另一种是由方言、语调等后天行说话习惯产生的，而先天性发音器官的个人差异是难于模仿的。在目前没有将说话人的个性特征从语音特征中分离出来的较好办法时，所采用的是固定文本内容从而得出说活人个性特征的办法，和不固定文本内容而从语音信号的统计信息中得出说话人个性特征的方法。随着时代的发展，说话人识别技术取得了长足的进步，语音的说话人个性特征分析和研究得到了关注。然而，出于各种各样的原因，说话人常常采用一些不易察觉的方法刻意改变自己或者模仿他人的声音，使语音信号的表征发生不可预知的变化，改变原本内在统一的特征参量。伪装语音的出现，使说话人鉴定工作难上加难。伪装语音将使说话人识别系统的识别率显著降低，而且不同的伪装方法对于自动说话者识别系统的影响也不尽相同。因此，深入研究各种伪装语音的特点及其对话者识别的影响，探索每种刻意伪装语音的各种域内的特征参量，提取最为理想的语音特征代替说话人个性特征，分析和改善说话人识别系统的性能，使之能够适应变化多端的伪装语音，最终提高基于伪装语音说话人识别系统的识别率，对于说话人的识别鉴定和其证据效力的发挥具有重要意义。同时，随着信息化社会的发展，基于刻意伪装语音说话人识别系统的应用领域也在不断扩大。 2 文献资料调研综述 2.1 语音的发音模型与特征提取 T T 1 开关K