集外词的语音检索方法研究-信号与信息处理专业论文.docxVIP

下载本文档

5
0
约6.69万字
约 79页
2019-05-09 发布于上海
举报
版权申诉

集外词的语音检索方法研究-信号与信息处理专业论文.docx

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

U U niwversityrsity ofOt Sciencience andnd Technologyechnolo of A d issertation for master’S deg ree Research on 0 ut．．of．．vocabu la Spoken Term Detection Author’S Name： ShiFu Xiong Speciality： Signal and Information Processing Supervisor： A．P．Wu Guo Finished time： May 12m，2014 中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文，是本人在导师指导下进行研究工作所取得的成中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文，是本人在导师指导下进行研究工作所取得的成果。除己特别加以标注和致谢的地方外，论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名：雏彬‰ 签字日期：圳p．，-；D 中国科学技术大学学位论文授权使用声明作为申请学位的条件之一，学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权，即：学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅，可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。必威体育官网网址的学位论文在解密后也遵守此规定。曰么开口必威体育官网网址(——年) 作者签名：熊逆皇导师签名：。～ f叭 7 签字日期：翌忡-J--3+ 签字日期： jLoI～ j．工、≯。摘要摘要摘要摘要语音检索是多媒体信息检索的重要研究方向，基于大词汇连续语音识别的检索算法是当前语音检索中的主流算法。集外词是一些经常被用户检索但是不在识别词典中的词，相比于集内词检索，集外词检索性能严重下降是语音检索面临的一个主要挑战。集外词检索的主要难点有：发音不确定性，词性质的多样性，声学模型和语言模型的高度弱模型性。为了解决集外词问题，提高集外词检索性能，本文首先着力于建立一个高性能的子词识别器。本文采用多种训练算法提高语音识别率，在基于混合高斯模型 -隐马尔科夫模型(GMM-HMMs)的声学建模中，采用最小音素错误(Minimum Phone Error,MPE)准则来提高模型区分性；进一步，采用深度神经网络(Deep Neural Network，DNN)声学模型替代GMM模型，并使用跨语种训练和矫正线性单元(Rectified Linear Units，ReLUs)激活函数改善DNN声学模型性能；针对小语种问题，提出使用自动生成问题集来减少声学模型的数量。通过以上方法，明显提升了声学模型的建模能力。针对集外词被词识别系统错误识别的问题，使用音素、音节、词片三种子词单元作为解码单元，降低集外词语言模型的弱模型性，提升解码过程中集外词的音素识别率。其次，在集外词的子词检索系统建立过程中，考虑到三种子词间的性质差异，本文对三种子词检索系统使用不同的检索策略。对基于音素的STD系统使用基于加权有限状态转换机(weighted finite state transducer，WFST)完全匹配检索的方法降低虚警；对基于词片和音节的STD系统使用模糊匹配检索减少漏警。为了处理集外词词性质的多样性，本文使用词项相关置信度归一化方法对得分进行规整。另外，考虑到不同识别系统的输出的互补性，本文提出了基于线性逻辑回归的多系统融合策略，进一步提高置信度的可靠性。使用这些改进算法，本文分别在NIST STD2006英语关键词检索数据库和 NIST STD2013越南语关键词检索数据库上进行了实验，获得了明显的关键词检索性能提升。关键词：语音检索语音识别深度神经网络集外词系统融合置信度摘要 Il AbstractAbstract Abstract Abstract Spoken term detection(STD)is a significant research task for multimedia information retrieval．The current mainstream STD algorithm is based on large vocabulary continuous speech recognition(LVCSR)．Out·of-vocabulary(oov)query terms are words that have a high