- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
U U niwversityrsity ofOt Sciencience andnd Technologyechnolo of A d issertation for master’S deg ree Research on 0 ut..of..vocabu la Spoken Term Detection Author’S Name: ShiFu Xiong Speciality: Signal and Information Processing Supervisor: A.P.Wu Guo Finished time: May 12m,2014 中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成 中国科学技术大学学位论文原创性声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成 果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写 过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确 的说明。 作者签名:雏彬‰ 签字日期: 圳p.,-;D 中国科学技术大学学位论文授权使用声明 作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥 有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交 论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学 位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制 手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。 必威体育官网网址的学位论文在解密后也遵守此规定。 曰么开 口必威体育官网网址(——年) 作者签名: 熊逆皇 导师签名: 。~ f叭 7 签字日期: 翌忡-J--3+ 签字日期: jLoI~ j.工、≯。 摘要摘要 摘要 摘要 语音检索是多媒体信息检索的重要研究方向,基于大词汇连续语音识别的检 索算法是当前语音检索中的主流算法。集外词是一些经常被用户检索但是不在识 别词典中的词,相比于集内词检索,集外词检索性能严重下降是语音检索面临的 一个主要挑战。集外词检索的主要难点有:发音不确定性,词性质的多样性,声 学模型和语言模型的高度弱模型性。 为了解决集外词问题,提高集外词检索性能,本文首先着力于建立一个高性 能的子词识别器。本文采用多种训练算法提高语音识别率,在基于混合高斯模型 -隐马尔科夫模型(GMM-HMMs)的声学建模中,采用最小音素错误(Minimum Phone Error,MPE)准则来提高模型区分性;进一步,采用深度神经网络(Deep Neural Network,DNN)声学模型替代GMM模型,并使用跨语种训练和矫正线性 单元(Rectified Linear Units,ReLUs)激活函数改善DNN声学模型性能;针对小语 种问题,提出使用自动生成问题集来减少声学模型的数量。通过以上方法,明显 提升了声学模型的建模能力。针对集外词被词识别系统错误识别的问题,使用音 素、音节、词片三种子词单元作为解码单元,降低集外词语言模型的弱模型性, 提升解码过程中集外词的音素识别率。 其次,在集外词的子词检索系统建立过程中,考虑到三种子词间的性质差异, 本文对三种子词检索系统使用不同的检索策略。对基于音素的STD系统使用基 于加权有限状态转换机(weighted finite state transducer,WFST)完全匹配检索的方 法降低虚警;对基于词片和音节的STD系统使用模糊匹配检索减少漏警。为了 处理集外词词性质的多样性,本文使用词项相关置信度归一化方法对得分进行规 整。另外,考虑到不同识别系统的输出的互补性,本文提出了基于线性逻辑回归 的多系统融合策略,进一步提高置信度的可靠性。 使用这些改进算法,本文分别在NIST STD2006英语关键词检索数据库和 NIST STD2013越南语关键词检索数据库上进行了实验,获得了明显的关键词检 索性能提升。 关键词:语音检索语音识别深度神经网络集外词系统融合置信度 摘要 Il AbstractAbstract Abstract Abstract Spoken term detection(STD)is a significant research task for multimedia information retrieval.The current mainstream STD algorithm is based on large vocabulary continuous speech recognition(LVCSR).Out·of-vocabulary(oov)query terms are words that have a high
您可能关注的文档
- 基于组织适应力与战略选择协同演化的企业持续成长研究-管理科学与工程专业论文.docx
- 会话中重复话语的功能及制约因素探析-语言学及应用语言学专业论文.docx
- 环境因子对喜树幼苗生长和喜树碱含量的影响-植物学专业论文.docx
- 基于自相似性的自然图像超分辨重建-模式识别与智能系统专业论文.docx
- 具有容侵能力的集群CAS单点登录系统研究与应用-计算机科学与技术专业毕业论文.docx
- 活性炭对铝的吸附与解吸的试验研究-市政工程专业论文.docx
- 刻蚀机腔室结构特性分析与工艺性能参数优化-机械电子工程专业毕业论文.docx
- 基于Ajax的在线考试系统的研究与实现-计算机技术专业论文.docx
- 基于“走出去”战略的文化经纪生态研究-文艺学·文化产业专业论文.docx
- 基坑排桩支护中冠梁计算方法及作用的研究-岩土工程专业论文.docx
- 环磷酰胺药物基因多态性与狼疮性肾炎疗效和不良反应的相关性分析-肾内科专业论文.docx
- 基因流速度与种间渐渗和物种界定 云杉属线粒体和叶绿体DNA群体遗传学的证据-生物学 生态学专业论文.docx
- 几个典型有机反应机理的从头计算暨内禀特征轮廓研究-物理化学专业论文.docx
- 基因流速度与种间渐渗和物种界定:云杉属线粒体和叶绿体DNA群体遗传学的证据-生物学 生态学专业论文.docx
- 黄土湿陷性影响因素试验研究-岩土工程专业论文.docx
- 环形穿梭车运行调度系统研究与开发-机械电子工程专业论文.docx
- 环境温度下厌氧折流板反应器运行特性的研究-市政工程专业论文.docx
- 口服胸腺肽肠溶微球的实验研究-药剂学专业毕业论文.docx
- 卡特青州(CQL)质量管理与控制体系优化研究-工商管理专业毕业论文.docx
- 甲基睾丸酮在罗非鱼体内的消解规律及其检测方法的研究-食品科学专业论文.docx
最近下载
- 社会责任审核培训课件.ppt VIP
- 2023年海南三亚市崖州区机关事业单位招考政府雇员储备库100人笔试参考题库(共500题)答案详解版.docx VIP
- 《房颤诊断和治疗中国指南(2023)》解读PPT课件.pptx VIP
- [三亚]2024年海南三亚市崖州区机关事业单位招考政府雇员储备库100人笔试历年参考题库频考点试题附带答案详解.docx VIP
- 科研人才队伍建设实施方案.doc VIP
- 神经系统的胚胎发育与生理.pptx VIP
- 海南三亚市崖州区机关事业单位招聘100名政府雇员冲刺卷一(附答案与详解).docx VIP
- You and Me (君と僕)松井佑贵 原版扫描谱 吉他谱 吉他指弹谱.pdf VIP
- 中华人民共和国监察法课件最终版.pptx VIP
- 监察法 教学课件.ppt VIP
有哪些信誉好的足球投注网站
文档评论(0)