信息检索疆少数名族语言语音识别技术的研究.docVIP

下载本文档

14
0
约4.63千字
约 12页
2018-01-26 发布于贵州
举报
版权申诉

信息检索疆少数名族语言语音识别技术的研究.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

信息检索疆少数名族语言语音识别技术的研究

目录摘要 1 关键词 1 1 前言 2 1、1语音识别技术概述 2 1、2中国少数民族语言概述 3 2 新疆少数民族语言发音特点分析 4 2、1 中国少数民族语音特性分析 4 2、2 中国少数民族语音识别研究现状 5 3 少数语言研究中的关键技术和模型 6 3、1语音识别技术流程 6 3、2预处理算法 6 3、2、1语音信号的获取 6 3、2、2语音信号的降噪增强 7 3、3端点检测算法 7 3、4 针对语音特征建立语音识别模型 8 3、5少数民族的语言模型 8 4 建立相关的语音库 8 5 结论 9 致谢 9 参考文献 11 新疆少数名族语言语音识别技术的研究摘要：语音识别是当今语音研究的热点，它是一门涉及多领域的交叉学科，也是模式识别和人工智能领域的重要分支。针对新疆有着55个少数民族这一实际情况，不少语言都处于濒临状态，因此，本文主要介绍了语音识别在少数民族语言应用中的技术和概况。希望利用这一数字化技术达到保护少数民族语言文化遗产的目的。在新疆少数民族尤其是维吾尔族在新疆人口中占有60%的比例。新疆地区官方语言是汉语和维吾尔语由于维吾尔语的语音特性,使得维汉之间的语言差异很大,正是这种少数民族的构成、人口与语言文字状况,使少数民族语言文字信息技术的开发与应用成为新疆信息化建设中不可或缺的一个重要方面,也是国家信息化的基础之一。而研究维吾尔语的语音识别技术是新疆信息化建设的内容之一,自然具有重大的研究意义。到目前为止,国外无一机构(包括微软、IBM等跨国公司)能够实现对维吾尔语的实时识别以及合成。所以目前国际上在此领域的成果还是一片空白。而纵观目前新疆民族语言信息技术研发与应用现状,目前新疆信息业内还没有一个完备的维吾尔语的语音识别软件。随着新疆经济的发展,旅游资源的开发,维吾尔语人机对话系统的开发工作已是一个很紧迫的任务。语音系统广泛的应用市场以及维吾尔族用户所占比例表明维吾尔语语音识别系统研究开发工作的必要性及不可忽视的广阔的市场前景。维吾尔语语音识别研究不仅会给新疆地区语音研究领域建立牢固的基础,也将对促进维吾尔语言文化的繁荣、发展和科技进步具有积极的意义近几年,的语音识别技术趋于成熟,发展迅速,尤其是大词汇表汉语语音识别系统的研究使人们看到了语音技术走向大众化、实用化的愿景。至今为止,汉语的朗读及口语语音识别都已经达到了一个较好的识别性能,声学模型自适应、发音自适应等各种技术被广泛使用。无论是听写机、电话语音识别还是口语对话识别都正处于实验转化阶段。然而,的语言文字博大精深,中文除汉语外还包含各种少数民族语言。各少数民族语言语音识别技术的研究还处于初期阶段。新疆地处中国西北边陲和亚欧大陆腹地,少数民族人数占新疆总人口的60.13%。这种特殊的地理、文化、环境原因,造成该地区在研究少数民族语音文字方面的优势。近年来,少数民族语言语音文字处理技术的研究已逐步成为热点,在国家自然科学基金、社会科学基金和各部委研究基金的支持下,现代维吾尔语口语语料库建设不断完善,非特定人连续语音识别的研究水平有所提高。研究由固定内容、固定模式的朗读语音,逐步转向灵活性较强的口语对话。研究维吾尔语语音识别中发音变异现象将有助于提高少数民族语言语音基础和应用研究水平,探索和拓宽少数民族语音识别的研究道路,保证科研资源的共享和科学研究的延续性,既加速了推图2 少数民族语音识别流程图 3、2预处理算法语音信号在处理成数字信号的过程中，将受到周围的各环境的影响而使语音产生变形，预处理的任务就是修正这种变形，尽可能的还原人的有效发音。少数民族语音识别预处理包括：信号获取、去除噪声、语音增强三个环节。 3、2、1语音信号的获取计算机声卡作为语音信号与计算机的接口卡件，其最基本的一项功能就是A/D转换。声卡是pc的一种多媒体设备，可以用windows的MCI（Media Control Interface)命令来控制声卡。图3信号获取过程中相关函数使用流程示意图 3、2、2语音信号的降噪增强在语音采集过程中，都会或多或少的产生背景噪音，设法去除语音信号中的噪声，增强有用信号，提高语音信号的信噪比就成为预处理研究中的一个重要步骤。常用的语音降噪增强算法基于语音频谱特征的谐波增强法基于短时谱估计的增强算法基于信号子空间处理的增强算法于听觉掩蔽效应的语音增强算法基于小波变换的语音增强算法 3、3端点检测算法端点检测是指从背景噪声中找出语音的开始点和终止点，是语音处理领域的基本问题，特别是在孤立词语识别中，找出每个单字的语音信号范围是很重要的，确定语音信号的开始和终止可以减少系统的大量计算，使系统运行效率得到很大的提高。少数民族语言的端点检测采用加窗、短时能量、过零率相结合的方法进行。