通信类中英文翻译、外文文献翻译.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
通信类中英文翻译、外文文献翻译.doc

美国科罗拉多州大学关于在噪声环境下对大量连续语音识别系统的改进 ---------噪声环境下说话声音的识别工作 简介 在本文中,我们报道美国科罗拉多州大学关于噪声环境下海军研究语音词汇系统方面的必威体育精装版改进成果。特别地,我们介绍在有限语音数据的前提下,为了了解不确定观察者和变化的环境的任务(或调查方法),我们必须在提高听觉和语言模式方面努力下工夫。在大量连续词汇语音识别系统中,我们将展开MAPLR自适应方法研究。它包括单个或多重最大可能线形回归。当前噪声环境下语音识别系统使用了大量声音词汇识别的声音识别引擎。这种引擎在美国科罗拉多州大学目前得到了飞速的发展,本系统在噪声环境下说话声音系统(SPINE-2)评价数据中单词错识率表现为30.5%,比起2001年的SPINE-2来,在相关词汇错识率减少16%。 介绍 为获得噪声环境下的有活力的连续声音系统的声音,我们试图在艺术的领域做出计算和提出改善,这个工作有几方面的难点:依赖训练的有限数据工作;在训练和测试中各种各样的军事噪声存在;在每次识别适用性阶段中,不可想象的听觉溪流和有限数量的声音。 在2000年11月的SPIN-1和2001年11月SPIN-2中,海军研究词汇通过DARPT在工作上给了很大的帮助。在2001年参加评估的种类有:SPIIBM,华盛顿大学,美国科罗拉多州大学,ATT,奥瑞哥研究所,和梅隆卡内基大学。它们中的许多先前已经报道了SPINE-1和SPLNE-2工作的结果。在这方面的工作中不乏表现最好的系统.我们在特性和主模式中使用了自适应系统,同时也使用了被用于训练各种参数类型的多重声音平行理论(例如MFCC、PCP等)。其中每种识别系统的输出通常通过一个假定的熔合的方法来结合。这种方法能提供一个单独的结果,这个结果的错误率将比任何一个单独的识别系统的结果要低。 美国科罗拉多州大学参加了SPIN-2和SPIN-1的两次评估工作。我们2001年11月的SPIN-2是美国科罗拉多州大学识别系统基础上第一次被命名为SONIC(大量连续语音识别系统)的。在那次评估中,我们单独的最好的系统在9x的实时性的解码速率下,有37.5%的错误率,在那篇论文中,我们描述了当前在通常识别系统发展的形式和工作依靠模式方面的改进.我们之所以关心这些问题,是因为这些问题是关系到在单独识别系统下降低噪声环境下说话声音的错识率,而不考虑那些工作中的识别融合问题。 噪声环境下说话者工作任务. 这个在噪声环境下的语音工作任务采用了ARCON通信实践,本实践的发展是源于测试通信系统和在战略航中伪装工作的说话音之间的合作,一个起发射办公者的作用(例中,武器控制系统,一个激光火炮和能源);另一个起接受办公者的作用(例如雷达和声纳装置)。每个角色在隔离房间中单独发声,使用军事设备和一个适当的用于模仿的声音装置设备。在这次训练中,两个参与者通过查清和证实栅栏(格子)的位置(x轴,y轴坐标)去有哪些信誉好的足球投注网站和破坏目标。这种位于SPINE—2中的格子能从诊断测试中组成含糊的句子。SPINE—2工作需要,这个格子位置的作用是组成了最小含糊军事用语(对话)。在每次过程中,通过典型的大声说话者,军事的噪声环境被描述。这个SPINE—1的评估数据包括六个噪声环境:1.飞机携带控制决定中心 2.AWACS飞机 3.一个军事工具(媒体) 4.一个军事领域 5.一个办公环境 6.一个安静环境。SPINE—2通过考虑增加到军用坦克和直生机环境下的各种噪声类型扩展了SPINE—1的数据。当通过一个类似通信通道的环境中时,每一种类型中来的噪声被通过头部损坏的麦克风记录。在本文中,我们仅考虑没有编码的声音频道中的说话声识别系统。 这个大量连续语音识别系统的ASR引擎. 3.1当前ASR的体系设计 我们当前用于实践的2001年11月的SPINE--2是应用了SONIC而设计的。即美国科罗多州大学大量连续说话声系统。SONIC是基于连续密度的隐马尔可夫声音模式。背景依靠三角电话,声音模式是依靠决定树的。每种模式有三个发射地域(空间),用伦琴迭代—2系统代表(象征)了我们在大量连续语音识别系统方面的最初成就。这个系统目前使用一个广阔的字典结构。它包括三点基础等级语法语言模式组成的人类决定的复合性词汇,单回归梅尔模式和全球广泛的各种变体以及通常意义上的三点式声音模式。自从2001年11月后,我们开始研究更加高效的词汇树。这种词汇树将拼凑声音模式,支持四种语法输入,完成数据引导语言合成,重组外加特征参数(例如对数频谱声码器,VTLN等)和说话人自适应模式。 SPINE系统概述 如表1所示,我们的SPINE体系包括一个高度完整的语言感应器和多路识别通路。在每次识别过程中,声音感应器根据当前的自适应声音模式重新划分结构

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档