多路并行的语音识别引擎的设计与实现.PDF

下载文档

22
0
约1.54万字
约 3页
2017-05-16 发布于天津
举报
版权申诉
保障服务

多路并行的语音识别引擎的设计与实现.PDF

1、本文档共3页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第 23 卷第 8 期计算机应用 Vol. 23 , No. 8 2003 年 8 月　 Computer Applications 　 Aug. , 2003 ( ) 文章编号 :1001 - 9081 2003 08 - 0051 - 03 多路并行的语音识别引擎的设计与实现吉鸿雁 ,刘　鹏 ,吴　及 ,王作英 (清华大学电子工程系 ,北京 100084) 摘　要 :文中讨论了一个多路并行语音识别引擎的设计与实现。在介绍多路语音识别系统的整体结构的基础上 ,着重介绍了该引擎主要功能模块和设计方法 ,给出了优化引擎内存和性能的一些方法。关键词 :语音识别 ;并行处理 ;模型共享中图分类号: TN912 　　文献标识码 :A A Multisession Speech Recognition Engine J I Hongyan , L IU Peng , WU Ji , WAN G Zuoying ( ) Depart ment of Elect ronics Engineering , Tsinghua U niversity , Beijin g 100084 , China Abstract : This paper discusses the design and implementation of a multisession speech recognition engine. First it introduces the structure of the multisession speech recognition system. Then it focuses on the engines main function module and the design method. Furthermore , some solutions for reducing the system memory cost and optimizing the performance are also presented. Key words : speech recognition ; parallel processing ; model sharing 　　考虑到语音识别系统的特性 ,我们设计了如图 1 所示的 1 　引言系统结构 : 本文论述了一个结构化的语音识别系统。该系统将音频输入前端和语音识别部分独立起来 ,将语音识别作为一个单独的引擎 , 同时提供该引擎和上层应用程序之间的通讯接口。这样为应用软件嵌入语音识别功能提供了方便 ,使上层应用程序的开发人员可以忽略语音识别技术的实现细节而实现语音识别功能。另外 ,在电话转接系统或公共信息查询系统等应用中 ,需要同时对来自多个应用程序的语音输入分别进行识别 ,为此系统考虑了并行处理技术的设计与优化。该语音识别系统的算法采用清华大学电子工程系语音识别实验室的汉语连续语音识别技术。