- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多路并行的语音识别引擎的设计与实现.PDF
第 23 卷第 8 期 计算机应用 Vol. 23 , No. 8
2003 年 8 月 Computer Applications Aug. , 2003
( )
文章编号 :1001 - 9081 2003 08 - 0051 - 03
多路并行的语音识别引擎的设计与实现
吉鸿雁 ,刘 鹏 ,吴 及 ,王作英
(清华大学 电子工程系 ,北京 100084)
摘 要 :文中讨论了一个多路并行语音识别引擎的设计与实现。在介绍多路语音识别系统的整体
结构的基础上 ,着重介绍了该引擎主要功能模块和设计方法 ,给出了优化引擎内存和性能的一些方法。
关键词 :语音识别 ;并行处理 ;模型共享
中图分类号: TN912 文献标识码 :A
A Multisession Speech Recognition Engine
J I Hongyan , L IU Peng , WU Ji , WAN G Zuoying
( )
Depart ment of Elect ronics Engineering , Tsinghua U niversity , Beijin g 100084 , China
Abstract : This paper discusses the design and implementation of a multisession speech recognition engine. First it
introduces the structure of the multisession speech recognition system. Then it focuses on the engines main function module
and the design method. Furthermore , some solutions for reducing the system memory cost and optimizing the performance
are also presented.
Key words : speech recognition ; parallel processing ; model sharing
考虑到语音识别系统的特性 ,我们设计了如图 1 所示的
1 引言
系统结构 :
本文论述了一个结构化的语音识别系统。该系统将音频
输入前端和语音识别部分独立起来 ,将语音识别作为一个单
独的引擎 , 同时提供该引擎和上层应用程序之间的通讯接口。
这样为应用软件嵌入语音识别功能提供了方便 ,使上层应用
程序的开发人员可以忽略语音识别技术的实现细节而实现语
音识别功能。另外 ,在电话转接系统或公共信息查询系统等
应用中 ,需要同时对来自多个应用程序的语音输入分别进行
识别 ,为此系统考虑了并行处理技术的设计与优化。该语音
识别系统的算法采用清华大学电子工程系语音识别实验室的
汉语连续语音识别技术。
文档评论(0)