- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
能自动翻译专利文献翻译系统
能自动翻译专利文献翻译系统
本文介绍了一个面向专利文献翻译的、实用的汉英机器翻译系统,包括系统的总体设计、系统中使用的主要翻译技术等。
随着我国对知识产权认识的不断提高以及国际交流的迫切需要,传统的由专利翻译人员进行手工翻译的方式已经不能满足目前急剧增长的专利文献翻译需求,一定程度上阻碍了我国专利技术的推广和交流。机器自动翻译和辅助翻译正是解决这一问题的有效途径。近年来机器翻译技术取得了很大的突破,特别是统计机器翻译技术的发展,使得翻译质量有了很大的提高,为专利文献翻译提供了新的有力的手段。
专利文献翻译的特点
相对于普通文本的翻译来说,专利文献翻译具有以下特点:
● 涉及的专业领域多。专利文献具有很强的领域特性,直接利用现有的通用翻译软件很难得到理想的翻译结果。不过专利文献所属的领域可以根据国际专利分类号划分,相对比较清楚。同时,专利翻译经过多年的积累,比较容易获得特定领域的双语平行语料库(Parallel Corpus),这对机器翻译的语料收集和语料的领域划分提供了方便。
● 使用的专业术语和法律术语多。专利文献中包含大量的专业术语和法律术语,因此对译员的综合素质要求很高。相应的,专利翻译所需支付的报酬也非常高。举例来说,在国外将本国语言译成外文所支付的翻译费大约在每100个源词30~50美元。对一些比较罕见的语种,翻译服务的价格还会更高。因此利用自动翻译或辅助翻译解决专业术语和法律术语的翻译问题,可以大大降低专利翻译的成本。
● 翻译的语言种类多。由于专利文献具有一定的国别特性,因此专利文献往往需要实现不同语言之间的翻译。如果每种语言翻译方向都建立一个翻译系统则需要大量的开发成本。因此,使用语言无关性好的翻译技术是比较合理的选择。
● 文献形式规范、语言严谨。专利文献具有一定的法律文件特性,因此相对于新闻或口语翻译,文本的格式比较固定,用语也较为规范。专利文献中经常包含一些固定句型,即俗称的“句套子”,如“本发明的目的是X”,“权力要求N所述的X,其特征是Y”,其中X、Y???以是任意词语或句子,N是任意数词组合。这些句型模板适合机器的自动翻译。
通过分析专利文献的上述特点可以看出,对于形式比较规范、领域比较确定的专利翻译而言,使用机器翻译方法是有可能取得较好的翻译效果的。特别是最近快速发展的统计机器翻译技术,具有语言无关性好、领域可移植性好、知识获取方便、开发周期短等特点,非常适合用于构建专利文献翻译系统。
中科院计算所多语言交互技术实验室在机器翻译方面有着多年的研究经验,近年来在统计机器翻译方面的研究取得了很好的成绩。而北京东方灵盾科技有限公司对专利文献翻译有巨大需求,希望借助于自动翻译软件进一步提高翻译质量和翻译效率。受东方灵盾科技有限公司委托,计算所研究人员利用多语言交互实验室已经积累的统计机器翻译技术,结合专利文献翻译的特点,设计并实现了一个特定领域的汉英专利文献翻译系统。该系统目前的翻译领域为传统中药专利文献。由于采用了以统计为主的机器翻译技术,该系统可以很容易地移植到其他技术领域的专利翻译。
系统总体设计
为了方便大规模、多用户、并发执行的任务需求,本系统采用了服务器/客户端的网络服务模式,并采用多线程调度。系统的物理结构和逻辑流程如下:
1.物理结构
汉英专利文献机器翻译系统的物理结构由两部分组成,包括:
● 翻译引擎服务器: 负责提供翻译服务,管理翻译资源。
● 客户端: 负责向用户呈现翻译结果,提供辅助翻译工具,将用户请求提交给服务器。
其中,服务器端主要放置翻译核心解码器及其所需的各种资源,如短语表、语言模型、模板库、词典、记忆库等。服务器端对这些资源进行统一管理,合理调度,同时服务器端负责各用户线程的调度与时间片分配,协调各用户提交的任务的优先级。
客户端又分为普通用户客户端和管理员用户客户端,不同的用户具有不同的权限。客户端提供方便的用户编辑、修改界面,同时提供给用户查看任务状态及服务器状态的功能,并能对服务器上的部分资源进行实时访问和修改,通过客户端,用户能够方便地批量上传文件进行翻译,并可以对返回的结果进行修改、重新提交翻译、批量导出翻译结果等。
服务器和客户端两部分均为可独立运行的进程,通过网络实现互相连接。
2. 逻辑流程
系统逻辑结构是系统的整体业务框架,它描述了从数据输入,经过系统的内部处理得到期望结果,一直到最后输出的全过程(本系统的逻辑流程参考图见图1)。
具体来说,该系统的主要流程描述如下:
● 翻译服务: 负责翻译用户提交的句子或文本文件,输出翻译结果。翻译过程中会调用记忆库管理程序、词典管理程序、
您可能关注的文档
最近下载
- 常见色票、手册、单据及台账填写作业指导书(一).pdf VIP
- 烧伤患者护理查房PPT课件.pptx VIP
- 2025年江苏高考地理试卷真题及答案详解(精校打印版).pdf VIP
- 尿毒症合并心衰的护理.pptx
- 蔬菜西甜瓜种子生产技术 瓜类种子生产技术、种子生产技术 西甜瓜杂交授粉技术..pptx VIP
- 前期物业服务投标方案493页.doc VIP
- 个人简历——【标准模板】.doc VIP
- xxx水电站工程项目建设管理规划【参考】.doc VIP
- 江苏省南通市如皋中学2024届高三下学期高考适应性考试(三)(3.5模)数学试题(含答案解析).docx
- 安全生产规章制度和劳动纪律.docx VIP
文档评论(0)