- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
跨语言信息检索浅析-自然语言处理
中国科学院软件研究所
跨语言信息检索浅析
孙 乐
sunle@
中国科学院软件研究所
自然语言处理研究组
2007, in ICT MT class
中国科学院软件研究所
大纲
背景
研究方法
关键问题
系统评测
公开问题探讨
SIGIR论文
小结
2007, in ICT MT Class
中国科学院软件研究所
定义
• 跨语言信息检索: 用一种语言的查询条件到另一
种语言的文档集中进行检索的过程。
Advanced School
2007, in ICT MT Class
跨语言检索系统
果 结
用户界面 文本
文 中 ( 用户需求(中文) 文本
)
翻译 户 用 文本预处理
馈 反
查询翻译
查询条件组织
筛选
用户需求(英文)
查询条件(英文)
检索 索引
检索结果 文本
语料库
结果排列
排序结果(英文)
中国科学院软件研究所
CLIR形式化模型
( Q , T , D ; t )
源语言查询条件 目标文档集
源语言查询条件 目标文档集
通常由几个词汇组成 用户需要检索的目标的多
通常由几个词汇组成 用户需要检索的目标的多
,如(S ,S …S ) 语言目标文档(D ,D …D )
,如(S ,S …S ) 语言目标文档(D ,D …D )
1 2 m 1 2 I
1 2 m 1 2 I
目标语言查询条件 查询条件翻译函数
目标语言查询条件 查询条件翻译函数
经过翻译程序,生成 多种翻译方法,包括双
经过翻译程序,生成 多种翻译方法,包括双
直接应用于目标文档 语词典,机器翻译,平
直接应用于目标文档 语词典,
文档评论(0)