基于最大熵方法的中英文基本名词短语识别_周雅倩.pdf

基于最大熵方法的中英文基本名词短语识别_周雅倩.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于最大熵方法的中英文基本名词短语识别_周雅倩

40 3 Vol140, No13 2003 3 JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT Mar1 2003 周雅倩 郭以昆 黄萱菁 吴立德 ( 200433) ( archzhou@ yahoo1 com) 1 Chinese T reeBank , , 7143%/ 109% / 1 , , , 1 TREEBANK Ò, 93131%/ 931 04% / , 1 , 1 ; ; TP391 Chinese and English BaseNP Recognition Based on a Maximum Entropy Model ZHOU Ya-Qian, GUO Y-i Kun, HUANG Xuan-Jing, and WU L-i De ( Dep ar tment of Co mp uter Science and Engineer ing, Fudan University , Shanghai 200433) Abstract A maximum entropy model in Chinese BaseNP recognition is used in this paper1 The open test on Chinese T reeBank, the public corpus, indicates the average recall and precision of 7143% and 109% respectively with limited know ledge ( text itself and its POS tag) 1 Because of the incomparability of Chinese BaseNP recognition results, the same algorithm is applied in English BaseNP recognition1 The test on TREEBANK Òshows that the recall and precision are 93131% and 93104% , w hich are close to the state of the art1 This not only proves the availability of the algorithm, but also indicates its language indepen- dence1 Key words maximum entropy; BaseNP; natural language processing , 1 1 (TREC) , , 1 TREC , ( ) 1 , , , , SMART 1 , ( ) 1 , 1 SMART , / 0 1 , / 0, 1 1 , , , , , 1 , , , 1 : 2001-11-09; : 2002- 11-2 : ( 69 73011) ; Intel 3 : 441 , ¹ [ 1] , 2 ( system combination) , 7 211

文档评论(0)

rovend + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档