实体提及的多层嵌套识别方法研究 - 中国中文信息学会.PDF

实体提及的多层嵌套识别方法研究 - 中国中文信息学会.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实体提及的多层嵌套识别方法研究 - 中国中文信息学会

第 2 1 卷  第 2 期 中文信息学报 Vol . 2 1 , No . 2 2007 年 3 月 J OU RN AL O F C H IN ESE IN FO RMA T ION PROCESSIN G Mar . , 2007 文章编号 : (2007) 0200 1408 实体提及的多层嵌套识别方法研究 刘非凡 , 赵 军 , 徐 波 ( 中国科学院 自动化研究所 模式识别国家重点实验室 ,北京 100080) 摘  要 : 实体识别在许多自然语言处理应用系统中发挥着极其重要的作用 。目前大部分研究集中在命名实体识 ( ) 别 ,且不考虑实体之间的嵌套 ,本文在 自动内容抽取评测 Automatic Cont ent Ext raction , A CE 背景下 ,对汉语文 ( ) 本中各种实体提及 命名性 ,名词性 ,代词性 的多层嵌套识别进行了研究 。我们将嵌套实体识别分成两个子任务 : 嵌套实体边界检测和实体多层信息标注 。首先 ,本文提出了一种层次结构信息编码方法 ,将多层嵌套边界检测问 题转化为传统的序列标注问题 ,利用条件随机场模型融合多种特征进行统计决策 。其次 ,将多层信息标注问题看 作分类问题 ,从实现的角度设计了含有两个分类引擎的并行 SV M 分类器 ,避免了对每层信息标注都设计一个分类 器 , 比采用单一分类器在性能上有明显提高 。在标准 A CE 语料上的实验表明 ,基于条件随机场的多层实体边界检 测模型正确率达到 7 1 % ,融合特征选择策略的两个并行分类引擎的正确率也分别达到了 89 . 05 %和 82 . 17 % 。 关键词 : 人工智能 ; 自然语言处理 ;实体提及嵌套识别 ;条件随机场 ;支持向量机 中图分类号 : TP39 1     文献标识码 : A Study on Multiscale Nested Entity Mention Recognition L IU Feifan , ZHAO J un , XU Bo (National L aboratory of Patt ern Reco gnition , In stit ut e of Automation , Chinese Academy of Sciences , Beij ing 100080 , China) Abstract : Entit y reco gnition p lay s a significantly import ant role in many nat ural language p rocessing app lication s. Previou s st udy on entit y recognition i s mainly focu sed on t he Named Entit y Recognition (N ER) and nest ed N Es are not con sidered . Thi s p ap er p ropo ses a

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档