汉语文本中的时间、事件及其属性识别.pdf

汉语文本中的时间、事件及其属性识别.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语文本中的时间、事件及其属性识别 【摘要】:时间和事件的识别任务近年来得到了广泛的关注和快速的 发展。作为时间关系研究的基础 ,时间与事件及其属性的识别也成为 自然语言处理中的一个重要任务。时间和事件的识别在 2010 年作为 两个单独的子任务被列入了 TempEval评测会议 ,该会议的评测涉及六 种语言:汉语、英语、意大利、法语、韩语和西班牙语 ,参与评测的 系统中多为英语和西班牙语。本文主要工作是针对 TempEval-2 评测 任务展开的 ,分别对时间和事件及其相关属性进行了识别 ,实验语料则 采用的是评测会议所给出的中文评测语料 ,涉及的标注则采用了 TimeML 标准。具体的研究工作如下: 1 研究问题的分析本文详细定 义和分析了时间和事件的识别问题 ,并分析了识别工作的具体内容和 识别难点 ,为之后识别方法的提出和问题的解决做了大量准备工作。 2 时间及其类型的识别对时间识别问题做了具体全面的介绍 ,包括识别 的思想和识别的详细过程。 该部分主要工作有时间表达式识别和时间 类型的识别 ,时间表达式识别采用了基于词性构建时间单元规则库的 方法 ,时间类型则使用了最大熵模型来分类识别。其中时间表达式识 别的准确率、 召回率和 F 值分别为 85.16%、83.16%和 84.17%,时间类 型的正确率为 93.02%。由此可知 ,基于规则的时间表达式识别方法和 基于最大熵类型识别两种方法均是有效的。最后 ,针对实验结果和错 误进行了深入分析和总结。 3 事件及其属性的识别事件识别方面主要 工作有事件识别和事件属性识别 ,其中属性识别主要针对时态属性进 行识别。事件用基于依存分析和规则的方法进行识别 ,事件的时态属 性则采用了规则方法来识别。 事件识别的准确率、 召回率和 F 值分别 为 89.2%、82.8%、85.9%,事件时态识别正确率为 76.9%。文章在对比 和分析实验结果不足和错误的同时 ,还对识别过程中存在的问题进行 了深入分析。 【关键词】:时间事件规则最大熵依存句法 【学位授予单位】:山西大学 【学位级别】:硕士 【学位授予年份】:2013 【分类号】:TP391.1 【目录】:摘要 8-9ABSTRACT9-11 第一章引言 11-151.1 研究背景 111.2研究现状 11-131.2.1时间及其属性识别研究现状 11-121.2.2事件 及其属性识别研究现状 12-131.3 论文主要工作 13-141.4 论文结构 14-15 第二章时间、事件识别问题分析 15-232.1 时间、事件相关定义 15-172.2 时间、事件识别内容和规范 172.3 问题及难点分析 17-212.3.1 时间识别任务 17-192.3.2事件识别任务 19-212.4 本章小结 21-23 第三 章时间表达式及其类型的识别 23-313.1 基于规则的时间表达

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地湖北
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档