- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语文本中的时间、事件及其属性识别
【摘要】:时间和事件的识别任务近年来得到了广泛的关注和快速的
发展。作为时间关系研究的基础 ,时间与事件及其属性的识别也成为
自然语言处理中的一个重要任务。时间和事件的识别在 2010 年作为
两个单独的子任务被列入了 TempEval评测会议 ,该会议的评测涉及六
种语言:汉语、英语、意大利、法语、韩语和西班牙语 ,参与评测的
系统中多为英语和西班牙语。本文主要工作是针对 TempEval-2 评测
任务展开的 ,分别对时间和事件及其相关属性进行了识别 ,实验语料则
采用的是评测会议所给出的中文评测语料 ,涉及的标注则采用了
TimeML 标准。具体的研究工作如下: 1 研究问题的分析本文详细定
义和分析了时间和事件的识别问题 ,并分析了识别工作的具体内容和
识别难点 ,为之后识别方法的提出和问题的解决做了大量准备工作。 2
时间及其类型的识别对时间识别问题做了具体全面的介绍 ,包括识别
的思想和识别的详细过程。 该部分主要工作有时间表达式识别和时间
类型的识别 ,时间表达式识别采用了基于词性构建时间单元规则库的
方法 ,时间类型则使用了最大熵模型来分类识别。其中时间表达式识
别的准确率、 召回率和 F 值分别为 85.16%、83.16%和 84.17%,时间类
型的正确率为 93.02%。由此可知 ,基于规则的时间表达式识别方法和
基于最大熵类型识别两种方法均是有效的。最后 ,针对实验结果和错
误进行了深入分析和总结。 3 事件及其属性的识别事件识别方面主要
工作有事件识别和事件属性识别 ,其中属性识别主要针对时态属性进
行识别。事件用基于依存分析和规则的方法进行识别 ,事件的时态属
性则采用了规则方法来识别。 事件识别的准确率、 召回率和 F 值分别
为 89.2%、82.8%、85.9%,事件时态识别正确率为 76.9%。文章在对比
和分析实验结果不足和错误的同时 ,还对识别过程中存在的问题进行
了深入分析。 【关键词】:时间事件规则最大熵依存句法
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1
【目录】:摘要 8-9ABSTRACT9-11 第一章引言 11-151.1 研究背景
111.2研究现状 11-131.2.1时间及其属性识别研究现状 11-121.2.2事件
及其属性识别研究现状 12-131.3 论文主要工作 13-141.4 论文结构
14-15 第二章时间、事件识别问题分析 15-232.1 时间、事件相关定义
15-172.2 时间、事件识别内容和规范 172.3 问题及难点分析 17-212.3.1
时间识别任务 17-192.3.2事件识别任务 19-212.4 本章小结 21-23 第三
章时间表达式及其类型的识别 23-313.1 基于规则的时间表达
您可能关注的文档
最近下载
- 第1部分 专题05:记叙文阅读之环境描写(练习)-中考语文复习 现代文阅读(全国版)(含答案及解析版).docx
- 人教版2019年初中物理 电能、电路、电功综合专题练习(含答案).doc
- 超星学习通 乡村振兴的实践探索(北京大学)章节测验答案尔雅网课答案.pdf VIP
- 2024年6月第英语六级真题(全3套)及答案解析.pdf
- (完整版)数量关系公式.pdf
- 山东省政府采购专家测评题库800-1000.docx VIP
- 新课标人教版高中英语教材词汇表 1-8册(1).doc
- GB/T 5686.7-2022锰铁、锰硅合金、氮化锰铁和金属锰 硫含量的测定 红外线吸收法和燃烧中和滴定法.pdf
- 河北省石家庄市2024年中考一模语文试卷(含答案).pdf VIP
- 全国卷书面表达说题比赛课件.pptx
文档评论(0)