中文文字蕴涵系统之特徵分析FeatureAnalysisof-ACLAnthology.PDFVIP

中文文字蕴涵系统之特徵分析FeatureAnalysisof-ACLAnthology.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文文字蕴涵系统之特徵分析FeatureAnalysisof-ACLAnthology

中文文字蘊涵系統之特徵分析 Feature Analysis of Chinese Textual Entailment System 黃文奇 Wan-Chi Huang, 吳世弘 Shih-Hung Wu* 朝陽科技大學資訊工程系 Department of Computer Science and Information Engineering Chaoyang University of Technology {s9727603, shwu}@.tw *Contact author 陳良圃 Liang-Pu Chen, 谷圳 Tsun Ku 資訊工業策進會 Institute for Information Industry {eit, cujing}@.tw 摘要 文字蘊涵(Textual Entailment)的定 是判斷兩個句子能否互相推論 。推論可 分為五種類型 :正向、反向、雙向、矛盾、獨立。這五種類型分別代表著不同的 蘊涵關係 。文字蘊涵辨識(Textual Entailment Recognition)是相當困難的自然語言 處理問題 。由於中文文字蘊涵的文獻較缺乏,本篇論文將中文文字蘊涵辨識提出 了一個流程 ,提供給之後想要做這個題目的人的作為一個參考 。中文的文字處理 相較於英文的文字處理有許多不同的難處 ,在本篇論文中,我們將介紹處理中文 的文字處理遇到的難處以及處理的流程 。我們的系統使用支援向量機(Support vector machine, SVM)作為區分類型的演算法 。使用的特徵分為兩個方向:1.文字 特徵 2.語意特徵 。 關鍵字 :文字蘊涵、tree kernel 、支持向量機、語意分析 一、緒論 近幾年來 ,文字蘊涵受到關注 ,主要是因為大家瞭解到文字蘊涵將使我們能 夠更準確的去推論自然語言的語 關係[1]以及處理一些重要的應用[2] 。像是檢 索系統經常會檢索出成千上萬筆資料 ,卻難以判斷哪個句子是與問句最相關的 。 於是可以透過蘊涵的推論 ,從這些成千上萬的資料中挑選出最相關的句子。由於 兩個句子中的關係有許多種 ,例如:蘊涵(entailment) 、改寫(paraphrase)以及獨立 (independence)等,語意推論的目的就是在於判斷兩個句子之間是屬於哪一種關 係。可以將推論分為五種類型 :正向、反向、雙向、矛盾、獨立這五種類型 。這 五種類型也分別代表著不同的蘊涵關係 。正向推論為可以從 t1 句子中推論出 t2 的句子 ,即代表t1 句子完整的包含著 t2 句子的資訊 ;而反向推論正好相反;雙 向即是 t1 與 t2 兩個句子互相完全包含著彼此的資訊 ;矛盾即是兩個句子中提到 281 的資訊是互相矛盾的 ;獨立則是兩個句子中提到的資訊是完全不相關的。如表 一。 表一中雙向蘊涵的例子比較屬於是改寫(paraphrase) ,更複雜的文字蘊涵推論 就像是 t1 → s , s → t2 。透過t1 的句子可以推論出涵 s ,接著透過涵 s 可以推 論出 t2 例如 :t1 :小明殺了小華。t2 :小華死了。從t1 我們可以推論出的 s 有很 多,如:小明是殺了小華的兇手 、小華被殺了、小華死了。這種推論需要有邏輯 推論以及許多背景知識才可以達成 。基於中文處理的成本以及困難度考量,本篇 論文主要針對改寫(paraphrase)去作分析 。 表一 各種類型的例句 類型 例句 t1 :日本時間201

文档评论(0)

sunshaoying + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档