基于语义的关键词提取算法_方俊.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义的关键词提取算法_方俊

2008Vol.35 №.6   *)      (西北工业大学自动化学院 西安710072)   1   关键词 提供了文档内容的概要信息, 它们被使用在很多数据挖掘的应用中。在目前的关键词提 算法中, 我们发现词汇层面(代表意思的词)和概念层面(意思本身)的差别导致了关键字提 的不准确, 比如不同语法的词可 能有着相同的意思, 而相同语法的词在不同的上下文有着不同的意思。 为了解决这 个问题, 这篇文章提出使用词义代 替词并且通过考虑关键候选词的语义信息来提高关键词提 算法性能的方法。 与现有的关键词提 方法不同, 该方 法首先通过使用消歧算法, 通过上下文得到候选词的词义;然后在后面的词合并、特征提 和评估的步骤中, 候选词义 之间的语义相关度被用来提高算法的性能。在评估算法时, 我们采用 一种更为有效的基于语义的评估方法与著名的 Kea 系统作比较。在不同领域间的实验中可以发现, 当考虑语义信息后, 关键词提 算法的性能能够得到很大的提 高。在同领域的实验中, 我们的算法的性能与 Kea ++算法的相近。 我们的算法没有领域的限制性, 因此具有更好 的应用前景。  关键词提 , 语义相关度, 消歧   Semantical ly Improved Automatic Keyphrase Extraction FA NG Jun  GUO Lei  WA NG Xiao-don (Colle e of Automation, Northw estern Polytechnical University, Xi an 710072, China)   Abstract  Keyphrases provide semantic metadata producin an overview of the content of a document, they are used in many text-minin applications.In the process of keyphrases eneration, w e notice that the distinction between lexical level (term for meanin )and conceptual level (the meanin itself)can result in inaccuracy.In order to solve this prob- lem, this paper proposes a new method that im proves automatic keyphrase extraction by usin semantic information of candidate keyphrases.Our keyphrases extraction method, in contrast to current methods, outputs the senses set in- stead of terms set by usin w ord sense disambi uation method, as sense has only one unique meanin .Semantic relat- edness betw een senses of candidate keyphrases is taken into consideration in the sta e of term conflation, feature calcu- lation, and evaluation.W e evaluate our semantically improved method a ainst the well know n Kea sy stem by usin a more effective semantically enhanced evaluation method.The inter-domain experiment show s that quality of keyphrases ext raction

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档