一种用于专利实体的实体消歧方法.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种用于专利实体的实体消歧方法.doc

文章编号:XXXX 一种用于专利实体的实体消歧方法 王琰炎,王裴岩,蔡东风 (,,关键词中图分类号:文献标识码:AAbstract: Patent Entity is a significant entity that used to express patents, utility models, and appearance design, as the kernel of patent text, patent entity is the absolute focus of entity search users. Patent Entity Search is the first step of Patent Information Extraction, and the entity disambiguation of patent is the most important operation of Patent Entity Search, which is divide relative words to different types according to different domains. Apply entity search technology to the abstract text of Chinese patent, make use of the technology of entity disambiguation, which can get the relative information that the user concerned. This paper propose a disambiguation method on the basis of analyzing the feature of the abstract text of patent adequately. Combined with HAC, this paper have gotten the result of disambiguation by using the word vector representation on the basis of IPC and Vector Space Model, combined with HAC. According to the parallel experiments, we come to the conclusion that the method could disambiguate accurately with the measure value of 78.9 percent. Key words: 专利文本是集技术情报、法律情报和经济情报于一体的实用知识载体,是极为重要的科技信息来源[1]。专利实体作为专利文本中的核心对象,研究价值较高。专利实体的消歧是专利实体有哪些信誉好的足球投注网站的核心步骤,目标是解决专利实体有哪些信誉好的足球投注网站中同名实体的歧义问题,帮助用户准确定位目标信息。在专利文本的基础上进行实体消歧,就是将具有领域歧义的实体相关词按照不同的领域含义划分为不同的类别。因此,专利实体上的歧义消解实际上就是目标词的聚类过程,消歧结果的好坏就取决于聚类中目标词向量的原始特征选择。本文尝试了三种不同的特征选取方法,将目标词表示成特征向量,再进行类别划分。经过实验验证,使用基于IPC分类的特征生成目标词向量的方法取得了更好的效果。 本文共分为5部分内容,第1部分介绍了国内外的相关研究,第2部分介绍了本文提出的三种相关词特征向量表示方法,第3部分介绍了使用聚类算法进行专利实体消歧的过程,第4部分则是实验和分析,最后一部分是本文得出的结论与展望。 1 相关研究 实体消歧问题是当下比较热点的研究问题,国内外的大多熟研究从两个角度解决实体歧义造成的影响,分别是通过寻求更高质量的特征和引入外部资源辅助消解。 在特征选取方面,何正焱[2]利用DNN(深度神经网络)方法,提出了一种文档和实体的相似度为框架的消歧模型;姜丽丽[3]提出了一种基于带权图结构的框架来实现人物实体的消歧工作,并使用实体标签对每个人物实体进行标注;Bagga和Baldwin[4]将不同文档间上下文的相似度作为特征实现实体消歧的;R.Bekkerman和A.McCallum[5]则结合了社交网络的链接信息和聚类两种非监督的框架对社交网络中的人物实体进行消歧。 给定的文档集中所包含的被査询人的信息往往是非常有限的,因此网络公共资源经常被用来挖掘更多的信息以提高同名消歧质量。其中,中科院的韩先培[6]使用了在线知识库信息来辅助解决实体歧义的,D.Bollegara[7]通过扩展查询词来对Web有哪些信誉好的足球投注网站引擎中的同名人物实体

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档