- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种用于专利实体的实体消歧方法.doc
文章编号:XXXX
一种用于专利实体的实体消歧方法
王琰炎,王裴岩,蔡东风
(,,关键词中图分类号:文献标识码:AAbstract: Patent Entity is a significant entity that used to express patents, utility models, and appearance design, as the kernel of patent text, patent entity is the absolute focus of entity search users. Patent Entity Search is the first step of Patent Information Extraction, and the entity disambiguation of patent is the most important operation of Patent Entity Search, which is divide relative words to different types according to different domains. Apply entity search technology to the abstract text of Chinese patent, make use of the technology of entity disambiguation, which can get the relative information that the user concerned. This paper propose a disambiguation method on the basis of analyzing the feature of the abstract text of patent adequately. Combined with HAC, this paper have gotten the result of disambiguation by using the word vector representation on the basis of IPC and Vector Space Model, combined with HAC. According to the parallel experiments, we come to the conclusion that the method could disambiguate accurately with the measure value of 78.9 percent.
Key words:
专利文本是集技术情报、法律情报和经济情报于一体的实用知识载体,是极为重要的科技信息来源[1]。专利实体作为专利文本中的核心对象,研究价值较高。专利实体的消歧是专利实体有哪些信誉好的足球投注网站的核心步骤,目标是解决专利实体有哪些信誉好的足球投注网站中同名实体的歧义问题,帮助用户准确定位目标信息。在专利文本的基础上进行实体消歧,就是将具有领域歧义的实体相关词按照不同的领域含义划分为不同的类别。因此,专利实体上的歧义消解实际上就是目标词的聚类过程,消歧结果的好坏就取决于聚类中目标词向量的原始特征选择。本文尝试了三种不同的特征选取方法,将目标词表示成特征向量,再进行类别划分。经过实验验证,使用基于IPC分类的特征生成目标词向量的方法取得了更好的效果。
本文共分为5部分内容,第1部分介绍了国内外的相关研究,第2部分介绍了本文提出的三种相关词特征向量表示方法,第3部分介绍了使用聚类算法进行专利实体消歧的过程,第4部分则是实验和分析,最后一部分是本文得出的结论与展望。
1 相关研究
实体消歧问题是当下比较热点的研究问题,国内外的大多熟研究从两个角度解决实体歧义造成的影响,分别是通过寻求更高质量的特征和引入外部资源辅助消解。
在特征选取方面,何正焱[2]利用DNN(深度神经网络)方法,提出了一种文档和实体的相似度为框架的消歧模型;姜丽丽[3]提出了一种基于带权图结构的框架来实现人物实体的消歧工作,并使用实体标签对每个人物实体进行标注;Bagga和Baldwin[4]将不同文档间上下文的相似度作为特征实现实体消歧的;R.Bekkerman和A.McCallum[5]则结合了社交网络的链接信息和聚类两种非监督的框架对社交网络中的人物实体进行消歧。
给定的文档集中所包含的被査询人的信息往往是非常有限的,因此网络公共资源经常被用来挖掘更多的信息以提高同名消歧质量。其中,中科院的韩先培[6]使用了在线知识库信息来辅助解决实体歧义的,D.Bollegara[7]通过扩展查询词来对Web有哪些信誉好的足球投注网站引擎中的同名人物实体
您可能关注的文档
最近下载
- 电工技能鉴定实操题库(高级工).pdf
- GB/T38058-2024民用多旋翼无人机系统试验方法.pptx VIP
- 公园绿化养护管理制度 .pdf VIP
- 2025甘肃甘南州专业化管理的村党组织书记招聘45人笔试备考试题有答案详解.docx VIP
- 2023-2024学年重庆市凤鸣山中学数学七年级第一学期期末经典试题含解析.doc VIP
- 必威体育精装版公务员面试试题经典题及答案.docx VIP
- 长恨歌意象研讨分析.pdf VIP
- 2025甘肃张掖市专业化管理村党组织书记招聘32人备考试题及答案解析.docx VIP
- 江西省临川第一中学2024-2025学年高一上学期开学考试数学试题(解析版).docx VIP
- QSR质量手册(超详模板).doc VIP
文档评论(0)