基于汉语科技词系统的专利文献标引及应用研究.PDF

基于汉语科技词系统的专利文献标引及应用研究.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于汉语科技词系统的专利文献标引及应用研究

本期话题 http: // 基于汉语科技词系统的专利 文献标引及应用研究* □ 张兆锋 / 中国科学技术信息研究所 北京 100038 / 南京大学信息管理学院 南京 210093 桂婕 张运良 / 中国科学技术信息研究所 北京 100038 刘喜文 / 南京大学信息管理学院 南京 210093 摘要:文章介绍了利用汉语科技词系统的词表及词间关系对中文专利文献进行主题标引的研究进展,根据 专利文献的特点设计了相应的标引策略和流程,并进行实验及结果分析,证明了本标引方案的有效性,最后对标 引结果在专利检索中的应用特色进行了介绍。 关键词:标引,专利标引,主题标引,科技词系统 DOI :10.3772/j .issn .1673—2286.2013.11.003 1 引言 深度挖掘,如文献自动分类和相似 2.1 专利标引概述 性计算等。为了更有效地利用专利 专利作为一种科技文献,与 文献资源,服务于技术创新、科研 专利标引指用一个或多个词来 期刊论文相比,它提供更全面、更 和支持管理决策,本文尝试基于汉 表现专利内容特征及相关技术、算 [2] 直接的技术信息,其内容具有广泛 语科技词系统对中文专利文献进行 法、组件的过程 。根据自动化程 性、可靠性、创造性、实用性的特 主题词标引,进而给每篇专利赋予 度可分为手工标引、机助标引和自 点,是掌握必威体育精装版技术的重要信息源 主题词,以便更好地揭示资源,充 动标引;根据标引的词语的来源不 [3] 之一。据研究,全世界的发明成果 分利用专利文献,实现专利信息的 同,可分为抽词标引和赋词标引 。 70%~ 90% 出现在专利文献中。如果 精准检索及与主题相关的分析挖掘 专利标引的主要对象是专利主题、核 充分利用专利文献,可以缩短60%的 服务。 心技术、重要算法、关键部件等,便 [1] 科研周期,节约40%的科研经费 。 本文在接下来的章节会首先简 于建立专利内容层面的知识关联, 专利文献是科技创新的体现,同时 要介绍现有的文本标引方法,基于 实现对隐含信息的挖掘。李宏芳等 又是创新的基础。随着十八大“实 此提出本文采用的标引方法,并介 人对三个较权威的中文专利数据 [4] 施创新驱动发展战略”,作为创新 绍相应的词表及标引策略设计。然 库的标引质量进行了测评 ,发现 载体的专利文献资源的挖掘与利用 后进行实际的标引程序开发实验, 中文专利数据库的主题标引深度不 必将受到越来越多的重视。 并对实验结果进行分析,总结此种 够,对非题名关键词的标引不足, 专利文献与科技论文相比,无 标引方法的优点和不足,最后对标 不便于从内容层面对相似题名的专 关键词字段。因此它不能像论文一 引的结果的应用场景进行设想。 利进行区分检索。同时,由于目前还 样可通过关键词准确地揭示论文的 是以手工标注为主,标引效率较低, 主

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档