h指数潜在缺陷.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
h指数潜在缺陷

h指数潜在缺陷   [摘要]指出Hirsch等人定义的h指数计算方法隐藏着一个可以被精确注水的重大缺陷,作弊者可通过对关键点施加引用的办法,即对引文数据流拦河建坝来达到快速提升其h指数的目的。针对这一缺陷分析其成因,指出其对引文数据价值和科学评价等的潜在危害;通过正常引文数据图和注水引文数据图的对比给出识别办法;最后提出一些预防建议。   [关键词]h指数 h指数增长关键点 h指数精确注水   [分类号]G250      科研人员的学术成就评价一直是一个棘手的问题,盛行的重论文数量轻论文质量的学术评价体系一直备受诟病。期刊影响因子虽然可以在一定程度上用论文发表载体的影响力来为论文质量背书,但仍不能准确表征论文的质量。在理想情况下,论文被引情况可以看作学界同行对文献内容价值的客观评价。加利福尼亚大学圣地亚哥分校统计物理学家赫希(Jorge.E.Hirsch)教授2005年发明的h指数就是一种利用论文被引情况来进行学术成就评价的新理论。其核心思想是:一个人的h指数是指他至多有h篇论文分别被引用了至少h次。赫希期望通过测定一个人的h指数,来判断他的论文影响力,并进而反映一个人的学术成就。该理论一经提出即在国际上引起很大反响,被普遍认为可以在一定程度上弥补传统文献计量指标在人物成就评价上的缺陷。本文指出h指数存在可以被人巧妙而隐蔽地精确操纵的重大缺陷,对造成这一缺陷的成因进行了深入分析,并给出了h指数精确注水的办法和弥补这一缺陷的具体建议。      1 h指数计算方法      h指数是由Hirsch提出的旨在评价个人成就的一种指标,用引文数来测度。Hirsch定义的h指数为:当且仅当一个科学家有h篇引文数至少为h的论文,同时剩余论文的引文数都小于h时,该科学家的成就分值为h。最初的h指数是基于SCI的,其测定非常容易:在SCI网站,查出某个人发表的所有SCI论文,让其按被引次数从高到低排列,往下核对,直到某篇论文的序号大于该论文被引次数,那个序号减去1就是h指数。   Hirsch认为h指数衡量的是一个人的全部学术成果能否经受长时间的考验,它的一个优势是很难通过自引来拔高,然而笔者对此的看法??并不乐观。笔者认为h指数的增长是完全可以被精确而隐蔽地操纵的。   笔者采用自己以前撰文介绍过的快速套取题录的方法,以南京大学版20种图情领域核心期刊为检索来源刊物,从CNKI套取题录信息。然后从中抽取第一作者信息,统计出图情领域近30年来第一作者人数为30274,其中发文量在5篇及5篇以上的为3911人。在对这些作者进行h指数统计研究的过程中,笔者发现了一个颇为隐蔽的与h指数相伴而生的缺陷――h指数精确注水问题。      2 h指数精确注水问题      笔者在对图情领域核心作者进行h指数实证研究的过程中,发现按照h指数的定义一些很有实力的作者的h值应该取较低的值,但是其h值以下的引文数据与h值颇为接近,有时甚至1次新加的引用即可改变作者的h值。这样的情况无疑是令人遗憾的,但这也暴露出h指数的设计存在一个很隐蔽的缺陷,即h指数的增长存在关键点。   按照h指数思想利用引文数据库提供的降序列表进行的h指数统计仅能看到单纯的h指数数字,无法看到同一作者所发表的全部文献的被引用情况,自然无法预见其h指数增长潜力。通过统计全部文献的被引用情况,可以发现h指数增长的关键点。比如,某作者被引9次以上的文献是9篇,第9篇的被引次数是9,第10和11篇的被引次数也是9,按照h指数的定义,其h指数只能是9。但是,如果该作者的第9篇和第10篇的被引次数各增长1,其h指数即可变为10,其总被引次数仅需增长2次;如果第9、10、11篇的被引次数分别增长2,其h指数即可变为11,而从宏观上看,该作者的总被引次数仅需增长6次。所以,h指数增长的关键点是指被引数量微不足道的增长即可显著改变h指数的文献。这些文献一股位于被引数量降序排列的h值附近,通过增加对它们的引用即可达到h指数快速增长的目的。由于h指数增长关键点的存在,作弊者通过自己或他人对处于关键点的文献施加次数很少的引用即可隐蔽地提升自己的h值。由于很难区分别引者的引文动机,所以这种作弊行为将与正常的引文行为毫无区别。笔者将这种隐蔽地对h指数增长关键点施加影响以达到快速提升h指数目的的作弊行为称为h指数精确注水。      表1为三名作者所发文献被引数降序列表,根据h指数的定义,作者A1、A2和A3的h值分别6、4和2,其中作者A1和A2的h值以下的被引数均与其h值极为接近。表1同时给出了对三位作者引文数据实施精确注水,将其h值提升5级所需的最小引文数。如果作者A1的第7篇文章被引数增加l,其h值即可提升为7;如果第6、7、8篇文章的被引数分别增加1、2、4次,共增加7

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档