从引文分析看网络数据结构挖掘.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从引文分析看网络数据结构挖掘.doc

从引文分析看网络结构挖掘 洪光宗 深圳图书馆 广东 深圳 518026 [摘要]本文在阐述引文分析的原理及作用的基础上,分析了网络结构挖掘的原理和作用,并给出了网络结构挖掘技术在有哪些信誉好的足球投注网站引擎中几例初步应用。 [关键词]引文分析 网络结构挖掘 网络数据挖掘 Analyzing Web Structure Mining From Citation Analysis Aspect Hong Guangzong Shenzhen Library, Shenzhen , Guangdong 518026 [Abstract]The method of web structure mining originates from citation analysis, the article at first sets forth the principle and function of the citation analysis, then analyses the principle and function of web structure mining. At present, the technology of web structure mining is applied into search engine and has got a good effect on it. [Keyword]Citation; Citation analysis; Web structure mining; Web data mining 1955 年,加菲尔德博士发表了具有划时代意义的引文索引论文Citation Indexes for Science: A New Dimension in Documentation through Association of Ideas》, 1964 年,推出了第一个世界各地的研究人员引文索引深入研究和评估他们的工作, 而是相互影响和相互联系的,不同文献间的联系突出表现在文献间的相互引用。那么,什么叫引文呢?简单而言,引文就是引用他人的著述。在科学著述活动中,作者往往要直接或间接地引用他人的著述,以提供文章的佐证,提供历史背景材料,来加强论述的可信度,帮助读者更好地理解作者的观点。详细而言,引文便可以这样描述:在文献甲中提到或描述了文献乙,并以文后参考书目或脚注的形式列出了文献乙的出处,其目的在于指出信息的来源、提供某一观点的依据、借鉴陈述某一事件(实)等。这时,便称文献乙为文献甲的引文,称文献甲为文献乙的引证文献。引文通常也称为被引文献或参考文献,引证文献通常也称为来源文献。文献间的相互引用,表明知识信息内容的继承和利用, 标志着学术研究的进展。 正因为引文在科学发展、学术研究中的特殊作用,对引文进行研究分析,可以让我们更清楚地发现文献间的内在联系。所谓引文分析,就是对专业人员论著之间的引用与被引用的现象运用统计、归纳、比较、抽象、概括等分析方法, 对科学期刊、论文、著者等各种分析对象的引用或被引用现象进行分析,以揭示各种文献集合以及与文献交流有关的各种集合特征和集合之间联系的文献计量研究方法。 引文分析作为一项学术成果,同时作为一种研究方法,其应用十分广泛。比如说,我们可以用引文分析法来进行机构和人才的评价,作为科学管理的工具;也可以用来研究引文间立体网络关系,从而提示科学发展、历史背景、前景等;还可以用来进行文献检索,对期刊地位进行学术评价等。 1.2 引文分析的原理   从宏观的角度来看,文献间引用和被引用的特有关系构成了文献信息的整体,整个文献信息构成一张网,这张网是以文献(作者或期刊)为节点、以文献引证关系为边的链型、树型、网型的结构,这些链、树、网可以用加权有向图统一描述。根据划分的标准不同,网络结构也不一样。   时序网络。在一组重要的具有代表性的引文中,每篇论文(或著者、或某期刊) 作为节点,按时间先后标以序号,连接这些节点并以引用次数或其被引率为权值,即构成引文时序网络图。时序网络图能够展示出某个研究主题的论文源流、最初著者以及该主题发展的来龙去脉,从中可以探讨科学技术的历史发展和研究规律。   同引网络。当两篇或两篇以上的文献共同被后来的一篇或多篇的文献引用,则称这两篇文献为同引,具有同引关系的两篇文献分别与其他文献构成同引关系,这些具有同引关系的文献形成的网络被称为同引网络。利用同引关系进行分析研究,可以展示和预测科学情报交流、传递的结果,同时也是文献检索的一种好方法。   耦合网络。若两篇文献共同引用了一篇或多篇文献,则称这两篇文献有耦合关系,如果多篇文献间具有耦合关系,则构成一个耦合网络。从文献耦合关系可以定量地分析文献,描绘出某一领域内的科学研究趋向,还

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档