- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络资源特点与自动化采集技术方案
网络信息资源的特点与自动化采集的技术方案策划 ——以图书馆为例 网络资源的特点 网络信息资源作为一种经济资源,具有经济资源的一般特征,但与其它物资资源相比,又有着自己的特点。 1、数量巨大网络信息资源量大,内容丰富,信息增长较快。如中国学术期刊网有时一天所增加的新文章就达多篇。作为一种全新的信息媒体,网络不仅信息量大和传输方便,而且不受时空限制,并且具有共享性。随着计算机硬件技术,特别是光盘技术、海量存储等技术的发展,为大容量、高速度、高稳定性的网络服务器提供了发展条件。随着计算机信息处理能力的不断增强和数字化技术的广泛应用,许多形式的信息都可以在网络中存储和传递。因此,网络信息资源将越来越丰 2、类型多样 因特网内容包罗万象,覆盖了不同学科、不同领域、不同地域和不同语言。在形式上,包括文本、图像、声音、软件、数据库等。既有公开出版发行的图书报刊、又有非公开发行的会议文献、学位论文、内部资料以及网上的“灰色文献”。网络文献不仅有题录、摘要,而且还有不少全文文献。此外,还有许多电子出版物、专门的文献数据库及数字图书馆等资源。 3、结构复杂 网络信息资源分别存储在世界不同国家、不同地区的服务器上。对信息资源的组织管理没有统一标准,不同的服务器采用不同的操作系统及数据结构,如有的采用字符界面,有的采用图形界面有的采用菜单式,有的采用超文本方式从整体上看,基本处在无序的状态。如今有不少 服务器是用等中间件与其它数据库连接起来的,因而在管理和利用方面比较复杂。 4、质量参差不齐 网络信息资源具有不同的层次与效用,既有科学前沿的研究报告,也有大众通俗读物既有已经加土整理的信息,也有无序的原始信息既有较大参考价值的信息,也可能混有毫无用处的“信息垃圾”,甚至还有不少有害的信息。利用的价值差异较大,信息质量参差不齐,并且相互混杂交织在一起,为用户选择利用带来了不便。 5、用户差异大 网络以其信息资源丰富、类型多样、利用方便等特点,吸引着众多的用户。用户群体和他们的信息需求表现出多样性,用户信息需求的变化频率加快用户需求日趋个性化,部分用户需求趋向更???专门化。 6、数字化 网络信息资源是以数字化的形式,也即二进制形式存贮于全球范围内大大小小网络的主机上,并通过现代计算机网络和通讯网络广泛传播。 7、动态性 网络信息资源是一个动态系统,许多服务器处在不断的变化之中,每天都有新的网站出现,有的合并,有的取消。因此,网络信息更新迅速,网页的增加、删除、更新地址经常发生,信息的时效性强。因特网改变了文献处理和获取信息的方式,由于网页更新周期缩短,使有关的内容处于一种动态的变化中。在网上能得到必威体育精装版的资料以及某个学科或某项科研的必威体育精装版动态,能检索到最近出版的文献。有些网络电子杂志甚至比印刷本发行还快,预印本的文章比正式印刷出版可提早与读者见面。 8、无序性 由于,没有一个主管机构进行集中领导和管理,尽管晚上有大量高质量的、有序的信息,如从某个局部、某个网页、数据库来看是有控制的、相对集中的、有序和规范的,但整个网络信息资源的分布出现混乱、无序的状况。 9、共享性 网络信息资源内容的数字化,使其可以打破传统文献信息资源的限制,可以不断地复制,可以多个人同时去使用网络信息资源的网络化传递,使其可以消除传统文献信息资源的时间和空间包括国界和语言的限制,各地的用户可以不受限制地利用网络信息资源。 10、互动性强 网络信息资源具有强大的互动功能,可以形成广泛的论坛氛围,有关专家可以就某一专题开设电子论坛,网上直接反馈读者信息,参与交流讨论。作者、出版者和读者可以通过网络直接交流沟通。而传统的文献信息资源则不具有这个优势。 11、关联程度强 传统文献信息资源的关联能力比较差,它主要通过参考引用文献来指导读者阅读和核对所引用的资料,如果用户找不到所引用的原始资料,那么就无法对某一资料进行详细地分析和研究。而网络信息资源则不同,它可利用超文本技术,通过超级链接手段,构成立体网状的联系,各个国家、各种服务器、各种网页、各种文章上的相关信息都可以通过结点连接起来,从而直接指导用户去查阅所引用的原始文献。 针对网络资源的自动化采集技术 (一)、采集方式 自动搜集 自动搜集指用一种网络机器人(网络爬虫)的软件在因特网上漫游,定期地到指定的网站自动搜集网上从了、和站点上的各种相关信息,并且把这些信息存于本站点上,然后再对其进行加、组织和提供服务。 人工搜集 人工搜集信息的工作由网站管理员完成,包括查阅书目、报刊、有关工具,利用商用数据库,浏览因特网以及利用政府机关、国内相关机构、相关学术活动与商业活动等进行信息搜集。通过信急搜集,获得该学科或领域有关的研究机构、电子图书、学术期刊、会议论坛、专家学者及其他相关的网址。这种搜集方式的优点是链接站点经人工选择,相关度较高。其缺点是效率
文档评论(0)