- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代的高校图书馆数据管理研究.doc
大数据时代的高校图书馆数据管理研究
摘要:大数据时代,图书馆服务过程中会产生大量的数据,完善的数据管理工作可以促进图书馆的数据统计工作,从而提高图书馆的服务质量。如何对这些数据进行管理,是一个系统而复杂的工作。文中试图构建一个数据管理框架,为图书馆未来发展提供数据基础。
关键词:大数据;数据管理;高校图书馆
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)29-0005-02
“大数据”是近几年来信息科技领域最热门的词,越来越多的人开始关注它。大数据也给图书馆带来了全面的冲击。 图书馆的职责是促进人类知识的交流与利用,有着存储知识的功能,对存储的文献知识和信息进行组织、整理,促进其交流和利用。图书馆与知识和信息紧密相连,而数据概念的外延与信息和知识的外延本身就交错重叠,不可分割,数据是图书馆馆藏资源的重要组成部分。因此,对于图书馆来说,大数据的到来首先要解决的问题是如何将数据更好地存储和管理。
1 大数据概述
“大数据”概念是伴随着现阶段数据增长的爆发趋势提出的。“大数据”是什么呢?从字面上理解,容易被理解为海量数据,目前也没有统一的定义。
1.1大数据研究现状
大数据经过这几年的发展和研究成果显著,杨绎[1]、韩芳芳、王新才等分别对我国大数据研究现状进行了总结,黄永勤[2]对国外大数据的研究热点进行了总结,薛辰[3]、李贺[4]等分别对国内外的大数据研究进行了综述。
1.2大数据应用现状
大数据已经不同程度地渗透到每一个行业领域和部门。数据里隐藏着巨大的商业价值,在未来的经济中将会起到不可替代的作用。目前,大数据的应用已经在电子通信、网络技术产业,甚至是工业、重工业等行业发挥了作用。特别是电子商务上,如淘宝、京东、亚马逊等通过对海量数据的掌握和分析,为用户提供更加专业化和个性化的服务。
1.3高校图书馆中的大数据
图书馆历来是信息技术应用的重镇,“大数据”时代亦不例外。图书馆在为读者服务过程中必然会产生大量的数据,因此图书馆中的大数据主要的来源有以下几种 :一是有图书馆内部产生,如图书馆自身的馆藏资源(纸质图书、电子书、各类期刊论文数据库、自建特色数据库等)、固定资产、馆舍情况、读者借阅数据、读者社交网络数据等;二是图书馆外部的开放性的数据,如馆际互借数据、出版商数据等。
2 数据管理概述
2.1数据管理定义
当前有关数据管理的定义有不同的表达,本文采用百度百科中对数据管理的定义,“数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。目的在于充分有效地发挥数据的作用。实现数据有效管理的关键是数据组织。”即对图书馆管理与服务过程中产生的数据进行有效管理。
数据管理[5]经历了人工管理、文件系统、数据库系统三个发展阶段。20世纪50年中期以前,属于人工管理阶段,数据不共享,不具有独立性,主要用于科学计算,没有相应的软件系统来管理数据。20世纪50年代后期到60年代中期,属于文件系统阶段,出现磁盘、磁鼓等存储设备,数据可以长期保存,有了专门管理数据的软件,成为文件系统,但数据共享性差、冗余度大。20世界60年代后期以来,这一阶段为数据库系统阶段,出现了大容量磁盘,数据能尽可能多的为应用程序服务,出现了数据库这样的数据管理技术。数据库的数据是面向全组织,具有整体的结构性,共享性高,冗余度减小,具有一定的程序与数据之间的独立性,对数据进行统一的控制。
2.2数据管理的必要性
1)大数据时代凸显数据重要性。大数据是数据分析的基础。没有对海量信息分析的大数据,就没有为所有信息消费者获取有价值信息的可能性[6]。
2)图书馆运营中产生大量的数据。近年来,计算机互联网技术的强大功能已经应用到图书馆的日常运营中。各类管理系统在图书馆服务过程中产生了各种数据,如读者数据、馆员工作日志、图书借阅数据、网站点击数据等。这些数据呈现几何级数递增趋势,应得到有效应用。
3)数据管理是图书馆数据得到有效应用的基础。图书馆所拥有的数据量在不断增加,但图书馆能够分析的数据比例却在不断降低。图书馆各个管理系统在设计之初不一定会考虑到数据的统一性问题,这会导致产生的数据不一致,不能完全整合等问题。大数据时代,要充分利用大数据所带来的技术优势的前提就是对图书馆的海量数据进行有效数据管理。
2.3大数据时代的数据存储管理
大数据存储随着大数据计算的发展也已经历时十多年,下面介绍两个比较著名的大数据存储方案[7]。
1) HDFS
HDFS(Hadoop Distributed File System)是支持Hadoop计算框架的分布式大数据存储系统,已经被广泛
文档评论(0)