大数据带给图书馆的影响和挑战
2014-04-07石岱
石岱
(黑龙江大学信息管理学院,黑龙江哈尔滨150080)
如今,大数据对于我们并不陌生,大数据这个词也并不生疏,早在1980年代,美国就有人提出了大数据的概念[1]。而将“大数据”作为全球性发展战略计划,则始于2012年2月美国奥巴马政府宣布推出的“大数据的研究和发展计划”,该方案计划投资两亿多美元,在美国国家科学基金、美国国防部等6家政府部门协作下,大力推动及改善与大数据相关的采集、组织、分析、决策工具及技术[2]。
1.大数据
1.1 概念
业内对大数据没有一个统一的概念,但是比较公认的是以下这种说法。大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
1.2 特点
大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(精确)。第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。以前的数据结构单一,现金则呈现出结构复杂的特点,结构化、半结构化、非结构化数据使对于大数据的处理更加复杂;第三,价值密度低,商业价值高。价值密度低体现在海量数据中可能仅有仅一少部分有效信息,但这少部分的有效信息却富含商业价值;第四,处理速度快,1秒定律。这点也是与传统数据挖掘不同的体现。
“大数据”与“海量数据”并不完全相同,“大数据”在数量上包含“海量数据”,但“大数据”在时间或速度维度上又区别于“海量数据”。结构的复杂化,处理数据的速度和效率都有别于“海量数据”。
1.3 大数据的影响
1.3.1 大数据将成为一种新的决策工具
2009年爆发的甲型H1N1流感,谷歌公司通过google浏览器中隐藏的大量数据对用户检索进行分析,从而预知了流感的发生,并确定了传播区域,从而带给公共卫生部门极有价值的信息,大大缩短了研究时间,而这个预测比疾控中心的判断提前了一两周的时间。
美国的Farecast飞机票价预测系统,也通过各种旅游网站获得大量数据进行分析,从而帮助乘客选择最佳购票时机,并降低了购票成本。
大数据的预知与决策的功能将帮助我们更好地分析与决策,节省不必要的时间与成本,从而带来更高的收益。
1.3.2 信息技术与各行业的深度融合
大数据时代下对各行业的发展都提出了新的挑战。医疗、教育、金融、IT等行业都呈现出巨量增长的数据。而有专家则提出,未来10年,大数据及其分析将改变几乎每一个行业的业务功能。美国大公司平均拥有的数据量,远超过美国国会图书馆所有的数据量,而这些数据则有可能改变其业务功能。
1.3.3 大数据推动新发展
大数据的特点之一就是结构的复杂性,而这些复杂的结构需要更新的技术来支撑分析。大数据的到来无疑会带动新的技术的发展,而大数据的有效利用,也依赖于技术的保障,只有更新、更有力的新技术才能更好地利用大数据。
2.大数据和图书馆的关系
2.1 大数据的积累,为图书馆带来了海量信息
由于信息技术的发展,尤其是大数据时代的到来,数据的积累与技术的结合,促进了图书馆中数字资源的产生。这种电子资源的数量和种类都与日俱增,正在超越纸本资源。据调查,全球新产出的信息量每3年翻一番,大约90%的信息都是以数据形式储存[3]。如此巨大的数据增长,就需要图书馆对于数据存储的能力有一定要求。
2.2 网络技术的提高,高速网络的实现,移动电话的便捷,给移动图书馆带来了更大的空间
根据中国互联网络信息中心(CNNIC)今天对外发布《第32次中国互联网络发展状况统计报告》显示,截至6月底,我国网民规模达5.91亿,较2012年底增加2 656万人。新增网民中使用手机上网的比例高达70%,而半年期新增网民中农村网民占54.4%。网民数量的剧增与移动网络的便捷都使得移动图书馆更加便利。
3.大数据对于图书馆的影响与挑战
3.1 对于技术的要求
大数据的到来,对于数据处理的技术要求提升,传统的数据处理满足不了多结构化、海量信息的要求。馆藏信息量的增大,要求图书馆的数据处理技术的提升。不仅是处理结构化、半结构化数据,非结构化数据的处理也成为数据处理的一部分,各种非结构化的数据又增加了大数据的复杂性。对数据的掌握将成为图书馆的核心资产,而对这些数据的利用则需要处理技术的支持。图书馆可以根据数据的分析来掌握用户借阅习惯,根据数据分析服务消费记载,提高服务质量等。
3.2 对于人员的要求
在面对大数据的时候,图书馆人员对于大数据的认知和理解局限了对于数据的进一步分析加工,对于图书馆及其人员来说,大数据还十分陌生,并不是所有人员都能够很好地处理分析所接收到的大数据,可能会将有可能有价值的信息忽略掉,从而使其失去价值,或者对于处理和分析大数据的能力尚未掌握,也会导致大量有效信息的流失[4]。所以这更需要图书馆相关人员对于大数据相关知识的进一步了解与认识。
3.3 对于存储能力的要求
现代完备的图书馆不仅有图书借阅信息、借阅人员信息外,还大量存储了图书本身的资料数据,尤其是大型或者学校的图书馆,各类书目、内容与数量上都很多。当前大型图书馆每年的数据增量大约为20~30TB,如此浩大的数据量,对于一个拥有100TB存储容量的图书馆也只能满足3~5年的数据存储需要。但是现今图书馆的存储设备的利用率低,还不过总容量的一半,还有很多的空间可以挖掘。这需要图书馆在数据存储方面作出改变,可以利用压缩技术、消重技术、提高空间利用率等手段,对馆藏数据进行整理整合,完善存储[5]。
3.4 对于改善服务的要求
图书馆的智能化服务已经是大数据时代下图书馆发展的趋势,不仅需要智能化的技术处理、分析数据,更需要智能化的服务来面对读者。服务的内容和手段的智能化提高有利于服务对象的满意度提高。智能化的分析大量并且结构复杂的读者数据,了解读者阅读习惯,有利于推送等服务的开展,有利于图书馆服务的开展[6]。
4.结束语
大数据时代的到来,给很多领域带来了机会和挑战,对于图书馆情报领域也不例外。大数据的海量特征为我们能找到所需信息提供了可能性,但同时其结构的复杂性又对数据处理技术提出了更高的要求。图书馆作为现代社会中公共信息服务体系必要的组成部分,不可避免地会受到社会技术应用潮流的影响,对于大数据的掌握是将图书馆的发展走向现代化的必经之路。技术上的提高与图书馆相关人员知识的提升都影响着大数据时代下图书管的发展,所以,图书馆若想在大数据时代良好的发展,应该了解大数据并合理利用大数据,对现在模式进行改善,从服务、人员培训、技术更新等方面提出要求。提升其核心竞争力,以最优状态在大数据时代中发展。
[1]张文彦.大数据时代的图书馆初探[J].图书与情报,2012(6).
[2][4]樊伟红,李晨晖,张兴旺,秦晓珠,郭自宽.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11).
[3]朱静薇,李红艳.大数据时代下图书馆的挑战及其应对策略[J].现代情报,2013(5).
[5]罗彬,阳静,袁赟.数字图书馆中大数据存储的应用研究[J].科技与企业,2013(18).
[6]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1).