大数据影响下的图书馆应变策略
2015-02-22赵雪峰
大数据影响下的图书馆应变策略
赵雪峰
(东北财经大学图书馆,辽宁 大连 116400)
摘要:大数据作为一项新兴信息技术,给大众信息库——图书馆带来了各方面的影响,具体表现在服务重点与用户需求、数据规模与类型、信息的采集模式与方法、存储能力、组织模式、信息服务方式和内容及其他信息服务等维度上。在合理界定大数据的基础上,系统分析大数据给图书馆发展带来的具体影响,并尝试探讨图书馆应变的相关对策,是图书馆在大数据潮流中与时俱进、科学发展的客观需要。
关键词:大数据;图书馆;信息服务;技术
中图分类号:F250.7
文献标识码:A
文章编号:1008-4681(2015)01-0047-03
收稿日期:2014-12-2
作者简介:赵雪峰(1976— ),男,辽宁大连人,东北财经大学图书馆馆员,硕士。研究方向:图书馆管理。
Abstract:As a newly developed information technology, big data exerts great influence on public information database, library, in all aspects, including the emphasis of service and the need of users, the scale and style of data, data collection mode and method, the capacity of storage, the pattern of organization, the mode and content of information service and so on. The paper systematically analyzes the specific impact which big data brings to libraries and explores relative countermeasures, which are objective requirements for the library to advance with the time and develop scientifically in the big data trend.
目前,关于大数据的实践已从局限于少数象牙塔之中的学术精英圈扩大到了普通的机构、企业和政府部门,已经在社会的不同领域产生了深刻的影响。鉴于此,唯有迎接挑战、破旧学新、总结变化的影响,并在此基础上不断完善创新图书馆的服务、管理机制才能适应数字信息环境的转变给社会大众带来的急剧变化和挑战,进而克服和破除价值质疑、贡献边缘化、技术落后和人员队伍不适应等一系列相关问题。
一大数据的学理释义
一提到大数据,不知其意的人一定认为它表示数据规模庞大,有海量的数据。其实,大数据的真实意义不能仅用数量上的庞大来表示,它经过了超大规模数据、海量数据,再到大数据的发展历程。
一些研究者对大数据提出了不同的看法,比如Gartner公司提出,大数据作为高速度、大容量、多样化的信息集合,必须采用新型的管理方式来提高数据的整合与利用,实现企业流程的优化,并不断提高决策者的洞察力和决策能力。再比如Information中国区首席顾问但彬认为,大数据虽然内容上包含了海量数据的含义,但是仅仅把大数据简单理解成海量数据就忽略了数据复杂性的重要性。另有资料这样描述大数据:大数据又可以称为企业无法在短时间内透过现有的文字软件、读写工具获取、整合和应用,使海量数据成为其提高企业决策支持的巨量资料[1]。目前业界对大数据的界定模式依旧比较简单,如利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集[2]。而IBM公司认为大数据具有4V特征,分别指规模性(volume)、高速性(velocity)、多样性(variety)及价值性(value);此外,IBM公司认为,大数据为用户提供了应对新的或潜在问题的洞察机会和解决方案,并使得其流程更加灵活[3]。而IBM公司认为大数据所具有的4V特征的观念也将贯穿于下文。
综合上述观点,考虑本文内容宜采用如下定义: 大数据的描述是伴随数据海量和数据类型激增应运而生的大规模、多样化的数据集合,以及提取知识、价值对数据集高速采集、分析、处理的技术结构域过程[4]。
二大数据给图书馆发展带来的影响
虽然大数据的应用多集中于企业,但图书馆所拥有的文献信息具有数据规模巨大、更新周期短、文献类型多样、载体数字化、语种多样性和内容交叉等特征,这些特征都具备大数据的特征。图书馆相关人员应该深刻了解大数据时代特征,在采集、分析、处理数据中,提取知识价值、构建技术框架,发现大数据对图书馆产生的影响,才能更好适应大数据时代的发展要求。
(一)服务重点和用户需求发生变化
不论是美国大选,还是地震海啸的预测,亦或淘宝购物,许多领域都充分利用大数据分析的手段,大数据已经成为一个众人瞩目的焦点。随着网络时代的发展,传统图书馆很难单以资源来吸收读者,图书馆应该既重视资源又重视个性化服务,利用大数据分析这一重要手段获取读者偏好,为读者提供个性化服务。
用户需求方面的变化比较明显。传统的服务都只为用户提供数据或信息,它包括整篇的相关文献、资料或其他知识产品;大数据时代下用户更加重视图书馆是否能为自己解决具体某一个问题,而不是单单的搜寻资料。这一区别显示了图书馆在服务的专业化和知识化水平视角下的用户需求发生的变化。除此之外,用户之间关系数据、用户与群组、科研小组之间相互关系的数据和信息更是在大数据时代用户需要的信息服务[5]。
(二)数据规模有所扩大,类型更加繁多
从规模来看,当前的数据规模已从以前的TB级别跃升到PB级别( I为1000个T,E为100万个T,Z为10亿个T)。数据规模的扩大无疑会给图书馆带来变化,图书馆也将会有一个新的适用过程。
从类型来看,数据类型也会更加繁多。网络日志、视频、图片等类型的出现,非结构化数据的增多也将会给传统信息处理能力带来极大的挑战。统计数据显示,世界结构化数据增长率大约是32%,而非结构化数据增长率则是63%,到2012年为止,非结构化数据已占互联网整个数据量比例的75%以上。就图书馆而言,非结构化数据虽与之相伴,但并没有得到图书馆的重视和研究。图书馆应该把结构化数据与非结构化数据相结合,充分发挥数据的功能。
综合两个方面,从大数据的四个特征中的两个“v”,即类型多和规模大,我们可以了解到大数据在这两点上的“魅力”和给图书馆带来的变化和挑战。
(三)信息采集模式发生变化
信息采集是信息处理的第一步,是大数据价值挖掘最重要的一环,其后的集成、分析、管理都基于信息采集[6]。传统的信息采集方式主要是网络蜘蛛、地毯式收索,采集内容一般结构化的出版物,例如期刊、专著、学位论文、电子书、会议报告等。但大数据时代下的数据类型较多,只能用非结构化数据库来解决。图书馆必须采用新的采集模式:依据图书馆自身的特征、管理模式,采用适合的、符合图书馆管理的采集模式。这一提议应当得到图书馆界人士的重视和思考。
(四)信息存储能力受到挑战,组织模式发生变化
信息存储(information accumulation)是将获得的或加工后的信息保存起来,以备将来应用。信息存储并不是一个独立的环节,它贯穿于信息处理的全过程。
谷歌公司每天都要处理24拍字节的数据、Facebook每天更新的照片量超过1000万张、YouTube每月接待多达8亿访客,这些正说明了数据的高速性。数据的增长幅度已经远远超出数据的存储和处理能力。图书馆的数据存储已经不能停留在结构化数据,非结构化数据的不断增多,原有的存储方式应该是进行升级的时候了。
针对信息的组织模式而言,传统的模式和大数据时代下的信息组织模式有明显区别。传统的信息组织模式仅为用户提供简单的信息服务,而大数据时代下的信息组织模式是为用户提供个性化、精确化的知识服务。主要体现在两个方面:第一,通过深入分析,可以对采集、存储的数据挖掘出有利用价值的信息;第二,大数据时代下的图书馆信息组织和分析更加注重用户信息的挖掘,旨在为用户提供独特性、精准化的服务。
(五)对图书馆信息服务产生一定影响
大数据时代的到来使得信息的服务方式和内容发生改变。大数据背景下,图书馆的竞争力已不再是体现在信息资源的数量、范围上,而是在于所提供的产品的信息化和知识化水平及其基于知识的创新力竞争。在收索需要的资源时,人们更倾向于利用图书馆中的数据库资源。这种既方便又快捷的方式,受到大数据背景下人们的热捧。
除了信息服务方式和内容的改变,大数据还加快了图书馆服务技术变革,推动图书馆服务模式创新,促进图书馆服务能力提升,并且还推动了图书馆服务的跨界合作。图书馆信息服务方面离不开大数据的应用。所以,图书馆相关机构要充分重视大数据对图书馆信息服务产生的影响,做好大数据时代的信息服务工作。未来,大数据坏境下的图书馆服务可能更加注重强化信息的集成服务、数据分析与挖掘、新型资源的收集、服务内容时效性,并且图书馆要想在大数据时代激烈的市场竞争中处于相对有利的地位,还必须广泛深入地开展用户数据分析。随着互联网的重心正逐步向移动互联网方向发展,图书馆的服务方式也将转向移动互联网。
三图书馆应变的策略分析
针对大数据给图书馆带来的变化,图书馆应该转变观念,正确理解大数据内在涵义,认识大数据技术的重要性,积极学习大数据相关技术,加强大数据人才队伍建设和管理机制的建设,这其中,大数据人才培养是策略之重,大数据相关技术的应用与发展离不开良好的教育和培养。不论大数据所带来的是机遇还是挑战,图书馆都应加以适应,从容应对,总结经验,做好大数据在图书馆应用的前景预测和分析,经受实践的考验。
(一)转变观念,正确理解大数据的涵义和特点
大数据已经在许多商业领域中被应用,但效果究竟如何尚无定论。一些科学的新事物在出现之前总是会受到质疑,但图书馆是传播知识的窗口,应该引领时代潮流,敢于接受,敢于尝试,转变观念,正确理解大数据内在涵义。其次,要深刻体会大数据规模大、类型多、速度快、价值性的特点,应用好大数据带给图书馆的机遇,应对好大数据带给图书馆的挑战。针对大数据四个特点图书馆应该明确四个基本问题:如何解决数据规模大的前提下数据的处理问题;如何解决数据在呈指数级别速度增长的背景下对数据的分析处理,避免数据结果过时的问题;面对数据类型和结构的复杂多样,如何处理非结构化数据等问题;面对数据巨大的价值量,图书馆如何才能发现新知识、创造新价值、提升竞争力。
(二)认识大数据的重要性,积极学习大数据相关技术
作为一项新信息技术,大数据能够帮助图书馆建立和完善新的知识服务方式,为图书馆拓展公共服务提供强有力的技术支撑。目前最为流行的大数据处理平台是 Hadoop,另外还有较多大数据处理工具,如 MapReduce等[7]。大数据技术可以帮助图书馆获得准确、及时的用户数据,并且还有助于管理者及时了解图书馆最新知识服务的趋势并及时而准确地作出决策、调整服务方向。这些作用有助于图书馆开展公共服务,同时,可以为用户提供更多的便利,进而提升公众的满足感,增强公共图书馆的核心竞争力。毋庸置疑,大数据技术的应用可以体现在图书馆管理中,图书馆管理人员应正确认识大数据时代所带来的优势与便捷,积极学习、应用大数据技术,才能适应大数据的影响并且充分发挥该技术的价值。
(三)加强大数据人才培养,提升图书馆队伍素质
研究大数据方向的人才大多是精通数学、统计学,并能够熟练进行数据分析、商业分析和自然语言处理;数据科学家应该是集数学、统计学、机器学习等于一身,并能综合掌控、熟练应用的复合型人才。
从人才培养角度来讲,对于图书馆相关专业的学习应该加强大数据技能的教育和培养,为图书馆数据科学家队伍的形成提供保障。目前,我国有许多企事业单位和机构已经重视大数据人才培养,并且做出了里程碑式的工作。2014年8月15日在“大数据时代企业创新发展”主题高峰论坛上,中国科学院大学管理学院EDP中心与工信部软件与集成电路促进中心联合启动了“国家信息技术紧缺人才培养工程(NITE)——中国科学院大学大数据分析高端培养与认证”项目。这一项目启动了大数据分析高端培训与资格认证高级研修班,并且首次面向全国招生。该课程紧紧围绕大数据的核心技术和技术的实际应用。图书馆领域也应该借此东风培养图书馆行业的大数据“科学家”。
从图书馆队伍角度讲,当前图书馆的管理人员大多是以图书馆学以及计算机为主修专业,这些人才在求学阶段对大数据技术的接触甚少,并不能将其掌握、应用到图书馆管理中来,无法更好地应对大数据时代的挑战。对此,相关部门应做好两方面工作:第一,调整招聘方向,引进一些涉及统计学、图书馆管理、计算机应用的复合型人才;第二,对原有的图书管理员进行大数据相关技术的培训,提升队伍素质。
对于图书馆大数据管理机制的建立大体上可从国家的大环境和图书馆范围内两个方面来考虑:首先,国家应该把图书馆规划在国家大数据战略范围内,与大数据背景相适应,用大数据战略引导图书馆的大数据,推动建立信息资源共建共享机制。其次,在图书馆内部对于大数据的管理应当形成链接式的完整的数据处理和管理过程,这其中包括数据的采集、数据存取、数据分析挖掘和数据服务,只有将这些环节完整地连接起来,形成图书馆内部的大数据处理流程,才能有效管理大数据条件下的图书馆事务。
参考文献:
[1]大数据[EB/OL]. http://baike.baidu.com/view/6954399.htm,2013-03-02.
[2]Big Data[EB/OL]. http://www.en.wikipedia.org/wiki/BigData,2013-03-02.
[3]What is big data? [EB/OL].http://www-01.ibm.com/software/data/bigdata/,2013-05-06.
[4]刘高勇,汪会玲,吴金红.大数据时代的竞争情报发展动向探析[J].图书情报知识,2013,(2).
[5][6]安宗玉.浅析大数据对图书馆的影响及对策[J].河南图书馆学刊,2014,(1).
[7]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1).
Countermeasures for Libraries Adapting the Changes
under the Influence of Big Data
ZHAO Xuefeng
(Library of Northeast University of Finance and Economics, Dalian Liaoning 116400,China)
Key Words:big data; library; information service; technology
(责任编校:陈婷)