大数据时代下的图书馆
2015-05-30卓莉
卓莉
摘要:随着计算机技术的不断发展,很多领域都开始引入大数据,以促进自身的发展。传统的图书馆领域也不可避免。大数据在图书馆领域的应用,既是机遇,又是挑战,本文探讨了大数据时代下图书馆遇到的挑战以及应对策略。
关键词:大数据时代 图书馆 挑战 应对策略
一、大数据时代概述
现今,大数据的使用越来越广泛,它的使用让图书馆焕然一新。最早提出“大数据”概念的是麦肯锡公司。2011年5月,麦肯锡公司在大数据报告中指出:“数据已渗透到每一个行业和业务职能领域,逐渐成为重要因素。”其后,大数据迅速成为政务及信息科技等行业关注的热点。
目前,大数据还没有一个统一、固定的定义。从狭义上来看,我们可以把“大数据”理解成“为超出传统数据管理工具处理能力的大规模、复杂的数据集合”。而一组名为“互联网上一天”的数据可以明确地告诉我们大数据到底有多大:一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;用它发出的邮件有2940亿封之多……截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际商业机器公司研究称,整个人类文明获得的全部数据中,有90%是过去两年内产生的。预计到2020年,全世界产生的数据规模将达到今天的44倍。
二、大数据时代下图书馆将遇到的挑战
首先,传统的网络构架与“大数据”时代不相适应。大数据时代下的信息交换是服务器与服务器之间的交换,而传统的服务器之间交换信息的程序十分复杂,且大數据时代下的存储数据分布非常广泛,各个服务器都有一定量的数据存储。
其次,数据中心在大数据时代的催化下所要面对的巨大压力。在大数据时代下,图书馆数据库里的内容丰富多样,包括办公的文本文档、图表报表、音频图片等。如此之多的非机构化数据,移动或是修改它都需要耗费大量的人力、物力和财力,如果移动数据,又会降低它的读取效率。
最后,在大数据时代下,虽然每天都会产生大量的新数据,然而真正可以利用的数据却很少,无法形成系统的知识源以供研究人员进行使用。
三、大数据时代下图书馆应采取的应对策略
1.解决大数据存储,建立超大型元数据仓储
建立超大型元数据是未来数字图书馆整合资源的思路之一,有利于实现资源的统一聚合与一站式检索。此外,我们还可以采用基于云计算的分布式存储技术,利用它和一直相关联的虚拟技术使图书馆数据更加有序、统一。
2.解决非结构优化数据的分析和挖掘问题
大数据规模庞大,数据分析和挖掘工作就显得非常重要。在图书馆的大数据中,有待处理的非结构化数据与读者的兴趣是紧密相关的。为了给读者提供个性化的服务,我们必须剖析、解读读者的显性行为,并挖掘其隐性行为。
3.将知识图谱可视化,实现个性化服务
大数据时代下的图书馆,需要提供统一的一站式服务,通过异构数字资源的融合、聚类和重组,使资源从数据层的揭示与展现转向信息层、知识层的深度服务;利用时间轴、地域轴等知识谱可视化展示方式,将资源呈现给用户;依托融合的物联网、移动通信网以及互联网进行传播,最终为用户提供电视、电脑、手机等多种终端的接收;加强分析用户数据,实现个性化服务;促进业界的合作建设,实现共知共享。
四、结语
大数据时代的到来,给图书馆的发展带来了很大的机遇,但同时也带来了不小的挑战。在大数据时代的影响下,图书馆形成了崭新的数据管理和处理模式。一方面,大数据本身的性能具有约束作用;另一方面,政府以及各信息行业高度认同和关注大数据。
图书馆是一个对技术要求极高的机构,对大数据的关注、应用和探讨,为解决图书馆资源发现和信息服务提供了契机,也为图书馆传播文明带来了更多便利。
参考文献:
[1]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012,(12).
[2]李奕.计算机革命与数据价值——2012第二届中国计算机技术大会专题报道[N].中国计算机报,2012-10-15.
[3]于良芝.图书馆学导论[M].北京:北京科学出版社,2013.
(作者单位:内蒙古呼伦贝尔市鄂温克族图书馆)