浅谈图书馆如何简单应用大数据特性
2017-06-05张颖
张颖
重庆师范大学涉外商贸学院
【摘 要】随着现代社会和科学技术的发展,以及大数据的概念出现以后,大数据已经渐渐融入到我们生活中的各个领域,正改变着人们的生活方式。图书馆作为文献信息中心,更应该接受和适应这种变化,并且利用大数据的特性进行发展和改变,来突出图书馆的特点和职能。
【关键词】图书馆;大数据;特性;简单应用
“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力,用来适应海量的、高增长率和多样化的信息资产。对于大数据这个概念大家并不陌生。
大数据有四特性:
1.大量
2.高速
3.多样性
4.低价值密度
随着社会和科技的发展,大数据已经融入到我们的生活中的各个领域。图书馆担负着教学和科研服务的双重任务,是培养人才和开展科学研究的重要基地,不仅要更好的融入当今社会的大数据时代,更应该更好的应用大数据的特性为广大读者服务。
一、大量
首先大数据与传统数据相比较,最明显是特点就是在于大数据的信息量巨大。
现在的图书馆已经不再是只用来存放纸质载体图书的建筑物,它还包括有电子资源以及各种不同形式、不同载体的信息和资源,图书馆的功能和内容正在发生转变。传统纸质图书载体能容纳的内容相对于大数据大量的概念来说已经不值得一提。而随着现代科技发展,出现的电子图书的信息量也是不能与大数据相比的。
原来所说的电子图书和数字资源一般都指存储于图书馆内的本地数据库中存储的资源。一般的电子图书和数字资源具有容量远远大于传统纸质载体图书,并且具有使用和检索都比纸质载体图书来的更为方便和快捷等优势。但在大数据环境下,使我们的这一概念发生了翻天覆地的变化。大数据的应用方式,在理论上可使图书馆的容量无限扩大。
大数据即将大量数据通过互联网聚集到某个特定点,也可以看成是把互联网上的所有数据集中在某一个特定数据库中,这个特定点或特定数据库存在于互联网中。事实上我们所说的特定点或者特定数据库只是把互联网中各个不同的数据库做成开放性数据库,让各个数据库之间进行相互通訊,而形成的一个整体数据库。
因此,图书馆也可以链接并使用这一特定的整体的数据库。通过此链接,不仅可以无限扩大本馆自身的馆藏资源,还能使本馆资源得到开放,更加有效充分的利用馆藏资源,并实现数据交流和资源共享。
二、高速
大数据和传统数据最大的区别在于大数据的高速特性,它对于数据处理的能力要求必须非常出色。
大数据在进行数据处理的时候,既能对数据进行流处理,也同时能具备对数据进行批处理的能力。也就是说,大数据处理要求在连续不断处理数据的同时,能够对突如其来的批量数据进行计算和处理。
大数据的高速运行,要求数据有时效性。随着时间推移,数据的价值会折旧,不同年龄阶段的数据具有不同的价值,如期刊类,报纸类。这就要求图书馆及时更新其馆藏。好在大数据时代的资源和数据能够互相连接,弥补了部分馆藏和资源不能高速运行更新的缺点。
从数据开发来看,图书馆存储了大量的数据和资源。当这些数据和资源被聚集到一起时,会形成数据和资源的“矿山”,那么“挖矿”的效率就要求非常高,大数据高速运行就成了“挖矿”的优势。
在图书检索上,大数据的高速运行查找能够快速、精准的定位每一本图书的位置。对于不熟悉图书分类法的读者来说,利用大数据进行图书资料的查找和检索无疑是最方便快捷和准确的。
三、多样性
大数据的数据来源的多样性,这是传统数据做不到的。
对于图书馆来说,产生数据的方式多种多样,有日常的统计数据报表,有人工借还和自助借还数据,有读者检索图书产生的数据,有使用网络图书馆产生的点击量、浏览量等多种数据来源。可以看出读者自身也是数据的创造者。
在大数据环境下,图书馆通过记录、收集并保存产生的一切数据,待数据量达到一定规模的时候,通过对多样数据的各种提炼和分析,了解读者需求,更好的提供多样化的资源和优质的服务。
通过分析读者的阅读需求等数据,可帮助图书馆优化自身的馆藏结构,帮助图书馆纸质图书馆藏的剔旧、电子资源的购买和更新等工作更科学的进行。
四、低价值密度
大数据的低价值密度是指数据的真实性。
大数据追求的是数据的高质量,大数据的基本在于为决策提供帮助,因此大数据必须拥有绝对的真实性。
从来源上分析,传统数据的来源是从宏观上采集的。数据的采集有原则性,有规律,采集的对象有阶段性有针对性,或者直接是进行抽样采集的。传统数据的采集方式决定了传统数据在真实性上会有所欠缺。
大数据的采集方法与传统数据迥异。大数据的数据采集方式是从微观采集,它进行的是个体采集,每个个体都有自己单独的数据集合,也是产生数据的来源。大数据对于数据的采集是没有标准的,它的采集方法源于对个体的行为与现象记录。通过对大量真实数据进行提炼、分析和总结出来的有用数据,其真实性是毋庸置疑的。
图书馆应用低价值密度这一特性,可以帮助图书馆对文献进行开发。因为图书馆所提供的文献、资源、信息等必须具有权威性和真实性。以大数据为基础的参考信息作为文献开发依据具备了真实性的原则。
大数据能真实的分析读者使用图书馆的习惯和读者的读书习惯。通过记录和分析读者的阅读倾向的数据和读者使用馆舍的数据等等,能真实分析出哪些是读者使用的重点资源,哪些是读者不常使用的次要资源。通过对读者的阅读倾向的数据进行记录和分析,可帮助图书馆加强对读者重点使用的资源的建设。而对读者使用馆舍情况的记录和分析,可以对图书馆馆舍进行科学的改造和布置,让读者使用图书馆更感舒适。
大数据真实的记录和分析读者阅读和使用图书馆的各种数据,可以引导读者进行阅读。挑选读者重点使用的资源设立专门的阅读区域,可在设立的阅读区内进行与重点资源的相关参考内容的引导和推荐工作,方便读者更好更有效的使用图书馆资源。
通过大数据对读者数据的捕捉,图书馆能提供更优质的服务。建立数据,统计数据和应用数据,可使图书馆更具有竞争力。有大数据的真实为支撑的基础上,图书馆在现有基础上,能更好的优化和深化服务。
大数据的四个特性,并不一定是独立的,在很多方面,这四个特性都是融会贯通在一起的。应用其特性并不是只会用到其中的一个特性。图书馆对大数据特性进行合理的应用,能更好的建设发展自身,适应和满足社会的需求。
参考文献:
[1]李恬.大数据理念与图书馆大数据[J].新世纪图书馆,2014,(6):24-27.
[2]韩翠峰.大数据带给图书馆的影响与挑战[J].图书情报,2012,(5)37-40.
[3]黄馥妃.大数据时代高校图书馆个性化服务研究[J].文化视野,2016.