大数据技术在数字图书馆管理与服务中的应用
2017-03-08高群
高 群
(江南大学图书馆 无锡 214122)
大数据技术在数字图书馆管理与服务中的应用
高 群
(江南大学图书馆 无锡 214122)
随着全球信息化的蓬勃发展,信息量的爆炸式增长,海量数据的出现催生了大数据技术的到来。同时,信息数字化的发展趋势,驱使着现代图书馆的管理与服务模式需要进行转变。如何高效、安全的存储图书馆海量的信息,如何快速返回用户需要的有用信息?利用大数据技术实现数字图书馆的管理与服务必将成为大势所趋。基于大数据技术的数字图书馆的管理与服务能够有效实现图书馆的信息资源整合与满足现代读者的个性化服务需求。
大数据 大数据技术 数字图书馆 管理服务
随着信息化时代的到来,信息量的指数级增长、信息技术的飞速发展、读者阅读需求的快速转变,这一切都标志着图书馆大数据时代的到来。图书馆在存储图书资料、管理系统、服务用户的时候,会产生大量类型多样的数据信息。大数据图书馆管理与服务是当代图书馆所面临的严峻挑战。
当今时代,信息数字化已是大势所趋,人们每天都生活在数字化信息的包围圈中。人们已经由从传统的书本、报纸上获取信息转变为从网络上获取数字化信息。图书馆作为人们获取信息的重要场所,又由于现在的图书馆信息存取大多是以数字化的方式进行,数字图书馆的诞生和繁荣便是顺理成章的事了。数字图书馆的产生与计算机技术、网络通信技术、存储技术等快速发展是分不开的,数字图书馆转变了人们读取信息的方式,加快了读取信息的速度,使人们获取知识更加方便快捷、丰富多彩。
数量巨大、结构不一,是当前数字图书馆信息存在的特点。如何更好地生产、存储、管理、分析、传播、修改、创新、应用好图书馆中的数字信息,更高效的为人们服务,是人们更加关心和需要解决的问题。于是,大数据技术的应用解决了这个难题。近年来,大数据技术的研究进入了鼎盛时期,国外研究机构纷纷投身其中[1]1。
一、理论背景
1.大数据技术简介。大数据技术[2]91,就是从不同性质的数据中快速挖掘出有用信息的一门综合技术。目前,大数据技术已衍生出了许多新颖技术,这些技术在大数据的采集、存储、处理、呈现等环节提供了强有力的支撑。大数据处理核心技术主要有:大数据采集、大数据预处理、大数据存储、大数据分析/挖掘、大数据展现及应用。大数据处理核心技术示意图如图1所示:
图1 大数据处理核心示意图
2.数字图书馆简介。数字图书馆[3]21(Digital Library)是用数字技术处理、存储大量各式各样文献的图书馆。它利用数字技术存储了许多不同载体和地理位置的数据资源,有利于针对不同区域、不同对象的网络检索与传播。数字图书馆主要包含了数据资源处理、存储、查询、应用这几个部分。其实,所谓数字图书馆则是虚拟的图书馆,它有别于传统的图书馆,既是无“围墙”的图书馆,也是依赖于网络环境下的可无限扩展的知识库,还是规模庞大的、分布式的、便捷的、无时空约束的、可用于跨库无缝对接、智能查询的信息大中心。
具体而言,“数字图书馆”从概念上理解,主要可以引申为两层意思:数字化图书馆与数字图书馆系统。它主要包含以下工作内容:将传统的纸质图书信息转化为电子版的虚拟的数字图书信息;电子版图书资源的加工、存储、流通。
3.大数据技术为数字图书馆管理与服务提供机遇。通过对大数据技术以及数字图书馆特征的介绍可知,大数据技术可应用于数字图书馆资源管理、建设、服务等方方面面。一般来说,大数据技术主要用于数据采集、数据存储、数据处理、数据分析、数据应用这五方面。引入大数据技术的数字图书馆结构图如图2所示:
图2 基于大数据的数字图书馆结构图
大数据技术应用于数字图书馆,不仅可以提高信息资源的整合度,也可以提升信息服务水平,还可以转变和改进服务方式,使得数字图书馆的管理与服务更能满足现代人们的需求[4]86。
(1)提高资源整合度。在当今各个高校中,均能登录校内网免费下载各种学习资源,而非校内人员以及非校内网则无法下载任何学习资源。由此可见我国数字化图书馆建设比较封闭,数字资源无法共享。这样的现象容易引起资源浪费、重复建设等问题。大数据技术的到来便可提高资源整合度,实现资源共享,加强各个高校图书馆之间的资源整合和共享。
(2)提升服务水平。在科学技术飞速发展的时代,图书馆建设要适应大众的各种个性化需求,则需要提升自身服务水平,拓宽服务内容,才能与时代接轨,摸索出自己长久发展之路。大数据技术应用于图书馆建设中,能够对数字化资源进行处理、应用,打造出各式服务。
(3)转变服务方式。形成学科服务模式,即针对某一学科范畴,依据一定的信息选定规范对其进行采集、描述,积累具备某些意义的电子信息,进行处理应用后再向用户提供一些基本服务以及个性化服务[5]75。如定期向用户提供信息推送服务,即可依据用户感兴趣或近期搜索过的信息进行信息推送。
二、基于大数据的数字图书馆管理与服务内容分析
1.数字图书馆管理与服务资源。所谓巧妇难为无米之炊,资源是管理与服务的基础。大数据时代信息资源的特征要求我们通过一定的技术手段去挖掘和发现有用的资源。
首先,数字信息资源的主要来源有:(1)数字化的馆藏资源。馆藏资源主要包括:电子文献、声像资源;(2)下载的网络资源;(3)购进的电子资源;(4)用户产生的信息资源。用户产生的信息资源又分为用户行为信息和用户需求信息。用户行为信息产生于用户注册登录网站、浏览资源、问卷调查等方式;用户需求信息则产生于元数据仓资源发现、用户数据晚间和分析的数字资源发现、大数据决策的信息资源发现[6]76。
2.基于大数据技术的图书馆资源存储。随着数据的不断增长和积累,图书馆数字资源量也呈现指数级增长,且数据结构多样。怎样有效存储海量且结构多样的信息资源,大数据技术的到来解决了这一难题。大数据诸多技术中,目前被广泛使用的技术主要有:Map Reduce技术、Hadoop技术[7]86、NoSQL、云计算等。基于大数据的数字图书馆存储平台结构图如图3所示:
图3 存储平台结构示意图
3.基于大数据技术的图书馆资源管理。由于数字图书馆信息资源存在着量大、结构复杂的特点,如何对资源进行有效、合理的管理就显得十分重要。
目前图书馆资源管理存在很多问题,如:资源管理具体操作中的不规范、资源管理的要求不统一、资源管理的方法不合理、资源管理的缺乏标准等。数字图书馆是由多个数据库、知识库构成的大型信息系统,如何构建一个标准化平台将各个不同的数据库、知识库中的数据流通是个难题。基于大数据的资源管理流程图如图4所示:
三、基于大数据技术的数字图书馆管理与服务模式
大数据技术大大推动了数字图书馆的发展,包括图书馆提供的信息资源量的增加以及服务模式的改善。基于大数据技术的数字图书馆的管理与服务模式正在发生翻天覆地的变化,不久的将来大数据环境下的图书馆服务模式必将注重信息的集成化服务、数据分析与挖掘、新型资源的收集、服务内容的时效性等[8]47。本文主要从数据、信息、知识、智慧这几个方面进行阐述数字图书馆的信息服务。
图4 基于大数据的资源管理流程图
1.一体化管理与服务模式。在当代信息资源所独有的大数据特征下,图书馆要全面采集各种信息资源是一项长久工序。因为图书馆的信息资源不仅仅包括已存在的馆藏资源,如馆藏书目数据库、电子出版物、网上下载的信息资源,还包括一些虚拟的馆藏资源,如网络动态信息、在线出版物等。如何将这些来源于不同数据库的信息资源进行整合,更好地服务于大众?大数据技术很好地解决了这一难题。大数据技术主要采用了MapReduce、NoSQL、云计算等技术对海量信息做提取、分析、处理,达到在类型不一的资源中进行查找,用统一的数据规范显示查找结果,最终实现多种数据结构的整合。
大数据技术在数字图书馆的建设与服务中的应用主要体现在其对来源不同、结构不同、数量庞大的信息资源进行高效的采集、分析、处理、整合、存储、应用,最终达到去除冗余数据、存储有用数据,并使用合适的智能检索方法为用户提供一体化的资源管理与服务模式。
2.学科资源管理与服务模式。所谓学科资源管理与服务模式就是针对不同领域的人,根据其需求采集、分析、处理相关学科知识,并提供给客户相关学科知识的各种服务。完善和创新数字图书馆服务模式的有效方式就是为用户提供个性化、精准化的信息资源。精准化的信息资源即学科化的信息资源,各个图书馆都应该为客户提供学科化的信息资源和服务。尤其是针对高校图书馆,更需要满足老师、学生的学科化服务。高校中的老师、学生从事科研的比例大,他们需要更加精准的学科知识,而高校图书馆则是他们获取学科知识最主要的渠道。所以,对于高校图书馆而言,提供其面向学科的信息服务是大势所趋。
怎样提供其面向学科的信息服务?首先,学科是学科信息服务的基石,通过海量用户对某一学科的信息资源进行检索、浏览以及下载的频率进行分析,分析出某段时间内用户对某学科的哪些方向内容关注度高,再利用数据挖掘或其他智能分析法,预先分析出某一学科研究的热点以及学科与学科间的关联内容研究。利用每个图书馆已有的借阅系统,对用户借阅资源的类型、方向、内容、频率等指标进行相关统计,挖掘分析出用户、图书、信息资源三者间的知识网络。利用该知识网络可提供给用户更满意的学科知识服务。
3.信息可视化管理与服务模式。随着科技的发展,人们获取信息的方式更加丰富多彩,人们对信息的呈现形式要求也更高。人们更加倾向于可视化的信息展现方式,这可以让人们更加直观的了解所需信息。所以,数字图书馆的信息服务也应该紧跟时代步伐,努力将其提供的服务走向可视化。
所谓信息可视化是将抽象的信息通过可视化技术处理成为能直接观看的形式。其中的信息可视化技术是为数据分析,规律发现和决策服务的。
可视化的服务能提高用户的满意度、使用速度、反馈速度、查准率等。信息可视化主要体现在:检索主题可视化、数据库分布可视化。通过把学科计量学方法与信息可视化技术进行有机结合,形成学科知识地图,显示出学科、作者以及著作间的关系,显示学科知识结构,反映不同领域知识的发展态势。利用可视化技术把集中的数据以及无法可视化的抽象数据的语义关系表示出来,反馈给用户。用户通过信息可视化技术挖掘出这些数据集中有用的潜在规律,为用户在获取、分析、处理、使用信息等方面提供捷径。在大数据环境中,数字图书馆为了更好地满足用户的个性化信息需求为用户提供基于数据应用的信息可视化服务是基于大数据的数字图书馆信息服务的发展趋势。
4.智慧化管理与服务模式。随着信息量的爆炸式增长,人们获取信息渠道的增多,人们获取信息越发方便快捷。人们希望获取信息能够更加智能化,即最短的时间内获取最感兴趣、最准确的信息。数字图书馆则变被动为主动,它通过分析用户的个人信息、使用信息、浏览记录等信息,对用户的需求进行分析处理,预测出用户的需求,并实时提供信息推送服务。智慧化服务流程图如图5所示:
图5 智慧服务流程图
目前数字图书馆的资源量均十分庞大,要实现信息服务的智慧化,需引入大数据技术对海量数据集进行整合、处理、发现出用户直接需求以及潜在需求。对于用户的各种需求提供个性、智慧的信息服务。智慧服务是更加高级的信息服务,它是对对基础知识服务的升华。
在当今科技日益发达,信息增长快速、信息结构不一、信息分布繁杂的态势下,数字图书馆的服务内容以及服务方式都在发生着变化。主要体现在信息资源发现,信息资源存储,信息资源组织,信息资源检索这几个方面,本文则主要从这几方面来阐述了构建基于大数据的数字图书馆管理与服务。数字图书馆存有海量的数字化数据信息,数据结构纷繁复杂,这些带有大数据特征的数据信息正是大数据技术得以施展的原材料。当前,大数据技术已经发展成熟,将大数据技术应用于数字图书馆的管理与服务中则能更好地为大众服务,让图书馆的价值得到体现。
本文仅仅从理论上分析了大数据技术应用于数字图书馆管理与服务的迫切性、必要性以及可行性,而在大数据处理的技术上没有具体阐述,没有基于大数据的数字图书馆信息服务的实例。本文存在的不足之处,后续的研究会进行完善和补充。
[1]The White Horse.Big data across the federal government.[EB/O L].http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_dat a_fact_sheet.pdf
[2]来红梅.大数据时代图书馆信息服务面临的挑战与对策[J].图书馆学刊,2014(3).
[3]张春红,唐勇,肖珑.我国数字图书馆研究十年发展回顾[J].数字图书馆,2011(4).
[4]马晓亭.大数据时代图书馆数据整合系统构建研究[J].图书馆建设,2014(6).
[5]陈臣.基于大数据的图书馆个性化智慧服务体系构建[J].情报资料工作,2013(6).
[6]苏蓉.基于大数据的数字图书馆信息服务研究[D].武汉:华中师范大学,2014.
[7]王玲玲.大数据时代图书馆数字化服务的模式[J].图书馆学刊,2014(4).
[8]赵雪峰.大数据影响下的图书馆应变策略[J].长沙大学学报,2015(1).
10.16565/j.cnki.1006-7744.2017.04.22
高群,江南大学图书馆馆员,主要研究方向为图书馆数字资源建设。
G250
A
2016-11-17