基于云计算大数据的图书馆创新发展模式研究
2017-12-19李大信
李大信
[摘 要] 本文研究了云计算、大数据在图书馆的应用以及对图书馆发展模式的影响,提出云计算、大数据与图书馆最终结合的形态,是云数据图书馆的模式。并从平台、服务、内容、相互关系等方面论述了云数据图书馆的特征。
[关键词] 云计算;大数据;图书馆
[中图分类号] G250.7 [文献标识码] A [文章编号] 1671-0037(2017)8-89-4
Research on Innovative Development Model of Library Based on Cloud Computing Big Data
Li Daxin
(Literature and Information center of Henan Academy of Social Sciences, Zhengzhou Henan 450000)
Abstract: This paper researches the application of cloud computing and big data in the library and its influence on the development model of the library, and proposes that the ultimate combination form of cloud computing, big data and library is cloud data library mode. The characteristics of cloud data library are discussed from the aspects of platform, service, content and relationship.
Keywords: cloud computing; big data; library
圖书馆的发展,经历了传统图书馆模式,电子图书馆模式,网络图书馆模式,数字图书馆模式等不同形态。在这些发展过程中,技术进步对图书馆发展模式的变化有着重大影响,主导了图书馆发展模式的变革。那么,云计算技术和大数据技术的出现,将对图书馆的发展带来那些影响?新的技术条件下,图书馆的发展,将会出现什么样的模式呢?
1 云计算与图书馆的发展
1.1 云计算与图书馆
云计算是“以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片`云'成为每一个网民的数据中心和计算中心”[1]。
图书馆发展的最终目标,是对图书馆以及一切知识信息资源进行充分整合,利用先进的信息技术,构建共知、共建、共享的智能的知识信息存取中心,共同致力于在整个国家乃至全世界范围内建立大文化集群。云计算为图书馆的目标提供了新的思路,它可以整合庞大的异构资源,形成云计算数字图书馆,并以云计算为服务平台,为用户提供全天候全地域的信息资源和服务,消除信息孤岛,实现信息资源共享。2009年5月,R.Wallis和F.Haugen等人提出了“云计算图书馆”(Cloud Computing Libraries)的新概念[2]。
云计算环境下,硬件对一个图书馆的影响将被弱化,丰富而大规模的应用集成是云计算与图书馆深度融合的基础。图书馆可以按照自身特色打造自己的服务平台,同时借助云计算的无限扩展性进行跨平台的数据收集、管理、提供,为用户提供广域的知识存取,实现信息自然交流。云计算对于资源的动态管理能力能够很好满足用户信息服务需求的多元特征和变化特征。
1.2 云计算在图书馆的应用形式
1.2.1 软件即服务(SaaS)。即运营商把软件安装在自己的服务器上,用户购买软件的使用权并通过网络使用该软件。大量属于Web2.0的图书馆应用,基本都属于这种类型。
1.2.2 计算机集成系统(ILS)。建立在云计算上的ILS,形式上也表现为软件供应商通过网络对用户提供服务,但是,图书馆的ILS的运行,更加依赖于图书馆自身的书目数据,一般情况下都是在本地服务器安装系统、保存数据,供应商掌握某些权限,通过计算机网络进行系统维护。
1.2.3 云存贮。云计算应用于图书馆最早的功能是存贮,越来越庞大的信息资源对图书馆的硬件建设带来了很大的压力,信息存储容量和安全的要求越来越高,因此,作为一种更加快捷廉价的解决方案,云计算的网络存贮应用将给图书馆带来巨大的影响。
1.2.4 平台即服务。用来自于云计算的服务,完全替代本地的it硬件和人员,将图书馆的服务移植到云计算中,摆脱硬件困境,可以使图书馆的业务和人力资源更多的分配到核心业务上来。
1.3 云计算图书馆的体系结构
传统的图书馆体系一般由硬件、系统、应用及服务等4个层次构成,而云计算的应用必将使图书馆发生巨大变化。在云计算上构建图书馆模型,必然将图书馆的资源包括软硬件资源以及最重要的信息资源进行整合,并将其架构与统一的云服务平台上,在更高的层次进行调度与分配。云计算环境下的图书馆体系结构将分为以下层次。
第一层,基础设施层。硬件云是基于Iaas的基础设施层,通过虚拟化技术连接处于不同空间的处理器、存储设备,并用网络将这些设施连接成相互联系的资源池,然后再集合成一个整体即云计算,实现云内的透明使用和统一访问。
第二层,管理层。主要通过云计算技术,管理基础设施层的设备,将其划分为相互关联的资源池,并对其进行统一调度和管理,为用户的应用或更高层次的平台提供开发、运行和管控的环境。
第三层,应用服务层。该层是云计算图书馆架构核心层,是图书馆应用的集合,该层主要功能是为运行在云计算中的图书馆应用提供统一的接口,并通过网络将交付给用户使用。endprint
第四层:云客户端。是指用户获得云计算图书馆服务的软件工具,用户可以通过接入网络的各种设备来使用这种工具,访问图书馆的资源。
与传统的体系结构相比,云计算图书馆的体系结构有着以下特点:资源海量、虚拟化、协议化。
1.4 云计算给图书馆带来了机遇和挑战
云计算给图书馆带来的最大便利,就是改变了图书馆现有的IT架构理念,使得很多图书馆得以摆脱硬件困境和技术困境,获得更好的发展机会,也使得图书馆共享理念进一步成为可能,给图书馆的发展带来了前所未有的机遇。但另一方面,云计算也给图书馆带来了挑战,从云计算的基本理念及图书馆应用云计算的框架分析,云计算将带来图书馆管理与服务相关的问题,图书馆界需要认真应对云计算带来的挑战,深入、系统的研究应用云计算所带来的相关问题。
2 大数据与图书馆的发展
2.1 大数据与图书馆
“大数据”是一个用来描述海量的结构化和非结构化数据的短语,特性用“4V+1C”[2]描述,即数量庞大(volume)、种类多样(variety)、更新快速(velocity)、真实准确(veracity)和处理复杂(complexity)。大数据有着非常广泛的分布,包括业务流程数据、企业大数据、社会大数据、个人大数据、科学大数据等[3]。
图书馆历来是新信息技术的研究和应用“先锋”之一,必将能够抓住大数据时代来临的良好契机,实现服务体系创新。具备大数据的处理能力的图书馆,可以创造更具挑战性的服务,增加服务手段,提供更多服务方式,服务水平得到提升,服务领域将会得到扩展。图书馆可以依托大数据,发展更加高级的数据处理与数据发现、数据分析、数据挖掘服务,为社会、为政府、企业提供大数据服务将成为图书馆的主要工作。
2.2 图书馆应用大数据的必要性
大数据的应用体现出越来越重要的战略价值和经济价值,国际数据环境发生了很大变化,联合国在2010年7月就发布了《大数据促发展:挑战与机遇》白皮书,指出了大数据存在的巨大价值,于是,各国政府纷纷将大数据上升为国家战略。大数据同时也是一种信息获取和处理的体系,为科研信息化(E-Science)提供了一种解决途径,能够为科学研究提供数据驱动的研究环境。大数据可以为图书馆用户提供更大数量、更高质量的信息,满足用户社会搜寻的需求。
2.3 大数据在图书馆服务中的应用
大数据技术一个很重要的内容就是基于大数据的行为分析,引入大数据技术的图书馆系统,可以对读者的访问行为进行挖掘分析,并在分析结果的基础上向读者进行有针对性的、个性化的服务推送,引导读者使用图书馆的服务,提高读者的时间效益。同样,大数据还能够预知读者需求,为图书馆的资源采集、资源更新提供依据,帮助图书馆确定资源建设的方向,提高图书馆的社会效益。
大数据本身也是一种信息资源,可以作为图书馆馆藏的一部分,既可以提供公众使用,也可以作为图书馆参考咨询的平台,馆员可以在具备大数据特征的咨询课题上引入大数据技术,跳出传统的参考咨询业务的限制,提供预测咨询、变化趋势咨询、在大数据的基础上,获取更加准确的结果,使图书馆深度参考咨询服务成为可能。
3 基于云计算大数据的图书馆发展模式构想
3.1 数据云图书馆——云计算大数据环境下图书馆发展模式
云计算和大数据是虽然都来自于计算机技术发展的概念,但两者一个属于系统管理的概念,一个属于数据管理的概念,存在本质的区别,但在实际应用上又产生了密切联系。云计算是跨越空间的计算机资源的联合,是计算机硬件系统发展的主要方向;大数据相当于海量数据的“数据库”,是未来数据环境的主要发展方向,既是数据,又是数据管理系统,既是信息资源,又是数据挖掘技术。二者具有相辅相成、密不可分的关系,云计算可以为大数据的存储和处理提供按需扩展的计算和存储资源,是实现大数据的最佳平台。
云计算是大数据实现价值的软硬件基础,大数据是推动云计算变革的重要动力。云计算和大数据有机融合在一起,将会成为图书馆的重要基础平台,依托这个平台,图书馆的设备、技术、资源从理论上可以无限扩展,从而使得图书馆更加接近理想:保存人类所有知识,并支持所有人随时随地取用。
云计算技术、大数据技术与图书馆结合,将会产生一种新的图书馆的发展模式,我们可以称之为数据云图书馆,简单说就是以数据化的信息为主要服务内容,运行于云计算之上的图书馆。
3.2 数据云图书馆产生的条件
3.2.1 对现有文献信息的数据化加工达到一定的规模。现有的文献信息数字化的加工,使得数量庞大的纸质文献变成计算机可利用的数字化信息,这些信息以名称、主题、著者、关键词、年代等为索引组成数据库,是数字图书馆得以建立的基础。如果再进一步,对数字化的文献信息资源进行数据化的加工,使得其中每一个字词都成为可以检索、排序、组织的资源,那么这些更加庞大的数据就成为了一种大数据,那么以这些数据为资源的图书馆即可跨入大数据时代。但是,图书馆大数据业务,无法单独建立在对单独图书馆自身所使用的文献数据库及自建数据库的数字化加工上,即使是区域性甚至全国性的图书馆联盟也没有这个可能,因为这些期刊、图书、报纸等数据库的所有权是版权所有者,而且数据化的加工,必须达到一定的规模,才能称为大数据。
3.2.2 云計算的商业化应用普及一定规模,其价格可以为日常应用所接受。
目前云计算技术已经进入实用领域,但是,图书馆界对如何使用云还有一些分歧,有人呼吁利用云计算技术,把一部分图书馆的软硬件统合起来,建立图书馆的专门云,也有人希望利用成熟的商业云来建设图书馆的云。从云计算技术的理念本身来说,这种狭义上的专门的图书馆的云是与云计算的理念背道而驰的;价格适中、运行稳定、安全有保障且面向公众开放的计算机的云,才符合图书馆对于云计算的需求。endprint
3.2.3 社会对大数据的需求达到一定水平。数据云图书馆的建立,需要建立在用户对大数据一定需求的基础上,用户的数据素养达到一定程度,有需要且能够利用大数据资源。这就需要大数据应用越来越广泛,从商业应用逐步拓展到政府、企业、社会团体的决策,甚至于个人也可以利用大数据来进行分析预测。
3.3 数据云图书馆的特点
数据云图书馆,将是一种全新的图书馆发展模式,它应该具备以下特点。
3.3.1 依托云计算平台而存在,以数据化的信息为主要服务内容。数据云图书馆的基础设施都是由云计算平台租赁而来,所有的资源也都存储在云上,依托网络平台向用户提供服务,支持用户在任意环境下获取所需的数据或服务。数据云图书馆以大数据为主要的资源的性质,使得它所拥有的资源必将有更高的存储、传输、处理及安全的需求,只有依靠云计算平台的巨大资源,才能满足数据云图书馆的IT需求。
3.3.2 数据云图书馆以大数据为主要的服务内容,其自身又是应用大数据技术的平台。随着大数据技术的逐渐普及,大数据本身的数量将会出现巨大的增长,而各种有针对性搜集整理的专门性大数据也将会随之出现,这些大数据在使用之后就会失去专门应用价值和保存价值,但这些大数据在其他方面仍然存在研究价值。另外,社會公共机构搜集的可以面向公众开放的大数据也将进入人们的视野。所有这些大数据,数据云图书馆都可以进行搜集、管理、提供公众使用。数据云图书馆系统自身,也将会使用大数据技术,对访问者的信息进行处理,当这些数据达到一定数量的时候,就成为新产生的大数据,变成数据云图书馆提供信息的一部分。
3.3.3 大数据分析师将是数据云图书馆的重要组成部分,而分析预测和参考咨询将是它的重要服务方式。传统图书馆向服务对象提供的都是可读的文本信息,而数据云图书馆提供的则是大数据信息,数量庞大、内容繁杂,需要根据服务对象的需求进行专门的处理,提供各项分析,帮助服务对象解读每一项数据背后的真正含义,满足服务对象的需要。所以,大数据分析师将是数据云图书馆不可或缺的重要岗位。
数据云图书馆的大数据信息不同于传统图书馆的文本信息,提供已有的知识或信息供服务对象使用。借阅和阅览将不是它的主要业务,以大数据为依托,根据服务对象的需求,进行分析预测参考咨询或者知识的创造,将会是数据云图书馆的主要服务形式。大数据分析师已经不是传统意义上的图书馆工作人员,而是可以参与服务对象决策的核心人物。
3.3.4 数据云图书馆具备自我增长、自我适应的特性。从概念上来看,大数据本身就是不断增长变化的,数据云图书馆的大数据系统,时刻处于自动搜集数据信息、加工数据信息、存储数据信息的工作中,数据云图书馆这样就实现了自我增长。数据云图书馆可以借助大数据技术来了解访问者类型与信息需求特征,预测读者信息需求的变化,制定个性化信息服务策略,动态、交互地融入用户信息查找、信息发现和信息获取的全过程。因此,数据云图书馆可以依托云计算的资源分配能力,主动进行数据资源的建设,并根据访问者的需求调配各种数据资源,构建一个自我增长、自动适应的新型服务体系。
3.3.5 数据云图书馆将是整个社会大数据的有机组成部分。数据云图书馆可以成为各种大数据的存储系统。数据云图书馆作为公共的大数据平台,可以为政府、社会团体等进行的大数据业务提供搜集和存储的服务,进行公共大数据的搜集和保存的工作。很多大数据,特别是商业类型的大数据,是根据需求进行搜集处理的,在达到使用者的目的后,对使用者来说即变为无用的数据。数据云图书馆可以对这些非长期持续性大数据进行搜集、存储,并向公众开放,成为社会大数据的存储器。作为一个提供社会服务的系统,数据云图书馆本身也在产生大数据,是大数据资源生产的源头,这些数据同样可以被获取、分析,而分析的结果又变成数据云图书馆资源的一部分,实现数据资源的有序增长。
4 结语
数据云图书馆在形式上已经完全不同于传统的图书馆,云计算中的不特定的计算资源池将替代传统的图书馆建筑设备,大数据管理员、大数据分析师将代替传统的图书馆员,大数据将替代传统馆藏的文献信息。但是,它依然具备了图书馆搜集信息、整理信息、提供信息的本质特征,万变不离其宗,所以,我们称其为数据云图书馆。
参考文献:
[1] 李开复.云中漫步——迎接云计算时代的到来[EB/OL].http://www.googlechinablog.com/2008/05/blog-post_09.html,2010-10-23.
[2] 赵玉冬,李桂贞,谢明亮.云计算环境下数字图书馆的变革.[J]图书馆研究,2016(5):14-17.
[3] 陈传夫,钱鸥,代钰珠.大数据时代数字图书馆建设研究.[J]图书馆情报工作,2014(7):40-45.endprint