云存储在图书馆数字化中的应用研究
2014-03-29王峥
王 峥
(安徽省图书馆报刊部,合肥 230001)
有关“云存储”的概念,到目前为止,还没有一个准确的定义去描述它,不过人们可以清楚地知道的是,云存储的概念是在云计算的概念上发展而来的,分布式处理和并行处理以及网络计算是云计算的发展源头。如果我们给云计算分配大量的存储介质,然后把云计算的处理转化为大数据存储管理,这时候一个云存储系统就应运而生。综上所述,我们可以将云存储系统视为一个偏重大数据存储和管理的云计算系统[1]。鉴于云存储技术在数字图书馆建设中的重要意义,许多图书馆都开始积极探索云存储技术的图书馆工作,尤其是在数字化工作中应用的可行性。
一、云存储的原理及其在图书馆工作中应用的可行性
随着云计算和云存储技术的飞速发展,图书馆的数字化成为了图书馆发展的必然方向,越来越多的图书馆将电子信息资源作为主体来代替传统的图书馆纸质媒介资源。所谓的云存储,它包含了多个部分,是一个非常复杂的系统,并非一个简单的存储介质[2]。当然,在云存储中,存储设备部分自然是整个系统的核心部件,但是云存储的架构还包含了相关的服务器、网络设备、接口等等。以下是云存储的分层结构图:
图1 云存储分层模型示意图
存储层是云存储的基础,其中的存储介质可以是IP存储设备①是IP网络中传输块级数据的设备,使服务器可以通过IP网络连接SCSI设备,并且像使用本地的设备一样,无需关心设备的地址或位置。,包括NAS②是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。按字面意义简单说就是连接在网络上、具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽、提高性能、降低总拥有成本,保护投资。其成本远远低于使用服务器存储,而效率却远远高于后者。以及SCSI③小型计算机系统接口(英语:Small Computer System Interface;简写:SCSI),是一种用于计算机和智能设备之间(硬盘、软驱、光驱、打印机、扫描仪等)系统级接口的独立处理器标准。SCSI是一种智能的通用接口标准,它是各种计算机与外部设备之间的接口标准。。同时也可以是DAS存储设备。由于这些存储介质经常分布在不同的地区,存储介质之间的数据传输可以通过光纤或者互联网实现连接。基础管理层是云存储重点部分,可以说是云存储的要害部门。在这一层中,经常要使用到分布式、并行计算等相关技术。在这一层中,要协调好各个设备之间的连接和工作,只有这样才能对外提供一个良好的性能更高的数据访问体验。再往上是应用接口层,这一层是整个云存储系统中较为灵活多变的一层,可以根据不同的业务场景和业务类型,开发出各式各样的API,对外提供不同的服务。最后是访问层,在这一层中,需要拟定一个标准的公用访问控制系统,这样方便授权的用户可以使用云存储服务。不同用户的体验也会不同[3]。
整个云存储技术的发展非一蹴而就,首先是整个网络带宽的发展导致用户有客观的条件可以接入到云服务中来,互联网访问速度的提升起到了至关重要的作用。其次是资源共享的目标深入人心,各式各样的数据在不同的计算设备上实现共享。这为云存储技术带来了需求上的刺激。再次就是存储技术的不断发展,存储的技术越来越先进,存储介质的访问安全高效。然后是集群、分布式等相关技术的全面发展。在不同设备之间共享数据,需要在设备之间建立一套高效协同的工作机制,只有这样才能对外提供良好的访问体验[4]。
笔者认为,不同的图书馆分布在不同的地方,有学校图书馆,也有各个地区自己的图书馆,不同的图书馆有不同的信息存储系统,我们可以把每个图书馆的存储系统看做图里面的一个点,如果我们把这些图书馆统一起来看,每个点就可以连接成一个图,在虚拟化技术的支持下,这个图就可以成为图书馆云,云里面包含了各个图书馆的信息,云内的成员可以在授权的情况下实现互相访问。如果有相关的IT服务提供商的支持,就可以在不为每个图书馆配备支持人员的情况下,使得云内的各个图书馆数据有效地对内和对外提供安全高效的服务。这种图书馆云的机制可以为图书馆云内的图书馆和他们的读者带来先天的优势[5]。
这样做可以有效地避免云内的数字资源冗余。在传统情况下,每个图书馆都购买自己需要的数据资源,可能不同的图书馆购买的资源相同,这种情况屡见不鲜,最典型的例子就是全国各大图书馆,几乎每个图书馆都会购买相同的检索数据库。这样做不仅浪费了大量的存储空间,而且在经费上和人力上计算都是不划算的。如果采用云存储技术,将各个图书馆通过各式各样的传输介质连接起来,就可以把相同的资源作为一个拷贝分享给各个图书馆,这样可以有效地避免数据的重复,在存储介质上的开销也会降低。图书馆在数据资源的建立上也会花销更少,而且不需要图书馆亲自去维护云系统。在管理方面,云存储技术也颠覆了传统的图书馆资源管理。由于每个图书馆对资源的需求是不同的,他们只需要提供各自的个性化需求给云存储系统服务商,通过付费的形式来使用云存储服务,这样做就解放了每个图书馆的设备维护要求,这相对于传统的图书馆管理模式有了很大的改变。另外,云存储技术资源共享上还带来了诸多好处。举个例子,某个图书馆需要获得其他图书馆的资料,如果采用了云存储技术,在授权的情况下,就可以互相弥补对方的不足,最终使得用户的满意度提升。所以,云存储技术带来的不仅仅是技术上的创新,更是图书馆运作机理上的一次巨大革命[6]。
二、云存储在图书馆数字化应用中的优势
自从上个世纪图书馆数字化的概念被提出来后,这个概念就一直被描述为是将图片、文字、声音等信息按照二进制代码的方式存放在磁盘、光盘、电子盘等存储介质中,通过现代的各种计算终端,将这些信息传播开来的传播媒体。
数字化后的图书馆和传统的图书馆相比较,具有很多先天优势。首先是共享性,通过访问控制的许可后,读者可以通过对应平台进入到被授权访问的信息库,通过互联网,越来越多的信息资源可以被共享开来,相对于传统的图书馆共享程度更进一步。然后是信息的更新速度更快。传统的图书馆,更新信息的能力相当滞后,旧的信息可能不产生价值,科技飞速发展的今天,只有把握住当下科技的前沿才能有更多的作为。最后是信息存储上的优势,通过把信息按照信息化的方式存储起来,让信息相对传统媒体更易于存储和展现,更易于被用户接受[7]。
然而,采用了云存储技术的图书馆相比普通的图书馆数字化,具有更进一步的优势,主要体现在以下几方面:
一是云存储能够降低存储成本。图书馆在构建图书馆数字化的过程中会产生大量的维护费用,包括人力、各种计算机存储设备以及相关服务器和对这些设备的维护和管理,只有这样才可以确保图书馆信息资源被正常的使用,这经常困扰着图书馆的管理人员。如果在图书馆构建数字化的过程中采用云存储技术,则可以节省大量的经费。云存储所应有的程序、服务及相关数据都存放在提供者处,图书馆不需要做前期的投资和建设,也无需担心中后期的改进和升级,因而图书馆可以将有限的资金用在更好地为读者服务中去。同时,云存储技术将电子信息存放在云端,云端的各种服务器和计算设备是通过良好整合后的云集群,不仅费用低,使用也更方便[8]。
二是云存储能够有效地保护图书馆信息的安全。信息的访问安全和访问控制是图书馆在数字化过程中的核心内容之一。传统的数字化图书馆在日常事务中,会招到大量的黑客攻击,包括数据的窃取、篡改或者恶意的攻击等等,这会导致图书馆的设备和信息无法正常地为合法使用者提供服务。但是云存储的出现,大大地改变了这一现状。云存储把信息和数据存储在不同的节点服务器上,使得图书馆的信息集中有序存放,自动生成数据备份,一旦磁盘损坏,系统会自动再生成数据备份在不同的节点服务器上,使数据能及时得到恢复,确保了数据安全。另外,云存储数据易于实现数据备份或迁移,有利于对其安全的监控和容易实现访问控制[9]。
三是云存储能够有效地实现数据灾备。假如图书馆遭受到了无法抗逆的破坏,导致了数据的丢失和破坏,云储存却能提供一套优秀的灾备模式。云存储可以在不同的服务器上对数据进行备份,这些服务器往往分布在不同的地域,因而可以有效地避免单点故障。假如某台云存储服务器发生故障,云存储系统会在最短的时间内切换到备用的服务器上,继续有效地为使用者提供相关服务。
四是云存储使得数据的共享更进一步。电子检索是图书馆所提供服务中的重要内容之一,采用了云存储技术后,对于使用者而言,他们可以通过这项技术获得更多的计算能力,在电子检索方面表现在具有更准确更快捷范围更大的检索效率。开放性是云存储系统的一个重要特征,云存储的出现使得图书馆中不同的数据来源实现互相整合,信息被统一管理和使用,是利用现有的网络基础设施为用户提供一体化的智能信息平台,虽然信息被存储在不同的位置,但是对于访问者来说,可以不必理会这些信息的存储位置,这大大提高了数字资源信息资源共享的程度,使得资源的共享范围更大。
三、云存储在图书馆数字化中的应用局限及解决对策
在实现图书馆云存储的过程中,难免会遇到困难。首先是图书馆需要对现有的资源和设备进行重新整合,这个工作量非常巨大,如果没有IT运营商或者云存储服务提供商的帮助一般很难完成。其次是云存储技术的实现和发展前提是网络带宽的提升,虽然云存储在国外已经有了很多成功的例子,但是在国内,云存储技术的发展还不太成熟。从国外的经验来看,云存储网络传输要求非常高,特别是当有大数据访问或者大规模计算的情况出现时,如果网络环境得不到保障,云存储服务将不能有效地提供给图书馆和读者。如果不能保证良好的网络带宽,图书馆的云存储模式很难得以实现,即网络环境的好坏对云存储的实现有着决定性的影响。再次是云存储服务的提供需要图书馆有充足的经费保障,对于部分中小型图书馆而言,由于预算的不足,可能无法享受云存储带来的好处。所以,笔者认为,云存储对于大型图书馆市场方面有着良好的未来。对于高校图书馆而言,采用云存储技术实现图书馆数字化还有待观望,千万不能听服务商的吹嘘,应该一切按照成本和规划来,避免盲目跟风[10]。
我们可以从以下几个方面来解决云存储在图书馆数字化中的应用局限。
第一,针对网络带宽问题,笔者认为可以以此为契机,首先从国家层面,对全国各大骨干网络进行提速,保证云存储系统所需最佳带宽。其次,可以优化云存储系统在数据交互方面的数据量,比如优化数据交互算法。再次,可以为云存储系统内各个节点建立网络专线,独享带宽。
第二,针对云存储的安全性,笔者认为可以从云存储算法角度进行改进,对云存储相关算法进行优化,并对数据交换协议的安全性进行论证,以保证数据交互的安全。
第三,针对成本问题,需要图书馆和云存储服务提供商协商,图书馆之间可以结成联盟,共享云存储服务,降低自身成本。
当前情况下,图书馆作为读者获取知识的公共场合,如果继续采用传统的资源分享方式,将不能够适应用户的需求。所以图书馆的数字化是一个必然的趋势。云存储在图书馆数字化过程中扮演着整合资源、降低成本、提供更好信息服务的角色。虽然到目前为止,云存储技术的应用在图书馆数字化的过程中还存在一些难题,但是我们相信在不久的将来,随着科学技术的进一步发展,云存储技术将会普遍地应用到图书馆工作中,为广大的读者服务[11]。
四、云存储条件下信息资源共享与知识产权保护问题
云存储条件下的信息资源共享建立在信息开放、扩大流通的基础上,要求信息无偿或低成本使用,限制信息专有,反对信息垄断,而信息资源共享不可避免地要涉及专有性信息的保密、保护和专用的问题,尤其是知识产权保护问题。
在云存储条件下的资源共享建设应该采用新的技术手段,例如采用合适的身份验证和授权设计方案来保护资源的知识产权。同时,可以成立资源共享的知识产权集中管理机构进行集中管理。
开放资源的知识产权保护将更加突显社会道德水平的价值,这对公众道德情操的培养和社会优良道德环境的构筑提出了新的挑战,因此要加强政府部门的舆论宣传及政策引导方面的工作。
云存储条件下的资源共享所涉及的知识产权保护问题需要从法律及技术层面去考虑和解决,云存储带来的信息资源共享所涉及的信息资源的知识产权有很大部分在法律上难以很快明确,需要在实践的过程中逐步解决。为此,要在遵循基于现存法律框架、公平与效率的统一、知识产权与公共利益的协调、知识产权保护与信息资源的公共获取的统一、程序节约与手续简单等原则的前提下,建立公正和实用的运营模式和技术平台,为真正实现云存储信息资源普遍共享提供必要的基础。
五、以安徽省图书馆配合国家中心筹建省级云存储数字支撑平台为例
在云存储技术飞速发展的背景下,安徽省图书馆依托国家公共文化服务数字支撑平台与各级分中心相互协作,共同为各类用户提供公共文化资源服务。同时,每个分中心既可以单独提供服务,也可以作为耦合单元共同组成更为完整和庞大的整体服务平台。建设国家级的“文化仓储”,即对国家公共文化服务数字支撑平台提供数据支持,以实现针对海量数据资源的存储和管理,最终实现资源共享。
基于云存储设施和数字资源库、机构信息库、服务信息库的支持,安徽省图书馆协同各级分中心在国家中心的统一部署下,按照实际需要部署“五系统”,即资源加工系统、资源库管理系统、资源调度系统、资源服务系统和运行管理系统。这五系统构建了公共文化服务数字支撑平台“内容建设”、“信息传输”、“资源应用”、“协同管理”的四大环节,实现了公共文化服务“建、传、用、管”重大抓手功能。
数字支撑平台最底层为基础设施,包含“一存储”以及云管理所需的虚拟适配层。全国范围内包括国家中心和各级分中心在内的多个不同地域均部署有云存储基础设施,云存储之间并不孤立,在云操作系统的统一管理下协同工作。“一存储”的实施规则如下图,其中,大圈内部分是云端共享资源(即“一存储”包含的部分),由国家中心进行统一管理、调配、备份和分享;大圈外部分为分中心本地存储,由分中心自己管理。国家中心资源和分布在各个分中心的资源共享池共同构成分布式结构的“一存储”,由国家中心统一管理;分中心资源由分中心本地存储资源和分中心共享池构成,其中,共享资源归国家中心统一管理,本地资源由该分中心管理。
图2 “一存储”实施规则
“一存储”的“一”主要体现在以下三个方面:统一资源目录,统一管理和统一服务。统一资源目录指“一存储”遵循统一资源目录的原则。由于所有的资源都是被放置在云存储中的,因此对于所有其他系统来说,都是统一的——不管该资源实际是存储在国家中心,或者是存储在分中心的共享池中,对于应用系统而言,该资源就是在云存储中;对外,云存储提供的是统一的资源目录,所有系统都能够通过统一的目录对资源进行访问或管理。统一管理指“一存储”管理的底层实现是基于云平台技术的“监·管·控”来完成的,实现对国家中心、各区域中心以及省级中心的集中管理,实现整个公共文化服务数字支撑平台的统一管理。统一服务指将平台的“一存储”作为一个云端资源服务器,为所有需要文化资源服务的单位和个人提供统一的一致的文化分享服务,从服务种类上又可以分为统一资源服务、统一素材服务和统一空间服务。
六、省图公共文化资源与高校资源互通共享
安徽省图书馆在组织机构设置、人员配备与培养、设备配置、质量控制以及通过互联网、IPTV、VPN、全国公共图书馆联合参考咨询平台等多种形式上开展了服务。尤其是在自建拍摄制作的专题片数量和质量上均在全国同行中位居前列。目前,省图从自拍自建的11部143集大型电视专题片中精选了其中的9部,作为首批共享资源推送至高校。高校师生可通过“安徽省高校数字图书馆门户网站”(http://ahadl.org)上“安徽文化数字资源共享工程”栏目访问到省馆制作的这批特色文化资源。与此同时,安徽省图书馆通过高校数字资源进驻公共图书馆的服务,充分发挥其作用,海量、高精专的高校数字资源不仅可以让省馆拥有更多的资源开展信息检索和文献传递服务,而且对于省馆开展科技查新业务起到了重要的作用。
七、结 语
图书馆在构建数字化的过程中使用云存储技术是一种全新的突破,但是任何一次突破或一次新的技术兴起总会伴随着瓶颈和缺陷,这就需要我们一步一步、耐心地改进。云存储在图书馆中的应用目前还存在一些问题,比如说受制于网络带宽、安全性以及其他问题。
但是这些问题阻碍不了云存储的发展,也撼动不了云存储在构建数字化图书馆过程中的地位。云存储作为未来存储的发展方向越来越受到更多人的关注。可以想象,随着云存储技术的进一步发展,图书馆在信息化、数字化建设的步伐将会越来越快,对信息的存储也越来越高效,越来越安全,我们有理由拭目以待。
[1] 周可,王桦,等.云存储技术及其应用[J].中兴通讯技术,2010,16(4):24-27.
[2] 唐 箭,云存储系统的分析与应用研究[J].电脑知识与技术,2009,(20):15-16.
[3] 李永先,栾旭伦,李森森.图书馆迎来“云”时代[J].高校图书情报论坛,2009,(3):59-62.
[4] 陶新权,孙青云,等.计算在图书馆中的应用[J].大学图书馆学报,2010,(2):55-57.
[5] 陶 蕾.“云”下的图书馆网络存储探讨[J].图书馆学研究,2010,(7):66-70.
[6] 臧海鹏.数字图书馆合理使用问题研究[D].杭州:浙江工商大学,2012.
[7] 张龙立,云存储技术探讨[J].电信科学,2010,(sl):7-8.
[8] 陈少春.试论云存储在图书馆数字化中的应用性[J].图书馆理论与实践,2012,(11):8-9.
[9] 董 屹,王昆鹏,云存储在数字图书馆中的应用[J].电脑知识与技术,2013,(9):2020-2021.
[10] 李 征.云计算在图书馆建设与信息服务中潜在价值探析[J].大学图书馆学报,2011,(1):58-62.
[11] 魏星德.数字图书馆资源的云存储模型研究[D].上海:上海海洋大学,2012.