SaaS与云存储构建区域图书馆共享域的探讨
2014-07-19朱林
朱 林
(淮南师范学院图书馆,安徽淮南 232038)
SaaS与云存储构建区域图书馆共享域的探讨
朱 林
(淮南师范学院图书馆,安徽淮南 232038)
CALIS在2010年云计算的基础上,构架了一个基于联合编目、联合采访、资源共建、统一门户、借阅优先、联合咨询等方面的共享域。文章通过该共享域与区域图书馆中心的契合,在对SaaS与云存储在区域图书馆共享域的服务和建设及其之间的关系进行分析的基础上,提出构建区域图书馆共享域的设想,并对区域图书馆共享域如何应用SaaS与云存储进行探讨,有助于区域图书馆之间的合作与可持续发展。
SaaS;云存储;共享域;区域图书馆共享域;CALIS三期工程
1 引 言
图书馆业务更多的是利用共享域平台进行业务协调,最终目的是实现图书馆文献资源的多层次共享,以消除读者“文献匮乏”感为最终目标。而目前大多数图书馆使用的集成系统都是基于本地安装的。读者要想进行某项专题研究,只能通过本地图书馆来获得此项服务。从长远发展趋势来看,未来图书馆学科服务将是基于联合编目、联合采访、资源共建、统一门户、借阅优先、联合咨询等方面的共建共享。利用SaaS(Software as a Service)和云存储构建区域图书馆共享域,为各图书馆之间进行文献资源传递提供一种新的共享,为教学、科研提供保障,实现文献资源共享,提高文献资源的利用率。
所谓“共享域”,是指为了进行资源共享,多个图书馆根据学科或者地区而共同建立的合作联盟,其目标是共享资源和彼此协作[1]。中国高等教育文献保障系统(CALIS)构建的共享域、跨区域学科联盟共享域、外语院校共享域、五星联盟共享域和大连、宁波与重庆等区域图书馆共享域就是此定义的典型实践。CALIS共享域是在一期、二期工程的基础上,基于云计算在图书馆领域的理论研究的总结,按照区域划分和学科分类进行文献传递服务实践的结果。CALIS共享域包括虚拟共享域和实体共享域[2]:“虚拟共享域是图书馆按服务或学科组建联盟,不需要使用云平台,在数据和服务层面实现共享的一种共享域;实体共享域是指利用云计算技术构建某种服务平台,实现为本区域的高校图书馆提供各种云服务,如云存储、SaaS等的共享域”。如图1所示。CALIS共享域的构建为基于区域图书馆共享域云平台进行文献资源共享提供了理论依据。
区域图书馆共享域是为了资源共享和彼此协作,由某个地区或重点城市的具有学科带头导向或具有重要影响力的重点高校图书馆领导,通过动员本地区的高校图书馆按照自愿、互惠和平等的参与机制,将各自的文献资源统一存储在共享域平台的“云”中,各高校图书馆以会员单位身份实现共享本区域的文献资源。通过区域高校图书馆利用共享域云平台,各图书馆无需购买和建立本地系统就能获得整体性的服务效应。本文在分析SaaS和云存储技术研究和应用的基础上,提出创建区域图书馆共享域的设想,并以安徽省各高校文献资源业务管理系统的使用情况为例阐述实现共享域的可能性,以促进图书馆的合作与发展。
图1 各成员馆与共享域的关系
2 理论支持和实践意义
2.1 应用云计算技术的设想
作为一种信息技术基础设施与服务的交付和使用模式,SaaS和云存储技术深刻地影响了传统图书馆的服务方式和文献资源的存储方式以及图书馆使用的基于本地进行安装的文献资源管理方式。迈克尔·史提芬在其撰写的《图书馆如何使用云》一文中,对图书馆如何应用云计算开展文献服务做出初步的设想和探索[3]。杰尼佛·盖滕比认为,“图书馆对自身拥有馆藏资源的数据,供用户自由地访问和获取,并不取决于运行这些馆藏资源数据的管理集成系统,而是取决于图书馆对云计算技术的掌控能力”[4]。这是云计算技术在图书馆领域应用的初步设想。斯蒂芬妮·巴克在其《许多人对云计算的定义仍然不确定》一文中指出,“美国的许多公立图书馆经过与OCLC的友好协商,共同使用图书数据和在线目录。云计算技术的应用使传统图书馆供应商也开始转变观念,为图书馆提供SaaS和云存储服务”[5]。 “数字图书馆在为用户带来极大便利时,其存在的问题也开始显现,项目开发的多头性,难以制定统一的标准,文献资源内容只能部分获取”[6]。基于云存储技术,SaaS服务试图降低图书馆永久保存文献资源数据的压力,从而有效降低了图书馆开展业务服务的难度。SaaS服务和云存储技术将图书馆从数字图书馆的模式中彻底解放出来,集中精力关注文献资源运行在云端的服务和共享能力。总之,国外图书馆对云计算的理解,关注的是云计算技术对于图书馆的意义——使图书馆的数据和业务管理突破实体图书馆的地域限制,但难以制定统一的共享服务标准,如存储数据格式标准。数据使用是采用一次性许可服务,还是采用租用服务模式,目前还没有好的解决方案。
2.2 云计算的研究
国内图书馆对云计算的研究主要有以下3个部分。
(1)图书馆云计算研究。刘炜、陈臣、王长全、李惠琴等学者提出:从基础设施方面来解决图书馆的终端设备、软硬件共享、数据安全;在服务方式上,云计算使图书馆突破了信息资源的共享局限,提高图书馆服务能力,让服务更加方便快捷[7-10]。但总体来说,研究仍存在一些不足,如何借助云解决联盟的共建共享问题,其对云技术的研究多停留在宏观层次上,对中、微观层面的文献资源如何获取缺乏深入研究。
(2)基于CALIS三期工程的图书馆云服务研究。王文清、陈凌提出CALIS图书馆云战略即设计和开发CALIS云服务平台,构建多级CALIS云服务中心,为高校用户提供各种类型服务,同时为图书馆提供本地化的云服务解决方案[11];肖小勃等针对CALIS 一期、二期工程中在服务方面存在的局限性,提出在CALIS 三期共享域平台上开通云服务,为成员馆提供联合资源检索服务、元数据联合编目服务、文献联合订购服务等[12]。CALIS共享服务平台已在全国400多家图书馆得到广泛应用。
(3)图书馆共享域建设研究。杨新涯等根据CALIS三期建设并结合重庆大学图书馆系统整合进行实践研究,认为CALIS共享域和地方图书馆系统之间,利用单点登录、资源交互、统一身份认证等功能,提高了CALIS共享域与各个图书馆的服务联系[2];杨振力结合CALIS大连共享域的前期规划,对共享域服务体系、服务内容、环境支持、馆员培训等进行分析[13];张海霞以旅游院校五星联盟院校图书馆共享域平台为例,提出实现完善书目数据的质量和服务内容的建议[14]。
综合上述可以看到,目前的研究和项目实践主要是围绕资源与服务的联合保障,从软件即服务、平台即服务这两个方面体现在硬件环境云共享、文献资源云建设、人力资源云共用、用户服务云体验,为实现图书馆的云服务和云共享提供了理论依据,但缺乏对云存储在共享域的研究。
2.3 应用现状
理论研究的突破给图书馆提供了一个新的管理机制和服务模式,为图书馆的信息资源整合和服务创新提供了新动力。由美国高校为主参与建设的Hathi Trust[15]系统对云环境下为用户提供服务。这种合作共建共享的模式对其他国家高校图书馆在云环境下开展用户服务提供了积极的范例。协作共享平台针对高层次读者的需求进行包括图书馆业务和环境支持两部分的服务内容。OCLC 公司推出基于全球书目数据的“通过互联网合作共享图书馆文献资源”改良版的全球分享系统,主要包括[16]“通过互联网对图书馆的文献资源进行远程控制,各个图书馆可以通过自身拥有的服务器,共享全球分享系统所带来的各种便利,而这种新型服务机制,将不再受制于某几家核心图书馆或垄断的数据提供商,只要是网络能到达的地方,任何图书馆都可享受这种新型服务”。全球分享管理服务提供基于网络的环境,使图书馆的编目、获取、权利许可和流通业务都采用SaaS服务。此外,系列解决方案的网络规模管理可为用户提供所需文献资源内容的多样化提取服务,而阿尔玛产品基于云服务环境的云计算系统,以艺术的手法进行个性化藏书系统的建构、存储、服务,确保其能够通过SaaS方式满足各种类型的用户需求。
马歇尔·布瑞德[17]基于上述公司的研发产品,撰文指出“云环境下的图书馆业务集成管理系统将采用SaaS方式提供服务,同时,更多地采用年费的方式,而不是传统使用的一次性缴费方式”。此外,全球两大开源软件Fedora和DSapce公司在原来联合开发的杜拉云[18]基础上进行产品升级,增加了面向云服务提供商跨多个平台的信息归档,功能包括云存储多服务器备份存储、数据安全等级、可视图像的云加载以及软件开发交流平台等。麻省理工学院、哥伦比亚等大学通过签约的方式,利用杜拉云来保护其托管的文献资源数据。此外,日本基于SaaS开发的GPRIM和基于云存储的TopNet系统,则有效解决了文献资源内容的获取服务和数据存储的安全性。
云计算给图书馆带来高效节能、扩展性强、节约成本及实现更大范围的数据共享和更高的数据挖掘价值,但也不乏失败案例,如华盛顿大学医学院图书馆应用云计算服务开展图书馆指南和在线参考服务。此外,当机风险、数据安全与隐私、数据所有权等,应引起图书馆的高度重视。对于存储在云端的数据,图书馆和服务商各有哪些权利?如果图书馆选择放弃云服务,哪些数据需要收回?以何种形式收回?如果服务商倒闭退出市场,图书馆的数据将如何迁移到新系统上?这些都是图书馆面临的新问题,应对这些风险有一个清醒的认识并做好应急准备。
天津高校图书馆联盟为适应云共享服务环境,从美国集体引进图书馆文献资源集成管理系统,这种引进模式也为我国其他图书馆进行此项服务提供了参照依据。CALIS基于云计算的三期共享域工程为我国区域图书馆共享体系进行结构再造带来契机。
3 创建区域图书馆共享域的依据
云计算是指用户利用因特网从公用或共用机器的仓库中获取存储在“云”中的资源或服务,并且可以通过任何的端口设备获取与使用这些资源。云计算技术对图书馆的文献资源业务管理系统的再造,转变了图书馆的服务理念。哈默对“业务流程再造”的解释为:“再造,不是自动化改造而是推倒重来。[19]”哈默的这一观点,对我国图书馆基于云环境下的文献资源业务集成管理系统的再造,在CALIS三期工程的基础上再造区域图书馆文献资源协作共享平台提供了理论与实践依据。
SaaS是当前最为普遍的一种云计算类型.其基本理念是将软件置于服务提供商的服务器上,由服务商对其进行维护与管理,使用软件的用户只是购买了该软件的使用权,且并不在本地安装。目前,这种云计算在图书馆中的应用,实际上是Web2.0在图书馆中应用,主要是在图书馆服务中应用Conduit在线服务生成的浏览器即时通讯工具等提供即时在线服务[20]。高校图书馆如何利用自身资源来开发和创造自己的特色馆藏文献资源?如何使本馆特色文献资源与本地区高校相同或相近学科的用户进行共享?如何做到与这种特色文献资源相互吸收、互相借鉴、共同提高?基于CALIS三期工程再造区域高校图书馆文献资源共享域平台,将SaaS技术与云存储技术嵌入到各高校图书馆本地系统中,实现无缝衔接,减少重复建设,且使运行维护费用达到成本与效益的最优化,同时方便文献资源的获取。
云存储是指通过集群应用、网格技术或分布式文件系统等功能, 将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的系统[21]。CALIS从主要面对“211”院校开展服务(一期工程),逐步扩展到所有高校(二期工程),目前正处于三期工程(又称共享域工程)验收阶段。三期共享域工程是针对一、二期工程服务能力所限以及不能将社会服务列为重点的现状,以“资源共享”为目标,以“普遍服务”为指导方式,以“云计算”为技术手段,以“多级保障体系”为骨干,构建覆盖全国各类高校的图书馆共享网络。三期工程的建设为区域图书馆提供最稳定可靠与最安全的数据存储平台。这种平台存储了不同成员馆的大量数据,配置了大量的存储设备,因此区域图书馆共享域云存储平台就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。图书馆不必再担心系统被病毒黑客入侵、数据信息的丢失等问题。同时,在云存储的条件下,由于资源都是存储在共享域平台上的“云”中,读者可以更加方便地获取其所需的资源。
4 共享域创建的实现与管理机制的创新
图2 协作共享平台结构图
现以安徽省各高校文献资源业务管理系统的使用情况为例,阐述共享域的实现与管理机制的创新。这些系统绝大多数都是基于本地安装的以安徽省高校资源共享服务平台为基础,同时吸收了安徽省高校数字图书馆联盟建设中的部分成功经验,构建基于CALIS三期工程模式并以SaaS与云存储等主要技术支持的文献资源业务协同平台,如图2所示。
这种平台采用的是基于Portal技术的服务集成和基于SaaS技术把各高校图书馆的资讯文献管理系统集成为联盟共享域,以区域发展需求和应用为导向的学科资源保障体系,资源的完整、连续、创新是实现联合服务的基础[22]。高层次读者关注的焦点是核心资源、核心机构、核心作者、核心期刊、前沿趋势和热点,所以共享域的资源与服务的架构应紧紧围绕读者的需求,即以读者为中心构建资源服务体系协作共享平台针对高层读者的需求进行包括图书馆业务和环境支持两部分的服务内容。其中图书馆业务支持又包括协调采购与资源建设(如成员馆协调采购、共享式资源与保障式资源建设和自建特色数据库)、公共检索与资源导航(如学术资源搜索引擎、外文期刊网、中外文学位论文和专题特色库)、文献传递与原文获取(如图书、期刊、学位论文、古籍)和互动问答与课题服务(如MSN、QQ、表单等)4方面的内容,还可以实现成员馆之间的人力资源共享,及时满足各成员馆读者的需求;图书馆环境支持则采用SaaS服务模式,CALIS 系统和服务部署在协作共享平台上,为成员馆提供共享和交流的平台,同时也有利于辅助成员馆开展科研工作,提高学术研究水平,促进学校学科建设。
协作共享平台本身就是一个多技术、多应用与多服务合作协同的共享资源池,成员馆的资源是按照统一部署、集中管理、按需分配、分布使用的原则进行管理与调度,提高对各成员馆系统资源统一划分、综合管理、弹性分配、全面优化的能力。在保证业务协同平台管理系统具有较高管理、运营效率的前提下,减少各成员馆资源部署时间,根据用户需求而自由、弹性、准确、快捷地分配,为读者需求开展提供资源供给服务。
这种平台的资源管理可分为资源信息收集、资源信息更新、资源发现、资源调度、资源定位、状态监控等部分,通过对该平台资源池资源总量和正在使用的资源数量进行统一的管理、分配、调度。依据资源分配与用户需求实际,采用高效的资源管理策略,按照成员馆资源使用时间、内容、数量、权限等进行分配。同时,依据资源的属性描述获得成员馆资源拥有的物理地址,实现资源分配在资源请求、分配、使用、释放过程进行监控,确保业务协同平台安全、高效、可控、便捷。
该平台是云计算时代相同学科领域内进行学术研究与交流的理想平台,其实现的前提就是要有稳定和切实可行的机制、统一构建的平台、规范的元数据格式与标准。区域图书馆共享域还应及时采购、上传、收集和保存各个成员馆的特色学科资源和知识成果,并提供有效的共享和利用。这将对业务协同平台的资源共享、数据共享等基础建设具有积极的促进作用。
业务协同平台具有对成员馆文献资源进行调度和依据读者需求而变化周期的特点。当成员馆进行文献传递服务时,读者群数量对文献资源需求的不确定性,会造成文献资源需求海量激增以及可供分配的文献资源迅速减少,致使成员馆文献资源管理、利用效率快速下降和读者需求满意度降低。因此,该平台具有针对成员馆文献资源需求量大、资源分配适时性强、调度高效与快速、突发性调度需求事件发生概率高等特点,设置较高的分配权限,当所分配的资源数量影响成员馆开展服务活动时,优先将资源池资源进行分配,或者从其他适时性与资源分配级别低的应用上进行调度。
成员馆在符合业务协同平台相关规则的基础上,平台为成员馆提供统一的管理接口和用户界面,对异构性高的成员馆具有较强的综合管理能力。此外,在业务协同平台构建中,采用以SaaS服务模式管理为对象的模块化设计方法,确保该平台管理模块具有较强的兼容性和独立性。使用户直接利用协作共享平台来检索其他成员馆的文献资源,当然也可以借助云存储技术,基于SaaS 服务架构把高校馆的数据存储在共享域平台的资源池中,依据平台预先设置而实现对各成员馆资源的配置和调度。当某个成员馆的部分服务器出现故障时,高校馆只需对关键数据进行备份存储,这些关键数据基于安全性考虑,防止存储在服务器上的关键数据损坏,应在平台的资源池中和各备份中心之间实施资源池资源的统一管理和调度,当某一成员馆负载量过大时,能够从其他成员馆的备份中心进行资源调度和迁移[23],确保读者需求的不间断性,保证成员馆系统数据传输的安全与畅通,及时将调度控制数据传输至控制器[24]。此外,通过SaaS 服务在物理上按一定的规则,构成一个统一的逻辑整体,使得每个成员馆服务器上的数据存储相对均衡,从根本上解决海量数据的存储、冗余、集成等方面存在的问题,缓解各成员馆的存储压力。这不仅拓宽了平台的应用范围,也降低了用户的应用门槛,使各成员馆更加专注于各自的服务领域。
5 结语
地方高校图书馆由于技术、设备、人员、能力等因素的限制,还有诸如各高校图书馆所在地域经济发展状况(影响资本投入) 、基础教育结构(影响服务对象) 、原有文献馆藏结构(影响共建共享与资源整合模式)等都会影响区域图书馆共享域建设的具体形态。因此,建设区域图书馆共享域能够实现各高校图书馆文献资源的统一集成和管理,促进高校图书馆文献资源的长期、有效、完整保存,是加快传播和共享文献资源的重要途径,对本区域的学科资源的开发、利用具有现实意义。区域内高校图书馆之间可以从联合编目、联合采访、资源共建、统一门户等方面进行合作,有效解决各高校图书馆所面临的资源、设施、服务、经费等因素的影响,使各高校图书馆的馆藏文献资源初步形成“集中资源、分工合作、均衡负载、用藏结合”的服务体系,后期工作仍然需要着力完善应用系统改进和集成,采编流程与CALIS联机编目中心整合等工作,累加更多的共享版应用,如特色学科资源库共享版、教参管理系统共享版等,强化协作共享平台云存储体系的建设力度,为成员馆及高校读者提供更加便捷的文献资源服务。
[1] 陈凌.CALIS共享域服务设计与实现(厦门)[EB/OL]. [2013-04-17].http://www.doc88.com/p-70721610025. html.
[2] 杨新涯,王文清,张洁,等.CALIS三期共享域与图书馆系统整合的实践研究[J].大学图书馆学报,2012(1): 5-8,99.
[3] Stephens M. How Can Libraries Use the Cloud [EB/ OL]. [2013-04-22]. http://tame the web.com/2008/08/ 04/how-can-libraries-use-the-cloud/.
[4] Janifer Gatenby. The Networked Library Service Layer: Sharing Data for More Effective Management and Cooperation[J/OL]. (2008-01-18). Publication:Ariadne Issue 56. http://WWW.ariadne.ac.uk/issue56/gatenby/.
[5] Buck S. Library in the Cloud-Making a Case for Google and Amazon[J]. Computer in Libraries, 2009(9): 6-10.
[6] 尤春花.云计算环境下图书馆信息资源共享的挑战与对策[J].图书与情报,2011(4):66-68.
[7] 刘炜.图书馆需要一朵怎样的“云”?[J].大学图书馆学报,2009(4):2-6.
[8] 陈臣.面向分散式存储的数字图书馆云存储方案研究[J].新世纪图书馆,2012(12):65-67,88.
[9] 王长全,艾雰.云计算环境下的数字图书馆信息资源整合与服务模式创新[J].图书馆工作与研究,2011(1): 48-51.
[10] 李惠琴.基于“云计算”的数字图书馆服务模式[J].科技创新导刊,2010(31):209-210.
[11] 王文清,陈凌.CALIS 数字图书馆云服务平台模型[J].大学图书馆学报,2009(4):13-18,32.
[12] 肖小勃,邵晶,张惠君.CALIS三期SaaS平台及云服务[J].图书情报工作网刊,2012 (3):52-56.
[13] 杨振力.资源共建共享机制的创新——CALIS大连共享域的建立[J].图书馆学刊,2013(2):54-56.
[14] 张海霞.旅游院校五星联盟共享域中心服务模式研究[J].图书馆学研究,2012(8):83-86.
[15] What’s Hathtrust [EB/OL]. [2014-05-10].http: //www. hathtrust.org/help general.
[16] OCLC News Releases, 32 Libraries Lead the Way to Web-scale Innovation-OCLC Web-scale Management Services on Target for July Lgeneral Release[EB/ OL]. [2013-05-04]. http://www.oclc.org/news/releases/2011/201128.htm.
[17] Marshall Breeding. What’s In Store for the Library Automation Industry in 2012?[EB/OL]. [2013-04-16]. http://www.alatechsource.org/blog/2012/01/whats-instore-for-the-library-automation-industry-in-2012. html.
[18] Press Release, DuraSpace Launches Open-source Cloud Service[EB/OL]. [2013-05-14]. http://www. duracloud.org/content/duraspace-launches-opensource-cloud-service.
[19] 哈默.再造:不是自动化改造而是推倒重来[J].知识经济,2004(4):48-50.
[20] 梁爱东,薛海波,周波.云计算下的图书馆发展策略研究[J].曲靖师范学院学报,2011(3):106-111.
[21] Michael Miller. Cloud Computing: Web-based Applications That Change the Way You Work and Collaborate Online[M]. First Edition. Que Publishing, 2008:289-293.
[22] 尹方屏, 张大为 谷秀洁,等.构建跨区域学科联盟共享域的策略研究—— CALIS 示范馆建设启示[J].图书馆建设, 2012(7): 62-66.
[23] 程仕伟,潘郁. 云计算环境下基于可信性的动态资源分配策略[J]. 计算机工程, 2011,11(37): 45-48.
[24] 张建勋,古志民,郑超. 云计算研究进展综述[J].计算机应用研究, 2010(2): 429-433.
Discussion of SaaS and Cloud Storage Applied for the Regional Library Share Domain
Zhu Lin
(Huainan Normal University Library, Huainan 232038)
Each library has its own advantages of collection, but large integrated systems which are used in the library installed locally, if a reader want to do a special study, he only can use local library resources. Therefore in 2010, CALIS builds a joint cataloging, joint interview, unify resources, borrow priority, of joint advisory and other aspects share domain. This paper analyzes the relationship between SaaS, cloud storage, and the service and the construction of regional library shared domain, then propose the application of cloud storage to the regional library shared domain, this will contribute to the cooperation and sustainable development of the regional libraries.
SaaS, cloud storage, shared domain, regional library shared domain, CALIS third project
G250.74
A
10.3772/j.issn.1674-1544.2014.03.010
朱林(1958- ),男,淮南师范学院图书馆副研究馆员,研究方向:数字信息资源服务与长期保存。
2013年10月9日。