数字图书馆的云计算应用及信息资源安全问题
2014-02-11邵燕,温泉
邵 燕,温 泉
(中国国家图书馆,北京 100081)
云计算作为信息技术的新宠,自诞生之日起就引起了学术界和产业界的广泛关注,凭借着开放性、高度共享、便利性、高性价比等特点,迅速渗透到各个行业,带来了信息化应用高速发展的云时代。进入21世纪的第二个十年,数字图书馆面临着海量信息资源的组织与管理、信息资源共建共享与推广、个性化服务等方面的迫切需求,云计算的出现,为数字图书馆解决这些现实问题和开创新的服务模式提供了很好的思路。国内外图书馆界在云计算出现早期就对其保持了极高的敏感度,最早的报道是美国著名图书馆学家迈克尔·斯蒂芬2008年8月在其博文 《图书馆如何使用云》中将云计算列入2009年图书馆界的十大技术趋势[1]。随后,国内外图书馆界对云计算应用进行了积极探索,各种基于云的数字图书馆应用先后推出,不断改变着我们的资源建设与服务模式、管理理念和业务格局。
1 数字图书馆的云计算应用
按照美国国家标准化研究所的定义,云计算有软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)三种服务模型[2]。这几种服务模型在国内外的数字图书馆建设中都得到了应用,其中比较有代表性的应用包括:图书馆自动化系统(ILS)、信息资源存储、信息资源检索与咨询服务、总分馆协作等。从参与图书馆来看,既包括各类型公共图书馆,也包括高校图书馆或者是图书馆联盟。
1.1 传统资源管理云服务
经过二三十年的发展,图书馆自动化系统在管理传统书刊资源方面具有非常成熟和完善的业务功能,在图书馆领域有了广泛的应用。随着云计算技术的发展,各开发商也逐步推出了基于云的ILS系统,这方面比较有代表性的系统有:Biblionix公司于2008年开发的ILS产品阿波罗(Appollo);LibLime公司2009年基于开源图书馆自动化系统Koha推出的Koha Express(适用于中小型图书馆)和LibLime Enterprise Koha(适用于大中型图书馆和图书馆联盟)两款托管式系统;2011年7月,OCLC推出的WorldShare服务,提供基于网络的图书馆自动化管理环境,优化了编目、获取、许可管理和流通流程,让图书馆能够共享基础设施成本和资源,开展网络协作;国内有华南理工大学图书馆基于Unionlib系统部署的SaaS模式图书馆自动化系统等等。
这类系统一般是SaaS的云服务模式,图书馆不再需要配备高昂的设备和基础设施条件,大大减少了前期投入和系统维护成本,对于经费和人力相对不足的中小型图书馆尤其适用,具有很好的市场前景。据OCLC官方数据显示,截至2013年3月6日,已有100个图书馆在使用World-Share管理服务,另外还有60多个图书馆即将使用这项服务[3]。应该说,图书馆自动化系统在云计算环境下的转型还是非常成功的。
1.2 数字资源云存储
图书馆引入云计算的另一大应用就是云存储服务。数字图书馆收藏了海量丰富的数字资源,面向互联网用户提供7×24小时服务,资源、系统平台和用户服务数据的存储和备份需求非常大。借助云存储技术,图书馆可以将庞大的资源数据进行异地存储与托管,有效地解决了自身存储空间不足的问题。2009年7月,美国国家数字信息基础设施与保存计划(NDIIPP)与DuraSpace公司联合开展DuraCloud试点研究项目,计划开发云存储平台,解决公共图书馆数字信息的长期保存,并提升服务效能。目前,DuraSpace公司已正式发布DuraCloud产品,为各类型用户提供基于云端的数据资源存储和访问服务[4]。
此外,Amazon公司提供的S3存储服务也是目前非常成功的云存储应用,美国波士顿公共图书馆(BPL)、华盛顿哥伦比亚区公共图书馆和俄亥俄州图书馆与信息网络(OhioLINK)都使用了该服务,由Amazon托管一部分数字资源或者进行图书馆系统的备份。与Amazon的S3服务类似的还有Google公司的云存储GCS、Microsoft公司的Azure等,这类服务通常兼具IaaS和SaaS模式。
1.3 数字资源云服务
云计算除了能使单个图书馆面对海量数字资源保存和备份时更加游刃有余,还能够有效解决各馆在数字资源管理与服务中常常面临的异构平台和缺乏标准等问题,更易实现海量数据的有序整合和不同系统间的数据共享,为用户提供一站式服务,充分体现数字资源建设的集群与规模效应。此类服务一般为SaaS和PaaS模式。2011年10月,基于云服务理念的中国政府公开信息整合服务平台正式上线,平台由国家图书馆搭建,资源内容采用分层建设、共建共享的模式,联合全国各省、市、区、县各级公共图书馆共同实现对全国各地政府公开信息的整合与服务,目前该平台已经完成24个分站的建设[5]。
此外,利用云计算平台本身的高性能和海量存储能力,还可将数字图书馆资源进行重组、创新、优化和增值,创新阅读方式和体验。2009年初,OCLC推出了一款名叫WorldCat Mobile的移动应用程序,借助搜索技术和基于位置的云计算服务,用户可以通过智能移动终端查找附近图书馆的电子及纸质馆藏,目前已经在北美,欧洲的英国、德国、法国、荷兰等地提供服务。
1.4 数字图书馆云协作
云计算服务平台的兴起为数字图书馆的协作与共建共享提供了新的思路和技术路线,使得整合各类型图书馆资源与服务、构建大型分布式的数字图书馆服务网络成为可能。这种分布式数字图书馆服务网络能够对各种资源和服务进行调度、分配和管理,使得数字图书馆服务打破时间、地域限制,更为均衡、快捷。
以吉林省图书馆联盟为例,它基于云计算的技术与理念构建了一个综合性的图书馆联盟云服务平台,整合了全省40余家公共、高校、科研系统图书馆的资源,实现了数字图书馆的集约化管理[6]。截至2011年末,吉林省图书馆联盟云服务平台所采用的核心系统Primo Central中整合的外文电子图书、期刊和报纸元数据超过了2.5亿条。
此外,还有中国高等教育文献保障系统(CALIS)的数字图书馆云平台模型Nebula[7],结合了云计算、分布式SOA等技术,实质上就是一个能够提供云服务的、互联互通的CALIS数字图书馆服务网络,为高校用户提供资源检索、资源下载、参考资源、馆际互借等服务。
数字图书馆云协作涉及数字图书馆建设的基础设施、数字资源,软件系统和管理平台等方面,是比较综合性的云计算的应用,探索了数字图书馆的协作新模式,也大大提升了面向终端用户的数字资源服务能力。
2 云计算环境下信息资源安全需求
云计算的发展使得数字图书馆在拓展服务范围、开展共建共享、节约成本投入等方面提供了更大的空间,同时云计算的迅猛发展也给信息资源的安全管理提出了更高的要求,具体可以从如下几方面来考虑:
(1)完整性。完整性是指数字图书馆在传输、存储或者服务过程中,能否确保数据信息未被恶意更改、破坏和丢失,保持着原始数据和信息不被未授权的篡改。特别是对于一些稀缺的公共数字文化资源,一旦被篡改或者删除,数字图书馆保存、传播信息的职能将受到挑战。
(2)保密性。保密性是指数字图书馆的信息资源只保证授权用户的访问和操作,限制其他非授权用户的利用。从使用过程可以分为信息资源传输的保密性、信息资源存储的保密性和信息资源处理过程的保密性。信息的保密性对于数字图书馆非常重要,除了信息资源本身的授权访问以外,还要考虑用户在访问资源时的信息保密,以及图书馆信息资源使用情况的保密性。
(3)可用性。可用性是指图书馆在需要时能够及时存取和访问所需的云服务和数据信息,不存在延时或者不稳定的情况[8]。可用性与安全息息相关,无法保证可用性对于数字图书馆来说还不如不用这样的系统。用户对信息资源和服务的需求是7*24模式的,他们并不关心图书馆的实现方式,但是在需要的时候,数字图书馆能否提供稳定和可用的资源与服务,将直接影响其耐心和忠诚度。
(4)规范性。云计算环境下,信息资源的访问和管理策略是否规范,是否支持数字图书馆业务系统的标准,是否对信息资源的知识产权有相关的条款约束,在遇到侵权或者故障时是否有完善的保障措施来确保图书馆的损失最小等,都是规范性的重要考虑因素。
3 云计算环境下信息资源面临的安全隐患
由于云计算是将资源和相关数据全部交付到云提供者手中,一旦云计算或者云存储平台出现数据丢失和损坏,对用户都是无法挽回的损失。例如 2008年,Amazon的 S3、Google的 AppEngine和Gmail都曾出现过长达数小时的服务中断或故障,使得依赖其进行文件存储的许多机构和用户蒙受了很大损失[9];2009年,微软的Danger云计算平台发生安全事故,大量的数据丢失,导致许多用户无法访问他们的个人信息及备份资料[10],这些丢失的数据后来也无法恢复。还有云计算带来的知识产权界定的问题。因此,要保障数字图书馆信息资源的完整性、保密性、可用性和规范性,我们必须要重新审视云计算环境下数字图书馆的资源建设与管理存在着哪些安全隐患。
3.1 技术层面的安全问题
在云计算环境下,图书馆对存放在云端的信息资源与相关流通数据并非像传统模式下那样拥有绝对的优先访问权,反而是云服务提供者的访问权限级别更高,这对于图书馆来说是一个比较大的安全隐患。同时,由于资源是存放在云端,图书馆无法获知该资源实际的存储位置,任何的访问和处理都要借助网络来完成,来自互联网的各种安全威胁在云服务条件下显得更为突出,如信息资源可能在传输中遭受越权访问或访问受限,或者因网络加密技术不够严格而被窃取,保密性受到威胁;网络故障造成服务短期或间歇性终端,无法保证信息资源的可用性等。
此外,为了提高云服务的访问性能,云服务提供商常常采用分布式存储技术,而容灾备份也使得相同资源存在多个物理备份,并且云计算的共享性和弹性存储机制又降低了信息资源的数据隔离程度,那么,如何保证每个资源备份都拥有相同的数据保存和恢复能力,还能避免传输和存储过程中被截获、泄露和篡改,这些都是数字图书馆在引入云服务时不能回避的安全问题。
3.2 管理层面的安全问题
(1)云服务的安全管理策略。云服务模式中,图书馆用户在经合法授权后,可在世界任何地方通过有线、无线等方式下载数字资源,享受数字图书馆的个性化服务,这就使得对于“云”用户来说,用户数据和资源的权限管理成为数字图书馆信息资源安全的重要组成。云服务提供商的安全管理水平和访问控制策略是否符合图书馆的安全等级要求,是否执行第三方安全审计,并对用户数据操作进行安全监控与权限限制等等,都会对数字图书馆的安全管理产生直接影响。
(2)云计算行业标准。对于云计算这一创新技术,已经无法适用传统的信息安全标准,不同的云服务运营商在设计产品时制定的安全策略也大相径庭,这就给图书馆进行云服务的选择或者在提供云服务时制定安全策略造成了难度。同时,从目前云服务市场占有来看,基本上是一些行业巨头在垄断着云服务市场,如果图书馆改变了云计算策略,或者变更云计算服务商,其技术复杂性和商业复杂性,成为数字图书馆信息资源安全的隐患所在。
(3)知识产权的界定。云计算的出现对信息资源的生产、整合和服务模式带来了变革,图书馆使用云服务,将数据信息交付云服务提供商托管。无可非议,这些被托管资源的知识产权归图书馆所有,而服务提供者没有权限对这些资源进行开发。但处于云计算和大数据环境中,许多云服务提供者会利用这些数据,以数据整合、数据挖掘、知识服务的名义使其对用户数据的利用合法化[11]。而数字图书馆原有的版权保护框架可能并不适用于云计算带来的这些版权纠纷,这就使得图书馆在享受信息资源的云服务之前,要对相关的版权风险有充分的评估,并制定出切实可行的方案,将安全风险降到最小。
3.3 政策层面的安全问题
云计算是个新生事物,因此在面对云计算带来的一系列安全隐患时,迫切需要相关的法律或者政策支持,以便在安全问题出现时,图书馆的权益能够得到充分保障,将损失降到最低。然而,目前我国在信息资源安全方面的政策法律非常有限,涉及云计算带来的安全问题的政策支持更是存在很大空缺。对于数字图书馆引入云计算来说,一定要充分认识到政策层面的相关安全风险,并提前制定相应措施来进行规避和保护。
首先,云存储带来的法律风险。由于云计算是将数字图书馆的信息资源存储在云上,而实际支撑云的硬件设备可能存储于世界各地,不同国家或地区对于信息安全的法规约束以及纠纷处理策略存在很大的差异,因此,在选用云存储时对于不同的供应商所涉及的司法政策要有充分的考察,以防出现违规违法行为时存在较大责任认定风险。
其次,云服务条款的权责约束的不完善也会对图书馆信息资源的安全造成隐患。亚马逊的云服务声明条款中这样写道:“我们对于任何未经授权的访问或使用造成的破坏、删除、销毁或弄丢任何你的内容或应用的程序不负有责任。”[12]这种情况并非偶然,许多云服务的提供商并不承诺对数据泄密或数据被破坏等行为承担法律责任,因此,除了要对云服务所属国家或地区的法律政策有所了解外,还需要对云服务提供者本身的服务条款进行仔细研究,以防他们将信息资源的安全风险转嫁给自己。
4 结语
云计算在数字图书馆中的应用才刚刚开始,尽管存在着诸多的安全隐患,但综合考虑其多方面的优势,我们相信,云计算在未来的数字图书馆建设中将占据重要的一席之地。面对信息资源管理与服务中存在的安全问题,未来图书馆和云服务的提供者需要共同努力,加强对新的防范措施和技术的研究,加强沟通和协商,加强标准和法规建设,从技术、管理和政策等多方面去完善信息资源的安全管理,逐步形成一个完善的云计算信息资源安全保障体系,使数字图书馆用户早日能够实现安全的“云端漫步”。
[1] Stephens M.How can libraries use the cloud[EB/OL].[2013-03-18].http://tametheweb.com/2008/08/04/howcan-libraries-use-the-cloud/.
[2] Evelyn Brown.Final Version of NIST Cloud Computing Definition Published [EB/OL].[2013-03-25].http://www.nist.gov/itl/csd/cloud-102511.cfm.
[3] OCLC news releases,University of Nebraska Omaha is 100th OCLC WorldShare Management Services user in production[EB/OL].[2013-04-15].http://www.oclc.org/en-US/news/releases/2013/201316dublin.html.
[4] Open technologies for durable digital content[EB/OL].[2013-03-05].http://www.duracloud.org.
[5] 中国政府公开信息整合服务平台.[EB/OL].[2013-05-06].http://govinfo.nlc.gov.cn/.
[6] 谢原,张静鹏,周秀霞.图书馆联盟云计算服务平台的设计与实现——以吉林省图书馆联盟云服务平台建设为例[J].情报科学,2012(12):1854-1857.
[7] 范敏.云计算在数字图书馆中的应用与瓶颈研究[J].现代情报,2012(2):147-150.
[8] 王新磊.云计算数据安全技术研究[D].郑州:河南工业大学信息科学与工程学院,2012:18-19.
[9] ARMBRUST Michael,FOX Armando,GRIFFITH Rean,et al.Above the Clouds:A Berkeley View of Cloud Computing [EB/OL].[2013-05-08].http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.pdf.
[10] 微软云计算遭质疑Sidekick断线资料毁损谁来买单[EB/OL].[2013-03-16].http://www.51testing.com/html/74/n-170374.html.
[11] 胡小菁,范并思.云计算给图书馆管理带来挑战[J].大学图书馆学报,2009(4):10.
[12] 王长全.云计算时代的数字图书馆信息安全思考[J].图书馆建设,2010(1):50-52.