基于云计算的数字图书馆可持续发展研究
2015-07-12李翔宇邓胜利
李翔宇 邓胜利
(武汉大学信息管理学院,武汉,430072)
1 引言
自可持续发展概念被提出,即受到世界关注。美国环境保护机构(the US Environmental Protection Agency,EPA)认为“可持续发展创造并保证人类与自然能够和谐共处,并满足当代和后代人的社会、经济以及其他方面需求”[1]。2014年,全球报告倡议组织(GRI)发布《可持续发展报告指南》,提供更为有力的工具。
当前,可持续发展日益深入社会,包括数字图书馆领域。数字图书馆的可持续发展内涵广泛,包括了从有关资源数字存储的技术层面问题到有关资源的长期可获得性的经济和社会问题[2]。在信息技术支持下,数字图书馆在管理和服务方面得到发展,但也面临着诸如存储空间不足、数据遗产保护、技术升级后资源兼容性以及服务器负载过重等问题。云计算利用海量存储和计算资源、使用与管理分离和全方位的网络扩展服务等优势,有效解决这些问题。由于云计算本身尚处于早期探索阶段,因此,本文对云计算技术应用于数字图书馆领域的影响进行分析,进而对基于云计算的数字图书馆可持续发展的可行性进行评价,并提出相关建议。
2 国内外研究综述
2.1 基于云计算的数字图书馆研究
2.1.1 国内外理论研究现状
国外学者从云计算的IaaS、PaaS、SaaS三个层次,对数字图书馆项目的构建提出了不同标准;从组织知识库升级、数字资源存储等具体问题,探究云计算应用优势;同时,注意与移动技术等其他技术的结合,共同促进数字图书馆项目的发展[3-4]。
国内学者们针对国内外一些数字图书馆的云计算应用案例,进行了分析总结,对于其成功的应用策略进行分析,对于云计算的应用方向进行归纳;结合现今图书馆联盟的发展趋势,对于两种趋势进行了协同分析;识别出图书馆云应用的核心问题,并为其解决提出多种建议[5-6]。
2.1.2 国内外应用实践
国外方面,美国亚利桑那州大学图书馆将其集成系统(ILS)、数字管理系统和数据库迁移到Linode平台,解决了设备老化、系统重启过慢等问题[7];在英国,联合信息系统委员会(Joint Information Systems Committee ,JISC)正在英国高等教育机构推广使用云计算技术提供数据和信息访问获取服务[8-10]。
国内方面,高校图书馆数字资源采购联盟(Digital Resource Acquisition Alliance of Chinese Academic Libraries)于2011年启动采购管理系统,从硬件、服务、数据三个层面进行云计算应用,实现图书馆联盟基于云计算的服务[11];福州地区大学城从基础设施层、动态数据层构建文献提供私有云,实现文献馆际互借与结算、文献提供等服务[12]。
作为一项新兴技术,云计算对于数字图书馆的可持续发展作用还不甚明朗。目前研究多集中在模型框架构建以及实践探索方面,从数字图书馆的可持续发展角度尚缺乏系统研究。
2.2 数字图书馆的可持续发展研究
可持续发展内涵包括经济、社会和生态三方面可持续发展。Chowdhury[13]将可持续发展概念应用于数字图书馆领域,即通过促进经济、社会、生态三方面整合,以提高数字图书馆整体服务质量,实现全面发展。
经济可持续发展研究主要对数字图书馆的成本和效益进行分析,综合考量经济可持续性,对效益实施评估[14];构建数字图书馆经济来源,降低其运行成本,以实现效益最大化[15]。
社会可持续发展主要涉及影响用户通过数字图书馆获取信息内容的各种因素,特别是在获取信息服务的途径方面,以实现数字图书馆平等服务、优化体验的目标[16-17]。
生态可持续发展主要探究降低数字图书馆对生态环境负面影响的措施,以绿色IT技术为指导,在数字图书馆的构建、信息服务提供等过程中减少温室气体排放以及能源消耗[18-19]。
以上三者并非各自孤立,它们之间存在密切联系。作为有机整体,可持续发展需要协同,尽管实现过程中存在种种难题,但必须将三者作为整体考量。
3 基于云计算的数字图书馆可持续发展分析
基于可持续发展三个维度,Chowdhury提出研究数字图书馆可持续发展的通用模型[13],如图1所示。数字图书馆服务通过恰当的ICT技术将用户与内容联系起来,并在结合中,构建持续性资金模型或商业模型以维持经济可持续性,提升用户素养、辅以政策法律以维持社会可持续性,采用绿色信息技术/系统、实施可持续存储以维持环境可持续性,通过三者协同,实现总体可持续发展。基于此,笔者进行基于云计算的数字图书馆可持续发展分析。
3.1 基于云计算的数字图书馆经济可持续发展
3.1.1 经济性是数字图书馆可持续发展的内在要求
数字图书馆的经济可持续发展要求在保证服务质量的同时降低成本,这是一个重要的挑战。因为除少量属于商业型、拥有自己的盈利模式外,大部分数字图书馆由公共或高校图书馆创建,其支持资金,大多源于政府财政、图书馆联盟或某些基金会,持续性不能充分保障。作为长期投入、短期效益不明显的项目,资金经常被缩减而且随发展,所需投入也不断提高。资金窘境使数字图书馆必须降低成本,同时提高效益。
图1 数字图书馆可持续发展模型
3.1.2 基于云计算的数字图书馆成本减少
云计算利用虚拟化技术,在一台物理服务器上实现多台逻辑服务器运行,从而把单台服务器的利用率从平均15%以下提高到70%以上[20],同时减少电力、冷却和场地成本;采用虚拟存储,统一管理底层存储设备,提高存储空间利用率,使磁盘利用率上升到70~90%;将网络虚拟化,实现少量物理网络支持多个逻辑网络需求,减少网络设备开支[21]。
利用云计算搭建数字图书馆架构存在两种方式:一种基于公共云,利用Google等服务商提供的云服务;另一种是通过图书馆联盟等合作组织构建私有云。公共云模式中,由于服务器的日常维护由更加专业的云服务商提供,图书馆方面的工作强度和维护成本会大大降低[22]。私有云模式中,通过联盟等合作形式,对分散的资源加以集中,实现平均成本降低、资源高度共享、效益最大化。
3.1.3 基于云计算的数字图书馆经济可持续可行性分析
2010年起,美国亚利桑那州大学(University of Arizona)图书馆将其数字空间(DSpace)以及北美协调委员会(North American Coordinating Council)的日文资源馆际互借系统(ILL)迁移到亚马逊的AWS(Amazon Web Service)等云平台上。Yan Han等人参与了这些项目,并对云端化和本地服务模式进行了总成本(Total Cost of Ownership,TCO)比较,如表1和表2所示[23]。
表1为计算成本对比。研究中假定服务器寿命为5年。由于一个小型亚马逊网络服务实例(instance)的计算力大致等同于一台服务器的50%,因此计算出本地服务器的总成本后要乘50%再进行比较。可以明显看出,云计算模式相较于本地服务器模式,大致可节约50%的成本。
表1 计算成本比较[23]
表2 存储成本比较[23]
表2为存储成本对比。研究以10TB作为存储空间大小。由于当时云计算商业化刚起步,亚马逊简单存储服务价格较高,为$0.14每GB,因此总成本较高。但随技术日趋成熟,价格已逐渐下降。若按最新价格[24],则使用网络服务的总成本为$7086,低于本地存储成本。在存储方面,云计算同样具有了较强的成本优势。
尽管价格波动等因素会影响云计算经济方面优势,但总体上,云计算技术的应用还是有利于数字图书馆朝提高效率、降低成本的方向发展。
3.2 基于云计算的数字图书馆社会可持续发展
数字图书馆的社会可持续发展要求保证信息获取公平性,平等提供可用可达的信息获取途径。云计算依靠自己的技术特点,在提升社会效益方面增强数字图书馆可持续性。
3.2.1 云计算有效改善数字鸿沟
数字鸿沟是一个严重影响数字图书馆的社会效益问题,被国际通讯联盟(the International Telecommunication Union)用来描述新ICT技术的受益者与非受益者的差距,其实际是一种创造财富能力的差距[25]。
这对数字图书馆发展是一大难题。对此,首先要解决硬软件等基础资源的配置问题。在讲英语加勒比地区(English-speaking Caribbean),数字图书馆的发展极大受限于基础设施条件:缺乏互联网接入点、带宽不足甚至电力供应不稳定[17]。云计算降低了数字图书馆资源配置的硬性要求。借助云端资源,相对弱势的图书馆可以利用少量且低端的设备完成服务。同时,相应技术人员也可减少,缓解了人才困境;此外,数字鸿沟问题还包含服务可获得性、学习能力和机会等软性因素。2012年,BBC曾报道将近160万英国人不具备最基础的互联网使用技能[26]。这些问题关乎个人的数字素养,而在云计算技术的辅助下,数字图书馆可以在更大范围传播更多的信息,给欠发达地区提供更多接触信息、接触ICT的机会,从而提升当地人的数字素养,改善数字鸿沟问题。
YAN Ze-hao, ZHANG Zheng-wei, YI Jiu, REN Hao, PAN Wei-hua, YANG Ya-li, LIAO Wan-qing, FANG Wei
3.2.2 云计算提升信息获取便利性
云计算同样提升信息获取便利性。针对目前资源“分布存储,分布访问”的状态,合作组织共建“云”图书馆提供给用户一站式搜索获取的体验,同时提高资源查全率;为满足用户信息即时获取、个性化服务的需求,“云”图书馆提供多种设备访问接口,构建独立于设备的信息获取途径,实现无缝对接;利用“云”图书馆开放和用户参与特性,基于用户情境提供解决方案,实现情境化、个性化服务;同时,借助云计算强大的计算能力与拓展的带宽,数字图书馆可以拓展新型复杂应用,对非结构数据等进行扩展探索[27]。
3.2.3 基于云计算的数字图书馆社会可持续性制约
云计算在社会可持续发展方面同样存在问题。数字信息的安全对于数字图书馆来说至关重要。借助公共云进行数字图书馆建设,将数字资源交付给云服务商,即存在信息泄露风险,而目前信息法律的不完善,无法确保用户权益;将数字资源用于构建云计算资源时,还需考虑数字资源的选择性整合问题。资源的私密性导致在构建云服务过程中需要按起源区分,如何选择、资源分离后如何整合也成为问题;共建“云”图书馆实现资源共享,但知识产权法律体系尚处于构架阶段,因此实际运行中可能会产生知识产权或数字版权的纠纷问题。虽然存在诸多问题,但是可持续性不可能单独依靠云计算完成,数字图书馆的社会可持续发展,同样要法律政策等手段的协同保障。
3.3 基于云计算的数字图书馆生态可持续发展分析
3.3.1 信息产业生态可持续的严峻形势
随信息化水平的提升,信息产业的能耗也越来越高。全球权威技术调查机构Gartner对信息产业的碳排放调查显示,信息产业的CO2排放量已占全球总排放量的2%,达到8.3亿吨。而随ICT技术继续深入和普及,至2020年,碳排放量估计将以每年6%速度增长,其中来自ICT设备使用过程的部分将占到3/4[28]。具体到信息服务业,也存在类似情况。2010年,谷歌公布其全年耗电量为22.5亿度,相当于一个核电站3个月的产能[29],而对应温室气体排放量相当于11家电厂总的年排放量[30]。这些全部表明ICT技术在解决生态可持续发展方面问题的紧迫性。
3.3.2 基于云计算的数字图书馆生态效益分析
(1)减少服务器能耗。通过对服务器、CPU等计算资源的优化协调,动态分配物理和虚拟资源,并根据其是否被调度使用决定是否进入休眠模式,实现服务器能耗降低[31]。
(2)减少网络能耗。在通过网络提供服务过程中,根据不同任务和服务类型实现自动控制和优化网络占用,最大化减少网络堵塞,实现网络能耗降低[32]。
(3)减少终端设备能耗。采用浏览器或者瘦客户端方式,使终端运行过程尽可能简化,大幅度降低终端设备的购置与维护成本、以及运行成本,实现终端能耗降低[33]。
3.3.3 基于云计算的数字图书馆生态可持续可行性分析
自2006年起,澳大利亚国家信息通信技术有限责任公司(National ICT Australia Ltd,NICTA)致力于研发面向服务的性能建模技术(Service-Oriented Performance Modelling technology),用于面向服务体系架构的性能测试。Paul等利用该技术,对澳大利亚气候交易系统(Australian Climate Exchange)以四种计算资源配置方式(初始方式、优化资源方式、服务器虚拟化方式、云计算方式)模拟评估,对比其在CPU使用量、耗电量、CO2排放量等方面的差距[34]。其中云计算模式以亚马逊的EC2节点为案例进行模拟。
由表4可以看出,在未对资源优化处理的情况下,全年CO2排放量会达到23.6吨。而通过几种优化,CO2排放量均有不同程度降低。特别是云计算方式,在消耗电能以及CO2排放量上都远低于其他方式,对环境可持续发展大有裨益。
表4 ACX四种资源配置方式对比[34]
从图3可以直观看到云计算方式相对于初始方式在CO2排放量方面降低了83%左右,远超过其他方式的优化效果。同时,图2和图4显示,在排放补偿费用以及总成本方面,云计算方式同样最为优化。
以上分析尽管并非针对数字图书馆,却证明了云计算技术在系统架构层面节能减排的突出效果。云计算技术为数字图书馆的生态可持续发展提供了一条可行的路径。
图2 排放补偿费用[34]
图3 CO2 排放降低率[34]
图4 总成本[34]
4 基于云计算的数字图书馆可持续发展的建议
本文基于Chowdhury构建的数字图书馆可持续发展模型,从经济、社会、生态三个角度探究了云计算对数字图书馆可持续发展的影响,得出其应用具有积极意义的结论。但也该注意到,目前数字图书馆对于云计算技术的应用尚处于初始阶段,还存在如下问题:
(1)目前云计算技术在图书馆领域多为小范围应用,尚未形成统一标准。而进一步推广势必会引发通用性、兼容性问题,这不利于今后的大范围内推广,同时也不符合可持续发展的理念。
(2)云计算技术的推广应用需要以各项硬件设施作为基础保障,然而目前一些地区的硬件设施以及网络连接情况水平十分落后,难以满足要求。这些普遍存在的情况,不仅会造成数字图书馆项目难以达到预期目标,更会进一步加重数字鸿沟以及社会排斥问题。
(3)目前我国有关数据安全、数字版权、知识产权的法律政策体系尚待完善,严重阻碍云计算技术在数字图书馆领域的发展与应用;此外,由于开放存取运动的开展,如何将开放存取运动与云计算技术恰当结合,也成为一项有待研究的问题。
(4)数字图书馆可持续发展的效果评测缺乏体系。研究多集中在理论层面,缺乏实际测量数据以及体系性测量工具。由于可持续性发展的成果并非直接可测,因此量化成果是一个难题。此外,由于评测复杂,还需要花费较长时间进行,以期得到较为客观的评测结果。
可持续发展是一个全面性、内在关联性很强的任务,某一方面的举措可能会影响多方面,某一方面目标的实现也需要多方面协同。因此,结合上述问题,在采用云计算技术的过程中,应注意以下方面的内容:
(1)在技术层面,持续跟踪云计算技术发展趋势,探索数字图书馆基于云计算新的设计模式和架构,并及时进行分析与评价,确定数字图书馆新的发展走向;在云计算技术实践中,不同地域、不同组织要进行更密切的合作交流,在技术协议和标准层面不断研究和探讨,使云计算标准更为普适化。
(2)在应用云计算技术架构数字图书馆的同时,加强相关辅助层面的建设。要协同从服务端到用户终端之间的各项基础设施水平,着力消除诸如网络可达性等因素的阻碍;要推进相关的政策法律体系建设,并且根据实际效果不断调整,从而使相关政策法律有效辅助云计算技术的发展与应用。
(3)选取合理的指标,以量化方式对数字图书馆可持续发展的效果进行评测。要综合各项因素,考虑通过间接测量来进行测评,从而对数字图书馆方面可持续发展的研究更加实际化,有效监测数字图书馆的可持续发展。
[1]Sustainability BasicInformation[EB/OL].[2014-12-15].http://www.epa.gov/sustainability/basicinfo.htm
[2]McArthur D J,Giersch S,Burrows H.Sustainability issues and activities for the NSDL[C]//Joint Conference on Digital Libraries,Marshall C C,Henry G,Delcambre L,2003:395
[3]Galvin D,Sun M.Avoiding the death zone:choosing and running a library project in the cloud[J].Library Hi Tech,2012,30(3):418-427
[4]Ifijeh G.Adoption of Digital Preservation Methods for Theses in Nigerian Academic Libraries:Applications and Implications[J].The Journal of Academic Librarianship,2014,40(3-4):399-404
[5]严潮斌,于国辉,段漉希,等.加州大学图书馆多平台云迁移策略研究[J].图书情报工作,2013(11):49-54
[6]郭彩峰.云计算下的国外图书馆联盟服务研究[J].图书馆建设,2013(5):65-67,71
[7]Han Y.On the cloud a new way of computing[J].Information technology and libraries,2010,29(2):87-92
[8]Cloud computing increasingly attractive to universities[EB/OL].[2015-01-12].www.jisc.ac.uk/news/stories/2011/05/cloud.aspx
[9]Cloud services for education and research-projectss and partners announced[EB/OL].[2015-01-12].www.jisc.ac.uk/news/stories/2011/06/cloudservices.aspx
[10]European cloud provision way forward,says JISC[EB/OL].[2015-01-12].www.jisc.ac.uk/news/stories/2011/05/europecloud.aspx
[11]吴元业.图书馆联盟云计算应用研究——以DRAA新门户为例[J].图书馆论坛,2014(3):103-106
[12]刘荣发.福州地区大学城文献提供云平台建设研究[J].图书馆学研究,2014(4):9-12,16
[13]Chowdhury G.Sustainability of digital libraries:a conceptual model and a research framework[J].International Journal on Digital Libraries,2014,14(3-4):181-195
[14]马燕,侯晓靖.数字图书馆新发展模式下的成本及效益分析[J].情报杂志,2004(9):29-30
[15]Hamilton V.Sustainability for digitallibraries[J].Library Review,2004,53(8):392-395
[16]Suleman,H.,Design and architecture of digital libraries.in Chowdhury,G.G.and Foo,S.(Eds),Digital Libraries and Information Access:Research Perspectives,London:Facet Publishing,2012:13-28
[17]Francis H.Digital Libraries:opportunities and challenges for the English-speaking Caribbean[J].Information Development,2008,24(2):143-150
[18]Chowdhury G.An agenda for green information retrieval research[J].Information Processing & Management,2012,48(6):1067-1077
[19]洪霞.云计算环境下绿色信息检索系统的研究初探[J].图书馆界,2014(1):1-4
[20]王淑红,刘晓辉.Microsoft虚拟化应用指南宝典[M].北京:中国铁道出版社,2009:79-80
[21]赵肄江,胡蓉.基于虚拟化的绿色云计算[J].湖南科技大学学报(自然科学版),2010(4):86-89
[22]陶新权,孙青,王亚,等.云计算在图书馆中的应用[J].大学图书馆学报,2010(2):54-58
[23]Han Y.Cloud Computing:Case Studies and Total Costs of Ownership.Information technology and libraries,2011,30(4):198-206
[24]定价[EB/OL].[2015-01-30].http://aws.amazon.com/cn/s3/pricing/
[25]Gamage P,Halpin E F.E-Sri Lanka:bridging the digital divide[J].The Electronic Library,2007,25(6):693-710
[26]BBC News-Millions in UK’lack basic online skills’.[2015-01-22].http://www.bbc.co.uk/news/technology-20236708
[27]周舒,张岚岚.云计算改善数字图书馆用户体验初探[J].图书馆学研究,2009(4):28-30,36
[28]张延林.信息科技对低碳的双重影响及解决途径分析[J].科技管理研究,2012(19):30-33
[29]邓元鋆.推动云计算减少碳排放[J].IT时代周刊,2012(Z1):15
[30]Jenkin T A,Webster J,McShane L.An agenda for'Green'information technology and systems research[J].Information and Organization,2011,21(1):17-40
[31]Liu J,Zhao F,Liu X,et al.Challenges Towards Elastic Power Management in Internet Data Centers[C]//29th IEEE International Conference on Distributed Computing Systems.IEEE,2009:65-72
[32]张亚明,刘海鸥.云计算研究综述——基于技术与商业价值双重视角[J].中国科技论坛,2010(8):126-133
[33]Cervone H F.An overview of virtual and cloud computing[J].OCLC Systems &Services:International digital library,2007,26(3):162-165
[34]Brebner P,O'Brien L,Gray J.Performance modelling power consumption and carbon emissions for Server Virtualization of Service Oriented Architectures(SOAs)[C]//13th IEEE International Enterprise Distributed Object Computing Conference(EDOC 2009).Tosic V,2009:92-99