欧盟数字图书馆云计划Europeana Cloud研究
2015-07-07陈劲松
陈劲松
陈劲松 靖江市图书馆采编部主任。江苏靖江,214500。
2013年,福布斯成功预言云将成为科技话题的NO.1,并预测2014年云端市场可达1590亿美元[1]。公有云、私有云和混合云等技术的涌现标志着云端时代的全面开启,引发了人类社会工作方式和商业模式的根本性转变,云计算也越来越成为经济发展过程中的一种必然选择和趋势。根据PEW调查机构的调查结果显示,美国人中69%使用云服务[2];英国CIF(Cloud Industry Forum,云产业论坛)2014年 6月公布数据显示,超过四分之三(78%)的机构正在使用至少一项云端服务,2010年到2014年期间,英国的云计算实现了61.5%的增长[3]。国内方面,公有云市场向全球的敞开,国外云巨头的进驻及与国内运营商的合作共赢,将吸引更多行业和客户接纳云计算,从而激发国内云市场活力。国内外政府部门及企事业单位应用实践表明,云计算能够切实解决系统利用率低下,资源无法合理有效利用,数据共享及安全性、兼容性问题,大大提升机构运行效率和服务水平。
随着技术应用的日益成熟,云计算也开始加速在图书情报领域中应用,使得图书馆IT构架、业务流程、管理方式、服务方式发生质的变化,如OCLC WorldCat Local云计划、欧盟数字图书馆Europeana Cloud云计划。Europeana Could寄期望通过一个集合资源云、服务云、技术云为一体的最佳实践网络平台的打造,为用户提供更为高效资源访问、数据管理及科研平台服务。本文将针对该计划展开探索及研究。
1 欧盟数字图书馆Europeana Cloud背景及目标解析
1.1 Europeana Cloud背景解析
欧盟数字图书馆于2008年11月20日在布鲁塞尔正式启动,用户可通过其门户网站http://www.europeana.eu访问来自欧盟27国的书籍、手稿、音乐、绘画、地图、照片和电影等丰富多彩的信息和资料。欧盟数字图书馆的云计划正是依据其门户网站域名被命名为Europeana Cloud。在云计算与外界各行业业务应用迅速融合的同时,欧盟数字图书馆面临着来自用户及其自身发展的多方需求冲击:(1)整个欧盟信息产业领域的内容提供商和集成商迫切需要一种更能节约成本、可持续化的基础设施,支持其元数据存储及内容存储;(2)欧盟科研人员需要一个全新的数字化空间,以便其展开革新性数字化内容分析和探索;(3)来自欧盟数字图书馆远景目标的挑战,至2015年,欧盟数字图书馆拥有的资源数量需达到3000万条。这一系列需求唯有通过云计算服务在其基础设施、资源共享和信息服务领域的全新应用才能满足。2013年1月,欧盟数字图书馆Europeana Cloud计划正式开启。
1.2 Europeana Cloud目标解析
Europeana Cloud计划目标包括6个维度:(1)提供统一的数据访问端口,访问内容包括新增的110万条元数据记录,以及对欧洲高校、图书馆、数据中心和出版社资源整合形成的500万条科研数据;(2)为内容提供商、集成商等利益相关机构构建一个云技术基础架构,以便其在整个欧洲范围提供成本节约、优质高效的元数据及内容存储服务;(3)深入了解并归纳云技术基础系统中,文化遗产机构或域名聚合平台涉及信息及内容的法律性、战略性和经济性问题;(4)达成全欧洲范围内,内容集成商与科研网络机构就云技术解决方案优势的广泛共识;(5)打造Europeana科研数字化平台,促进科研数据信息的探索、应用和发现;(6)通过云平台为科研人员提供更多的科研工具和服务,促进Europeana数字化内容的开发及科研创新[4]。
2 欧盟数字图书馆Europeana Cloud中的WBS
2.1 Europeana Cloud计划中的WP
Work Breakdown Structure(工作分解结构,以下简称WBS),是项目管理常用规划设计工具之一,该方法以可交付成果为导向,分组项目要素,归纳和定义每下一层级的项目工作范围,将项目成果和项目工作分解成更为微观、易于管理的组成部分,其中,Work Package(工作包,以下简称WP)是WBS中最低层元素,包含一系列的微观可交付成果。通过WBS分解,Europeana Cloud计划被分解为如图1所示的7项WP。(1)评估云环境中科研人员需求状况,确保相关利益团体对Europeana Cloud项目的参与;(2)构建欧盟数字图书馆的云计算基础设施;(3)开创云服务平台中的科研服务新工具及新模式;(4)丰富Europeana Cloud平台中的内容创建和元数据创建;(5)解决云计算环境涉及的法律性、战略性、经济性问题,实现云计划的可持续化发展;(6)云计划的内容推广、信息交流传播及沟通性网络建设;(7)整个Europeana Cloud的项目管理[5]。
图1 Europeana Cloud计划WBS-WP分解图
2.2 Europeana Cloud计划中的LoD
List of Deliverables(可交付成果列表,以下简称LoD)是项目管理中的阶段性及最终交付物的集合,也是WP的进一步细分,其在很大程度上反映了项目目标的要求,一切项目活动和资源都围绕LoD的有效完成而产生。European Cloud计划中的7项WP共被细化为39项可交付成果。交付成果既可以是有形的实物,也可以是无形、抽象的环境、服务,以WP2和WP3为例,WP2被细分为7项可交付成果:(1)有利于云计算基础设施发展的环境;(2)云计算基础设施结构设计文件初始版本;(3)元数据的云计算数据模型;(4)内容云的云计算数据模型;(5)元数据云计算数据模型中的核心服务;(6)元数据云和内容云的传递;(7)元数据及经分析处理内容的迁移和上传。
WP3被细分为4项交付成果:(1)用户人物角色分析、服务计划方案、使用案例相关数据档案;(2)服务应用工具及服务;(3)工具及服务评估报告;(4)Europeana科研门户网站[6]。
2.3 Europeana Cloud计划中的WPD及MS
Work Package Description(工作包说明书,以下简称WPD),顾名思义,是对工作包中项目目标、工作内容及职责的详尽化说明。Milestone(里程碑事件,以下简称MS)是WP实施过程中取得的阶段性重大成果,标志着项目的实质性进展。相较于LoD,WPD更为详尽和具体地阐述了取得各项可交付成果的过程和方法,MS则突出了各项交付成果量化积累导致的质变成果。以WP2为例,图2展示了云基础设施建设的分解化工作内容和里程碑事件。
图2 Europeana Cloud计划客户端角度系统架构图[7]
3 欧盟数字图书馆Europeana Cloud功能及结构设计
3.1 Europeana Cloud功能需求及阶段性实施
Europeana Cloud的功能设计必须能够满足其潜在用户的各项需求,WP2阶段,欧盟云计划项目组深入了解了Europeana、TEL(欧洲图书馆)等元数据集成方、终端用户、内容提供商、科研人员的各项需求,并按需求程度及提及频率归纳总结出Europeana Cloud的14项功能性标准:(1)支持数据更新的标识符分配功能,云端标志符/本地标识符的映射功能;(2)多种数据格式(如基于文本格式和二进制格式)和不同版本数据的存储和访问功能;(3)数据记录能够分组至数据供应商或数据集;(4)存储数据相关链接能够被有效验证;(5)显示数据记录的提供方、数据及数据格式、许可证等相关内容,确保对数据访问的有效控制;(6)对云端记录更改的追踪功能;(7)按特定数据集、特定格式或特定信息提供商进行数据访问或下载功能;(8)数据记录的自动转换、处理功能;(9)建立数据间某特征下的联系;(10)数据处理及映射前后相关联系的追踪功能;(11)当前内容快速扫描功能;(12)开放文件格式自动转换功能;(13)能够对自己在云端存储文件的充分读写、访问功能;(14)对不同版本数据记录的链接支持功能[6]。
项目组进一步对14项功能需求进行分析和整合,规划出Europeana Cloud系统开发的4步骤:(1)eCloud Alpha初始系统,实现第 1、2、3、6、13 项需求功能;(2)eCloud Beta测试系统,在初始系统功能基础上,实现第 5、7、8、4、10 项需求功能;(3)eCloud 1.0正式版本,在测试系统功能基础上,实现第9、11项需求功能;(4)系统完善阶段,增加第 14、12项及其他个别性需求功能。
3.2 Europeana Cloud结构设计
基于云用户的需求分析及功能设计,Europeana Cloud计划形成如图2的云系统架构。从客户端来看,整个系统可被视为一个相似于其他网络服务的软件即服务云;从eCloud存储性相关系统功能来看,整个系统可被视为一个基础设施即服务云。Europeana Cloud客户端的各项服务分别有各自的API(Application Programming Interface,应用程序编程接口),同时,为确保云服务的纵向可拓展性,Europeana Cloud系统采用了REST(Representational State Transfer,含状态传输)软件构架风格。
具体来说,Europeana系统设计有两种类型的云,计算云(虚拟服务器)和存储云(NoSQL数据库,分布式文件系统)。(1)计算云:计算云由前后端两层服务层构成,前端服务层按照系统功能性标准,为用户提供各项数据信息服务,因此又被称为功能性服务层,其包含的每个功能化模块都提供两种形式的API,客户端API及管理端API,前者是用户服务使用的端口,后者为服务管理端口。后端服务层不直接服务于最终用户,主要满足系统管理及其他非功能性服务需求,后端服务层功能一般可通过系统外组件实现,各功能模块同样提供客户端和管理端两种形式API。(2)存储云:为计算云中的各项功能性服务提供相应的存储性服务。
4 欧盟数字图书馆Europeana Cloud启示
4.1 大力推广云技术,提高服务效率,降低服务成本
长期以来,图书馆乃至整个信息服务产业都遭受着基础设施构建、信息系统集成、信息资源管理、多元化服务领域中多种问题的困扰。以传统的数据聚合模型为例,单向的数据传递模式及非统一规范性的集成管理信息系统势必会带来高额的信息运行和维护成本。除了高额的运营成本,较低的信息资源使用率、用户未能满足的信息化需求等问题亟待解决,云技术为这些长期困扰图书馆问题的解决提供了新的思路。以数据集成为例,Europeana Cloud通过统一技术支持框架的提供实现了数据的循环流通,元数据每经历一次丰富完善将有效地传递给系统内的其他组织[8]。国内图书馆及信息服务机构应充分认识到云技术带来的发展机遇,实现云技术与基础设施建设、信息集成、信息管理及服务领域的充分融合,着重从以下3方面实施技术应用:(1)构建可持续发展的云计算基础设施,提供高效的信息存储、共享、访问服务;(2)不断丰富和扩大云平台的元数据存储及内容存储;(3)为用户提供行之有效的云技术服务项目和服务工具。
4.2 集合多方力量,开发功能完备的云技术服务平台
云技术服务平台的构建牵涉到多方利益相关者,如信息集成商、内容提供商、终端用户、科研高校及图书馆等,终端用户的需求信息可以作为云平台功能化标准的设计依据,而数据管理机构在长期的数据集成、管理过程中累积的丰富技术管理经验则能够为项目开发提供一定的人力资源和技术资源。Europeana Cloud正是在多方力量(包括高校、图书馆、基金会等的35个合作单位)集聚的基础上开发其云技术服务平台。国内云平台的开发应在国家权威性政府机构或科研机构的号召下形成项目的广泛参与,组建强大技术团队,为开发功能完备、运作高效、成本节约的云服务平台奠定基础。功能完备的云平台通常具备以下功能性标准:(1)标识符服务;(2)元数据及内容服务;(3)告知服务;(4)数据注释服务;(5)数据处理服务;(6)许可、授权服务;(7)异步消息传递;(8)日志管理[9]。
4.3 借鉴项目管理先进理念和方法,推进云计划实施
Europeana Cloud计划实施和管理中大量运用了项目管理的先进方法,如采用WBS方法将项目工作分解为一系列可交付成果,并从LoD/WPD/MS角度对每个WP进行详细阐述及深入说明。国内云计划或其他数据项目实施过程中,同样可以大胆借鉴项目管理领域的先进理念和方法,从如下方面保障项目的有效管理和顺利推进:(1)设立项目执行董事会、联合会、督导组、协调小组、评估小组等项目执行、管理机构,建立云计划项目实施的组织保障;(2)采用项目工作包管理方法,明确项目职责与权力划分,制定项目期计划,有效监控项目进度;(3)建立项目阶段性报告制度,开展项目定期评估;(4)开展有效的项目质量控制管理和风险控制管理[10]。
4.4 重视法律性、战略性问题,实现云技术可持续发展
云计算在各个领域得到广泛运用,促进社会相关产业日新月异发展的同时,也带来了诸如云计算环境和计算过程的安全性、云计算相关法律法规和标准化等系列问题。当数据、信息存储于物理位置不确定的云端,服务安全、数据安全如何保障,随着云技术与社会各产业领域的融合,如何从战略高度对云计算的发展进行合理规划等等,这些法律性、战略性问题的解决直接关系到云技术未来的发展方向和发展态势。Europeana Cloud计划将云环境中法律性、战略性及经济性问题的解决单独列为一个WP,显示项目对其的高度重视性。国内云技术的应用及发展应从我国国情出发,制定相关的法律法规及政策,创造良好的产业环境,正确引导行业发展,通过技术保障和管理保障体系的构建切实解决各种法律性、战略性问题,实现云计算在国内的可持续化发展。
5 结语
欧盟数字图书馆Europeana Cloud利用云技术为终端用户提供了统一的数据访问端口、完备的服务功能和先进的云应用工具,为内容提供商、集成商构建了统一的云基础架构,为科研人员打造了统一的科研数字化平台,实现了计算云和存储云的有机结合。云技术的应用有利于基础设施成本的降低、数据集成和数据管理效率的提升及用户多元化需求的满足。国内图书馆及信息产业机构应在深入了解云用户需求动态的基础上,集聚多方力量,开发功能完备的云技术服务平台,同时重视云发展环境中的法律性、战略性问题,推进云技术应用的可持续化发展。
[1]云端服务:福布斯语言2013年云将成为科技话题NO.1[EB/OL].(2013-10-14)[2014-07-07].http://www.yixieshi.com/it/14626.html.
[2]Source“Cloud computing gains in currency”,Pew Research,May 2008.[EB/OL].(2008-09-12)[2014-07-07].http://www.pewinternet.org/2008/09/12/use-of-cloud-computing-applications-and-services/.
[3]调查:英国云计算应用率持续走高[EB/OL].(2014-07-15)[2014-07-27].http://cio.chinabyte.com/126/13 017626.shtml.
[4]Europeana Cloud will change the way that data is sent to Europeana,and will give researchers new tools to enrich and use that data[EB/OL].(2014-06-21)[2014-07-27].http://pro.europeana.eu/web/europeanacloud/home;jsessionid=17A8F7F50B551C44F231B1D 8113A73C4.
[5]Our project encompasses over 30 partners.[EB/OL].(2014-06-24)[2014-07-27].http://www.pro.europeana.eu/web/europeana-cloud/project-partners.
[6]CIP competitiveness and innovation framework programme 2007-2013[EB/OL].(2014-06-24)[2014-06-25].http://pro.europeana.eu/web/europeana-cloud/results/-/document_library_display/p6BV/view/1861926.
[7]D2.2:Europeana Cloud Architectural Design[EB/OL].(2014-06-24)[2014-06-28].http://www.pro.europeana.eu/web/europeana-cloud/results/-/document_library_display/p6BV/view/1861920.
[8]Europeana Cloud:a factsheet for aggregators[EB/OL].(2014-06-24)[2014-07-27].http://www.slideshare.net/Europeana/europeana-cloud-factsheet-final.
[9]Europeana Cloud High Level Principles[EB/OL].(2014-06-03)[2014-07-25].http://pro.europeana.eu/web/europeana-cloud/blog/-/blogs/europeana-cloud%3A-establishing-the-high-level-principles.
[10]Europeana Cloud Poster at LIBER 2014[EB/OL].(2014-06-04)[2014-07-25].http://www.pro.europeana.eu/web/europeana-cloud/blog.