基于云计算的贵州省数字图书馆联盟平台的构建与建设方案
2014-08-06曾维
曾 维
(贵州省图书馆,贵州 贵阳 550025)
图书馆是当今必不可少的文化教育机构。它承载着保存人类文化遗产、开展社会教育、传递科学情报、开发智力资源、提供文化娱乐的重要职责。随着时间的推移、科学技术的不断更新,图书馆的职能也在不断的发生变化。对于文献而言,图书馆除了要以手写、印刷的文献保存以外,还要以其他载体形式的资源保存,如缩微胶片、电子图书等,这就使得图书馆走向了数字化的发展方向。
一、数字图书馆和云计算的概念
数字图书馆(Digital Library)是利用计算机、网络、数字化等相关技术形成的不受时间、空间、地域限制的信息系统。简单而言,数字图书馆就是一个在网络环境下,规模大、方便快捷、无限制使用、实现无缝链接与智能检索的虚拟图书馆。图书馆在经历了多个时代后,现已经开始进入云计算时代。
云计算(Cloud Computing)是将互联网中运行的软、硬件信息资源共享,根据用户的需要提供给计算机相关设备的计算方式。随着云计算商业价值的直线攀升,全球主要的软件公司在云计算方面的研究与应用都积极地投入巨资,如谷歌、微软、雅虎、IBM公司等。2007年10月谷歌和IBM合作并发布了云计算覆盖全球的计划。其他IT巨头如微软、雅虎也有或正在建设这样的云服务。2009年联机计算机图书馆中心(OCLC)发布了第一个在图书馆管理服务在云计算下、网络规模下的共享方式,即“Web级协作型图书馆管理服务”[1],且带来了巨大的影响。当前,联机计算机图书馆中心提供了包含搜索更多动态数据的云服务模式,因而属于基于动态数据的云服务。总体来说,这标志着在图书馆领域云计算服务有了实质性的开展。
二、贵州省内各图书馆的现状以及特点
贵州省内有90个各级公共图书馆,由于经费短缺让省内各级公共图书馆陷入艰难的处境,导致馆舍条件简陋、购书经费不足、人员流失、服务内容差、工作效率低等。在省内众多公共图书馆中, 有的公共图书馆连馆舍都没有,更何谈图书馆的建设。目前,只有为数不多的几家建有自己的数字图书馆,且数据库单一、资源量小、使用不便。在贵州省委省政府、贵州省文化厅等多家单位的支持下, 2009年9月28日贵州数字图书馆(www.gzlib.org)面向贵州省公民免费开放使用,并且馆内的任何数字资源都为读者24小时不间断服务。贵州数字图书馆主要是以贵州省图书馆本馆的数字资源为基础,构建一个全省统一的资源和服务平台,为全省公共图书馆读者提供统一服务。该馆也是贵州省范围内唯一的中国数字图书馆联盟的成员馆,在登陆统一认证平台后可以免费使用中国数字图书馆提供的资源。在贵州省内,贵州数字图书馆如今已是贵州省内家喻户晓的公益性公共数字图书馆。贵州数字图书馆现已建成贵州省公安厅、中国水电顾问集团贵阳勘测设计研究院、贵阳职业护理学校、乌当区图书馆和贵阳市第十八中学、贵州广电集团、贵阳市华麟中学、大方县人民医院等多家数字分馆。数字分馆的用户可以无障碍使用贵州数字图书馆的任何资源,并且可以优先享受到其他服务,如讲座、活动等。未来还将不断的有更多单位成为数字分馆。至开馆以来,四年累计访问量已达6700万人次。截止到2013年12月贵州数字图书馆注册用户已达113万人,总访问量已达2400多万人次,数据库总量超过80TB。贵州数字图书馆现阶段已拥有超星电子图书、中华连环画、中国工具书网络竖版总库、CNKI学术期刊、龙源期刊、中国博士硕士学位论文全文数据库、会议论文、CNKI重要报纸、库克数字音乐图书馆、乐儿少儿科普知识系列动画、超星学术视频、音符考试题库、提问365试题搜索、新东方多媒体学习库、贵州府县志图片数据库、贵州农民画数据库、民国图书全文数据库、百链外文数据库等数据库等数据库,其中超星电子图书拥有电子图书290余万种,涵盖了建国后出版的所有图书,140万种电子图书可供省内读者免费检索、浏览和下载全文,其余的可通过文献传递免费获取;CNKI学术期刊收录了国内正式出版的近8000种重要学术类期刊,其中核心期刊、重要评价性数据库来源期刊近2700种,累计学术期刊文献总量3600多万篇;库克数字音乐图书馆拥有世界上98%以上的古典音乐资源。
贵州数字图书馆的数字资源虽然具有覆盖面较广、数据资源量较多使用便捷等优点,但其也有缺点:1.贵州数字图书馆主要是以公共资源为主体,专业学术科研领域的资源量很少;2.贵州数字图馆是以“IP+账号”的方式进行访问的,省外的IP地址以及省内校园网是无法访问的;3.贵州省图书馆部分自建数据库只提供馆内查询;4.除电子图书、电子期刊数据库外,其余数据库使用率较低;5.由于版权等多方面问题没有解决的电子图书馆,无法阅读全文。6.“二次文献”方面的内容,目前为零。
三、基于云计算的贵州省数字图书馆联盟平台建设的必要性及建设方案
综合贵州省内各图书馆的特点,笔者构想搭建一个平台——贵州省数字图书馆联盟平台。该平台由贵州省公共、高校和科研三大系统图书馆联合组成,是以中心馆、成员馆共建共享与多馆协作的联合保障体系,其更大程度地实现资源共享与协作,是促进共建、共享、实现低成本、高效率的有效方法。
贵州省数字图书馆联盟平台的构建的必要性:1.避免各图书馆电数字资源的重复投入、重复建设、重复购买、节约大量的人力、物力、财力。2.把不同行业、不同领域、不同区域的图书馆有机整合在一起,延用贵州数字图书馆的“一站式”服务,提高信息资源的广度和深度。3. 解决各图书馆数据标准和规范不统一、自动化管理系统不兼容、难以相互应用,相互共享的问题;4. 数字图书馆需要注重版权意识,保护作者的利益和权利[2];5.由于联盟平台是一个合作团体,运行是个复杂的过程,必须有一个机构来组织协调各图书馆之间的系统管理,其建设需得到政府及相关部门足够的重视、专人负责、着力建设、保证足够的运行经费,配置必要的硬、软件,并引进培养高素质人才,提高图书馆业务能力水平;6.该平台能为读者提供互相学习、互相交流、互相研究的环境。数字资源满足省内不同读者群体的不同需求,以及全省高校教师学生和创新主体的教学科研需求;7.该平台还可以为贵州省高校提供课程资源共享服务,实现贵州省高校优质公开课程资源的共享,并逐步推进开放的课程从点到面、从校内到校外的进程;8.加强贵州省建设特色数据库的建设,挖掘贵州地方独有特色资源,比如民族文化相关资源等,大力开发和利用,推动贵州经济文化发展;9.由于贵州省数字图书馆联盟平台是通过互联网运作的,对于信息安全要充分考虑。
基于云计算的贵州省数字图书馆联盟平台的建设,充分考虑到贵州省各图书馆经费、人力、数字资源建设的状况以及读者需求的特点,笔者建议采用以下主要建设方案:
1. 该平台的基本框架主要采用云计算的三个层次:应用层、平台层、基础设施层。每层相应的基本服务形式分别为基础设施即服务、平台即服务、软件即服务三种服务方式[3],从上到下构成了云计算的金字塔结构,如图1。
图1 云计算的金字塔示意图
基础设施即服务:即Infrastructure as a Service(IaaS)。供应商根据用户的实际需要随时为用户分配相应的计算能力和硬件资源,并且允许用户的应用进行横向扩充。用户可以无需花费巨资购买高性能的服务器和网络设备,直接“租用”这些资源。
平台即服务:即Platform as a Service(PaaS)。 是由供应商提供一切设施和条件,支持用户在自己的平台上围绕某项核心应用进行相关的应用开发,包括设计、实施、调试、测试、配置、运行和维护的各个环节,方便用户实现对于特殊开发平台的使用需要求。
软件即服务:即Software as a Service(SaaS)。是将软件作为一种服务提供给用户,用户无需在意硬、软件,直接使用该软件的具体功能,根据实际使用的情况支付费用。
2.该平台是一个系统的服务平台,其服务体系架构主要包括四层:基础设施层、数据层、管理平台层、应用层[4],如图2。
图2 基于云计算的贵州省数字图书馆联盟平台服务体系架构
基础设施层:提供了云服务的基础,位于整个服务体系机构的最底层,它是经过虚拟化技术后的硬件资源和相关管理功能的融合。
数据层:是管理数据、分布数据、删除重复数据、压缩数据、备份加密数据等。
管理平台层:也是管理中间件层,主要负责信息资源管理、程序运行管理、读者管理和网络安全管理。
应用层:是整个平台服务体系的核心,主要向用户提供简单的应用服务以及用户交互接口等。
3.整合贵州省各数字图书馆的资源与服务,完成公有云、私有云、混合云[5]的建设:
公有云:是一种基于互联网的服务,该服务的运营商为用户提供免费或者成本低廉的云服务。公有云可以在现今公用的网络中提供任何服务。公有云可以根据其安全、方便、数据共享、无线可能的优点对贵州省内各图书馆的资源进行有效地整合,构建贵州省数字图书馆联盟平台公有云,让成员馆享受到任何服务。
私有云:是根据用户的需要单独构建的云服务,提供对数据、安全性和服务质量的最有效控制。相对于复杂的公有云,私有云可以部署在任何基础设施上,例如:可以部署在客户自己的数据中心内的防火墙上,同时部署在一个安全的主机托管场所,这样可以降低用户IT架构的复杂度,使用户的IT资源得以整合,私有云的用户是完全拥有整个云中心设施的,用户可对自己的云数据,云的安全性和服务进行有效控制,满足客户的发展需求。根据私有云具有数据安全、服务质量好、充分利用现有硬件资源和软件资源、不影响现有IT管理流程的优点,贵州省数字图书馆联盟平台可以用私有云负责本地业务流程与服务,让中心馆与成员馆间进行交互。
混合云:是 “公有云”和“私有云”的结合。该云可以通过一种可控的方式部分拥有,部分与他人共享,因安全和控制因素,混合云并非所有用户通用。这使得中心馆和成员馆可以无限制的使用云共享方式。
4.云计算是完全按照贵州省数字图书馆联盟平台的需要来部署的,主要依赖于虚拟化技术、分布式技术、集群技术、网格计算、新一代的WEB技术、等多方面的技术手段。
虚拟化技术:是云计算系统底层架构的重要组成部分。该技术可以把硬件设备的容量根据需求扩大,简化软件的重新配置过程。计算任务并不是真实的在硬件上而是在虚拟的基础运行。单个CPU模拟多个CPU,可以同时运行多个操作系统,运行独立的空间应有程序时,可以互不影响。从而大大提高计算机的效率。虚拟化技术还可分为完全虚拟化和准虚拟化。
分布式计算:是一种新型的计算方式,是将需要强大的计算能力才能解决的问题分割成若干部分,把这些部分分配给多台计算机进行运算,最后再把计算结果综合起来得出最终的数据结论的科学。该计算可以与稀有资源共享,可以负荷多台计算机的平衡计算,可以把程序运行在最适合其自身优势的计算机上操作。
集群技术: 是集群系统中较新的核心技术,它以较低的成本来获取灵活、可靠的较高收益。通常情况下,计算机在集群中拥有同一个名称,所有的用户可以使用运行在集群内的任何系统服务。该技术具有提高性能、降低成本、提高可扩展性、增强可靠性的优点。
网格计算:实际上,该计算是分布式计算的一种,所有具有分布式计算的优点。和传统的集群相比,网格计算链接了一组计算机,该计算机虽然相关,却不信任,所以其不是一个单独的计算机,更像一个计算公共设施的运作,并且支持了不同类型的计算机设备。
新一代的WEB技术:在云计算的网络应用模式中,前端界面的应用程序从传统的桌面应用程序转向基于Web的应用程序,由此产生了新一代web技术的产生和发展。它还具有增强的标记能力、全新的交互体验、完善的表单功能、丰富的多媒体元素、强大的移动支持五大优点。
四、结论与展望
随着科学技术的不断更新,云计算在图书馆领域的运用越来越不可缺少。本文介绍了数字图书馆和云计算的概念,以及云计算的广泛运用。分析了贵州省内各数字图书馆发展过程中所面临的问题,提出了贵州省数字图书馆联盟平台构建的必要性,解析了基于云计算的贵州省数字图书馆联盟平台建设中存在的问题以及建设的方案。
构建一个成熟的基于云计算的贵州省数字图书馆联盟平台是长期而艰巨的任务,不仅需要贵州省内各数字图书馆研究人员不断的探索,还需要努力适应新形势下数字图书馆的发展需求。目前,虽然我省还没有建设数字图书馆联盟平台的规划,但是通过分析研究,笔者尝试提出基于云计算的贵州省数字图书馆联盟平台的崭新构想,以中心馆为中心、以成员馆为节点,构建覆盖贵州省的数字图书馆联盟平台。在全省范围内形成统一、有效的数字资源服务体系,从而将图书馆的服务空间从物理馆舍延伸到互联网、手机、数字电视、智能移动终端等新兴媒体。通过该平台的搭建,建设一个内容丰富、技术先进、覆盖范围广、快速传播的公共文化服务网络,服务范围涵盖了电信网、广播电视网、互联网的贵州省数字图书馆联盟平台,成为推进文化创新、繁荣和传播社会主义先进文化的基础性文化惠民工程。切实保障公共文化服务的公益性、基本性、均等性、便利性、最大限度地发挥数字图书馆在文化建设中引导社会、教育人民和推动发展的功能。为贵州省的教育、科技、文化发展提供高效率、高质量、全方位的资源信息保障与服务,成为创新信息服务基础设施的重要组成部分,加快贵州省建设的步伐,为我省的图书馆事业尽一份力。
[1] 孙卫.图书馆在云时代的思考[J].数字图书馆论坛,2009(11):35- 41.
[2] 王晓虹.数字化图书馆的知识产权保护[J].牡丹江大学学报,2011(02).
[3] 王红.“云图书馆”平台的架构与实现[J].情报理论与实践,2010(10):111-112.
[4] 王静.基于云计算技术的数字图书馆云服务平台架构研究[D].吉林大学硕士论文,2011.
[5] 曹异卿,唐俊.基于第三方平台的数字图书馆资源评价研究[J].计算机与数字工程,2013(06).