APP下载

基于云计算的图书馆数字资源保障链研究

2010-04-05彭骏

大学图书情报学刊 2010年4期
关键词:服务器数据库数字

彭骏

(第二军医大学,上海 200433)

当前云计算已经成为IT研究的热点问题,作为最擅长利用最新信息技术和理论的学科,图书馆学界也开始关注这一问题。可以预见,作为信息数据中心的图书馆在不久的将来会广泛应用云计算技术,而图书馆也必然在未来的云时代中获益。

按照OCLC的说法,图书馆引进云计算服务,可以让图书馆的数据以大规模的分布式方式存在,图书馆的协作和服务也可以在更大的Web范围内进行。这不仅会影响到上游出版商对于数据和信息的组织整合提供方式,信息拥有者、使用者、提供者的关系和职能更为复杂,而且也会影响到图书馆与用户的交互方式,以更为个性化、更为贴近用户日常信息接收和知识交流方式的形式提供服务。[1]因此,云时代图书馆信息资源的建设将相应发生重大的变化。

1 什么是云计算

云计算(cloud computing)是在分布式系统、网格计算等基础上发展出的一种新型计算模型,是一种新兴的共享基础架构方法。它拥有超大规模的分布式环境,其核心是提供数据存储和网络计算服务。所谓“云”是指计算机群,每一群包括了几十万台,甚至上百万台计算机,是数据存储和应用服务的中心,用来完成存储和计算的工作[2]。

目前公认的云计算有以下几大形式:虚拟化(Virtualization)、效用计算(Utility Computing)、基础设施即服务 (Infrastructure as a service,IaaS)、平台即服务(Platform as a Service,PaaS)、软件即服务(Software as a Service,SaaS)。在这些服务形式下,用户终端不再需要配置大容量硬盘等存储设备,数据可以放在云中来管理,无论何时何地都可以方便地存取,同时轻松地实现存储数据的共享;用户也不需要再安装和更新各种软件,因为SaaS可以通过浏览器将应用程序传给用户在线使用;如果用户想要完成类似超级计算机才能完成的计算任务,也不需要斥巨资购买昂贵的计算机设备,效用计算服务形式可以创造虚拟的计算中心,提供超级计算能力。作为程序开发者不需要自建开发环境,转而利用PaaS来使用中间商的设备开发自己的程序,并通过网络发送到用户手中。从它的构建方式到提供的服务形式不难看出,云计算的确整合了网络资源,为终端用户提供了巨大的方便。按照云计算的理念,随着云计算服务的普及,“用户可以通过网络和简易的终端设备随时随地使用几乎所有的信息资源及计算能力,像用电用水一样,按使用量来计费。”

2 基于云计算的图书馆数字资源保障链

分析云计算的特点和服务模式,我们不难看出云计算也适用于图书馆的资源建设。目前图书馆信息资源体系中主要分为两大类,即实体资源和数字资源。实体资源包括印刷型文献、缩微平片胶卷、音像资料等。由于实体资源的物理特性,不能通过网络进行共享(除非先进行实体资源的数字化),所以本文主要研究利用云计算开展数字资源的保障链服务。现阶段图书馆的数字资源大体包括三个方面的内容:

(1)馆藏书目数据库。馆藏书目数据库是开发信息资源的基础数据库,是图书馆全面实现网络化、自动化的基础,其作用是对馆藏进行揭示,便于用户检索和利用图书馆的信息资源。

(2)特色文献数据库。特色文献数据库是图书馆根据其文献资源状况与用户的信息需求,选择馆藏中富有特色的文献资源所建立的专门化数据库。比如高校图书馆的本校学位论文数据库、学术成果数据库,地方图书馆的地方方志数据库。

(3)商用数据库产品。这些资源由数据库生产商开发,产品类型多种多样,如文摘数据库、书目数据库、全文数据库、事实数据库等。大部分都可以通过Web进行服务。

所有这些数字资源在云中皆表现为数据,图书馆的服务则表现为对数据的操控。在此条件下,图书馆信息资源建设的目标将不再是占有资源,而是确保信息资源在用户有需求时能够及时获取,因此图书馆要建设一个信息资源保障链。这种信息资源保障链与过去的资源共享、文献传递服务不同,信息资源保障链更追求时效性。传统的文献传递服务最快也要一天时间(根据本馆服务时间),而用户对于资源的需求是要求实时获取,这一问题在传统条件下无法获得根本解决,而在云计算时代,由于技术和服务模式的进步,使得图书馆利用云计算服务建立实时的信息资源保障链成为可能。

2.1 图书馆数字资源的存储

对图书馆数字资源保障链而言,存储是首要问题。传统上,数字资源的存储主要是靠各图书馆自己建设的服务器、磁盘阵列存储,随着信息量的不断扩大,各馆的存储设备也在不断扩容,普通本科院校每年的数字资源以5-10TB数量增长,每年至少要增加1-2个磁盘阵列以及服务器,[3]才能勉强满足数字资源的增长需求。从未来发展来看,各馆再建立自己的存储中心已经力不从心,而云计算服务将能解决数字资源存储的难题。

利用云计算进行的存储可称为“云存储”,它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。

在云时代,图书馆藏书目数据库和特色文献数据库资源都可以选择存储在云中。图书馆根据本馆需要向云服务提供商租用相应的存储空间,并可以随时按照需要增加或减少空间的大小。数字资源存储在“云”中,就如同存储在本地一样,可以随时调用数据,并省去了存储空间管理的麻烦。

2.2 图书馆数字资源的检索

检索是数字资源利用的重要环节,基于云计算的数字图书馆资源保障链能否顺利应用,就需要考查其检索功能。网络中信息检索的成败取决于服务器计算能力,而云计算在这方面提供了很好的保障。与传统的数字图书馆相比,利用云计算进行图书馆数字资源的检索,将更加有效。

云计算为网络应用提供了强大的计算能力,可以为普通用户提供每秒10万亿次的运算支持,完成用户的各种业务要求。这种超级运算能力在普通计算环境下是难以达到的。因此,为图书馆开展大规模用户同时在线检索服务提供了可能。同时,云计算的检索功能还可以为图书馆提供新的服务模式,即按照用户的使用量来付费,同时根据用户的不同,开发不同的界面使用检索服务。

另外,传统数字图书馆的数据基本上处于“分布式存储,分布式访问”的状况。用户要检索不同的数据库的内容需要通过不同的数据库检索系统,分别进入各个数据库的检索界面。基于云计算的图书馆至少在技术上能够将分布式存储的数据库和一站式的检索界面结合起来。用户通过Google式的检索界面将检索请求提交给云计算服务器,服务器根据用户提交的请求调配强大的计算能力,进行本体演算、机器智能推理等复杂计算,充分分析用户需求。根据分析结果调配存储在分布式云存储服务器的资源,将结果提供给用户,可以极大提高资源查全率和查准率。这为用户提供快捷的、直达需要的数字资源的良好体验。

2.3 图书馆数字资源的获取

传统数字图书馆资源的获取中,有两种主要方式:一是由图书馆购买数据库安装在本地使用;二是购买数据库使用权远程访问。本地镜像站获取速度虽快,但是占用大量贮存空间,远程访问的速度又不甚理想。而在云时代,图书馆将不再购买数据库本地安装,而远程访问获取的方式也将改变,资源获取变得更快捷,更经济。

在云计算模式中,相关的数据资源存储在“云海”之中,而随着IPv6等技术的应用以及云计算本身的分布式架构和强大计算能力,使得从云中获取数字资源的速度将如同在本地一样快捷。图书馆用户在任何时间、任何地点都可以以方便、安全的方式向云服务器提交获取资源请求,云计算服务器将通过统一平台,自动调取分布在云中各处的数据提供给用户。虽然在“云”里有成千上万台计算机为其提供服务,但对于“云”外的用户来说,他看到的只是一个统一的“服务”(或接口)界面,用户使用云服务就像通过互联网使用本地计算机一样的方便。[7]可以说,基于云计算的图书馆数字资源获取的核心关键词是“随时获取,按需付费”。

3 基于云计算的图书馆数字资源保障链的优势

从上面的分析我们不难看出,利用云计算技术建立图书馆数字资源保障链的可能性,下面我们再从简单的几个方面来阐述一下云计算的特点和优势:

3.1 可靠、安全的数据存储

“云计算”将信息集中处理,保证了图书馆及用户的信息安全。云计算提供了最为可靠安全的数据存储中心,数据(如文档和媒体)将会自动同步,通过Web可在所有的设备上使用。

传统数字图书馆的服务器及公用电脑常被木马病毒攻击。由于计算机和存储设备的交叉使用,导致计算机病毒在图书馆网内广泛传播。安装杀毒软件,除了使用费用,还要定期更新和防止杀毒软件误删除的危险。因此,图书馆数据安全工作不太可能做到足够的专业,云计算中所提供云存储服务,可以为重要数据提供安全的防护,因为这些工作都是由专业的云存储服务商来提供,他们有先进的技术和专业的团队,可以为图书馆提供各种安全服务承诺。

同时,数据的统一管理更容易实现安全监测:通过将信息存储在一个或者若干个数据中心,通过分布式、多节点备份,保证数据的安全及可靠。对应的管理者可以对数据进行统一管理,负责资源的分配、负载的均衡、软件的部署、安全的控制,并有效降低使用者的成本,而且可以根据图书馆要求提供各种专业而严格的权限管理策略,让图书馆不同层级的用户共享数据。

另外,确保服务器的全天候可靠运行,最大限度地降低服务器出错概率。在现行的图书馆中,由于数据都集中在馆内的服务器上,一旦服务器出现故障,将使图书馆无法进行正常的服务,甚至会导致重要数据的丢失,给图书馆造成不可挽回的损失。运用云计算模式可以挽回这种局面,因为云中有成百万台服务器,即使云中的某台服务器出现故障,云中的其它服务器也可以在极短时间内,快速利用克隆技术将这台服务器中的数据完全拷贝到别的服务器中,并启动新的服务器来提供服务,从而使图书馆真正实现无间断的安全服务。

3.2 经济、合理的投入

随着云计算的发展,极大地减少了软硬件资源的管理和维护成本,节省了人力物力。据预计,相对于自已运营的数据中心而言,云计算服务提供商的存储成本一般只有其1/10,而带宽成本只有1/2,计算处理能力成本只有3/10。

对于图书馆说,硬件设施投入是一笔巨大的开支,而且为了适应技术设备的发展,这些设备往往还需要不断更新或升级,这又意味着一笔硬件资源的浪费。云计算中,用户不需要任何的部署成本,只需花少量的钱来租用相关的云服务商所提供的相关服务即可。它可以让用户使用很少的投资获得较大的回报,同时用户不必担心自己花费巨大投资所部署的IT产品被时常淘汰的后果,因为具体的硬件配置和更新都是由云服务提供商来提供的。

云计算时代,用户将不需要安装和升级电脑上的各种应用软件,只需安装网络浏览器,就可以方便快捷地使用云计算提供的各种服务。同时,图书馆还可以向云计算服务商定制软件服务,比如图书馆所需的信息检索、文献阅读等应用软件,一些常用的应用软件,如办公软件、电子邮件系统等也可以从云服务中以低廉的价格获得。

图书馆还可以以极低的成本投入获得极高的运算能力,克服服务器访问限制的瓶颈。普通服务器的相关硬件资源都有一定的限制,若服务器同时响应,用户的数量超过了自身的限制,将导致服务器的崩溃。如果图书馆想满足这部分被限制的用户的请求,就不得不花费大量的资金部署更高级别的服务器。而应用云计算技术,通过支付少量的费用,图书馆就可获得云模式中成百上万台服务器提供的服务,用户的请求便可在毫秒的时间内获得响应,从而使图书馆以较低的成本获得较高的效益,与花数万元购买专用的服务器相比,使用云服务显然更经济划算。

另外,云计算服务还能有效降低图书馆维护成本。图书馆资源建设的维护工作涉及到硬件、软件等各方面,如对服务器、计算机、网络设备所进行维护、升级和硬件更新;数据库数据的拷贝、安装;大量的软件安装、授权使用、后期更新、病毒防范等等。而使用云计算模式,由于云计算模式对于用户终端的配置没有限制,因此有关的技术人员不必在升级图书馆的相关硬件上煞费苦心,数据库服务器的日常维护也由云服务提供商来提供,大部分软件的使用都来自于SaaS的“云海”中,软件的安装、更新、授权和病毒防范等问题也统统丢到“云”里。这样,相关人员的工作强度就会大大降低,从而能腾出更多的时间来开展其他的工作。

3.3 灵活、兼容的共享服务

图书馆资源建设的目的是为了更多的人能够使用图书馆,最大限度地发挥图书馆的作用。但是在传统的数字图书馆服务模式下,用户一般必须使用计算机,才能使用指定图书馆的数字资源。而云计算条件下的图书馆将能让更多的用户利用各种终端在不同的图书馆中共享数字资源。

云计算轻松实现不同设备间的数据应用。随着嵌入式技术的发展,各种智能终端设备的性能越来越完善,不少掌上电脑、智能手机的CPU和存储能力已经与低端PC不相上下,而这些设备的便携性使得它们成为未来重要的图书馆使用接入终端,但传统数字图书馆很难实现各种设备共享图书馆的数字资源。而云计算能解决这一难题,在云计算的网络应用模式中,数据保存在“云”端,同时,云计算模式提供了强大的无线接入功能,因此未来用户可以通过各种相关的终端使用图书馆的数字资源,从而使图书馆资源中心的作用得到最大限度的发挥。所有电子设备只需要连接互联网,就可以同时访问和使用这些数据,这些设备之间的数据也可以无障碍共享。实现用户对数字图书馆的无缝接入,这样可以使图书馆的数据能实现更深一层次的共享[9],可以真正带给用户“图书馆无处不在”的体验[10]。

4 结语

无论是不是新概念,无论是不是炒作,云计算的研究热潮已经形成。虽然理想中“云计算”还没有在图书馆现实中实现,而且也有研究发现存在诸如网络基础设施问题、先期投入等问题。2009年7月,美国国会图书馆宣布进行为期一年的试验,在他们的国家数字信息基础设施和保存计划中测试云技术对永久保存数字内容的应用[11],可以预料,这将对云计算在图书馆的应用产生巨大的影响。作为图书馆更应该投身到云计算研究的热潮中去,借“云”之力,让图书馆的发展在云时代扶摇直上,直达云端。

[1]OCLC云服务深度解读[EB/OL].http://www.kevenlw.name/archives/1290.2009-10-16.

[2]中国云计算网[EB/OL].http://www.cloudcomputing-china.cn/Article/jh/200805/1.html accessed.2009-10-16.

[3]Michael Armbrust,ArmandoFox,Rean Griffith,etc.Above the Coulds:A Berkeley Viewof Cloud Computing[EB/OL].http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.pdf.2009-10-16.

[4]邱锋祥,汪晓兰.图书馆应用网格技术的几点思考[J].图书情报工作,2009,53(1):105-108.

[5]云计算和云存储的关系[EB/OL].http://tech.ddvip.com/2009-06/1243849316121868.html.2009-10-28.

[6]云计算细分之七大类商业模式[EB/OL].http://blog.chinaunix.net/u2/75125/showart_1657241.html.2009-10-28.

[7]李永先,栾旭伦,李森森.图书馆迎来“云”时代[J].高校图书情报论坛,2009,8(1):59-61,4.

[8]IT主管应该尽早为云计算做准备 [EB/OL].http://blog.e-works.net.cn/280051/archive/2009/02/06/22827.html.2009-10-28.

[9] 卢晓娟.云计算与未来图书馆 [J].数字信息资源建设,2009,(2):23-24.

[10]周 舒,张岚岚.云计算改善数字图书馆用户体验初探[J].图书馆学研究,2009,(4):28-30,36.

[11]Rosenberg D.Library of Congress test drives cloud storage[EB/OL].http://news.cnet.com/8301-13846_31028628062.html.2009-11-12.

[12]李开复.云计算[J].中国教育网络,2008,(6):34.

[13]张 莹.“云计算”技术在高校资源建设中的应用初探[J].科技资讯,2009,(9):219-220.

[14]孙 卫.图书馆在云时代的思考[J].数字图书馆论坛,2009,(6):35-41.

[15]Using IPv6 for hybrid cloud computing.[EB/OL].http://www.zuia.org/xwdt/gjdt/45cbe003f2045c6a47646102ff76445f.html.2009-11-12.

猜你喜欢

服务器数据库数字
通信控制服务器(CCS)维护终端的设计与实现
答数字
数据库
中国服务器市场份额出炉
得形忘意的服务器标准
数字看G20
计算机网络安全服务器入侵与防御
数据库
数据库
数据库