云计算技术在图书馆中的应用研究
2012-04-29黄胜国
黄胜国
〔摘 要〕云计算是一种新型的基于互联网的商业计算模型,它是分布式处理、并行处理和网格计算的发展,具有安全可靠、海量信息存储、快速方便等特点。云计算以其独特的优势被各个国际著名厂商重视,并在各领域都起到一定的影响,同样它也将对图书馆的发展产生深远影响。现今,图书馆应该思考的是如何运用云计算来调整服务模式,以便更加有效地适应读者与图书馆之间的互动,并解决好云计算运用过程中出现的数据安全、标准和版权等方面问题。
〔关键词〕云计算;分布式处理;并行处理;网格计算;海量信息存储
DOI:10.3969/j.issn.1008-0821.2012.02.027
〔中图分类号〕G250.74 〔文献标识码〕A 〔文章编号〕1008-0821(2012)02-0107-04
Research on the Application of Cloud Computing Technology in LibraryHuang Shengguo
(Library,South China Normal University,Guangzhou 510631,China)
〔Abstract〕As a result of evolving of distributed processing,parallel processing and grid computing,cloud computing which is a new kind of commercial computation model has many advantages such as being safe and reliable,capable of mass data storage,as well as easy and convenient to use.The unique advantages of cloud computing has already caused the attention of various famous international companies and applied in various fields.Also it will greatly affect the development of libraries.Nowadays,libraries should contemplate how to adjust their services mode by using cloud computing,in order to effectively adapt themselves to the interactions between readers and libraries,and solve a series of problems in cloud computing such as data security,standard and intellectual property.
〔Key words〕cloud computing;distributed processing;parallel processing;grid computing;mass data storage
云计算(Cloud Computing),是一种基于互联网的超级计算模式。狭义上讲,它是分布式处理、并行处理和网格计算技术的综合发展,是一种新型的计算模型,是一种新型的共享基础架构的方法。广义上讲,它是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备对内对外的服务。云计算的核心思想,是将大量用网络连接的计算资源统一管理和调配,构成一个计算资源池向用户按需服务。提供资源的网络被称为“云”,“云”的出现简化了IT架构的实施,给人们提供了一种理想的方式,即IT应用可以像水电煤气等公共设施一样,实时定制,随时取用,按需付费。目前按照“云”的内容,可以把云分为3种:提供资源的云,包括提供存储、网络、带宽等,将“资源”网络化、虚拟化,以服务的形式提供;提供动态数据的云,包括对动态数据服务的云,包括对原始数据、半结构化数据和经过处理的结构化数据管理、分享、组织、转换、分析、挖掘、搜索等服务,它把资源连同计算处理能力和领域知识技巧一起提供;提供软件平台的云,包括SasS服务、软件API、开发环境、应用工具等,用户只需通过浏览器(包括手持设备专用的浏览器)就能获得各种类型的服务[1]。
作为一种新兴、备受瞩目的技术,云计算技术一经推出就受到业界人士的广泛推崇。图书馆历来是IT新兴技术应用的主要场所之一,云计算也不例外。2009年4月OCLC(Online Computer Library Center,联机计算机图书馆中心)正式宣布将向它的会员图书馆提供“基于云的”、Web规模的协作式图书馆管理服务,并推出基于WorldCat书目数据的“Web协作型图书馆管理服务”,不仅此项服务被公认为是一项云计算服务,此举也预示着云计算将在图书馆领域中广泛应用[2]。未来云计算技术将给图书馆带来深刻变革,图书馆自动化系统在云计算时代将不再需要重新在本地安装和部署,而是采用以网络服务的形式由供应商直接远程提供;通过Web云接入,可以实现超大规模的计算和存储服务的访问,克服图书馆服务器访问限制瓶颈;将分布式存储的数据和一站式检索界面结合起来,进行数字资源的整合、组织、关联、导航,甚至是可视化服务,以实现不同“云”之间的互操作及全方位的网络扩展服务等。云计算无疑将给图书馆服务方式和服务内容带来新的机遇,同时也给图书馆技术、管理等方面要求带来新的挑战。
1 云计算的在国内外的发展
1.1 云计算在国外的发展
早在20世纪60年代麦卡锡(John McCarthy)就提出了把计算机能力作为一种像水和电一样的公共事业提供给用户。云计算的第一个里程碑是1999年Salesforce.com提出的通过一个网站向企业提供企业级应用的概念;另一个进展是2002年亚马逊(Amazon)提供一组包括存储空间,计算能力甚至人力智能等资源服务的Web Service;2005年,该公司又提出弹性计算机云(Elastic Compute Cloud,EM2)服务。自2008年起,国外许多著名的IT厂商开始谈论云计算,这些公司包括硬件厂商(IBM、HP、INTEL、思科等)、软件厂商(微软、ORACLE等)、互联网提供商(GOOLE、Amazon等)和电信运营商(AT&T等),甚至一些中小型IT企业也将云计算作为自己的主战场。目前,国外主要的云计算机服务还包括:Google的应用托管服务(Google APP Engine),IBM“蓝云计划”,Sun的“黑盒子计划”,微软的Live Mesh与HP、Intel、Yahoo的“云计算试验平台”等。
1.2 云计算在国内的发展
在国内,云计算的发展也相当迅猛,但应用相对滞后,如金蝶、用友纷纷推成立了SaaS部门,神州数码、清华同方等开始了SaaS平台的搭建,也有如瑞星的“云安全”计划等研发应用,但数量不多。目前,国内对“云”的应用研发主要存在3种模式。一是国外著名IT廠商在国内的开发应用,如IBM于2008年在分别在无锡软件园建立的全球第一个实现商业运营云计算中心与在北京建立的IBM大中华区云计算中心;二是IT巨头与国内企业的合作研发,如金碟与IBM发布的拟在帮助中小型企业用户通过互联网实现在线管理及电子商务服务的一站式“腾云计划”,Google中国、EMC与清华大学的“云计算”,南京三宝与微软合作建立SaaS运营服务管理平台等。第三种类型是国内IT企业自主研发用的云计算应用,如世纪互联的业内首款基于云计算的弹性主机租用(EPS)服务,浪潮的“挺进高端”战略计划,解放军理工大学研制了云存储系统MassCloud,Alibaba集团研发了淘宝分布式文件系统(TFS)并启用“电子商务云计算中心”,CALIS中心也提出设计和开发数字图书馆云服务平台并为图书馆提供本地化的数字图书馆云计算解决方案[2]。
2012年2月第32卷第2期云计算技术在图书馆中的应用研究Feb.,2012Vol.32 No.22 图书馆云计算机平台的实现
为了实现云计算,其体系结构必须支持几个关键特征。首先,系统应该是自治的,即需要内嵌自动化技术,以减轻或消除人工部署和管理的工作,平台能自发地响应系统的要求;其次,云计算的架构必须是敏捷的,能够快速对信号进行响应。内嵌的虚拟化技术和集群化技术,能够动态地随服务系统要求的变化而作改变。云计算平台是一个强大的“云”网络,连接了大量并发的网格计算和服务,可利用虚拟化技术扩展每一台服务器的能力,将各自的资源通过云计算平臺结合起来,提供超级计算及存储能力。通用的云计算体系结构如图1所示。图1 云计算平台的体系结构
建设云计算的数字化图书馆,核心部分是云平台的服务层,它主要包括物理层、虚拟化层,基础设施管理层,平台层和应用层,图书馆云平台架构实现的模型如图2所示。虚拟化层的功能是将服务器、储设备和网络等物理层资源池化,使所有的硬件资源可以灵活调度。虚拟化是实现模块化、集成化、简单化和标准化的重要方法之一。虚拟化可以使企业集中并共享IT资源,从而优化资源利用率,使IT资源供给动态地满足系统的要求。基础设施管理层提供了基础设施的统一监控、管理、控制,并实现资源供应的自动化。通过统一的管理平台,可实现对包括Unix服务器、DAS、NAS、SAN和网络等IT基础设施的统一管理。借助统一管理平台,图书馆用户获得了一个可扩展、基于标准的服务器和存储设备管理平台,并以此提高应用程序可用性,以及IT资源的生产率和灵活性。平台层通过丰富的工业标准集群解决方案,使应用处理要求与可用性和性能所需的级别相吻合。图书馆用户通过集群方案可以整合㊣/O带宽、内存、CPU资源和海量存储等,同时也增强了数据的完整性,最大程度地提高了系统的可用性。应用层通过SOA(Service-Oriented Architecture,面向服务架构)构建应用程序是一种松散耦合,充许合成的架构风格。它采用了SOA的架构原则并且把这个原则应用到了一个基础设施[3]。
应用层(实现SasS,如Google Apps、Zoho Office)
SOAP COBRA EJB AJAX平台层(实现PasS,如IBM IT Factory、Google APPEngine)
操作系统集群 数据库服务集群 应用服务集群基础设施管理层(实现IasS,如Amazo EC2、SUN Grid)
统一监控/管理/控制 资源供应自动化虚拟化层
服务器资源池 存储资源池 网络资源池服务器 存 储 网 络安 全 管 理 平 台图2 图书馆云计算平台的实现模型
3 云计算技术在图书馆的应用与发展
云计算技术在图书馆的广泛应用将对图书馆数字化资源存储、管理及读者网络化利用方面带来深刻影响,从而影响传统流通服务模式及读者获取知识的方式。这种影响促进图书馆去积极适应、迎合这种挑战,图书馆才会在未来信息存储中心的阵营中稳固自己的领地。
3.1 提供安全可靠的数据存储
数字图书馆最大的担心在于数据的安全性,无论书目数据、读者数据、流通数据还是数字资源、特色馆藏资源一旦丢失,后果将不堪设想。云平台环境下为了保障图书馆数据存储的可靠性,可以采用最为先进的虚拟化海量数据存储技术来管理和存储数据资源。海量存储数据常采用镜像和校验技术进行容错,需要在两套不同的设备中维护相同的数据,一旦主设备坏,可立即切换到镜像设备(或容灾中心)进行访问。虚拟化海量存储技术是采用数据副本进行容错,它不需要冗余设备,通过对每个虚拟盘创建多个副本提高数据的可靠性和访问性能。这种方法不需要维护规模庞大的映射表,即使磁盘被损坏,也不会影响正常的读写访问,更适合在云环境下的海量存储网络系统中实现[4]。
3.2 实现数字资源的共享和共建
图书馆界一直追求的目标是数字资源的共享共建,云计算的应用将完全可以实现这一目标。在图书馆领域,各个图书馆的各种数字资源可以借一朵“云”统一结合起来,内容高度整合,就如当前流行的“信息共享空间”一样。用户通过云服务商那里获取相应的数字资源,而无需理会后台硬件及系统的复杂运行,也不必更新、维护硬件设备。图书馆的运行成本大大降低的同时,效率还大幅度提升。随着云计算技术的成熟及广泛推广,今后全球图书馆的数字资源将得到真正的整合及共享、共建,使用户的信息需求得到完全的满足[6]。
3.3 实现数字资源的合理分配
由于各所大学的学科设置不一(或某一区域、某段时间读者关注数字资源的侧重点不同),图书馆经常出现的数字资源得不到合理的利用,部分数字资源用户过多,而另外一些数字资源却少有人问津。云计算的解决的目标之一,就是资源的合理分配与利用。图书馆可以从云计算提供商那里获得更合理的计算能力,支持数据的良好运行;倘若某一时刻某一数据库访问人数很多,可要求分配更多的运算资源,以保证服务顺畅运行;倘若某一时段访问人数很少,云计算便可动态归还多余的运算能力,减少资源的浪费。云计算可以完全改善资源的合理分配,各类型的图书馆(大、中、小型、社区及高校图书馆)的经费方案和设备配置可以得到进一步的优化。
3.4 保障服务器高可靠性运行
单一图书馆即使搭建了可靠的服务器,但限于技术水平、黑客入侵、病毒传播、用户过多等因素,服务器经常会出现濒临崩溃的状况。图书馆从云计算服务商那里可以获取更强技术手段和更完善的维护能力;“云”内往往有大量服务器工作(根据云规模大小而定,几十至几百万台),其中某台(或几台)服务器出现故障,“云”内其它服务器将快速切换为图书馆用户提供服务,整个云服务不受任何影响。
3.5 保障图书馆的数字资源服务安全
云平台下图书馆可以根据用户数字资源需求的不同,将用户从低到高划分若干个安全等级,并严格控制用户对资源的访问权限。PMI(Privilege Management Infrastructure,特权管理基础设施)是目前较为成熟的权限管理与控制技术,它是基于属性证书(Attribute Certificate,简称AC)的授权平台,它以PKI(Public Key infrastructure,公钥基础设施)体系为基础,向所有用户提供与应用相关的授权服务,并在用户请求时进行权限验证,成为用户和服务供应者之间的安全通信基础[6]。图书馆通过PMI进行授权管理,普通读者登录到“云”端后根据系统内设置的角色分配相应权限,承担数据维护的管理员登录到“云”端也可获取相应的权限。云认证平台对认证信息通过权限确认后,将相应信息通过应用服务的认证接口发给具体应用服务进行验证,通过验证用户可获取相应的权限维护数据。通过单点登录的统一身份认证和PMI权限控制技术,图书馆根据不同用户设置相应权限,从而可严格控制用户对资源的访问;同时还能将云计算从物理上和逻辑上分成多层进行管理和控制,从而有效地保证数字资源服务的安全。
3.6 降低图书馆的运营经费
为了适应信息技术的高速发展的要求,图书馆的设备需要不断升级换代,图书馆应用系统及硬件的维护成本普遍较高。云计算在图书馆的应用将改变这种现状,由于具体的硬件配置和更新都是由云服务供应商来提供的,用户只需提供浏览器将满足所有需求,用户可通过各种终端设备享受云服务提供自己的信息、知识、资源、服务等,从而大大降低图书馆经费投入成本,也降低了图书馆技术员维护系统的工程强度。此外云计算还可以节省图书馆机房使用面积,电能及制冷消耗,并提高设备的利用率,进而为图书馆纸质书刊腾出更多的使用空间,馆藏资源利用率也相应提升。
4 云计算在图书馆应用中需注意的问题
虽然云计算已经成为当前信息技术研究的热点并已经获得商业的大量应用,但它仍然还存在诸多问题(包括安全、性能、标准、成本、能耗等)需要解决。随着云计算的进一步发展与推广,云计算平台必将成为图书馆的信息基础设施,基于云的应用也将成为图书馆的重要选择。根据现有云计算出现的问题,结合图书馆应用的特点,云计算在图书馆中的应用需注意以下几方面的问题。
4.1 云平台环境中的数据安全问题
图书馆现有的数字资源从理论上讲都可以利用一朵“云”将其全部放入云平台中,供云环境内用户共享使用,从而取代现有桌面计算模式。但在实际应用过程中,为了安全和稳定,也为了“云”服务的中断或失效,图书馆在把数字资源放入云平台时,尽量保存本地重要数字资源的镜像(备份),这些数据也可作为未来“云”数据的备份。在云平台环境下,资源对所有用户都是共享的,一些私有信息(如本人姓名、身份证号、电话号码、E-mail等)放入云中也容易造成个人隐私被窃,这些数据如果可能的话也尽量不要通过云平台共享出来。因此,在云计算模式下,不能完全推翻原有传统的数字资源保存和读取模式,云计算是有现有部署模式的有效补充。图书馆应该在充分论证的情况下,确定哪些数据放在云平台中,哪些数据必须在现在模式中予以保留[7]。
4.2 硬件、数据和系统的兼容性问题
由于各个图书馆的情况不同,图书馆所使用的硬件配置、操作系统和应用系统也千差万别,有些使用Windows,有些使用Linux或Unix。为了能更好的适应云计算的环境,更好地融入“云”中,图书馆应当密切关注云服务提供商所针对不同的操作系统平台开发的接口软件,也可通过与相关公司合作,开发出兼容本馆具体环境的通信协议及接口插件。
4.3 数字资源共享的版权问题
在云计算的模式中,各个加入云模式的成员馆之间可以通过有关的协议共享彼此的数字资源,也就是说“云”中的用户像使用本馆的数字资源一样去使用其它成员馆共享出的数字资源。在云模式下各成员馆方便用户、提高数字资源共享自由度的同时,也带来了大量版权纠纷问题。为此,图书馆界应该针对云模式共享资源中可能引起的版权纠纷做深入的研究,制定切实可行的管理制度,以切实保证图书馆的权益不受损害[8]。
5 结 语
虽然云计算大规模商业应用还存在一定的疑虑,但云计算带来的诸多优势,已经引起IT界的高度关注并已然成为当前IT技术研究热点。一旦云计算解决云计算标准、安全性、版权等细节问题,云计算将给IT界带来巨大变革。云计算的出现给图书馆带来了机遇,同时也使我们对未来云计算在图书馆的应用产生无限美好的遐想。把云计算应用到图书馆工作中,图书馆将专注自己的业务,摆脱IT束缚,发挥IT的最大效益,降低IT应用难度和复杂性,从而降低管理成本,减少系统性风险。相信不久的将来,随着云计算技术的不断成熟、完善,云计算在图书馆中应用将越来越广泛,图书馆上空将盛开朵朵“云”。
参考文献
[1]刘炜.图书馆需要一朵怎样的“云”[J].大学图书馆学报,2009,(4):2-6.
[2]Lihong Zhu.The role of the Cataloging Department in the implementation of OCLC WorldCat Local[J].Library Collections,Acquisitions,and Technical Services,2010,(4):123-129.
[3]Xun Xu.From cloud computing to cloud manufacturing[J].Robotics and Computer-Integrated Manufacturing,2012,(1):75-86.
[4]杨明芳,袁曦临.云计算环境下的数字图书馆[J].图书馆建设,2009,(9):7-12.
[5]石美清.云计算对图书馆数字信息资源建设的影响[J].图书馆理论与实践,2010,(5):65-67.
[6]Flavio Lombardi,Roberto Di Pietro.Secure virtualization for cloud computing[J].Journal of Network and Computer Applications,2011,(4):1113-1122.
[7]Richard Blandford.Information security in the cloud[J].Network Security,2011,(4):15-17.
[8]Paul T.Jaeger,Jimmy Lin,Justin M.Grimes.Cloud Computing and Information Policy:Computing in a Policy Cloud?[J].Journal of Information Technology and Politics,2008,(3):269-283.