云计算在图书馆中的研究展望
2011-03-18谢明亮
谢明亮 徐 瑾
(1.江苏教育学院图书馆,江苏 南京 210013;2.江苏畜牧兽医职业技术学院图书馆,江苏 泰州 225300)
谢明亮 男,1984年生。本科学历,助理馆员。研究方向:数字图书馆。
徐 瑾 女,1983年生。本科学历,助理馆员。研究方向:图书馆理论研究。
1 云计算的概念、原理与特点
2006年,云计算(Cloud Computing)的概念首次被Google提出;2007年,云计算开始成为IT领域新的研究热点;2008年,Google、Amazon、IBM、微软等IT业巨头以前所未有的速度和规模推动云计算技术和产品的普及;2009年被认为是云计算的元年,融合了设施、能力和数据的云正在成为一种网络存在方式。
对于云计算,Google全球副总裁李开复博士的定义为:“所谓云计算,就是要以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片‘云’成为每一个网民的数据中心和计算中心。”
云计算(Cloud Computing)是一种新近提出的计算模式,是一种数据密集型的超级计算,其基本原理是,用户所需的应用程序并不需要运行在用户的个人电脑、手机等终端设备上,而是运行在互联网的大规模服务器集群中。用户所处理的数据也并不存储在本地,而是保存在互联网的数据中心里面。这些数据中心正常运转的管理和维护则由提供云计算服务的企业负责,并由他们来保证足够强的计算能力和足够大的存储空间来供用户使用。在任何时间和任何地点,用户都可以任意连接至互联网的终端设备。因此,无论是企业还是个人,都能在云上实现随需随用。云计算中的“云”可以再细分为“存储云”和“计算云”,也即“云计算=存储云+计算云”。“存储云”是一个大规模的分布式存储系统。“存储云”对第三方用户公开存储接口,用户可以根据自己的需要来购买相应的容量和带宽。“计算云”包括并行计算和资源虚拟化。并行计算的作用是首先将大型的计算任务拆分,然后再派发到云中节点进行分布式并行计算,最终将结果收集后统一整理,如排序、合并等。虚拟化最主要的意义是用更少的资源做更多的事[1]。毫无疑问,云计算有望成为一个更加开放的、互操作的新模式,以满足计算服务的需求。Intel亚太研发有限公司软件与服务事业部首席研发官杨诚评价云计算“因为不贵,所以珍贵;因为不繁,所以非凡”。同时,中国工程院院士李伯虎也指出,要实现高效、高质的云计算,还要在应用、技术方面带来更大的创新。
云计算的蓝图已经呼之欲出:在未来,只需要一台笔记本或者一部手机,就可以通过网络服务实现我们需要的一切,甚至包括超级计算这样的任务。从这个角度而言,最终用户才是云计算的真正拥有者[2]。云计算有以下5方面的特点:
①超大规模的计算能力。由于云计算集中地为用户提供基础设施、平台或应用服务,因此其规模巨大,尤其是大型提供商的云计算,如Google的云计算已经拥有100多万台服务器,企业私有的云计算一般也拥有数百上千台服务器。由此可见,“云”能赋予用户前所未有的计算能力。
②可靠、安全的数据存储。云计算提供了最为可靠安全的数据存储中心,数据(如文档和媒体)将会自动同步,通过Web可在所有的设备上使用,这样避免了用户将数据存放在个人电脑上可能造成的数据丢失或病毒攻击等问题,同时云计算通过严格的权限管理策略支持数据的共享。
③虚拟性。云计算支持用户在任意位置使用各种终端获取应用服务。用户无需了解也不用担心应用运行的具体位置,只需要一台笔记本或一个自己喜欢的浏览器,在浏览器中键入URL,就可以尽情享受云计算带来的乐趣,实现所需要的一切,甚至包括超级计算这样的任务。
④廉价性。由于“云”的特殊容错措施可以采用极其廉价的节点来构成云,“云”的自动化集中式管理使大量的企业无需负担日益高昂的数据中心管理成本,云计算在“云”的支撑下可以构造出千变万化的应用,同一个“云”又可以同时支撑不同的应用运行,这样导致资源的利用率较之传统系统大幅提升。因此,用户可以充分享受“云”的低成本优势,经常只要花费几百美元就能完成以前需要几万美元的任务。IBM认为,云计算可以帮助企业节省多达80%的机房面积和60%的计算机运行与冷却的电费。
⑤方便快捷性。在云计算模式中,相关的数据存储在“云”之中,用户在任何时间、任何地点都可以以某种快捷、方便、安全的方式获得云中的相关信息或服务。虽然在“云”里有成千上万台计算机为其提供服务,但对于“云”外的用户来说,他看到的只是一个统一的“服务”(或接口)界面,用户使用云服务就如通过互联网使用本地计算机一样方便[3]。
2 云计算对图书馆的影响及挑战
2.1 云计算对图书馆的影响
2009年,世界最大联机图书馆服务供应商OCLC宣布即将推出基于Worldcat书目数据的“Web级协作型图书馆管理服务”,被公认为是一项云计算服务,其目标是取代各类型图书馆的集成管理系统。这说明“基于云”的服务已经引入到了图书馆界,云计算一旦在图书馆界应用,势必将给图书馆带来很多变化:①在物力上的成本投入降低,不再需要购买多种服务器、大容量的设备,读者只要能够连接上网,每台机器均可以进行图书馆业务的操作;②在人力上,其成本投入也相应降低,不再需要那么多的IT维护人员;③读者利用图书馆资源不必再局限于计算机,可以通过移动设备(PDA、智能手机等)访问图书馆的资源;④图书馆的所有业务支持系统和资源服务系统都将由“云”来提供,而不像以前那样由图书馆集成系统厂商提供;⑤图书馆不需再向信息系统提供商支付昂贵的费用;⑥“云”计算的引入,可以提高图书馆工作人员的效率,减少成本和时间;⑦把图书馆的馆藏资源放在“云”上,可以使图书馆的馆藏和服务国际化[4]。
2.2 云计算应用于图书馆中的挑战
云计算作为一种新技术应用于图书馆中,必然会给图书馆带来各种困难和挑战,下面从4个方面探讨云计算在图书馆应用中面对的问题。
2.2.1 云服务供应商的选择问题
图书馆应用“云”管理图书馆服务所需IT资源,理想状况是:存在若干相互竞争的大型云提供商,以可拆分的方式为图书馆提供硬件、软件、系统、平台或基础设施的服务(XaaS,Xasaservice。X为用户所需IT资源)。也就是说,图书馆可以从不同的云服务中选择最合适的应用,混搭提供最佳的服务,而不是完全依赖于一个服务供应商。这样,图书馆所选择的云服务供应商提供服务的性价比(质量、价格等)会很高,图书馆的利益可以得到保障,同时,不同的图书馆面临着选择不同的云供应商问题,这就需要图书馆培养专门的对云计算及云服务熟悉的“云图书馆员”。
2.2.2 标准问题
要想实现不同云服务供应商之间的软件、硬件、系统及平台可相互兼容,除通过相应的协议与供应商形成合同关系外,从技术上说,还需要IT服务提供商所提供的云计算能够遵循共同的标准。没有共同的标准,就不可能实现从一家供应商到另一家供应商之间的零成本转移。由于云计算发展迅速,大企业纷纷“抢滩”,因而标准问题更加突出。当前云计算领域的标准,要么是像微软产品由于市场占有率奇高而自然形成的标准,要么是行业组织或多家企业联合制定的标准。例如,2009年1月,云计算标准制定组织“开放云联盟”(OCC)成立,思科、雅虎成为其首批成员。2009年4月,包括AMD、思科、惠普、IBM、英特尔、微软等众多知名企业支持成立于1992年的标准化组织“分布式管理任务组”(DMTF)组建“开放云计算标准孵化器”,可见云计算企业对于建立云计算标准的关注。
上述机构建立的标准是必要的。它们至少能够保证不同的云之间具有互操作性。对于图书馆行业,关注的标准可能需要更加广泛一些,比如不但需要程序交互接口的标准化,而且需要支持不用再编程的可交互接口,支持数据的标准化,等等。《云计算权利宣言》对云计算标准提出的4点要求或许可以作为我们认可企业提供云计算的评判标准。这4点要求是:①尽可能使用现有标准,而不是创立新标准;②有合适的标准时,应当使用开放标准;③不应该使用专有标准;④应该使用透明的数据格式。
2.2.3 数据安全和保密问题
数据安全对图书馆至关重要。无论是书目数据、读者数据还是流通数据,一旦丢失,后果都不堪设想。而馆藏文献数字化的数据一旦丢失更令图书馆人心痛不已。可以说,图书馆人对于数据脱离自己的控制有一种本能的恐惧。但实际上,大型计算中心的硬件条件和管理能力比普通图书馆的IT管理能力要高出许多,单就技术而言,图书馆将数据置于云上不会比置于本地硬盘更不安全。所以数据安全和保密问题,更多的是政策层面的。云计算企业的管理政策、企业信誉,甚至国家政策,都可能对云计算数据的安全造成极大影响。
2.2.4 知识产权问题
用户购买云计算后,将自己的内容交给云,由云计算企业托管这些内容。理论上说,用户应该完全拥有被托管数据的知识产权。就是说,用户希望自己能够管理和控制这些内容,有权修改和删除这些内容,并且其他人不得使用和修改这些内容。这一要求,应该作为图书馆应用云计算的前提条件之一。但是在现实中,云计算企业深知“数据核心(Datais the Next Intel Inside)”原理,因而他们会千方百计地利用这些数据,并以数据整合、数据挖掘、知识服务的名义使用户数据利用合法化。近年来,OCLC利用WorldCat中集成的馆藏数据,开发出了一些新产品,如每季的大学与研究图书馆推荐书目、作品的读者对象。其Web级服务也就是云计算图书馆集成系统一旦上线,将会集成大量图书馆的本地读者信息及借阅数据,可以预计OCLC也会对其进行开发。这些数据与馆藏信息不同,本为成员馆所唯一拥有,如果用以开发而成产品,其知识产权的界定将成为新的问题[5]。
3 云计算在图书馆中的研究展望
随着云计算技术的深入开发和实践,其在图书馆应用的研究内容也会逐步深入发展,并逐渐进入实践和理论相互促进、共同发展的阶段。针对云计算对图书馆的影响和挑战,笔者提出以下5个未来可能的研究方向。
3.1 云计算与图书馆理论研究
就像历史上任何一场技术变革一样,“云计算”在刚开始时也会遇到许多似乎解决不了的问题,但我们相信,历史选择的技术总是指向低成本、高效率的方向,“云计算”正是计算机发展的这样一个方向。我们应该从观念、思想上认识、了解和把握这一变革的脉络。产业政策制定者、企业家、投资者、教育科研部门和图书馆应以开放心态尽快认识这个技术革命的内涵,要尽量了解掌握它的产业链结构,并能把握趋势,在关键领域进行政策制定、科研投入与企业转型,以此实现云计算环境下的图书馆新的变革,实现跨越式发展,把图书馆推向全新的发展阶段。
3.2 加强引导支持,开展规模化、系统性的实证研究
图书馆应用云计算并没有现成的道路可走,前方的道路可能比以往图书馆自动化、数字图书馆的进程存在更大风险。这就需要图书馆界迅速应对云计算给图书馆管理提出的挑战,对应用云计算所导致的管理问题进行系统、深入的研究。政府管理机构、学会(协会、研究会)应加强管理和引导,2010年度国家社会科学基金项目课题指南将“基于云计算的中小图书馆IT管理与服务模式研究”列入“图书馆、情报与文献学”目录;中国图书馆学会专业图书馆分会、中国图书馆学会数字图书馆研究与建设专业委员会将“当前各种新技术(Web2.0、数据挖掘、语义网、聚类分析、知识抽取、云计算等)的研究、开发、应用”列入2010年“专业图书馆信息技术的应用、服务和创新”学术研讨会征文,充分体现了对云计算应用的重视和引导。开展规模化、系统性的实证研究是应用云计算的基础性工作,对调研结果可靠、有效地处理、分析是进一步深化云计算应用的科学性保障。
3.3 培养“云图书馆员”
2008年10月,Jason Griffey提出“云图书馆员”(Cloud Librarians)的新概念,云计算的环境下将使图书馆员依托云而非实体图书馆提供服务,成为“云图书馆员”。图书馆学教育的根本出路在于教育体制改革,统筹解决生源、学习动力和人才供给结构与人才需求结构的契合问题,要改变目前以本科教育为主体的模式,积极兴办职业技术教育,大力发展研究生教育,本科教育应以继续教育为主。更新图书馆学教育办学理念,使图书馆学教育拓展社会方向、夯实理论基础、加宽知识层面、加重现代技术含量、保持专业特色和与国际同业接轨,积极培养“云图书馆员”。
3.4 积极引进、吸收国际上先进成果和管理经验
2009年初,MichaelStephens预测图书馆界2009技术趋势,将云计算列为十大技术趋势之首,2009年4月23日,OCLC宣布即将推出基于WorldCat书目数据的“Web级协作型图书馆管理服务”,被公认为是一项云计算服务,其目标是取代各类型图书馆的集成管理系统。由于OCLC在图书馆界的广泛影响,此举预示着云计算在图书馆领域广泛应用的开始。美国国会图书馆与Dura Space公司的Dura Cloud项目是图书馆对云服务进一步应用的重要见证。在欧美发达国家,云计算已经从技术概念如火如荼地运用到图书馆的实践中,在研究云计算可能导致的图书馆机构与流程的变化、IT部门人员数量与结构的变化、图书馆对于云计算服务的质量检测与控制手段等等方面,取得了一定成果。我们应当积极学习和借鉴,结合实际,积极运用云计算技术推动我国图书馆事业又好又快发展。
3.5 云计算环境下的图书馆人文关怀
人文关怀是图书馆的核心价值,是图书馆建设和发展的需要,是图书馆服务中必须坚持的原则。克劳福德、戈曼提出的图书馆学新五律之一就是要“聪慧地利用技术加强服务(Use Technology Intelligentlyto Enhance Service)”,随着新技术应用和社会的向前发展,为了更深地发掘文献信息资源,我们要借助现代技术手段,更好地揭示馆藏,更好地为读者服务,更好地体现图书馆的人文关怀[6]。
[1]张健.云计算概念和影响力解析[J].电信网技术,2009(1):15-18.
[2]张叶红.云中漫步:图书馆云计算应用[J].农业图书情报学刊,2010(12):211-214.
[3]张凌超.基于“云计算”的数字图书馆建设模式初探[J].图书馆学研究,2010(11):39-42.
[4]高晓燕.云计算在图书馆中的应用探究[J].浙江高校图书情报工作,2010(1):11-14.
[5]胡小菁,范并思.云计算给图书馆管理带来挑战[J].大学图书馆学报,2009(4):7-12.
[6]张进英.我国云计算与图书馆问题研究综述与展望[J].图书馆学研究,2010(8):13-16,30.