国内外云计算研究的现状与发展
2012-04-29周海花华薇娜
周海花 华薇娜
〔摘 要〕运用文献计量方法,通过科学文摘数据库检索1969年至今所有云计算的文献,并从文献量、著者、期刊和关键词等方面对云计算领域研究论文进行分析, 从而探讨世界范围内的云计算研究的现状与发展趋势。
〔关键词〕云计算;INSPEC数据库;定量分析
DOI:10.3969/j.issn.1008-0821.2012.02.007
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2012)02-0026-05
Current Situation and Development of Cloud Computing in the World
——A Quantitative Analysis of the Research Articles based on INSPECZhou Haihua1,2 Hua Weina2
(1.Library,Nanjing Xiaozhuang University,Nanjing 211171,China;
2.Department of Information Management,Nanjing University,Nanjing 210093,China)
〔Abstract〕Based on the scientific research articles retrieved from the INSPEC database in the period from 1969 up till present,a large scale of bibliometric study has been made from many aspects as the amount,authors,journals,keywords and so on in order to reflect and evaluate the general scientific research capability in this field of cloud computing in the world.
〔Key words〕cloud computing;INSPEC database;quantitative analysis
什么是云计算,迄今为止学术界未形成统一的定义,不同领域不同行业提出不同看法,如维基百科、Google、IBM、美国加州大学伯克利分校、澳大利亚墨尔本大学、中国电子学会云计算委员会等,他们对云计算的定义都各执一词。尽管有关云计算的定义各有不同,我们仍然试图从各种层面来理解云计算这个浪漫的术语。从字面上看,“云”即互联网即网上的各种资源,“计算”则是能力,包括信息的处理、存储、检索、交互等;从技术层面看,云计算最核心的技术是虚拟化,将网络上的软硬件资源整合成网络服务能力;从服务层面看,云计算是一种新的商业模式,服务商利用虚拟化技术为用户提供优质价廉的专业化、规模化的信息服务;从应用层面看,云计算是一种新的用户体验,用户就像家庭用水电般使用互联网服务,像在银行存钱一样在网络上存储自己的信息[1-2]。国际许多大公司如Google、Amazon、IBM、Microsoft和Yahoo等都投入到云計算的研究和推广中,国内许多公司如中国移动、中国电信、中国联通、华为、中兴、联想等也已介入,成立中国云计算技术与产业联盟。有一点是毋庸置疑的,云计算的发展会给网络服务商、设备制造商带来新的发展机遇,也将对人们的生活和工作方式产生巨大的影响。
有学者[3]就LISA数据库中的云计算文献进行了定量分析,LISA数据库仅仅是图书情报领域包罗最广的文献数据库之一,而云计算在图书情报领域的应用只是其很小的一个方面,云计算的产生和应用更多的是在计算机科学、控制工程和信息技术等领域,因而在LISA数据库中能获取到的云计算方面的文献量很少(30篇),因此笔者选择了ISI Web of Knowledge 平台上INSPEC数据库作为定量分析云计算的工具。
INSPEC[4-5]数据库,全名为《物理学、电技术、计算机及控制信息数据库》(Information Service for the Physics,Electro-technology,Computer and Control,简称INSPEC),该数据库是目前全球在物理和工程领域中最全面的二次文献数据库之一,它的前身是“科学文摘”(Science Abstract or SA,始于1898年),被誉为国际六大检索期刊。它提供涵盖:物理、电子和电子技术、计算机科学、控制工程和信息技术等专业领域的科学技术文献检索,它是工程技术领域最受欢迎的文献数据库之一。该数据库其数据来源于全世界80多个国家的3 850多种科技期刊、2 000种会议录以及大量的著作、报告和论文。INSPEC数据库的所有文献都含有目录和摘要,数据并以每周的速度更新。从1969年至今,INSPEC数据库含有近1 200万条文献,并且以每年70万条新文献的速度增加。INSPEC数据库除了以它广而深的学科覆盖、准确的目录标引广受使用者欢迎外,还以它专业而完善的主题索引机制而著称。对于订购了该数据库的任何用户在ISI Web of Knowledge平台上都可以访问该资源。
1 载文量分析
笔者以“云计算”为题名,于2011年11月16日在INSPEC数据库中共检索到1969-2011年的相关文献1 179篇,主要包括会议论文849篇占总文献量的72.01%,期刊论文312篇占总文献量的26.46%。文献的数量反应了该学科研究水平和发展程度,笔者检索到的1969-2011年有关云计算的文献量分布如表1所示。表1 云计算历年文献量统计表
年 份文献量(篇)比 例(%)200310.092008312.63200922318.91201055547.07201136931.30
从表1可看出,INSPEC数据库中收录的关于云计算最早的一篇文献发表于2003年,该文刊自东南大学学报(自然科学版),由总参通信网络技术管理中心的尹国定和总参自动化工作站的卫红[6]撰写的《云计算——实现概念化计算的一种方法》(Cloud computing:a method to realize conceptual computing),该文在中国工程院李德毅院士提出的云模型的基础上阐释了云计算的原理,并提出云化计算包括两个过程:计算的云化过程和云的计算过程,计算的云化过程是从计算中获取云规则,而云的计算过程就是云的推理过程,最终在文末提出了云化计算的系统实现。不过很遗憾的是,该文作者此后并未就此领域作进一步研究。由┍恚笨杉,云计算被学界大范围广泛关注始于2008年,接下来的两年(2009年和2010年)关于云计算的文献量都超过200篇,由于检索时间限于2011年11月份,因此2011年的文献量并不全面,总文献量达369篇,预计未来几年云计算的文献量会不断攀升直至云计算时代的真正来临。为全面了解世界范围内学者何时真正开始关注云计算的,笔者选择了收录世界核心期刊数最多的WoS(Web of Knowledge)数据库,检索到学界开始关于云计算始于2007年,美国学者Waldrop,M.Mitchell[7]于2007年8月在《科学》的姐妹刊《科学美国人》上以题名 《盒子里的数据中心——一个塞满了服务器的集装箱将迎接云计算时代的到来》(Data center in a box-A shipping container stuffed with servers could usher in the era of cloud computing)发文,该文的刊出标志着学界开始关注和研究云计算。《科学美国人》是一本科普杂志,未被INSPEC数据库所收录,故笔者在INSPEC数据库中检索到的数据集中未有该篇文献。
2012年2月第32卷第2期国内外云计算研究的现状与发展Feb.,2012Vol.32 No.22 全部作者分析
作者在某一学科领域发表的文献数量,在一定程度上反映了该作者对这一领域的研究深入程度,对本文数据集的论文作者进行分析,有利于了解世界范围内云计算研究的领军人物。在检索到的1 179篇文献中,除20篇文献无作者外,其余文献共涉及到2 917名作者(包括合著者)。作者发文情况如表2所示。表2 全部作者发文情况
文献量(篇)人 数比例(%)12 50685.91231610.833732.54120.415561
0.3483131
由表2可知, INSPEC数据库中研究云计算的文献作者,85.91%的作者只被收录1篇文章;10.83%的作者被收录2篇文章,2.5%的作者被收录3篇以上文章,有10位作者发表了5篇及5篇以上的文献,现将这10位作者列于表3中。
表3 全部作者分析(发文量不少于5篇)
序号核心作者文献量(篇)国 别机 构研究活跃期(年)1Buyya,R.13澳大利亚墨尔本大学计算机科学与软件工程学院2008-20112Cong Wang8美 国伊利诺理工大学2009-20113Kui Ren8美 国伊利诺理工大学2009-2011 续表3
序号核心作者文献量(篇)国 别机 构研究活跃期(年)4Wenjing Lou8美 国伍斯特理工学院2009-20115Jian Wang6中 国东华大学科技学院2009-20116Gansen Zhao5中 国中山大学软件学院2009-20117Huan Ting-lei5中 国桂林电子科技大学计算机科学与工程学院2010 8Naixue Xiong5美 国乔治亚州立大学2009-20119Pearson,S.5英 国惠普实验室2009-201110Qian Wang5美 国伊利诺理工大学2009-2011注:同一英文名相同的作者合并进行统计,所列机構为同名作者文献量最多的作者署名机构,仅供参考。在所统计的10位核心作者中,以来自澳大利亚墨尔本大学计算机科学和软件工程学院的Buyya,R发文最多达13篇,Buyya,R全名Rajkumar Buyya,他是澳大利亚墨尔本大学计算机科学和软件工程学院副教授、云计算与分布式系统实验室主任,同时也是一家云计算企业(Manjrasoft Pty Ltd)的创始人兼执行董事,在计算机领域有着丰富的学术研究与产业化经验,由于他在学术成就和专业成就上的突出表现,曾被多个机构授予各种奖项。表3所列学者中有5位来自美国,其中的Cong Wang、Kui Ren、Qian Wang 3位学者来自伊利诺理工大学,Wenjing Lou来自伍斯特理工学院,这4位学者合作了5篇文章。来自中国东华大学科技学院的学者Jian Wang发表6篇文章,这是国内研究云计算比较深入的一位学者,该学者主要关注的是云计算数据安全和数据隐私等方面的内容。图1 著者合著网络(合作频次≥2)
利用ucinet软件对核心作者的合著文献进行可视化,结果如图1所示,从图1的著者合作网络明显看出学者之间的合作关系,其中节点的意义设置为点度数,即节点越大,表示该作者的合作者越多;连线越粗,表示连线两端的作者合作越频繁。图1中最大的一个合作团体来自伊利诺理工大学和伍斯特理工学院的Cong Wang、Kui Ren、Qian Wang、Wenjing Lou等学者。
3 期刊分析
对于一个比较成熟的学科领域来说,往往会形成80%的论文刊载在20%的期刊上的趋势。这样只要掌握了核心期刊,人们就可以用较少的时间、较经济的资源、获得较多的科学研究信息。通过统计所有刊载云计算文献的INSPEC来源期刊,既可以确定该领域的核心期刊,为研究者重点阅读提供指导,为文献管理提供依据,又可以了解各个刊物的办刊特色。由前面分析可知,本次检索的数据集中,绝大多数为会议论文,期刊论文只有312篇,通过对这部分论文的分析可知,云计算研究分布的期刊数量有147种,把载文量不少于5篇的期刊列于表4中。表4 刊载云计算文献的期刊
序号刊 名国别载文量
(篇)1Telecommun.Sci.(China)中国222Comput.(USA)美国133Information WEEK(USA)美国124IEEE Internet Comput.(USA)美国105Commun.ACM(USA)美国86Fujitsu(Japan)日本87IT Prof.(USA)美国88Cutter IT J.(USA)美国79NEC Tech.J.(Japan)日本710Appl.Res.Comput.(China)中国611IEEE Secur.Priv.(USA)美国612Netw.Comput.(UK)英国613Proc.SPIE-Int.Soc.Opt.Eng.(USA)美国614Adv.Mater.Res.(Switzerland)瑞士515EDUCAUSE Quart.(USA)美国5
表4中列出的15种期刊来自4个国家,分别是美国(9种)、中国(2种)、英国(1种)、日本(2种)、瑞士(1种),其中尤以美国的期刊引人注目,占据了所列期刊的绝大部分。刊载云计算文献最多的中国期刊《电信科学》于1956年创刊,现已成为通信领域颇具影响力和权威性的杂志,自1992年来连续5次入选中国中文核心期刊,并被科学文摘收录,该期刊刊载的22篇云计算方面的文献,主要关于云计算的概念和框架、云安全模式、云计算的现状和未来发展趋势、云计算的应用等等。
4 关键词分析
4.1 高频关键词分析
为了确定云计算领域最具代表性的研究主题,对云计算的1 179篇论文关键词进行统计。通过TDA分析软件统计,词频不低于20的关键词累计27个,共涉及文献1 148篇,占文献总量97.37%,具体分布见表5。
由表5可见,“云计算”和“因特网”2个关键词位居前列,这两个关键词共涉及了1 023篇文献,占全部文献量的86.77%。除这两个关键词外,“数据安全”是学者探讨最多的关键词,数据安全问题是云计算这种全新模式下,用户和服务商都比较关注的问题,云计算的低成本但超级计算服务功能,使入侵者只须投入极少的成本,就能获得极大的网络破译计算能力,一旦这些“云”被用来破译各表5 云计算研究高频关键词分布
序号关键词(中文译名)词频1cloud computing(云计算)6072Internet(因特网)4293security of data(数据安全)1534Web services(网络服务)935grid computing(网格计算)906resource allocation(资源分配)907software architecture(软件架构)808virtual machines(虚拟机)759data privacy(数据隐私)7010business data processing(业务数据处理)5811computer centres(计算机中心)5212computer aided instruction(计算机辅助教学)4713mobile computing(移动计算)4514Scheduling(调度)4315Authorisation(授权)4216quality of service(服务质量)3917Virtualisation(虚拟化)3618Cryptography(加密)3219ubiquitous computing(普及计算)3120information technology(信息技术)2821parallel processing(并行处理)2622service-oriented architecture(面向服务架构)2323distributed processing(分布式处理)2224open systems(开放式系统)2125information retrieval(信息检索)2026public domain software(公用软件)2027storage management(存储管理)20
类密码、进行各种攻击、修改访问权限,将会对“云”上的数据安全造成极大危险,与此相关的关键词还有数据隐私、加密、授权等等。云计算既然是一种网络服务模式,那不得不考虑服务的质量问题,因此网络服务和服务质量这两个关键词也被学者频频提出。如美国圣母大学的Yi Wei等人在《面向服务的计算和云计算带来的机遇和挑战》(Service-Oriented Computing and Cloud Computing:Challenges and Opportunities)一文中作者探讨了面向服务的计算和云计算的关系,尽管面向服务的计算在云计算环境下遇到了挑战,但是作者认为两者的结合还是有潜在的变革机会的。学者除了关注以上问题外,探讨最多的是云计算的技术和应用问题,如网格计算、并行计算、软件架构等,如浙江大学的吴吉义等人在《云计算:从概念到平台》(Cloud Computing:Concept and Platform)一文中提出,云计算是以虚拟化技术为基础,以网络为载体提供基础架构、平台、软件等服务为形式,整合大规模可扩展的计算、存储、数据、应用等分布式计算资源进行协同工作的超级计算模式。作为一种全新的互联网应用模式,云计算将成为未来人们获取服务和信息的主导方式。针对當前云计算概念混杂的现状,提出了一个较综合的参考性定义,并分析了云计算与分布式计算、网格计算、并行计算、效用计算等相关计算形式的联系与区别。对目前主流的云计算平台实例进行了概括性介绍,从云平台的层次更深刻地剖析云计算的本质。
4.2 关键词共现网络
云计算研究领域词频不低于5的关键词共142个,累计涉及文献1 171篇,占文献总量的99.32%。为更加清晰和直观说明国际云计算研究的重点,利用频次和共现频次超过5次的关键词进行共词分析和知识图谱绘制,获得云计算研究领域的知识网络结构全景图,以清晰地梳理出云计算研究的热点主题以及主题内部的知识结构。结果如┩迹菜示。节点大小表示点度数大小、连线粗细表示共现次数多少。图2 关键词共现网络(词频≥5,合作频次≥5)
由图2可见,云计算研究领域关键词共现网络主要形成了两个核心知识网络,这两个核心知识网络分别是以“云计算”和“因特网”这两个高频关键词为中心而形成的。除了两个核心知识网络外,还有一些小的知识网络如数据隐私、网格计算、数据安全、软件架构、虚拟机、数据处理、网络服务、资源分配、授权、加密、计算机中心、计算机辅助教学等。
5 结束语
根据上述对科学文摘中云计算研究领域文献的定量分析,可以看出,从2008年至今,国际云计算研究领域经历了飞跃发展的过程,该领域的研究队伍已经具有相当的规模,形成了固定期刊群,并以云计算和因特网为中心形成核心知识网络。
云计算是一个新的事物,同任何新的事物的一样,它的前景都具有不确定性。也许它能够像计算机或因特网一样彻底改变我们的生活,也许它会很快烟消云散。总体上讲,云计算领域的研究还处于起步阶段,缺乏统一明确的研究框架体系,尚存大量未明晰和未解决的问题,研究意义和价值不言而喻。现有研究多集中于云体系结构、云存储、云数据管理、虚拟化、云安全、编程模型等技术,云计算领域尚存大量开放性问题有待诸多学者作进一步探讨。
参考文献
[1] 李德毅,陈桂生,张海粟.云计算热点问题分析[J].中兴通讯技术,2010,16(4):1-4.
[2]唐红,徐光侠.云计算研究与发展综述[J].数字通信,2010,(6):23-28.
[3]沈奎林,杜瑾.LISA数据库中关于云计算文献的定量分析[J].科技情报开发与经济,2010,20(25):1-4.
[4]INSPEC[EB/OL].http:∥thomsonreuters.com/productszservices/science/sciencezproducts/a-z/inspec/,2011-11-16.
[5]INSPEC[DB].http:∥apps.isiknowledge.com/INSPECzGeneralSearchzinput.do?highlightedztab=INSPEC&product=INSPEC&lastzprod=INSPEC&searchzmode=GeneralSearch&SID=2Cn8kNG48iC@IKF@C1C,2011-11-16.
[6]Yin GD,Wei H.Cloud computing:a method to realize conceptual computing[J].Journal of Southeast University(Natural Science Edition),2003,33(4):502-506.
[7]Waldrop,MM.Data center in a box-A shipping container stuffed with servers could usher in the era of cloud computing[J].SCIENTIFIC AMERICAN,2007,297(2):74-77.
[8]Wall DP,Kudtarkar P.,Fusaro VA.,et al.Cloud computing for comparative genomics[J].BMC Bioinformatics,2010,(11):259-270.
[9]Zhang YY,Guan LT.Cloud Computing Assisted Instructions in China[A].Proceedings of the 2010 International Conference on Educational and Information Technology(ICEIT 2010)[C].2010,(2):438-440.
[10]Wang HQ,Zhao DM,Kong J.Library knowledge sharing based on Cloud computing[A].2010 2nd International Conference on Software Technology and Engineering(ICSTE 2010)[C].2010,(1):424-427.
[11]Zhou PL,Mei WF,et al.The analysis of GIS software engineering pattern under the cloud computing environment[A].Proceedings of the 2010 International Conference on Educational and Information Technology(ICEIT 2010)[C].2010,(2):450-452.
[12]Yi W,Blake MB.Service-Oriented Computing and Cloud Computing:Challenges and Opportunities[J].IEEE Internet Computing,2010,14(6):72-77.
[13]Wu JY,Ping LD,Pan XZ,et al.Cloud Computing:Concept and Platform[J].Telecommunications Science,2009,25(12):23-30.
[14]范并思.云计算与图书馆:为云计算研究辩护[J].图书情报工作,2009,53(21):5-9.