基于知识图谱的云计算技术研究现状与分析
2020-07-26潘玉珠贾文丽徐方全曲绍燕
潘玉珠 贾文丽 徐方全 曲绍燕
摘 要:为更清晰地了解国内云计算技术研究现状,以云计算为检索词,选取CNKI数据库中云计算领域近14年(2006-2019年)共5 623篇相关文献为数据源,采用文献计量学方法,借助CiteSpace绘制知识图谱。通过对发表时间、文献作者、科研机构、关键词等进行可视化分析得出结论:①该领域文献发表量虽趋于平稳,但仍维持在较高水平;②文献发表以多人合作形式为主,部分研究机构联系密切;③研究热点集中在大数据、虚拟化、物联网、负载均衡、任务调度等领域;④与人工智能结合是未来研究方向。
关键词:云计算;CiteSpace;可视化分析;知识图谱
DOI:10. 11907/rjdk. 201434 开放科学(资源服务)标识码(OSID):
中图分类号:TP301文献标识码:A 文章编号:1672-7800(2020)007-0267-04
An Analysis of the Current Situation of Cloud Computing Technology Based on Knowledge Map
PAN Yu-zhu1,JIA Wen-li2,XU Fang-quan2,QU Shao-yan2
(1. College of Computer Science and Engineering, Shandong University of Science and Technology;
2. Archives of Shandong University of Science and Technology, Qingdao 266590, China)
Abstract:In order to have a clearer understanding of the domestic research status of cloud computing technology,the article uses“cloudcomputing”as a search term , and selected a total of 5623 related literature in the field of cloud computing in the CNKI database for the past 14 years (2006-2019) as the data source, knowledge mapping with the help of CiteSpace by the method of bibliometrics.Through visual analysisof publication time, literature authors, scientific research institutions, keywords, etc., the following conclusions are drawn:(1) Although the number of publications in this field tends to be stable, it still remains at a high level; (2)The publication is mainly in the form of multi-person cooperation, and some research institutions also maintain close contact; (3) Research hotspots mainly focus on big data, virtualization, Internet of Things, load balancing, task scheduling, etc.; (4) The future research directionwill change to the combination with artificial intelligence.
Key Words:cloud computing ;CiteSpace; visual analysis;mapping knowledge domain
0 引言
2019年10月12日,國务院发展研究中心发布《中国云计算产业发展与应用白皮书》(以下简称《白皮书》)。据《白皮书》介绍,我国云计算作为支撑企业数字化转型的核心基础设施,与新一代信息技术融合效应已经逐渐显现,“5G+云+AI”组合正逐步成为推动数字经济发展的重要引擎[1]。
云计算技术作为满足用户特定需求的远程资源池技术[2],应用场景有云服务器、政务云、金融云等。自2006年8月谷歌公司首席执行官施密特首次提出云计算概念以来[3],云计算技术以日新月异的速度发展,广泛应用在互联网、金融、医疗、运输、教育等行业,成为专家学者研究热点[4]。为准确把握云计算技术研究发展历程与研究动态,本文将中国知网(CNKI)数据库中的相关文献作为数据源,运用CiteSpace绘制知识图谱,力求生动形象地展现该领域文献发表时间分布、科研单位、文章作者以及重点研究方向,厘清脉络轨迹,为相关研究人员提供参考。
1 信息检索与处理
本文相关信息全部取自CNKI文献库,运用文献计量学方法,借助可视化引文分析软件CiteSpace[5]定量分析云计算技术研究近况。为保证检索全面,构造检索式为:篇名=“云计算或关键词=云计算”。云计算概念始于2006年,故检索时间跨度设置为2006-2019年。选取SCI、EI、中文核心期刊、CSSCI、CSCD,下载并保存相关题录及引文信息,检索到相关期刊文献5 973条,采用去重软件以及人工查重,逐条剔除无效文本数据,最终选取5 623条文献,以Refworks格式导入本地,利用CiteSpace将引文信息格式化,然后设置参数并运行程序,构建相应知识图谱[6]。
2 研究现状分析
2.1 研究年代分布
以年为单位,对所有检索文献进行统计,生成发表量变化折线图,如图1所示。
从发文时间可以看出,国内第一篇与云计算技术有关的论文发表于2008年,之后论文发表量维持较快上升速率,其中增长最快的是2012年,较前一年增加270篇。究其原因与2012年工业和信息化部电信研究院首次发布《云计算技术白皮书》[7]有关。2013年迎来文献发表量巅峰,峰值881篇。之后相关文献发表量渐趋平稳,较前一年份呈现下降趋势,但整体上发文数量仍保持较高数量,云计算技术研究依旧处在快速发展进程中。
2.2 研究机构分布与联系
按照文献计量学理论,研究机构在某研究方向上的发文数量显示该机构在这一领域科研实力的强弱[8]。对2006-2019年云计算领域中发文数量较多的科研机构统计,时间为一年,节点采用“TopN”(N=50)标准,启动CiteSpace绘制图谱如图2所示。
在研究机构共现图谱中,出现频率较高的单位有南京邮电大学,其下设有省级大数据安全与智能处理重点实验室、高性能计算与大数据处理研究所及计算机技术研究所等,在云计算情境下的任务调用[9]、QOS[10]、隐私保护[11]、可信计算[12]、对等计算、数据折叠、并行加密[13]等领域进行了系统研究。武汉大学信息管理学院所属图书馆、情报与档案管理一级学科是国家一级重点学科,在数字图书馆、学术信息资源共享等方向研究团队实力强,文献发表量大。此外,该校计算机学院云计算研究也颇为活跃。清华大学作为我国顶尖科研院校,其计算机科学与技术系在云计算研究领域成果斐然,研究方向包括雾计算[14]、边缘计算、虚拟化技术[15]和大数据等。此外,校校合作、校企合作、企企合作成果值得关注,如清华大学计算机系与东北大学信息科学与工程学院、北京科技大学计算机与通信工程学院、解放军信息工程大学、西安科技大学计算机科学与技术学院等院校沟通合作密切;华南理工大学计算机科学与工程学院与中国电信股份有限公司合作,在云计算领域开展一系列研究与创新;中国电信上海研究院与广东研究院等机构组成研发体系,在云呼叫中心、动态分配、物联网、云服务提供商等领域进行广泛深入合作。校企合作既可充分发挥高校理论研究优势,又可解决企业实际应用中的复杂问题,有效推动云计算技术进步。
2.3 文献作者分布与联系
统计2006-2019年每个4年区间有过合作关系的作者,运行CiteSpace构建知识图谱,结果如图3所示。从图中可以看出,云计算技术领域关系网络中处在中心位置的有陈臣、马晓婷、邓仲华、张云勇、马剑锋、于炯等权威作者。
图3中节点大小表示作者出现的频次,按时间片进行分隔,两个节点的连线代表两位作者合作的密切程度。兰州商学院陈臣和马晓亭2011-2014年一直保持着高水平文献产出量,其研究集中在数字图书馆和资源管理等方面。武汉大学信息管理学院邓仲华在图书馆云服务质量等领域也有深入研究, 2010-2014年他与陆颖隽、李志芳多次合作,完成多篇文献。西安电子科技大学网络与信息安全学院马剑锋和熊金波,2013-2014年一直致力于研究云计算环境下的安全问题,包括用户认证、签名、访问控制等方向,为安全可靠使用云服务提供保障[16]。新疆大学于炯、杨兴耀、廖彬在云环境下任务调度领域做出成绩。发文量较多的还有中国联通研究院张云勇团队、南京邮电大学徐小龙团队,以及华北电力大学王德文团队等。正是这些学者不懈努力,推动我国云计算技术不断发展。
2.4 重点研究方向分布
关键词是文章主旨的集中体现,在文献统计中出现频率较高的关键词往往揭示该领域重点研究方向。随着时间推移,研究热点也会不断变化。本文采用关键词词频统计法和关键词共现法发掘云计算领域重点研究方向[17]。选取2006-2019年作为时间区间,针对每年节点采用TopN(N=30)选择标准,并对图谱设置自动修剪,采用CiteSpace构建图谱如图4所示。
为使图谱便于观察,隐藏本文研究的中心节点“云计算”,将频次最高的前20个关键詞整理在表1中。
从表1可以看出,知识图谱出现频次较多的两个节点有大数据和虚拟化,分别是322次和205次,热点主要集中在以下几个方面:
(1)大数据。与大数据共现频次较高的关键词有资源共享、电子政务以及人工智能。中国人民大学信息学院孟小峰[18]在《大数据管理:概念、技术与挑战》一文中指出,数据从简单的处理对象开始转变为一种基础性资源,如何更好地管理和利用大数据已经成为普遍关注的课题。
(2)虚拟化。虚拟化技术是云计算的基础,虚拟化技术将应用程序及其运行的上下文环境包装成一个整体,用户不必关心应用程序与计算机底层交互,一台物理机器可能有多个这样的整体,以便能够使应用程序的部署、扩展、迁移变得方便可靠[19]。
(3)任务及资源调度。云计算环境下云服务器往往需要进行大量计算,而服务器资源有限,为高效利用这些资源,就要对资源调配方法展开研究。四川大学计算机学院李建锋[20]提出一种基于改进遗传算法的任务调度算法,能实现在较短周期内完成任务调度。
(4)分布式计算。分布式计算是将一个任务切分为多个子任务并分配给不同机器进行计算,最后将处理结果进行统一的技术,可解决单台机器资源不足问题。
为了对未来研究趋势作出预测,将关键词共现知识图谱转换成时间线视图模式,可以更清晰地观察随时间变化的研究热点情况,如图5所示。
从图5可以看出,自2018年以来,云计算与人工智能联系逐渐密切[21]。人工智能本质是对数据的挖掘、训练和推理预测。为取得更加准确的预测结果,通常需要经过大量的数据运算,而云计算解决的问题就是如何更好地提供更大数据量计算,这恰巧为人工智能发展奠定了坚实基础。与此同时,人工智能发展也促进云计算进步,借助人工智能技术,云计算可以更好地实现资源及任务调度,提高资源利用率。
3 结语
本文借助CiteSpace工具,结合统计学相关理论,通过可视化方法分析了我国云计算研究领域年代分布、主要科研机构、文献作者及主要研究内容分布情况。近10余年我国在云计算方面投入巨大,获得了令人满意的成果。
基于本文分析,笔者认为云计算技术未来发展趋势如下:
(1)校企合作逐步走向深入。目前国内云计算技术研究以单所高校和校校合作为主,难以适应市场对云计算技术发展需求。校企合作可结合高校与企业自身资源优势,利用知识共享达到双赢,这种理论与实践相结合的理念必将成为高校与企业的共识。
(2)云计算与人工智能技术不断融合。云计算与人工智能技术相辅相成。作为我国新时期重点发展的两项信息技术,人工智能发展让云计算变得更加智能,云计算进步又反作用于人工智能,为人工智能提供更加快速可靠的算力。因此,积极促进二者结合,将对我国生产力发展起到极大的推动作用。
参考文献:
[1] 金融科技时代编辑部. 国务院发展研究中心发布《中国云计算产业发展与应用白皮书》[J]. 金融科技时代,2019,18(11):94-101.
[2] 黎春兰,邓仲华. 云计算环境下的信息资源共享研究[J]. 中国信息界,2011,25(12):66-70.
[3] 邹徐熹. 云计算下的(m+1,t+1)门限秘密共享研究[D]. 合肥:合肥工业大学, 2017.
[4] BHAGWAN SINGH,SUMEET DHAWAN,ANISH ARORA,et al. A view of cloud computing[J]. International Journal of Computers & Technology,2013, 4(2b1):50-58.
[5] 李杰,陈超美. CiteSpace:科技文本挖掘及可视化[M]. 北京:首都经济贸易大学出版社,2016.
[6] 陈悦. 引文空间分析原理与应用[M]. 北京:科学出版社,2014.
[7] 工业和信息化部电信研究院. 《云计算白皮书》选编[J]. 数据通信,2012,11(4):124-129.
[8] 邱均平,方国平. 基于知识图谱的中外自然语言处理研究的对比分析[J]. 现代图书情报技术, 2014,32(12):261-268.
[9] BELGACEM A,BEGHDAD BEY K,NACER H. Task scheduling in cloud computing environment: a comprehensive analysis[M]. Advances in Computing Systems and Applications,2019.
[10] FILHO F L D C,ROCHA R L,ABBAS C J B,et al. QoS scheduling algorithm for a Fog IoT gateway[C]. 2019 Workshop on Communication Networks and Power Systems (WCNPS),2019.
[11] HUANG X A. Study of personal information security and privacy protection based on big data[J]. Journal of Modern Information,2018,56(2):1120-1129.
[12] GOVINDARAJ P,NATARAJAN J. Trusted computing in social cloud[J]. International journal of reasoning-based intelligent systems, 2018, 10(3-4):212-218.
[13] LIU B,BAAS B M. Parallel AES encryption engines for many-core processor arrays[J]. IEEE Transactions on Computers,2013,62(3):536-547.
[14] RAZZAQ S,WAHID A,KHAN F,et al. Scheduling algorithms for high-performance computing: an application perspective of Fog computing[M]. Recent Trends and Advances in Wireless and IoT-enabled Networks,2019.
[15] ZHIGE L,CHUNMEI L I,XIAOLIN P I. Research on the security of cloud computing virtualization platform[J]. Modern Information Technology, 2018,66(5):201-220.
[16] 熊金波,李鳳华,王彦超. 基于密码学的云数据确定性删除研究进展[J]. 通信学报,2016,15(8):167-184.
[17] 于文超. 国内图书情报领域物联网研究与应用进展[J]. 图书馆工作与研究, 2018, 17(6):71-78.
[18] 孟小峰,慈祥. 大数据管理:概念、技术与挑战[J]. 计算机研究与发展,2013,50(1):146-169.
[19] 何国民,王代君. 基于虚拟化技术的云服务平台的构建与管理[J]. 电脑知识与技术,2016,15(23):156-159.
[20] 李建锋,彭舰. 云计算环境下基于改进遗传算法的任务调度算法[J]. 计算机应用, 2011,31(1):184-186.
[21] 叶舒,严威川. 人工智能:改变世界的“原力” [J]. 信息安全与通信保密, 2016,26(12):94-109.
(责任编辑:杜能钢)