2011-2020年国内电子信息科学领域研究热点与主题演化可视化分析
2021-07-19李慧妍
李慧妍
摘要:近年来,我国电子信息科学领域研究发展迅速,电子信息科学类学科的研究成果显著。本文通过分析电子信息科学领域的研究热点、主题演化趋势,为研究者及时把握学科发展动向,紧跟学术前沿,加强交流合作提供参考。该文以国内十种电子信息科学领域的核心期刊在2011-2020年间刊发的论文为数据源,采用文献计量分析、VOSviewer绘制知识图谱等方法对相关数据进行统计与分析,进而探究此领域的研究热点以及主题演化趋势。研究发现,电子信息科学领域近十年的研究热点主要包含无线传感器网络、云计算、深度学习、遗传算法和压缩感知等主题;根据同质性差异和共现次数,可以将电子信息科学领域的研究主题聚类为六大簇,分别以无线传感器网络、云计算等为中心点;2011-2020年电子信息科学领域的理论、技术研究经历了从发展到完善,不断探究新理论、新技术的过程,隐私保护、深度学习等将成为未来一段时间内的研究热点。
关键词:电子信息科学;文献计量学;知识图谱;研究热点;主题演化;VOSviewer
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2021)13-0224-03
1引言
电子信息科学是涉及电子科学、通信和计算机技术等多学科交叉的综合性研究领域,包含信息安全、微电子学、光信息科学与技术和电子信息科学与技术等具体专业。近年来,我国电子信息科学领域的研究发展迅速,但仍有较大的进步空间。及时把握领域研究的发展动向,洞察研究热点的演化趋势,对科研人员明晰研究方向具有参考意义。
罗宇文(2013)[1]提出电子信息技术在不同领域的技术需求差别很大, 这些应用特点决定了各自的发展方向。在微电子技术高集成化发展方向中,他指出采用纳米集成技术的arm、fpga、asic、dsp等嵌入式产品在电子产品中得到了广泛应用。
张璇,苏楠等(2012)[2]以2000-2011年Web of Science数据库收录的3000篇国际电子政务研究文献为样本,利用CiteSpace和VOSviewer绘制出科学知识图谱,将国际电子政务研究归为电子政务技术应用创新研究、电子政务管理实践研究、电子政务用户服务研究三个大类。李跃艳,王昊等(2020)[3]以SIGIR年会2008-2019年的录用论文为数据源,采用Python中的工具包构建LDA模型并生成主题,并使用Gephi软件分析了近十年信息检索领域研究主题的演化路徑。文献计量学、知识图谱等方法在不同学科领域知识发现、主题演化、热点探析等方面有较广泛的应用。
目前,关于电子信息科学领域发展的研究很多,但大部分关注电子信息学科的实践应用特点和专业课程体系和人才培养模式,且停留在较为宏观的层面上,对电子信息科学的发展方向和研究热点的研究较少。因此,本文以国内电子信息科学领域核心期刊近十年录用的论文为数据源,通过文献计量分析、大数据处理技术、VOSviewer可视化等方法对研究热点、研究主题的演化趋势以及合作者的特征进行深入研究,为科研人员选择研究方向、了解研究前沿提供参考。
2数据来源与研究方法
本文数据来源是中国知网(CNKI),它提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类等多种数据库,内容丰富,数据准确。参考电子信息科学综合专题分类,选取电子信息科学领域影响力较大的十种核心期刊(见表1),以期刊名为文献来源进行检索,共检索出95568篇文献,选取其2011-2020年发表的35853篇文献作为本文的数据源,数据采集时间为2021年1月11日。
采用文献计量分析方法对文献数据进行统计分析,利用VOSviewer绘制关键词共现图谱,分析电子信息科学领域的研究热点和主题演化趋势。
3结果分析
3.1研究热点分析
3.1.1 高频关键词
关键词出现的次数越多,与之相关的研究就越多。通过词频统计软件分析,发现出现频次≥5次的有效关键词4460个,出现总频次超过6.2万余次。表2为前50位的高频关键词列表,这些高频关键词是2011-2020年间电子信息领域的代表性术语。出现频率较高的关键词分别是无线传感器网络558次、云计算439次、深度学习431次、遗传算法389次、压缩感知348次。
其中,无线传感器网络是一项通过无线通信技术把数以万计的传感器节点以自由式进行组织与结合进而形成的网络形式,在环境监测、军事、医疗护理等领域有广泛应用;从广义上来看,云计算是与信息技术、软件、互联网相关的一种服务,是继互联网、计算机后在信息时代的又一革新;深度学习是机器学习领域中一个新的研究方向,它是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像等数据的解释有很大的帮助。它是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远超先前相关技术。
3.1.2 关键词共现分析
使用VOSviewer软件对电子信息科学领域十种核心期刊在2011-2020年间的发文数据进行分析,每个颜色分别代表一个聚类,每个圆圈代表一个关键词,圆圈大小代表关键词频数,圆圈越大、字体越大表明该关键词出现次数越多。关键词之间的线段代表彼此之间的共现强度,强度越大,线段越粗。关键词含义越接近,彼此之间连线越短。选取论文关键词中的术语条目,设置最少出现次数为50,从1000个术语中筛选出172个高频术语显示在地图上,得到关键词共现可视化视图,结果如图1所示:
对期刊论文的关键词进行共现分析可以揭示该领域的研究热点[4]。根据图谱中关键词同质性差异、共现次数和关键节点的信息,将2011-2020年电子信息科学领域的研究聚类为六个簇,簇中心点分别为:无线传感网络、云计算、深度学习、遗传算法、压缩感知、隐私保护。表3列出了中心点在关键词共现图谱中的连线次数(Links)、共现次数(Occurrences)、共现强度总计(Total link strength)以及中心点所在的簇主要包含的对象。
由图1和表3可知,2011年-2020年间电子信息科学领域的研究热点主要分为六大类:第一类是以无线传感器网络为中心点的研究,主要涉及网络编码、物联网、认知无线电、协作通信、安全、路由算法、博弈论等研究主题,无线传感网络一词作为关键词共现的次数为559次,是电子信息科学领域学者关注较多的研究热点;第二类是以云计算为中心点的研究,主要涉及大数据、虚拟化、云存储等研究主题;第三类是以深度学习为中心点的研究,卷积神经网络、机器学习、人工智能、迁移学习、图像分类等都与深度学习有较大关联,且近年来,深度学习在搜索技术、机器学习、机器翻译、自然语言处理,多媒体学习、推荐和个性化技术等相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步;第四类是以遗传算法为中心点的研究,遗传算法(Genetic Algorithm,GA)最早是由美国的 John holland于20世纪70年代提出,是一种通过模拟自然进化过程搜索最优解的方法。该算法利用计算机仿真运算,将问题的求解过程转换成类似生物进化中的染色体基因的交叉、变异等过程[5]。遗传算法现如今已被人们广泛地应用于信号处理、组合优化和自适应控制等领域;第五类是以压缩感知为中心点的研究。压缩感知理论一经提出,就引起学术界和工业界关注,与信息论、图像处理、地球科学、模式识别、无线通信等方面的研究结合紧密;第六类我以隐私保护为中心点的研究,主要与社会网络、数据挖掘、推荐系统等研究热点关联较大。在电子信息快速发展的背景下,大众的个人信息有很大一部分都是通过电子形式进行存储,因此,个人隐私保护也成为当前电子信息科学领域关注的重要问题。
3.2 主题演化分析
使用VOSviewer软件对选取的十种期刊在2011-2020年所有发文数据进行分析,提取关键词,设置最少出现次数为50,筛选出172个高频术语,得到关键词叠加可视化图谱(见图2),从而探究研究主题的演化路径。从2011-2020年间的关键词演化来看,研究主题呈从中心向边缘扩散的趋势,且研究热点的平均出现年份集中在2013-2018年。
2011-2013年,研究主题主要有无线传感器网络、网络编码、协助通信和信号处理等,网络编码技术应用于无线通信、无线传感器网络中基于网络编码的协助通信等研究均体现了研究热点关键词间的联系。此后,关注点逐渐转向云计算、遗传算法和压缩感知相关研究。
2014-2015年,研究热点主题主要分为三个部分:以云计算为中心的技术与应用、以遗传算法为热点的优化算法和以压缩感知为主的信号处理技术。云计算与云存储、物联网、密码学、信息安全访问控制的相关研究较多,同时,与计算与另一研究热点主题,遗传算法的关联极为密切。此阶段与遗传算法共现次数较多的关键词有粒子群优化、粒子滤波、支持向量机、聚类、petri网和粗糙集。压缩感知与无线传感器网络之间连线的强度較大,且无线传感器网络为2014年的研究热点,压缩感知在2015年受到的关注最多。分析可知,无线传感器网络提高了人们远程交互的能力,成为研究的热点,但是该项技术存在信号传输困难,传感器节点单价高等问题,实际应用价值较低。但是,新兴压缩感知理论为数据采集理论带来了革命性突破,在无线传感网络的应用使得无线传感网络中多数问题得以解决。因此,压缩感知与无线传感网络的关联性较强,且出现在无线传感器网络研究热潮之后。
2016-2018年,研究热点主要分为隐私保护为主的社会网络研究和以深度学习为主的新兴研究点,且隐私保护作为关键词的平均出现年份在2016年,深度学习作为关键词的平均出现年份在2018年。与隐私保护连线强度较大的关键词有2014年的热点关键词云计算、遗传算法、物联网,以及2014年的热点关键词无线传感器网络。隐私保护作为中心点,其聚类簇中包含区块链、数据挖掘、差分隐私、推荐系统、大数据、边缘计算等对象,且簇中对象出现的年份平均在2016-2017年。深度学习属于机器学习的子类,灵感来源于人类大脑的工作方式,是利用深度神经网络来解决特征表达的一种学习过程。与深度学习连线强度大的关键词有机器学习、神经网络、卷积神经网络,且平均出现年份在2018年之前,与之同年份关联度大的关键词有迁移学习、卷积神经网络、深度神经网络和自然语言处理。
4结语
对电子信息科学领域的研究热点和主题演化进行分析,可以为这一领域的学者提供一个全面的视角,为开展新的研究和选题都有一定的参考价值。本文选取了电子信息科学领域影响力较大的十种核心期刊,并以其2011-2020年刊载的所有论文作为数据源,主要采用文献计量学、知识图谱等方法对近十年电子信息科学领域的研究热点及主题演化趋势与内容特征进行分析。首先通过词频统计软件对发文关键词进行统计分析,然后利用VOSviewer绘制关键词共现图谱和叠加可视化图谱,对研究热点进行聚类分析,并逐年探究了电子信息科学领域的研究主题演化。结果显示,电子信息科学领域的研究热点包含无线传感器网络、云计算、深度学习、遗传算法、压缩感知等理论和技术。通过关键词共现图谱,可以将近十年的研究热点聚类为六大簇,分别以无线传感器网络、云计算、遗传算法、压缩感知、隐私保护和深度学习为簇的中心点,每个簇中的对象关联紧密,多为研究同一方向的技术和方法。叠加可视化视图充分体现了研究主题的演化趋势,2011-2013年的研究热点是无线传感器网络、协助通信等方向,2014-2015年主要包括云计算、云存储相关研究和遗传算法、优化相关研究两个方面的研究热点。2016-2018年主要分为隐私保护、深度学习两个方面的研究热点,根据发文趋势预测,隐私保护、深度学习等将成为未来一段时间内的研究热点。以数字化、网络化、智能化为特征的信息化浪潮方兴未艾,信息技术日新月异,与各行业的融合不断加深,电子信息科学在信息化、网络安全、网络与通信等方面将有更为长远的发展。
本研究仅根据国内的期刊论文对研究热点和主题演化进行探析,未涉及国际电子信息科学领域的发展状况。下一步可以通过扩大、更新数据源,进而对国内和国际的研究热点进行对比分析,从而更清晰地掌握电子信息科学的发展脉络。
参考文献:
[1] 罗宇文.探究电子信息技术的应用特点和发展方向[J].通讯世界,2013(9):23-24.
[2] 张璇,苏楠,杨红岗,等.2000—2011年国际电子政务的知识图谱研究——基于Citespace和VOSviewer的计量分析[J].情报杂志,2012,31(12):51-57.
[3]李跃艳,王昊,邓三鸿,王伟.近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J].数据分析与知识发现,2020:14.
[4] 马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,25(2):163-171.
[5] 郑树泉,王倩,武智霞.工业智能技术与应用[M].上海:上海科学技术出版社,2019:250-251.
【通联编辑:朱宝贵】