我国智能优化算法的研究现状
——基于CiteSpace的可视化分析
2023-05-08陈丹妮赵剑冬邓熊娜
陈丹妮 赵剑冬 邓熊娜 黄 鹏
(广东技术师范大学计算机科学学院 广东 广州 510665)
0 引 言
近年来,人工智能开始进入国家战略规划。智能优化算法作为人工智能的分支,主要指模拟自然界的现象规律或者生物种群的社会生活而提出计算方法,典型的智能优化算法包括遗传算法、粒子群算法、模拟退火算法、蚁群算法、差分进化算法等。智能优化算法为许多复杂困难问题的求解提供了可行有效的策略,已经受到越来越多的关注[1]。然而,目前尚未发现关于我国智能优化算法研究现状的可视化知识图谱分析。在此背景下,本文借助文献分析工具CiteSpace,对中文核心期刊上与智能优化算法相关的研究文献进行可视化分析,旨在为该领域研究工作者提供参考。
1 数据来源与研究方法
1.1 数据来源
本研究以中国知网CNKI学术期刊全文数据库为数据来源,运用CNKI的高级检索功能,在中文核心期刊来源下,以“智能优化算法”“智能优化”或“优化算法”为关键词,时间段设置为2000年至2020年,共检索到3 682记录。检索时间为2020年5月27日,检索表达式为“关键词=智能优化算法OR关键词=优化算法OR关键词=智能优化AND年Between(2000,2020)AND核心期刊=Y(精确匹配)”。在此基础上,剔除重复数据、组稿方向以及专题导读等无关文献,共选取3 672篇中文核心期刊文献作为研究样本。
1.2 研究方法
本研究使用的文献分析工具为CiteSpace。这是一款对文献进行分析和可视化的工具[2]。本研究使用CiteSpace5.1R6版本作为研究工具,处理条件为:时间区间设置为2000年至2020年;时间切片设置为3年;对象数据之间的连接强度设置为Cosine类型;分析数据的阈值为Ntop=50。节点类型依次选择keyword、author、instruction进行共现分析,最终生成相关知识图谱。其中,在对关键词共现分析时,采用LLR对数似然率对关键词进行聚类分析。
2 智能优化算法研究的态势分析
2.1 发文量分析
图1显示了自2000年以来智能优化算法研究文献在中文核心期刊每年发文量和累计发文量的变化趋势。不难看出2000年以来我国智能优化算法研究在核心期刊的发文量整体上处于一个稳中有进的状态。其中,2000年—2006年处于一个快速发展阶段,2006年之后增速稍有减弱,但依旧有所增长;2007年—2008年以及2016年—2017年的发文量有较为明显的上升。此外,中国知网预测该领域在2020年度的中文核心期刊发文量将达到333篇,说明智能优化算法研究领域仍处于持续增长阶段。
图1 中文核心期刊智能优化算法研究发文量变化图
2.2 文献期刊来源分析
本研究样本的3 672篇文献来源于585个不同中文核心期刊,每个期刊的平均发文量约为6篇,发文量达40篇及以上的期刊有12个,具体见表1。其中《计算机工程与应用》的发文量最高,2000年以来共出刊了142篇关于智能优化算法研究论文。除了发文量可以体现出每个期刊在该领域下的重要性和影响力。目前,在评价期刊学术影响力方面,被引频次通常被作为重要的评价指标[3],学术影响力与被引频次呈正相关[4]。因此,表1列发文量最高的12个期刊的同时,也展示该期刊上智能优化算法相关研究的每篇文献平均被引率。
从表1中的数据可以得知,除了《计算机工程与应用》期刊外,《计算机应用研究》《计算机工程》《计算机应用》《计算机科学》等期刊的发文量也不少。此外,《电子学报》《控制与决策》《系统仿真学报》《系统工程与电子技术》这四个期刊每篇智能优化算法相关研究文献的被引率是名列前茅的。因此,可以说明这几个期刊在对智能优化算法领域研究方面的重要性和影响力也是较大的。
2.3 发文机构分析
对发文机构的分析主要依靠CiteSpace工具,将节点类型设置为“instruction”进行运算分析。得出的知识图谱(见图2)中有387个节点和105条连线,网络密度为0.001 4,可见机构间的合作度较低。
图2 智能优化算法研究机构分析图
其中,上海理工大学管理学院以54篇的发文量居首,中国科学院大学、河南师范大学计算机与信息工程学院、中南大学信息科学与工程学院、东北大学信息科学与工程学院、华东理工大学信息科学与工程学院等紧随其后,是目前国内智能优化算法研究领域的主力军。在对智能优化算法研究方面,上海理工大学管理学院的发文量多于高校的计算机类学院,并且位居榜首的主要原因在于其教师团队中,马良和刘勇等学者在智能优化方面的深入研究和探索。其中马良在本研究的文献样本中,发文量位居榜首。
2.4 研究学者分析
对研究学者的分析主要依靠CiteSpace工具,将节点类型设置为“author”进行运算分析。得出的知识图谱(见图3(a))中有621个节点和466条连线,网络密度为0.002 4,可见作者间的合作度也并不高,但作者间的合作高于机构间的合作。从作者网络图中可以看出目前我国该领域的研究学者大部分处于单打独斗的情况。与此同时,也形成一些比较有代表性的合作群。例如,河南师范大学计算机与信息工程学院的张新明、窦智、刘尚旺、刘国奇、康强等学者(见图3(b));中南大学信息科学与工程学院的桂卫华、吴敏、李明、阳春华、王勇等学者(见图3(c));上海理工大学管理学院的马良和刘勇等学者;中国科学院成都计算机应用研究所的王鹏和王辉等学者;沈阳建筑大学的侯祥林和贾连光等学者。
(a)
(b) (c)图3 智能优化算法研究作者分析图
2.5 主要文献分析
表2展示了在本研究样本3 672篇中文核心期刊文献中,被引频次前十篇文献的信息。
表2 被引频次Top10的文献
其中,陈海焱等[5]学者在传统粒子群算法中引入了下降搜索算子,提高例子的收敛速度和精度并将其应用到动态经济调度问题上。刘书雷等[6]学者提出了一种基于多目标遗传算法的QoS全局最优服务动态选择算法,从全局最优的角度把服务动态选择问题转化为一个带QoS约束的多目标服务组合优化问题,有效地解决了局部最优方法的不足。彭喜元等[7]学者以蚁群算法和粒子群算法作为群智能理论的代表,阐述了这两种典型算法的基本原理和研究现状。张丽平等[8]学者从数学角度在传统粒子群算法的基础上提出随机惯性权重选择策略,以此增强算法的全局搜索能力。针对粒子群算法容易早熟陷入局部最优的缺陷,胥小波等[9]学者在粒子的运动过程中融入混沌,让粒子群在稳定和混沌之间不断交替从而逐步趋向最优,这极大地提高算法的全局寻优能力。在解决估计前向神经网络隐含层神经元数目问题上,夏克文等[10]学者利用黄金分割法的原理提出了一种隐含层节点数的寻优算法。高海昌[11]、董立立[12]、吴一全[13]等学者分别从旅行商问题、机械优化设计、图像阈值分割的应用角度论述遗传算法、粒子群算法、模拟退火算法、蚁群算法等智能优化算法的特点。
3 智能优化算法研究的热点和趋势
3.1 关键词共现分析
为了把握我国智能优化算法研究领域的热点,对研究热点的分析主要依靠CiteSpace工具,将节点类型设置为“keyword”进行运算分析。得出的关键词共现图谱(图4中只展示词频排名前30的关键词)中有255个节点和934条连线,网络密度为0.028 8。
图4 智能优化算法研究关键词共现图
关键词出现的次数越高,表明该领域内学者对该关键词的关注度越高;关键词中心度越高,表明该关键词在该研究领域内重要程度越高。表3列出了智能优化算法研究前15个高频关键词,同时列出该关键词的中心度。
由表3可以看出中文核心期刊在不同智能优化算法之间的研究主要集中遗传算法、粒子群算法、蚁群算法和模拟退火算法等。其中值得注意的是,在出现频次上2016年提出的鲸鱼优化算法高于1983年提出的模拟退火算法,在中心度上高于1995年提出的粒子群算法和1996年提出的蚁群算法,可见鲸鱼优化算法在国内智能优化算法研究中具有较高的重要性,并且获得我国研究学者较高的关注度。在各类智能优化算法下,中文核心期刊较多关注全局优化、神经网络、多目标优化、函数优化、参数优化等主题,其中神经网络和全局优化在智能优化算法研究中具有较高的重要性。
表3 出现频次Top15的关键词
3.2 关键词突现分析
为了更好地把握2000年以来,在中文核心期刊上智能优化算法研究领域中不同关键词和主题词的兴起和衰落,本研究使用CiteSpace软件的突现度分析Burstness功能,并节选出突现度最高的前20个主题,见图5。可以看出我国学者目前将智能优化算法应用于压缩感知、图像分割、任务调度等方面,而且到2020年依旧突现性较强。由此可见,在未来几年智能优化算法仍会这几个应用领域上发挥作用。此外,2015年至今,反向学习、深度学习、蝙蝠算法、差分进化、鲸鱼优化算法等热点在国内智能优化算法研究领域获得较大的关注度。例如:孙辉等[14]提出了在粒子群算法中引入方向学习策略,提升粒子群逃离局部最优的能力,从而增强全局搜索能力。邹华福等[15]在群搜索优化算法中应用反向学习机制和差分进化变异策略,在扩大了种群搜索范围的同时,还避免了无效搜索,使算法在全局探勘和局部开采之间取得平衡。范纯龙等[16]利用差分进化搜索图像敏感点,并对基于深度学习模型决策定义的损失函数进行优化,实现了有效的黑盒攻击。唐贤伦等[17]用粒子群算法优化卷积神经网络参数和卷积层之间特征图连接结构,有效提高了网络训练效率和识别率。为了提高算法的收敛速度和精度,赵青杰等[18]提出了动态自适应权重和柯西变异的蝙蝠优化算法。郝晓弘等[19]在鲸鱼优化算法中引入混沌映射和非线性策略。
图5 智能优化算法研究关键词突现分析图
3.3 关键词聚类分析
在对关键词共现分析和突现分析之后,在CiteSpace中选择Log-Likelihood Rate算法对关键词进行聚类,聚类标签使用关键词表示。本研究关键词的聚类结果如图6所示,一共得到8个聚类。可以看出每个聚类块都有所重叠,没有较大的明显区别。在此基础上,使用CiteSpace的TimeLine视图功能,可以更加清晰地展示随着时间变化这八个聚类下各包含哪些主题(见图7)。在第一个聚类“优化算法”中,主要包括优化算法的一些应用,例如背包问题、图像配准、目标跟踪、功率分配、分布式电源等应用领域。在第二个聚类“遗传算法”中,主要包括遗传算法的改进和应用,例如混合优化、禁忌搜索、启发式、有限元法等改进设计以及路径优化、动态规划、室内定位、多目标跟踪等应用领域。在第三个聚类“神经网络”中,主要包括智能优化算法与机器学习的结合,例如深度学习、强化学习、卷积神经网络,图像分割等。在第四聚类“优化”中,主要包括传统数学方法,例如最小二乘法、小波变换、支持向量机、粗糙集等。在第五个聚类“压缩感知”中,主要包括智能优化算法与压缩感知技术上的结合,例如函数优化、参数辨识、异构网络、图像处理等。第六个聚类“全局优化”中,主要包括通过不同优化算法和各类优化策略实现全局优化,例如:蚁群算法、模拟退火算法、差分进化算法、烟花算法、鲨鱼优化算法、灰狼优化算法等优化算法以及反向学习、并行计算、混沌优化等优化策略。第七个聚类“智能优化”中,主要包括比较少见的优化算法和应用领域,例如:萤火虫算法、五行环优化算法、代理模型、模式识别、车辆路径问题、复杂曲面等。第八个聚类“粒子群算法”中,主要基于粒子群算法的改进和应用。
图6 智能优化算法研究关键词突现分析图
图7 智能优化算法研究关键词突现分析图
4 结 语
利用文献计量工具CiteSpace对中文核心期刊上智能优化算法研究文献的发文量变化、期刊来源、发文机构、研究学者、主要文献、研究热点与趋势等进行了系统分析,结果如下:
(1) 智能优化算法研究现在处于持续上升阶段,近二十年来,发文量在整体上呈稳步增长状态,预估在今后几年内依旧会处于稳中有进的状态。
(2) 在中文核心期刊上智能优化算法研究领域中,上海理工大学、中国科学院大学、河南师范大学、中南大学、东北大学、华东理工大学等高校是主要领军机构。
(3) 整体上,智能优化算法研究学者合作群不多,大部分处于单打独斗的状态。与此同时,张新明、窦智、刘尚旺、刘国奇、康强等学者,桂卫华、吴敏、李明、阳春华、王勇等学者,马良和刘勇等学者,王鹏和王辉等学者,侯祥林和贾连光等学者均已形成有代表性的合作群。
(4) 目前中文核心期刊上智能优化算法研究中,研究热点和趋势是遗传算法、粒子群算法、蚁群算法、鲸鱼优化算法等优化算法,反向学习、代理模型等优化策略,深度学习、压缩感知、图像分割等应用领域。