基于CiteSpace的卷积神经网络可视化分析研究
2022-05-10莫兰蕊龙涛李妹燕
莫兰蕊 龙涛 李妹燕
摘要:为了研讨卷积神经网络在计算机领域的应用及发展趋势,文章选择2010-2021年中国知网中以“卷积神经网络”为篇名的2818篇核心期刊论文作为研究样本,采用文献计量方法,借助CiteSpace软件对核心期刊文献进行可视化分析,文章主要梳理了国内核心期刊关于卷积神经网络的研究热点,从作者、发文机构、关键词等角度分析卷积神经网络的研究现状和发展趋势,研究结果表明卷积神经网络应用于计算机视觉上图像处理以及深度学习的多维度将成为未来研究热点。
关键词:卷积神经网络;知识图谱;可视化;图像处理;深度学习
中图分类号:TP18 文献标识码:A
文章编号:1009-3044(2022)09-0063-04
1 引言
卷积神经网络(Convolutional Neural Network,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(Deep Learning)的代表算法之一。神经网络是受到生物神经元间的链接方式的启发而出现的,逐渐发展为卷积神经网络(Convolutional Neural Network,CNN)[1]。在20世纪60年代,Hubel和Wiesel在钻研猫脑皮层中用于部分敏感和目标方向选择的神经元时发现其独特的网络构造能够有效地降低反馈神经网络的复杂性,通过这个研究发现,他们继而提出了卷积神经网络这一名词。经过往后的推广,明确地说明了卷积神经网络是得到广泛应用的一种人工神经网络,也是首个真正被成功训练的深层神经网络。
卷积神经网络作为深度学习的重要推动力,近年来取得了重大的突破,在计算机视觉、自然语言处理和遥感图像理解等领域有出色的表现[2]。而且卷积神经网络(全卷积神经网络)在深度学习中表现出强大的潜能,逐渐成为图像语义分割问题的首选[3]。在计算机领域当中,卷积神经网络对图像的处理是进行图像识别,因为卷积神经网络避免了对图像处理的复杂性前期与处理,能够直接输入原始图像,因此得到了更为广泛的使用[4]。图像识别是一种利用计算机对图像进行处理、分析和理解,再通过卷积神经网络对输入的数据进行特征提取,利用提取的特征实现目标的分类与定位[5],以识别各种不同模式的目标和对象的技术,是计算机视觉的一个主要研究方向,在以图像为主体的智能化数据采集与处理中具有十分重要的作用和影响。
本文借助CiteSpace可视化分析软件对卷积神经网络相关核心期刊文献进行可视化分析,进一步对卷积神经网络展开研究,并且重点研究它在计算机学科领域上的应用和发展趋势。
2 数据来源与研究方法
2.1 数据来源
本文利用中国知网(CNKI)上收录的核心期刊文献能够较全面地反映出卷积神经网络在各个领域上的应用,因此本文的数据来源于中国知网CNKI学术期刊库的核心期刊文献。本文在收集数据时,打开中国知网(CNKI)首页,点击“学术期刊”导航按钮,选择高级检索,以“卷积神经网络”为篇名,选择“中英文扩展”,时间范围设置为2010—2021年,来源类别选择“北大核心”和“CSSCI”,检索的结果是2818篇,将检索到的核心期刊通过点击“导出与分析”并选择导出文献,然后选择以“RefWorks”格式导出。
由于检索到的核心期刊文献覆盖领域较广,为了保障数据的真实性和有效性,对检索到的核心期刊文献做人工筛选,剔除以下内容:1)刊名为杂志、报道、通报等文章。2)没有作者的文章。3)与计算机学科不相关的文章等。最终筛选出的核心期刊文献为1821篇。
2.2 论文研究的方法
本文主要研究卷积神经网络在计算机领域上的应用和发展趋势。采用文献计量方法,通过CiteSpace可视化软件对1821篇核心期刊文献进行可视化分析。CiteSpace软件是由美国德雷塞尔大学信息科学与技术学院英籍华人陈超美教授在2014年开发的软件[6]。CiteSpace可视化软件在国内有个别名叫作引文空间,在科学计量学、数据和信息可视化背景下逐步发展起来的,是一项专门分析科学研究中潜在知识的文献(引文)可视化分析软件。本文采用的是CiteSpace5.8.R1版本,对卷积神经网络的文献作者、机构、关键词进行共现和聚类分析,生成相应的知识图谱,以便于学者们对卷积神经网络进行后续的研究。
3 数据分析
3.1 文献年度发文量分析
对文献各个年度的发文量进行统计便可以得出广大学者对某一主题的研究关注度和投入度,本文统计了2010—2021年度的发文量,共得到2818篇核心期刊文献,对检索结果进行可视化分析统计后发现如图1所示,卷积神经网络在近几年发文量呈现上升趋势,说明卷积神经网络近几年在国内引起广大学者的关注和重视,特别是在2019年,年度发文量达到了663篇,这表明卷积神经网络得到了快速发展和广泛应用,同时2021年预测到的发文量是957篇。就目前的情况而言,发文量在持续上升,卷积神经网络成了研究热点,说明未来几年学者们对卷积神经网络还会有更深入的研究,同時卷积神经网络在计算机领域上还会得到持续的发展,相关发文量也会继续上升。
3.2 文献发文作者分析
统计作者的相关信息有利于发现作者之间的合作关系,同时对作者进行分析,可以准确地了解到研究领域中的权威学者(专家),因为他们对自己研究的领域有着较全面、较充分地理解,也有着丰富的知识理念,同时也已经形成较成熟的知识体系。对权威学者的文献进行阅读,可以快速地了解该研究领域的知识和相关主题的应用,同时也可以实时了解到最新的研究状况和所在领域前沿。本文使用CiteSpace可视化分析软件对作者进行可视化分析,设置时间范围是2010—2021年,时间切片为1,Node Types选择“Author”,得到了卷积神经网络研究发文作者的知识图谱,图中名字字体越大表示发文量越多,如图2作者共现图所示。得到的关键节点N=309个、关键路线E=184个。其中发文较多的作者为周建平(5篇)、曾上游(5篇)。最后对发文量进行统计。发现卷积神经网络的学者发文量都相对较少,学者之间的合作也比较少,如表1作者首次发文及文献量所示。同时,从数据中可以明确地知道,发文数量较多学者大多数是在2018年开始发表关于卷积神经网络的文章,时间线紧跟生活,卷积神经网络在近年也逐渐成为研究热点。对于卷积神经网络的研究,本文认为,学者之间应该相互交流,虽然卷积神经网络出现也有了一段时间,但是其涉及的领域以及研究意义值得学者们一起去研讨。
3.3 发文机构分析
对发文机构进行可视化分析,可以得到机构发文网络以及机构与机构之间的合作关系,本文可以根据分析得出卷积神经网络在不同机构中的分布情况。
在CiteSpace中将“Author”改为“institution”,其余条件保持不变,得到了机构共现知识图谱如图3所示。在知识图谱中,机构名字越大,表明机构的发文量就越多,机构发文量体现出机构在该领域的科研能力和科研水平,以及对研究主题的专注度。由于图中数据不是很清晰,因此对后台数据做了一些统计,统计出发文量排名前十的机构,如表2所示,这样更能方便读者们阅读。数据表明,有挺多的机构对卷积神经网络进行研究,促进卷积神经网络的发展,但是在知识图谱中,也得知机构之间没有合作关系,各个机构都是自发地研究卷积神经网络。由此可见,在国内大部分机构都是按照区域划分的,这也导致相关领域之间跨机构、跨学科、跨地区合作相对较少,在这方面的合作还需要不断加强,机构之间多多交流,也能促进机构的发展和知识的传递。
3.4 关键词词频分析
对于一篇文献而言,关键词算是重中之重,关键词是对一篇文章的高度凝练和概括,文章的主题就是围绕着关键词来写的,因此运用CiteSpace可视化分析软件对核心期刊文献进行关键词分析和统计,才能更好地明确研究的核心期刊文献的重点主题。
本文运用CiteSpace可视化分析软件,将“Node Types”设置为“Keyword”,然后其他条件保持不变,对关键词进行词频分析,词频分析法是通过分析关键词出现的频数高低来确定在某一领域的研究热点和发展动向。并且关键词词频越高,越能反映该领域的研究热点。在得到关键词的频度和中心性的图表后[7],本文选择前十的关键词对其进行分析如表3所示。图中高频关键词为“深度学习”和“卷积神经网络”,“深度学习”中心性最高,其次再到“卷积神经网络”,毕竟卷积神经网络是深度学习算法的一种,说明众多研究还是围绕着“卷深度学习”和“卷积神经网络”的研究为重点。在计算机研究领域上,关键词的代表是“图像处理”“特征提取”,不过这两个的频度较低,说明卷积神经网络在计算机领域是处于发展中的。
3.5 关键词共现分析
笔者在CiteSpace中点击关键词分析,得到关键词共现知识图谱如图4所示,其中关键节点N=506个,关键路线E=627个。在关键词共现知识图谱中,能够清楚地看到“卷积神经网络”和“深度学习”这两个词组的字体是比较大的,字体越大越能说明关键词度中心性的大小,由上文词频得知“卷积神经网络”和“深度学习”的中心性是位居一二的,因此根据图中关键词词组字体的大小,便可知道“卷积神经网络”“深度学习”“图像处理”“特征提取”“深度卷积神经网络”等为关键词共现的重点词汇[8]。
3.6 关键词聚类分析
在分析文献时,为了避免高频关键词遗漏信息,本文对关键词共现进行聚类分析。通过点击关键词聚类,得到关键词聚类图如图5所示,对于关键词聚类分析,本文要通过模块值Q和平均轮廓值S来判断CiteSpace软件聚类的显著性和合理性。当Q≥0.3,则说明,此时划分的聚类结构是显著的;当S≥0.5,则说明聚类是合理的[7]。本文是以一个时间切片做聚类分析,得到聚类分析的Q值是0.6621,S值是0.8616,由此说明划分的聚类结构是显著的,聚类是合理的。在分析结果中,本文统计了前十个聚类规模较大的关键词如表4所示。同时在CiteSpace软件上生成时间序列图如图6所示,在CiteSpace中,时间序列图是以年份作为时间轴,展现关键词随着年份(时间)变化特征的时序图。在图的右边为聚类的热点关键词,图中节点的大小则表示该节点关键词的重要程度,節点所在的位置表示该关键词出现的时间。
3.7 关键词趋势分析
在CiteSpace可视化分析软件中,可以根据关键词首次出现的时间(年份),将2010~2021年间卷积神经网络研究领域的关键词投射到时间线的横坐标上,最终得到卷积神经网络研究的时区图谱如图7所示。这个图是从时间维度上展现了2010~2021年间每一年新出现的卷积神经网络研究主题。同样的道理,在时区图中,关键词字体的大小就代表它中心性的大小,字体越大,说明它在关键词词组中越重要[7]。在图7中,可以看到,“图像处理”“图像分类”“特征提取”是从2016开始的,说明卷积神经网络在计算机视觉上图像处理方面的应用是从2016年开始的,到2021年图像分类上还是使用到了卷积神经网络。
4 结果与讨论
通过使用CiteSpace软件对卷积神经网络的引文进行可视化的分析,了解到了关于卷积神经网络的一些关键词和热点词汇。首先它是基于深度学习算法的,基于算法出身,是不断优化和更新的,因此卷积神经网络的知识也不断地被学者挖掘、优化,继续往卷积神经网络的高深层次和不同纬度发展、学习、研究;其次,卷积神经网络在各个领域都得到广泛应用,介于本文主要研究它在计算机领域的应用,就不对其他领域作过多介绍。
在计算机领域方面,卷积神经网络主要是应用于“图像处理”“特征提取”和“图像分类”,为学者们在处理图像时给予特别大的帮助,通过卷积神经网络进行处理,会更快的得到图像的特征因素,而且方便分类提取。同时,经过分析、权衡利弊之后,发现卷积神经网络在计算机领域存在着几个问题:
1)卷积神经网络多层分化,在进行图像处理时,对于不同类型的图像难以确定要使用哪一层次的卷积神经网络。
2)随着卷积神经网络层次的加深,在筛选合适的层次时,势必会造成大量的资源消耗,成本也随之提高了。
3)进行特征提取时,卷积神经网络还无法对大量的数据快速识别并提取到特征因素,其结构还得不断优化,以及在大量数据中还得实现算法并行。
4)近年来,手机也在不断地发展,手机对性能、功能的要求也越来越多,但卷积神经网络在手机上还没怎么使用,如何设计出精巧的且能在手机上使用的卷积神经网络是值得学者们研讨的问题。
跟随着科技的进步,未来人们的生活基本上都用到眼部识别,要求的图像分辨率高,机器扫描眼睛,进行图像对比,特征提取来确认人们的身份信息或者出行的,可以减少一些不必要的麻烦,目前各种硬件设备的智能化还没有大量普及,因此卷积神经网络在计算机领域方面还得继续发展,跟进时代的脚步。
生活在信息化时代,离不开科技,也离不开学习,卷积神经网络是人工神经网络,是学者发现并推广使用的,而且还发掘了不同层次的卷积神经网络,但卷积神经网络中还有各种结构、层次等着学者们去发掘和运用。
参考文献:
[1] 董永峰,邓亚晗,董瑶,等. 基于深度学习的聚类综述[J/OL].计算机应用:1-8[2021-11-14].http://gfffg0d5ea2b984614a3chbonv9vfop0cq6ovw.fgfy.bsuc.cwkeji.cn/kcms/detail/51.13 07.TP.20210927.1729.016.html.
[2] 张鑫,姚庆安,赵健,等.全卷积神经网络图像语义分割方法综述[J/OL].计算机工程与应用:1-16[2021-11-14].http://gfffg0d5ea2b984614a3chbonv9vfop0cq6ovw.fgfy.bsuc.cw keji.cn/kcms/detail/11.2127.TP.20211220.0930.002.html.
[3] 吕伏,刘铁.基于学习率自增强的图像识别深度学习算法[J].计算机应用与软件,2021,38(12):268-273.
[4] 卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17.
[5] 王振华,李静,张鑫月,等.面向视频数据的深度学习目标识别算法综述[J/OL].计算机工程:1-19[2021-11-14].DOI:10.19678/j.issn.1000-3428.0062227.
[6] 李慢.基于citespace5.2视角的国内人工智能研究可视化分析[J].智库时代,2018(44):201-202.
[7] 张秦,孙长坪.基于CiteSpace的我国营商环境研究重点与趋势的知识图谱分析[J].统计与管理,2021,36(11):124-128.
[8] 王文曦,李乐林.深度学习在点云分类中的研究综述[J].计算机工程与应用,2022,58(1):26-40.
【通聯编辑:谢媛媛】