基于人工智能的计算机视觉研究领域发展现状研究
——基于多种可视化工具的比较分析
2023-01-06肖文芳黄稚霆欧俊宏刘浩鹏黄诗琪
肖文芳,黄稚霆,欧俊宏,刘浩鹏,黄诗琪
(广东医科大学 生物医学工程学院,广东 湛江 524023)
人工智能技术发展起源于1956年的夏季[1],最初对人工智能的构想只是使用设备模拟人类思维并处理问题。后续的研究使人工智能从单一的设备研发发展成一门涉猎广泛的交叉学科。时至今日,人工智能的重要性已经引起了全世界的重视。在事物识别与判断,机器自动化与智能化等领域都成为人工智能发展的重要领域。计算机视觉技术是在计算机上利用适当的算法对采集的图像等进行分析的技术,重点在于软件,关注点是阅读后如何使用科学方法进行分析[2]。计算机视觉研究已经在学术领域研究多年,发展出很多深刻的原理与技术,近年的重点主要放在工业化进程上,如利用GPU和视觉计算加速器处理数据。但计算机视觉技术走出实验室,走进市场,还需进一步探索。
本文以CNKI为检索平台,以“人工智能”与“计算机视觉”为检索主题,时间区间为1979—2021年,经过检索与筛选,得到文献6 028篇。借助CiteSpace[3]、VOSviewer[4]、SPSS[5]等可视化分析软件,运用词频分析法及聚类分析法等对检出文献的作者、机构及关键词进行可视化分析与研究,以期把握基于人工智能的计算机视觉研究领域的内容及特征,并对未来的研究趋势进行探讨。
1 基于人工智能的计算机视觉研究领域的作者分析
1.1 领域内高产作者分析
将CNKI收录基于人工智能的计算机视觉技术的文献数据导入VOSviewer软件中,确定作者为其网络节点,经过VOSviewer软件进行可视化后得到101个作者(图1)。在LabelView视图中节点与字体的大小取决于该节点的权重。由图1可见,李伟、袁保宗、藤光辉、阮秋琦等的发文量较多,其中发文最多的李伟为23篇。
图1 基于VOSviewer的作者频次图
1.2 基于SPSS的核心作者分析
作者的多维尺度分析实质是依据作者之间的“距离”即关系的紧密程度对研究问题进行聚类,能全面反映研究的主要角度与热点。
利用SPSS进行多维尺度分析,得到可视化结果,如图2所示。然而仍需对结果进行有效性和可靠性判断,其中包括变量的二维分布图。对输出结果还要判断其可靠性和有效性,主要通过应力系数(stress)和拟合优度的平方(RSQ)进行判断[6]。RSQ越大越好,一般大于0.6认为是可接受的,而stress的标准一般0是完美,2.5是优,3是良,到20则代表拟合效果很差。画图后我们得到RSQ=0.988 81,Stress=0.060 81,因此可以认为此结果是有效且可靠的。
图2 基于SPSS的作者多维尺度分析图
通过多维尺度分析的结果可以将基于人工智能技术的计算机视觉研究者分为以下4类。每一个类当中的作者所研究的领域都具有一定的相似性。从图中可以看出李伟、袁保宗、李德华等距离中心最近,属于该领域较为有影响力的研究者。
2 基于人工智能的计算机视觉研究领域的关键词分析
2.1 研究主题辨识
节点大小代表相对词频,节点间连线代表共现关系,连线颜色深浅代表关联度,节点发出的连线数量代表节点的中心度及在基于人工智能的计算机视觉领域的重要程度(图3)。
由图3可知,我国基于人工智能的计算机视觉研究领域中,除“人工智能”与“计算机视觉”2个上位关键词外,“机器视觉”与“图像处理”在余下的关键词中占主要地位,大部分研究方向都与其有联系。可以认为,迄今为止在整个研究领域中,大部分研究都以机器视觉或图像处理为出发点进行研究。无论基于何种出发点,大部分的小型聚类(图3中未显示文字的节点构成的聚类)都与这2个出发点存在联系,小型聚类间的相互联系也相当紧密,但小型聚类间并没有产生出新的具有共同高频词(新研究重心)的大型聚类(新研究方向),这反映了基于人工智能的计算机视觉这一领域空有联系,但缺少新的研究重心与方向,只能从过去的研究成果中寻求突破。使用SPSS对关键词进行多维尺度分析得到图4。
图3 关键词共现图谱显示出现频次15次以上的节点
结合图4的可视化结果得出,基于人工智能的计算机视觉领域从1996—2018年的研究重热点大致分为3个类别:以人工智能和计算机视觉为主为一派,以图像处理和物体与模式识别为一派及以人机交互、机器学习为重点一派。同时也明显看出人工智能与计算机视觉图像处理这一类要明显比另外2类离中心较近,属于核心大类,是目前研究的重中之重。图4呈现出小型聚类(小型研究方向)间的联系是脆弱的,不可靠的,甚至在本质上是不甚相关的。
图4 基于SPSS的关键词聚类分析图
2.2 研究前沿辨识
研究前沿的识别与追踪能够为研究者提供学科研究的最新演化动态,预测研究领域的发展,识别需要进一步探索的问题。在研究中,前沿往往采用代表该研究相同的词汇或短语出现次数的变化进行分析。相对于传统的高频主题词分析,突现主题术语更适合探测学科发展的新兴趋势和突然变化。在分析凸显主题术语时,可利用突现词探测技术和算法,通过考察关键词词频时间分布,从中探测出频次变化率高的主题词。
基于人工智能的计算机视觉研究前沿划分为3个阶段(图5)。
图5 基于CitesPace的1996—2018年突现率排名前25的关键词
第一阶段:在1996年,基于人工智能的计算机视觉研究处于研究初期,产生大量具有突现度和中心度的突现词,表明人工智能为基础的计算机视觉理论在提出的初期便成为学术研究的热点,形成多样化的研究中心。“小波变换”“主动视觉”“图像识别”“图像处理”从出现便呈现出较高的突现度。可见,本领域初期研究是以图像的识别和转换处理为研究热点,随着研究不断深化,本领域也逐步界定了具有自身特色的概念和理念,并进行推广。
第二阶段:从1997年到2006年,在过去提出的理论被继续丰富的基础上,大量的新研究热点被提出并进行研究。“计算机制图学”“计算机图形学”等词呈现出20以上的惊人突现度,毫无疑问这是当时最火热的研究热点。这表明针对已识别的图像处理与表现成为当下的研究热点。同时,其他的数据转换及处理技术也在飞速发展。
第三阶段:从2006年至今,未见有新研究热点的提出,原有的研究热点也逐渐冷却,2012年后,以往提出的研究热点都趋于平静。这表明在经历1996—2005年的理论推广期和活跃期后,基于人工智能的计算机视觉研究进入酝酿阶段。
突现词分析结果表明,人工智能与计算机视觉主研究点在历年来拓展出了诸多研究方向,但各个方向都未形成明显的研究派系。各研究方向正在完善自身的理论基础,期待厚积薄发,成为新的研究热点。
3 结束语
自1996年以来,基于人工智能的计算机视觉研究成果收获颇丰。这足以表明基于人工智能的计算机视觉研究整体呈现活跃态势。研究类别包含基本概念、基础技术应用、具体技术应用、新发展方向等多方面从理论性到应用性的研究。研究方式趋于多样化。发文量也呈现随时间发展而上升的趋势。整体看来本领域正欣欣向荣。
但基于人工智能的计算机视觉研究领域依然存在许多不足。如研究重点的关联不足,作者以及机构间的合作较少,新概念的提出并未引起相关研究的爆发性增长等问题。在未来的研究中,第一,应当加强作者及机构间的联系,强强联手,以期做出更好的成果;第二,应当在保证基础理论研究的情况下加大对新生技术以及概念的研究力度,当新概念或技术成为热点时,才能更快地暴露其优势或劣势,从而决定未来的研究方向;第三,加强领域间的联系,多向其他领域借鉴学习,他山之石可以攻玉,以期获得新的研究目标或者成果。