基于文献计量的机器视觉缺陷检测研究述评
2021-02-22彭昭勇陈华伟王书祥
彭昭勇,伍 权,陈华伟,郑 跃,王书祥
贵州师范大学 机械与电气工程学院,贵阳 550025
机器视觉的概念,源于美国机械工程师协会(American Society of Manufacturing Engineers,ASME)中的机器视觉分会以及美国的机器人工业协会(Robotics Industries Association,RIA)中的自动化分会[1]。按照其定义,机器视觉是指“经过光学装置和非碰触型的传感器自主接收并处置某个真正物体的图形,并对其剖析取得所需要的信息或用来管控机器运行的设施。”机器视觉具有精度高、成本低、效率高、灵活性高、自动化程度高等优点[2-4],在特定工作条件和环境下,可以取代人类的工作,因此广泛应用于现代工业自动化生产中,如零配件批量加工的尺寸检测,自动装配的完整性检查,电子装配线的元件自动定位,IC 上的字符识别等[5-14]。随着机器视觉的发展,学术界对机器视觉缺陷检测的关注度不断提高,研究成果不断积累,据此一些学者针对中国机器视觉缺陷检测研究所取得的成果做了回顾和展望[15-22]。上述研究为促进中国机器视觉缺陷检测研究奠定了良好的基础,但从研究时间段来看,有的研究距今太过久远,已不能及时且全面地反映近几年中国机器视觉缺陷检测研究领域发生的新变化;从研究内容来看,既有从整体角度,也有从某种类型对中国机器视觉缺陷检测研究成果进行梳理;从研究方法来看,几乎所有的研究都采用传统的内容分析,无法发现研究议题间的知识脉络关系。
因此,本文基于中国知网(CNKI)数据库中1995—2020年的文献数据(根据检索条件,能够检索到的最早关于中国机器视觉缺陷检测研究的文献[23]发表于1995年),通过文献计量和图谱分析相结合的方法,能够系统考察和直观反映中国机器视觉缺陷检测研究现状、热点和前沿,从而为后续研究提供借鉴和参考。
1 数据来源和研究方法
1.1 数据来源
本研究的数据来源于中国知网(CNKI)期刊全文数据库(https://www.cnki.net/)收录的全部期刊,包括核心期刊、CSCD 期刊、EI 期刊等。以“机器视觉缺陷检测”为主题词进行检索,检索日期截至2020年7月17日,对数据进行整理后共获得相关文献588篇,以此作为分析研究对象。
1.2 研究方法
本文综合运用文献计量法和知识图谱分析法。时间跨度为“1995—2020 年”,时间间隔为1 年,在此基础上,分别选择关键词、作者、机构、发文期刊等作为研究对象,并绘制相应的分析图,通过可视化手段呈现科学知识的结构、规律和分布情况,直观地反映不同研究间的内在联系,为科学有效地预测某一领域研究的发展动向和趋势提供科学依据[24]。
2 结果与分析
2.1 发文量分析
某一研究方向发表论文数量的变化能够直观反映该研究在某一时间段内研究热点的变化,是衡量该研究在该时间段内发展态势的一个重要指标,对分析未来研究发展动态和趋势具有重要意义[25]。根据我国机器视觉缺陷检测研究文献在历年分布数量的统计分析可知(如图1 所示),1995—2020 年,中国对机器视觉缺陷检测研究大致经历了初步探索、快速增长和高速增长三个阶段。其中,1995—2005 年为该研究初步探索的阶段,这一阶段研究成果相对较少,年均发文量仅为1.6篇,但随着1995年关于产品缺陷自动视觉检测论文的首次出现,揭开了中国机器视觉缺陷检测研究的序幕。2006—2011 年为该研究快速增长的阶段,发文量逐年攀升,由2006 年的7 篇增加到了2011 年的28 篇,与前一阶段的2005年相比,增长了12.9倍。主要原因为随着企业自动化生产线的升级迭代,传统人工和机械检测方法越来越满足不了自动检测的需求,在行业需求的带动下,企业和高校的研究热情高涨,进而推动了论文数量的上升。2012—2020 年为该研究的高速发展阶段(其中截止2020年7月17日共发表48篇,数据不完整,在图中未列入),发文量逐年快速上升,2019年最多为86篇,总体呈稳步上升态势。随着计算技术进步,机器视觉算法效率越来越高,缺陷检测效果越来越具有实用性,且机器视觉技术得到大量应用,进一步推动了机器视觉缺陷检测文献数量的增加。
图1 1995—2019年研究文献数量
2.2 关键词分析
2.2.1 关键词分布图分析
中心度和频次综合指标作为判断某一研究领域热点方向的标准,是指一个节点在网络中处于核心地位的程度,节点的关联性越大,其中心度越高,说明节点在该领域的重要性越强[27]。中心频度大于0.1 的关键词,普遍被认为其在该研究领域的影响力较大[28]。表1 中,中心频度大于0.1 的关键词从大到小依次为机器视觉、图像处理、缺陷检测、支持向量机、计算机视觉、表面缺陷检测、表面缺陷、模板匹配、深度学习、边缘检测。
2.2.2 关键词演进分析
图2 关键词分布图
表1 文献中出现频次高于15的关键词
为清楚呈现我国机器视觉缺陷检测研究的整体脉络,本文绘制了基于时间轴的中国机器视觉缺陷检测研究趋势演进图(如图3所示),可以看出该领域研究热点总体上从宏观的围绕机器视觉的缺陷检测、图像处理、深度学习逐步向表面缺陷、图像分割、数字图像处理、模式识别、自适应阈值、神经网络、分类器、中值滤波、人工智能与最小二乘法等细分领域研究拓展。图中词语字体和圆圈的大小反映了机器视觉缺陷检测研究的热度,关键词之间的连线表示它们的关联关系。此外,从图3中的连线也进一步反映出关联词之间的这种关系在时间跨度上有演进趋势,如在1995 年的关键词“缺陷检测”中就包含关键词“最小二乘法”。
2.2.3 关键词聚类分析
关键词共现分析和演进分析能够直观呈现目前机器视觉缺陷检测研究热点内容以及脉络[29],但是由于机器视觉与各行业深度融合是目前各个领域的研究热点,尤其是机器视觉在检测领域的相关研究与应用,造成该领域以机器视觉为核心的相关研究日益多元化,不仅研究的内容繁多,而且比较分散,未形成系统的研究框架。因此,本文对统计的全部关键词进行聚类分析,并根据各聚类关键词的组成,总结出各聚类的名称与研究内容,以梳理机器视觉缺陷检测研究的整体框架,探究目前机器视觉相关研究的主要领域,使相关研究更加体系化,突显机器视觉检测研究的热门领域,也为预测未来机器视觉检测热门研究奠定基础。本文采用UltraEdit对关键词去重,用Endnote 软件将数据格式转换成RIS格式,然后通过Vosviewer软件对关键词进行聚类分析,阈值选择为2,最终生成8个聚类(表2)。
图3 研究趋势演进图
表2 关键词聚类
由表2可知,8个聚类由不同的研究内容组成,代表8种不同研究领域,即目前机器视觉缺陷检测的相关研究主要集中在“缺陷”“缺陷检测”“visionpro”“特征提取”“mura缺陷”“模板匹配”“表面缺陷”“模式识别”8 个领域。
2.2.4 战略坐标分析
本文以各细分领域研究关注度为横轴,研究新颖度为纵轴,绘制机器视觉研究细分领域战略坐标图,探究目前机器视觉研究的热门领域及未来的热门领域,使8个细分研究领域分别落入不同的象限,如图4 所示,图中每个散点代表一个细分研究领域。
在区块链技术日益被广泛关注和逐渐蓬勃发展应用的大背景下,本文以肉类食品为例,从传统供应链出发,分析了传统供应链中各个节点对接的不足,说明了区块链技术的优点,并与供应链进行结合,解决传统供应链中信息不对称,对接效率低等问题,研究了区块链与供应链结合的新管理模式与如何实现产品溯源、防伪验证等技术问题。目前,我国对于区块链在供应链中的应用还处于探索时期,所以,我们应该更多的对区块链在供应链上的应用多加研究,将理论方面的创新实践到实际生活中,才能让区块链技术有更大的突破。
图4 战略坐标图
从4个象限的分布情况看,领域#5“模板匹配”位于第一象限,该象限为热门研究领域,其代表的研究内容具有高频次与高中心度特点,且与其他研究领域具有较高的关联度。领域#2、#4、#7、#0“visionpro”“mura缺陷”“模式识别”“缺陷”位于第二象限,该象限为高潜热门领域,其代表的研究内容具有低频次、高中心度特点,表明表面缺陷检测、边缘检测识别、视觉程序软件开发、计算机视觉自动检测是未来研究的热门领域。领域#6“表面缺陷”位于第三象限,该象限为孤岛领域,其代表的研究内容既不具备高频次,也不具有高中心度,表明该领域并不是机器视觉缺陷检测研究的核心内容,相关研究比较少并且未形成完整的研究体系。但该研究领域部分关键词处于机器视觉缺陷检测研究热点的边缘,如“表面缺陷”(频次54;中心度0.46)、“图像分割”(频次12;中心度0.11),也有可能发展为机器视觉缺陷检测研究的热点。领域#1、#3“缺陷检测”“特征提取”位于第四象限,该象限为边缘领域,其代表的研究内容具有高频次、低中心频度的特点,说明该领域也是目前机器视觉缺陷检测研究的热门领域,但与其他研究领域的关联度不高。
2.2.5 凸显关键词
凸显词指在较短时间内出现较多或使用频率较高的词,根据凸显词的词频变化可以判断研究领域的前沿与趋势[30]。基于CiteSpace的凸显词分析,得到机器视觉缺陷检测凸显主题及对应的凸显率(如图5 所示)。“深度学习”“表面缺陷”“计算机视觉”“pcb”“在线检测”“视觉检测”“边缘检测”是机器视觉缺陷检测研究的热点,其中“深度学习”主要体现在1995—2007 年,“表面缺陷”体现在2001—2010年,“计算机视觉”体现在2004—2011 年,“pcb”体现在 2007—2013 年,“在线检测”体现在 2010—2016 年,“视觉检测”体现在2014—2017 年,“边缘检测”体现在2017—2020 年,并且研究趋势表现为逐年上升。这在一定程度上说明,目前国内机器视觉缺陷检测研究前沿主要体现在深度学习、表面缺陷、计算机视觉、pcb、在线检测、视觉检测、边缘检测等主题。
2.3 发文作者分析
在文献计量分析中,通常需要寻找核心作者以发现某研究领域的骨干力量。核心作者是指发文数量较多并且影响力较大的作者[31]。本文依据普赖斯公式进行统计分析:
式中,M为核心作者发文数(篇),Nmax为统计年限中发文量最多的作者的发文数(篇)。发文量为M篇及以上的作者即为核心作者[32]。经统计,中国机器视觉缺陷检测研究领域Nmax=7,将该数值带入式(1)中,求得M≈1.98,取M值为2,即发文量为2 篇及以上的作者为中国机器视觉缺陷检测研究领域的核心作者。
根据统计结果,参与发表论文的作者总人数为615人,核心作者人数为126 人,占总人数的比例为20.5%,总发文量为295篇,占总发文篇数的50.2%,符合普赖斯理论中“核心作者发文数量占总发文数量50%”的观点[33]。
图5 关键词凸显率
图6为中国机器视觉缺陷检测研究发文作者分布图,由图6左上角的信息说明窗口可知:N=126,E=126,Density=0.016。其中,N为节点数,表示此种参数组合下提取的作者数量;E为连线数,表示作者间的合作程度,连线越多表明作者间的合作越密切;Density表示网络密度[34]。图6 中的连线数小于节点数,说明在中国机器视觉缺陷检测研究中,作者间的联系较少,密度较低。其中,存在较多的单点,说明有部分学者处于独立研究状态;双点合作如李江波和饶秀勤等表明其研究联系较少;三角形合作如乔湘洋、祁超飞和王海芳等表明其研究合作关系相对稳固;以王耀南、彭玉、范涛、周显恩、刘学兵等作者为中心点的合作研究网络最为紧密,且处于同一个网格之中,有可能是实验室间相互合作或者同门之间的相互合作。
图6 发文作者分布图
2.4 发文机构分析
通过对发文作者所属机构的统计分析可知,本研究设计的作者分布在108 个机构中,发文数量在5 篇及以上的机构有7个(表3)。其中发文最多的机构为广东工业大学自动化学院,发文量共计10篇;其次为四川大学制造科学与工程学院,发文量共计8 篇;紧随其后的为江南大学轻工过程先进控制教育部重点实验室和上海理工大学光电信息与计算机工程学院,发文量都为6篇。
表3 发文量较多的机构
图7为中国机器视觉缺陷检测研究发文机构图,图中节点圆圈大小和发文机构字号大小与发文机构在该研究领域中的研究成果成正比关系,节点越大表示该机构在中国机器视觉缺陷检测研究方面的成果越丰富[35]。同时,由图7 还可以看出:目前,尽管在全国已形成以广东工业大学自动化学院和四川大学制造科学与工程学院为代表的机器视觉缺陷检测研究中心,但不同机构相互之间的合作研究在不断加强,并逐渐形成一定的合作网络。其中,上海理工大学光电信息与计算机工程学院、广东华中科技大学工业技术研究院广东省制造装备数字化重点实验室和湖南大学电气与信息工程学院等大部分机构为独立研究状态;中国科学院大学人工智能学院和中国科学院自动化研究所精密感知与控制研究中心等为相互合作的状态;中国科学院成都计算机应用研究所、国网重庆市电力公司电力科学研究院和中国科学院大学为三角形合作,合作关系较为稳固。
图7 发文机构图
2.5 发文期刊分析
对刊发学术文献的期刊进行分析,有助于了解该研究领域的核心期刊群,为学者选择文献发表平台、搜索资料提供指导[36]。本文筛选出的588篇文献中载文7篇及以上的期刊共发文106篇,占总发文量的18%(表4)。其中,《激光与光电子学进展》《制造业自动化》分别载文14篇,同居榜首,其发文量略高于其他期刊;《包装工程》《计算机测量与控制》分别载文12 篇,紧随其后;《机床与液压》《组合机床与自动化加工技术》分别载文11篇;《电子测量与仪器学报》共载文10 篇;《机械设计与制造》共载文8篇;《计算机工程与应用》《仪表技术与传感器》分别载文7篇;其余期刊的发文量则在7篇以下。
表4 刊载论文7篇以上的期刊
根据布拉德福定律,将期刊刊载某学科领域的论文数量以递减顺序排列,可把该学科领域的期刊分为核心区期刊、相关区期刊和非相关区期刊3 种类型[37]。其计算公式如下:
式中,r0为核心区期刊,E 为欧拉系数(E=0.577 2),Y为当前领域最大载文量期刊的载文量。本研究中Y=14,通过计算可得r0≈6.4,按照四舍五入原则,取r0的值为6,即处于核心区的期刊有6 种,分别为《激光与光电子学进展》《制造业自动化》《包装工程》《计算机测量与控制》《机床与液压》《组合机床与自动化加工技术》,它们是目前刊载机器视觉缺陷检测研究成果的主要期刊,反映出这些期刊的办刊宗旨及对刊发机器视觉缺陷检测研究成果的倾向。
3 结论与展望
3.1 结论
本研究的分析样本来源于中国知网(CNKI)数据库中1995—2020年共588篇期刊文献,改变了以前传统的定性分析以及描述统计,综合运用文献计量及知识图谱分析方法,揭示了中国机器视觉缺陷检测研究的多维结构和网络关系。主要得出以下结论:
(1)根据文献产出逐年变化情况,将1995—2020 年中国机器视觉缺陷检测研究历程划分为3个阶段:初步探索阶段(1995—2005 年)、快速增长阶段(2006—2011年)和高速增长阶段(2012—2020 年)。从整个时期来看,发文数量总体呈上升趋势。
(2)在研究关键词中,机器视觉、图像处理、缺陷检测、支持向量机、计算机视觉、表面缺陷检测等为该领域的核心词;在关键词演进分析中,该领域研究热点总体上从宏观的围绕机器视觉的缺陷检测、图像处理、深度学习逐步向表面缺陷、图像分割、数字图像处理、人工智能与最小二乘法等细分领域拓展。
(3)在发文作者上,以王耀南、彭玉、范涛及其团队为引领而取得的成果最为丰硕;在研究机构上,以广东工业大学自动化学院、四川大学制造科学与工程学院为代表的科研院所占据重要地位;在刊文载体上,已形成由《激光与光电子学进展》《制造业自动化》《包装工程》《计算机测量与控制》《机床与液压》等9 种期刊组成的核心期刊群。
3.2 展望
本文也存在一定局限性:第一,未对机器视觉缺陷检测引用数量进行统计,未来可对其深入统计和分析,利于快速、准确查找对该领域有重要影响和价值的文献。第二,未对机器视觉缺陷检测发文地区分布情况进行统计分析,未来研究可对发文地区分布进行分析,能够明确目前各地区对该领域研究内容及数量的差异,为促进各研究机构的跨地域合作、交流提供指引。第三,本文仅对知网的全部期刊,如核心期刊、CSCD期刊、EI期刊等数据库中的文献做统计与分析,未来研究可对国内全部中文数据库中该领域的文献进行统计和分析,进一步增强研究结论的说服力。