数字图像处理在木材缺陷识别中的应用与展望
2023-11-03董霙达司丽洁廖瑞姬多化琼
李 晴 董霙达 司丽洁 徐 威 廖瑞姬 多化琼
(内蒙古农业大学材料科学与艺术设计学院,内蒙古 呼和浩特 010018)
20世纪60年代,第五次信息技术革命兴起,我国步入信息化时代。由于现代计算机技术的进一步发展,数字图像处理技术逐渐运用到木材科学的不同领域[1-2],致力于解决缺陷识别中存在的问题。在不断的改进创新下,数字图像处理技术在木材科学中发展到了一个新高度。
木材本身因素、工艺流程或加工设备都会导致缺陷的产生[3],如节子、虫害、裂纹、腐朽、变色、锯解干燥过程形成的缺陷等。将图像处理技术广泛应用到木材缺陷处理中,可提高识别的精准性及实时性,减轻人工的压力,同时节约生产成本[4]。数字图像处理主要包括低级、中级和高级三个层次[5],分别对应木材缺陷识别过程中的图像采集和增强、图像分割和特征提取以及识别。
本文从数字图像处理技术出发,总结图像预处理、图像分割、图像缺陷特征提取与识别在木材缺陷方面的研究进展,以期推动数字图像处理技术在木材缺陷识别中的广泛应用。
1 数字图像技术对木材图像的预处理
在复杂多变的工厂内操作时,由于设施、环境等方面的影响,图片检测易受到众多不确定因素影响,如光照不均匀导致图像灰度过于集中、摄像头获取图片或传递时产生噪声污染,导致木材检测效果差。为解决此类问题,研究人员以数字图像处理技术为基础,对图像进行预先降噪和增强,从而减少噪音对缺陷检测结果的影响。
1.1 木材缺陷图像降噪
图像降噪是计算机视觉和数字图像处理领域的重要任务[6],其原理是在不破坏图像细节特征的前提下,对图像中的噪声进行去除。当木材图像掺杂噪音影响图像的清晰度时,图像降噪便成为图像预处理中不可或缺的操作。
均值滤波算法简易,对高斯噪声效果显著,易造成细节缺失及边缘模糊,直接导致图像分割失败。中值滤波在选择合适的滑窗前提下,较容易去除部分孤立噪声,能够保留大部分的边缘信息,对滤除脉冲噪声比较有效。高斯滤波调用一个二维离散的高斯函数去除噪声,使其保留更多的边缘细节,图像更为清晰,平滑效果也更加柔和。双边滤波滤除噪声、平滑图像的同时,又做到边缘保护。小波变换去噪同时保留图像的频率和空间信息,但方向性差,仅能获取部分方向信息[7]。范增明[8]对比了均值滤波、高斯滤波、中值滤波及双边滤波在木材缺陷图像中滤波效果,发现双边滤波平滑图像的同时,能够较为完整的保存边界信息,去噪效果更优。许多学者结合经典图像去噪算法的优缺点,进行了算法的结合与改进。高欣欣等[9]以传统均值滤波为基础,提出迭代均值滤波的方法,明显改善了图像重构的质量。屈正庚[10]等将传统中值滤波改进为自适应加权中值滤波算法,根据图片中噪声的大小对滤波模板尺寸进行调整,增强了去噪效果。彭姝姝等[11]将均值滤波与小波变换进行结合,不仅降低了噪声,还较好保护了图像细节。杨赞伟等[12]结合均值滤波及泊松核改进的双边滤波图像降噪算法,提高了降噪精度,防止信息丢失,且保持了边缘及细节信息。
1.2 木材缺陷图像增强
图像增强可以突出图像中感兴趣的区域,提高信息可读性,木材缺陷图像增强中常采用小波变换、直方图均衡化、Gamma校正及基于Retinex理论的图像增强等。小波变换可以较好地用频率表示某些特征的局部特征,但增强过程中会放大噪声,信噪比较低。因此,需要结合木材图像的特点对传统增强算法进行创新升级。秦彦平等[13]提出将小波变换与双三次插值算法融合应用于木材节子图像增强,提高清晰度和对比度,更大程度上保留边缘细节信息。为解决均值漂移及亮度过暗的情况,丁安宁[14]提出了一种基于非线性权重调整的Gamma校正算法(Adaptive Gamma Correction,AGC),将对比度和亮度增强函数修正为连续函数,发现AGC能够有效增强位于边界附近的缺陷图像。此外,研究者还将人工多重曝光融合算法(Artificial Multiple-Exposure Image Fusion,AMEF)与AGC算法相结合,融合两者优点,发现缺陷图像的视觉质量得到了显著改善,缺陷部分和细节部分清晰可见。Liu等[15]将结合注意力机制与Retinex图像增强算法结合,更好地均衡图像的整体亮度,保留了更多的图像细节和颜色信息。现阶段而言,增强图像的各项指标达到最优化难以实现。因此,需要在不同的环境中根据需求选择合适的算法,从而增强效果。
2 图像分割
图像分割是图像处理到图像分析的一个重要步骤,是木材进行缺陷识别的基本前提步骤。其过程是按照独特的性质(如灰度值、空间纹理、几何形状、RGB值等),把图像划分成若干区域,将感兴趣的目标区域进行提取的过程[16]。图像分割的两个基本原则为不连续性与相似性。当前,相对热门的图像分割方法有传统的分割方法,如基于阈值、边缘和聚类的图像分割方法等,以及基于深度学习的图像分割方法[17]。
2.1 传统的图像分割方法
2.1.1 基于阈值分割算法
基于阈值分割算法是目前最为常用的图像分割方法之一,具有操作简单、时效性强等优点。同时,对于图像缺陷和背景差异较大的图片可以得到较好的分割效果。此方法只研究图像本身的灰度值,而不考虑自身语义及空间等特征信息,容易受到噪声的干扰。因此,在实际的木材缺陷分割应用中,基于阈值的分割方法通常结合其他分割方法使用。李健[18]提出被囊群体算法与模板匹配结合的阈值分割算法,迭代计算得到全局最优解,利用泊松分布作为目标函数,得到的木材活节图像分割效果最好。当木材缺陷与背景色彩纹理相似时,则分割效果不理想。针对此类问题许多学者开展了探讨,王映月[19]结合二维交叉熵阈值分割算法与改进的缎蓝园丁鸟优化算法(SBO),发现该算法可以高效地区分木材缺陷与背景色彩纹理。
2.1.2 基于聚类的图像分割方法
聚类算法依据图像的像素点,通过某种特定的聚类算法将像素点聚集到同区域,通过反复迭代聚类,当结果收敛时将所有像素点聚集于不同区域,实现区域分割[20]。常见的聚类算法可归纳为三种,分别是基于距离、密度和连通性的算法。K-means算法的数据相似性衡量方式是通过计算距离。由于初始聚类中心具有随机性,所以仅适用于样本体量较小,且特征点不多的分割图像,应用于实际分割任务中时需求复杂[21]。K-means算法分割技术不断优化,程昱之[22]改进了K-Means聚类与水平集的算法,并应用于木材横截面管孔分割,分别用这两个算法进行粗分割与精分割,其准确率提高了1.7%。均值漂移(Mean Shift)算法是传统的非参数的聚类算法,当缺陷中心数量未知的情况时,仍能对任何形态的缺陷进行聚类,并对初始化具有鲁棒性,而且可以处理灰度、彩色、复杂及高分辨率的图像数据。韩俊等[23]证明此算法对噪声点不敏感,当搜索到的模点过多且较近时不易导致过分割现象,能够适应大多数场景的图像分割任务。
2.2 基于深度学习的图像分割方法
传统的图像分割方法通过图像表层的特征信息为前提进行分割,以大量语义信息来进行分割任务则不实用,实际应用到木材缺陷分割中时往往比验证环节更加复杂。传统方法提前预设分割规则,在一些细节处不能灵活地根据图像特征进行变通和调整,这导致传统的无监督分割方法的效果不理想。随着深度学习的不断发展以及在木材缺陷识别领域逐步引入,深度卷积神经网络在图像分割领域取得了巨大进展,实现了从粗糙到精细、从局部到全局的历程。通过语义分割提高木材缺陷图像识别,可以更好的适应多变的工厂环境。提出基于深度学习图像的语义分割方法,提高了分割的稳定性和精确性[24]。基于深度学习的经典分割方法主要包括FCN网架、Mask R-CNN架构、SegNet网络、DeepLabV架构、DeepMask架构、U-Net 架构等,本文主要介绍使用频率较高的4种方法。
1)FCN网架构是应用于语义分割的深度学习中重要的模型,完全实现全卷积神经网络在像素级预测任务上的端对端训练。打破常规尺寸的壁垒,可对任意大小的图片进行处理,也防止重复存储和计算卷积的情况,提高效率。严飞等[25]通过只采用全卷积对活节、死节、虫洞进行研究,验证了FCN框架在木材缺陷分割的可行性。
2)Unet是由FCN衍生而来卷积神经网络模型,严飞[25-26]挑选出合适的网络结构和阈值等参数,将改进的 Unet 模型与像素阈值结合应用于木材缺陷图像分割,发现木材缺陷图像分割时,激活层通道灰度图的分割效果优于卷积层。
3)SegNet网络是一种用于语义像素级分割的深度全卷积神经网络结构,在时间和内存方面保持良好性能。针对其具有效率低、精度低等问题,Ling等[27]提出了ResNet 的改进方案,具有更强的泛化能力,在活结、死结、虫洞等缺陷识别中的效果突出,相比于传统的卷积神经网络,其准确率由80%提升到了97%。
4)Mask R-CNN架构是实例分割算法中使用频率最高且效率最高的分割算法。通过对Faster-R-CNN进行改进,添加Mask预测分支,能够实现像素级别的分类,将目标检测扩展到实例分割。其中,分类与分割可以同时进行,该算法是实例分割领域的优选。高爱等[28]对Mask R-CNN算法深入分析,研究改进策略来增强其分割精度。研究发现,对于易出现特征提取不完全的问题,可加入注意力机制和替换特征提取网络对其进行改进。对于提取结果中目标边缘粗糙的问题,可加入新的分支实现对边缘特征和空间特征的提取,新分支与原Mask分支相互融合作用,从而实现对目标信息的充分提取。对于训练过程中的学习优化的问题,可通过梯度下降算法以及学习率衰减策略,使网络模型达到更好的训练效果。
3 木材缺陷特征提取
图像分割后进行图像特征的描述,运用数字图像技术对数字图像特征提取,很大程度提高图像识别的准确率。常见的特征提取算法有BRIEF算法[29]、SIFT算法[30]、SURF算法[31]、Harris算法[32]、FAST算法[33]、ORB算法[34]、LBP算法[35]等,其优缺点及特征检测方式如表1所示。
表1 木材缺陷特征提取算法比较Tab.1 Comparison of wood defect feature extraction algorithms
结合算法的优缺点,许多学者进行了针对木材特征提取的研究。邓正岩[36]分析了不同种类缺陷的外形特征与纹理特征,提出了基于改进SURF算法与Tamura纹理特征相结合的方法,并通过试验验证了该算法的有效性与实效性。 Rahillda[37]等对4种不同的LBP进行木材缺陷特征提取,分别为基本、旋转不变、均匀和旋转不变均匀的LBP,并进行特征集创建,通过多种分类器识别,发现均匀LBP结合ANN分类器的性能最好。李绍丽[38]等结合LBP与韦伯定律建立了LB_DEP直方图,反映出图像纹理结构位置与差异激励关联关系,将LBP和LB_DEP直方图链接,再通过PCA进行数据降维,得到特征向量的方法称为“H-PCA”法,将LBP和LB_DEP直方图与卡方距离测度方法相结合,分别提取两者的“直方图-卡方”特征,并链接起来形成特征向量的方法称为“H-chi-square”法。将本文中两个改进算法统计计算后与LBP+SIFT[39]和LBP+GLCM[40]特征算法对比,发现H-PCA 算法特征提取准确率较高。
数字图像处理技术被引入木材缺陷特征提取后,根据木材缺陷的特点与特征值的选取,融合创新出更高效的特征提取新算法,特征提取的召回率、精确率稳步提高同时运行时间逐步缩减。
4 基于数字图像处理的木材缺陷识别
完成数字图像缺陷预处理、分割以及特征提取后,需要根据木材缺陷的特点选取合适的分类算法。目前最流行的图像识别机器学习模型包括支持矢量机(SVM)、人工神经网络(ANN)和卷积神经网络(CNN)。
1)SVM是一种线性分类器,因其具有较强的推广能力和泛化能力,在机器学习中占据重要地位。此方法仅适用于解决小样本情况下的机器学习,对于大规模训练样本难以实施,因而许多学者致力于对该问题的研究。Huang等[41]将高斯混合模型(GMM)和SVM结合作为分类识别算法,对共振板进行分类识别,克服了SVM面对海量数据时识别率下降的问题。徐梓敬等[42]通过遗传算法(GA)优化权值和阈值,再通过SVM算法训练,实现了木材内部缺陷图像的识别。庄前伟[43]发明公开了一种基于改进鲸鱼算法优化SVM的缺陷识别方法,依据特征矩阵建立SVM分类模型,并使用改进鲸鱼算法对SVM进行调参,得到全局最优解赋值给SVM模型训练,缺陷识别准确率高。
2)ANN是人工智能领域研究的热点话题,应用在木材缺陷识别中最广泛的是BP神经网络模型,具有简单、适用广泛、学习效率高等优点,是多层前向网络优势算法。牟洪波等[44]将模糊数学与BP神经网络相结合,设计出了模糊BP神经网络(FBP),并采用最大隶属度方法对特征向量进行模式识别,进而实现了木材缺陷自动识别和分类,同时该神经网络对木材缺陷的识别准确率较高。王福伟等[45]发明一种基于神经网络的木材缺陷检测方法,解决了神经网络进行缺陷识别时不能进行分割的问题。
3)CNN是一类包含卷积计算且具有深度结构的前馈神经网络,广泛应用到数字图像识别中,识别效率和效果相较于传统识别手段有明显提高。基于CNN的目标检测算法主要分为One-stage和Two-stage两类[46],其典型代表算法及优缺点如表2所示。
表2 两类CNN的目标检测算法Tab.2 Target detection algorithms for two types of CNN
为解决传统SSD算法在实木板材表面缺陷检测工作中存在缺陷定位与分类精度不高的问题,丁奉龙[47]将Dense Net121网络引入,在采用密集残差学习的思想避免特征图信息丢失的同时又增加了网络的深度,从而获得更深层次的信息,使平均精度值提高至96.1%。魏智峰等[48]将一种轻量级的深层神经网络MobileNet与SSD算法结合,使用Inception网络附加到多个特征映射上,构建SSD-MobileNet算法模型用于人造板缺陷检测,以提高区分不同缺陷的能力。石佳浩[49]通过对R-CNN、Fast R-CNN、Faster R-CNN及Mask R-CNN经典目标检测算法优劣及实际对比分析,选择Mask R-CNN算法为研究模型,并引入神经网络架构搜索算法,搭建了NAS-Mask R-CNN模型,引入置信度优化策略对模型进行优化,提高了算法在工程应用中的稳定性,同时提出多通道选择优化策略,对网络结构进行优化。结果发现,改进的NAS-Mask R-CNN算法在检测速度方面较大提升,精确度达到98.7%。He等[50]提出了一种基于深度卷积神经网络(DCNN)的激光扫描仪采集的木材图像特征检测与缺陷自动分类学习方法,其综合准确率高达99.13 %,仅需1.12 s。
目前,基于数字图像处理的木材缺陷识别已有多项发明专利,李东洁等[51]提出一种基于改进Mask R-CNN的木材缺陷识别和分割方法,使用Momentum优化方法,此发明使用人工智能的方法同时完成缺陷的分类,缺陷的位置检测和缺陷的轮廓分割,适用于木材工业加工线对木材缺陷的快速处理。王宝刚等[52]提出一种基于改进YOLOv3模型的木材缺陷检测方法,本发明是为了解决现有缺陷检测方法对缺陷识别的泛化能力差,模型计算量大,识别效率和精度低,难以工业使用的问题[53-56]。
5 结语
数字图像处理技术在木材缺陷的识别中得到广泛应用和发展,自动化与智能化逐步代替人工,不仅提高了执行效率及准确率,也提高了木材加工企业的经济效益。数字图像处理技术必将成为未来研究和发展的热门话题,当前数字图像处理技术在木材缺陷识别的理论研究和实际应用中取得突破性进展,但仍存在问题限制发展,需在以下几个方面有所突破:
1)提高木材缺陷检测的准确性及实时性。一方面要增强硬件设备性能,防止设备及信息传输问题产生噪音对识别效果造成的干扰;另一方面要加快算法的创新升级,提高算法的旋转不变性、模糊复原性以及识别准确性。
2)提高木材缺陷识别的准确率。木材缺陷图像采集时易受到光照、雾气及噪声等多种因素干扰,造成数字图像信息呈现不清晰。因此,构建木材缺陷识别系统时要考虑其稳定性以及鲁棒性,从而减少外界因素对图像质量的影响。
3)增进不同方法之间的融合互补。木材品类多种多样,在生产中可能出现的缺陷也形态各异,基于不同方法得到了图像增强、分割、特征提取、识别算法准确率等,其互通互补性还有待进一步加强。