APP下载

基于Retinex模型和GTV的铁路货车铸件DR图像增强

2023-03-29任雨霞曾理

铁道科学与工程学报 2023年2期
关键词:信息熵铸件纹理

任雨霞 ,曾理

(1. 重庆大学 数学与统计学院,重庆 401331;2. 重庆大学 工业CT无损检测教育部工程研究中心,重庆 400044)

由于生产工艺的限制,铁路货车铸件可能会出现缺陷,缺陷位置可大体划分为外部及内部缺陷[1],铁路铸件的外部缺陷可通过观察直接分辨,而内部缺陷需经过数字化X 线摄影(Digital Radiography, DR)等无损检测技术勘测。目前,已经存在一些钢轨表面缺陷检测技术,如顾桂梅等[2-3]提出的缺陷检测方法。但这些方法对于检测铁路货车铸件的内部缺陷效果不佳。由于铁路货车铸件厚薄不均,反映在原始DR 图像上呈现灰度不均的特点,不利于检测员对对比度较低的DR 图像缺陷做出判断,因此,增强待检测区域的缺陷尤为重要。传统的图像增强方法主要有:1) 统计方法。如直方图均衡化(Histogram Equalization,HE)算法。此外,出现了一些改进的HE 算法,如SHANKAR等[4]提出的BBHE 算法,CHEN 等[5]提出的MMBEBHE 算法,WANG 等[6]提出的局部直方图均衡化方法。基于直方图的方法旨在优化图像直方图的形状[7],该方法原理简单,但往往只计算像素的强度,而忽略了像素的空间信息,因此,该方法往往增强效果不佳。2) Retinex方法。Retinex 理论假设观测图像可以分解为光照图和反射图[8]。早期该方法使用高斯滤波器来估计平滑光照图,并直接将反射图作为最终的结果图。然而,这些方法往往导致图像过度增强和增强结果不自然等不同方面的负面效应。GUO等[9]提出一个结构感知的平滑模型来优化光照图,REN 等[10]提出低秩正则化Retinex 模型(LR3M),XU 等[11]提出一种新的结构和纹理感知的Retinex (STAR)模型,HAO 等[12]提出一种基于Retinex 的半解耦模型。这些方法对于自然图像的增强取得了比较好的效果,而对于铁路铸件DR 图像增强缺陷效果不明显。随着深度学习的发展,图像增强技术取得了很大进展。钟嘉俊等[13]基于改进的Faster R-CNN 识别焊缝缺陷,LORE 等[14]提出一种基于深度自动编码器的学习方法(LLNET),CHEN 等[15]提出一种全卷积网络结构,在真实的微光图像上可以取得较好的增强效果,Retinex-Net[16]对于自然图像的增强也产生较好效果。虽然深度学习方法已获得广泛应用,但传统方法是人类长时间知识积累的结果,不需大量配对图像或标记图像进行训练,其模型和方法具有可解释性,容易使使用者信服其结果,而且可根据相关知识进行改进,所以仍然有研究价值。基于数据的深度学习方法与基于知识的传统方法各有所长,但二者的适用场景和条件不同,很难公正地比较。随着小样本甚至单样本深度学习网络的发展,结合传统方法的深度学习方法也在发展中。针对铁路货车铸件DR 图像对比度低、缺陷等细节显示不足的问题,为了在保持图像整体结构和细节信息的同时有效增强图像,本文设计一种基于Retinex 理论和高斯全变分(Gaussian Total Variation, GTV)的增强模型。根据理想光照图的充分光滑性和反射图应包含尽可能多纹理细节的特性,将图像分解为光照图和反射图进行估计。其中,利用基于GTV 的理论估计图像光照图,利用指数局部导数作为权重项来更好地提取有意义的纹理细节反射图。最后,将体现图像纹理细节的反射图作为增强图像,从而实现增强图像缺陷细节的目的。

1 基于Retinex 模型和GTV 的增强方法

针对增强铁路铸件DR 图像缺陷的问题,提出一种利用GTV 和基于纹理感知的加权项对Retinex分解过程中的光照图和反射图进行正则化的模型。其中,基于GTV 的理论可以较好地显示图像的整体结构,缺陷等细节信息留在反射图中,基于纹理感知的加权项促进了图像细节信息的提取。最后,采用交替迭代算法对模型进行求解。

1.1 模型构造

Retinex 模型模拟人类视觉系统的色觉[11]。它的目标是将观测图像O∈Rn×m分解为光照图和反射图:

其中:I∈Rn×m表示场景中代表物体亮度的光照图;R∈Rn×m表示场景中代表物体物理特征的反射图;⊙表示对应元素相乘。光照图I和反射图R可以通过交替估计来得到:

其中:⊘代表对应元素相除,事实上,为了避免分母为0,使用I=O⊘(R+ε),R=O⊘ (I+ε),其中ε=10-8[11]。Retinex 模型将观测图像分解为光照图和反射图。这是个高度病态的问题,应该考虑合适的光照图和反射图的先验信息,一般来说,光照图应该是分段平滑的,可以捕捉场景中物体的结构,而反射图应该反映场景的物理特征,捕捉其纹理信息。本文使用一种基于高斯全变分(GTV)的边缘保持滤波器,用于估计图像光照图。文献[12]中将传统的全变分|∇x,yT|扩展至高斯全变分(GTV):

其中:T是滤波图像;∇x,yT是T在x方向或y方向的微分;此处加入了一个高斯核项为分母,高斯核宽为σ1;Gσ2(T)表示作用在T上的空间宽度为σ2的高斯滤波器。基于Retinex 的方法,提出一个目标函数的同时估计光照图和反射图,建立如式(4)目标函数模型:

其中:ℜ1(I)和ℜ2(R)分别是关于光照图I和反射图R的2 种正则化函数。文献[11]中指出ℜ1(I)和ℜ2(R)为全变分形式时,无法较好地区分图像的边缘及纹理细节,在平滑噪声的同时往往会模糊图像的边缘细节。文献[17]中首先利用GTV 估计图像的光照图,然后在基于Retinex 理论的限制下估计反射图。本文不仅利用GTV 作为正则化项估计光照图,为了更好地提取纹理细节,还加入纹理感知加权项估计反射图,本文建立如式(5)目标函数模型:

其中:O为原始观察到的图像;I和R分别为要估计的光照图和反射图;∇I和∇R分别为要估计的光照图和反射图的梯度;α和β为平衡光照图和反射图的参数;T0为权重矩阵,影响提取的反射图的纹理细节。

T0的设计对提取图像的纹理细节信息是有意义的,受文献[11]的启发,选取权重矩阵T0如式(6)所示:

其中:Ω 为像素点周围的局部区域;|Ω|为局部区域Ω 内像素点的个数;ε设置为0.000 1。为了求解 GTV正则项中的L1范数,做出了如式(7)L1范数的逼近形式:

其中:ε是一个避免分母为0 的较小的正常数,本文设置为0.000 1(2.1 节阐述了ε的取值),式(7)将基于GTV 的正则项近似分解为二次项和非线性权重ωx,y,其中,ωx,y如式(8)所示:

因此,目标函数可转化成如式(9)形式:

图1 不同ε的结构图Fig. 1 Structure images of different ε

1.2 模型求解

目标函数(9)中2 个变量I和R是可分离的,因此可以通过交替优化算法求解模型。本文初始化矩阵变量I0=O,R0=O⊘I0。分别用Ik和Rk表示第k次(k=0,1,2,…,K)迭代的光照图和反射图,K为最大的迭代次数。在优化一个变量的同时固定另一个变量,可以交替更新这2个变量。

1) 更新I,固定R。

进一步有:

为了解决问题(10),将式(11)化为:

其中:Dx和Dy是带有向前差分的离散梯度算子的Toeplitz 矩阵;Wx和Wy是带有权重wx和wy的对角矩阵;式(12)关于I求导,令导数为0,可得到:

2) 更新R,固定I。

式(12)中求解可得出Ik+1,而:

重复上述算法直到满足收敛条件或迭代次数超过预设阈值K。本文给出了交替优化算法的收敛条件为≤ε,由此,模型(5)可以有效地解决。根据上述求解过程,分离后的每个子问题都有封闭形式的解。

表1 求解模型(5)的算法流程Table 1 Algorithmic process for solving the model (5)

2 实验结果与分析

本文实验所用笔记本配置为Intel(R) Core(TM) i5-1035G1 CPU @ 1.00 GHz,基于Matlab R2021a编程实现。实验所用图像为实际扫描得到的带有缺陷的铁路货车铸件DR 图像,如图1(a)所示。由于实际扫描得到的DR图像一般为12~16位,而显示器往往只有8位,不易区分缺陷部位和非缺陷部位,因此实验中输入图像是16 位的DR 灰度图像,输出是增强后的24位DR图像。此外,实际扫描得到的DR 图像往往尺寸很大,而缺陷等细节信息往往存在于局部区域中,为了突出缺陷信息,截取DR图像的部分区域进行实验。

2.1 结构图结果

本文模型使用图像的反射图作为最终增强结果,为了得到较优的反映细节缺陷的反射图,估计的光照图需要反映图像的主体结构。观察模型(9)可知,权重项ωx,y对于提取图像的光照结构图是重要的。本文选取图1(a)中方框区域图1(b)作为输入图像,设置一组ε的值:0.000 01,0.000 1 和0.1,得到反映图像的结构图,如图1(c),1(d)和1(e)所示。观察可知,ωx,y中ε的取值对于图像的结构图影响较小,本文设置为0.000 1。由图1(c),1(d)和1(e)可以看出,设置的权重项ωx,y较好地提取了图像的结构,促进了缺陷等细节信息暴露在反射图中。

2.2 模型结果

选取图1(a)中方框区域图1(b)作为输入图像,经过多次实验,选择合适的算法参数α=0.001,β=0.000 01,γt=0.8,γI=2,γR=1.5,迭代次数K=7,停止迭代准则中ε设置为0.01,得到增强图像如图2(b)所示,图2(c)为进一步得到的部分缺陷放大图。

从图2(c)中可以观察到,本文模型得到的增强图像增强了纹理特征,气孔等缺陷信息清晰地显现出来,且保持了边缘信息,有助于检测人员标注缺陷信息。

图2 增强结果图Fig. 2 Enhanced images

2.3 定性定量地评估模型

经典的图像增强方法有HE 和SSR,现有流行算法有LR3M 方法[10],STAR 方法[11],Shi’s 方法[12]和Retinex-Net[16],本节用这些方法来评估本文模型。如图3 所示,实验选取了2 组不同的铁路货车铸件DR 图像,图3(a)是原图像,图3(a)上部分是第1 组DR 图像,3(a)下部分是第2 组DR 图像,右图是左图中方框区域的局部放大图。

图3 不同方法的增强图Fig. 3 Enhancement images of different methods

从图3(b)和图3(c)中可以观察到,HE 和SSR方法可以显著提高图像的整体对比度,但局部区域亮度过强或过暗,丢失了图像的部分真实信息,不利于缺陷的检测。STAR 方法,Shi’s 方法和LR3M 方法得到的增强图像不易捕捉图像缺陷细节。由于没有标准地配对DR 图像进行网络训练,因此,Retinex-Net 方法得到的增强图像对比度低,图像信息损失严重。而本文方法得到的增强图像提高了图像的对比度,明显突出了缺陷等细节信息,给人以良好的视觉体验效果,有利于检测人员识别缺陷细节。

为了进一步评估本文方法,需要计算图像的信息熵和平均梯度。其中,图像的信息熵反映了图像中平均信息量的多少,通常情况下,图像信息熵越大,其信息量就越丰富,质量就越好。信息熵的计算公式如式(18)所示,p(ri)表示第i个像素灰度值出现的概率。平均梯度显示了图像中纹理细节的反差变化速率,一般而言,图像的平均梯度越大,对应图像层次越丰富,平均梯度计算公式如式(19)所示。下面分析比较不同方法下得到的图像的信息熵和平均梯度信息。

观察表2 和表3 可知,与原图相比,HE 方法提高了图像的平均梯度,使得增强后的图像层次更加清晰,但该方法降低了图像的信息熵,导致增强图中信息的损失。SSR方法无法显著提高图像的信息熵和平均梯度,对于增强图像细节效果不佳。STAR 方法和Shi’s 方法改善了图像的信息熵,但平均梯度有所下降,导致图像层次信息的损失。LR3M 方法提高了图像的平均梯度,对于不同DR图像的信息熵改善效果不同,对于不同图像的增强效果不稳定。Retinex-Net 方法得到的图像的信息熵及平均梯度有一定提高,但实际增强后的图像效果却不理想。而本文方法显著提高了图像的信息熵和平均梯度,即得到的图像含有丰富的信息量,层次结构也更加分明。

表2 信息熵对比结果Table 2 Information entropy comparison results

表3 平均梯度对比结果Table 3 Average gradient comparison results

3 结论

1) 提出一个基于Retinex 理论和高斯全变分的增强模型,利用基于高斯全变分的滤波器估计图像光照图,利用指数局部导数作为权重项来更好地提取有意义的纹理细节反射图,最后用交替优化算法进行求解,将反射图像作为最后增强图像。

2) 相比于已有的一些增强方法,本文方法保留了图像的结构信息,增强了图像缺陷细节,改善了图像的视觉质量。与原图相比,增强后的图像的信息熵提高了8%以上,平均梯度至少提高为原来的6倍。

3) 本文方法提高了DR 图像检测缺陷的能力,促进了铁路货车铸件的无损检测。

猜你喜欢

信息熵铸件纹理
2021 年中国铸造行业数据发布
GJB 2896A-2020《钛及钛合金熔模精密铸件规范》解读
基于信息熵可信度的测试点选择方法研究
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
废铸件推出装置
基于信息熵的实验教学量化研究
TEXTURE ON TEXTURE质地上的纹理
环形凹槽类铸件铸造工艺
一种基于信息熵的雷达动态自适应选择跟踪方法