基于潜在低秩表示及导向滤波的红外与可见光图像融合方法①

2021-10-11朱亚辉

计算机系统应用 2021年9期

朱亚辉

(陕西学前师范学院数学与统计学院,西安 710100)

红外与可见光图像融合技术在军事和民用领域中占有重要地位,如目标检测、监控和情报收集等.其中,可见光图像含有丰富的细节和纹理信息,但易受光线和天气等因素的影响,难以捕捉到场景内的所有信息;红外图像是经红外成像传感器获得的图像,易丢失许多空间细节信息,视觉感受不自然.红外与可见光图像融合的目的是充分利用红外图像和可见光图像的优势,生成一幅含有丰富细节背景和热目标的高质量图像,便于计算机视觉任务[1].

由于成像机理的不同,同一空间位置的红外和可见光图像的像素强度往往差异很大,为了得到具有良好视觉感知的融合结果,引入多尺度变换(Multi-Scale Transformation,MST).常用的MST 方法包括:Curvelet[2]、Contourlet[3]、DTCWT[4]等,这些方法能将图像分解为低频子带和高频子带,但它们不具有平移不变性,容易造成伪Gibbs 现象.虽然NSCT 变换[5]、NSST 变换[6]等增强了图像的平移不变性,但在融合过程中未考虑空间一致性,也容易引起亮度失真.随着机器学习的发展,稀疏表示具有良好的去噪能力和空间一致性等特征,但仍存在捕获全局结构的能力有限以及细节信息不足的缺点.为了解决稀疏表示的问题,Liu 等[7,8]提出的潜在低秩表示法(Latent Low-Rank Representation,LatLRR),该方法能够提取源图像的全局结构信息和局部结构信息.已有学者[9-11]将其应用到红外与可见光图像融合中,并取得较好的融合结果.但仅使用潜在低秩方法分解源图像,存在高频信息提取不完全的问题,导致融合效果不佳.

本文针对红外与可见光图像融合过程中出现的细节损失严重等问题,提出了潜在低秩表示和导向滤波的红外与可见光图像融合方法.该方法将潜在低秩表示方法和导向滤波相结合,较充分地挖掘源图像的基础信息、细节信息和显著信息,并应用各信息的特征进行融合.实验结果表明本文方法能保留较多的源图像的细节信息.

1 相关理论

1.1 潜在低秩表示方法

LatLRR 方法具有较好的空间一致性,能有效提取原始数据中的全局结构和局部结构.它将图像分解为基础子带与显著子带,其表达式为:

式中,X是输入图像,B是低秩系数,D是显著系数;XB,DX分别表示低秩图层和显著图层;N表示稀疏噪声.

将LatLRR 问题进行最优化求解,其表达式为:

式中,‖·‖*表示核范数,‖·‖1表示l1范数,α ＞0表示平衡系数.为便于分析,令低秩图层=BX,显著图层=DX.

1.2 导向滤波

He 等[12]提出了导向滤波(Guided Filtering,GF)的概念,通过引导图像完成滤波过程,不仅能够滤除图像噪声,而且能够平滑边缘、保持其梯度特性.

设输入图像I,导向图J,导向滤波过程表示为:

其中,wk为半径为r的正方形窗口,系数ak,bk为常数,可直接通过线性回归求出,即:

式中,|w|为wk内的像素点个数,,分别为图像I和图像J在窗口wk的均值,σ2k为方差,ε为正则化参数.

2 融合方法及融合规则

已知红外图像I,可见光图像V,设融合结果为F,图1给出了本文融合方法的流程图,具体融合步骤为:

图1 本文融合方法流程图

Step 1.应用LatLRR和导向滤波将源图像分解为基础图层、细节图层和显著图层.

Step 2.各图层融合规则:基础图层、细节图层、显著图层分别以视觉显著度加权法、梯度显著度加权法、绝对值最大选择法为融合规则,考虑到初始权重具有噪声且不与物体边界对齐,应用导向滤波优化初始权重.

Step 3.将基础融合图层、细节融合图层和显著融合图层叠加,得到融合图像.

2.1 图层分解

首先,采用LatLRR 方法分解红外图像I和可见光图像V,分别得到红外低秩图层、红外显著度图层、可见光低秩图层、可见光显著图层;再分别以低秩图层,为输入图,以红外图像I和可见光图像V为导向图,应用导向滤波将低秩图像,分解为基础图层和细节图层.

其中,GF表示导向滤波器;IBased,VBased分别为红外图像的基础图层和可见光图像的基础图层;IDetail,VDetail分别为红外图像的细节图层和可见光图像的细节图层.r,ε分别为导向滤波的滤波大小和正则化参数.图2给出了源图像的图层分解示意图,将源图像依次分解为基础图层、细节图层和显著图层.

图2 源图像分解

由图2可以看出,基础图层包含着基本信息,结构信息较少,例如可见光图像中的文字基本已经模糊不清;细节图层包含着图像结构信息,例如红外图像中行人的轮廓、汽车等轮廓信息;显著图层包含着源图像的显著信息,例如行人、车辆、红绿灯、招牌等信息.因此,将LatLRR和导向滤波相结合,可充分地分解源图像信息.

2.2 融合规则及融合图像重建

可见光图像和红外图像均被分解为基础图层、细节图层和显著图层,该节分别针对每层的特征,采用视觉显著度加权法、梯度显著度加权法、绝对值最大选择法作为每层的融合规则.具体介绍如下:

(1)基础图层融合规则

基础图层包含着图像大部分信息,尤其以显著性目标为主.因此,该层以视觉显著度加权法作为融合规则,其融合公式为:

其中,FBased,IBased,VBased分别为基础融合图层、红外基础图层、可见光基础图层;权重分别为Guided filtering 及其滤波大小和正则化参数;,分别为红外显著图和可见光显著图.

(2)细节图层融合规则

细节图层包含着源图像大量的边缘信息和结构信息,采用Scharr 算子[13]En和拉普拉斯能量和[14]Em分别衡量边缘信息和结构信息,结合这两个特征,定义梯度显著度,即为:

其中,EI,EV分别为红外梯度显著度和可见光梯度显著度;EmI,EnI分别为红外图像的边缘信息和拉普拉斯能量和;EmV,EnV分别为可见光图像的边缘信息和拉普拉斯能量和.

融合图像的细节层融合公式为:

其中,FDetail,IDetail,VDetail分别为细节融合图层、红外图像的细节图层、可见光图像的细节图层;权重wDetail=GF(0.5+0.5(EI-EV),I,r,ε).

(3)显著图层融合规则

由图2可以看出,红外与可见光显著图信息相辅相成,故采用绝对值最大为权重图.即:

其中,权重w=GF(w′,I,r,ε),w′(i,j)=分别为显著融合图层、红外显著图层和可见光显著图层.

(4)融合图像重建

将基础融合层FBased、细节融合层FDetail和显著融合层叠加,得到融合图像F为:

3 实验及结果分析

在本节中,通过主、客观评价多组融合图像的效果,分析本文融合方法的有效性.其中,3 组红外与可见光源图像对分别是“Camp”、“Road”和“Kaptein”,它们均来自于TNO Image Fusion Dataset;采用的融合方法包括:DTCWT[4]、GCF[15]、VSM[16]、LatLRR[9]和本文方法.其中,DTCWT和GCF 属于多尺度分解,DTCWT 滤波器参数为“legall”、“qshift_06”,分解级数为2 级;GCF 采用高斯曲率滤波迭代分解源图像,其迭代次数为20 次;VSM 融合方法通过滚动引导滤波器分解源图像,其中σS=2,σr=0.05,迭代分解4 次.LatLRR融合方法中的参数α=0.8;在本文融合方法中,导向滤波器的参数设置为σS=5,σr=100,潜在低秩表示方法中参数 α=0.1.图3给出了多组红外与可见光图像融合结果.

图3 多组红外与可见光融合结果

3.1 融合图像的主观评价

对比第1 组的融合结果可以看出,在基于DTCWT融合结果中,虽然左侧树杈的纹理较为清晰,但行人周边存在明显的光晕.这是因为基于DTCWT不具有平移不变性;在基于GCF和VSM 融合结果中,无论左侧树杈的纹理还是行人的边缘都存在模糊性,说明它们未能充分提取源图像的细节信息;在基于LatLRR 融合结果中,左侧树杈纹理明显模糊不清,房顶细节不清晰.基于本文融合方法的融合结果较好地保留了左侧树杈纹理信息,且行人边缘较为清楚,热目标亮度适中,符合人眼视觉效果.

对比第2 组融合结果可以看出,在基于DTCWT融合结果中,整幅图像较为模糊、偏暗,行人周边存在明显光晕,红绿灯亮度不明显;在基于GCF 融合结果中,行人边缘存在锯齿状;在基于VSM 融合结果中,整幅图像较为模糊,例如招牌上的文字、行人边缘等;虽然基于LatLRR 融合方法提高了图像亮度,但也存在细节信息挖掘不充分的问题,例如,招牌上的文字、窗户的边缘、车身的边缘等;基于本文方法的融合结果不仅保留了可见光场景的细节信息,且行人、车辆、红绿灯等红外热目标边缘清晰,接近自然场景.

对比第3 组融合结果可以看出,在基于DTCWT融合结果中,整幅图像亮度偏暗,热目标边缘存在光晕;在基于GCF和VSM 融合结果中,地面纹理不清晰,左侧草丛纹理不清晰,且路灯周边存在明显的伪边缘;基于LatLRR 融合方法导致整幅图像较为模糊,且热目标亮度不均匀;基于本文方法的融合结果保留了可见光场景的细节信息,如地面纹理信息、草丛纹理信息,且行人和窗户等边缘清晰.

3.2 融合图像的客观评价

为了更加客观地评价本文融合方法的有效性,应用互信息MI[17]、边缘信息传递量QAB|F[18]、结构相似度SSIM[19]和特征相似度FSIM[20]分别从互信息、边缘信息保留程度、结构相似度和特征相似度评价融合图像质量.这4 个指标数值越大,则融合效果越好.表1给出了3 组融合图像的客观评价值.

由表1可以看出:1)对比“Camp”,本文方法的融合结果具有较高的MI 值、QAB|F值、SSIM 值和FSIM值,表明本文融合方法在互信息、边缘保留度、结构相似度和特征相似度上均优于其他融合方法;2)对比“Road”,本文方法的融合结果具有较高的MI 值、QAB|F值、SSIM 值,表明本文融合方法较好地保留了源图像的边缘信息、结构信息等;在FSIM 指标上,5 种融合方法的FSIM 值基本接近,表明这5 种融合方法都较好地保留了源图像的特征信息;3)对比“Kaptein”,本文方法的融合结果具有较高的MI 值、QAB|F值、SSIM值和FSIM 值,也表明本文融合方法较好地保留了源图像的灰度信息、边缘信息、结构信息和特征信息.

表1 多组融合结果评价指标值

表2给出了3 组融合图像的客观评价均值.

表2 融合方法客观评价均值

由表2可以看出,本文融合方法在互信息、边缘保持度、结构相似度和特征相似度均优于其他融合方法,尤其是MI 指标和QAB|F指标.这4 个评价指标均反映了融合图像与源图像间的细节保留程度,因此,本文融合方法能有效保留源图像的细节信息.

4 结论与展望

针对红外与可见光图像融合过程中出现的细节损失严重等问题,提出一种基于潜在低秩表示与导向滤波的红外与可见光图像融合方法.该方法结合潜在低秩表示方法和导向滤波的优势,将源图像分解为基础图层、细节图层和显著图层,并分别以视觉显著度加权法、梯度显著度加权法、绝对值最大选择法作为融合规则.最后通过叠加3 个图层获得最终融合结果.通过对多组融合结果的主、客观评价,分析了本文方法是切实可行的,能够得到具有丰富信息且较为清晰的融合图像,在视觉质量和客观评价方法较优于其他方法.但本文方法的融合结果的FSIM 评价值较其他融合方法略高,优势不是很明显,其主要原因可能在于导向滤波的参数设置.因此,后续将对本文方法的灵敏度进行分析,优化参数设置.