自适应红外行人图像PCNN分割算法
2022-08-11张嘉瑛贺兴时于青林
张嘉瑛, 贺兴时, 于青林
(1.西安工程大学,西安 710000; 2.汤普森河大学数学与统计学系,加拿大 甘露市 V2C 0C8)
0 引言
德国科学家ECKHORN等[1]通过对猫视觉皮层结果的模拟发现了利用脉冲神经网络的脉冲发放特性可以很快地找到图像当中的同质区域,更好地处理图像的分割、去噪、匹配和融合,提出了脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN),并将其广泛应用于图像分割领域。然而,分割结果的质量取决于PCNN参数的取值。参数的适当值只能手动调整或通过大量的训练来估计,限制了PCNN的进一步发展。研究者们试图解决这个问题,KUNTIMAD等[2]分析了在获得对象和背景的强度范围后进行完美图像分割的连接强度的最小值和最大值;基于连接强度的原理,KARVONEN[3]根据从训练合成孔径雷达图像中获得的段的分布信息计算了连接强度的特定值;STEWART等[4]提出了一种多值图像分割区域——PCNN区域,但需要手动设置时变动态阈值E,并将强度与增量常数联系起来;由BI等[5]介绍的方法根据空间和灰度特征自适应地确定了权重矩阵和连接强度,但通过经验设置了动态阈值E的振幅和衰减常数;此外,YONEKAWA等[6]自动调整了连接强度和指数衰减系数,但需要多次反复试验。
如何依据图像信息调整神经元连接系数与触发阈值来提升分割性能,避免图像的过(欠)分割是PCNN研究的重要问题。LI等[7]提出了一种基于免疫算法的新型PCNN参数自动决策算法,实现了PCNN的参数自适应调整;程述立等[8]用多种智能优化算法优化最大类间方差,再结合PCNN对图像进行分割;XU等[9]提出基于ACO算法的自适应PCNN及其在医学图像分割中的应用。但是目前提出的PCNN方法不能有效地抑制红外噪声,当它们直接应用于红外行人分割时,通常会导致行人目标边缘模糊,为解决该问题,提出了基于多尺度PCNN红外行人图像的自适应分割算法。在简化的PCNN模型中引入尺度空间,使得模型具有尺度性与方向性,加强了中心神经元与最优方向上周边神经元的联系,同时利用PSO算法寻找关键参数的最优值,有效地结合了PSO算法、尺度空间与PCNN各自的优势,使其实现关键参数的智能寻优,得到最优的参数组合,将分割结果与其他分割方法进行定性和定量比较,验证了本文的方法。
1 简化PCNN模型
简化的PCNN模型[10]中单脉冲耦合神经元的结构分为接收、调制和脉冲发生器3部分,其数学表达式为
Fi j(n)=Ii j
(1)
Li j(n)=∑Wi jklYkl(n-1)
(2)
Ui j(n)=Fi j(1+βLi j(n))
(3)
θi j(n)=exp(-αE)θi j(n-1)+VEYi j(n-1)
(4)
(5)
式中:Fi j(n)为第i,j个神经元的反馈输入;Ii j为外部输入刺激信号(即图像矩阵中各个像素的灰度值);Li j(n)为耦合连接输入;Wi jkl为连接矩阵;Ykl(n-1)为(n-1)次迭代时神经元的输出;Ui j(n)为内部活动项;θi j(n)为动态阈值;Yi j(n)为神经网络的输出;β为连接系数;αE为阈值衰减系数;VE为阈值放大系数。
改变PCNN的参数可调整PCNN的运行行为。其中连接系数β、阈值衰减系数αE、阈值放大系数VE、连接矩阵这4个关键参数对分割结果产生较大影响。
2 粒子群优化(PSO)算法
(6)
χid(t+1)=χid(t)+ϑid(t+1)
(7)
(8)
3 高斯核尺度空间PCNN模型
3.1 高斯核尺度空间
高斯核尺度空间的基本思想[12-13]是:建立引入尺度参数的高斯核函数,并与图像进行卷积,通过改变核函数的参数可得到图像在不同尺度下的空间表示序列。将图像I(x,y)的高斯尺度空间定义为L(x,y,p),尺度参数p=σ2,p≥0,σ为高斯核G(x,y,p)的标准差,则该尺度空间可由高斯核G(x,y,p)与I(x,y)卷积得到
(9)
式中:
(10)
通过定性分析可以得出:随着σ的增大(减少),尺度参数p也随之增大(减少),导致尺度空间各尺度图像的模糊程度逐渐增大(减少),这样就能够模拟目标由近(远)到远(近)时的尺度变化情况,本文采用二维高斯核函数实现尺度空间的变换。
3.2 AGK-PCNN模型
本文提出的自适应高斯核尺度空间-脉冲耦合神经网络(Adaptive Gaussian Kernel scale space-Pulse Coupled Neural Network,AGK-PCNN)模型是利用PSO算法对关键参数进行寻优,并利用高斯核函数替代传统PCNN模型中通过智能算法动态改变权值实现图像分割的算法。AGK-PCNN模型中单个神经元的结构如图1所示。
图1 AGK-PCNN模型神经元结构Fig.1 Neuron structure of AGK-PCNN model
局部红外噪声由高斯噪声、泊松噪声、乘法噪声和椒盐噪声组成[14],考虑到这些噪声的特征,从各向异性高斯核[15]中学习构造权重矩阵,在该各向异性高斯核滤波器中起到两个作用:1) 降低整幅图像的噪声;2) 保留原始图像中边缘、角、小尺度特征等重要结构,而非边缘区域。从而建立如下数学模型
Fi j(n)=Ii j
(11)
(12)
{(x,y)∣x=1,2,…,k;y=1,2,…,l}
(13)
(14)
Ui j(n)=Fi j(1+βLi j(n))
(15)
θi j(n)=exp(-αE)θi j(n-1)+VEYi j(n-1)
(16)
(17)
在输入部分中,输入Fi j(n)的权重矩阵G起着重要作用,可以将邻域的灰度信息传递到中心神经元像素,并进一步表达红外图像的局部特征。因此,可以利用权重矩阵G来配合简化的PCNN增强局部信息和抑制局部红外噪声。所以利用PCNN模型的权重矩阵消除了红外图像的噪声,并保留了行人的几何特征。式(11)~(17)中,连接矩阵Wijkl用高斯核函数代替。在传统的PCNN模型中没有反映尺度变化的参数,对图像分割时主要通过设定连接矩阵Wijkl的大小,在AGK-PCNN模型当中引入高斯核函数代替连接矩阵Wijkl,使得模型具有了尺度特性,控制中心神经元受周围神经元影响的范围和权重,从而实现尺度变化的功能。
4 基于PSO算法的AGK-PCNN自适应图像分割方法
4.1 PSO算法的适应度函数
适应度函数作为优化算法中重要的一部分,影响着分割结果。熵能够反映目标包含的信息量的大小,熵越大,说明包含的信息量越大。因此选取分割后图像的熵作为适应度函数,其算式为
H=-p1×lbp1-p0×lbp0
(18)
式中,p0和p1分别为PCNN输出图像Y(n)中像素为0和1的概率。
4.2 基于PSO算法的AGK-PCNN自适应图像分割方法的实验流程
AGK-PCNN模型中,通过PSO算法对参数β,αE,VE以及加入高斯核的连接强度λ和方差σ2进行优化,找到最佳参数数值,从而实现对红外行人图像的分割。算法的具体分割流程如下。
2) 将红外行人图像作为输入图像输入到AGK-PCNN中,由PSO算法初始化的随机参数对AGK-PCNN中的参数进行设定。
3) 通过PSO算法对式(18)的适应度函数进行优化,适应度函数为红外行人图像经过AGK-PCNN处理后进行信息熵值计算的结果,通过式(6)~(8)来进行参数空间的寻优,通过比较输出的适应度函数值与上一次迭代得到的适应度函数值,保留局部最优的参数。
4) 当算法达到设置的容忍度或者达到最大迭代次数时,输出此时的最优参数作为全局最优适应度函数值和最优参数值,否则重复进行3)和4)。
5) 将AGK-PCNN的参数设置为优化算法得到的最优参数值,进行红外行人图像分割。
6) 对分割图像进行中值滤波,用来处理数量较少的稀疏噪点。
7) 输出最终红外行人图像分割结果,算法结束。
图像分割的流程如图2所示。
图2 基于PSO的AGK-PCNN图像分割流程Fig.2 AGK-PCNN image segmentation process based on PSO
5 实验结果与分析
为了验证本文算法,选取几组红外行人图像[16]分别采用:自适应高斯阈值分割方法[17],最大类间方差(OTSU)分割方法[18],结合高斯滤波OTSU分割方法,SCM(一种简化参数的PCNN,参数由文献[19]给出)分割方法,基于粒子群算法的PCNN(PSO-PCNN)[20],基于哈里斯鹰算法的PCNN(HHO-PCNN)[21],基于遗传算法的PCNN(GA-PCNN)[10]与AGK-PCNN分割方法进行实验对比,随机选取了6组不同的红外行人图像进行测试,其分割结果如图3所示。
如图3所示,通过视觉观测可知,原始红外行人图像噪声极大且背景与行人亮度对比度低,实验结果显示,自适应高斯阈值分割方法、OTSU方法、结合高斯滤波的OTSU方法等传统的分割方法在处理图像时难以应对这类红外行人分割问题,而本文方法可有效地滤除噪点,加强目标行人的观测亮度,得到的分割效果显著优于传统方法。由图3可以看出,本文算法的红外行人图像分割十分接近参考真值,达到了很好的分割效果。在第1个参考图像中,行人与背景几乎混杂在一起,但本文算法在对行人的提取效果上依旧优于其他算法,在极端情况下不会出现目标观测不到的情况。
注:每个子图从左至右红外图像编号分别为IMG_00005,IMG_00007,IMG_00011,IMG_00015,IMG_00017,IMG_00022
另外,本文算法与PSO-PCNN,HHO-PCNN,GA-PCNN的不同之处主要是本文的自适应多尺度PCNN模型在参数优化阶段结合了多尺度理论使得图像具有尺度特性,能够显著消除红外图像的噪声且提升行人区域的连接强度,从图3中可以看到,本文算法获得了更清晰的分割边界。
为了对本文算法进行定量评价,采用了IoU与Dice作为评价标准。IoU(Intersection over Union)是对象类别分割问题的标准性能度量。给定一组图像,IoU度量给出了在该组图像中存在的对象的预测区域与地面实况区域之间的相似性,可以定义为
(19)
式中,PT,PF,NF分别为真阳性、假阳性和假阴性计数。表1是利用IoU得分对实验图片的定量比较,得分最高值为1,得分越高,越接近参考真值。
Dice系数是一种集合相似度度量函数,通常用于计算两个样本的相似度(取值范围为 [0,1]),即
(20)
式中:PT为目标区域与分割部分重合的部分;PF为分割结果中非目标区域的部分;NF为目标区域中分割部分不包含的部分。表2为Dice对比结果,Dice值越接近于1,分割效果越好。
像素准确率是预测正确的结果占总样本的百分比,表达式为
(21)
准确率能够判断总的正确率,能够作为一种很好的指标来衡量结果。
从表1和表2中可以看出,本文算法在所有进行实验的红外行人图像上IoU,Dice得分均为最高,在表3像素准确率的计算中,本文的AGK-PCNN模型的值在几组实验当中,计算结果都高于其他模型,表明分割的准确率也有所提升。这种定量结果与人眼的视觉效果是一致的。在视觉效果上,一些常用的经典分割方法对这种红外行人图像很难达到好的效果。
表1 不同方法对红外行人图像分割结果的IoU得分
表2 不同方法对红外行人图像分割结果的Dice得分
表3 不同方法对红外行人图像分割结果的像素准确率
从图3实验结果中可以得出,对噪点直接进行高斯滤波难以达到好的效果,例如OTSU和结合高斯滤波的OTSU分割方法,其所起作用反而使得小目标难以识别,造成更大的分割困难,而SCM分割方法也对红外图像难以取得好的适应性,对比PSO-PCNN等可知,结合自适应高斯核参数调整的算法能达到更好的行人分割效果。本文算法采用智能算法快速寻优,结合多尺度空间理论,解决了在不同尺度情形下图像行人的精细分割和图像噪声情况的适应程度,达到了良好的自适应图像分割效果。
6 结束语
针对现有红外图像分割算法难以通用以及存在设置参数困难的问题,提出了一种红外行人图像分割的AGK-PCNN算法。该算法有效结合多尺度空间的特性和PCNN模型的特点,并在此基础上利用PSO算法实现参数自适应选择优化,达到了更好的红外图像自适应分割效果。与经典的分割算法相比,本文算法在视觉效果和客观指标上均取得了显著的改进,是一种有效的红外行人图像分割算法。