红外搜索跟踪系统的虚警率降低方法
2022-04-25宋治杭林丹丹杜欣悦
宋治杭,张 晋,朱 亮,林丹丹,杜欣悦,林 宇
(昆明物理研究所,云南 昆明 650223)
0 引言
大视场多目标监视是目前红外搜索跟踪领域研究的热点,该领域正朝着高分辨率、超大视场成像的方向发展[1-3]。对应大视场下多目标的监视与跟踪任务,视场的增大,红外图像的背景成分变得极其复杂,又加上来自地面建筑物、地杂波等的干扰,极其容易在图像区域产生伪目标,造成红外全景搜索跟踪系统的虚警[4-7]。在实施全景搜索跟踪的任务过程中,视场中难免出现虚假运动目标,其中既有静止物体,也可能包含运动方向与真实目标不一致的物体。如果不能对以上虚假目标及时进行识别并剔除,将会严重影响后续搜索跟踪任务的执行。
针对红外搜索跟踪容易遇到的上述问题,王卫华[8]等人提出了一种基于兴趣区(region of interest)提取的目标实时监测算法,根据目标运动特性与灰度特性快速提取目标可能存在的兴趣区,再针对兴趣区内的局部目标图像切片,进一步剔除虚假目标干扰;陈炳文[9]提出一种基于时空融合与粒子滤波的弱目标检测算法,首先利用像素点的帧间和邻域相关性,采用短程非参数核建模算法检测候选目标,接着使用粒子滤波跟踪候选目标,以剔除虚假目标得到真实航迹;王雪梅[10]等提出了基于背景检测的单帧检测弱小目标改进算法,结合多方向多极梯度算法,对背景预测初步检测出来的可能目标点进一步检测,从而排除虚假目标;罗举平[11]等针对红外目标检测任务,提出了变门限检测与跟踪的方法,减少了虚假量测的数量。张艳艳[12]等引入Lucas-Kanade(LK)光流法,对光流结果进行最大类间方差分割,视光流不连续区域为真实运动目标;西北工业大学[13]利用Lucas-Kanade 光流法对连续帧红外图像检测疑似运动区域,再通过SVD(singular value decomposition)分解与目标背景重构检测弱小目标;Lei Wang[14]等利用先验概率降低视频中目标检测的误报率;Recchia Giuseppe[15]等将Lucas-Kanade 光流法应用于无人机光电视避系统,有效降低了误警率与虚警率。然而上述方法并不专门针对全景图像,因此对于全景图像中同一运动目标帧间距离过大造成的影响,这些方法并不能有效解决。类似方法甚至会错把真实运动目标当作虚假目标加以剔除,因而并不适用于降低红外搜跟系统的虚警率。本文针对以上问题提出了一种基于Lucas-Kanade 光流特征的红外全景系统虚假目标甄别与剔除的方法。
1 建立图像金字塔
选取前后相邻两帧红外全景图像I和J,为图像I和J分别建立金字塔表达 {IL}L=0,...Lm和 {JL}L=0,...Lm,这里Lm通常取为3,也就是金字塔层数一般为4。把原始图像作为第0 层,通过高斯滤波并令宽高缩小2L倍的图像作为第L层,多层图像组合类似金字塔,如图1所示。
图1 图像金字塔的建立Fig.1 Image pyramid construction
2 计算前后帧图像光流
由于红外全景搜索跟踪系统的任务在于利用360°全景影像实现对周围环境态势感知的能力,因此往往将目标定为包括人、车辆、舰船以及飞机等相比环境温度较高的物体。在实际图像中该类目标一般呈现较高的灰度值,因此本文利用二值化将图像中的高亮目标都事先提取出来,在这些高亮目标区域中随机选择若干像素记为该目标对应的像素点u,接下来利用LK 光流法思想依次从最高层开始计算目标像素点u对应的LK 光流dL,并取LK 光流dL对应层光流初始值gL的和为下一层光流的初始值,直至迭代到原始图像层(第0 层),最终获取目标像素点u在原始图像层的光流值按照如下步骤计算图像光流d,接着利用光流d的模值与角度为主要特征,使用聚类算法将真实运动目标和虚假运动目标区分开来。首先计算前后帧图像间的光流:
初始化最高层光流的初始值gLm= [ 0 0]T,令L=Lm,每迭代一次,L减1,直到L=0:
由于图像金字塔建立过程中,图像的长宽依次缩小一倍,因此针对第L层图像,计算图像IL中像素点u对应的位置:
计算图像IL在x方向的梯度:
计算图像IL在y方向的梯度:
计算空间矩阵:
式中:wx、wy表示u处具有相同光流邻域的大小。
初始化迭代LK 光流初始值d0=[0 0]T;令k=1,每迭代一次k加1,直到匹配差异向量小于1:
定义此时(x,y)处前后两帧图像的差异δI(x,y),则有:
计算图像差异:
计算匹配差异向量:
计算光流:
为下一次迭代提供初始值dk=dk-1+ηk;
结束k上的迭代,得到第L层图像上的光流优化值dL=dk;
为第L-1 层图像提供光流初始值gL-1=2(gL+dL);
结束L上的迭代,最终计算得到光流d=g0+d0;
得到图像J中对应点坐标v=u+d。
3 重新表达目标光流
上述步骤求得前帧图像I中目标区域像素点u在前后两帧图像对应的光流d,以及该像素点在后帧图像J中的位置v。其中光流d为一个二维向量,该向量标识图像平面内由位置u指向位置v的运动位移。而同一个运动目标其运动位移应该是一致的,这就给区分真实运动目标和虚假运动目标带来了先决条件。针对图像I中经过二值化后获得的目标区域,每个区域选择m个像素点(u1,u2,…,um),本方案根据图像视场范围以及处理器运算能力综合考量选择m=5。对于每一个像素点ui,按照第2 章所述方法得到对应的光流d(ui),然后利用算术平均值来求取对应目标区域Φ的光流dΦ:
4 目标分类
对于地面建筑或者地杂波等产生的虚假目标,由于全景成像系统镜头本身的运动,造成其通过上述计算也会产生光流值,但该光流值并不能反映像素点的实际运动。虚假目标光流值与真实目标光流值会有显著不同,这主要表现在光流向量的方向和大小两个方面。
1)虚假目标由于本身静止或运动范围很小,在叠加了红外摄像机自身旋转运动后,其光流方向会有高度趋同性,而真实运动目标的光流方向应与其实际位移方向一致,从而造成虚假目标与运动目标在运动方向上的显著区别;
2)虚假目标因为本身基本处于静止状态,表征运动位移的光流仅反映红外摄像机自身的运动,实际观察光流值大小应不大于10 个像素,这也是区别于实际运动物体的显著特征。
最后利用聚类算法将得到的目标光流进行分类,由图2可以发现真实运动目标与虚假运动目标的光流分布区域有较大区别,为了把二者快速区分开来,首先在离θ轴较近的光流表征向量中随机选择一个作为第一个初始聚类中心,然后选择距离该中心最远的一个光流表征向量作为第二个初始聚类中心,通过计算各光流表征向量与初始化聚类中心的距离,将这些光流表征向量重新划归至距离最近的类别,并以新类别中各光流表征向量的均值作为新的聚类中心,持续迭代直至光流表征向量的分配聚类情况没有更新,以实现最终把真实运动目标(类别1)与虚假静止目标(类别2)分开的目的。
图2 光流向量2D 分布Fig.2 Optical-flow vector 2-D lay out
5 实验结果
为验证本文的虚警率降低方法是否具有普遍性,项目组利用研发成功的红外全景成像设备采集不同环境下(室内、室外)的中波红外全景图像,在Windows操作系统下使用Visual C++开发环境将本文算法实现,将不同场景下前后两帧全景图作为输入,以验证算法有效性。
观察图3和图4可以发现,无论室外还是室内环境,复杂背景下总会引入干扰,同时搜索跟踪系统自身旋转导致其中的高亮物体都会得到表征运动的光值,因此很多由于干扰产生的伪目标极易被搜索跟踪系统误判为真实运动目标。引入本文算法后,系统对输入的前后两帧全景图像计算LK 光流,随后将重点区域光流进行包括大小与方向的比对,按照聚类思想将其实施二分类,重复迭代直至真实运动物体被区分出来。根据图3与图4中处理后图像可以发现,红外全景图像中的真实运动物体均以实线框标记出来,而由于干扰造成的虚假运动目标被虚线框标记出来,由此可见本文算法较好地将红外搜索跟踪系统所获全景场景中的虚假运动目标加以抑制,从而有效降低了该类系统的虚警率。
图3 虚假运动目标剔除效果(室内)Fig.3 False motion target elimination(indoor)
图4 虚假运动目标剔除效果(室外)Fig.4 False motion target elimination result (outdoor)
6 结论
红外全景监控设备是未来红外热像系统化发展的主要趋势,而大视场的引入必然加大后续图像处理设备的工作量,对于嵌入式图像处理系统由于本身运算能力有限,因此在预处理阶段自动排除虚假目标以减轻后续处理运算的压力就显得尤为必要。本文所述方法通过对实际采集的红外全景序列图像加以分析,很好地剔除了造成干扰的虚假运动目标,实验结果也验证了该方法的有效性。未来将把该方法向以GPU/FPGA+DSP 为主处理器的嵌入式平台移植,同时针对特征提取阶段做更为深入的研究融入更多特征以提升虚假目标检测效果,为红外搜索跟踪系统等产品提供有效的技术支持。