基于稀疏表示的红外小目标跟踪
2013-06-23郑江滨
李 志,郑江滨
(西北工业大学 计算机学院,陕西 西安 710129)
现代高技术战争中,在目标距离成像系统尽可能远的地方对目标进行捕获跟踪,是红外精确制导系统中的重要部分。远距离目标在视场中常以小目标的形态出现,由于能量衰减和传感器噪声的影响,小目标容易被背景杂波淹没。因此,设计一种鲁棒的红外小目标跟踪算法,是一项既有实际应用意义又有挑战性的课题。
红外目标跟踪主要分为基于滤波理论的目标跟踪方法和基于Mean Shift的目标跟踪方法[1]。基于滤波理论的目标跟踪方法将目标跟踪问题转化为状态估计问题,使用卡尔曼滤波器或粒子滤波器及相关改进来跟踪目标[2-3]。基于Mean Shift的目标跟踪方法,使用概率密度函数对目标进行建模,往往使用巴氏距离衡量模型之间相似度,通过梯度下降法快速定位目标[4]。红外小目标跟踪方法中,由于形状、纹理等信息不稳定,多使用灰度直方图[2],面积和灰度均值等统计特征[3]对小目标建模,然而这些传统模型对噪声敏感,在某些情况下导致跟踪失败。
针对上述情况,文中提出一种稀疏表示目标建模和贝叶斯推理相结合的红外小目标跟踪方法。该方法将表征目标的模板向量和表征遮挡及噪声的正负琐碎向量级联起来,形成对噪声不敏感的稀疏表示模型;在贝叶斯推理框架下使用图像子块系数向量的目标模板重构误差作为观测模型,选择最小重构误差处为小目标的最终位置,充分利用帧间相关性实现小目标的鲁棒跟踪。
1 算法主要流程
文中算法主要分为2部分:首先是稀疏表示目标建模初始化阶段,在红外图像序列F1,F2,…,Fn的前帧中手动标识出目标模板向量,结合表示噪声和遮挡的正负琐碎向量构建目标的超完备字典,归一化之后形成对噪声和遮挡不敏感的小目标稀疏表示模型;二是跟踪阶段,在贝叶斯推理框架[5]下,使用二阶自回归模型描述小目标的运动,预测小目标下一时刻的位置,对于采样得到的每一个图像子块,使用L1方法[6-9]计算其在初始化阶段所得超完备字典下的系数向量,使用图像子块系数向量的目标模板重构误差作为观测模型,寻找最小重构误差处为被跟踪目标位置。
2 稀疏表示目标建模
鲁棒的目标表示模型对于目标跟踪非常重要。稀疏表示具有抵抗噪声和干扰的能力。文献[10]就利用稀疏表示的这些优点,构建人脸模板向量字典,实现了鲁棒的人脸识别。文献[11]使用高斯亮度模型构造的超完备字典表示小目标,实现单帧红外小目标的检测。稀疏表示用于目标跟踪主要分为两步:首先构建表征目标的超完备字典,然后通过计算目标模板重构误差来衡量模型之间的相似程度。
2.1 目标超完备字典构建
图像稀疏表示理论中一个重要问题就是稀疏字典的构建,稀疏字典的构建方法一般分为两类,第一类就是将标准正交基级联,常用的标准正交基包括傅里叶基、小波基和Gabor基等[12];第二类是从训练样本中采用某种学习方法得到适用于特定任务的字典,文献[13]利用K-SVD算法来生成具有通用性的字典,完成图像去噪任务,文献[14]直接利用整体目标模板向量级联琐碎向量构建字典,实现可见光下运动目标的鲁棒跟踪。文献[5,6,15,16]利用局部稀疏表示模板构建字典,实现可见光下运动目标的鲁棒跟踪。文献[12]的研究表明,使用学习方法构建的字典的性能优于傅里叶、小波等标准正交基级联构造的字典。
本文将目标模板向量和表征噪声及遮挡的正负琐碎向量级联形成表示小目标的超完备字典。主要过程如下:
给定包含个目标模板的集合T=[t1,t2,…,tn],其 中ti∈Rd(i=1,2,…,n)由r行c列的目标模板图像子块Ii∈Rr×c按列拉直形成,则有d=r×c。将目标图像子块按列拉直形成的列向量为y,则可以用目标模板集合T的线性展开近似表示,
其中a=(a1,a2,…,an)T∈Rn为目标系数向量。
考虑到噪声和干扰可能会出现的情况,目标线性表示式(1)可以写为
其中ε∈Rn为误差向量。ε中的非0元素表示相应位置出现噪声或干扰。在目标模板集合T的基础上级联琐碎向量集合V=[v1,v2,…,vd]∈Rd×d,将目标和干扰统一到线性表示框架下[5],
其中琐碎向量vi∈Rd中除去第i个元素为1,其他元素均为0,V形成一个单位矩阵,e称为误差系数向量。
根据式(3),除去目标向量会在T和V级联基下形成稀疏表示以外,与目标模式完全相反的向量也会形成稀疏表示,仅仅是系数变为相反数而已,为了去除目标相反模式的影响,限制系数向量全为正。式(3)可写为,
其中e+,e-∈Rd为表征噪声和遮挡的正负琐碎向量,B=[T,V,-V]∈Rd×(n+2d),矩阵B为目标模板向量和琐碎向量组成的超完备字典,c为向量y在超完备字典B下的系数向量。
使用上述方法构造的超完备字典可以有效的表示小目标,目标和背景在所构建的超完备字典下的系数向量表现出完全不同的特性。目标在超完备字典下的系数向量具有稀疏性,即系数向量中大部分元素均有较小的值,只有少部分元素具有较大的值;背景系数向量则不具有稀疏性,即所有元素均具有较小的值。目标和背景稀疏表示示意图如图1所示,可以看出目标系数向量中大部分元素接近0,只有少数元素的值较大;而背景系数向量中的大部分元素具有非0的较小值。
图1 目标和背景稀疏表示示意图Fig.1 Diagram of target and background’s sparse representation
2.2 目标模板重构误差
目标图像子块和背景图像子块在2.1节所构造超完备字典下的系数向量有很大不同,利用目标和背景图像子块系数向量的差异,可衡量衡量模型之间的相似程度。本文使用目标模板下的重构误差作为与目标相似性的衡量手段,可去除琐碎向量所对应噪声的影响,目标模板下重构误差定义为
其中y为图像子块向量,T为超完备字典B中的目标模板部分,a为系数向量c中与目标模板T对应的目标系数向量。
计算图像子块的目标模板重构误差,首先需要求解方程(4)的稀疏表示如下:
其中‖c‖0为系数向量c的L-0范数,定义为c中非零元素的个数,这是一个NP难的问题,需要穷举所有可能才能得到最优解,文献[10],[14]将式(5)转化为L-1范数优化问题,同时考虑重构误差
其中‖·‖1和‖·‖2分别为向量的L-1和L-2范数,‖y-Bc‖22表示重构误差,λ是平衡稀疏度和重构误差的稀疏因子。使用文献[12-13]的工具包进行方程(7)的稀疏求解。得到系数向量之后,就可以根据公式(5)计算图像子块的目标模板重构误差。
使用目标模板重构误差能够有效的衡量图像子块和目标之间的相似程度,重构误差描述相似度示意图如图2所示,相似度与重构误差成反比,放大示意图为方便显示,亮度越高表明当前位置图像子块为目标的可能性越大。可见,目标模板重构误差是一种有效的相似度衡量手段。
图2 重构误差描述相似度示意图Fig.2 Diagram of similarity based on reconstruction error
3 跟踪方法
目标跟踪问题在贝叶斯推理框架可转化为状态估计问题,估计目标在每一帧中的运动状态。给定1到t时刻的观测集合y1:t={y1,y2,…,yt},目标状 态可以通过最大后验 概率计 算
得到
其中xit是t时刻第i个状态采样,后验概率p(xt|y1:t)可以通过贝叶斯理论递推得到
其中p(xt|xt-1)和p(yt|xt)分别描述运动模型和观测模型。使用粒子滤波方法[17]可以有效计算概率分布。
使用二阶自回归模型描述目标的运动方式,则有
其中Pt=(r,c)表示t时刻目标的中心坐标,U为零均值高斯随机过程。
令xt=(vr,vc)表示t时刻目标的中心运动速率即xt=Pt-Pt-1,则有
其中∑为对角矩阵,对角元素为中每个元素的方差。
p(yt|xt)是观测yt在状态xt下的似然概率,使用式(5)中的目标模板重构误差定义似然概率
其中TEt为t时刻yt目标模板下的重构误差。
下面给出红外图像序列中跟踪小目标的具体过程:
1)给定图像序列F1,F2,…,Fn利用前帧中手动标识出的目标模板向量,构造目标模板集合,级联正负琐碎向量,形成可以表示小目标的超完备字典;
2)根据p(xt|xt-1)=N(xt;xt-1,∑)描述的小目标运动模型,在第t帧进行采样得到图像子块,并且计算每个采样的先验概率;
3)对于2)中每一个采样形成相应的图像子块,采用公式(7)计算其在超完备字典下的系数向量,采用公式(12)计算似然概率,结合先验概率计算出后验概率,后验概率最大处为被跟踪目标位置,使用最小方框图标识出目标;
4)对t+1帧进行2)和3)操作,直至处理完成最后一帧图像。
4 实验结果和分析
采用云天背景下连续采集的450帧红外序列实验,单帧图像分辨率为320×240。实验中选取初始化帧数为M=10,图像子块大小为16×16,稀疏度平衡因子λ=0.1,粒子数为N=100。
文中方法和传统的以直方图表示目标的粒子滤波跟踪[18]方法进行对比。传统方法采用灰度直方图描述目标,从260帧左右开始丢失目标,跟踪结果一直在(185,102)周围小幅摆动,这是因为目标被噪声部分遮挡,直方图模型无法对遮挡和噪声建模,从而导致跟踪失败;本文方法采用稀疏表示对目标建模,具有对噪声和遮挡建模的能力,出现噪声和遮挡之后,仍能够正确跟踪目标。跟踪结果示意图如图3所示,传统方法跟踪结果使用方框1框出目标,文中方法使用方框2框出目标。跟踪至260帧时,传统方法和文中方法均能框出目标;300帧时,传统方法跟踪结果仍为260帧跟踪结果,已丢失目标,本文方法可以正确框出目标。
图3 跟踪结果示意图:方框1为经典粒子滤波跟踪结果,方框2为本文方法的跟踪结果Fig.3 Diagram of tracking results:rectangle 1 for traditional result,rectangle 2 for this paper’s result
比较跟踪方法的精度,以手动标识目标为标准结果,定义第跟踪误差为跟踪结果和标准结果的欧氏距离,同时定义帧累积跟踪误差
其中(tix,tiy),(six,siy)2分别表示跟踪结果和标准结果。
跟踪轨迹误差图如图4所示,可以看出,文中方法的跟踪误差始大部分帧中小于传统方法误差,累积跟踪误差曲线也说明本文方法跟踪效果优于传统方法。
图4 跟踪误差曲线Fig.4 Tracking error curve
5 结束语
针对传统模型对噪声敏感而导致小目标跟踪失败的情况,本文提出一种稀疏表示目标建模和贝叶斯推理相结合的红外小目标跟踪方法。构建目标的稀疏表示模型,对目标亮度变化和噪声出现具有良好的适应能力,在贝叶斯推理框架下使用目标模板重构误差作为观测模型,充分利用帧间相关性。实验证明算法能够实现小目标的鲁棒跟踪。由于稀疏表示计算量较大,如何提高算法效率是进一步的研究内容。
[1]许彬,郑链,王永学,等.红外序列图像小目标检测与跟踪技术综述[J].红外与激光工程,2004,33(5):482-487.XU Bin,ZHNEG Lian,WANG Yong-xue,et al.Survey of dim target detection and tracking ininfrared image sequences[J].Infrared and Laser Engineering,2004,33(5):482-487.
[2]崔丽洁,郑江滨,李秀秀.基于SVD背景抑制和粒子滤波的弱小目标检测[J].计算机应用研究,2011,28(4):1553-1555,1572.CUI Li-jie,ZHENG Jiang-bin,LI Xiu-xiu.Detecting small targets based on SVD for background suppression and particle filter[J].Application Research of Computers,2011,28(4):1553-1555,1572.
[3]汪鲁才,易锡年,陈小天.基于自适应跟踪窗的红外小目标跟踪方法[J].计算机应用研究,2012,29(8):3185-3188.WANG Lu-cai,YI Xi-nian,CHEN Xiao-tian.Algorithm for dim target tracking in infrared image based on adaptive tracking window[J].Application Research of Computers,2012,29(8):3185-3188.
[4]程建,杨杰.一种基于均值移位的红外目标跟踪新方法[J].红外与毫米波学报,2005,24(3):231-235.CHENG Jian,YANG Jie.Novel infrared object tracking method based on mean shift[J].J.Infrared Millim.Waves,2005,24(3):231-235.
[5]WANG Qing,CHEN Feng,XU Wen-li,et al.Online discriminative object tracking with local sparse representation[C]//IEEE Workshop onApplications of Computer Vision(WACV),2012:425-432.
[6]JIA Xu,LU Hu-chuan,YANG Ming-suan.Visual tracking via adaptive structural local sparse appearance model[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2012:1822-1829.
[7]Kim S J,Koh K,Lustig M,et al.Simple Matlab Solver for l1-regularizedLeast Squares Problems. [EB/OL].http://www.stanford.edu/~boyd/l1_ls.
[8]Kim S J,Koh K,Lustig M,et al.A method for large-scale L1-regularized least squares[J].IEEE Journal on Selected Topics in Signal Processing,2007,1(4):606-617.
[9]李亚峰,王纯.红外摄像技术及输变电红外图谱数据库系统的建立[J].陕西电力,2012(1):60-63,85.LI Ya-feng,WANG Chun.Infrared photography technology and infrared mapping database system establishment for power transmission& transformation[J].Shaanxi Electric Power,2012(1):60-63,85.
[10]Wright J,Yang A Y,Ganesh A,et al. Robust face recognition via sparse representation [J].IEEE Trans.On Pattern Analysis and Machine Intelligence,2009,31(2):210-227.
[11]赵佳佳,唐峥远,杨杰,等.基于图像稀疏表示的红外小目标检测算法[J].红外与毫米波学报,2011,30(2):156-161,166.ZHAO Jia-jia,TANG Zheng-yuan,YANG Jie,et al.Infrared small target detection based on image sparse representation[J].Infrared Millim.Waves,2011,30(2):156-161,166.
[12]Wright J,Yi Ma,Mairal J,et al.Sparse representation for computer vision and pattern recognition [J].Proc.IEEE,2010,98(6):1031-1044.
[13]Elad M,Aharon M.Image denoising via sparse and redundant representation over learned dictionary[J].IEEE Trans.On Image Processing,2006,15(12):3736-3745.
[14]MEI Xue,LING Hai-bin.Robust visual tracking using l1 minimization [C]//IEEE 12th International Conference on Computer Vision,2009:1436-1443.
[15]ZHONG Wei,LU Hu-chuan,YANG Lin-suan.Robust object tracking via sparsity-based collaborative model[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2012:1838-1845.
[16]LIU Bai-yang,HUANG Jun-zhou,YANG Lin,et al.Robust tracking using local sparse appearance model andK-Selection[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2011:1313-1320.
[17]Isard M,Blake A.CONDENSATION—Conditional Density Propagation for Visual Tracking[J].International Journal of Computer Vision,1998,29(1),5-28.
[18]Rollason M,Salmond D.A particle filter for track-beforedetect of a target with unknown amplitude[C]//Proc of IEEE Conference on Target Tracking :Algorithms and Applications,2001:16-17.