APP下载

基于在线学习的雷达目标跟踪技术研究

2018-10-12耿利祥尹晓燕蔡文彬

雷达与对抗 2018年3期
关键词:跟踪器杂波检测器

耿利祥,尹晓燕,蔡文彬,李 伟

(中国船舶重工集团公司第七二四研究所,南京 211153)

0 引 言

传统的α-β滤波和卡尔曼滤波对线性系统高斯过程的跟踪性能好,但对于非线性非高斯过程性能较差,扩展卡尔曼滤波以及不敏卡尔曼滤波是针对非线性过程进行改进的。基于蒙特卡洛方法的粒子滤波算法在非线性、非高斯系统均表现出一定优越性,近年来得到了研究人员的青睐[1]。交互多模型跟踪算法在机动目标跟踪方面表现出了强大的能力[2],另一类算法是利用检测的方法跟踪目标。Collin[3]通过寻找最具分辨率的特征空间计算其与目标和背景的相似度比值,选择比值高的候选样本作为目标。Grabner[4]提出了基于在线Boosting的跟踪算法,利用了集成学习算法的思想。为了能够解决长时间目标稳定跟踪问题,Kalal Z[5]在视频跟踪中引入跟踪—学习—检测(Tracking-Learning-Detection,TLD)的跟踪机制,从而达到目标长时间稳定跟踪的目的。在长时间雷达目标跟踪任务中,杂波的干扰和目标本身的机动性是导致目标跟踪不稳定的两个主要原因。一方面,复杂的杂波环境直接导致目标被遮蔽、误检,使目标跟踪很容易关联到杂波,导致目标跟丢跟错。另一方面,机动目标运动模式参数变化较大,单一模型很难及时准确辨识机动参数,造成模型的不准确,导致算法性能下降。

本文采用了TLD跟踪框架,引入了在线学习机制,将雷达目标检测器和跟踪器通过在线学习算法结合在一起,充分发挥了检测器和跟踪器的优势,同时将多模型算法作为雷达TLD框架中的跟踪器,提出了多模型优化的在线学习雷达目标跟踪算法(Multiple Model Tracking Learning Detection,MM-TLD),从而提高目标长时间跟踪过程中目标跟踪的鲁棒性,减少目标状态变化和干扰引起的不稳定性。

1 多模型优化的在线学习雷达目标跟踪算法

1.1 跟踪-学习-检测(TLD)算法框架

作为一种全新的跟踪架构,TLD将跟踪任务分为跟踪、学习和检测3个部分。通过引入P-N学习[6],将单纯的跟踪器和检测器联系起来,利用目标更多的时间和空间的信息,使目标更加稳定。其流程如图1所示。检测器不断地修正跟踪器。跟踪器对目标进行跟踪,并且更新检测器。学习器估计出检测器和跟踪器中的错误并及时对它们进行更新。

1.2 基于多模型优化的在线学习雷达目标跟踪算法(MM-TLD)

作为解决目标机动的有效方法,在目标的长时间跟踪过程中,多模型针对不同的过程噪声级建立不同模型,并将不同滤波结果经由专家学习机制生成目标检测分类器的输入样本。

1.2.1 多模型跟踪器

多模型算法(Multiple Model,MM)[7]可以在目标运动模式的结构和参数起伏很大的情况下利用不同的模型估计变化的运动参数,以适应目标多种参数变化,减少目标跟丢的情况。对于雷达目标而言,扫描时所产生的属性量测均可作为目标属性特征建立目标的状态向量X。令Mj表示具有先验概率Pr{Mj}=μj(0),(j=1,2,…,r)的模型j是正确的事件。在模型j的假定下,k时刻的量测的似然函数为

(1)

μj(k)

(1)

利用上述概率作为权重进行加权平均就是目标的状态估计,因此最终得到的组合状态和协方差估计为

(2)

(3)

跟踪器中多个滤波器并行工作,每个模型对应的概率在根据学习器学习后模型反馈结果进行更新,纠正跟踪器中的模型估计,以提高模型估计的概率的准确性。

1.2.2 检测器

目标检测器采用了Adaboost算法[8],利用一组串行的弱分类器级联成一个强分类器。在对待识样本分类时,前一级分类器判决为正样本则送入后一级分类器,负样本则直接输出。每一级的分类器均判决为正的样本作为正样本输出。Adaboost算法结构的示意图如图2所示。

1.2.3 学习器

P-N学习是一个新的基于结构化、未标记数据的学习训练方法。数据中的结构被称为正约束和负约束。正约束指定正样本可接受特征。负约束指定负样本可接受特征。具体实现步骤如下:

首先以有监督学习的方式利用被标注为正负样本的目标学习训练一个初始的分类器。然后,将正样本加入到正样本库内,将负样本训练分类器输出给检测器,检测器根据输入的新分类样本把结果输出给P-N专家学习;P-N专家检查分类结果,将漏检目标更新到正样本库,将虚假检测更新到负样本库,再次训练分类器,重复迭代直到满足收敛条件为止。将P-N专家约束得到的结果送给跟踪器,更新每个模型的概率。

基于多模型优化的在线学习雷达目标跟踪算法流程如图3所示。

2 仿真实验与结果分析

为了验证本文算法在长时间雷达目标跟踪过程中的鲁棒性和稳定性,实验运用蒙特卡洛仿真方法仿真了多次长时间跟踪的数据集,并对每一组数据采用了经典的卡尔曼滤波算法和本文算法作对比。

考虑到雷达回波的起伏以及受杂波的影响,由于雷达回波受雷达目标散射截面的影响,因此利用RCS的分布特征χ2分布来表征雷达目标回波起伏。χ2分布概率密度函数为

(4)

其中,λ为双自由度。

试验中,地杂波采用瑞利分布,航迹噪声采用高斯分布。χ2分布双自由度λ取2,σ为瑞利系数取0.5,叠加高斯噪声均值取0,方差取50,时间间隔取2 s。仿真实验中采用了500组目标作为实验对象,以相同的算法对该组目标进行跟踪,其中一个机动目标的仿真航迹和跟踪结果如图4所示。

从图4中可以看出,目标机动性较强的情况下,卡尔曼滤波在跟踪过程中由于受到了杂波影响导致跟踪到错误的量测,造成了目标跟丢;而本文MM-TLD算法由于利用在线学习机制,当有错误跟踪或者跟丢情况发生时学习机制通过P-N学习及时发现,并且可以通过检测器重新初始化跟踪器,最终及时纠正模型中错误跟踪,达到长时间稳定鲁棒跟踪的效果。

为了测试目标跟踪受杂波影响,实验模拟了虚警概率10e-3、探测概率0.9条件下的500组目标。每组目标个数为10个匀速运动目标,并计算每批目标跟踪航迹与模拟的真实航迹的均方根误差(RMSE),同时测量了算法的平均耗时。实验模拟了虚警3*10e-3、探测概率0.8条件下500组目标。每组目标为10个匀速运动目标,并采用了文献[9]的方法计算了目标的平均稳定跟踪周期数。最后,实验模拟了虚警概率10e-3、探测概率0.9条件下的500组目标。每组目标个数为10个最大加速度为3 g的机动运动目标,将跟丢的目标个数除以总的目标个数作为目标跟丢率。实验中,算法采用了目标的9种属性特征,其中包括点迹中心、高度及俯仰质量、解模糊识别码、点迹回波数、幅度、环境估值、回波展宽度、多普勒特性、关联质量。跟踪数据率2 s。算法运行平台为CPU:Intel®CoreTMi5-3230M,主频:2.6 GHz,内存4 GB;算法运行环境:matlab。表1反映了两种算法实验的跟踪结果均方根误差、跟丢率、每一离散时刻平均耗时和平均稳定跟踪时间。

表1 算法性能比较

表1中结果反映出卡尔曼滤波和本文MM-TLD算法在跟踪性能上有明显差异。长时间跟踪任务对目标跟踪的稳定性要求较高,因此保证目标一直不跟丢很重要。MM-TLD算法的跟丢率较之传统的算法有了显著的改善。虽然本文MM-TLD算法的耗时高于卡尔曼滤波算法,但在2 s数据率的数据处理中,本文算法的多批目标的处理时间可以满足数据处理的实时性,在高稳定性的长时间跟踪任务中可以满足任务要求,在此基础上MM-TLD算法的鲁棒性和稳定性更优越。

3 结束语

本文提出了一种基于在线学习的MM-TLD雷达目标跟踪算法。该算法能够在杂波环境中准确地对雷达目标进行长时间精确跟踪。算法通过引入P-N学习,将目标检测和目标跟踪结合使用,在TLD架构的基础上利用多模型跟踪器产生多个跟踪训练正样本,并利用P-N学习纠正模型中的错误,在跟丢情况下通过检测器重新初始化跟踪器成功在杂波环境中对雷达目标实现长时间稳定跟踪。相较于传统的跟踪方法,本文MM-TLD算法在保证实时性的基础上目标跟丢率远比传统卡尔曼算法低,取得了更为精确而稳定的跟踪效果。

猜你喜欢

跟踪器杂波检测器
基于高速公路事故黑点的检测器优化布设
光伏跟踪器阵列跟踪精度的测算方法研究
参数可调的联合子空间目标检测方法 *
一种改进的基于背景自适应的杂波图算法
基于近程杂波协方差矩阵构造的俯仰滤波方法
一种自适应双参数杂波图检测方法
某雷达杂波数据分析及杂波图技术研究
佛山南海:为油气回收装上“跟踪器”
超长待机的自行车位置跟踪器
基于均匀性判定规则的统计MIMO雷达多通道融合检测技术