基于机器学习的多算法融合航迹稳健起始方法
2022-05-24聂熠文刘军伟孟凡钦沈晓静
李 川,聂熠文,刘军伟,孟凡钦,沈晓静
(1.中国电子科技集团公司第38所,安徽合肥 230031;2.孔径阵列与空间探测安徽省重点实验室,安徽合肥230031;3.四川大学空天科学与工程学院,四川成都 610065;4.四川大学数学学院,四川成都 610065)
0 引言
航迹起始是雷达系统进行多目标跟踪的基本问题,是后续点航关联、航迹滤波、波门预测等的基础。真实航迹的正确起始与对虚假航迹的有效抑制,对提高雷达目标的跟踪质量,降低虚假航迹、混批、断批的频率,实现多目标快速稳定跟踪十分关键。目前电子对抗和雷达任务环境日益复杂,受雷达量测噪声和环境杂波的影响,航迹起始难以处理。
经典的航迹起始方法主要分为两类:顺序处理方法和批处理方法。其中,常用的航迹起始方法包括启发式规则法、逻辑法、运动建模法、Hough 变换法和修正的Hough 变换法。经典的航迹起始方法可以看作根据一定的规则对雷达观测的组合进行判断以确定其是否为真实目标,这是一个分类问题。目前,机器学习方法在许多领域有着突出的表现,特别是在分类决策领域,决策精度显著优于传统的决策方法。根据这种分类的思路,机器学习和深度学习分类方法可以用于航迹起始方法。
机器学习算法在航迹起始问题上已有初步应用:文献[9]介绍了一种基于随机森林的航迹起始算法,并指出它在强杂波和高测量噪声背景下具有更好的性能;文献[10]提出了一种基于卷积神经网络的雷达航迹起始方法,该方法对杂波背景环境具有较好的适应性;文献[11]针对海面目标跟踪过程受到强海杂波干扰和目标机动等影响,导致传统方法的航迹起始效果较差,出现混批、起始失败和误跟踪等问题,提出了一种基于机器学习支持向量机的海面目标航迹起始算法,采用支持向量机作为分类器。
本文尝试用多种机器学习融合的方法来解决强杂波环境下的航迹起始问题,以提升经典航迹起始算法的性能。在雷达系统航迹起始问题中,由于航迹起始的点与特征较少,这适用于传统的机器学习算法,如随机森林算法、梯度提升树(gradient boosting decision tree,GBDT)。然而,在复杂场景下,单一的机器学习算法难以满足实际需要。根据这一思想,可以使用多机器学习融合决策方法来提高航迹起始的正确率。
随机森林是由多决策树分类模型组成的组合分类模型,通过每棵树的分类结果投票生成最终结果。GBDT 通过采用加法模型以及不断减小训练过程产生的残差来达到将数据分类或者回归的目的。两种模型通过不同的方式利用树结构进行分类,随机森林通过抑制数据方差实现模型优化,GBDT 则通过减少模型偏差提高模型性能。融合利用两个模型不同的优化方向,可实现最终航迹起始模型方差和偏差的双重优化。本文将随机森林与GBDT 算法进行融合,提出一种基于随机森林和GBDT 融合的航迹起始方法,该方法可以在随机森林虚警率低、漏检率高的环境中提升随机森林算法检测性能。
1 随机森林与GBDT基本概念
1.1 随机森林
随机森林分类是由多决策树分类模型组成的组合分类模型,给定新数据,每个决策树分类模型都获得一个分类结果,新数据的分类结果按分类树分类结果形成的分数而定,基本原理流程见图1。
图1 随机森林原理流程Fig.1 Flow chart of random forest
1.2 GBDT
GBDT 是通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。因为训练的过程是通过降低偏差来不断提高最终分类器的精度,所以,对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。
GBDT 使用的决策树是CART 回归树,对于回归树算法来说最重要的是寻找最佳的划分点,即回归树中的可划分点包含了所有特征的所有可取的值。在分类树中最佳划分点的判别标准是熵或者基尼系数,都是用纯度来衡量的,但是在回归树中的样本标签是连续数值,所以再使用熵之类的指标不再合适,取而代之的是平方误差,它能很好地评判拟合程度。GBDT 同时通过梯度提升树来降低偏差,提升最终分类器的精度。GBDT的算法流程见图2。
图2 GBDT原理流程Fig.2 Flow chart of GBDT
2 算法实施方案
2.1 融合算法思想
考虑二元假设检验问题,其包含如下两个假设:①-目标不存在;②-目标存在。
两个假设的先验概率分别是()=和()=。如图3 所示,考虑随机森林(算法1)和GBDT(算法2)的结果融合,每个算法对同一个对象进行检测。
图3 多算法稳健决策融合Fig.3 Robust decision fusion of multiple algorithms
进一步,假设第个算法的漏检率和虚警率分别为P和P。假设每个算法的观测条件概率为p(|H),=1,2。每个算法利用检测规则g()获得检测结果d,=1,2,有
最优融合规则可由式(2)所示似然比检验给出
式中:左边是似然比,右边是贝叶斯假设下的最优阈值。
通过贝叶斯准则可以得到
由于两个算法检测的是同一个对象,两个算法的结果是相关的。忽略其相关性,即假设两个算法结果不相关,则可获得经典的Chair-Varshney 最优决策融合公式
式中:S={:d=},=1,2。
2.2 数据预处理与特征提取
利用启发式规则法对观测数据进行预处理,在避免漏检真实目标的情况下,减少进行检测的观测数据,提高算法效率。
设X,=1,…,为次连续扫描的观测值,满足以下条件的观测组合才能进一步检测。
2)目标加速度的绝对值的最大值为,对于=1,…,-2应满足
3)目标两段速度向量的夹角最大值为,对于=1,…,-2应满足
若X,=1,…,满足以上条件,则得到对应的特征,包括:
2)连续三次扫描的加速度
3)连续三次扫描的速度夹角
以上特征可表示为:
=(,…,v,,…,a,,…,θ)。
2.3 整体流程
算法流程如图4所示。首先对观测点迹组合进行数据预处理,见2.1 节。对通过预处理的数据进行特征提取,接着使用训练好的随机森林和GBDT 以及相应的融合中心进行判别,得到本算法的航迹起始结果。
图4 算法工作流程Fig.4 Flow chart of proposed algorithm
算法中主要包括训练和检测两部分。训练过程主要是利用训练样本集分别训练随机森林和GBDT两个分类算法,估计训练好的分类算法相应的漏检率和虚警率,根据式(4)获得融合中心融合公式。检测过程是通过数据预处理,并将获得的特征分别输入到训练好的随机森林和GBDT 中,获得各自的估计结果,通过公式(4)获得最终的航迹起始结果。
3 仿真实验
本文主要比较启发式规则法、随机森林、GBDT和融合算法性能,以航迹起始漏检概率和虚警概率等指标评价算法性能。启发式规则主要是利用航速、航向、高度等传统航迹特征完成规则筛选,根据规则判断目标航迹是否起始。
在50 km×50 km 的区域内有10 个目标做匀速直线运动,随机生成目标位置与运动方向,目标的速度范围为300~500 m/s。雷达进行4 次扫描,扫描周期为5 s,每次扫描观测到的杂波服从参数的泊松分布,雷达测距和测角的标准差分别是40 m 和0.2°。分别用启发式规则法、随机森林、GBDT 和本文的融合方法进行航迹起始。启发式规则法中,对应速度、加速度和速度夹角的阈值分别为=0 m/s,=1 000 m/s,=50 m/s,=50°。使用随机森林、GBDT 和融合方法进行航迹起始时,数据预处理的阈值与启发式规则法设置相同。设置仿真区域内杂波分布的均值分别为=50、70、90、110,对每一个取值进行多次Monte Carlo 实验,分别统计4 种算法的虚警率(虚假航迹数/总起始航迹数)和漏检率(漏检航迹数/真实航迹数),实验结果如表1 和图5~6所示。
由表1和图5~6可以看出:在同一场景内,启发式规则法漏检概率最低,但其虚警率远高于其他算法,在密集杂波场景中不实用;其他3种算法中,随机森林航迹起始算法的虚警率最低,融合航迹起始算法的漏检率最低,有较好的整体性能。
表1 启发式规则法效果Tab.1 Result of Heuristic rule method
图5 3种算法虚警率随杂波数变化曲线+Fig.5 False alarm rates of three algorithms vary with clutter number
图6 3种算法漏检率随杂波数变化曲线Fig.6 Undetected rates of three algorithms vary with clutter number
3 结束语
本文讨论了随机森林航迹起始方法、GBDT 航迹起始方法和多算法融合航迹起始方法。总的来说,多算法融合航迹起始算法的整体性能显著优于启发式规则航迹起始方法和GBDT 航迹起始方法的整体性能。融合算法可以在虚警率低、漏检率高的环境中提升航迹起始算法检测性能。文中的融合算法仍有改进空间,比如分析随机森林和GBDT 算法结果的相关性并合理利用,可以进一步提升融合算法性能。