雷达网目标分配方法综述*
2019-07-16杨善超田康生吴长飞
杨善超,田康生,吴长飞
(空军预警学院 预警情报系,湖北 武汉 430019)
0 引言
在现代高技术、信息化作战中,防空反导预警体系所面临的敌方电子干扰、反辐射导弹、隐身目标和低空入侵等威胁越来越严重。雷达组网能够运用数据融合技术,通过对多雷达进行管理,实现信息的冗余和互补、覆盖范围的拓展、检测性能和空间分辨率的提高,是提高我“四抗”能力,应对这些威胁的有效方式。在多雷达多目标背景下,由于传感器资源的相对不足、目标机动性的增强及环境不确定性的增加,必须解决雷达对目标的分配问题,才能完成对多扫描空间和多目标的探测跟踪任务。近年来,部分学者将雷达网多目标分配方法总结为以下几种:基于滤波技术及协方差控制的方法、基于数学规划及智能优化技术的方法、基于信息论的方法、其他方法[1-2];但是这些有的是分配模型构建方法(基于协方差控制),有的是分配方案某种衡量标准的度量(例如信息增量),有的是模型求解算法(数学规划及智能优化技术),将其作为目标分配方法并行的分类并不合理。
另一种是将目标分配方法分为优化方法、控制方法、决策方法3类。优化方法是找出使某一指标达到最优的分配方案;控制方法是将某一指标控制在限定范围之内,例如基于协方差控制的方法就是找出使实际跟踪精度最贴近于期望精度的分配方案;决策方法则将人的偏好等因素考虑在内。这种分类方法是并行的分类,但是存在交叉问题,比如决策类方法,有时在进行决策过程中也需要使某一指标达到最优,这又可以归类为优化方法。但是总的来看,这3类方法都是先构建出一定约束条件下反映某种性能指标的目标函数,综合目标函数、约束条件构成了雷达网多目标分配模型,再利用求解算法找出其最优目标分配方案。刘先省[2]也指出传感器管理的核心问题就是依据传感器资源的约束条件建立一个易于量化的目标函数,然后对目标函数进行求解以获得传感器对目标的有效分配。因此,本文将从目标函数、约束条件和求解方法3方面对雷达网目标分配的方法、理论进行梳理和概述,以对其研究现状和前沿问题进行把握和跟踪。
1 分配模型
分配模型包含目标函数和约束条件2部分。目标函数的构建是为了达到某个具体特性的要求,反映了进行雷达网目标分配所要实现的目的;约束条件反映了雷达网资源、探测能力等的约束限制。雷达网目标分配模型流程如图1所示。
1.1 目标函数
1.1.1 效能函数
雷达对目标执行任务时所产生的效能反应了该任务所能取得的成效,其决定于目标特性、雷达性能、雷达与目标配对与否等因素。雷达网目标分配的效能函数衡量不同方案所产生的系统效能,从而找出最优目标分配方案。
Bier和Rothman[3-4]定义了一种基于传感器与目标配对有效性的模型,利用传感器性能模型预测传感器对目标的效能,并将其作为目标函数,对各备选传感器分配方案的临界效益进行量化,利用目标航迹的有效数据,可以对量测性能进一步预测,这样就可以估计出每个备选方案的目标函数值。国内学者的研究大多集中于构建不同雷达与目标配对的效能函数,在此基础上根据目标优先级以及雷达与目标配对与否构建出目标函数,其一般形式为
(1)
(2)
式中:efij为效能函数,其一般定义为:当用雷达(组)对目标进行探测时,雷达对系统所做贡献的大小与其潜在价值相比较的数值。效能函数的影响因素不同,其内涵和表现形式都不同。
梅发国等[5]将传感器分配给探测航迹段的效能定义为以下3个值的加权和:传感器对探测航迹段的覆盖能力得分、跟踪能力得分、预警时间。田德伟[6]将传感器对目标的效能函数定义为监视效果。张雅青[7]将效能函数定义为最小夹角和驻留时间的函数。
可以看出这些效能函数主要从预警时间、多目标能力、航迹寿命、跟踪能力,以及探测发现概率等角度出发。在这些效能因素里,预警时间、跟踪能力、探测发现概率3种效能受到相对更多的重视,体现了更强的重要性,这是由于预警时间、跟踪能力、以及发现概率是评判雷达执行预警探测任务情况主要指标,对这三者进行优化才能更好地完成预警探测任务。
另一方面,上述的效能函数更多反映的是雷达自身性能;然而雷达与目标配对的效能函数不仅与雷达有关,还与目标的优先级等特性有关,对高优先级的目标执行同级别的任务其效能必定更高[8-9]。此外朱斯平[10]从系统要求的角度出发,将雷达测量参数精度和系统要求精度的匹配度作为效能函数的一部分。
1.1.2 跟踪精度函数
跟踪过程中,目标的跟踪精度与对其分配的雷达资源的多少有关;同样的,针对不目标执行不同任务,其对于跟踪精度的要求也不同。基于跟踪精度对传感器进行管理是尽可能达到每个目标所需跟踪精度的主要方法[11]。
目标跟踪精度大多是通过滤波估计协方差的形式来表示的,很多学者在研究雷达网目标分配时,提出了基于协方差控制的方法[12-13],以卡尔曼滤波估计协方差为参考,每一时刻遍历所有雷达组合并预测其滤波估计协方差,最终选择滤波估计协方差Pi(tk)与期望协方差Pd(tk)最接近的组合,目标函数为
(3)
上述方法都是假定传感器对目标的观测是同步的,但是在实际的雷达组网探测系统中,各雷达的采样周期、通讯延迟等可能会有区别,会导致在融合中心得到的各雷达数据不能同步。针对这一问题,尹德兴等[14]提出了一种基于协方差控制的异步观测融合方法,对异步雷达的量测值按采样时刻顺序滤波后得到估计协方差与期望协方差之间的偏差。另一方面,周文辉[15]提出一种稳态传感器目标分配算法,设置一个期望达到的稳态状态协方差矩阵,根据Riccati方程对不同传感器组合进行计算。
利用滤波估计协方差来表示跟踪精度容易受到滤波算法优劣以及适应性的影响,某一次滤波误差就有可能导致分配的偏差。文献[16-17]采用后验克拉美罗下界(PCRLB)作为目标跟踪精度衡量标准,独立于所采用的滤波算法,易于做单步或者多步预测计算,避免了单次运算可能带来的误差。
为了尽可能的保证重点目标的跟踪精度,需要在每一时刻都进行目标分配,且每一次分配都要遍历所有的雷达组合,这样可能会导致计算量的急剧增加以及传感器的频繁切换,进而给雷达网系统造成极大负荷。文献[18]提出一种改进的协方差控制方法,在目标函数中加入传感器是否切换的度量因子,以改进现有协方差控制方法要遍历所有传感器组合的问题。
1.1.3 信息增量函数
基于信息论的方法是一种应用广泛的雷达网目标分配方法,通常情况下采用集中式管理策略,将系统信息增量最大作为目标函数[19-20]。
Hintz和McIntyre等[21-23]首先将信息论方法应用于单传感器跟踪多目标时的目标分配问题中,使用期望熵变作为期望信息增量,根据期望信息增量的大小来确定被测量目标,可以达到每个采样间隔获取信息量最大化的目的。文献[24-25]给出了2种不同任务情形下的信息增量表达方式,在进行目标检测时,以最大化先、后验概率密度函数间的信息熵变化量作为信息增量;当进行目标检测时,以量测前后目标航迹协方差间的的信息熵变化量作为信息增量,并以此来实现传感器的选择。目标检测时信息增量表达式为
(4)
目标跟踪时信息增量表达式为
(5)
或者
I=tr{P(k|k-1)}-tr{P(k|k)}.
(6)
信息论中不确定性的表示方法除开信息熵之外,还有混合0熵(分辨力函数)的形式,它与信息熵不同之处在于混合熵本身就是信息量大小的一种度量[26-27]。另外,文献[28-29]采用Rényi差异来计算信息增量,Rényi信息增量对先、后验概率密度函数的分布没有高斯限制,更具有灵活性。文献[28]还将指数定义的信息熵引入到目标检测问题中,该指数定义信息熵改善了对数定义Shannon信息熵中存在的部分情况下信息熵无定义值和零值问题。
在实际目标分配的过程中,基于信息增量的方法可以通过相关目标信息的积累使其不确定性得到控制,但是信息增量只是目标分配的必要条件,还应该从目标及任务特性的角度出发对目标分配的充分条件进行完善。文献[30]提出了一种目标权重和信息增量相结合的方法,该方法在利用IMMKF获取信息增量的基础上,结合由部分排序集合方法得出的任务优先级别来对传感器资源进行分配。
上述方法中,都是通过卡尔曼滤波或者并行、串行卡尔曼滤波得到信息增量,对于只存在高斯噪声的线性系统,采用卡尔曼滤波就进行系统状态估计,但是现实中很多系统都是非线性的,卡尔曼滤波便不再适用。针对系统的非线性问题,学者首先提出了扩展卡尔曼滤波方法(EKF)[31],其基本思想是将非线性系统进行线性化后再进行卡尔曼滤波;但EKF因需要计算模型的Jacbian矩阵而导致实现困难,此外EKF在将非线性系统进行线性化的过程中,只对非线性函数泰勒展开式的一阶偏导部分进行利用,容易产生状态估计误差,影响滤波算法性能。后来出现了无需Jacbian矩阵计算的滤波方法,如Unscented卡尔曼滤波(UKF)[32]、粒子滤波[33]。UKF不再对非线性方程进行线性化,仍然采用高斯随机变量表示状态分布,用特定选择的样本点对状态的后验概率密度进行逼近;与EKF相比,UKF能够有效减小误差,并且计算更简单。粒子滤波是一种基于MonteCarlo仿真的最优回归贝叶斯滤波算法,这种方法需要大量的量测,在此基础上通过对一组加权粒子进行演化和传播,来获得近似的状态统计量,该方法适用于非线性系统的目标状态滤波[34]。
1.1.4 代价函数
雷达网在对目标执行任务时,必然会产生资源消耗,也就是雷达网为目标分配所付出的代价。很多学者针对使系统以最小的资源代价来达到设定跟踪状态或者完成规定任务的方法进行了研究。代价函数模型为
(7)
文献[30]在研究雷达网目标分配的过程中,将网络传输耗能最小作为目标函数,不仅考虑了雷达任务的要求,还考虑了网络间信息传递的限制;给出了雷达发送和接收数据时的耗能模型,这样就可以根据传感器与目标配对情况求出每一种方案的总能耗,进而选择能耗最小的分配方案。
雷达网资源的消耗不仅仅是网络线路传输能耗,更主要的是雷达自身资源的消耗。文献[35-36]根据目标跟踪性能和传感器资源的消耗,综合建立了传感器管理代价函数,以代价取值最小为目标来分配传感器资源。此外,王庆贺[37]等人在解决多无人机多目标情况下目标分配的优化问题时,以由无人机总飞行距离代价、总飞行时间代价、总损毁概率代价构成的综合代价最小作为目标函数。
除开上述的集中目标函数之外,还有一些研究从目标的发现概率[38]、雷达开机数目[39]、雷达网能发挥出的威力[40]等角度出发构建目标函数,在保证雷达网自身安全的前提下确保其对目标的效能或者威力。
还有很多学者将上述的2种或多种因素结合起来构建综合性目标函数或者多目标函数。例如王琳[41]从目标跟踪精度与代价最小2方面共同考虑,将误差协方差矩阵的迹与代价之和最小作为目标函数。杨龙坡[42]将传感器对目标执行任务的风险系数、情报时延系数、定位误差系数和探测概率系数结合起来,构建了一个综合因子目标函数。
总的来看,从跟踪精度和信息增量2个角度进行的研究占据主要部分,说明学者对目标的跟踪精度以及系统不确定性的优化更为重视。
1.2 约束条件
1.2.1 最大跟踪数目约束
单传感器能力是有限制的,最直接的体现就是其可跟踪的目标数目是有限的,将每个雷达最多能跟踪目标数目作为约束函数的数学表达式为
(8)
1.2.2 目标被执行任务容量
目标被执行任务容量是指每个目标占用的雷达数目,雷达组网将多雷达组合起来增强整体性能以更好地完成对多目标的探测跟踪任务,单个目标占用雷达数目越多时,对其执行任务效果会越好。但是雷达数目不可能无限制增长,在满足对每一目标执行任务需要的基础上,单目标所占用的雷达数目是有限的。文献[5]将目标每一个目标只需要一部雷达进行探测作为约束函数:
(9)
文献[7,9]构建的优化模型中,将每个目标至少分配一个雷达(组)做为约束条件;相反的,文献[24]构建的基于信息论的目标分配规划模型中,将每个目标只分配不多于一个雷达(组)作为约束条件。
1.2.3 时间和能量资源约束
雷达的时间和能量资源有限性是其固有属性,正是由于这种限制,才导致单雷达不能完成超出其能力范围之外的多目标跟踪探测任务,需要以雷达组网的形式满足对多目标和扫描空间的需求;同样的,在雷达组网中,每个雷达所分配目标的时间和能量资源消耗也不能超过其自身限制[43]。实际上,雷达的时间和能量资源约束是目标分配问题中最重要的约束,其数学表达式为
(10)
式中:Time(i,j),Energy(i,j)分别表示用雷达j跟踪目标i时所消耗的时间和能量资源。
Severson[44]研究了海基相控阵雷达组网的目标分配问题,利用搜索以及跟踪模式中信噪比SNR公式推导出某雷达分别用于搜索、跟踪、以及附加的时间资源占用比:Tsearch,Ttrack,Teng,从总任务时间占用比小于1的角度构建出雷达的时间资源约束。
1.2.4 目标发现概率约束
在传感器管理过程中,当有新目标出现时,必须要对其分配足够的传感器资源以满足对其探测发现的需要,这就对其他任务的传感器资源分配形成了约束。文献[14-15]研究了在新生目标发现概率最大的条件下使目标的跟踪精度最优化。
同时,当目标不在雷达的探测范围时,该雷达对目标的发现概率必然很低,雷达探测范围约束也是发现概率约束的一部分[45]。
2 求解算法
求解算法是通过目标分配模型得到最分配方案的关键步骤,人们一直致力于求解算法的研究和更新,以在尽可能减少计算量的基础上达到收敛并得到最终分配方案。
早先的求解算法大多是遍历性质的,但是随着传感器和目标数目的增多,以及空中环境的日趋复杂,采用遍历算法势必会导致计算量的组合爆炸;人们就越来越多的引入包括智能求解算法在内的启发式算法,这些算法具备更好的鲁棒性和自组织性,极大的提高了寻找最优解的效率,但是也会由于部分参数或者初始域设置不合理导致不能收敛或陷入局部最优。下面主要分基于规划论的求解方法、基于博弈论的求解方法和启发式算法3方面对多目标分配模型求解算法进行介绍。
2.1 基于规划论的求解方法
2.1.1 匈牙利算法
1955年Kuhn针对指派问题提出了一种求解方法,它引用了匈牙利数学家Konig一个关于矩阵中0元素的定理:一个系数矩阵中,独立0元素的个数最多等于能覆盖所有0元素的最小直线数,因此该方法称为匈牙利算法。指派问题包括平衡指派问题和非平衡指派问题2类,多雷达目标分配平衡问题是指雷达与目标个数相等,非平衡是指两者个数不等[7]。针对平衡问题,可以直接用经典的匈牙利算法进行解决,而对于非平衡指派问题,需要通过构建“虚拟变量” (当雷达数目大于目标数目时构建虚拟目标,当雷达数目小于目标数目时构建虚拟雷达组)变成平衡问题求解。
2.1.2 拍卖算法
拍卖算法是一种多智能体协调机制,具有运行速度快、可操作性好的特点。拍卖算法一般包含两种智能体:拍卖智能体A代表目标进行拍卖,竞拍智能体B则根据自身资源和目标相关特点投标。通过拍卖,A选择竞价最高的智能体B作为优胜者,从而资源与目标之间的映射,即完成多个智能体之间的分配[46]。在雷达网多目标分配的过程中,智能体A代表多目标任务,智能体B代表目标分配方案,竞拍过程中通过一定的规则对不同分配方案进行衡量,最终选取优胜者即最优分配方案完成对多目标的任务。
2.1.3 多重优化解法
多重优化解法(或者二次分配方法)的思想是首先将多目标函数按层次分解成多个单目标函数,再按照其重要程度进行多次单目标优化。
文献[13]中首先对跟踪数目最大化进行求解使雷达网跟踪目标数目最大化;对于还有剩余资源的雷达,再根据目标的优先级等进行再一次的资源分配,使各目标的跟踪精度满足期望要求。文献[14]中构建了包含跟踪数目最大化和雷达威力最大化的多目标规划模型,先针对跟踪数目最大化进行求解再针对雷达威力最大化进行求解,同时在完成第1个优化模型求解之后将其解集加入到第2个优化模型的约束条件中。
2.1.4 单目标化解法
由于多目标函数之间可能存在一定的正相关或者负相关,导致多目标优化问题的求解非常复杂。单目标化解思路是指将多目标问题中的多个目标函数通过一定的方转化成单目标函数[5]:
f=f(f1,f2,…,fs).
(11)
新构建的单目标函数可以根据约束条件的不同单调递增或递减,对单目标模型进行求解得到的和原多目标问题的最终分配方案是等价的。
2.1.5 隐枚举法
当雷达和目标数目都不多时可以用穷举法找到最优的目标分配方案,但是当数目较多时穷举法显然是一种耗时很长、效率低下的方法,这时可以采用隐枚举法来找到最优解。其思路可以描述为:首先找出一个可行解,计算其对应的目标函数值作为阈值,并由此一个过滤条件,对于其他不满足过滤条件的分配方案,就不用再去检验其是否为是可行解;对于满足过滤条件的方案,则求得其目标函数值,如果比阈值好,则进行阈值更新,同时将当前的方案作为待选解。这种方法虽然列出所有的可能分配方案,但并没有针对所有方案都进行约束条件的计算[9]。
2.2 基于博弈论的求解方法
通常一个博弈模型由以下3个基本要素组成:参与者、策略和收益。参与者是指参与博弈的决策主体,其目的是通过选择最终执行的策略使自己的收益最大化;策略是指每个参与者为了使自身利益最大化,而给出的相关解决方案;收益是指按不同策略计算得出的各个参与者能获得的收益。在雷达网目标分配过程中,雷达是博弈参与者,不同的分配方案是博弈策略,目标函数所追求的某种指标最优化就是效益,通过博弈、选择使效益最大化的分配方案[47-48]。在目标数目比较少的情况下,文献[49]将目标作为博弈主体,以各目标的收益作为博弈收益构建模型,能大大减少计算量。
2.3 启发式算法
启发式算法的特点就是在解决问题时,结合过去的经验选择已经具有一定有效性的方法,以随机或近似随机方法搜索非线性复杂空间中全局最优解,而不是系统地以确定步骤寻求答案,这样能大大减少计算量[50]。
2.3.1 遗传算法
利用遗传算法求解多目标分配模型的基本步骤就是从所有可能的分配方案中选择初代种群,通过交叉、变异等操作进行迭代遗传,利用适应度函数衡量解的优劣,经过多次迭代直到迭代次数到达规定值或者出现最优解为止[5]。文献[51]利用改进的遗传算法解决多目标分配问题,首先以目标的价值作为初始种群的启发信息,由此产生一部分适应度较高的初始种群;在构造适应度函数的时候,利用罚函数对约束条件进行处理,对于不满足约束条件的种群减少其适应度值,使其遗传到下一代的概率随之变小,在一定程度上减少了目标分配的不合理性,并提高算法效率。
2.3.2 智能算法
人工萤火虫群优化(GSO)算法是基于每个萤火虫个体总是趋近于周边亮度更强的萤火虫的思想,在求解函数极值问题、优化问题上取得了很好的效果,具有寻解速度快、通用性强等优点,将其应用到多目标分配问题中发现该算法的收敛速度比遗传算法更快[9]。
文献[41]利用蚁群算法对目标分配模型进行了研究,蚁群优化算法是最近几年发展起来的一种模拟蚂蚁群体行为的智能仿生方法,具有较好的稳定性和分布式计算能力,很适用于解决离散组合问题。
粒子群算法是一种新的进化算法,该算法也是通过适应度来评价解的品质,但是比遗传算法规则更为简单,没有交叉、变异等操作,在近年的雷达网目标分配研究中应用越来越多。在运用粒子群算法的时候,最关键的问题是模型中相关参数的设置,这决定了算法收敛的速度,以及是趋向于全局最优还是局部最优,同时粒子群算法有很强的兼容性,可以和遗传算法、鱼群算法等结合起来适用[52]。
3 未来研究展望
随着数据融合技术在军事领域的广泛应用和高速发展,雷达组网管理问题会受到越来越多的重视,合理有效的多目标分配是雷达网能有效完成任务的关键。为了更好的进行雷达网目标分配,有效完成对多目标、多空间的探测跟踪任务,作者认为未来还可以从以下几方面展开研究。
3.1 基于增量调整的目标分配
现有的雷达网目标分配没有延续性,下一时刻的目标分配虽然会利用到上一时刻相应雷达对目标执行任务产生的量测信息,但是并没有参考上一时刻的分配方案,只是简单地根据该量测信息结合目标需求以及客观条件进行重新分配,这种方式会造成资源极大的浪费;所以要考虑到增量调整的问题,即在每一次目标分配的时候要参考上一次的分配方案,考虑到其后续影响,尽量在前一方案的基础上进行改动,而不是简单的重新分配。
3.2 基于一致性的目标分配
现在雷达网目标分配大多是在融合中心进行的,除此之外,还可以考虑先将每个雷达作为节点进行分布式的目标分配,形成其自己的方案,这样可以更好的参考目标对于不同雷达的优先级的差异;再将各雷达的方案集中起来在融合中心进行基于一致性的目标分配,形成唯一的最优方案。这种两层的分配方法可以更好地利用不同目标—雷达配对之间的效能、权重等因素。
3.3 将雷达的安全问题纳入管理范围
在进行雷达网管理的时候,不仅要考虑分配结果要达到的效能,还要尽量降低由于雷达主动探测而给自身带来的暴露威胁,提升雷达网自身的安全系数,将这些因素结合起来进行研究,才能在实际应用中获得更大成效。
4 结束语
雷达网目标分配是雷达网资源管理的重要内容,合理有效的目标分配是雷达网能在有限资源条件下完成对多目标或多扫描空间有效探测和跟踪的关键。本文从模型、求解算法2方面对雷达网目标分配的研究现状进行了总结分析(其中模型又分为目标函数、约束条件2部分);并从提升目标分配有效性、节省资源、减少计算量的角度出发,对未来的研究方向进行了展望。进一步深入研究雷达网目标分配及其关键技术,对未来雷达网体系建设以及雷达网资源管理的研究具有重要的支持作用和参考意义。