APP下载

辐射风险和多目标跟踪精度约束下的传感器调度方法*

2022-01-06安雷李召瑞吉兵

现代防御技术 2021年6期
关键词:杂波代价调度

安雷,李召瑞,吉兵

(陆军工程大学 石家庄校区,河北 石家庄 050003)

0 引言

在以雷达等为代表的主动传感器对空中目标的跟踪当中,由于单传感器的侦测范围有限、冗余能力不足、灵活性差、易暴露等问题,通常难以满足实际作战任务需要。为此,通过采取多传感器调度的方法,有针对性地分配传感器资源、控制工作时间,可以有效达到提升跟踪精度、降低使用代价、改善生存能力等优化传感器系统性能的目的[1]。

应用中,传感器调度一般基于实际任务的需要,通过优化决策产生调度序列,在保证一定跟踪精度的前提下,有效控制辐射风险、频繁切换、响应延迟等使用代价。这其中,辐射风险带来的辐射代价是指主动传感器在工作时,由于向外辐射电磁波,导致观测信号存在被目标的辐射告警接收机检测、识别进而锁定位置的问题。要实现对辐射风险的有效控制,首要的是对其进行准确的量化,文献[2-3]以传感器的工作时间作为辐射代价的衡量标准,虽然能够充分减少主动传感器的对外辐射量,但由于未针对探测性能和辐射性能的差异进行量化,在实际应用中存在一定局限。文献[4]则将传感器一个工作时长内的辐射代价量化为固定值,并通过目标优化函数决定调度序列,但由于辐射风险的变化是非线性的,将其简单地确定为固定值并不准确。文献[5]则基于敌我双方传感器的发射功率、脉冲宽度和采样时间等参数,计算我方传感器被目标截获的概率,并将截获概率与截获代价的乘积定义为截获风险,以截获风险作为辐射风险的衡量指标。文献[6]在调度中采取辐射度影响(emission level impact,ELI)模型量化传感器辐射风险,时变地描述辐射状态变化情况,无需提前掌握目标辐射告警设备的相关参数,比较符合实际情况。

由于主动传感器的固有特性,更高的跟踪精度往往意味着更大的辐射风险,这就要求调度策略必须能够实现多指标的有效平衡。文献[7]针对传感器网络多目标跟踪中的节点调度问题,在节点数和跟踪精度双重约束的前提下,以节点调度代价和网络传输代价最小化为优化目标,提出了一种基于单步代价的传感器短时调度策略。但短时调度由于决策依据仅为单步收益,整体性能一般,虽然能够实现单指标的最优化,却不能很好地满足多指标平衡的要求,而且还会导致频繁切换的问题[8]。为此,文献[9]针对空战中飞行器跟踪精度与辐射风险的平衡问题,以多步累积发现概率、累积被截获概率为决策依据,实现了机载多类型传感器的有效协同,对任务性能约束下的雷达射频隐身性能作了进一步优化。文献[10]以最小工作时长为调度方法的时间尺度基础,规定传感器只有在达到最小工作时长后才决策是否进行切换,有效降低了辐射代价和切换次数,得到了调度方案的次优解。文献[11]以一段时域内的目标跟踪精度和传感器辐射代价为指标建立目标优化函数,并采取分支定界算法求解调度策略,实现了传感器系统生存性和稳定性的有效平衡。

同时,随着无人机蜂群等作战样式的出现,杂波环境下的多目标跟踪成为了研究的热点,由于难以做到对多目标的完全观测,且观测结果还包含了大量杂波干扰,导致跟踪的不确定性进一步增加[12]。对此,经典的多目标跟踪方法如联合概率数据关联算法[13](joint probabilistic data association,JPDA)和多假设跟踪算法[14](multiple hypothesis tracking,MHT)等,采取数据关联的方式来解决不确定性问题,导致调度方案求解变成了非确定性多项式难题,计算量大,反应速度慢,无法满足目标跟踪时效性的要求。针对这个问题,Mahler基于随机有限集(random finite set,RFS)理论,首次提出了有限集统计学(fInite set statistics,FISST)[15],将目标检测和状态估计整合为贝叶斯最优步骤,依据各采样时刻内的多目标状态观测集,递推更新状态概率密度函数,形成了一种可适性好的多目标多传感器系统统计模型。在此基础上,为简化多目标贝叶斯滤波器求解复杂性,相继提出了概率假设密度[16](probability hypothesis density,PHD)滤波器、带势概率假设密度[17](cardinalized PHD,CPHD)滤波器、多伯努利[18](multi-Bernoulli,MB)滤波器及其改进等多目标跟踪算法,在进一步省去复杂的量测-航迹关联环节的同时,实现了比经典多目标跟踪方法更好的跟踪性能。

进一步,学者们将杂波环境下的多目标跟踪算法与传感器调度相结合,文献[19]针对单传感器可移动平台控制问题,以最优子模式分配(optimal subpattern assignment,OSPA)距离为指标创建目标优化函数,采取标签多伯努利(labeled MB,LMB)滤波器实现多目标状态估计,显著提高了目标跟踪性能,但未考虑多传感器条件。文献[20]在基于LMB滤波器提出多传感器控制方法的基础上,研究给出了LMB分布的后验概率泛函,并利用该泛函作为约束条件,对控制策略求解过程进行优化,有效提高了运算速度。文献[21]则选取柯西-施瓦茨散度作为传感器系统的性能评价函数,通过局部迭代搜索的方式求取控制策略次优解,显著减少了计算量,但由于其决策的时间尺度为固定时长,从而限制了可行解的范围。文献[22]采取高斯混合多目标(Gaussian mixture multi-target,GM-MT)滤波器,利用不同高斯分布之间的巴氏距离求解GM之间的信息增益,提出了以单步OSPA距离最优为准则的传感器控制策略,但该方法仅对基于传感器跟踪精度的优化进行了研究,未考虑使用代价因素,在实际应用中存在不足。文献[23]基于集中式处理结构,以传感器能量损耗为约束条件,采取多目标均方误差界为代价函数,将多目标贝叶斯建模为δ-广义标签多伯努利(generalized LMB,GLMB)RFS,采用子最优算法求解调度方案,提出了一种约束条件控制下的多传感器控制算法。

本文根据已有研究成果,结合截获概率的思想,提出了一种基于RFS多目标跟踪理论的传感器辐射控制的长时调度方法。首先创建传感器调度模型,基于部分可观马尔可夫决策过程(partially observable Markov decision process,POMDP)[24]和RFS,对目标的真实状态和观测结果进行了数学描述;基于截获概率的思想,提出了改进的辐射风险量化方法;并以跟踪精度和辐射风险的有效平衡为目标创建了优化函数。然后,基于高斯混合概率假设密度[25-27](Gaussian mixture PHD,GM-PHD)平滑滤波算法,提出了多目标长时跟踪精度的预测方法;结合目标的辐射告警最大作用距离,提出了传感器长时辐射代价的预测方法,并设计了传感器的调度流程。最后进行了仿真实验,分别对本文所提调度方法的性能、辐射风险量化方法的性能、目标优化函数系数对调度的影响、环境杂波对调度的影响进行了分析,验证了本文所提方法的有效性和可行性。

1 创建数学模型

1.1 多目标状态模型和转移概率

立足二维坐标下的情况,定义k时刻多目标运动状态

(1)

即k时刻Mk个在状态空间上取值的目标状态,其中多目标数目Mk是变化的。每个目标的状态则分别表示目标m在x和y方向上的位置分量和速度分量。

Xk+1=Sk+1|k(Xk)∪Bk+1|k(Xk)∪Γk+1,

(2)

式中:Sk+1|k(Xk)为k+1时刻的存活目标RFS;Bk+1|k(Xk)为由存活目标Xk衍生的目标RFS;Γk+1为n时刻的新生目标RFS。

根据文献[25],各目标的运动特征服从线性高斯多目标(linear Gaussian multi-target,LGM)模型,则目标马尔可夫转移概率密度满足:

(3)

1.2 多目标观测模型及观测矩阵

多目标的观测模型可定义为

(4)

式中:Ok为k时刻传感器系统在观测多目标时所得的量测值。由于存在目标漏检及杂波干扰情况,故无法与目标的真实状态一一对应。

Ok=Dk(Xk)∪Kk.

(5)

由于传感器量测模型也必须服从LGM,故多目标量测似然为

(6)

式中:Hk为观测矩阵;Rk为观测噪声协方差矩阵。

本文仅考虑主动传感器,所以k时刻传感器n对目标m状态的量测信息包括目标斜距离和方位角,即

(7)

1.3 量化传感器辐射风险

(8)

(9)

同时,由于截获概率α的定义为[30]

(10)

式中:RI为目标的辐射告警接收机能发现传感器辐射信号的最大距离;Rk为k时刻传感器探测到其与目标间的距离。

(11)

1.4 传感器调度动作及目标优化函数

定义传感器系统在k时刻的调度动作为

(12)

考虑各传感器工作性能的差异,规定最小工作时长为φ∈{φ1,φ2,…,φN},在此基础上,构建目标优化函数:

(13)

(14)

(15)

2 调度方法和流程

2.1 GM-PHD平滑滤波器

为有效克服多目标跟踪中存在的杂波干扰和目标漏检情况,采取GM-PHD平滑滤波器进行状态估计,在此基础上,以OSPA距离为衡量指标实现多目标跟踪精度预测。

在LGM假设条件下,目标生存概率和检测概率与目标的状态无关,即

(16)

同时,定义:

QS,k+1=1-PS,k+1为目标消亡概率;

QD,k+1=1-PD,k+1为漏检概率;

Jk为k时刻描述PHD函数υk(Xk)的高斯分量的数目;

(1) 预测

假设在n时刻,目标后验强度具有高斯混合的形式:

(17)

则k+1时刻的目标预测强度也具有高斯混合形式:

(18)

(2) 更新

k+1时刻的目标后验强度也具有高斯混合的形式:

(19)

式中:k+1时刻的目标量测强度为

(20)

(3) 后向平滑

对目标滤波结果进行平滑处理:

υk+1|l(Xk+1)=υk+1(Xk+1)Bk+1|l(Xk+1),

(21)

式中:Bk+1|l(Xk+1)为后向校正函数,在高斯混合假设条件下,其值为

(22)

则平滑PHD函数υk+1|l(Xk+1)也为高斯混合形式,当采取一步平滑的办法,即l=k+2时,平滑PHD函数为

(23)

(4) 合并修剪

由于高斯分量的个数会随着迭代的持续而无限增长,故采取合并修剪的办法,抑制高斯分量数目。

首先设置合并门限U,减少分布接近的高斯分量。若分量i和分量j满足:

(24)

则将2个分量合并,随后通过剪枝的办法舍去权值低于修剪阈值τ的分量,进而控制高斯分量数目,提高运算效率。

(5) 状态提取

采取GM-PHD平滑滤波算法进行目标跟踪时,由于目标状态信息包含在υk+1|k+2(Xk+1)中,为进行后续计算,则需要在其中提取目标状态,通常选取υk+1|k+2(Xk+1)中权值大于0.5的高斯函数分量的均值进行描述。

2.2 多目标长时跟踪精度的预测

在基于RFS的多目标跟踪中,OSPA距离是一种重要的整体性能评价标准,能够较为全面、准确地评价多目标跟踪的精度,其值越小,相应滤波算法所对应的位置估计精度或多目标状态估计性能也就越好[31]。在GM-PHD平滑算法的基础上,利用OSPA距离,可以提出多目标长时跟踪精度的预测方法:

Step 1: 初始化

Step 2: 获取目标状态

Step 3: 求取截止距离

(25)

式中:d(X,Y)为k+h-1时刻X和Y2条航迹的基准距离。

Step 4: 计算OSPA距离

(26)

式中:ΩMm表示{1,2,…,k}上排列的集合。

Step 5: 循环

若h<φ,令h=h+1,转到Step 2;若h=φ,循环结束,得到φ时长内的平均OSPA距离预测值:

(27)

2.3 传感器长时辐射代价的预测

基于前文对传感器辐射风险的量化,为有效实现传感器辐射状态的实时更新,结合最小工作时长的思想,提出传感器长时辐射代价的预测方法。

Step 1: 初始化

跟踪步长与调度动作同2.2节Step 1一致。

Step 2: 获取目标状态

(28)

Step 3: 计算距离

(29)

Step 4: 计算辐射代价

(30)

Step 5: 循环

若h<φ,令h=h+1,转到Step 2;若h=φ,循环结束,求取φ时长内辐射代价非0的各时刻值的平均值:

(31)

2.4 多传感器调度流程

Step 1: 初始时刻

Step 2: 重新决策

至φ时刻,传感器n0:φ-1已工作满φ时长,此时决策是否切换传感器。

Step 3: 预测跟踪代价

Step 4: 预测辐射代价

Step 5: 代入目标函数

将各传感器的跟踪代价和辐射代价代入目标优化函数式(13),得到下一时刻或下一时长内的最优传感器nmin。

Step 6: 确定工作时长

Step 7: 循环

传感器系统按照上述步骤循环决策,至H-1时刻,调度任务结束。

3 仿真校验

假设系统包含4个传感器,在2维空间中跟踪4个目标,传感器的初始位置为N1(70,-70) m,N2(-70,-70) m,N3(-70,70) m,N4(70,70) m,采样间隔t=1 s,最小工作时长φ=2 s,测量误差δr=0.5 m,δφ=0.5 rad。

将观测环境中杂波干扰的RFS建模成泊松分布,其强度Kk(Zk)=λcVu(Zk),其中u(·)为均匀分布概率密度函数;V=(-150 m,150 m)×(-150 m,150 m)为传感器监测区域,λc=3为单位面积内杂波的平均个数。目标的辐射告警作用距离RI均设置为50 m。仿真总时间为70 s,仿真结果为200次蒙特卡罗实验的平均。

3.1 调度方法性能分析

为验证本文所提调度方法的适用性和有效性,同时与单传感器系统多目标跟踪,以及多传感器系统无时长约束调度策略[3](non-timestep constrained scheduling policy,NCSP)、固定时长调度策略[4](fixed timestep scheduling policy,FTSP)进行对比。

如图1~3所示,相比基于多传感器调度的目标跟踪,处于4个不同位置的单传感器由于不进行选择优化,得到的OSPA距离累计值、目标数目标准差、辐射时长明显最高,辐射距离最小,效果最差。

图2 各采样时刻目标数目标准差和目标数目标准差均值Fig.2 STD of the number of targets at each sampling time and STD of target numbers

图3 各采样时刻得到的辐射距离、辐射时长和 传感器调度次数Fig.3 Radiation distance,radiation duration, and sensor switching times

本文所提方法(proposed scheduling method,PSM)由于是长时调度,相比于NCSP的短时调度方法,决策基础为长时跟踪效益,是一段时域内优化目标的累计值,所以在跟踪精度、辐射风险以及切换次数的平衡优化方面要明显更优,传感器调度次数、OSPA距离累计值、目标数目标准差更低,整体性能突出。同时,本文所提方法在达到最小工作时长后,再依据预测结果决策是否进行切换,相比FTSP中传感器在满足固定时长后即发生切换,丢失较多可行解的情况,求解覆盖范围更加全面,得到的调度方案更优,各项调度性能指标均明显好于FTSP。

总的来看,本文所提调度方法在保证了对辐射风险有效控制的基础上,进一步改善了目标跟踪精度和传感器切换代价,更加满足多指标平衡优化的目的,调度性能最优。

利用本文所提调度方法跟踪目标,得到的调度序列和多目标运动轨迹如图4,5所示。

图4 采取本文所提方法得到的传感器调度序列Fig.4 Sensor scheduling sequence under scheduling with PSM

图5 多目标真实运动轨迹和采取本文所提方法 进行调度得到的观测轨迹Fig.5 Real motion trajectory of multi-target and observation trajectory obtained by PSM scheduling

3.2 辐射风险量化方法性能分析

为验证本文基于截获概率改进的传感器辐射风险量化方法的实际效果,采取ELI的辐射风险量化指标作为对比,分别利用2种方法求取调度序列,并互相采用性能指标对调度结果进行评价。

仿真中,为排除目标函数系数对调度效果的影响,区分仅对跟踪代价进行优化和仅对辐射代价进行优化2种情况进行实验。ELI状态真实值量化为(1,2,3),相对应的瞬时观测威胁度也为(1,2,3)。为保证2组实验的对比性,规定4个传感器的探测性能相同,则ELI状态转移矩阵也保持一致:

(32)

其余条件与3.1节相同,进行200次蒙特卡罗仿真实验。如表1所示,分别取2组实验的OSPA距离累计值、目标数目标准差、传感器切换次数、辐射代价累计值、辐射时长和辐射距离6类调度性能指标进行对比,其中辐射代价累计值为采取ELI方法时辐射代价的描述指标。

从表1中可以看出,当目标函数仅对跟踪代价进行优化时,其实质上变成了针对跟踪精度的最优化,应用2类辐射代价量化方法进行调度,所得结果的各项性能指标基本一致。

表1 不同辐射风险量化方法下的调度性能对比Table 1 Comparison of scheduling performance under different radiation risk quantification method

而只针对辐射代价进行优化时,由于本文所提方法限制了目标的辐射告警作用距离,传感器在作用距离之外工作时,不考虑辐射代价问题,只对跟踪代价进行优化,所以得到的OSPA距离累计值、目标数目标准差及传感器切换次数更优。辐射代价控制方面,采取本文所提辐射风险量化方法进行调度时,由于将辐射风险同主动传感器与目标间的距离相关联,所以调度得到的辐射距离和辐射时长有了大幅改善,而ELI指标由于只是将各时刻的辐射风险量化为固定值,所以优化效果有限。而由于4个传感器的探测性能和辐射性能均相同,所以在2种辐射风险量化方法下,调度序列的变化并不会让累计辐射代价发生明显降低。

由此可以认为,相比于采用ELI指标时将辐射代价量化为固定值,仅能反应其非线性变化特征,而与实际工作情况无关,且跟踪全程都只针对唯一的优化目标进行决策的情形,本文所提的辐射风险量化方法,将辐射风险与目标处的发射功率密度相关联,能够更加准确地反映传感器工作的实际特征,还可以根据探测所得的传感器与目标间的距离,实时对优化目标进行调整,提高传感器资源利用效率,进而改善多目标跟踪精度,降低传感器的切换代价和辐射信号被目标截获的风险。

3.3 目标优化函数系数对调度的影响

结合目标优化函数式(13)可知,系数α起到了调控调度系统优化目标的作用。由于跟踪代价和辐射代价之间量纲上的差距,在3.1节仿真实验中,设定的系数α=103。为进一步分析系数α的选取对本文所提调度方法的影响,分别取α=0,102,5×102,103,5×103,104,进行200次蒙特卡罗仿真实验。如表2所示,为分别取不同的目标优化函数系数时,调度所得OSPA距离累计值、目标数目标准差、传感器切换次数、辐射距离和辐射时长的对比情况。

从表2中可以看出,随着系数α的增大,衡量目标跟踪精度的指标OSPA距离累计值和目标数目标准差逐渐增加,说明随着跟踪代价在目标优化函数中占比的减少,目标跟踪精度在逐渐变差。而反映辐射风险的指标辐射距离逐渐增加、辐射时长逐渐减小,即当辐射代价在目标优化函数中的占比增加时,调度方法针对辐射风险的优化效果将更加明显,能够实现对辐射风险的有效控制。

表2 不同优化函数系数下的调度性能对比Table 2 Comparison of scheduling performance under different objective optimization function coefficients

同时,传感器切换次数的减少,也进一步验证了本文所提方法的合理性和可适性。通过决策选择,可以有效增大辐射距离,减少辐射时间和切换次数,降低传感器系统被目标截获的概率,以及由频繁切换所带来的伺服系统工作驻留、信号响应延迟等一系列切换代价问题。本节仿真实验同时也进一步验证了3.2节的仿真结果。

3.4 不同杂波密度下的调度性能分析

为克服环境杂波对目标观测的影响,本文采取GM-PHD平滑滤波算法进行目标状态估计。在前节仿真条件设置中,我们将杂波干扰的RFS建模为单位面积内杂波平均个数λc=3的泊松分布,为进一步分析环境杂波对传感器调度性能的影响,分别取λc=0,3,6,10,20,30,进行200次蒙特卡罗仿真实验。如表3所示,为不同杂波密度下,经过调度后传感器系统所得OSPA距离累计值、目标数目标准差、传感器切换次数、辐射距离和辐射时长的对比情况。

表3 不同杂波密度下的调度性能对比Table 3 Comparison of scheduling performance under different clutter densities

在传感器调度的决策阶段,由于预测长时跟踪精度时采用的是目标量测的预测值,不包括杂波干扰,所以如表3所示,杂波密度的变化不会对调度方案产生影响,系统经过调度后得到切换次数、辐射距离、辐射时长保持稳定。而多目标跟踪精度的变差,则是由于在调度方案执行阶段利用GM-PHD平滑滤波算法处理杂波干扰时,受算法处理能力的限制,随着杂波密度的增大,得到的目标状态估计结果中包含的杂波数量增加,从而导致目标数目标准差和OSPA距离增大。通过本节仿真,进一步证明了本文所提调度方法的稳定性,能够有效避免环境杂波的干扰,实现对辐射代价和切换代价的有效控制。

4 结束语

本文针对多目标跟踪中的传感器调度问题和辐射风险量化问题进行了研究。首先,基于RFS理论对多目标状态进行了描述和定义;其次,利用GM-PHD平滑滤波算法实现了长时多目标跟踪精度的预测,基于截获概率的思想提出了改进的辐射风险量化方法,并实现了长时辐射代价的预测;最后,结合最小工作时长确定调度策略,提出了一种可行的多传感器多目标跟踪长时调度方法。仿真实验表明,采取本文所提的辐射风险量化方法实施调度,更加符合主动传感器的工作特征,可以对辐射代价进行有效控制,并基于传感器与目标间的观测距离,自适应地调整目标优化函数,有利于传感器资源的充分利用,进一步优化了各项调度性能指标;同时,通过与其他调度方法对比,本文所提调度方法在目标跟踪精度和辐射代价、切换代价等多指标的平衡优化方面效果更佳,验证了其优越性和可行性。

猜你喜欢

杂波代价调度
基于智慧高速的应急指挥调度系统
基于模糊逻辑的双偏振天气雷达地物杂波识别算法
基于CE-PF算法的舰载机离场调度优化问题
水资源平衡调度在农田水利工程中的应用
一种杂波实时仿真方法*
基于增益调度与光滑切换的倾转旋翼机最优控制
基于近程杂波协方差矩阵构造的俯仰滤波方法
爱的代价
幸灾乐祸的代价
代价