APP下载

一致性约束下末制导系统最大可容许模式决策延迟

2022-07-03项盛文范红旗

自动化学报 2022年6期
关键词:制导机动均值

项盛文 范红旗 达 凯 付 强

在实际的末制导拦截场景中,目标状态不可避免地受噪声污染并且不是所有的状态量都能直接被量测,因此估计器是制导系统中的一个关键组件.由于目标机动通常是未知且难以预测的,目标状态估计是一个典型的混合估计问题,即包含基础状态估计和模式决策两个任务.目前,常用的混合估计方法可以分为两类:单模方法和多模方法.Li 等[1-2]对这两类方法进行了全面的分析和总结.值得注意的是,无论选用哪种方法,模式决策延迟都是影响系统估计精度的关键因素.具体而言,在单模方法中模式决策延迟表现为目标机动检测延迟;而在多模方法中则表现为模型概率收敛的时间.Shinar 等[3]指出对于大机动目标拦截(Highly maneuvering target interception,HMTI)问题,目标状态估计延迟特别是目标横向加速度的估计延迟,是引起系统非零脱靶量的主要因素.因此,为了尽可能地提高系统估计和制导的精度,模式决策延迟的取值越小越好.否则,由模式失配引起的不精确状态估计会误导拦截器生成错误的控制指令,并最终导致系统拦截精度降低(模式延迟太大且没有足够长的时间让估计器收敛).

近年来,研究者分别从不同的角度考虑如何降低模式延迟对制导性能的影响:一种是研究新型导引律以适应模式决策延迟;另一种则聚焦于怎样降低系统的模式决策延迟.在导引律设计方面,学者们提出了一系列延迟信息模式下的微分对策导引律.Shinar 等[4]假定目标横向加速度分量存在一个固定的估计延迟,基于状态可达集提出了一种新型导引律DGL/C (Differential games law,DGL).文献[5]在同时考虑目标横向加速度和相对速度存在延迟的条件下提出了DGL/CC.对于随机Bang-Bang 机动目标,DGL/CC 与DGL/C 相比可进一步降低系统脱靶量.文献[6]则考虑更一般情形,假定弹目相对距离、相对速度和目标加速度均存在估计延迟,提出了一种多信息延迟模式下的微分对策导引律.然而,对于HMTI 问题,单一的估计器和导引律的简单组合并不能适应所有的目标机动情形[7].采用集成估计导引(Integrated estimation and guidance,IEG)的思路,组合使用一组不同精度和带宽的估计器和一个独立的模式决策器,可以显著提高末制导精度并越来越受到研究领域的关注[8-11].其中,基于逻辑的IEG 方法具有潜在的应用前景[12-13],该方法也在多个拦截场景中得到了验证.另一方面,为了降低模式决策延迟,研究者们从目标机动特性出发进行了不同的尝试.事实上,雷达和光电导引头可以观测到与目标机动紧密相关的特征信息,这也为目标机动的快速辨识提供了可能.相关研究结果表明,集成雷达特征信息可以有效降低目标机动检测的延迟并提高制导系统的精度[14-15].

为了定量评估模式决策延迟对制导性能的潜在影响,需进一步回答该问题:给定系统误差边界后,模式决策器最大可容许的模式决策延迟(Maximal admissible mode decision delay,MAMDD)是多少? 对于该问题,文献[16]分析了离散时间系统状态估计误差特性并推导了模式延迟的上边界和模式逗留时间的下边界[16].文献[17]将该工作推广至连续时间情形.考虑末制导的拦截特性,文献[18]通过将零控脱靶量(Zero-effort miss,ZEM)估计误差的均值限定在捕获区边界内提出了一种MAMDD 的数值计算方法,然而该方法未考虑ZEM 估计误差的方差.文献[19]同时考虑ZEM 估计误差的均值和方差,引入可靠性评价指标得到了系统可接受模式决策延迟的范围,但没有给出MAMDD的具体数值.

本文针对HMTI 问题,在IEG 系统框架下,分析给定系统性能约束条件下模式决策器的性能指标,为模式决策器的设计提供指标参考.主要创新点包括:1)给出了离散时间系统ZEM 估计误差模型;2) 同时考虑ZEM 估计误差一阶矩和二阶矩,利用一致性约束条件提出了一种MAMDD 的数值计算方法.研究结果表明在末制导前段采用一致性约束、后段采用捕获区约束可保证更好的拦截性能.

1 问题描述

1.1 系统运动模型

本文仅考虑图1 所示的一弹一目平面拦截场景,表1 给出了全文的符号描述,下面对拦截问题做3 个假设[3-6,11-12,15-19]:

图1 平面拦截几何Fig.1 Planer interception geometry

表1 符号说明Table 1 Description of symbols

1) 弹目的控制动态可用一阶转移函数近似,对应的时间常数分别记为τp和τe;

2) 弹目飞行速度恒定,分别用Vp和Ve表示;

在图1 中,P (Pursuer)和E (Evader)分别表示导弹和目标;X轴沿弹目初始视线方向;Y垂直于X轴;(xp,yp) 和 (xe,ye) 分别为P、E 的当前位置;φp和φe分别为弹目的速度偏角,定义为速度矢量和X轴正方向的夹角.对于高速大机动目标末制导拦截场景,速度偏角满足小角度条件(sinφp≈φp,sinφe≈π-φe),弹目相对运动轨迹可沿初始视线方向进行线性化[12].假定弹目接近速度恒定、起始时刻t0=0s, 给定弹目起始距离r0后,拦截的终止时刻满足

剩余飞行时间定义为tgo=tf-t,其中,t∈[0,tf].

其中,x1=ye-yp为弹目沿Y轴的相对距离;x2为相对横向速度;up和ue分别表示P 和E 的横向加速度指令且满足有界条件

系统的动态方程可写成如下的矢量形式

通过终端投影变换

可将方程(4)转换为一个标量问题.此时,系统新的状态量为零控脱靶量z(t), 系统的脱靶量则为tf时刻的z(t),即z(tf).在式(6) 中,d=[1,0,0,0]T;Φ(tf,t)为满足齐次方程的状态转移矩阵,求解可得到

由式(6)容易得到z(t) 满足

其中,gT(t)=[g1(t),g2(t),g3(t),g4(t)]且

将目标的横向加速度控制指令ue(t) 建模为一个跳变的马尔科夫过程[16]

其中,m(t) 为目标当前时刻的运动模式,它表示目标横向加速度指令的具体取值,且满足{m(t)∈M=[m1,m2,···,m|M|]},其中M为目标运动模式集、|M|为模型集的势,w(t) 为量化误差,建模为零均值的高斯白噪声,功率谱密度为sw.

不失一般性,我们假定在 [0,tf]内目标仅发生一次模式切换.用tsw表示模式切换时刻,m1,m2分别表示模式切换前后目标的运动模式量,则m(t) 可表示为

其中,u(t) 为阶跃函数,定义为

1.2 状态方程离散化

将式(10)中的ue代入式(4),可以得到

假定系统的时间采样间隔为T且在每一个T内弹目的横向加速度指令保持恒定,容易得到与式(13)等价的离散模型为

其中,

1.3 系统观测模型

假定雷达导引头测量每一时刻弹目的相对位置和导弹自身的加速度,则系统的观测方程可以写成[20]

2 ZEM 估计误差模型的推导

图2 给出了一种典型的基于逻辑的IEG 系统架构[8,17-19].在该制导系统中,通过引入一个独立的模式决策器用于估计目标当前的运动模式(即目标横向加速度指令),并为估计器和导引律提供目标的运动模式信息.这种系统架构的优势可从以下两方面进行理解.一方面,模式决策器的输出可以辅助估计器选择合适的的动态模型;当目标发生机动后,估计器能够根据目标的运动模式信息快速切换至正确的模型.另一方面,模式决策器的输出可以辅助制导律单元选择合适的导引律.例如,当目标当前的运动模式量取值很小时(即|v|很小),对应的目标横向加速度很小,此时可选用DGL/0 导引律,因为其计算效率更高;若目标当前的运动模式量取值较大(即|v|很大),此时目标加速度不能直接忽略,可将导引律切换至DGL/1 以保证更高的拦截精度;此外,如果模式决策器能够提供目标运动模式的符号或方向,可根据这一信息进一步缩小目标加速度的可达集[21].本节将基于该制导系统架构推导目标存在运动模式切换时ZEM 估计误差的分布,在此基础上进一步分析模式决策延迟对系统制导精度的影响.

图2 一个典型的基于逻辑的IEG 制导系统框架[18]Fig.2 A typical logic-based IEG guidance system frame[18]

对式(11)进行离散化处理后,目标加速度指令满足

其中,ksw表示模式切换离散时刻

将式(22)代入式(14),可以得出离散系统的动态方程满足

记模式决策器的时间延迟步长为j,则离散系统目标模式切换以及对应模式决策器的输出可用图3 表示.从图3 容易得出估计器的动态模型满足

图3 目标模式切换和模式决策器输出示意图Fig.3 Diagram of target's mode switch and mode decision-maker's outputs

由式(24)和式(21)可以看出,系统的状态方程和测量方程具有线性形式.因此,选用线性Kalman 滤波器作为最优估计器.下面根据目标模式切换时间、模式决策器延迟和拦截终止时刻的关系分三种情形分别讨论ZEM 估计误差的分布.

情形1.ksw≥kf.在这种情形下,目标的横向加速度指令在整个末制导期间始终为m1,估计器使用的模型不存在失配.此时系统的状态方程为

从式(25)容易看出估计器的滤波方程为

其中,Kk+1表示tk+1时刻的离散Kalman 增益矩阵,满足

由于 E{ωk}=0 和 E{vk}=0,则状态估计误差的均值(记作ξk)满足

且状态估计误差的协方差矩阵(记作 Σk)具有如下的迭代形式

情形 2.ksw<kf≤ksw+j.这里需要分两种情况分别讨论.

1)k∈[0,ksw).此时状态估计误差的均值和协方差分别同式(32)和式(33).

2)k∈[ksw,kf].目标的运动模式发生了切换,此时系统的动态方程满足

估计器的滤波方程为式(27),因为导弹仍然认为目标的运动模式为m1,即在此期间内系统存在模式失配.根据状态估计误差的定义,x~k满足

容易得出状态估计误差的均值为

协方差矩阵的递归形式与式(33)相同.式(36)中的前一项描述了起始状态估计误差的影响,而后一项则度量了模式失配的影响.

情形 3.ksw+j <kf.类似地,需要分三种情况分别讨论.

1)k∈[0,ksw).在此区间内,目标运动模式未发生改变,因此状态估计误差的均值由式(32)确定,协方差矩阵由式(33)确定.

2)k∈[ksw,ksw+j).在此区间内,目标的运动模式发生切换但模式决策器未检测对应的改变,系统存在模式失配.状态估计误差的均值和协方差分别满足式(36)和式(33).

3)k∈[ksw+j,kf].在此区间内,目标的运动模式由m1切换至m2,并且模式决策器已经正确检测出目标的运动模式.因此,系统的状态方程满足式(34),而滤波方程为

由式(37)和式(34)容易得到状态估计误差均值将由式(32) 确定,误差协方差矩阵由式(33)确定.

定义ZEM 的估计误差为估计的ZEM 值与系统真实的ZEM 值之差,即

综上所述,每一时刻的ZEM 估计误差均服从有偏的高斯分布,均值为μk, 方差为.当目标的运动模式和估计器执行的模式匹配时(即模式切换前和模式正确匹配后),ZEM 估计误差的均值满足如下的迭代方程

3 一致性约束下MAMDD

由前文分析可知,每一时刻的ZEM 估计误差均服从均值为μk、方差为的高斯分布,即受基于跟踪滤波器残差进行机动检测理论的启发,构造如下的中心加权的检验统计量

不考虑系统的起始状态估计误差,当目标运动模式不发生切换时,此时,服从自由度为1 的χ2分布,即相反,当目标运动模式改变后,ZEM 的误差随着模式决策延迟的增大逐渐增大,对应的取值增大;而当误差增大到一定程度后的条件将不满足,此时认为系统的模式决策延迟不可接受.因此,在给定系统容许的虚警概率后,根据上述的一致性约束条件可计算得出MAMDD.

下面通过一个典型的TBM 拦截场景介绍MAMDD 的具体求解过程,仿真参数见表2[11,17-20].系统可容许的虚警率α设定为0.05,查表可知3.84.评判标准如下:当ZEM 估计误差位于系统容许的误差范围内,对应的模式决策延迟是制导系统可接受的;反之,则认为该模式决策延迟超出了系统可容许的范围之内.图4 给出了tsw=2.0 s、Δm=10 g 时的变化.如图所示,目标模式切换前(tsw≤2.0 s,即tgo≥1.03 s),ZEM 估计误差的均值为零,对应的取值为零,因此始终位于置信边界范围内.目标模式切换后(tsw>2.0 s,即tgo<1.03 s),由于系统模式决策延迟的存在,ZEM 估计误差增大,也随之增大.经过一段时间后,的取值超出系统给定的置信边界此时,我们认为ZEM 的估计误差过大,估计的ZEM 将不可靠,它会误导导弹生成错误的制导指令从而导致系统的制导性能下降.在这种思路下,

图4 tsw=2.0 s和 Δ m=10 g下的Fig.4 under tsw=2.0 sand Δm=10 g

表2 仿真参数Table 2 Simulation parameters

初始化.初始化拦截场景和估计器参数,目标模式切换时刻tsw,模式变化量, Δm=m2-m1和系统可接受虚警率α.

步骤 1.根据式(42)计算tk时刻ZEM 估计误差的均值.

步骤 2.根据式(40)计算tk时刻ZEM 估计误差的方差.

步骤 3.根据式(43)计算tk时刻检验统计量.

步骤 4.判断tk时刻的大小,若当前时刻满足,则 MAMDD=tk-tsw;否则,回到步骤1.

4 仿真实验

图5 给出了tsw=1.0 s(对应tgo=2.03 s)、Δm分别取10 g 和20 g 两种情形下的取值.仿真过程中,我们将模式决策延迟设置为无穷大.如图5所示,如果目标在同一时刻进行模式切换,机动的强度越小,对应的取值越小.因为在该情形下,Δm取值越小,ZEM 估计误差的均值也越小,对应的值就越小.图6 给出了 Δm=20 g、tsw分别取1.0 s和2.0 s (对应tgo=1.03 s)两种情形下的取值.可以看出,目标机动时刻越晚,对应的取值越小.由前面的分析可知,目标模式切换不影响ZEM 估计误差的方差,因此在 Δm相同情形下,在每一时刻的取值相等.目标机动越早(红色虚线),由于模式决策延迟无穷大,每一时刻ZEM 估计误差的取值越大,对应的值也就越大.

图5 tsw=1.0 s时不同机动幅度下的Fig.5 under different maneuver magnitude for tsw=1.0 s

图6 Δm=20 g时不同机动时刻下的Fig.6 under different maneuver time for Δm=20 g

图7 给出了 Δm分别取5 g,10 g,15 g,20 g,30 g 时系统MAMDD 与目标模式切换时刻的关系.在仿真实验中,我们假定拦截器的参数始终保持不变,仅改变目标的机动参数.如图7 所示,MAMDD 随着模式切换时刻呈现先减小后增大并最终达到无穷大的变化趋势,这与文献[18]给出的结果是一致的.可以看出,当目标机动时刻较早时(即对应tgo取值较大),ZEM 估计误差的方差取值较大,的取值相对较小(见式(43)).此时,与置信边界相交的时间较长,这意味着MAMDD 的取值越大,即系统对模式决策器的要求相对宽松.当目标机动时刻越来越接近拦截终止时刻(即tgo取值减小)时,ZEM 估计误差的均值和方差均逐渐减小,对应的取值也随着时间逐渐减小.当满足<3.84 时,ZEM 估计误差对拦截精度的影响可以忽略.如果目标在此时机动将无益于逃逸,MAMDD 的取值趋向于无穷大,系统对模式辨识器的性能不作要求.此外,对比不同机动幅度下MAMDD 的曲线可以看出,当 Δm的取值较小时,对应的MAMDD 的值越大.这表明,对于弱机动类型目标,拦截系统对于模式决策器的要求也相对宽松.

图7 不同 Δ m 条件下MAMDD 与模式切换时刻Fig.7 MAMDD with mode switch time for different Δm

表3 对比了5 组不同机动幅度下分别采用捕获区边界作为ZEM 误差边界[18]和利用本文一致性约束条件作为ZEM 误差边界的MAMDD.对比5 组数据结果可以看出,在拦截周期的前段选用一致性约束条件系统对模式决策器的性能要求更为严格;而在拦截周期的后半段选用捕获区边界作为约束条件系统对模式决策器的要求更加苛刻.具体来看,当tsw<2.2 s(即tgo=0.83 s)时,采用一致性约束条件得出的MAMDD 小于采用捕获区边界的MAMDD.当tsw≥2.2 s,采用捕获区约束条件获取的MAMDD 大于一致性约束条件下的MAMDD (注意当tsw=2.2 s、Δm取20 g 和30 g 时,两种方法求得的MAMDD 可看作近似相等).因此,为对模式决策器提出更为严格的要求以确保系统的拦截精度,在末制导前段可以采纳一致性约束条件,而在末制导后段应选用更为严格的捕获区边界作为ZEM 估计误差的约束条件.

表3 两种方法MAMDD 对比Table 3 Comparison of MAMDD with two methods

5 结束语

本文在基于逻辑的集成估计导引的制导系统框架下,针对末制导拦截场景推导了离散时间ZEM估计误差模型;然后提出了一种满足一致性约束条件的系统最大可容许模式决策延迟的数值计算方法,可为模式决策器的设计提供性能参考.实验结果表明,为确保系统的拦截精度,在末制导前段可选用一致性约束作为ZEM 估计误差的限制条件,在后段应选用捕获区边界的限制条件.开展目标运动模式辨识技术研究是下一步的主要工作.

猜你喜欢

制导机动均值
装载机动臂的疲劳寿命计算
12万亩机动地不再“流浪”
机动三轮车的昨天、今天和明天
基于MPSC和CPN制导方法的协同制导律
基于在线轨迹迭代的自适应再入制导
均值不等式失效时的解决方法
均值与方差在生活中的应用
带有攻击角约束的无抖振滑模制导律设计
海上机动之师
关于均值有界变差函数的重要不等式