过虚拟交班点的能量最优制导律

2019-12-27李晨迪王江李斌何绍溟张彤

航空学报 2019年12期

李晨迪，王江，李斌,*，何绍溟，张彤

1. 北京理工大学宇航学院，北京 100081 2. 北京理工大学无人机自主控制技术北京市重点实验室，北京 100081 3. 北方华安工业集团，齐齐哈尔 161006

随着现代军事技术的发展，对精确制导武器的需求与日俱增，超视距导弹武器系统一般采用复合制导体制[1-3]。复合制导中，导弹由中制导转为末制导时，交接班问题是实现精确制导的关键。为了使导引头开机时顺利截获目标，实现中末制导交班，往往对此时导弹的位置等信息有一定要求[1]，为了满足对导弹中末制导交班的弹道约束，本文研究过虚拟交班点的制导律，为导弹提供可靠的中末制导交班条件。

近年来，基于轨迹跟踪的制导律在无人飞行器领域被广泛研究[4-5]。根据跟踪方式，轨迹跟踪法可分为两类：连续轨迹跟踪和路径点(弹道点)跟踪。与连续轨迹跟踪相比，路径点跟踪只需要选取有限个弹道特征点，通过使导弹经过选定的弹道点而得到期望弹道，计算量较小。连续轨迹跟踪往往需要通过复杂计算实时得到待飞轨迹长度，或者基于虚拟目标进行轨迹跟踪[6]。文献[7]提出了一种两点间线性二次最优轨迹跟踪制导律，用于跟踪两个弹道点之间的直线，其路径改变点同样基于需用过载最小得到，但该制导律不是全局最优。文献[8]提出了一种数值优化方法，使得轨迹跟踪制导律的能量消耗最小，计算复杂度较高。文献[9]以反舰导弹为应用背景，通过离线参数优化得到每个弹道点的最优边界条件，例如角度和过载，从而在两个弹道点之间采用最优攻击角度制导律，得到了全局能量最优的轨迹跟踪制导律。

有时，需要导弹以特定的终端落角对目标进行攻击，以增强毁伤效果[10]，近年来考虑终端角度约束的制导律受到广泛关注。文献[11-12]通过求解含剩余飞行时间的线性二次最优控制方程得到含终端角度约束的最优制导律的一般形式。文献[13]应用Schwarz不等式研究了带落角约束的任意加权最优制导律，得到了制导律的一般表达式。文献[14]针对高速/低速目标拦截问题，采用时变偏置角速率设计了一种三维联合偏置比例导引律。文献[15]研究了一种无剩余飞行时间的偏置比例导引律，在比例导引的基础上加上角度约束偏置项，通过改变导弹过载实现终端角度约束。文献[16]针对空地导弹具有终端角度约束的制导问题，提出了一种在有限时间内稳定的新型二阶滑模变结构制导律。

路径点跟踪制导问题在每两个相邻路径点之间可以看作一般的制导问题，因此近几十年研究得到的一些经典导弹制导律同样可以应用于路径点跟踪问题。对于不考虑制导动力学滞后的制导问题，无终端落角约束时，导航比为3的比例导引为最优制导律[17]，当考虑终端落角约束时，弹道成型制导律则成为最优制导律[18-20]。但是在多个弹道点之间连续采用上述制导律的全局能量消耗是否为最优尚未得到研究验证[21]。基于此，本文将过虚拟交班点的精确制导问题视为路径点跟踪的特殊情况，即包括虚拟交班点与目标点两个弹道点，以气动力控制的导弹为研究对象，分别研究了无落角约束与考虑终端落角约束情况下的全局最优制导问题，推导出了解析解。最后，对非线性模型进行仿真，结果表明，与经典最优制导律相比，无落角约束与考虑终端落角约束的情况下，该制导律可以将控制能量消耗分别减小49%和22%。

1 运动模型建立

1.1 非线性运动模型

为方便描述，将虚拟交班点与目标落点视为两个导弹需要经过的路径点，记作Pi(i∈{1,2})，导弹与目标路径点Pi之间的相对几何关系如图1所示。图中：XIOYI为惯性坐标系；V和a分别为导弹速度与法向过载；θ为弹道倾角；ri、qi和σi分别为导弹与第i个目标路径点之间的相对距离、弹目视线角和速度方向误差角。

图1 弹目相对运动关系
Fig.1 Missile-target engagement relationship

导弹与目标路径点之间的相对运动方程为

(1)

由几何关系有

σi=θ-qi

(2)

1.2 模型线性化

本文将基于线性模型推导最优制导律的解析解。引入参考坐标系，对建立的非线性运动学模型进行线性化。如图1所示，将坐标系OXIYI绕原点旋转qR角，得到参考坐标系OXRYR。令yi=yPi-yM为导弹与Pi之间垂直于XR轴方向的相对位移，由几何知识，yi=0⟺ri=0。

在参考坐标系XROYR下，弹目相对运动方程可表示为

(3)

式中：vi、ai分别为导弹与Pi之间垂直于XR轴方向的相对速度与过载，由几何关系可得

a⊥=acosσi

(4)

在工程实际当中，飞行弹道由无控段、中制导段与末制导段3部分组成，对于中制导段与末制导段，可在每段飞行过程中分别视为弹目视线角变化较小，因此通过选取合适的qR可以使qi-qR为小量。同时，在实际情况中，导弹速度方向误差角σi也为小量。基于以上合理假设，式(3)可改写为

(5)

记系统状态向量为x=[x1,x2]T=[y1,v1,y2,v2]T，输出向量为y=[y1,y2]T，线性化的系统状态方程可以写为

(6)

式中：

(7)

2 最优控制问题描述

为得到控制量的全局最优解，提出以下形式的性能指标：

(8)

式中：tf,i为导弹到达第i个路径点的时刻。

本文研究的过虚拟交班点的固定目标最优控制问题可以表述如下。

问题1过定点的最优制导律问题

对线性化的系统(6)，解得使性能指标(8)取极小值的制导指令a，并满足约束:

yi(tf,i)=0i∈{1,2}

(9)

问题2带终端落角约束的过定点最优制导律问题

对于带有终端落角约束的最优控制问题，在上述无落角约束情况下，需额外满足约束

θ(tf,2)=θd

(10)

式中：θd为期望落角。

3 过定点的最优制导律设计

本节根据取控制能量最小的性能指标，选取零控脱靶量(ZEM)[19]作为唯一状态变量，对系统进行变换，从而实现系统降阶，对上述两个最优控制问题进行推导，以得到最优制导律的解析解，并对其进行分析。

3.1 系统降阶

为了方便对最优解的解析形式进行推导，对状态向量进行坐标变换，使系统降阶。以第i个点为例，进行变换

(11)

式中：变换矩阵Φi(tf,i,t)为

(12)

其中：tgo,i为导弹至第i个点的剩余飞行时间(time-to-go)，将式(12)代入式(11)可得

(13)

得到Zi即零控脱靶量，它表示从当前时刻起，导弹不再执行任何控制指令的情况下到达第i个点的脱靶量。

对式(13)求导可得

(14)

经过以上状态变换，系统(6)由4阶降为2阶。

3.2 最优制导律设计

对于变换后的系统，最优控制问题1转化为在相同性能指标下，对系统(14)求最优解，即找到适当的a使Zi尽快减小到0，同时控制能量最小。

根据ZEM的物理意义，新的系统状态的终端约束为

Zi(tf,i)=0i∈{1,2}

(15)

根据线性系统理论，式(14)可改写为

(16)

将式(15)代入式(16)，可得

(17)

定理1H为希尔伯特空间，{α1,α2,…,αn}为H中的一个线性无关集，c1,c2,…,cn为一组已知常数，在H中满足约束条件(x|α1)=c1,(x|α2)=c2，…，(x|αn)=cn的所有解构成一个集合V，此时V是一个余维数为n的线性流型，若xmin∈V，并且具有最小范数，则有

bi满足：

对于最优控制问题1，式(17)中a(τ)与tf,i-τ分别对应定理1中的x与αi，由定理1可得，含有拉格朗日乘子λi的最优解形式为

(18)

式中：拉格朗日乘子λi即定理1中的bi。

以t≤tf,1为例，求解拉格朗日乘子的表达式。将式(18)代入式(17)，可得

(19)

同理可以求得

(20)

定义λ=[λ1,λ2]T,Z=[Z1,Z2]T,由式(19)和式(20)可得

Z=Gλ

(21)

式中：

(22)

由式(21)可得

λ=G-1Z

(23)

将式(23)代入式(18)，可最终得到

(24)

3.3 讨论与分析

为了更好地理解上述推导得到的制导律，进行如下分析与讨论。

讨论1用tf,i=t+tgo,i计算到达时间，当导弹位于路径点附近时，可以视为得到精确的到达时间。

讨论2考虑到实际应用问题，对式(24)中的Z作如下处理：由于qi-qR为小量，所以有

(25)

求导得

(26)

由式(26)可得

(27)

在实际工程应用中，由弹目视线角速率、速度和弹目距离等可测物理量，可计算得到制导指令。

(28)

这与经典的比例导引制导律(Proportional Navigation Guidance, PNG)形式一致。根据文献[18]，在只有一个目标点时，导航比为3的比例导引为最优制导律，与式(28)一致。进一步可以得出结论，仅在相邻两点之间连续采用比例导引并不是能量最优的，因为比例导引只保证当前段弹道能量最优，没有终端落角约束，因此总的控制能量消耗与本文提出的最优制导律不同。

讨论4将t≤tf,1时刻的过载指令表达式展开得

(29)

将式(27)代入式(29)，可得

(30)

式中:

(31)

式(30)与含有偏置项的比例导引(BPN)形式一致，将其看作导航比随时间变化的BPN，根据文献[14]有

(32)

式中：q0为与初始条件有关的常数。

(33)

此时，制导指令为

(34)

由于

(35)

可得

(36)

4 考虑终端落角约束的过定点最优制导律设计

在一些情况下，需要导弹以一定的终端落角攻击目标，以达到更好的毁伤效果。本节在第3节的基础上加入终端落角约束，对有落角约束的过定点最优制导律进行设计。

4.1 最优制导律设计

经过系统降阶后，第2节中的最优控制问题2转化为，对系统(14)求最优解，使目标函数达到极小值，并在满足约束(15)的同时，还满足以下终端落角约束:

θ(tf,2)=θd

(37)

由线性系统理论可得

(38)

过载指令由两部分组成:

a=aZ+aθ

(39)

式中：aZ、aθ分别为与ZEM和弹道倾角相关的调节项。根据定理1，有

(40)

同样地，以t≤tf,1为例求解拉格朗日乘子，将式(39)代入式(38)可得

(41)

由式(41)可得

(42)

式中：G1∈R2×2,G12∈R2×1,G21∈R1×2，由3.2节可知

(43)

下面求解G12、G21、G2:

(44)

可得

(45)

由式(42)～式(45)可以解得拉格朗日乘子为

(46)

可得过载指令为

(47)

当tf,1

(48)

过载指令为

(49)

4.2 讨论与分析

注意到当tf,1

(50)

对式(1)的第3项积分可得

(51)

将式(5)代入式(51)，可得

(52)

又由式(13)可得

(53)

将式(52)、式(53)代入式(50)，可得

(54)

与经典的弹道成型制导律(Trajectory Shaping Guidance, TSG)形式一致。在只有一个目标点，考虑终端落角约束的制导问题中，TSG是能量最优的[18]。

5 仿真验证

本节以非线性系统为研究对象，对提出的制导律进行仿真验证，并与经典最优制导律进行对比。飞行弹道包括无控段、中制导段与末制导段，导弹在40 s启控后进入中制导段，经过虚拟交班点进入末制导段，仿真参数如表1所示。

表1 仿真参数Table 1 Simulation Index

5.1 无落角约束的最优制导律仿真

本节针对过虚拟交班点的无落角约束最优制导律(24)进行仿真验证，并在中制导与末制导段分别采用最优比例导引，即导航比为3的比例导引律，与本文提出的最优制导律进行对比。仿真结果如图2所示。

图2分别给出了2种制导律下的弹道、弹道倾角、过载指令和控制能量曲线。图2(a)中五角星表示需要经过的路径点1(虚拟交班点位置)与路径点2(目标)，可看出两种制导律都可以准确经过目标路径点，但通过对比2条弹道曲线末制导段发现，本文提出的最优制导律比最优比例导引制导律弹道更为平直；对比图2(c)，该最优制导律在末制导阶段的过载指令远小于最优比例导引。且最优比例导引的过载指令在虚拟交班点处出现跳变，本文提出的制导律下过载指令为连续的，最大需用过载不超过分段比例导引的36%。图2(d)为2种制导律下的控制能量消耗，可以看出，本文提出的最优制导律能量消耗大大减少，比最优比例导引所需的能量消耗减少49%。

图2 无落角约束情况下的仿真结果对比
Fig.2 Comparison of simulation results without angle constraint

5.2 考虑终端落角约束的最优制导律仿真

本节对考虑终端落角约束的最优制导律进行仿真验证。导弹期望落角选取为-90°。采用PNG与TSG切换的制导律进行对比，即导弹在启控后采用PNG，经过虚拟交班点进入末制导阶段后，由PNG切换为TSG以实现期望落角。仿真结果对比如图3所示。

对比发现，图3(a)与图2(a)第一段弹道相同，而最优制导律在加入终端落角约束后，末制导段弹道轨迹与弹道倾角变化较为明显，因为本文提出的最优制导律在开始时就将落角约束考虑进去，从而得到全局最优的制导律。图3(c)给出了两种制导律下的过载指令，可以看到在经过虚拟交班点时，PNG+TSG下过载指令与无落角约束时一样出现了不连续性，而本文提出的最优制导律为连续的。图3(d)为2种制导律所消耗的控制能量，对比发现本文提出的制导律所需控制能量比无落角约束时明显增大，但仍比PNG+TSG下能量消耗减少22%。