具有约束的双机空战机动控制设计方法研究

2022-01-11明瑞晨刘小雄李煜章卫国

西北工业大学学报 2021年6期

明瑞晨, 刘小雄, 李煜, 章卫国

(1.西北工业大学自动化学院, 陕西西安 710129; 2.陕西省飞行控制与仿真技术重点实验室, 陕西西安 710129)

飞行空战研究一直以来都是飞行控制领域的重点难点，并且空战的研究方法也在不断地改进。早期的空战决策研究中，大多数采用博弈论、最优控制等思想。Jarmark[1-2]建立双机对抗微分博弈模型，然后使用微分动态规划法来求解。Imado等[3]使用了最优控制方法，通过对迎角和推力的控制实现空战中对导弹的规避。这些方法的主要思路都是首先建立理想的空中对抗模型，然后使用一些数学方法，比如微分动态规划法来得到最优解，而实际的空战模型非常复杂，加上这一时期的研究中几乎没有建立态势模型，因此优化目标通常是飞机的状态信息，得出的最优解的应用范围比较小。

为解决这种方法的不足，关于空战的架构研究开始发展起来。Byrnes[4]提出了一种概念无人机FQ-X，这种无人机采用了观察、判断、决策、执行回路(observation,orientation,decision,action,OODA)和能量机动结构，并在OODA的框架下设计了无人机自主作战决策。李清伟等[5]提出了一种空战分层决策模型，使用经验知识将复杂高维的战场决策分解成数个低维的模块，决策模型更加符合空战作战经验。OODA作为这一时期的空战架构，给众多研究者指明了空战中的研究重点和研究方向，其中态势评估可以作为OODA的评价标准也成为研究重点。

态势评估作为空战博弈的感知和评价[6]在空战决策模型中起到至关重要的作用。在众多的态势评估研究成果中，几乎都是基于导弹攻击区进行设计的，其中角度态势尤为重要。史振庆等[7]在估计角度态势时，考虑了敌机的攻击区对我机的影响。兰轶冰等[8]使用几何学方法对角度态势进行评估。王光辉等[9]使用区间数和模糊综合评判结合的方法得到空战威胁评估模型。赵克新等[10]使用改进的决策树方法估计空战态势。Xuan等[11]使用灰色模糊贝叶斯网络表示空战态势。姜龙亭等[12]根据贝叶斯概率提出一种动态变权重的态势评估方法。此外，态势评估还可以应用在强化学习的奖惩函数上，以强化学习为基础的空战策略也流行开来。

近年来，随着计算机算力的提升，信息化、人工智能等技术的发展，深度学习、强化学习等人工智能计数的研究流行开来，而基于这种人工智能思路的空战决策的研究也已有不少。谢建峰等[13]使用强化学习的思想对遗传算法进行改进，设计了无人机空战机动决策算法。谢俊洁等[14]在空战决策中使用Q-learning的强化学习方法进行目标分配，使用智能优化算法进行火力分配。Lowe等[15]使用了actor-critic方法的强化学习研究了多智体的协同对抗问题。2020年DARPA举行了阿尔法狗斗试验，表明了空战决策技术日益成熟，且愈加得到重视。

空战研究不仅体现在顶层的空战决策上，而且在底层的控制研究也有不少，蓝伟华等[16]根据不同空战环境设计了瞄准攻击、逃逸等控制律。刘佩等[17]采用复合控制思想，在原始控制中加入限幅、指令淡化等功能，来实现空战机动的飞行轨迹控制。反步法作为一种成熟的非线性控制方法已经应用于各类控制领域上。反步法是在20世纪90年代初，由Kanellakopoulos等提出，该方法在设计之处就考虑了Lyapunov稳定性，通过引入虚拟控制的概念，采用逐步反推的思想对每一环进行控制器设计。反步法发展至今，有着诸多的改进，其中约束反步法能够有效解决常规反步法没有考虑系统输入和状态的约束问题。在设计约束反步法控制器中，一种方案是引入误差的修正量，通过对修正量的更新，保证系统稳定；另一种方案是引入障碍Lyapunov函数，由此设计的控制器会在范围的边界附近阻止状态越界。反步法作为目前非线性控制中较为成熟的方法，在飞行控制方面有着诸多研究。

针对飞行机动过程中没有考虑态势信息，导致己机在机动时飞行安全受到影响的问题，比如飞机执行一个斤斗等类似的机动，整个机动做完耗费的时间基本上都超过20 s，有人机由于过载限制，所用时间会更长，而在这段时间内，己机的路径都是固定的，很容易被预测并针对。本文提出了带态势信息约束的反步法的空战机动控制方法，该方法可以保证飞机在做特定机动过程中，通过设计特定的Lyapunov函数，运用带约束的反步法，将角度态势信息考虑到控制中，得到带有角度态势约束的反步法控制律。最后通过仿真验证了在斤斗机动和上半滚倒转机动中，该方法能考虑到态势变化并有效地使得飞机角度态势朝优势发展。

1 一对一空战问题描述

一对一空战过程中，己机通常根据敌机的相对位置、航向等信息，采取相应的机动进行应对。因此空战决策通常可以分为态势评估部分和机动动作设计部分。

1.1 态势模型

一对一空战态势模型实质上是敌我两机在对方导弹攻击区的可能性模型。而导弹攻击区是指载机在一定的发射条件下导弹可以命中的空间范围。在态势评估中，通常将这种模型分解成4个方面，分别是速度、高度、距离和角度。

本文主要目标是将态势信息引入到底层控制中，用角度态势对飞机的横滚模态进行修正。

图1 空战基本态势

在对角度态势建模时,忽略导弹最大离轴发射角和最大搜索方位角,认为在目标进入角不变时,目标方位角为0时态势最优,为π时态势最劣,基于这种思想,对目标方位角进行划分,可以得到近似的角度态势模型为

Sa=

(1)

式中,Sa为角度态势值,范围在[-1,1],大于0时表示优势,小于0时表示劣势。其态势与目标方位角和目标进入角之间的关系如图2所示。

图2 角度态势图

1.2 机动动作设计

通常机动动作库的设计有2种思路:①NASA提出的7种基本的机动动作;②使用典型战术机动的动作库,比如眼镜蛇机动、斤斗等。本节内容主要针对第二种,对斤斗机动和上半滚倒转机动进行设计。

斤斗动作能够降低前进速度,能将劣势态势转为优势,同时在躲避空空导弹上也起到作用。关于斤斗动作的控制通常是分阶段的,根据飞机所处的不同状态,选择合适的控制目标。下面给出斤斗动作的执行流程。

表1 斤斗动作流程

上半滚倒转在前半段同斤斗一样,使飞机拉起,后面通过控制滚转角,将飞机回正。因此,可以给出上半滚倒转机动流程。

表2 上半滚倒转动作流程

2 带有约束的反步法飞行控制

飞行过程中,飞机的状态量存在各类物理条件下的约束,比如速度迎角和高度应该在飞行包线内,控制律的舵面输出存在速度和位置的限制等。这些约束在常规飞行下不会影响飞机的稳定,然而当飞机在机动飞行或者需要给出大的指令信号时,由控制律输出的数值很容易导致舵面饱和,进而影响系统的稳定性。

本节将对这类自身约束的飞机进行反步法的飞行控制律设计。

2.1 控制律设计

以六自由度飞机模型为例,给出飞机速度,气流角和角速度的微分方程

(2)

(2)式可写成

(3)

其中，角度回路中,系统状态为气流角和角速率

(4)

根据模型(3)设计控制律,首先对速度通道控制律进行设计。

zV=V-Vref

(5)

(6)

式中，χV为误差的修正量。设Lyapunov函数为

(7)

对(7)式求导

(8)

(9)

(10)

由(9)式和(10)式可得控制律为

(11)

(12)

然后对气流角回路控制律进行设计,定义气流角误差变量和修正误差变量

zαβφ=xαβφ-xαβφ,ref

(13)

(14)

式中，χαβφ为气流角修正值。可得虚拟控制律为

(15)

(16)

可得控制律为

式中：u0为控制律解算出的结果；u表示由指令滤波器输出后的结果,指令滤波器结构如图3所示。

图3 控制律输出的指令滤波器结构

2.2 稳定性分析

设Lyapunov函数为

(21)

两边求导

(22)

将(16)式和(20)式带入(22)式可得

(23)

由(4)式可以看出gαβφ(x),gpqr(x)都是满秩的,因此二者可以直接求逆,并且控制律结果是唯一的,不存在奇异情况。

将虚拟控制律(15)式和控制律(19)式带入(23)式得

(24)

3 基于态势约束的反步法飞行控制

在空战过程中,飞机在采取特殊机动,如斤斗、上半滚倒转这类机动时,能够通过这类机动取得优势,但同时,这种特殊机动需要持续约20～60 s不等的时间,而在这段时间内,己机的未来运动轨迹很容易被预测,如果敌机采取针对动作时,己机需要尽快切出这个机动,否则会十分被动。

因此飞机在做机动的过程中,还应该考虑两机之间的态势变化,如果在做常规的机动控制中包含态势的信息,将更有利于空战中己机的生存率。

3.1 修正误差更新律设计

这里将角度约束增加到控制律中,对角度态势改变最有效的是控制航迹滚转角,由前文内容可知约束反步法的控制律输出,在带有态势约束的情况下,设修正误差为

(25)

式中：χμ为航迹滚转角的修正量；c为方向参数,取值为±1。则可得虚拟控制律和修正量χμ的更新律为

(26)

(27)

式中：kμ为正数,是控制律增益,同时也表示修正量收敛到0的快慢；f(*)为态势到修正程度的函数,根据态势的优劣程度,设置相应的函数使得修正量始终向态势变优的方向发展。因此控制律的重点就在于求解f(*)的表达形式。

在(27)式的作用下,当态势值为优势时,此时χμ在f(Sa,χμ)控制下应该朝向0变化。当态势为劣势时,在f(Sa,χμ)控制下χμ存在一定的偏差来修正原本的控制量。因此可以得到f(Sa,χμ)的大致表达式

f(Sa,χμ)=Sa(-kμχμ+kS(1-Sa))

(28)

(29)

由(29)式可知,在初始时刻,c为1,然后c的取值将由上一拍的c决定。如果态势朝优势变化,则c不变,认为此时的修正量对误差的修正方向不变;如果态势朝劣势变化,则c取反,认为此时的修正量对误差的修正方向应该反向。

3.2 障碍Lyapunov函数

修正误差更新律是将态势信息转换成航迹滚转角的指令数值,这一过程中需要考虑修正误差的定义范围。这里引入障碍Lyapunov函数,障碍Lyapunov函数是一种特殊的Lyapunov函数,常见形式有分数形式,对数形式或者正切形式。当状态量在区间边界附近时,其导数会非常大,阻止状态量越出边界。

对于原修正误差χμ,可以定义Lyapunov函数为

(30)

则(30)式的导数为

(31)

当态势为优势时,即Sa>0时,忽略χμ的更新输入,有

(32)

现使用障碍Lyapunov函数进行改进

(33)

式中，L为χμ的边界,即可认为χμ∈(-L,L),则χμ的更新律可改进为

(34)

3.3 稳定性分析

设Lyapunov函数为

(35)

对其求导得

(36)

将(26)式和(34)式带入(36)式可得

(37)

当态势为优势时,即Sa>0时,设Lyapunov函数为

(38)

对(38)式求导,将(34)式代入,在不考虑输入时

(39)

所以可得χμ→0成立。

由稳定性分析可知,在系统处于优势时,此时修正量会很快趋于零,即优势状态下,基本不会对系统指令进行修正。而在系统处于劣势时,此时控制律的修正量将起作用,通过对滚转角虚拟控制律进行修正,确保系统的态势向优势变化。

4 仿真验证

仿真中使用F-16飞机进行空中对抗模拟。首先给出初始状态己机为劣势时,采用斤斗机动的仿真结果。其中飞机的初始状态包括三轴位置以及速度、航迹倾斜角和航机方位角用[x,y,h,V,γ,χ]表示,敌机初始状态为[1 500,4 000,3 000,150,0,0],己机初始状态为[0,0,3 000,150,0,0]。

图4 直接斤斗机动双机轨迹

图5 带角度态势约束的斤斗机动双机轨迹

图6 上半滚倒转机动2种方法舵面输出对比

图7 斤斗机动2种方法角度态势对比

由仿真结果可以看出，在仿真起始时，己机处于劣势态势，此时在修正误差的作用下，己机向右侧偏，态势逐渐增大。随后在斤斗翻转的过程中，己机最终会从劣势转成优势。带了态势约束的斤斗机动比直接机动在系统态势上有了一定提升。

然后给出己机在初始状态处于互为均势时，采用上半滚倒转的仿真结果。其中飞机的初始状态包括三轴位置以及速度、航迹倾斜角和航机方位角[x,y,h,V,γ,χ]，敌机为[1 000,3 000,3 000,150,0,0]，己机为[0,0,3 000,150,0,0]。

图8 直接上半滚倒转机动双机轨迹

图9 带角度态势约束的上半滚倒转机动双机轨迹

由仿真结果可以看出，开始时己机处于互为均势，在修正误差的作用下，己机开始向右侧偏，到飞机俯仰角翻转180°后，己机态势最终变为优势。带了态势约束的上半滚倒转机动比直接机动在系统态势上有了一定提升。

图10 上半滚倒转机动2种方法舵面输出对比

图11 上半滚倒转机动2种方法态势值对比

5 结论

针对机动飞行过程中，己机会受到敌机机动飞行的影响，导致态势变差的问题，本文提出了一种带有态势约束的机动控制律设计方法。将态势信息作为约束，引入到底层控制律中，当飞机处在劣势态势时，控制律会通过修正误差使飞机态势朝优势变化；而当飞机优势时，则修正误差会很快收敛至零。通过斤斗机动和上半滚倒转机动的仿真验证表明，将态势信息引入控制律设计中，己机的飞行轨迹更优，态势得到了很大提升。本文为飞机空战的控制提供了一种新的思路，这和微分对策等最优求解的方法有所不同。微分对策这类方法则更重视对优化目标函数的求解，以得到最优空战态势，而本文的方法认为态势信息不止作为决策的输入，还可以作为控制器的补偿值，这种方法更加看重系统的稳定性，其次是提升空战态势。最后，本文只是引入了态势估计的一部分，即角度态势，并补偿到横滚通道控制量中，而对于更全面的态势，以及对应的控制分配问题还需要进一步的研究。