APP下载

改进型模型预测静态规划制导律算法

2022-08-02胡任祎贺彦峰史丽楠马洋洋泮斌峰

航天控制 2022年3期
关键词:改进型步长制导

胡任祎 贺彦峰 史丽楠 马洋洋 泮斌峰

1.北京航天自动控制研究所,北京 100854 2.西北工业大学航天学院,西安 710072

0 引言

随着战场环境的日益复杂化和防御体系的发展完善,仅考虑单一命中精度要求的导弹末制导律已经不能满足现代战争需要。例如,对于反舰作战,不仅需要导弹能够精确命中目标,还需要满足特定的攻击角度以增加毁伤效果;对于协同作战,为保证导弹同时命中目标,需要满足攻击时间约束等。因此,研究复杂环境多约束条件下制导律,以增加毁伤效果和提高作战效能,具有重要的理论价值和应用前景[1,2]。

除了传统的比例导引律,先进制导律的研究工作主要依赖于最优控制、滑模变结构控制、李雅普诺夫理论、反馈线性化等控制理论。文献[3]针对再入飞行器含终端位置约束和落角约束的末制导问题,引入了二次型性能指标函数,将含约束的末制导问题描述为线性二次型最优控制问题,推导了Riccati方程以提供时变反馈增益,最终得到一种次优末制导律。文献[4]基于滑模控制理论提出了一种以期望落角拦截静止和匀速运动目标的制导律。该方法在有限时间内选择合适的导弹横向加速度并在设计的开关表面上施加非奇异的终端滑模,进而实现期望的撞击角。文献[5]针对含有攻击时间和终端落角的末制导问题,提出了一种既可用于反舰导弹的有效齐射攻击也可用于无人飞行器的协同任务的新型制导律,该制导律可以导引导弹在指定的攻击时间内以规定的撞击角度打击目标。另外,基于深度学习和强化学习理论的导弹智能制导技术也得到了充分发展[6-7],本文不再展开讨论。

近年来,模型预测静态规划(Model Predictive Static Programming, MPSP)算法在轨迹优化以及制导控制领域得到广泛研究和应用。它结合模型预测控制和静态规划思想,能够高效解决含终端约束的两点边值问题,具有在线计算潜力。文献[8]针对弹道导弹再入段含终端落角约束的末制导问题,以制导过程消耗能量最少作为性能指标,建立最优控制问题,采用MPSP算法将动态规划问题转换成静态规划问题,进而得到解析最优控制量,在打击静止和机动目标两种场景中验证了该制导律的有效性。文献[9]针对多枚导弹协同制导问题,以含攻击时间约束的制导律作为初始猜测,采用MPSP算法对控制变量进行迭代更新直至满足落点和落角约束,从而得到能够同时满足攻击时间和攻击角度约束的次优协同制导律。文献[10]在MPSP算法基础上,推导终端输出和终端时间误差与控制量增量之间的关系,并在目标函数中添加终端时间误差项,建立控制量增量和终端时间误差的静态优化框架,从而设计出可变终端时间的三维非线性次优制导律。文献[11]提出MPSP算法等价于欠定方程组求根问题的牛顿迭代法,并存在牛顿法的缺点,即当初始猜测远离真实解时,收敛性较差。文献[11]进一步引入阻尼增稳技术,通过阻尼参数调节迭代步长的大小,提高算法收敛性。

本文在上述研究和分析的基础上,首先给出传统MPSP算法的推导过程,然后采用线搜索和信赖域策略发展出两种改进型MPSP算法,最后通过数值仿真验证了两种改进型MPSP算法的有效性。

1 MPSP算法

本节将MPSP算法等价于欠定系统求根问题的牛顿迭代法,并给出推导过程和计算步骤,进而为后文改进型算法奠定基础。

考虑离散形式的系统动力学方程和输出方程:

(1)

式中:xi∈n,ui∈m和yi∈p分别为ti时刻下的状态矢量、控制矢量和输出矢量;i=1,2,…,N表示离散形式的时间步长。

考虑典型问题即寻找合适的控制量U使得系统满足终端约束方程:

(2)

将式(1)代入式(2),可以得到:

(3)

式中:F:mN→p为终端约束函数;U∈mN为离散形式的控制序列,即

因此,上述典型问题可以重新表述为欠定系统的求根问题,如下所示:

(4)

牛顿法是一种高效、常用的迭代算法。从初始猜测U0开始,其迭代公式可以表示为:

(5)

式中:雅可比矩阵F′(Uk)∈p×mN定义为:

(6)

(7)

考虑到式(5)中的迭代方向dUk存在无数个解,必须施加附加条件使得迭代方向唯一确定。最典型的思路是求解如下最小二范数问题:

(8)

问题(8)可以利用Lagrange乘子法解析求解,进而得到迭代增量:

dUk=-F′(Uk)+F(Uk)

(9)

式中:F′(Uk)+为雅可比矩阵F′(Uk)的摩尔-彭若斯广义逆矩阵,其计算公式为:

F′(Uk)+=F′(Uk)T[F′(Uk)F′(Uk)T]-1

(10)

因此,传统MPSP算法的计算步骤可以概括如下所示:

1. 令k=0,给出控制量初始猜测U0;2. 计算控制量迭代增量dUk;3. 更新控制量Uk+1=Uk+dUk;4. 判断收敛条件Uk+1-Uk≤ε是否满足,若满足,转步骤5,否则,令k=k+1,转步骤2;5. 获得原问题的解Uk+1,结束。

2 改进型MPSP算法

牛顿法收敛速度快,计算效率高,但是对初始猜测比较敏感;而线搜索和信赖域是解决牛顿法收敛性的关键技术。因此,本节分别基于线搜索和信赖域策略发展出两种改进型MPSP算法。

2.1 基于线搜索的MPSP算法

线搜索方法[12]的基本思路是先确定迭代变量的更新方向d,然后在该方向上确定一个最佳的步长α,使得目标函数沿d方向前进α距离后下降最多。在迭代方向式(9)的基础上,线搜索的迭代公式可以表示为:

Uk+1=Uk+αdUk

(11)

式中:α为迭代步长,且满足下述优化问题:

(12)

直接求解优化问题(12)比较困难,计算量较大。常用的思路是尽可能选择较大的步长,使得目标函数值尽可能降低。比如回溯策略从步长为1开始,判断是否满足充分下降条件,如果满足就停止搜索,否则缩小步长,再次判断,直到满足充分下降条件为止。

下面给出基于线搜索的MPSP算法的计算步骤,如下所示:

1. 令k=0,给出控制量初始猜测U0和参数c;2. 计算控制量迭代增量dUk;3. 判断F(Uk+αdUk)≥(1-α/2)F(Uk)是否满足,若不满足,令α=cα,再次判断,直到满足条件;4. 更新控制量Uk+1=Uk+αdUk;5. 判断收敛条件Uk+1-Uk≤ε是否满足,若满足,转步骤6,否则,令k=k+1,转步骤2;6. 获得原问题的解Uk+1,结束。

2.2 基于信赖域的MPSP算法

信赖域方法[12]的基本思路是先用一个简单模型近似目标函数,然后确定一个信赖域半径,在该半径范围内寻找一个使得近似模型下降最多的更新量。直观意义上,线搜索方法先确定迭代方向,再确定迭代步长;而信赖域方法先确定最大迭代步长,再确定方向和实际步长。

首先构造信赖域子问题,如下所示:

(13)

同理,直接求解优化问题式(13)比较困难,计算耗时长。折线法可以利用柯西点和牛顿点近似求解该约束优化问题。其中,柯西点即为不考虑信赖域约束情况时问题式(13)的最速下降点,其迭代增量表示如下:

(14)

牛顿点即为不考虑信赖域约束情况时问题式(13)的牛顿下降点,其迭代增量同式(9),表示如下:

(15)

在利用折线法得到信赖域子问题式(13)的近似解后,计算目标函数的真实下降值,即:

(16)

计算目标函数的预测下降值,即:

(17)

定义比值rk:

rk=Aredk/Predk

(18)

比值rk代表近似模型与目标函数的逼近程度,rk越接近1,表示逼近程度越高,并根据比值rk调整信赖域半径Δk的大小。

下面给出基于信赖域的MPSP算法的计算步骤,如下所示:

1. 令k=0,给出控制量初始猜测U0和相关参数 0<θmin<θmax<1,0<δmin<δ;2. 计算牛顿点的迭代增量dUkNP,若dUkNP≤δ,则计算dUk=dUkNP,转步骤4,否则,转步骤3;3. 计算柯西点的迭代增量dUkCP,若dUkCP≥δ,则计算dUk=δ·dUkCP/dUkCP,转步骤4,否则,计算dUk=dUkCP+τ(dUkNP-dUkCP),转步骤4;4. 计算Aredk和Predk,并判断Aredk

3 数值仿真

考虑导弹三自由度质点动力学方程:

(19)

式中:[x,y,z]T为导弹的位置矢量;V为速度大小;γ为飞行路径角;ψ为航向角;m为导弹质量;g为重力加速度;az和ay分别为法向和横向指令加速度。D表示阻力大小,计算公式为:

(20)

(21)

式中:CD0为零升阻力系数,K为诱导阻力因子,两者均为速度的函数。

仿真模型中考虑一阶延迟环节,如下所示:

(22)

式中:τ为时间常数。

制导算法的任务是求解合适的制导指令az和ay使得导弹能够击中目标,并且能够满足攻击时间约束和攻击角度约束。这里,终端约束条件可以表示为:

(23)

本文考虑导弹的初始质量为m=150kg,参考面积为S=0.0324m2,气动参数参考文献[13]。导弹的初始状态设置如下:

(24)

期望终端位置设置为(0,0,0)m,终端飞行路径角和航向角设为(-40,190)°,终端时间设为28s。

首先需要给出控制量的初始猜测U0。这里采用2种生成方式:1)采用扩展比例导引律生成初始猜测,记作良好初始猜测;2)采用零控导引律作为初始猜测,即将控制量全部设置为0,记作差初始猜测。本节分别利用传统MPSP算法和2种改进型MPSP算法,并考虑2种初始猜测进行仿真试验和比较分析。

图1表示基于传统MPSP和2种改进型MPSP算法的导弹三维运动轨迹曲线。当采用良好初始猜测时,3种算法均能够使得导弹命中目标。当采用差初始猜测时,传统MPSP算法无法收敛,而两种改进型MPSP算法均能够保证收敛。

图1 导弹三维运动轨迹曲线

图2和图3分别表示法向和横向指令加速度变化曲线。可以看出,当采用良好初始猜测时,3种算法得到的指令加速度有少许差异,但变化趋势保持一致。然而,同一种算法基于2种不同初始猜测得到的指令加速度的变化趋势存在明显差别。因此,同一种算法基于不同初始猜测得到的状态轨迹、飞行路径角以及航向角的变化趋势也存在差别,如图1、图4和图5所示。

图2 法向指令加速度变化曲线

图3 横向指令加速度变化曲线

图4 飞行路径角变化曲线

图5 航向角变化曲线

图4~5分别表示飞行路径角和航向角的变化曲线。可以看出,当采用良好初始猜测时,3种算法均能同时满足攻击时间和攻击角度约束。当采用差初始猜测时,两种改进型MPSP算法也能同时满足设定的终端约束。

相比传统MPSP算法,基于线搜索的改进型MPSP算法需要多消耗大约16.3%的计算时间,基于信赖域的改进型MPSP算法需要多消耗大约28.7%的计算时间。尽管如此,两种改进型算法仍能保证一定的计算效率,同时具有更强的收敛性。

4 结论

针对多约束条件下导弹末段制导问题,提出了两种改进型MPSP制导律算法。传统MPSP算法对初始猜测比较敏感,收敛性较差;而本文提出的改进型MPSP算法利用线搜索和信赖域策略能够明显降低其对初始猜测的依赖性,增强收敛性。仿真结果表明,两种改进型MPSP制导律算法,即使在较差初始猜测条件下,均能够有效地完成飞行任务。

猜你喜欢

改进型步长制导
董事长发开脱声明,无助消除步长困境
步长制药50亿元商誉肥了谁?
步长制药50亿元商誉肥了谁?
起底步长制药
盾和弹之间的那点事(十三)
盾和弹之间的那点事(十)
盾和弹之间的那点事(九)
盾和弹之间的那点事(八)
IWI美国分公司UZI PRO SB半自动冲锋枪改进型
俄罗斯赛加MK—107半自动步枪改进型