一种多约束条件下的三脉冲交会优化设计方法
2022-08-17李君龙李松洲
李君龙, 李松洲, 周 荻,*
(1. 北京电子工程总体研究所, 北京 100854; 2. 哈尔滨工业大学航天学院, 黑龙江 哈尔滨 150001)
0 引 言
空间交会技术一直是航天领域的重要研究内容之一,无论是合作目标的故障诊断、维修以及燃料加注等,还是对非合作目标的抵近观察监视以及空间碎片清理等,都需要依赖空间交会技术。由于航天器所能携带的燃料十分有限,以降低能耗为目的的最优交会问题是空间交会技术研究的热点问题之一。关于最优交会问题,主要集中在两脉冲和多脉冲交会问题的研究,通常采用的方法可分为智能优化方法和传统优化方法。
智能优化算法凭借强大的全局搜索能力,在最优交会问题求解中得到广泛应用。文献[8]应用遗传算法对第一脉冲位置变化条件下的双冲量时间-燃料最优交会问题进行求解,表明第一次冲量位置对优化指标影响较大。文献[9]提出一种基于种群熵粒子群优化(particle swarm optimization,PSO)算法求解固定时间燃料最省的多脉冲交会问题,通过种群熵确定搜索空间,减少了搜索空间的浪费,提高了算法收敛速度和精度。为了减轻算法对参数设置的依赖程度,文献[10]综合差分进化、遗传算法和PSO算法优势,提出一种混合进化算法对固定时间共面圆轨道间的多脉冲交会问题,提高了算法的搜索效率。文献[11]以转移时间和控制能耗为代价函数组,以脉冲个数和作用位置为设计变量,通过多目标遗传算法研究了在轨服务卫星的共面多脉冲交会帕累托最优意义下的轨迹优化问题。文献[12]采用圆锥曲线拼接法将两轨道间的多脉冲转移问题转化为参数优化问题,并提出一种将改进的PSO方法和自适应共轭梯度法相结合的混合优化算法,有效解决了优化变量随着脉冲数线性增长所带来的初始化难题。文献[13]采用深度学习方法研究了脉冲大小受限、飞行轨迹受约束条件下的线性多脉冲交会的最优制导问题,通过在网络训练中综合考虑飞行中的多种干扰因素的影响,使算法表现出良好鲁棒性。文献[14]提出了一种序列重排方法,对固定时间多脉冲最优交会问题求解过程中的等式约束进行了巧妙处理,为进化算法的设计和应用提供了便利。
此外,一些传统优化方法也被大量用于求解最优交会问题。文献[15]研究了两定点间轨道转移的双脉冲优化问题,表明在转移时间不受限制的条件下的最优转移轨道角动量幅值满足一个四次方程,并证明了解的存在性。文献[16]结合状态转移矩阵和古典变分法提出一种两脉冲轨道转移优化算法,具有计算速度快和精度可控的优点,其本质上是一种迭代算法,对迭代初值具有一定依赖性。文献[17]在求解固定时间三脉冲交会优化问题时,引入“序优化”思想,减小了搜索空间,提高了搜索效率。文献[18-19]基于基矢量法研究了固定时间近圆轨道间的四脉冲最优交会问题,所提方法都是基于线性化交会模型,不适于远程交会问题的求解。文献[20]建立了包含J2摄动项和大气阻力项并考虑对非合作目标导航误差影响的椭圆轨道最优交会模型,通过引入松弛变量将最优交会问题转化为标准二阶锥规划问题进行求解,但其所采用的模型是以起始相对距离较近为前提的线性化模型,对于远程交会问题求解同样不适用。与此类似,文献[21]基于Clohessy-Wiltshire(C-W)方程采用二阶锥规划方法求解了初始接近、路径点跟踪以及考虑球形安全域的目标监视等交会问题的求解。文献[22]研究了非线性脉冲控制系统的最优控制问题,提出一种自适应动态规划求解方法,并将其用来求解固定时间多脉冲轨道转移问题。文献[23-26]还研究了多航天器间的最优交会问题。另外,关于连续推力最优交会,也有大量相关研究成果,但连续推力在实际应用中存在实现成本高等问题,远不如脉冲推力应用得广泛。
上述研究多以交会时间为固定量或为自由量进行展开,且多数仅适用于求解近程交会问题。对于空间快速对接进行定点观测任务而言,要求整个任务在规定时间内完成,即交会总时长满足一个不等式约束。此外,某些情况下的特殊任务要求在追赶飞行器和目标飞行器距离较远时就开始执行交会任务,这使得上述交会制导不完全适用。本文将围绕该任务背景,建立共面圆轨道条件下的三脉冲最优交会数学模型,将Hill制导方法与粒子群算法相结合求解转移路径点以及转移时机的最优解,考虑到交会时间约束和转移路径约束,提出一种等价变换的方法将原始待求量转化为一组新的相互独立的待求变量,将各约束项转化为更加易于描述和处理的搜索空间边界条件,减小了算法初始化过程计算量,简化了算法对约束的处理方法设计,一定程度上改善了算法寻优性能。
1 相对运动模型
设目标T在一个圆形轨道上飞行,一般而言,为实现对目标的接近观测,往往先将观测器(追赶飞行器)运送到一个比目标飞行器低(或高)数十公里的圆形停泊轨道,待到合适时机二者相对位置满足一定条件(如相对距离小于100 km)后,开始实施交会接近制导过程,将观测器送到指定位置,对目标实现定点稳定观测。为了完成这样的任务,不仅要求观测器在最终时刻抵达指定相对位置,而且要求二者相对速度充分小。
设观测器所在停泊轨道与目标飞行器轨道共面,则观测器与目标飞行器的相对运动关系如图1所示,为目标轨道坐标系,为目标飞行器,表示追赶飞行器,、分别表示二者的地心距矢量。
图1 追赶器与目标飞行器的相对运动关系Fig.1 Relative motion between the pursuer and the target aircraft
(1)
令=0和=0,可以得到无控制作用下相对运动的解析解为
(2)
从而得到对应的相对速度为
(3)
则方程(2)可表示为
(4)
则方程(3)可表示为
(5)
由方程(4)可以得到
(6)
在给定转移时间和终端相对位置的条件下,可以由式(6)求得所需初始相对速度,这就是Hill制导,将求得的结果与追赶飞行器当前相对速度作差即可求得完成转移需要的速度脉冲。
2 三脉冲交会优化模型
考虑到Hill制导仅适用于相对距离小于50 km的情况,对于完成相对距离大于50 km的交会任务,采用将这个交会过程分成多段实施,通过设置转移路径点,使最后一个路径点与目标距离小于50 km,保证了最后一次转移的精度,在邻近路径点间应用Hill制导实现追赶飞行器在邻近路径点间转移,最终逐步将追赶飞行器转移到期望终端相对位置,并于终端施加一次制动脉冲,消除与目标飞行器间的相对速度,保证观测器完成定点稳定观测任务,这样就形成了一个多脉冲交会问题。在该问题中,路径点位置的设置和各路径点间转移时间的选择都会影响最终任务能量消耗。对于空间飞行器而言,燃料有限,因此合理设计交会过程,减小任务过程燃料消耗十分重要。
本文重点研究有时间约束的三脉冲最优交会问题,设追赶飞行器在停泊轨道飞行,当与目标飞行器相对距离小于100 km(时刻)后开始进入交会阶段,为了方便说明,整个交会过程示意图如图2所示,图中(=0,1,2,3)和(=0,1,2,3)分别表示追赶飞行器和目标飞行器在时刻(=0,1,2,3)的位置。交会过程描述如下:
图2 交会过程示意图Fig.2 Illustration of the rendezvous
(7)
(8)
相对观测位置给定,即已知,从而有
(9)
而
(10)
所以
(11)
(12)
3 优化算法设计
PSO算法是模拟鸟类群体觅食行为的一类启发式智能优化算法,种群的每只鸟(每个粒子)通过综合自身经验和群体经验调整觅食方向,朝着食物丰富的方向进行搜寻,直到找到食物最多的地点。PSO算法的核心可以表达为
(13)
(14)
(15)
标准PSO算法计算过程如算法1所示,其中和分别表示搜索空间的上下边界,和为根据实际需要设定的搜索步长上下界。
算法 1 PSO 算法伪代码步骤 1 初始化变量kmax,w,cp,cg,N,Xmin,Xmax以及Vmin,Vmax步骤 2 初始化各个粒子的位置以及速度Xi,0=Xmin+UXi,0(Xmax-Xmin), i=1,2,…,NVi,0=Vmin+UVi,0(Vmax-Vmin)步骤 3 计算每个粒子的适应度函数pi,k=ffit(Xi,k), i=1,2,…,N 步骤 4 计算个体历史最优适应度pbesti,k=pi,k和种群最优适应度gbestk=min{pbesti,k},记对应的个体和种群历史最优位置分别为Xbesti,k和Xbestk步骤 5 更新速度Vi,k+1=wVi,k+cpUpVi,k+1(Xbesti,k-Xi,k)+cgUgVi,k+1(Xbestk-Xi,k)步骤 6 更新位置Xi,k+1=Xi,k+Vi,k+1步骤 7 更新适应度pi,k+1=ffit(Xi,k+1)步骤 8 如果pi,k+1 在实际计算过程中,往往还存在粒子位置和速度“溢出”边界的情况,这时一般需要在执行算法1中的步骤5和步骤6时,额外执行 (16) (17) 以保证各粒子在搜索空间内部以规定的搜索步长进行搜索。 Δ+Δ+Δ≤600 s (18) (19) (20) (21) 图3 Δt0、Δt1、Δt2分布等价性蒙特卡罗实验结果Fig.3 Monte Carlo experiment result on the distribution equivalence of Δt0,Δt1,Δt2 图4 x2、y2分布等价性蒙特卡罗实验结果Fig.4 Monte Carlo experiment result on the distribution equivalence of x2,y2 表1 初始轨道参数 表2 PSO算法初始化参数 当采用原始变量进行求解时,还需要对式(18)和式(19)所述约束进行处理,这里采用设置惩罚函数的方式,当判断当前粒子不满足式(18)和式(19)时,赋予该粒子一个很大的适应度函数值=10 000,这样种群中的粒子在式(13)的作用下就会避免向该位置靠近,从而促使种群粒子尽可能地在约束空间内进行运动搜索。 进行100次打靶实验,最终得到的变量变换前后的打靶结果如图5和图6所示,相应的统计结果见表3。可以看到,尽管变换后求得的结果终端误差相对于转换前略大一些,该误差工程上依然可以接受,但是相应的能耗都要比变换前低很多,且各次寻得的最优能耗值趋于一致。另外,变换后算法计算耗时情况如图7所示(计算环境为:软件Visual Studio 2017;PC机Intel(R) Core(TM) i7-8700 CPU @ 3.20 GHz),可见寻优过程的计算耗时基本保持在31 ms左右,稳定在40 ms内的仿真次数占比得到98%。在这么短的时间内飞行器间相对运动关系变化不大,由计算耗时带来的转移误差可忽略不计。因此,所提算法能够满足在线应用需求。 表3 三脉冲交会寻优打靶结果统计 图5 总冲量打靶结果Fig.5 Total impulse shooting results 图6 终端误差打靶结果Fig.6 Terminal error shooting results 图7 计算耗时打靶结果Fig.7 Computing time shooting results 所以,采用本文的等价变换方法将原始变量转化为一组新的相互独立的变量后,将原本的式(18)和式(19)所述的不等式约束转化为明晰的搜索空间边界,相对于原来设置惩罚函数的方式,在这种设计下,算法搜索效率更高,找到最优值的概率更大,算法整体性能更加稳定,如表4所示,对应的收敛过程和追赶飞行器接近目标飞行器的相对运动轨迹分别见图8和图9。 表4 三脉冲交会寻优结果 图8 寻优收敛过程Fig.8 Convergence process of the optimization 图9 接近过程的相对运动轨迹Fig.9 Trajectory of relative motion for the approaching process 以空间快速接近定点观测任务为背景,本文研究了共面圆轨道间远距离三脉冲最优交会问题。基于Hill制导算法和PSO算法,建立了具有交会时间和转移路径约束的多约束条件下的三脉冲交会优化模型,给出了相应的优化求解流程。针对原始问题中的约束项不易处理的问题,提出一种等价变换的方法,将原始待求变量转换为一组新的相互独立的变量进行求解,将原始的多项不易处理的多项约束转化为更加易于描述和处理的搜索空间边界条件,为算法的初始化过程带来了便利,同时使得算法的设计工作也更为简单。 应用所提出的方法和设置惩罚函数的约束处理方法分别进行了仿真实验,一方面验证了所提设计算法的有效性;另一方面,通过对比发现在采用本文所提方法进行算法设计时,一定程度上提高了算法效率,找到最优解的概率得到了提高,同时算法性能表现也更加稳定。本文的研究工作对于解决类似的多约束远程交会问题,具有一定的工程参考意义。4 仿真算例
5 结 论