基于多目标优化的深空探测器姿态组合规划方法

2021-07-02王卓，徐瑞

深空探测学报 2021年2期

王卓，徐瑞

（1.北京理工大学宇航学院，北京 100081；2.深空自主导航与控制工业和信息化部重点实验室，北京 100081）

引言

随着深空探测技术的不断发展，对深空探测器的姿态机动能力提出了越来越高的要求[1]，特别是在深空导航和科学探测等方面。与传统的航天任务相比，深空探测任务具有任务周期长、飞行距离远、通信和控制能力不足的特点，需要尽可能减少时间和燃料资源的消耗。因此，深空探测器在执行大角度姿态机动任务时，通常需要优化一个或多个性能指标参数，比如机动时间或能耗[2-3]。跟踪目标时探测器需要执行快速姿态机动，同时减少能量消耗，以尽可能地增加探测器在轨工作时间。此外，深空探测器还会受到其它复杂约束，比如以强光为特征的天体必须禁止进入某些特定的光学传感器区域（如红外敏感器件或低光敏器件）以免其敏感部件损坏，这类约束极大地限制了探测器姿态机动的可行域。同时，角速度和控制力矩的上限也会影响姿态机动[4]。在这些复杂的约束条件下，同时优化多种性能指标参数的姿态机动路径对深空探测器姿态控制系统来说是一个极大的挑战。

姿态约束显著减小了姿态机动路径的可行空间，在姿态约束处理方面，McInnes采用欧拉角描述深空探测器大角度姿态机动过程中对太阳矢量的回避问题[5]，但是只考虑了单个姿态指向约束。由美国和意大利联合研制的“卡西尼号”（Cassini）探测器采用了约束监测算法来进行约束姿态机动[6]，没有考虑该算法的收敛性。仲维国等[7]利用罗德里格参数来表示探测器姿态，同时通过快速扩展随机树（Rapidly exploring Random Tree，RRT）规划器规划出了安全可行的姿态机动路径，没有考虑姿态动力学，事实上实际的姿态机动过程中需要全方位考虑动力学约束与外部环境约束。Kjellberg等[8]通过A*算法进行姿态机动路径搜索，将连续的姿态空间进行离散化，而且设计了反馈控制器，但是该方法没有同时考虑多种姿态约束。

在姿态机动性能指标优化方面，关于有界约束的姿态机动路径优化研究，取得了一定的成果。被普遍认同的算法主要包括最速下降法、打靶法和多重打靶法等[9-11]，但这类方法都具有一定的缺陷，限制了其适用性，比如最速下降法的收敛速度较慢、打靶法对初值要求过高等。基于上述不足，高斯伪谱法作为一种直接求解方法，在进行时间最优控制的相关应用中体现出许多性能优势，Fleming等[12]首次在探测器时间最优机动问题中应用了高斯伪谱法，但是高斯伪谱法在处理多约束情况下的能力是有限的。考虑能量优化的情况，Kim等[13]将目标能量函数表示成关于状态的二次型，通过半正定规划获得姿态路径，但这样的单步控制模式很难满足深空探测器的指向约束。Spiller等[14]将元启发式算法引入到姿态机动问题中，将逆动力学方法和粒子群算法结合在一起，获得了时间最优姿态机动路径。武长青等[15]使用角速度时间编码的方式，采用标准差分的方法对姿态机动路径进行时间优化，但算法收敛速度较慢。在多目标优化方面，通常是将指标参数进行多目标加权，通过高斯伪谱法进行优化可得到最优解，但是运算时间过长，不适合深空探测姿态规划环境[16-18]。

本文主要关注深空探测器姿态机动多目标优化问题，提出多目标组合规划方法，旨在得到同时满足多种约束条件和优化指标的深空探测器姿态机动路径。多目标最优路径规划模型的特殊性主要表现在目标函数的构造上。通过物理规划方法设计目标函数，将多目标优化分解为单目标规划问题，以替代适应度函数作为优化标准。通过快速欧拉机动获得初始姿态路径，设计组合差分进化算法，以设定概率用快速欧拉机动路径改进变异过程，得到满足多约束多目标的深空探测器姿态机动路径。最后，基于深空探测器的姿态机动过程，进行多目标组合规划数值仿真，验证了所提出方法的可行性和有效性。

1 探测器模型

1.1 探测器动力学与运动学约束

深空探测器在轨运行时需要进行大量的姿态机动来完成各种跟踪和探测等任务，姿态系统需要时刻规划出有效合理的姿态机动路径。所以，对深空探测器姿态机动过程中约束的建模和分析是设计深空探测器姿态机动路径规划算法的前提。

本文将探测器视为刚体。为避免奇异性，采用四元数形式来描述姿态运动学和动力学约束探测器姿态机动

1.2 探测器有界约束

在实际深空探测任务中，深空探测器的执行机构提供的力矩幅值是有限的，控制输入有界约束为

其中：γ1表示系统控制力矩的幅值。

系统敏感器的量程有限，要求深空探测器的角速度必须保持在某个范围内，角速度有界约束为

其中：γ2表示系统角速度幅值。

1.3 探测器姿态指向约束

深空探测器在执行空间任务时，会面临较为复杂的指向约束，这些指向约束极大程度地缩小了姿态机动的可行空间。一旦违反指向约束，将会对深空探测器携带的光学载荷造成严重的损坏，进而影响对应空间执行的任务，所以要分析和处理深空探测器的指向约束。

深空探测器在姿态机动过程中必须避免强光天体进入敏感光学元件的视场角中，这种约束称为“禁止指向约束”。图1为深空探测器指向约束关系图，rg1表示该光敏元件在本体下的方向矢量，rI表示某一强光天体在惯性系下的方向矢量。

图1 深空探测器指向约束示意图Fig.1 Schematic diagram of pointing constraint of deep space probe

姿态机动过程中要求强光天体方向矢量和光敏元件的视线方向夹角不能低于视场角，约束表示形式为

将指向约束的姿态余弦矩阵展开，将指向约束表示为更加简洁的二次型形式

1.4 探测器多目标规划模型

姿态机动多目标优化不仅要满足上述复杂约束条件，还需要重点考虑时间和能量参数作为优化性能指标。这里将多约束下深空探测器姿态机动多目标规划问题归纳为以下形式，具体比例参数由第2节给出。

2 多目标组合规划算法

2.1 多目标分解

这里采用物理规划方法，将探测器姿态机动的多目标优化问题转化为单目标优化问题。通过分析多目标之间的关系，得到一个在Pareto最优解前沿附近的解[19]。

通过物理规划将不同性质的多个指标融合成一个分段指标，在分段区域根据指标优先级设置不同的权重，既能够根据指标的特性进行针对性的优化，又能够对多目标优化进行解耦，简化路径规划过程和提高规划效率。

其中：Pi是分解函数；nsc是目标函数的个数。

分解函数被划分成多个区间，在各个区间之中，通过分段曲线拟合能够得到各个性能指标函数的分解函数，用分段样条函数表示。第一段和剩下的多段表示如下

2.2 性能指标适应度函数

使用目标优化函数代替差分进化算法的总体适应度函数，用于改进差分进化算法的选择标准。目标优化函数由分解函数pi和性能指标适应度函数Ji(x)组成。

差分进化算法的性能指标适应度函数设置为越小越好型，通过寻找目标优化函数的最小值来变异、交叉和选择得到最优姿态机动路径。性能指标适应度函数除了探测器的性能指标机动时间和能量之外，也要考虑探测器遇到的路径指向约束、有界约束和终端约束。

首先考虑深空探测器姿态机动过程中的时间和能量优化指标参数，转换为多目标优化的时间和能量适应度函数为

姿态路径指向约束的适应度函数针对禁忌约束

探测器有界约束的适应度函数取为

为了确保算法的准确性与收敛性，将终端约束扩展到所有节点的目标导向约束，这时终端约束的适应度函数为

得到所有性能指标适应度函数，与分解函数组合得到目标优化函数。

2.3 初始姿态机动路径

为了加快算法收敛，本文将首先生成初始机动路径，并与改进差分进化算法组合，共同生成多目标优化姿态机动路径。

本文通过快速欧拉旋转方法得到从初始到目标的机动路径，并不考虑指向和有界约束，得出转动四元数

根据欧拉定理，得出欧拉转角

再根据初始姿态参数，进行逐步姿态路径节点计算，得到整个姿态路径上的姿态四元数，即得到初始的姿态机动路径，用以引导优化过程的中间姿态机动路径。

2.4 组合差分进化算法

1）初始化

利用n个向量P作为每一代的种群，每个个体向量Pi,G表示为

其中：ω为当前节点的姿态角速度；t为节点的机动时间；i表示个体在种群中的序号；G表示进化代数。

初始化的过程主要是生成算法优化的初始种群。通常为了避免算法后期的收敛效率过低，常用的生成初始种群的方法是基于给定约束值进行边界内部随机选择。

2）组合变异

对于单个个体向量Pi,G，采用组合变异的方式。由欧拉旋转得到的初始机动路径为Pc，以设定的概率选择是否将Pc放入差分进化的变异过程中，变异个体的产生如式（22）所示

其中：ra为0～1之间的随机数；f为相应范围内的判断概率，判断是否将初始路径Pc加入变异过程中；Pc是欧拉旋转得到的最短距离姿态机动路径，引导当前的中间姿态机动路径向最短距离姿态机动路径变异，加快算法收敛速度；突变算子F的取值显著影响算法的搜索范围，F值越大，算法搜索的范围越广，全局搜索能力强，也能够避免过早收敛。相反，一个较小的值F可以提高算法的局部搜索能力，加快局部搜索速度和算法的收敛速度。一般的F值固定选取为1，这里将F值设置为根据算法进程可变的形式，搜索前期较大，搜索后期较小，使算法同时具有较好的前期全局搜索能力和后期收敛速度

其中：ki是当前节点数；kmax是总节点数；c5和p为控制参数。

3）交叉

作为变异策略的补充，利用交叉策略在变异向量的基础上保留原始目标个体的信息，并生成一个测试向量与原始目标个体竞争。交叉向量可以表示为

其中：CR为交叉概率因子，是0～1的正实数；rb是0～1的随机数；rn为[1，2，···，D]的随机整数。

4）选择

3 仿真分析

表1 仿真条件Table 1 Simulation conditions

算法的仿真环境为Matlab 2019b，计算机主频为3.2 Ghz，内存4 G，采用本文提出的多目标组合规划算法进行姿态机动路径求解。

深空探测器姿态机动过程中的姿态四元数、控制力矩和角速度分别如图2～4所示。可以看出，探测器的姿态机动路径满足有界约束，没有超出探测器的角速度和控制力矩上限，同时角速度和控制力矩路径的前后转变平稳，比较方便实际工程实现。

图2 深空探测器姿态四元数曲线Fig.2 Attitude maneuver quaternion curve of deep space probe

图3 深空探测器控制力矩曲线Fig.3 Attitude maneuver control torque curve of deep space probe

图4 深空探测器角速度曲线Fig.4 Attitude maneuver angular velocity curve of deep space probe

经过组合规划算法得到探测器在天球坐标系下的姿态机动路径，如图5所示，环形区域表示姿态指向约束，红色连线表示姿态机动路径。可以看出，深空探测器运动从起始点成功姿态机动到目标点，并且没有进入约束区域，说明该算法能够得到安全的姿态机动路径。

图5 探测器在天球坐标系下姿态机动路径Fig.5 Attitude maneuver path of deep space probe in celestial coordinate system

同时，探测器在天球坐标系下可见光相机的空间姿态机动路径如图6所示，其中，圆形区域表示的是姿态指向约束，红线表示空间姿态机动路径。由此可以看出，在探测器机动过程中光学相机成功地规避了4个发光天体，满足了姿态指向约束，得到了安全的姿态机动路径。从上述所有结果可以看出，本文提出的组合规划算法可以满足多种姿态约束，证明了算法的有效性。

图6 天球坐标系下深空探测器可见光相机空间姿态机动路径Fig.6 Space attitude maneuver path of visible camera of deep space detector in celestial coordinate system

多目标组合规划算法的平均运行时长为36 s，姿态机动时长为200 s，能量消耗的相对单位为0.8。基于相同的仿真环境，对比基于时间优化的差分进化算法，时间优化后的标准差分进化算法的平均运行时长为60 s，姿态机动时长为220 s，能量消耗的相对单位为1.5。可以看出，多目标组合规划算法同时提高了时间和能量的优化效率以及程序运行速度，具有较好的时间和能量优化效果。

4 结论

本文研究深空探测器姿态机动多目标规划问题，提出多目标组合规划方法。考虑时间、能量和约束等多目标函数，将多目标优化分解为单目标规划，通过快速欧拉机动获得初始姿态路径，并改进差分进化算法，设计新的变异过程，提高收敛速率和程序运行效率。仿真结果表明，通过本文提出的多目标组合规划方法生成姿态机动路径，可以实现多约束多目标姿态机动路径规划，且具有较好的时间和能量优化效果。