空间飞行器大角度姿态机动控制能量优化

2020-12-14赵振平王林林王锦程王永海

哈尔滨工业大学学报 2020年12期

赵振平,王林林,周荻,王锦程,王永海

(1.北京航天长征飞行器研究所,北京 100076；2.哈尔滨工业大学航天学院,哈尔滨 150001)

某空间飞行器为实现对地观测等任务，在飞行过程中可能需要进行多次大角度姿态调整，以满足观测角度的要求. 根据实际情况，该空间飞行器采用6个安装在尾部的小型姿控发动机作为姿控系统的执行机构，姿态机动过程中需要消耗燃料.燃料的消耗量与姿态控制律密切相关.由于空间飞行器总质量的限制，其携带的燃料有限，为保障机动全程的燃料消耗，需要优化设计姿态控制律，以期兼顾控制精度和能量消耗.

关于空间飞行器姿态机动优化控制方法，一些文献已经给出了相关的研究成果，减少能量消耗的思路集中在姿态控制律的设计上.文献[1]采用自抗扰技术设计姿态机动控制器，仿真结果显示该控制器能够减少能量消耗.但是该方法参数整定繁琐，且对观测器性能有较高要求.文献[2]也采用自抗扰控制器设计了姿态控制律，并给出了控制参数优化的方法.文献[3]通过对bang-bang控制的优化减少了姿态机动的振动问题，从而实现对能量时间的优化. 上述3种方法仅能实现能量消耗的降低，并非最优能量控制.

通过应用最优控制方法设计姿态控制律，从而降低航天器姿态控制系统的能量消耗，是一种常见的设计思路.例如，文献[4]设计了一种反最优控制器，从而避免了直接求取Hamilton-Jacobi方程.仿真结果显示能够实现能量的优化.文献[5]把姿态控制问题转化为一个具有平方和约束的参数优化问题，利用平方和优化技术，实现了能量的最优控制.文献[6]讨论了采用变速控制力矩陀螺的一种姿态/能量一体化控制方法.文献[7]不仅设计了能量姿态一体化控制律，并进一步考虑了执行器饱和及四元数漂移等问题，对其漂移进行了整定，实现了姿态能量的一体化控制.实际上，上述这些文献均采用了庞特里亚金最小值法设计姿态最优控制律.

最优控制理论中的非线性规划方法也在最优姿态控制律的设计中的得到应用.文献[8-10]均把姿态机动问题转化为非线性规划问题.文献[8-9]使用非线性规划的方法描述了姿态机动问题，并提出了解的构造方法，避免了求解高阶微分方程，但仍存在计算复杂的问题；文献[10]进一步对初始可行解进行了改进优化，仿真结果显示该方法能够有效减少寻优计算的时间.文献[11]通过伪谱法计算全局路径节点，减少了全局规划的计算量，结合预测控制实现能量节省.

另外，针对非对称航天器姿态机动问题，文献[12]则基于Krotov-Bellman充分条件求取了最小燃料消耗解.

上述的文献在求解姿态最优控制律的过程中，均假设姿态控制系统执行机构能够输出连续变化的控制力矩，从而实现最优控制律所需要的连续型控制变量.但在许多特定应用背景下，例如本文所研究的某空间小型飞行器上，只能安装小型姿控发动机组，每个姿控发动机的输出均为开关型的控制力，即使采用脉冲调宽方式，也无法准确输出最优控制律所要求的连续型控制力矩.因此，需要结合特定的问题优化设计特定的姿态控制律，达到优化燃料消耗量的目的.

为避免奇异并有利于非线性系统的稳定性分析，宜采用四元数描述空间飞行器的大角度姿态运动.因此，在姿态控制律优化设计中，本文采用鲁棒性相对较好的基于四元数的非线性PD姿态控制律，并在这种控制律中引入3个姿态控制通道的开关门限，从而即有利于用脉冲调宽方式近似实现该控制律，又能有效地降低燃料消耗.另外，本文还采用一种新的改进的粒子群寻优(PSO)算法对非线性PD控制律的开关门限进行寻优设计.

对于许多执行大角度姿态机动的空间飞行器而言，经常采用的机动模式是从一种姿态指向到另外一种姿态指向的Rest-To-Rest机动.Rest-To-Rest姿态机动指令的规划也直接影响姿控系统的燃料消耗量.阶跃型指令只强调了快速性，而忽略了姿态机动指令对燃料消耗的影响.本文针对Rest-To-Rest姿态机动模式，研究用四元数描述的姿态指令规划问题，通过指令设计进一步减少燃料消耗，同时兼顾一定的响应速度.

1 空间飞行器的姿态运动数学描述

假设某空间飞行器需要在飞行过程中进行大角度姿态机动，为实现姿态控制，在飞行器的尾部安装了6台姿控发动机，发动机采用倒T型布局，如图1所示，每个姿控发动机可以工作与开启或关闭状态，其推力工作曲线如图2所示.

图1 空间飞行器姿控发动机布局

图2 姿控发动机推力上升和下降动态特性

定义四元数q=[q0,qv]T，qv=[q1,q2,q3]T，则四元数描述的姿态运动方程为[13]

考虑到存在干扰，姿态动力学方程写作：

式中：J=diag[JxJyJz]为转动惯量矩阵；u∈R3为控制力矩；d∈R3为干扰力矩.

2 基于误差四元数的姿态跟踪非线性PD控制器设计

2.1 误差四元数的姿态跟踪控制系统数学模型

定义误差四元数[14-15]为

其中

不难证明‖e‖=1.定义由体坐标系到期望的体坐标系的转换矩阵为C1→d，则坐标转换矩阵可以表示为

定义角速度跟踪误差为

ω=[ω1ω2ω3]T=Ω-CΩd,

(1)

而跟踪误差动力学方程为

(2)

式中，ω=Ω-CΩd为角速度跟踪误差.

2.2 非线性PD控制律设计

本文先给出应用Back-Stepping方法设计的非线性PD控制律[16].

ω可以视作运动学方程式(1)的虚拟输入，选取:

ω=-k1ev,k1>0,

预选Lyapunov函数为

沿着状态轨迹(1)求导得到:

易得ev→0.

由于ω不是真实输入，把ω与理想值-k1ev之差记为

σ=ω-(-k1ev).

(3)

Lyapunov函数V1的真实导数表达式为

由式(3)和式(1)、(2)可以改写为

(4)

本文重新选取Lyapunov函数为

沿着式(4)求导可得：

2σTJ(σ-k1ev)×CΩd-σTCΩd×JCΩd-

(5)

本文为式(4)所示的非线性系统设计如下PD控制器：

u=-k2σ-k3ev,

式中,k2,k3为大于零的常数.式(5)可改写为

k1γJ‖ev‖‖σ‖(‖σ‖+k1‖ev‖+‖CΩd‖)+

2γJ‖σ‖‖CΩd‖(‖σ‖+k1‖ev‖)+

-χTQχ+WTχ,

其中:

本文假定k3=1/3，保证矩阵Q正定的约束条件可由下式给出：

如果合理选择k1,k2满足上述不等式，则有

式中，λ为矩阵Q的最小特征值，即

借鉴文献[16]中的进一步分析结果，当t→时，σ和ev趋于有界，进而ω趋于有界.

为了简单起见，对控制器的形式做一些改写，令

u=[MzxMzyMzz]T=-K1ω-K2ev.

(6)

式中：Mzx、Mzy和Mzz分别为滚转、偏航和俯仰力矩；K1=k2，K2=k2k1+k3.

按照PD控制律(6)，得到控制指令力矩指令Mzx，Mzy，Mzz后，需要根据控制力矩指令对图1所示的6个发动机的工作方式进行分配.

2.2.1 滚转和偏航通道

由于滚转和偏航方向具有耦合作用，本文对滚转和偏航同时进行控制.本文采取以下的发动机分配方式：

Mzx=Fz1lx+Fz4lx,

(7)

Mzy=Fz1ly-Fz4ly,

(8)

式中，lx、ly分别为滚转和偏航力臂.联立式(7)、(8)，解出:

Mzx=-Fz3lx-Fz6lx,

(9)

Mzy=-Fz1ly+Fz6ly,

(10)

联立式(9)、(10)，解出:

当Mzx=0时，1，3，4，6号发动机均不输出控制力.

2.2.2 俯仰通道

俯仰通道没有耦合，很容易得出2号和5号发动机所需产生的等效力:

由于姿控发动机只能工作于完全开启状态或完全关闭状态，不能输出所需要的连续控制力，所以只能采用脉宽调制(PWM)方法，在一个给定的控制周期Tc内，通过调整发动机开启和关闭时间的占空比，利用冲量等效原理近似实现PD控制律[17-18].

根据动量等效原则，发动机产生的等效力Fe为

在一个控制周期Tc内，上式中

通过调整开启时间Ton可近似输出不同的等效控制力Fe.

为了节省燃料，并降低姿控发动机的开启频率，本文在非线性PD控制规律中引入开关门限δx、δy、δz，它们均为大于零的常值.这样，实际实现的PD控制律表达如下：

2.3 非线性PD控制律开关门限的粒子群寻优

首先选择适当的PD控制律参数，在跟踪指令信号时，满足跟踪速率快，基本无超调，而且在连续控制量下稳态误差也很小.

进一步设计中，本文在PD姿态控制律引入了开关门限δx、δy、δz，目的是在满足姿控精度和姿控效率的情况下，尽量减小燃料的消耗量.为实现控制能量的优化，并保证一定的控制误差，选取下式作为优化指标：

式中：u(t)为控制输入；e(t)为控制系统误差；w1、w2为权值.

本文引用文献[19]的算法，利用粒子群算法(PSO)和遗传算法(GA)结合，来实现PD姿态控制律开关门限参数的寻优.PSO和GA都是群体智能优化算法.每一种寻优算法都有其缺陷.由于缺乏选择机制，传统粒子群算法会在较差个体上浪费过多资源，从而降低效率.在传统遗传算法中，如果某个个体未被选中，那么该个体的信息就会丢失.因此，PSO-GA的基本思想是将PSO的群体搜索能力和GA的局部搜索能力相结合.同时，利用粒子群速度更新算法中的“记忆”功能，来保留搜索过程中的较好解.粒子群的位置更新由个体最优位置和群体最优位置构成.在粒子群迭代中形成新一代粒子后，选取新群体中一定数量的粒子，分别应用遗传算法对其进行求解.选取的数量如下:

每一个选中的粒子加上在粒子群中随机选择一定数量的粒子作为进化算法的初始种群，该算法从种群中通过选择、交叉和变异算子，选择最优个体后，通过遗传原理将当前种群中的点替换为当前最优点.遗传算法的种群大小GAPS和最大迭代次数GAMaxIter随着PSO迭代次数的增加而逐渐减小，其关系定义如下:

通过上述迭代过程，种群趋于全局最优状态.

3 大角度姿态机动角速度和四元数指令规划方法

以Rest-To-Rest大角度姿态机动问题为例，研究大角度姿态机动指令规划方法.

大角度姿态机动的指令规划思路是：令姿态初始的欧拉角按照某种运动规律在期望的时间内变化到终端欧拉角，然后求出这种运动规律下对应的姿态角速度指令和四元数指令.以欧拉角作为考核指标，设按照312转序旋转3次得到的期望Euler角分别为ϑd、γd和ψd.设初始欧拉角为ϑd0、γd0和ψd0，经过时间td到达期望的终端姿态角ϑdf、γdf和ψdf.

这里，本文给出一种令欧拉角匀速变化的角速度和四元数指令设计方法.令3个欧拉角匀速变化的姿态指令，即:

这样, 不仅可以独立控制3个欧拉角的变化规律，使得四元数描述的姿态控制系统3个欧拉角的运动相互之间不产生耦合影响，而且姿态角和姿态角速率指令的变化也始终是平滑的，易于保证姿态控制系统的动态特性，并有助于减小能量消耗.

并可推导出四元数指令，即

4 数值仿真

假设飞行器携带的燃料总质量为2.0 kg，姿控发动机的稳态推力设计为Fzs=18 N.以一种Rest-To-Rest的大角度姿态机动过程为研究对象，设计指令时，取动态上升时间td=30 s，在300 s内完成5次大角度姿态机动.采用欧拉角匀速变化的角速度和四元数指令，令俯仰角ϑ和偏航角ψ同时在0°～60°之间作5次大角度姿态机动，而滚转角γ保持为0°.具体设计出来的俯仰角指令ϑd如图4中的虚线所示.

采用基于误差四元数的姿态跟踪PD控制律和姿控发动机开关逻辑.PD控制律为u=-K1ω-K2ev，取K1=6，K2=32.在这组参数满足跟踪速率快，基本无超调的要求，而且在连续控制量下稳态误差远小于1°.

姿控指令更新的周期取2 ms，PWM控制周期Tc=0.3 s.

4.1 无开关门限时的Rest-To-Rest姿态机动

令δx=0，δy=0，δz=0，这种情况相当于没有在PD控制律中加入开关门限.

无开关门限情况下，图3所示的俯仰角变化过程表明，在大约前155 s，姿控系统跟踪指令的过程良好，但155 s时燃料耗尽，姿控系统发散，无法继续跟踪姿态指令.图4显示的俯仰角速度指令跟踪过程也呈现同样情况. 图5显示的姿态角的跟踪误差在前155 s均小于0.5°，但155 s后发散.偏航角和滚转角的控制也表现出同样的特性.

图3 俯仰角变化情况(无开关门限)

图4 俯仰角速率指令和实际值变化情况(无开关门限)

图5 俯仰角跟踪误差(无开关门限)

4.2 最优开关门限下的Rest-To-Rest姿态机动

为实现飞行器大角度姿态机动的能量优化管理，在PD姿态控制律设计中，引入了开关门限δx，δy和δz，目的是在满足一定姿态控制精度的情况下，尽可能减小燃料的消耗量.在上述给定的Rest-To-Rest姿态机动指令下，采用的粒子群寻优算法对开关门限δx，δy和δz进行寻优.为了保证姿态控制有一定的稳态精度，δx，δy和δz每一个参数的寻优范围都限定在[0 10/57.3]范围内.设种群大小为100，循环迭代500次.求得的最优解δx=4.09/57.3，δy=3.35/57.3，δz=3.35/57.3.

采用这组最优开关门限，在进行大角度姿态机动的过程中，俯仰角可以很好地跟踪设计的机动指令，动态过程几乎无超调，如图6、7所示.图8(a)给出的是整个300 s仿真过程中俯仰角指令的跟踪误差，无论动态跟踪误差还是稳态跟踪误差均较小，图8(b)给出的是前120 s的俯仰角指令跟踪误差，更清楚地显示了俯仰角指令动态跟踪误差和稳态跟踪误差均较小.

偏航角和滚转角的控制也表现出同样的特性.仿真得到的最优解保证了姿态控制3个欧拉角的姿态控制误差小于1°，最小燃料消耗为0.89 kg.

在同样的控制器参数下, 如果简单地采用阶跃型四元数指令, 那么在85 s时燃料消耗殆尽, 也无法完成5次姿态机动的任务.