失效航天器姿态接管的SDRE微分博弈控制
2020-03-13罗建军谢剑锋
柴 源,罗建军,韩 楠,谢剑锋
(1. 西北工业大学航天学院,西安 710072;2. 西北工业大学航天飞行动力学技术重点实验室,西安 710072;3. 北京航天飞行控制中心,北京 100094)
0 引 言
近年来,航天器在轨服务受到世界各国的重视。服务航天器与失效航天器形成组合体后通过自身执行机构可接管失效航天器姿轨控系统,实现稳定控制,失效航天器的接管控制作为一种急需的在轨服务受到广泛关注[1-2]。由于目前在轨运行的多数航天器事先未进行可服务和可维修设计,无交会对接辅助设备,因此,采用传统的交会对接方法进行接管控制存在困难。文献[3]研究了空间机械臂的失效航天器姿态接管控制,但空间机械臂难以对失效航天器进行长周期姿态调整。文献[4]研究了绳系空间机器人对非合作目标进行抓捕的问题,但是存在绳索被割断的可能性。此外,针对不同任务定制相应的空间机械臂和绳系机器人,也需要消耗巨大的成本和时间。近年来,微小卫星技术得益于微电子技术的进步而快速发展,具有发射成本低、研制周期短、可批量生产等优势。凤凰计划项目[5]和iboss系列任务[6]利用多颗微小卫星来实现空间飞行器的部件再利用和新卫星的在轨组装,是微小卫星应用的新方向。文献[7]通过多颗纳星协同,设计辨识和控制一体化方法,实现失效卫星的低成本姿态接管控制。其中多颗微卫星如何通过分布式协同来实现失效航天器的姿态接管和长期的姿轨协同控制,仍有很多理论和方法问题需要解决。
多颗微卫星对失效航天器姿态接管控制问题的解决方案包括集中式控制和分布式控制等[8]。文献[9]通过任务分配方法实现了多机器人的集中式控制,但是集中式控制依赖中央控制个体,容错性差,更适合控制中心可靠的场合。分布式控制通过个体之间信息的交互实现运动行为的协同,具有灵活性好、容错性高和容易拓展等优势。传统的分布式协同控制[10-12]基于相对运动模型来设计控制器,更适合编队、集群等空间任务;文献[13]利用分布式控制分配方法实现空间细胞机器人的姿态接管,但是频繁不断进行的控制分配增加了机器人计算负担。
微分博弈方法研究了多个参与者的最优决策与控制问题,其中每个个体通过优化各自性能指标函数可得到各自的控制策略[14]。该方法可以视为一种特殊的分布式控制,其通信拓扑结构为可切换的全连通拓扑,允许个体的加入与退出,具有容错性和灵活性。文献[15]将微分博弈方法用于多智能体的一致性控制问题中;文献[16]研究了在轨卫星的追逃博弈问题;文献[17]将二人非零和微分博弈方法用于航天器对接任务中。
本文将失效航天器姿态接管控制问题转化为多颗微卫星的微分博弈问题,从而通过微卫星的自主决策实现分布式姿态接管控制。该问题的关键在于求解耦合的HJ(Hamilton-Jacobi)方程得到多颗微卫星的纳什均衡策略[18],但是由于HJ方程的非线性及耦合性,很难得到解析解。传统的解法大多采用离线计算[19],近年来提出的基于策略迭代的求解算法,利用神经网络近似值函数,但是权值的调整依赖于经验[20]。本文采用状态相关黎卡提方程(State-dependent Riccati equation, SDRE)方法,引入状态相关系数(State-dependent coefficient, SDC)矩阵[19-20]将非线性模型转化为状态相关线性模型,从而得到状态相关线性二次型微分博弈[21],通过对耦合的状态相关黎卡提方程组进行求解,得到微分博弈的纳什均衡,从而得到微卫星控制策略的闭环表达式。
1 问题描述
1.1 基本假设及定义
为了实现对失效航天器的姿态接管控制,N颗微卫星需要通过自身的执行机构实现组合航天器的姿态稳定,如图1所示。本文采用基于SDRE的微分博弈方法进行姿态接管控制。基本假设如下:
1)微卫星和失效航天器均为刚体。
2)微卫星已贴附在失效航天器上,且在姿态稳定过程中,各颗微卫星的相对位置保持不变。
3)失效航天器的姿控系统完全失效,所需控制力矩仅由微卫星提供。
4)微卫星上安装有三轴正交的反作用飞轮。
5)组合航天器的转动惯量已辨识且保持不变。
图1 微卫星姿态接管控制示意图
所涉及的坐标系定义如下:
1)微卫星i(i∈N)本体坐标系Oixiyizi:Oi表示微卫星i的质心,xi,yi,zi分别表示微卫星i的三个惯量主轴,在三个惯量主轴上各安装一个反作用飞轮。
2)参考坐标系Oxyz:用来描述每颗微卫星的方位。选取微卫星1的本体坐标系为参考坐标系,则其他微卫星相对于微卫星1的方位可由各自的本体坐标系与参考坐标系之间的转换矩阵来描述。
1.2 姿态运动学
假设微卫星和失效航天器均为刚体,因此姿态接管控制过程,由N颗微卫星和失效航天器形成的组合航天器的姿态运动可由刚体航天器的姿态运动学方程来描述。本文采用修正罗德里格斯参数(Modified Rodrigues parameters, MRPs)描述姿态,以避免奇异。组合航天器的姿态运动学方程为[7]
(1)
式中:σ∈R3×1是以MRPs表示的组合航天器姿态角;ω∈R3×1为组合航天器的姿态角速度。M(σ)为可逆矩阵,有
(2)
式中:σ×=[0,-σ3,σ2;σ3,0,-σ1;-σ2,σ1,0];I3为3×3的单位对角阵。
1.3 姿态动力学
组合航天器的姿态动力学方程为
(3)
式中:J∈R3×3是组合航天器在参考坐标系Oxyz中的转动惯量矩阵;N是微卫星的个数;Cj∈R3×3是从微卫星j的本体坐标系Ojxjyjzj到参考坐标系Oxyz的转换矩阵,用来表示微卫星j的方位[7];uj∈R3×1为微卫星j在本体坐标系Ojxjyjzj的三轴姿态控制力矩;ω×=[0,-ω3,ω2;ω3,0,-ω1;-ω2,ω1,0]。
1.4 微分博弈模型
根据组合航天器的姿态运动学模型和姿态动力学模型,可得多颗微卫星接管失效航天器姿态运动的微分博弈模型为
(4)
式中:x=[σT,ωT]T∈R6×1,且
(5a)
(5b)
式中:03为3×3的全0矩阵。
微卫星的性能指标函数定义为
(6)
定义1.可行控制策略集[17]:若反馈控制策略ui(x)在紧集Ω上连续,ui(0)=0,反馈控制策略集u(x)={u1(x),…,uN(x)}在Ω上能够稳定式(4),且式(6)对于任意的x0∈Ω是有限的,则u(x)在Ω上相对于式(6)定义为可行的,记作ui(x)∈Ψ(Ω)。
对于给定的可行控制策略,微卫星的值函数可表示为
(7)
并满足Vi(x)>0,Vi(0)=0且连续可微。
(8)
多颗微卫星的微分博弈可以由下式来描述
(9)
2 基于SDRE的微分博弈控制器设计
2.1 状态相关线性微分博弈模型
微卫星的值函数的微分等价形式为
(10)
定义哈密尔顿函数为
(11)
(12)
将式(12)代入式(10)中可以得到N个耦合的HJ方程
(13)
(14)
式中:A(x)=[03,M(σ);03,-J-1ω×J]∈R6×6是与状态相关的状态矩阵,且(A(x),Bj)满足能控性秩判据。根据上述分析,将非线性微分博弈问题转化为由式(14)和式(6)描述的状态相关线性二次型微分博弈问题,能够在保留了原模型的非线性特性的同时,使得微分博弈问题更加易于求解[19]。
2.2 姿态控制器
针对状态相关线性模型(14),独立优化每颗微卫星的性能指标函数(6),可以得到每颗微卫星的控制策略,实现失效航天器的姿态接管控制。
定理1. 对于状态相关线性二次型微分博弈问题,在系统(A(x),Bi)完全能控的条件下,线性状态反馈控制策略为
(15)
对称正定矩阵Pi(x)∈R6×6为下面耦合状态相关黎卡提方程组的解
(16)
证. 为了方便推导,在证明中将Pi(x)记为Pi,将A(x)记为A。
假设最优值函数(9)在状态x(t)下有线性二次型形式的解
(17)
则可得
(18)
忽略式(18)中的高阶项,则微卫星i(∀j≠i)对应的反馈控制为
(19)
将其代入式(10)中可得
(20)
整理为二次型形式得
(21)
(22)
将其代入式(21)得
(23)
整理得
0=xT(Qi+PiA+ATPi-
(24)
由于存在下式关系
(25)
则可以得到
(26)
(27)
取i=1,2,…,N,可以得到耦合的状态相关黎卡提方程组(16),对其求解可以得到矩阵Pi,从而得到状态反馈控制策略(15)。
根据上述分析,系统模型可以表示为如下形式
(28)
(29)
式中:ψ(x)是高阶展开项,且满足
(30)
因此,在原点的邻域内,常系数矩阵Acl(0)的稳定,保证了系统的局部渐近稳定性。
注1.要求系统完全能控是为了保证系统的稳定性。由于控制区间为无限时域,若出现状态不能控,无论采取任何控制策略,性能指标都会趋于无穷大。
注2.上述定理得到的状态反馈控制律,在每一时刻更新状态x(t),得到对应的状态矩阵A(x),并通过求解耦合状态相关黎卡提方程组(16)得到对称正定矩阵Pi(x),在下一时刻重复上述过程,得到时变的状态反馈调节器,能方便地实现闭环控制,这在工程应用中具有十分重要的意义。
3 李雅普诺夫迭代
对于耦合的状态相关黎卡提方程组(16),要求在每一步求解耦合的代数黎卡提方程组。目前对于耦合代数黎卡提方程组的求解有很多研究成果[14,21],本文采用李雅普诺夫迭代法进行计算。该方法将耦合的代数黎卡提方程组降阶并解耦为李雅普诺夫方程来独立运算,算法速度快,准确性高。本文将文献[21]中针对二人微分博弈得到的迭代算法进行归纳,给出一般性的李亚普诺夫迭代公式。
迭代算法:
k=0,1,2,…;i= 1,…,N
(31)
初值选择:
(32)
通过迭代求解李亚普诺夫方程(31)可以得到状态x(t)下的矩阵Pi(x)(i∈N)。
4 仿真校验
为了验证对失效航天器姿态接管的SDRE微分博弈控制方法的有效性和容错性,对组合航天器的姿态稳定控制过程进行仿真研究。
4.1 有效性仿真
假设采用三颗微卫星对失效航天器进行姿态接管控制,微卫星可提供的控制力矩满足|u|≤0.25 N·m,其各自的本体坐标系到参考坐标系的转换矩阵为
组合航天器的转动惯量矩阵为
组合航天器以MRPs表示的初始姿态角为σ0=[0.015,0.009,0.013]T,初始姿态角速度为ω0=[0,0,0]T。取两个微卫星的权重矩阵分别为Q1=5I6,Q2=5I6,Q3=5I6,R11=R12=R13=0.01I3,R21=R22=R23=0.01I3,R31=R32=R33=0.01I3。取仿真步长为dt=0.01s。在上述参数下,仿真验证SDRE微分博弈控制的有效性。
图2和图3是组合航天器分别以MRPs和欧拉角表示的姿态角变化曲线,图4是组合航天器的姿态角速度变化曲线。从图中可以看出,组合航天器在40 s到达稳定状态,精度为1×10-5量级,在仿真结束时,可以达到更高的精度。因此,基于微分博弈的姿态控制器可以实现失效航天器的姿态稳定。
图2 姿态角σ曲线
图3 姿态角欧拉角曲线
图4 姿态角速度ω曲线
图5是姿态接管控制阶段三颗微卫星的控制力矩随时间变化曲线。在初始控制阶段,由于状态量幅值较大,因此所需的控制力矩也较大,随着状态量幅值的不断减小,所需控制力矩也逐渐减小。
图5 微卫星控制力矩曲线
4.2 容错性仿真
为了验证该方法的容错性,设计如下仿真场景。采用三颗微卫星对失效航天器进行姿态接管控制时,微卫星2在第6 s执行机构失效,无法提供控制力矩,则前6 s姿态接管控制所需控制力矩由三颗微卫星提供,在6 s之后仅由微卫星1和微卫星2提供。其他仿真参数与4.1节仿真参数相同。
图6为以欧拉角表示的姿态角和角速度随时间变化曲线,图7为三颗微卫星的控制力矩变化曲线。从图6可以看出,在存在一颗微卫星失效的情况,其他的微卫星将失效微卫星视为不参与,更新参与者个数,解算控制力矩使组合航天器的状态趋于稳定。从图7可以看出,前6 s的仿真结果和4.1节中前6 s的仿真结果一致。在第6 s,微卫星3无法提供控制力矩,微卫星1和微卫星2在更新参与者个数后计算各自的控制力矩,因此在图7中可以看到6 s时微卫星1和微卫星2的控制力矩会有突变。6 s之后的微卫星3的控制力矩为0,微卫星1和微卫星2的控制力矩逐渐趋于0。仿真结果表明本文提出的微分博弈方法具有容错性。
图6 部分微卫星失效的姿态角和角速度变化曲线
图7 部分微卫星失效的微卫星控制力矩曲线
5 结 论
本文采用SDRE微分博弈方法研究了多颗微卫星接管姿态控制系统失效的航天器的控制问题,通过引入SDC矩阵将多颗微卫星的非线性微分博弈转化为状态相关线性二次型微分博弈。多颗微卫星通过独立优化各自的性能指标函数得到各自的控制策略,实现了多颗微卫星接管姿态控制失效的航天器的分布式控制。该方法在保留非线性特性的同时,通过推导得到耦合的状态相关黎卡提方程组来逼近微分博弈的纳什均衡并得到控制策略的闭环表达式,采用李亚普诺夫迭代法进行求解,简化了纳什均衡的求解过程。数值算例的结果表明,SDRE微分博弈方法可以实现多颗微卫星对失效航天器的分布式姿态接管控制,具有较高的控制精度和容错性。