SE(3)上姿轨耦合航天器高精度快速终端滑模控制

2017-03-27张剑桥孙兆伟

宇航学报 2017年2期

关键词：滑模航天器动力学

张剑桥，叶东，孙兆伟

(哈尔滨工业大学卫星技术研究所，哈尔滨150001)

SE(3)上姿轨耦合航天器高精度快速终端滑模控制

张剑桥，叶东，孙兆伟

(哈尔滨工业大学卫星技术研究所，哈尔滨150001)

针对编队飞行航天器姿轨耦合一体化控制问题，本文提出了一种高精度快速收敛的滑模控制方法。首先，建立了以Lie群SE(3)上指数坐标表示航天器位置和姿态跟踪误差的相对耦合动力学模型。然后以该指数坐标和速度跟踪误差定义的滑模面，设计了一种新型的基于切比雪夫神经网络(CNN)的非奇异快速终端滑模控制器(NFTSMC)，实现了跟踪航天器对目标航天器的有限时间跟踪控制，并基于Lyapunov方法证明了系统的稳定性。该控制器无需显式的相对参考状态，不仅能保证滑模到达阶段和滑动阶段的有限时间稳定性，还由于引入仅需期望信号具有强逼近能力的CNN在线自适应估计系统总扰动而获得了较高的控制精度。最后，对主从模式的编队飞行航天器进行了仿真分析，结果表明该方法是有效可行的。

耦合动力学模型;Lie群SE(3);非奇异快速终端滑模;切比雪夫神经网络;高精度

0 引言

航天器编队飞行系统利用低成本、研制周期短、性能好的小型航天器来实现复杂的大型航天器的功能，同时改善了系统的可靠性、鲁棒性和重构性，还可以通过选择不同构型来满足不同的任务需求。目前编队飞行航天器主要用来进行科学实验、近地观测、深空探测和在轨服务等［1－3］。

虽然航天器编队飞行具有很多优势，但同时也存在着许多技术难题，如编队飞行航天器的构型同步控制问题。通常航天器轨道和姿态的控制是分开描述的，但当面对需要较高控制精度的航天任务时，由于两者之间的耦合特性，分开处理的方法因无法同时满足轨道和姿态精度要求而存在不足［4］。为解决上述问题，采用一体化手段实现姿轨耦合航天器动力学建模与控制已引起国内外学者的关注并取得了一定的研究成果［5］。文献［6］使用哈密尔顿方法进行建模，模型中包括了高阶项和轨道扰动项;文献［7］在姿轨解耦情况下建立了六自由度运动模型;文献［8］完成了六自由度运动模型的建立，并且考虑了耦合的动力学项;文献［9］采用相对位置、相对速度、四元数和角速度建立姿轨耦合相对运动模型。然而需要注意的是以上六自由度模型的建立均把轨道部分和姿态部分分开考虑，参数表示不统一，计算过于复杂，为问题的分析和控制带来了不便。

刚体的位姿构型可以利用三维欧几里得空间上表示平动的位置矢量和转动运动的正交矩阵构成的Lie群来一体化描述，该构型空间是一个特殊的欧氏群，称为SE(3)。已有研究表明在SE(3)上以一体化方式建立航天器姿轨耦合模型并设计简洁的控制器实现控制目标是可行的。文献［2］在SE(3)上基于Lyapunov方法设计的输出反馈控制器实现了从星相对主星的轨道和姿态跟踪，且给出了机动过程中从星避免碰撞策略;文献［10］在考虑控制输出饱和情况下，在SE(3)上利用滑模控制实现了从星相对主星的轨道和姿态跟踪。然而需要指出的是文献［2，10］中均未充分考虑系统的外部干扰和模型不确定性，且所设计的控制器只能保证系统渐近稳定，需很长时间才能达到较低精度的控制目标。因此，在系统存在上述干扰情况下，针对SE(3)上姿轨耦合模型设计高精度的有限时间控制算法成为本文研究的重点。

终端滑模控制作为有限时间控制的一种，可用来实现系统的有限时间稳定性［11］，并在航天器控制领域有了一定的应用［12－15］。综合文献［13－15］的滑模设计思想，本文通过构造一种新型非奇异快速终端滑模面来实现有限时间控制。而为了抑制干扰，提高控制精度，需对干扰项进行准确的自适应估计。近年来由于CNN能以高精度逼近非线性函数，且基函数只需期望信号，已被广泛应用到航天器自适应控制领域［15］。文献［15］利用CNN逼近系统总干扰，在有限时间内实现了较高精度的姿态控制，然而却未证明该自适应方法是否对姿轨耦合模型适用。文献［16］基于［15］的逼近思想，在系统只存在外部干扰情况下，利用基于CNN的自适应方法实现了姿轨耦合控制，但控制器只能保证系统渐近稳定，还因为模型的复杂性导致控制器设计很复杂。

基于上述研究，为实现编队飞行航天器姿轨耦合有限时间高精度跟踪控制，并保证控制器设计的简洁性，本文首先在系统存在外部干扰和模型不确定性情况下推导了SE(3)上航天器相对耦合动力学模型;然后，设计了基于CNN的自适应非奇异快速终端滑模控制器对该模型进行一体化控制，并对系统的稳定性进行了严格的数学证明;最后，通过数值仿真校验了所提出的控制算法的有效性。

1 基于SE(3)的航天器运动的描述

1.1 SE(3)上的系统描述

Lie群SE(3)是由半直积R3SO(3)以4×4齐次形式表示，用来描述刚体的平动和转动运动。其中R3为刚体质心的位置矢量构成的三维空间，SO(3)为正交矩阵构成的Lie群，用来表示刚体的转动［2］。用SE(3)上元素χ来描述的航天器的姿态和位置为:

式中:C为航天器本体坐标系到惯性坐标系的姿态转换矩阵，R为航天器在惯性系下的位置矢量。

航天器的角速度和速度定义为:

式中:ω和v为航天器的角速度和平移速度在本体系下的表示。为了描述系统的运动学与动力学方程，需要满足的映射关系定义如下［17］:

1)χ=χ(C，R)∈ SE(3)的伴随矩阵定义为:

式中:R×为R的反对称矩阵，算子(·)×:R3→ζo(3)是叉乘运算，这里ζo(3)是SO(3)的李代数。

2)V=［ωTvT］T∈R6的伴随算子定义为:

3)V的R6→ζe(3)的映射关系是:

ζe(3)是R3和ζo(3)的半直积，并且与R6是同构的。

1.2 基于SE(3)的航天器姿轨耦合运动学方程

惯性系下航天器的轨道和姿态运动学方程为:

1.3 基于SE(3)的航天器姿轨耦合动力学方程

航天器轨道和姿态动力学方程可以表示为:

式中:m为航天器质量，fg为考虑非球形摄动的地球引力，uc为控制力，ud为干扰力，J为转动惯量矩阵，Mg为重力梯度力矩，τc为控制力矩，τd为干扰力矩。fg和Mg的具体形式为:

式中:

fJ2=。G为地球引力，fJ2为J2项摄动力，μ值为398600.47(km3/s2)为地球引力常数，Rb=CTR为体坐标系下航天器质心的位置坐标，表示向量的欧几里得范数，J1=0.5tr(J)I+J，tr为求矩阵的迹，I为3×3的单位阵，J2=1.08263×10－3，Rx，Ry，Rz为R的坐标分量，Re=6378.14 km为地球半径。

根据前述的映射关系，结合式(8)，可得到基于SE(3)的航天器姿轨耦合动力学方程:

2 基于SE(3)的航天器相对姿轨耦合动力学模型

记目标航天器的位姿构型为χo，跟踪航天器的位姿构型为χb，则跟踪航天器相对于目标航天器的构型χb/o可以表示为［17］:χb/o= χ－1oχb。如果跟踪航天器相对于目标航天器的理想构型为χd，则跟踪航天器的跟踪误差为:

根据式(11)，在指数坐标系下姿态和轨道跟踪误差可以描述为:

式中:(·)－1是(·)V的反变换。logSE(3)χ1的计算结果为:

式中:

跟踪航天器相对于目标航天器的速度误差，在跟踪航天器本体坐标系下表示为:

式中:Vb为跟踪航天器在其体坐标系下的速度，Vo为目标航天器在其体坐标系下的速度。

根据式(12)和(15)，得到航天器相对姿轨耦合运动学方程［2］:

式中:

将式(10)代入式(18)中可得到航天器相对姿轨耦合动力学方程:

式(16)和(19)便构成了系统的相对姿轨耦合运动学与动力学模型。该模型在统一框架下一体化描述了航天器相对姿轨耦合动力学特性，利用参数代替了显式的位置和姿态跟踪误差，形式简洁明了，极大地方便了控制器的设计。

由于航天器存在参数不确定性，设实际的惯量和质量矩阵为Ξ1=Ξ+ΔΞ，其中Ξ为标称的惯量和质量矩阵，ΔΞ为矩阵中的不确定部分，(Ξ+ ΔΞ)－1可以表示为 Ξ－1+ΔΞ～，ΔΞ～也为不确定部分，则式(19)可以改写成:

3 姿轨一体化控制器设计

本节在构造不需要显式的相对参考状态的滑模面的基础上，设计了一种新型的基于CNN的非奇异快速终端滑模控制器。该控制器形式简洁，无需将轨道和姿态部分分开考虑，可保证跟踪航天器在有限时间内完成对目标航天器的高精度轨道和姿态跟踪，实现真正意义上的一体化控制。

3.1 切比雪夫神经网络

本文采用CNN来逼近系统的总干扰，CNN结构图如图1所示。可以看出CNN由数值变换部分和学习部分组成［15］。数值变换部分使用切比雪夫多项式将输入向量扩展得到切比雪夫多项式基函数，并将其作为新的输入向量输入到学习部分。学习部分用来调节权值矩阵使其处于最优，保证CNN能够以任意精度逼近非线性连续函数。切比雪夫多项式由以下递推公式得到:

通常T1(x)有x，2x，2x－1和2x+1等多种定义形式，本文定义T1(x)=x。向量X=［x1，…，xm］T∈Rm的切比雪夫多项式基函数为:

式中:n为切比雪夫多项式的阶数。

利用CNN的逼近性质，一个连续的非线性函数F(X)∈Rn可以通过CNN来逼近，即

式中:W*∈R(nm+1)×n为CNN的最优权值矩阵，ε∈Rn×1为有界的CNN的逼近误差。

3.2 控制器的设计

为使跟踪误差能够快速收敛，且有效避免奇异问题，本文选择如下滑模面:

式中:对角阵α，β∈R6×6为正定矩阵，1＜p/q＜g/h＜2，且p，q，g，h均为奇整数。通过选取的滑模面，得到的跟踪误差动力学方程为:

式中:W是W*的估计值。为便于后续控制器设计和分析，对于式(25)描述的系统，提出以下合理假设:(1)CNN的最优权值矩阵W*有界，且满足: tr(W*TW*)≤WM。(2)CNN的逼近误差ε有界，且满足:≤εM。(3)系统总干扰F有界，且满足:≤FM。WM，εM，FM均为正常数。

为实现控制目标，给出如下的控制算法:

式中:Γeq为满足=0时的等效控制，Γvss为切换控制，满足对系统总干扰的鲁棒控制。具体形式为:

式中:Kβ= diag(q/(pβ1)，…，q/(pβ6))，Kα= diag(gα1/h，…，gα6/h)，αi，βi(i=1，2，…，6)为α，β主对角线上元素。K1=diag(k11，…，k16)，K2= diag(k21，…，k26)为正定常数矩阵。γ=q/p，λ(t)为开关函数，定义为

权值矩阵估计值的自适应律设计为:

式中:σ1＞0，σ2＞0，且为常数。ψ =［ψ1，…，ψ6］T和Ψ =［Ψ1，…，Ψ6］T为鲁棒控制项，定义为:

式中:ku=0.2785，κ1，κ2为正常数且满足κ1≥εM，κ2≥FM。Si为S的分量，τ为一个较小的正数。对于双曲正切函数有:0≤－δtanh(δ/)≤0.2785，所以很容易证明ψ，Ψ满足以下性质:

CNN控制项Wξ和鲁棒控制项ψ构成了神经网络自适应控制项。其中，Wξ用于逼近系统总扰动，ψ用于补偿CNN的趋近误差。一般而言，CNN在学习初始阶段逼近未知动态非线性函数的能力较弱，可能会出现因CNN输出过大而导致控制输出过大。将开关函数λ(t)应用到控制器中，实现神经网络控制项与鲁棒控制项Ψ之间的切换，保证只有当CNN的输出限制在FM内时，神经网络控制项工作。从而保证所设计控制器的实用性。通过图1可以看出CNN是单层的神经网络，由于缺少隐藏层，减少了CNN的计算量。同时扩展的切比雪夫多项式的收敛速度比大多数扩展的多项式集合要快，所以CNN的选用不会影响所设计控制器的实时性。

3.3 稳定性分析

为后续证明的需要，首先给出以下引理:

引理1［11］.对于一个连续的正定函数V1(x):Rn→R，如果存在0＜ρ＜1，ρ1＞0，ρ2＞0，且满足不等式:。则系统可在有限时间内到达平衡点，到达时间为:

引理2［11］.存在正常数a1，…，an和ρ，且满足0＜ρ＜1，有下面的不等式成立:

引理3［12］.对于一个连续的正定函数V2(x): Rn→R，如果存在＞0，∈(0，1)，且存在平衡点的一个邻域 ΩRn使得不等式(x)≤0，(x∈Ω，x≠0)成立，则系统可在有限时间内到达平衡点，到达时间为:

定理1.对非线性系统(25)，若对角阵Λ，α，β为正定矩阵，则在系统状态到达滑模面后，和可在有限时间内分别收敛到零。

证.选取如下的Lyapunov函数:

对V3求导可得到:

对V4求导，并将式(25)，控制律(27)和自适应律(30)代入，同时利用不等式(32)和不等式，经整理可得到:

因此令c=λmax(K3)τ+σ2WM/2，在集合

注1.通过合理的调整参数可以使S收敛到任意小的范围内。然而定理2只说明了控制器能保证闭环系统的渐近稳定性，并没有说明系统是否是有限时间稳定的。因此提出定理3来实现滑模到达阶段和滑动阶段的有限时间稳定性。

定理3.对非线性系统(25)，应用控制律(27)和自适应律(30)，且满足初始条件:κ1≥ εM+，ST(0)S(0)+tr()≤Vmax，则可以保证系统状态在有限时间内收敛到包含S=0的一个闭集内:

并且，跟踪误差能够在有限时间内收敛到包含平衡点的闭集内，表示为:

证.选取Lyapunov函数

记 a3= λmin(Ξ)/2，当 a1＞ τ1/V5时，由式(46)和引理1可以得到:S可在有限时间内到达区域:;当时，由式(47)和引理1可以得到:S可在有限时间内到达区域:。由以上分析可知:S可在有限时间内到达下式描述的区域:

4 仿真校验及分析

为证明本文所设计控制器的有效性，选择存在外部干扰和模型不确定性的主从模式编队飞行航天器作为验证对象，在MATLAB/Simulink环境下对该系统进行数值仿真分析。

假设目标航天器运行在高度为400 km，倾角为45°的圆轨道上，目标航天器体坐标轴与其惯性主轴重合，表示航天器惯量和质量的矩阵Ξ取为:Ξ = diag(22，20，23，100，100，100)，惯量单位为kg·m2，质量单位为kg。目标航天器的轨道坐标系定义为: x轴方向由地心指向航天器质心，y轴为速度方向，z轴通过右手坐标系得到，且初始时刻目标航天器的体坐标系与轨道坐标系重合。χo和Vo的初始值为:

Vo=［0 0 0.0011 0 7.6126 0］T，位置单位为km，角速度单位为rad/s，平移速度单位为km/s。

跟踪航天器初始状态为:跟踪航天器的姿态转换矩阵在目标姿态基础上，先绕目标航天器x轴方向转动π/6，再绕z轴方向转动π/6;初始时刻角速度为［0.000009 0.000598 0.000931］Trad/s;平移速度为［3.44151 5.69884 －3.69202］Tkm/s;在目标航天器本体坐标系下位置坐标为［5 5 5］Tm。控制目标为:跟踪航天器与目标航天器的姿态保持同步，悬停在目标航天器x轴下方5 m且V～=0。仿真中控制力限制在［－10，10］N，控制力矩限制在［－1，1］N·m，切比雪夫多项式阶数取为3，权值矩阵W(0)=06×37，其余的参数设置见表1，仿真结果如图2～图7所示。

表1 仿真参数Table 1 Simulation parameters

图6和图7分别给出了控制力和控制力矩的变化曲线，可以看出，力和力矩均由限定值逐渐减小，在该控制作用下跟踪航天器以较快速度和较高精度到达期望的跟踪状态，并继续保持对目标航天器状态的跟踪。实际的航天器执行机构可以提供对控制力和控制力矩所取的前述输出限定值，表明了本文所提控制方法具有一定的工程应用价值。

上述仿真结果说明在系统存在外部干扰和模型不确定性情况下，CNN可以有效逼近系统的总干扰，通过设计的控制算法可使跟踪误差在有限时间内快速收敛且具有较高的跟踪精度。

5 结论

本文研究了编队飞行航天器姿轨耦合有限时间高精度跟踪控制问题。在系统存在外部干扰和模型不确定性情况下，推导了形式简洁的基于SE(3)的航天器间相对姿轨耦合动力学模型。基于此模型，构造了不需要显式的相对参考状态的滑模面，在此基础上设计了基于CNN的自适应非奇异快速终端滑模控制器，保证了闭环系统的有限时间稳定性，实现了跟踪航天器对目标航天器的高精度姿轨一体化有限时间跟踪控制。最后，对本文所设计的控制算法进行了仿真校验。结果表明，该方法收敛速度快，控制精度高，且具有一定的工程应用价值。

［1］张世杰，段广仁.分布式卫星编队飞行队形保持协同控制［J］.宇航学报，2011，32(10):2140－2145.［Zhang Shi-jie，Duan Guang-ren.Cooperative control for distributed satellite formation keeping［J］.Journal of Astronautics，2011，32(10): 2140－2145.］

［2］ Lee D，Sanyal A K，Butcher E A.Asymptotic tracking control forspacecraftformation flying with decentralized collision avoidance［J］.Journal of Guidance，Control，and Dynamics，2014，38(4):587－600.

［3］宋申民，郑重，苏烨.控制受限的编队航天器鲁棒自适应控制［J］.宇航学报，2014，35(12):1422－1429.［Song Shenmin，Zheng Zhong，Su Ye.Robust adaptive control of spacecraft formation flightundercontrolconstraint［J］.Journalof Astronautics，2014，35(12):1422－1429.］

［4］ Wu J J，Liu K，Han D P.Adaptive sliding mode control for six-DOF relative motion of spacecraft with input constraint［J］.Acta Astronautica，2013，87:64－76.

［5］王剑颖，梁海朝，孙兆伟.基于对偶数的相对耦合动力学与控制［J］.宇航学报，2010，31(7):1711－1717.［Wang Jianying，LiangHai-zhao，SunZhao-wei.Dualnumber-based relative coupled dynamics and control［J］. Journalof Astronautics，2010，31(7):1711－1717.］

［6］ Kasdin N J，Gurfil P，Kolemen E.Canonical modelling of relative spacecraft motion via epicyclic orbital elements［J］.Celestial Mechanics and Dynamical Astronomy，2005，92(4): 337－370.

［7］ Ren W，Beard R.Decentralized scheme for spacecraft formation flying via the virtual structure approach［J］.Journal of Guidance，Control，and Dynamics，2004，27(1):73－82.

［8］ Kristiansen R，Nicklasson P J，Gravdahl J T.Spacecraft coordination control in 6 DOF: Integrator backstepping vs passivity-based control［J］.Automatica，2008，44(11):2896－2901.

［9］ Wu Y H，Cao X B，Xing Y J，et al.Relative motion coupled control for formation flying spacecraft via convex optimization［J］.Aerospace Science and Technology，2010，14(6):415－428.

［10］ Lee D.Spacecraft coupled tracking maneuver using sliding mode control with inputsaturation［J］. JournalofAerospace Engineering，2014，28(5):04014136.

［11］ Yu S，Yu X，Shirinzadeh B，et al.Continuous finite-time control for robotic manipulators with terminal sliding mode［J］.Automatica，2005，41(11):1957－1964.

［12］ Jin E D，Sun Z W.Robust controllers design with finite time convergence for rigid spacecraft attitude tracking control［J］.Aerospace Science and Technology，2008，12(4):324–330.

［13］赵琳，闫鑫，郝勇，等.基于快速终端滑模的航天器自适应容错控制［J］.宇航学报，2012，33(4):426－435.［Zhao Lin，Yan Xin，Hao Yong，et al.Adaptive fault tolerant control for spacecraft based on fast terminal sliding mode［J］.Journal of Astronautics，2012，33(4):426－435.］

［14］胡庆雷，王辉，石忠，等.航天器新型非奇异饱和终端滑模姿态控制［J］.宇航学报，2015，36(4):430－437.［Hu Qing-lei，Wang Hui，Shi Zhong，et al.Novel non-singular saturated terminal sliding mode based attitude controller for spacecraft［J］.Journal of Astronautics，2015，36(4):430－437.］

［15］ Zou A M，Kumar K D，Hou Z G，et al.Finite-time attitude tracking control for spacecraft using terminal sliding mode and Chebyshev neural network［J］.IEEE Transactions on Systems，Man，and Cybernetics，Part B(Cybernetics)，2011，41(4): 950－963.

［16］张海博，梅杰，马广富，等.多航天器相对轨道与姿态耦合分布式自适应协同控制［J］.控制理论与应用，2013，30 (9):1086－1098.［Zhang Hai-bo，Mei Jie，Ma Guang-fu，et al.Coupled-distributed-adaptive-coordinated control for relative orbit and attitude of multiple spacecraft［J］.Control Theory＆Applications，2013，30(9):1086－1098.］

［17］ Nazari M，Butcher E A，Yucelen T，et al.Decentralized consensus control of a rigid-body spacecraft formation with communication delay［J］.Journal of Guidance，Control，and Dynamics，2016，39(1):1－14.

通信地址:哈尔滨工业大学3013信箱(150080)

电话:13352220328

E-mail:1977148919@qq.com

叶东(1985－)，男，博士，讲师，主要从事分布式航天器协同控制理论与方法。本文通信作者。

通信地址:哈尔滨工业大学3013信箱(150080)

电话:13946172131

E-mail:yed@hit.edu.cn

(编辑:张宇平)

High-Accuracy Fast Terminal Sliding Mode Control for Coupled Spacecraft on SE(3)

ZHANG Jian-qiao，YE Dong，SUN Zhao-wei
(Research Center of Satellite Technology，Harbin Institute of Technology，Harbin 150001，China)

A sliding mode control scheme with high accuracy and fast convergence is proposed to solve the coupled－control problem of a spacecraft formation flying system in this paper.First，in the presence of structured and unstructured uncertainties，coupled dynamics model of relative position and attitude are derived based on the Lie group SE(3)，in which the tracking errors of position and attitude are described by exponential coordinates on SE(3).A new nonsingular fast terminal sliding mode controller(NFTSMC)based on Chebyshev neural network(CNN)is proposed to make the tracking control come true in finite time by using a sliding surface，which is defined by the exponential coordinates and velocity tracking errors，and the stability of the closed－loop system is proved by Lyapunov methods.The controller doesn’t need explicit reference states and can guarantee finite-time stability in both the reaching phase and the sliding phase.Since the adaptive control scheme based on CNN，whose basis functions only need the expected signals and represented capabilities is powerful，is introduced to approximate the total disturbance online，the controller also has high accuracy.Finally，numerical simulations on the leader-follower spacecraft formation are presented to validate the effectiveness and feasibility of the proposed controller.

Coupled dynamics model;Lie group SE(3);Nonsingular fast terminal sliding mode;Chebyshev neural network;High accuracy

V448.22

1000-1328(2017)02-0176-09

10.3873/j.issn.1000-1328.2017.02.009

张剑桥(1993－)，男，博士生，主要从事航天器轨道姿态动力学与控制。

2016-07-11;

2016-09-14

国家自然科学基金(61603115，61273096);2015年黑龙江省博士后资助经费(LBH-Z15085);微小型航天器技术国防重点学科实验室开放基金(HIT.KLOF.MST.201501);中国博士后科学基金(2015M81455)