航天器编队飞行自适应协同避碰控制

2020-06-23史小平林晓涵李师轮王子才

哈尔滨工业大学学报 2020年4期

史小平,林晓涵,李师轮,王子才

(1.哈尔滨工业大学控制与仿真中心,哈尔滨 150080； 2.哈尔滨工业大学航天学院,哈尔滨 150001)

近年来，考虑避免碰撞的编队飞行航天器系统协同控制受到了广泛的研究和关注[1-7]. 与鲁棒性较差的单个航天器系统相比较[8]，多航天器编队飞行系统具有通信成本低、鲁棒性强、效率高等优点[9]，可以突破单个航天器编队系统的局限，对探测所需要的控制目标有更广阔的前景和更有意义的研究价值.

在航天器编队飞行系统协同控制的实际应用中，要求航天器能获得相互信息以实现对期望状态的跟踪. 然而在信息获取的过程中由于距离和传输设备的约束，通常存在通信延迟[10]、信息无法实时准确获取[11]、航天器之间存在碰撞等情况. 在编队飞行过程中，由于存在燃料损耗，航天器质量等信息无法精确实时获取，且在信息传递时会受到各种外部扰动的影响. 根据上述分析的问题，为了提高编队航天器间协同控制的性能和精度，设计相应的自适应协同避碰控制算法具有重要的研究意义. 文献[12]中对航天器编队协同控制进行分析，同时考虑避免碰撞提出了3种不同的编队跟踪控制方法. 在文献[13]中基于编队卫星姿态动力学模型方程，通过引入速度滤波器设计了能够保证速度误差渐近收敛的自适应协同控制器. 文献[14]进一步考虑推力校正和系统增益存在不确定性的情况下，提出了自适应跟踪控制算法.在上述分析的协同控制律中均为全状态反馈，而在实际的航天器编队飞行任务应用中，为节约燃料消耗、防止航天器之间的相对速度测量装置发生故障导致整个系统不稳定，需要保证编队系统在无速度测量情况下的有效协同作用. 文献[15]提出了一种仅利用领航-跟踪航天器编队中的相对姿态反馈跟踪相对转动的控制器. 文献[16]考虑输入受限的情况下，针对多Euler-Lagrange系统提出了一种无速度测量的分布式有限时间跟踪控制算法.

在编队飞行过程中，航天器之间避免碰撞是实现多航天器编队跟踪控制目标的重要保证. 近年来，在多无人机协同控制、机械系统同步控制、多无人车协同控制等方面引起了国内外广泛的研究和关注. 碰撞规避的主要研究方法可以分为：博弈论、碰撞概率分析、数学规划、半定规划[17]和势函数法[18].而势函数因其简单直观的物理意义成为解决避免碰撞的一种重要方法[19-20]. 文献[21]基于势函数的方法对模型不确定的编队飞行卫星系统设计了避免碰撞的自适应协同控制器，同时考虑了参考轨迹作用的问题. 文献[22]设计了能保证Lagrange系统协同避碰的控制律，并考虑输入扰动的影响. 在此基础上，文献[23]分析了Lagrange系统同时存在外部干扰和参数不确定的情况下的稳定性，并利用势函数的方法设计相应的鲁棒自适应控制算法.

受上述文献的启发，本文针对航天器质量未知和存在通信时延的情况，考虑反馈状态对航天器编队飞行系统的影响，分别对于全状态反馈和无速度测量设计两种自适应协同避碰控制律.首先，本文考虑了存在通信时延的航天器编队飞行系统的自适应协同避碰控制问题，在设计相应控制律时，选取合理满足系统的势函数，实现避免碰撞的控制目标；其次，考虑航天器编队反馈状态的角度，分别提出了全状态反馈和无速度测量的自适应协同避碰控制律，并同时考虑了航天器质量不确定性和通信时延，对于参数不确定有较好的自适应性; 最后通过仿真分析证明了所设计控制律的有效性.

1 基础理论

1.1 相对运动非线性模型

在本文中每个航天器均假设为刚体结构，则n个航天器绕参考航天器编队飞行情况示意图，如图1所示.其中FI{OIXIYIZI}为赤道惯性坐标系，其原点OI代表地球的中心.Fl{olxlylzl}为参考航天器轨道坐标系，用来描述编队航天器间的相互运动，其原点ol位于参考航天器的质心，xl轴沿着地球质心指向参考航天器的矢量方向，yl轴垂直于xl轴并位于参考航天器轨道平面，zl轴通过右手定则获得.rl为参考航天器相对于地球质心的位置矢量[24].

图1 编队航天器飞行系统坐标系

Fig.1 Coordinate frame for the formation spacecraft flying system

在不考虑参考航天器所受主动力控制的作用下，假设参考航天器在椭圆轨道上运行.ri、vi分别为第i个航天器相对与参考航天器的在编队飞行系统中的位置和速度，则第i个航天器非线性动力学模型的相对运动方程为：

(1)

ni(rfi,rl)+di+fi,

(2)

其中：

(3)

(4)

(5)

(6)

式中：dl、dfi分别为参考航天器和第i个航天器所受到的外部干扰总和;θc为参考航天器的真近点角;rl、rfi分别为参考航天器和第i个航天器到地球中心的距离;I3×3为适当维数的单位矩阵，μ为地球引力常数.

为能够更好地设计本文所提出的自适应协同避碰控制律，利用Euler-Lagrange方程来描述编队飞行航天器系统的相对运动[25]：

(7)

式中：

1.2 基础图论

本文中用加权无向图G=(V,E,A)来描述编队航天器之间的信息传递[26]：V={v1,…,vn}为节点集，E⊆V×V为连接节点的边集，A=[aij]∈Rn×n为加权邻接矩阵.若(j,i)∈E，且(i,j)∈E，则称G为无向图. 如果第j个节点有指向第i个节点的路径且存在信息传递，则第j个节点就有一条边指向第i个节点，记为(j,i)∈E.在无向图中，如果任意两点之间存在路径连接，则无向图具有连通性[26].

1.3 势函数设计与控制目标设定

1.3.1 势函数设计

本文利用势函数的方法来完成多航天器编队飞行避免碰撞的控制目标，使系统达到期望的控制状态. 势函数的主要优点在于：在期望的状态下具有全局最小值，且具有较高势函数值的区域代表障碍碰撞等限制情况. 受文献[27]启发，设计势函数的主要思想如下：首先，定义一个反映系统约束条件的标量势函数. 其次，利用势函数的梯度值表示施加在航天器编队上避免碰撞的控制力. 最后，设计适当的控制律使系统势函数的值具有减小的趋势，并且应用Lyapunov稳定性理论，保证编队系统的位置和速度均同时收敛于期望状态，满足避免碰撞的控制目标.

Rij、rij分别为编队系统通信和最小安全区域的距离，选取如下的避免碰撞势函数：

式中,Vij(ri,rj)为一个非负连续的可微函数.

Vij沿向量ri的梯度表示为

1.3.2 控制目标设定

2 控制律设计

在本文中，为实现编队航天器飞行系统的自适应协同避免碰撞控制，分别对于全状态反馈和无速度测量情况，设计相应的控制律. 在设计控制律时，为实现编队系统的稳定性应考虑：1)编队航天器对期望位置和期望速度的跟踪；2)编队航天器的协同控制作用使其状态趋于稳定；3)保证编队航天器之间不发生碰撞.

2.1 全状态反馈自适应协同控制律

将辅助变量定义如下:

通过利用滑模变结构理论，第i个航天器可以表示为

式中η为正常数.

定理1考虑航天器编队相对运动模型(1)～(6)，如果通信拓扑结构为无向图，假设第i个航天器所受到的外部扰动di=0，在存在航天器质量参数不确定性、通信时延的情况下，同时考虑避免碰撞的控制目标，将航天器编队飞行系统控制律设计如下：

(8)

(9)

(10)

定义第i个航天器的质量估计误差为

根据势函数设计与控制目标设定提出的势函数方法和文献[27]所提出的相关内容，本文对势函数作如下假设.

假设1若拓扑结构为无向图且Vij(‖ri-rj‖)对称，则可以得到▽riVij(‖ri-rj‖)=-▽rjVij(‖ri-rj‖).

在本文中，假设航天器所受到外部扰动di=0，将控制律(8)～(10)代入式(2), 则闭环系统可以写为

证明1定义如下Lyapunov函数:

(11)

将式(11)对时间求导，可以得到:

(12)

在对式(12)推导过程中，需要分析如下几点：

2)若航天器编队系统的通信拓扑结构为无向图，则aij=aji，进一步可以得到如下等式成立:

3)若通信拓扑结构为无向图且▽riVij=-▽rjVij，则

4)时间延迟满足如下不等式:

根据上述分析，式(12)可以写为

2.2 无速度反馈自适应协同控制律

受文献[29]启发，考虑到通信时延的情况，设计一种无源滤波器：

(13)

(14)

式中：i=1,…,n，Θ∈R3是Hurwitz矩阵.Λ=ΛT∈R3×3为正定矩阵满足如下Lyapunov等式：

ΘTΛ+ΛΘ=-Q,

式中，Λ、Q均为对称正定阵.

定理2考虑航天器编队相对运动模型(7)，如果通信拓扑结构为无向图，假设第i个航天器所受到的外部扰动di=0，在存在航天器质量参数不确定性、通信时延及速度无法测量的情况下，同时考虑避免碰撞的控制目标，将航天器编队飞行系统控制律设计如下：

(15)

(16)

式中,ξi为自适应更新律的正常数量. 则有

引理1文献[30]假设M∈Qp×p，N∈Qq×q，则下式成立：

1)(M⊗N)(A⊗B)=MA⊗NB.

2)假设M和N为可逆矩阵，则满足(M⊗N)-1=M-1⊗N-1.

3)如果M和N是对称正定的，则M⊗N同样也为对阵矩阵.

与设计全状态反馈控制律相似，假设航天器编队受到的外部干扰为零，则闭环系统方程可写为

证明定义如下Lyapunov函数:

(17)

将式(17)对时间求导，可以得到:

(18)

在对式(18)推导过程中，需要分析如下几点：

1)根据式(13)可以得到如下:

(19)

2)如果编队航天器之间相互作用的通信拓扑结构是无向的，且拓扑图的边指向航天器，则矩阵Ξ=LA+diag(a10,…,an0)是对阵正定的.

3)根据引理1可知，等式(Ξ⊗I3)-1(In⊗Λ)=Ξ-1⊗Λ是对称正定的.

根据上述分析，式(18)可以重新写为

3 仿真分析

为了验证本文所设计控制律的有效性，以3个航天器编队飞行系统为例，分别对全状态反馈和无速度测量自适应协同控制进行相应的仿真.

将避免碰撞的最小安全距离设置为cij=10 m，选取势函数为

首先，设置全状态反馈自适应协同控制律(14)～(16)中的参数如下：λi=50,γi=50,α=1，通信拓扑图为无向图，则aij=0.5，反之aij=0.

在全状态反馈自适应协同避碰控制律(8)～(10)的作用下，图2、3分别为航天器编队相对位置误差曲线和相对速度误差曲线.由图2、3可以看出，在跟踪到期望位置的过程中，编队航天器相对于参考航天器速度收敛于零附近，同时编队航天器相对距离在100 s后基本保持不变，在任意时刻相对距离均不小于c=10 m，避免碰撞的发生.

图2 全状态反馈相对位置误差曲线

图3 全状态反馈相对速度误差曲线

其次，设置无速度测量自适应协同避碰控制律(15)～(16)中的参数如下：β=1,ξi=0.1通信拓扑图为无向图，则aij=0.3，反之aij=0.

在无速度测量自适应协同避碰控制律(15)～(16)的作用下，图4、5分别为航天器编队相对位置误差曲线和相对速度误差曲线.由图4、5可以看出，位置跟踪误差曲线和速度跟踪误差曲线均能收敛到零附近，且收敛时间具有同步性并保持编队飞行系统稳定，在图4中，相对位置跟踪误差以稳态误差约为10-3m，而在图5中相对速度跟踪的稳态误差约为10-5m/s.

图4 无速度测量相对位置误差曲线

图5 无速度测量相对速度误差曲线

图6、图7分别给出了全状态反馈和无速度测量控制力曲线图. 在图6、图7中可以看出，在仿真的初始阶段由于存在通信延迟会产生较大的抖振，但随着时间的变化曲线均达到收敛.与全状态反馈自适应协同避碰控制律相比，编队航天器在无速度测量自适应协同避碰控制律作用下，相对振幅较大，是由于航天器质量估计值在自适应更新律中稳态控制不能为零.因此，根据设计的控制律(8)～(10)、(15)～(16)可以看出，当辅助变量收敛到零附近时，控制变量不能达到零.

图6 全状态反馈控制力曲线

图7 无速度测量控制力曲线

编队航天器避免碰撞的相对位置变化轨迹如图8所示，在航天器编队飞行时假设各航天器为刚体结构，但是在实际应用运行过程中会受到姿态展开等因素的影响，这些干扰因素仍然是无法忽略的. 由图8可以看出，各航天器均能到达期望轨迹且不发生碰撞. 根据上述分析可知，航天器编队飞行闭环系统稳定性，并完成编队跟踪、避免碰撞、自适应协同控制的控制目标.