APP下载

非合作航天器姿态接管无辨识预设性能控制

2018-11-30殷泽阳罗建军魏才盛王嘉文

航空学报 2018年11期
关键词:组合体航天器姿态

殷泽阳,罗建军,,魏才盛,王嘉文

1. 西北工业大学 航天学院,西安 710072 2. 西北工业大学 航天飞行动力技术重点实验室,西安 710072

随着航天技术的发展与应用,越来越多的航天器被发射进入地球轨道,并在任务完成后成为非合作航天器,对在役航天器的安全造成巨大威胁[1]。使用服务航天器利用抓捕装置(如机械臂等)对非合作航天器进行抓捕并形成刚性组合体,随后利用服务航天器上的姿态运动执行器对其进行姿态接管控制,为处理非合作航天器提供了新的解决方案[2]。对非合作航天器进行姿态接管后,可为其提供轨道和姿态控制,进而实现在轨位置保持、轨道修正、姿态机动、拖曳离轨等操作,因而具备重要的理论研究意义和工程应用价值[3-4]。

针对非合作航天器捕获后的组合体姿态接管控制,目前已有一些研究工作。按照对参数信息的了解程度,大体可以分为4类:参数已知、参数辨识后已知、参数近似已知和参数完全未知4种。参数已知的方法中,针对机械臂抓捕非合作目标后的组合体稳定控制问题,刘厚德等[5]基于机器人动力学提出了组合体航天器姿态稳定协调控制方法,利用机械臂特性对非合作目标进行协调控制。文献[2,6]利用状态相关里卡迪方程方法设计姿态稳定最优控制器,并利用θ-D方法对最优控制器进行快速求解。然而在实际工况中我们往往无法获得系统的精确参数,因此基于精确系统参数的控制方法在应用中很受局限。第2类控制方法使用辨识算法对系统参数进行在线辨识,并假设辨识后的参数可靠。文献[7-8]利用机器人动力学特性对非合作目标惯量矩阵进行参数辨识。韦文书等[9]则利用反馈信息,利用自适应规划方法对非合作航天器的质量特性和惯量矩阵信息进行辨识,并利用滑模控制方法对组合体进行稳定控制。但是,基于辨识方法的组合体控制方法往往计算量比较大,很难在线快速实现;此外,当非合作目标存在姿态力矩输入时,上述辨识过程也很难实现。第3类方法假设非合作目标参数近似已知,并使用自适应控制方法实现在线自适应控制。文献[4,10]利用动态逆方法对组合体航天器进行姿态接管控制,并在控制器中加入自适应因子,来应对参数不确定性对系统的影响。这类控制方法能够对参数不确定性具有一定的鲁棒性,但当参数变化范围大或者剧烈时变时,其控制性能有限。第4类方法假设非合作航天器参数完全未知,目前相关文献较少。文献[11]将无模型预设性能控制方法应用于航天器的姿态跟踪控制上,并设计了与惯量矩阵无关的控制器。但其模型转化方法存在缺陷,会导致控制器奇异;此外其控制器并非完全无模型的,还需要系统的部分参数。综上,对非合作目标进行姿态接管控制仍存在很多挑战。首先,由于目标航天器是非合作的,因此其动力学参数应是完全未知的。基于参数的控制方法在实际工况下无法获得理想的结果。另外,非合作目标还可能存在时变的参数不确定性,甚至可能存在服务航天器未知的姿态输入力矩,这要求控制器具有极强的鲁棒性。最后,绝大多数控制方法对于其控制结果均不含有先验估计,姿态轨迹收敛过程无法预先得知,在复杂的空间环境中容易发生碰撞、失稳等情形。

本文针对参数完全未知、存在时变不确定性和非合作控制力矩的组合体航天器系统的姿态接管控制问题,基于预设性能控制理论提出一种无需参数辨识的无奇异预设性能控制方法。在建模方面,将传统的姿态跟踪运动模型转化为不含奇异项的拉格朗日型姿态跟踪运动模型;在控制器设计方面,利用跟踪微分器构造了不包含角速度信息的广义状态量,进而结合预设性能框架设计了无需辨识的预设性能控制器,并证明了系统状态在控制器的作用下满足预设的性能范围;在控制分配方面,使用基于序列二次规划的动态控制分配算法进行高效的分配,保证控制系统的低复杂度;在仿真方面,设计了两组仿真实验,验证了本文方法对外部干扰、时变不确定性和目标产生的非合作力矩的鲁棒性。区别于此前的姿态接管控制方法[2-10],本文的控制方法具有如下3方面的优势:① 本文允许组合体参数(惯量矩阵信息)完全未知,可以应对绝大多数的组合体航天器控制问题;② 本文可以对组合体姿态的收敛轨迹边界进行提前预设,并能保证系统在预设性能范围内进行收敛稳定,能够从理论上保证组合体航天器系统的性能和安全;③ 本文不包含复杂的参数辨识过程,计算复杂度低,适合在线应用。

1 组合体航天器姿态运动建模

1.1 组合体航天器姿态误差运动建模

本文所探讨的组合体航天器系统(图1)由可视为刚体的服务航天器、构型可变的非合作目标,以及两个空间机械臂组成[6,12]。其中,左臂有nL个关节,右臂有nR个关节,每个关节均为一个自由度。在实际控制任务中,往往期望服务航天器接管非合作目标的姿态运动,并使组合体跟踪期望的姿态运动轨迹进行姿态运动。本文采用修正罗德里格斯参数(MRP)误差σe=[σe1σe2σe3]T∈R3来描述接管控制过程中组合体航天器的姿态MRP与期望MRP间的关系。其定义为[13-14]

图1 两机械臂组合体航天器系统示意图Fig.1 Illustration of combined spacecraft with two arms

(1)

假设1MRP误差σe在控制过程中是精确可知的。

注1当组合体航天器的本体坐标系与追踪航天器本体坐标系的三轴指向定义相同时,组合体航天器的姿态定义和确定方法与原追踪航天器是相同的,因此假设1是合理的。

(2)

式中:ω=[ω1ω2ω3]T、ωd=[ωd1ωd2ωd3]T和ωe=[ωe1ωe2ωe3]T分别为组合体航天器的真实角速度、期望角速度和角速度误差,且满足ωe=ω-ωd;ω0为组合体航天器的轨道角速率;

矢量R3的定义为

叉乘算子[·×]对于任意三维向量ϖ=[ϖ1ϖ2ϖ3]T定义为

矩阵Geσe∈R3×3的定义为

(3)

式中:I3×3为三维单位矩阵。值得注意的是,矩阵Ge(σe)为非奇异矩阵,且当σe有界时其也为有界矩阵。

(4)

组合体航天器的主动控制力矩矢量为

(5)

文献[6]严谨地推导了组合体航天器的惯量矩阵J∈R3×3的解析形式,具体如下:

(6)

1.2 基本假设

针对式(2)所示的组合体航天器姿态跟踪运动模型,可作出如下合理假设:

假设2[14]机械臂的所有关节在完成非合作目标抓捕后锁死,服务航天器及机械臂的构型在姿态接管控制过程中保持不变。

假设3非合作目标的惯量矩阵在接管控制过程中完全未知,且可能由于非合作目标的构型改变发生变化。

假设4由于测量条件的限制,在接管控制过程中,组合体航天器的角速度ω及角速度误差ωe未知。

假设6非合作目标在被接管过程中不配合服务航天器的控制,存在有界的非合作控制输入un。

假设7组合体航天器系统存在有界外部干扰力矩d。

1.3 非奇异拉格朗日型模型转化

文献[11]首次将预设性能控制方法应用于航天器的姿态控制中,但其模型转化方法存在理论缺陷:由于模型转化方法的不恰当,姿态运动方程在欧拉角为±180°时发生奇异,进而导致控制器中存在奇异项,严重时甚至会导致系统失稳。本文提出了一种针对MRP误差的非奇异拉格朗日型模型转化方法。

基于式(2)和式(3),通过代数运算可以得到如下所示的拉格朗日型模型:

(7)

式中:

(8a)

(8b)

(8c)

很容易证明,在假设2~7下,上述拉格朗日型模型满足如下性质:

性质1矩阵Aσe满足对称正定性,且当MRP误差σe有界时,Aσe及其逆矩阵A-1σe均满足有界性。

2 控制器设计

2.1 基于跟踪微分器的广义状态量构造

MRP误差σe及角速度误差ωe是控制器设计中的核心状态信息。然而在很多情况下,由于电力供应的约束及传感器精度和造价的限制,往往无法获得控制器所需的精确角速度信息,也就无法求得角速度误差信息[15]。因此,近年来无角速度测量信息的航天器姿态控制理论成为一个重要研究方向。考虑到基于运动学的角速度观测方法理论复杂,工程应用繁琐[15],因此文献[16-17]中基于全状态反馈的预设性能控制方法无法直接进行工程应用。

(9)

式中:v1i与v2i为跟踪微分器的状态量;0<μ0<1,μ1>0与μ2>0为微分器的可调参数。

(10)

注2文献[18]的定理3指出,当微分器的输入量(即本文的姿态信息)存在随机干扰噪声时,微分器能够对噪声进行滤波降噪,使得微分器的状态v1i逼近于σei的真值。因此,在实际工程应用中,若遇到姿态传感器存在噪声的情形,可以使用v1i近似替代姿态信息σei,从而降低噪声的影响。为保证理论的严谨性,在本文的理论证明部分仍然假设姿态信息σei是精确可知的,只分析微分器跟踪误差ξi对控制器的影响。

z(t)=σe(t)+λv2(t)

(11)

基于上述讨论,结合文献[16-17]中预设性能控制的概念,本文的控制目标可以总结如下:

针对式(7)所示的组合体航天器姿态误差拉格朗日型模型,在无需具体系统参数的前提下设计一种鲁棒控制器,使得

1) 广义状态量z(t)及MRP误差σe始终保持有界。

2) 广义状态量z(t)的每一维状态量zi(t) (i=1,2,3)至少以指数速度收敛。

3) 广义状态量z(t)的每一维状态量zi(t)(i=1,2,3)最终将收敛到用户预设的稳定域内。

2.2 非奇异姿态接管预设性能控制器设计

预设性能控制理论通过对系统状态量设置性能边界,进而约束状态量的收敛轨迹[16-17]。针对广义状态量zi(t)(i=1,2,3),可设计如下所示的上下界边界约束:

-αi(t)

(12)

式中:αi(t):R+→R+为预设性能函数(PPF)。PPF约束下的状态量可通过图2进行阐释。为了综合考虑系统的稳态和瞬态性能,PPF可设计为如下指数递减的正值函数:

(13)

图2 PPF约束下的广义状态量示意图Fig.2 Illustration of extended states under PPF

对于任意变量ϑ(t),定义单调递增的一一映射函数h(ϑ):-1,1→R为

hϑ=tanh-1ϑ

(14)

基于该一一映射函数,可以构建无约束的映射状态变量s=[s1s2s3]T∈R3:

sizi(t),αi(t)=hzi(t)/αi(t)

(15)

为了简洁性,后文中将sizi(t),αi(t)简写为si(t)。通过上述映射,将广义状态量zi(t)在区间-αi(t),αi(t)内的约束控制问题转化为si(t)的无约束控制问题。

对映射状态量求导可以得到

(16)

式中:θi(t):=θisi(t)=tanhsi(t);ri(si(t),t)=(∂θi(t)/∂si(t))αi(t),且

将式(7),式(11)代入式(16),可以得到

(17)

式(17)也可以整理为

(18)

基于上述讨论,可设计如下所示的姿态接管非奇异预设性能控制器:

(19)

式中:k>0为控制器的可调增益,可任意选定。

从上述控制器中可以看出,区别于文献[11]中的姿态预设性能控制器,本文所设计的控制器计算过程中不包含任何的系统参数信息(惯量矩阵信息),是真正的无模型预设性能控制器;再者,控制器中不包含任何可能导致奇异的项,控制性能稳定;此外,区别于文献[11]中的增益设计,其增益必须足够大才能保证控制系统稳定,而本文中的控制增益可任意选定;最后,控制器形式非常简洁,计算的过程中不含任何参数辨识过程或复杂的迭代过程,是一种低复杂度的无辨识控制方法。

3 控制器稳定性分析

首先给出稳定性分析所需要的一个定义与两个相关的引理。

定义1[19]考虑如下所示初值有界的系统:

(20)

式中:x(t)∈Rn;fx(t),t:Rn×R+→Rn为局部可积的非线性函数;初值边界ζx为一非空开集。若该非线性系统某个解的所有右扩展均不是该系统的解,则定义该解为系统式(20)的最大解。

引理1[19]针对非线性系统式(20),对于任意tmax>0,给出系统在时间区间0,tmax上存在唯一的最大解x(t)∈ζx的一个充分条件:非线性函数fx(t),t在时间区间0,tmax上对于任意x(t)∈ζx均保持连续,且满足局部Lipschitz条件。

基于上述定义和引理,本文给出如下定理:

(21)

在时间区间0,tmax上构造系统关于映射状态量s的李雅普诺夫函数V=sTs/2。对该李雅普诺夫函数展开可得

(22)

(23)

(24)

结合式(22)~式(24),可以得到

(25)

将式(19)中的控制器代入式(25)有

(26)

进而考虑逆映射θi(t):=θisi(t)= tanhsi(t)。由于tanhsi(t)在-∞,+∞到-1,1间也为单调递增的一一映射,显然可以得到:

θi(t)∈-tanhρ,tanhρ∈-1,1

(27)

tmax=+∞

(28)

最后我们将证明MRP误差σe始终保持有界。考虑广义状态量z(t)的定义式(10),该式可以写为

(29)

式中:wi=1/λi。对式(29)积分可以得到

(30)

将式(27)代入式(30)可以得到

(31)

综上,定理1证明完毕。

4 基于序列二次规划的动态控制分配

在实际控制中,式(19)计算得到的组合体航天器理想的三轴控制力矩u,要通过4个反作用飞轮的力矩uw共同作用实现,即式(5)。为解决反作用飞轮可能发生饱和的情形,同时兼顾计算效率,本文采用基于序列二次规划的动态控制分配算法[20]解算实际力矩uw。令反作用飞轮的控制力满足如下上下界约束:

-umax≤uwi(t)≤umaxi=1,2,3,4

(32)

则动态控制规划问题可以描述为如下所示序列二次规划的形式:

(33a)

(33b)

为提高计算效率,在当前执行器最优集均不发生饱和现象时,即最优集ζu内的uw(t)均满足约束条件(32)时,式(33a)存在如下所示解析解:

(34)

式中:

(35)

通过该解析解可以高效地计算出最优飞轮控制力矩uw(t)。

5 仿真分析

在本节中,为了验证姿态接管无辨识控制器式(19)的有效性,本文设计了两组仿真如下:在5.1节中,为了验证预设性能算法的有效性和性能优势,本文在存在强外部干扰和时变不确定性的条件下进行仿真,并与文献[6]中改进状态相关里卡迪方程控制方法和传统的PID控制方法进行性能对比。在5.2节中,为了验证控制器对非合作输入的鲁棒性,假设非合作目标存在以保持初始姿态为目标的非合作控制输入,验证本文方法对该非合作输入的鲁棒性。

5.1 组合体航天器姿态接管控制对比仿真分析

本文采用与文献[6]相同的组合体航天器参数进行数值仿真,采用本文控制器式(19)与文献[6]中提出的改进状态相关里卡迪方程控制方法(典型的基于模型参数的控制方法),以及传统的PID控制方法进行对比仿真。具体仿真参数设置为:服务航天器在完成抓捕过程后,左侧机

组合体航天器的初始瞬时欧拉角设置为[20°-20°15]T(初始MRPσ(0)=σ0=[0.087 5-0.087 50.065 5]T),初始角速度ω(0)和期望角速度ωd(t)均设置为0。

4个反作用飞轮的惯量均设置为Jwi=0.338 kg·m2(i=1,2,3,4);飞轮的控制输入约束边界为umax=1 N·m;飞轮的构型矩阵H设置为

文献[6]在仿真中并未考虑干扰的影响,本节为模拟外部干扰的作用,组合体航天器的外部干扰力矩设计为

(36)

在服务航天器抓捕非合作目标形成组合体后,尽管服务航天器及其机械臂构型不发生变化,可视为刚体,但是非合作目标可能存在服务航天器未知的构型改变,进而导致组合体系统的参数发生改变。为模拟非合作目标构型的变化,本节假设组合体航天器的惯量矩阵存在时变的强不确定性,来验证控制器对不确定性的鲁棒性。具体为

J=J0+diag(500,400,300)·

(1-cos(0.5t)) kg·m2

(37)

式中:

J0=diag672.9,4 002.5,4 238.9 kg·m2

(38)

值得注意的是:本文提出的控制器和PID控制器对于J和J0是完全未知的,本文假设文献[6]中的方法已知J0。

跟踪微分器的参数设置为与文献[18]相同:μ0=0.2,μ1=6和μ2=30。预设性能边界函数相关的参数设计为

(39)

控制器相关的参数设置为

k=1,λ=diag(20,20,20)

(40)

在本节仿真中,假设非合作目标不存在姿态控制,被动接受服务航天器的接管控制。仿真结果见图3和图4。

图3给出了3种方法中MRP误差随时间的变化图。从图3(a)中可以看出,MRP误差在本文提出的控制器作用下快速地收敛,并且收敛轨迹始终位于预设的性能边界以内,满足用户的预设要求。从图3(a)的子图中可以得到:系统进入稳态后,稳态误差极小,MRP误差保持在2×10-5以内(姿态角误差约为4×10-3(°)),系统成功收敛于预设的稳定域内。而文献[6]方法(图3(b))的求解过于依赖系统的数学模型,当本文的仿真引入强外部干扰式(36)和时变不确定性式(37)后,该方法的性能不再优秀,存在一定的稳态误差,系统性能逊于本文提出的方法,并不适合于惯量矩阵完全未知的非合作目标姿态接管控制问题。PID控制器(图3(c))作用下的系统收敛速度更为缓慢,且存在较大的稳态误差。

图4给出了姿态接管控制中3种方法的反作用飞轮的控制输入力矩随时间的变化图。从图中可以得到:本文方法航天器的控制力矩稳定且幅值较小,极少出现输入饱和的情形,且对外部干扰和不确定性具有较强的补偿作用。文献[6]中的方法缺乏对模型的认知,对外部干扰和不确定性的补偿作用十分有限。PID控制方法不但控制精度很低,在控制初期还出现了严重的控制饱和现象,十分不利于工程实现。

图3 MRP误差随时间变化图Fig.3 Variation of MRP error with time

图4 飞轮控制力矩随时间变化图Fig.4 Control input of reaction wheels with time

5.2 对非合作控制输入的鲁棒性分析

除惯量矩阵未知和存在时变强不确定性外,非合作目标的非合作性还体现在其可能存在服务航天器未知的非合作姿态控制输入,且该控制输入的量级可能远大于外部干扰,与服务航天器控制输入量级相等或略小,这不但会影响系统的稳态精度,甚至会影响系统的稳定性。

本节假设非合作目标的控制目标是保持其初始姿态,即施加控制输入,保证非合作目标保持在初始姿态σ0=[0.087 5-0.087 50.065 5]T上。为完成该控制目标,假设非合作目标会对组合体施加如式(41)所示非合作控制力矩(通过PD控制策略实现姿态保持):

(41)

式中:kp为比例增益参数,在仿真中设置为kp=15;kd为微分增益参数,设置为kp=50。此外,假设非合作控制输入un满足如下输入饱和约束,即

-0.8≤uni(t)≤0.8i=1,2,3

(42)

值得注意的是,服务航天器反作用飞轮的输入uw饱和约束为

-1≤uwi(t)≤1i=1,2,3,4

(43)

该非合作输入与服务航天器的控制能力相近,对组合体的接管控制提出了严峻的挑战。

组合体航天器的其他参数及控制器参数设置与5.1节相同。仿真结果见图5和图6。

图5给出了仿真过程中,非合作输入力矩随时间的变化图。从该图中可以看出,随着非合作目标被迫远离初始姿态,非合作目标施加的非合作输入力矩越来越大,并很快达到饱和上下界±0.8 N·m。考虑到组合体执行器反作用飞轮的饱和上下界仅为±1.0 N·m,该非合作输入对控制器的鲁棒性提出了很高的要求。

图6(a)给出了非合作控制输入作用下,MRP误差随时间的变化图。与不包含非合作输入的MRP误差结果图(图3(a))相比,MRP误差收敛速度有所减缓,但仍处于预设的性能范围以内。由于非合作输入的存在,系统的稳态误差有所增加,从2×10-5提升到2×10-4(姿态误差角约为4×10-2(°)),但仍处于预设的稳定域以内。值得注意的是,MRP误差的收敛速度和稳态误差仍可以通过调整预设性能函数的参数进一步提升和减小。

图6(b)给出了姿态接管控制中控制力矩随时间的变化图。尽管存在式(41)所示的强非合作输入,且非合作输入大部分时间均处于饱和约束边界,但反作用飞轮能够对非合作输入起到较强的补偿作用,保证系统收敛的瞬态和稳态误差。

图5 非合作控制输入随时间变化图Fig.5 Variation of non-cooperative control input with time

图6 MRP误差和飞轮控制力矩随时间变化图(5.2节)Fig.6 Variation of MRP error and control input of reaction wheels with time (Section 5.2)

上述仿真结果说明本文所提出的控制器对非合作控制输入并不敏感,具有极强的鲁棒性。

6 结 论

1) 针对参数未知、存在时变不确定性和非合作控制输入的组合体航天器系统的姿态接管控制问题,构造了不含奇异项的姿态跟踪拉格朗日型系统,保证后续控制器设计的连续性和稳定性。

2) 提出了一种无需参数辨识的预设性能控制方法,证明了组合体系统变量的稳定性和有界性,并通过仿真结果表明:所提出的控制器能够保证系统状态量以预设的收敛速度收敛于预设的稳定域内,且对外部干扰、时变参数不确定性及非合作目标的未知姿态控制输入具有很强的鲁棒性。

猜你喜欢

组合体航天器姿态
2022 年第二季度航天器发射统计
空间站组合体3D展示产品
攀爬的姿态
2019 年第二季度航天器发射统计
“拆”解组合体求积问题
不同组合方式煤岩组合体强度及声发射特征分析
2018 年第三季度航天器发射统计
全新一代宋的新姿态
2018年第二季度航天器发射统计
另一种姿态