一种超低轨卫星干扰力矩与故障的估计及补偿方法
2023-12-28马嘉宏吴宝林耿云海
马嘉宏,吴宝林,耿云海
(哈尔滨工业大学航天学院,哈尔滨 150001)
0 引言
超低轨卫星轨道高度为120~300 km,具有发射成本低、在轨重访周期短、观测效果好、满足特定在轨科学实验要求、解决近地轨道拥挤问题等优势[1-2]。但超低轨道卫星相较传统轨道高度卫星设计难度更高,由于卫星所处轨道更低,大气密度相比中高轨道高很多,大气阻力力矩对姿态控制影响明显。除此之外,严酷的超低轨道空间环境和复杂的卫星结构使得保持卫星安全工作是试验星任务设计中需要考虑的重要因素。当卫星在姿态控制执行机构发生乘性故障与加性故障时,如果能将故障的影响与外界干扰力矩的影响分离开,则方便相应地采取应对措施。
针对卫星姿态机动过程中较大的外部干扰力矩及可能出现的姿态控制执行机构故障,控制方案设计思路可以分为两大类。第一类设计思路追求控制方案的广泛适用性,以滑模控制理论、自适应补偿技术和预设性能方法为代表的一类具有抗干扰和容错能力的控制技术已经被大量应用[3-9]。例如,文献[5]在航天器有限时间姿态跟踪控制方案设计中采用了滑模技术,解决了姿态控制执行器故障问题,还提高了航天器在扰动影响下的控制精度及稳定性。文献[6]借助自适应技术完成了具备一定抗干扰和容错能力的分布式航天器的姿态跟踪控制。然而当外部干扰力矩过大或姿态控制执行机构故障较为严重时,卫星可能发生失控情况。这种保守性促使工程中更倾向于另一类解决干扰及故障情况下卫星姿态控制问题的途径,可概括为设计干扰和故障信息的估计或逼近模块并分类补偿,为此,基于观测器的补偿控制方法被广泛研究[9-15]。比如文献[13]引入神经网络对执行器故障和扰动进行在线估计,并设计自适应滑模容错控制器进行补偿。文献[14]借助迭代学习技术设计观测器完成了执行机构失效故障的重构,其中外界干扰未被估计而是视为影响故障重构效果的因素。但上述方法存在3 个问题:1)设计观测器时通常需要系统实时状态信息以及指令力矩信息,需要对系统进行持续激励;2)以神经网络逼近为代表的故障及扰动信息逼近模块设计虽较有前景,但因计算量大也阻碍其在卫星姿态控制系统中实际应用;3)由于故障和扰动均可对姿态控制的精度产生影响,通常估计模块设计时无法将上述二者分离,造成补偿控制律设计繁琐。
针对上述问题,本文构想将并行学习自适应辨识策略代入干扰和故障信息的估计模块设计问题中。并行学习自适应算法发展于在线参数辨识领域,于2010年在模型参考自适应控制理论的基础上提出[16]。传统的自适应方法只使用瞬时数据进行参数更新,因而需要持续的系统状态信息作为激励,而并行学习自适应算法同时使用记录数据和当前数据进行参数更新,相比传统方法中持续激励的条件有所放宽,因此限制性更小[17-18]。该算法不仅被广泛应用于航天器未知转动惯量估计问题中[19-21],还为存在未知量的控制系统设计问题提供了新的思路。如文献[22],在解决一类非线性不确定系统的最优保成本控制问题时,利用并行学习自适应算法对神经网络理想权值矢量实现了无需系统实时状态信息条件下的精准逼近,被估计信息不再局限于惯性参数。研究表明,该算法展现出可利用更少量的激励信息对未知常量或近似常量进行有效估计的能力,可依据历史和当前信息进行待辨识参数解耦。该优势对细化干扰及故障信息特性、解决上述观测器设计问题具有指导意义。
借助并行学习自适应算法的优势,本文提出了一种具有干扰及故障在线估计和补偿能力的姿态控制方法。利用参数辨识领域的理论去解决未知扰动观测问题和故障辨识问题是一种新尝试,为解决具备超低轨卫星特色的姿态控制问题提供了新思路。首先,通过对超低轨卫星所受干扰进行分析,将大气阻力力矩以符合目标轨道高度扰动特性的形式进行建模。其次,针对存在的大气阻力力矩以及姿态控制执行机构可能出现的乘性及加性故障情况,应用并行学习算法去分别估计上述相关参数。该过程仅需要收集一定量的过往和当前的卫星角速度信息及对应时刻的指令力矩信息,并利用低通滤波获取一些普通传感器无法获取的卫星角加速度信息,此举可放宽对卫星实时状态信息的需求,解决持续激励的条件限制并节省星上算力。再次,将干扰力矩和故障的估计信息与工程实践中常用的类PD 控制相结合分别做到针对性的补偿。最后,通过仿真验证了该估计与补偿控制方法具备抗干扰和容错高精度姿态控制能力。
1 问题描述
本文的目的是针对超低轨卫星系统设计一种用于大气阻力力矩及姿态控制执行机构存在的乘性、加性故障的估计方法,将获得的扰动及故障估计信息结合类PD 控制器主动补偿,保证姿态跟踪过程的稳定性及精度。
1.1 刚体卫星动力学模型
本文用单位四元数描述卫星的姿态,基于姿态跟踪误差信息的刚体卫星运动学方程和动力学方程如下[23]:
式中:I3∈R3为单位阵为跟踪误差四元数,用以描述星体本体坐标系B 相对于期望姿态坐标系R 的姿态;ωe=ω-Cωd为姿态跟踪误差角速度,用以描述星体实际角速度与期望角速度之间的差值;C为星体本体坐标系B 与期望坐标系R 两坐标系间的方向转换矩阵,并满足为期望姿态坐标系R 相对于惯性系I 的姿态角速度;J∈R3×3为星体转动惯量矩阵且对称正定;u∈R3为刚体卫星的三轴指令控制力矩;d∈R3为外部干扰力矩;操作符a×为以向量a=[a1,a2,a3]T为基础构建的反对称矩阵
性质1.J有界且满足其中ζ∈R3,λm(J)和λM(J)分别代表矩阵J的最小与最大特征值。
1.2 大气阻力力矩描述
考虑到超低轨道卫星受到的大气阻力力矩与太阳光压力矩、地磁矩等相比具有更大的数值[1-2],因此,在超低轨卫星的姿态控制问题中,可将大气阻力力矩视为主要的外部干扰力矩进行研究。
超低轨卫星相应高度空间的大气条件决定了对卫星的入射流可视为平行流,大气阻力力矩总是与姿态相关,其可表示为姿态信息的函数:
式中:Cd为阻力系数;ρ为卫星所处空间区域处的大气密度;Ap为卫星迎流面面积,它取决于卫星姿态;v为卫星相对大气的运动速度大小;L为卫星质心至压心的矢径在星体本体坐标系下的表示;v为来流方向的单位矢量在星体本体坐标系下的表示。
假设1.本文研究超低轨卫星短时间姿态控制问题,在姿态控制期间,大气密度ρ,气动阻力系数Cd和卫星质心至压心的矢径L假定为未知常值。
根据假设1,将外界干扰d拆分为两部分
注1.关于假设1以及d0=CdρL视为定值的原因:研究对象超低轨卫星姿态控制任务一般耗时几分钟甚至只有几十秒,在此期间卫星在轨道空间内仅活动于一片很小的区域,可以认为短时间以及同一片空域内ρ是一个定值;Cd主要取决于星体本身特性,可认为是一个定值。根据自由分子流的假设,航天器各个面所受大气阻力以各自受力面的几何中心为作用点,作用方向则与卫星速度相反,可以假设L是一个定值。
1.3 执行机构故障描述
考虑一类存在执行机构乘性故障和加性故障的超低轨卫星系统,式(3)可改写为
式中:uc为理想指令力矩;Ka=[Ka1Ka2Ka3]T为加性故障项,考虑三轴附加力矩Ka1,Ka2与Ka3均为常值小量的情况;Ku=diag(Ku1,Ku2,Ku3)为乘性故障系数矩阵且为对角矩阵,考虑三轴执行机构失效因子Ku1,Ku2与Ku3均为(0,1)内的常值量的情况。
注2.本文利用并行学习算法进行故障及外界干扰的同时估计,由于超低轨卫星姿态控制任务过程时间较短,仅考虑发生常值故障的情况,不做时变故障情况的研究。
本文设计的考虑外界干扰和执行机构故障的超低轨卫星姿态跟踪控制结构框图如图1所示,意在提供一种干扰及故障估计的新思路。利用并行学习算法设计估计模块对卫星姿态机动过程中存在的大气阻力力矩d与假设存在的故障信息Ku,Ka进行估计,通过结合上述信息,选用工程中常用的类PD 控制器,使系统输出ω,q逼近参考姿态ωd,qd,旨在验证基于并行学习的估计模块在替代基于观测器的补偿控制方法中观测模块的有效性。
图1 考虑外界干扰和执行机构故障的姿态跟踪系统结构图Fig.1 Structure of the attitude tracking system with external disturbances and actuator failures
2 扰动及故障估计
鉴于并行学习辨识算法对常值量估计的优越表现,上述3 个未知量Ku,Ka和d在此基础上进行估计。
该算法应用于估计模块设计之前需要构建回归方程以及设计简单滤波完成信息采集,以此进行大气阻力力矩及故障估计。
首先对于矩阵x∈R3×3及y∈R3,定义以下算子
针对回归方程式(9),为辨识未知常量θ,假设可通过陀螺仪获知系统的角速度,由于角加速度一般无法由传感器获得,采用如下低通滤波方法[21]
式中:η>0 是待设计的滤波参数;Ya,f,Yb,f和Φf分别为Ya,Yb和Φ的一阶滤波值。则新的回归方程可写为
为了获取包含乘性故障Ku、加性故障Ka和未知扰动不变量d0三者集合信息的未知向量θ的估计值,不同于传统的基于观测器的抗扰动或容错控制方法,本方法只需记录有限的激励数据,通过收集有限组过去某时刻的包含星体姿态运动信息和期望姿态信息的滤波值Ya,f,Yb,f及对应同一时刻矩阵Φf的信息,借鉴并行学习自适应策略,求得式(11)中未知部分θ的估计相当于用并行学习估计模块代替了观测器,为解决干扰及故障观测与补偿问题提供了新的思路。
下面是并行学习估计模块具体设计过程:
第1步:已知变化参数Φf(t)的存储。
在并行学习数据的更新过程中,采用文献[16]的数据筛选方法,在存入第一组数据信息Y1,f和Φ1,f后;如果当前数据Φnew,f与存储空间中最后一组存储数据Φend,f满足
则保存当前数据,其中κ是筛选参数。
当存储的数据量等于预留的最大存储空间p时,如果当前数据与最后一组存储数据依旧满足式(12),则删除最旧的数据并保存当前数据。
第2步,筛选与收集适量历史激励信息。
对于线性回归模型中的参数辨识问题,需要系统运行过程中回归矩阵的信息足够丰富,能够为辨识参数产生足够的激励,所以给出以下假设。
假设2.卫星姿态控制过程能够产生估计参数所需的激励信息,通过调整合适的存储空间p和筛选参数κ,对一段时间内Φf(t)信息收集后,能够使得存储信息矩阵满秩。
针对本问题的研究对象,即为
第3步,设计参数估计的自适应律。
求取输出估计误差信息矩阵
以误差信息指导待辨识参数更新。自适应律形式多种多样,不同的自适应律对应的收敛速度也不同,本节根据一种有限时间稳定的参数自适应方法[19]设计以下自适应律:
注3.筛选参数κ的大小反应对激励改变的敏感程度,调大会增加存储数据量达到p个的时间。正定增益矩阵Γ的大小视激励信息矩阵与待估计量的大小而定,可反映估计值的变化快慢。
引理1[24].对于任意的正常数a1,a2,…,an和q∈(0,2),满足下列不等式
引理2[25].有限时间稳定判据:
以下式表征的系统为例
针对系统(17),在原点的某邻域内,若可以找到该系统的某个候选函数V,当它具有如下性质
式中:c与α皆为常数且满足c>0,0 <α<1;此时原点为系统的有限时间快速稳定平衡点,且稳定时间T(X0)满足
记矩阵的最大及最小特征值分别为λM(·)与λm(·),利用性质1和引理1,则有
根据引理2,则有如下结论:
3 控制器设计
本节用并行学习估计模块代替观测器模块,二者可以完成相同的扰动及故障估计工作;这种尝试是在应用最广泛的基于观测器的控制方法的思路上将他领域的方法进行嫁接。
为验证估计算法的有效性并使得图1所示闭环系统能够完成姿态跟踪,本文设计了一种基于并行学习估计补偿的改进型类PD控制律:
式中:-kpev-kdωe表示反馈项部分,kp>0,kd>0;(ωe+Cωd)J(ωe+Cωd)+表示动力学非线性前馈项部分代表气动干扰力矩d的估计值表示加性故障矩阵Ka的估计值表示乘性故障矩阵Ku的估计值。
定理 2.考虑由式(1)、式(2)与式(6)表征的卫星姿态跟踪控制系统,当由式(15)表示的基于并行学习算法的估计器估计误差收敛后,在控制器(25)作用下,姿态控制系统全局最终一致有界。证.定义Lyapunov候选函数为
求导后将式(1)、式(2)、式(6)与式(25)代入则有
即姿态控制系统全局最终一致有界。证毕。
4 仿真校验
为了验证本文估计和补偿方法的有效性,采用仿真的方法,对具有一定代表性的刚体卫星模型进行定量分析和比较。下面针对刚体卫星仿真模型进行强干扰及故障存在情况下的姿态跟踪模拟。
仿真中垂直于卫星横滚轴的投影面积记为A1;垂直于卫星偏航轴的投影面积记为A2;对应地,此时星体受到的大气阻力Fd对应的标量值大小即可记作
当超低轨卫星轨道高度为180 km,求得速度大小为7.796 1 km∕s,大气密度参照NRLMSISE 模型可取为5.464 × 10-10kg∕m3,阻力系数设为2,阻力力臂长度设为0.1 m。超低轨卫星干扰力矩d设计为俯仰角θ的函数,可取为
超低轨卫星存在的乘性故障设定为
加性故障设定为
其他部分仿真参数设定见表1。
表1 姿态跟踪系统参数Table 1 Attitude tracking system parameters
为了验证本文提出方法的有效性及优势,给出两组对比仿真结果。对比一为加入估计模块前后的控制效果比较,对比二为本文方法与传统基于观测器的控制方法估计及控制效果比较。
对比一:仿真结果图2~3 为一组对比仿真,情形A 为采用式(25)中uc(即基于并行学习估计的改进型类PD 控制)作为指令力矩的姿态跟踪过程;情形B 为仅采用式(25)中u1(类PD 控制)作为指令力矩的姿态跟踪过程。为了更加直观地对比仿真结果的差异,依据误差四元数给出了欧拉角跟踪误差变化曲线图(见图3)。
图2 情形A和情形B的角速度跟踪误差Fig.2 Angular velocity tracking errors in case A and case B
图3 情形A和情形B的欧拉角跟踪误差Fig.3 Euler angular tracking errors in case A and case B
从仿真结果图2~3 可以看出,将并行学习估计算法与类PD 控制相结合用于扰动和故障的估计与补偿可显著提高卫星姿态跟踪精度。相较情形B 角速度跟踪精度1.0 × 10-3(°)·s-1,情形A 在姿态跟踪系统收敛后三轴角速度跟踪精度提升至1.0 ×10-4(°)·s-1;相较情形B 中存在的约为2°的欧拉角跟踪误差值,情形A 中三轴欧拉角跟踪误差最大值约为0.08°。由此可见,通过并行学习估计算法针对扰动和故障进行估计并补偿有效地提高了姿态跟踪过程的控制精度。
另外,并行学习估计模块估计误差收敛效果也达到预期,参考图4~6中各待估计量的真实值和估计值变化曲线,各估计值可以有效逼近真实值,其中外界干扰估计误差约为2.5 × 10-4N·m,乘性故障估计误差约为1.3 × 10-3,加性故障值最大估计误差亦收敛到1.0 × 10-4N·m。
图4 情形A的大气阻力力矩及其估计值Fig.4 Atmospheric drag torques and their estimation values in case A
图5 情形A的加性故障及其估计值Fig.5 Additive faults and their estimation values in case A
图6 情形A的乘性故障及其估计值Fig.6 Multiplicative faults and their estimation values in case A
对比二:选择文献[14]中设计的故障重构方法进行对比研究。为了便于比较,其设计的乘性故障重构方法将在情形A的环境下进行数值仿真。控制输出将在式(25)的基础上设计为,记作情形C。
在传统的基于观测器的故障及扰动补偿问题中,通常将大气干扰力矩视为影响故障重构的因素而未被估计。而对于超低轨道环境,较大的大气阻力力矩将严重影响故障重构效果,会将由外部扰动带来的状态估计误差归因于执行机构故障。已验证在较小大气阻力力矩情况下应用文献[14]设计的观测器可以快速完成乘性故障估计。从仿真结果图7 可以看出,在情形A 的环境下,过大的加性故障及大气阻力力矩存在时,乘性故障估计效果较差。由图8 和图 9 可知,情形C 在姿态跟踪系统收敛后三轴角速度跟踪精度为5.0 × 10-4(°)·s-1;三轴欧拉角跟踪误差最大值约为0.5°,相较情形B 的姿态控制效果有明显提升,但情形A 角速度跟踪效果明显优于情形C,且情形A 欧拉角跟踪效果明显优于情形C。本文方法做到了将乘性、加性故障同大气阻力力矩分开估计,以便设计更加简单的控制率进行补偿。除此之外,本文方法不再需要实时的系统状态信息,相较传统观测器减少了系统激励限制。
图7 情形C的乘性故障及其估计值Fig.7 Multiplicative faults and their estimation values in case C
图8 情形A和情形C的角速度跟踪误差Fig.8 Angular velocity tracking errors in case A and case C
图9 情形A和情形C的欧拉角跟踪误差Fig.9 Euler angular tracking errors in case A and case C
5 结论
针对超低轨卫星存在较大大气阻力力矩以及可能存在姿态控制执行机构乘性和加性故障的姿态跟踪控制问题,本文提出了一种基于并行学习算法的估计与补偿控制方法。首先,利用并行学习算法的优势,代替了基于观测器的补偿控制算法中观测器的作用,相较之下做到了无需持续角速度、角加速度和指令力矩信息情况下的干扰与故障准确估计。其次,该方法中估计模块设计时区别于普通观测器,将乘性、加性故障同大气阻力力矩分开估计。再次,将类PD 控制与上述估计信息融合设计了补偿控制律,算法简单,节省星上算力。最后,仿真结果表明,该方法可对姿态控制执行机构故障及大气干扰力矩做到精确估计,完成超低轨卫星高精度姿态控制。