APP下载

基于伪谱重构的采样反馈近最优制导

2016-09-07闫循良廖守亿王仕成

系统工程与电子技术 2016年9期
关键词:变轨交会制导

闫循良, 廖守亿, 王仕成

(火箭军工程大学控制工程系, 陕西 西安 710025)



基于伪谱重构的采样反馈近最优制导

闫循良, 廖守亿, 王仕成

(火箭军工程大学控制工程系, 陕西 西安 710025)

利用采样反馈控制和轨迹快速重构技术,设计了固定采样反馈和自适应采样反馈两种有限推力远程变轨近最优闭环制导策略。建立了空间变轨和交会最优制导数学模型。结合变轨运动方程特征,给出了伪谱优化参数缩减方法和实时性提升策略;基于采样反馈和最优控制理论,利用采样数据进行连续轨迹重构,并将开环最优解进行闭环反馈以更新制导指令。仿真结果表明,两种策略在保证任务指标近最优性的同时,可以有效抑制地球扁率J2摄动和计算误差的影响;自适应采样策略自主性好、制导精度误差收敛快,但计算量和燃耗偏大,二者使用时需要根据具体任务要求合理选择。

远程交会; 闭环制导; 近最优制导; 采样反馈; 伪谱轨迹重构

0 引 言

随着空间任务复杂性和多样性的进一步提高,航天器要求其变轨制导系统和制导律具备良好的自主性、自适应性、鲁棒性和安全性等特点。而经典的冲量变轨制导律以及有限推力非最优制导律[1-5]很难满足以上要求。

目前,为了提高航天飞行任务的可行、可靠和最佳性能,远程变轨轨道设计往往引入最优控制理论,将机动轨道和制导律设计转化为最优控制问题,并采用数值方法进行求解[6-7]。然而,此类制导律多为非闭环形式,制导精度和鲁棒性受实际飞行环境影响较大。随着控制理论和计算软硬件技术的发展,尤其是高性能计算设备的出现,非线性反馈控制理论被引入最优控制领域,如基于伪谱法的最优反馈控制算法[8-9]。该算法利用伪谱法的数值计算优势和采样反馈控制理论,通过实时反馈低采样频率数据实现了高精度的控制,且不需要求解复杂的偏微分方程,因此被广泛应用于飞行器制导、控制问题[10-13]。

基于文献[8-9]的实时反馈控制方法和本人前期工作[13],本文将改进的伪谱方法与采样反馈技术相结合,分别设计了固定采样和自适应采样反馈两种近最优制导策略,并通过有限推力燃耗最优交会制导仿真验证了其可行性和有效性。

1 远程变轨最优制导

1.1运动模型描述

由文献[13]可知,考虑摄动的航天器变轨动力学方程为

(1)

(2)

将式(1)无量纲归一化,得到

(3)

式中,η=Tref/(mrefg0),mref=m0为量纲质量;Tref=Tmax为量纲力;上标“-”表示无量纲化的参数,简便起见,后文均将“-”忽略。相关处理过程及参数定义见文献[13]。

1.2最优交会制导规律设计问题描述

燃料最优往往是空间变轨首要考虑的性能指标。考虑燃料最省交会,有

J=m0-mf→min

(4)

且需要满足运动微分方程约束、端点约束、状态及控制约束,以及推力方向矢量内点路径约束

(5)

最优交会制导律设计问题可描述为:对于给定的飞行工况,设计规划用于航天器变轨机动的最佳T(t)、u(t)等控制参数,保证其在完成预定交会变轨任务的同时,满足精度、燃料最省等指标要求。可见,该问题为一考虑干扰和不确定因素的典型多约束、非线性复杂最优控制问题,其一般描述形式(典型非线性系统)为

(6)

式中,未摄动常量参数p0∈RNp,X(t)⊂RNx,U(t,x(t))⊂RNu分别为相应维数的实数空间;且作如下假设,对容许任意控制u(t)而言,微分方程函数矢量f∈RNx均满足C1-Carathéodory必要条件[8-9]。

将最优控制描述为以下典型形式:寻找组合{x(t),u(t)}及系统参数p0,最小化目标函数

(7)

除典型运动微分方程式(6)外,还需满足式(8)~式(10)所描述的一般形式的非线性复杂代数约束:

(8)

(9)

(10)

由于实际应用中存在参数不确定性因素和外界干扰,对应式(6)的实际非线性系统动力学方程形式为

(11)

式中,ζ(t)为外部干扰;p为实际系统参数常量。

基于文献[8-9]提出的实时最优反馈控制原理,可以对上述问题进行数值求解,在处理不确定性因素和外界干扰影响的同时,实现性能的最优化。即利用采样周期对控制时间区间[t0,tf]分段,顺序解算[ti,ti+1]上的开环最优解u(t)=k(t,x(ti)),依次执行上述开环解,即等价于闭环反馈控制。解的稳定性、连续性等详细讨论见文献[8-9,12]。

2 近最优制导策略设计

2.1改进的伪谱轨迹快速优化设计

由于具备解算实时性高、初值不敏感、解曲线相对光滑等诸多数值解算性能优势[7-8,13-14],伪谱方法(pseudospectral method,PSM),尤其是Legendre-Gauss-Lobatto (LGL) PSM,在最优控制及轨迹优化领域得到了较为广泛的应用[14-15]。本节结合远程机动变轨数学模型特征,根据位置矢量和速度矢量的物理意义和微分关系,通过变量代换等简单代数运算消去LGL PSM中的速度优化参量,并对约束条件进行转换处理,从而达到降低优化变量和约束方程数目,最终提高LGL PSM数值解算效率的目的。

考虑到LGL PSM在τ∈[-1,1]上用Lagrange多项式对状态量和控制量进行拟合,故将时间变量t进行变换:

(12)

将式(3)改写为微分方程组的形式:

(13)

基于LGL PSM将式(13)离散化,得到代数方程组:

(14)

式中,D=[Dki]为(N+1)×(N+1)维微分矩阵。R、V、A、M、T分别为相应变量在LGL点的离散值。故优化变量为X=[RTVTMT]T。

将式(14)的前两式重新改写,有

D1R=V,D1V=A

(15)

得到新的离散化方程为

(16)

其中

(17)

考虑质量离散化方程,得到缩减的待优化变量为X′=[RTMT]T,微分方程约束的离散化形式为

(18)

并有

V=D1R

(19)

经过上述变换,待优化变量消去了状态分量V,由X缩减为X′;与此相对应,离散化的微分方程约束则消去了与V有关的矢量方程,由式(14)变为式(18)。结合V的物理意义知其维数为3(N+1),因此,待优化变量和总约束均缩减了3(N+1)。可见,变换处理后,伪谱解算效率和算法的实时性均将会显著提高。

2.2近最优闭环制导策略

如图1所示,本节设计了固定采样和自适应采样反馈两种闭环近最优制导策略。

图1 闭环近最优制导策略框图Fig.1 Closed-loop near optimal guidance frame

开环轨迹离线生成模块通过离线解算,为首次在线轨迹重构提供初值,从而保证算法的计算效率和优化收敛性能;数据处理及存储模块用于实现在线优化结果的存储和控制指令的映射插值;真实动力学模型模块主要进行运动方程积分、状态测量和飞行模拟;制导逻辑模块则通过对状态偏差的分析,完成是否执行轨迹重构判断;状态预报模型模块主要用于预报下一采样时刻的状态数据。其中,仅固定采样反馈策略需要用到状态预报模型。

2.2.1固定采样反馈近最优制导策略

设采样周期为Δt,采样时刻ti+1=ti+Δt。

步骤 2执行制导算法控制逻辑模块:

(20)

式中,范数‖·‖均取2范数‖·‖2进行计算。

对于终端状态而言,有

(21)

对于过程状态条件,有

(22)

ε偏差球由具体任务要求决定,同时取决于制导系统的硬件设备性能。

逻辑判断执行过程:若式(21)成立,意味着终端精度达到预定指标,闭环制导任务完成,即无需继续执行轨迹重构解算,而是保持当前制导指令变轨飞行至任务结束;式(21)不成立时,若式(22)成立,则表明当前测量状态与前一次优化状态满足偏差要求,则继续积分运动方程而不进行轨迹重构,即转到步骤1;否则,转至步骤3;

2.2.2自适应采样反馈近最优制导策略

步骤 1与第2.2.1节步骤1相同。

步骤 2与第2.2.1节步骤2相同。

3 算例及分析

本节开展燃料最省近地轨道远程空间交会制导仿真。表1给出了交会双方航天器的轨道根数。其余仿真条件设置如下:追踪航天器初始质量m0=1 000 kg,携带燃料质量mp=400 kg,有限推力发动机相关参数为比冲Isp=300 s,推力极值Tmax=500 N。

表1 相关初始轨道根数

仿真用台式计算机配置:E7500/2.93GHzCPU,2G内存,编程环境为Matlab。初值生成器[7]的初始节点数目N1=5,离线及在线重构所用的多节点数目均取N2=25。基于序列二次规划(sequencequadraticprogram,SQP)优化软件包SNOPT对该问题数值求解。

为了验证本文制导算法的精度、鲁棒性等性能,制导仿真重点考虑地球扁率J2摄动、计算误差、预报误差等影响,即轨迹重构和状态预报不考虑J2摄动,而只在模拟实际飞行过程中考虑。固定采样周期Δt需要结合任务要求和弹载计算机性能进行选择。初步计算后,根据优化计算需求,本文保守选取Δt=10s。由于无法真正获取实际工程中对位置和速度偏差的精度要求,故人为选取了一组偏差球参数来验证算法的有效性,其中,εrm=5m,εvm=0.05m/s,εrf=50m,εvf=0.5m/s。

表2给出了开环制导(用OL表示)、固定采样反馈闭环制导(用FSP表示)、自适应采样反馈闭环制导(用ASP表示)的仿真结果。飞行结束tf时刻的质量、位置及速度偏差分别用mf、Δrf、Δvf表示,Tg为闭环反馈制导连续轨迹重构结束时对应时刻,该时刻表征了制导解算的结束时间。图2给出了部分情况对应的状态轨迹、制导指令结果对比。

表2 不同制导策略的仿真结果

图2 不同情况的制导仿真结果对比Fig.2 Results comparison of different guidance schemes

由表2可知,采用离线轨迹优化得到的控制指令进行开环制导,无论有无J2摄动交会误差均较大,考虑J2影响时位置和速度误差分别达到5 833m和3.76m/s。究其原因,主要有以下几方面:①轨迹优化所用离散节点数目较少;②积分计算等数值误差的积累;③最优控制曲线的光滑程度较差、对其插值所用方法精度较低。

通过表2不难发现,两种闭环制导策略交会精度得到显著提高,均满足所设定的偏差球要求,即位置偏差不大于50m,速度偏差不大于0.5m/s,但为了修正制导误差,二者交会时间均有一定的增加。分析闭环制导策略可知,闭环制导一方面通过轨迹重构增加了积分过程所对应的优化离散节点数目,另一方面,连续采样和轨迹重构减小了积分计算误差的积累,因此能够弥补开环制导的前两条不足,以提高制导精度。由表2亦可知,对于闭环制导策略而言,在满足速度偏差要求时,有无J2摄动的位置误差不同,如对于ASP闭环制导而言,无J2摄动的位置误差为48.55m,而有J2摄动时为12.52m。分析可知,考虑J2摄动时,对于所设定的偏差球误差要求,位置误差收敛速度较快,待位置误差满足要求后,继续进行轨迹重构计算,直至速度误差满足要求,此时位置误差已得到进一步改善。

由图2(d)可知,闭环制导对应的控制指令连续性和光滑性较差,其局部放大图如图3所示。实际上,除了燃料最优所具有的近似“bang-bang”控制特性外,控制指令的不连续和非光滑性体现了摄动和计算误差的影响。由于摄动和误差的存在,连续采样和轨迹重构得到的开环控制初始条件与上一次最优解并不一致,故使得闭环制导控制指令存在明显的不连续和不光滑,这也体现了闭环制导对开环最优控制的不断修正。考虑有些实际任务对控制指令光滑性要求较高,可以通过引入控制指令变化率约束,并在采样点施加连续性条件加以改进。

图3 控制指令局部放大图Fig.3 Local enlarged drawing of control command

此外,分析表2及图2可知,ASP策略制导精度误差收敛速度优于FSP策略,对应燃耗和交会时间则具有劣势。不考虑J2摄动时,ASP策略在进行639.74s制导计算后即可保证以给定精度完成交会任务,而FSP策略制导计算时间则为1 060s,即前者比后者提前420.26s完成制导解算任务,若考虑J2摄动,提前时间为21.05s。相应地,与FSP策略相比,ASP策略燃耗代价较大,分别增加0.15kg和14.92kg。与此同时,ASP策略所需的交会时间有一定的增加,分别增大0.23s和3.42s。

表3给出了不同制导策略连续轨迹重构的CPU耗时统计结果,可见,两种制导策略的单次CPU耗时最大值tmax均不超过10s,平均CPU耗时tave均小于1s,具有较好的实时性和在线应用潜力;ASP策略轨迹重构次数Iter较多,但单次CPU耗时较小,故在保证反馈更新周期自适应调整的同时,具有更好的在线应用潜力。

表3 闭环制导轨迹重构CPU耗时统计

可见,ASP制导策略具有更高的自主性,精度误差收敛性优于FSP策略,但燃耗代价偏大,所需交会时间偏长;单次CPU耗时较少,但轨迹重构次数较多,计算量偏大。因此,可结合交会精度误差收敛速度、燃耗、交会时间、轨迹重构次数和单次CPU耗时等要求进行闭环制导策略的选择应用。

4 结 论

基于采样反馈控制理论和轨迹重构算法,针对空间远程交会问题,本文设计了两种闭环近最优制导策略。仿真结果表明:

(1) 与传统的轨迹跟踪制导方法不同,本文的两种闭环制导策略均无需进行参考轨迹跟踪和控制增益调整,而是通过在线轨迹重构技术进行闭环指令反馈更新,以实现对地球扁率J2摄动偏差和计算误差影响的修正,而改进的伪谱轨迹优化算法保证了轨迹重构的实时性能,故所提闭环制导策略具有较高的精度,较好的自主性、鲁棒性和实时性,以及在线应用潜力;

(2)ASP制导策略的采样时间可随飞行状态进行自适应调整,具有更高的自主性,精度误差收敛性优于FSP策略,但燃耗代价偏大,所需交会时间偏长,轨迹重构次数较多,计算量偏大,因此在应用时需要根据具体情况进行选择。

[1]ZarchanP.Midcouseguidancestrategiesforexoatmosphericintercept,AD-A355820[R].CambridgeMA:CharlesStarkDraperLaboratory, 1998.

[2]ChenF,XiaoYL,ChenWC.Guidancebasedonvelocity-to-be-gainedsurfaceforsuper-rangeexoatmosphericintercept[J].Acta Aeronautica et Astronautica Sinica, 2010, 31(2): 342-349. (陈峰, 肖业伦, 陈万春. 基于需用速度增益曲面的大气层外超远程拦截导引方法[J].航空学报, 2010, 31(2): 342-349.)

[3]NewmanB.Strategicmidcourseguidanceusingmodifiedzeroeffortmisssteering[J].Journal of Guidance, Control, and Dynamics, 1996, 19(1): 107-112.

[4]ShangHB,CuiPY,LuanEJ.Guidancestrategyforlow-thrusttransfertrajectoriesbasedonoptimalstatesfeedbacktechnology[J].Journal of Jilin University, 2007, 37(4): 949-954. (尚海滨, 崔平远, 栾恩杰. 基于最优状态反馈的小推力转移轨道制导策略[J].吉林大学学报, 2007, 37(4): 949-954.)

[5]ZhuZX,JinW,HanP.Anewguidancemethodusinglinearizedgravitationalfield[J].Journal of Northwestern Polytechnical University, 2012, 30(2): 181-186. (朱战霞, 金伟, 韩沛. 一种基于引力场线性化的制导方法[J].西北工业大学学报, 2012, 30(2): 181-186.)

[6]GaoY,LiWQ.Systematicdirectapproachforoptimizingcontinuous-thrustearth-orbittransfers[J].Chinese Journal of Aeronautics, 2009, 22(1): 56-69.

[7]YanXL,LiaoSY,ZhangJS,etal.Trajectoryoptimizationusingpseudospectralmethodbasedonagridnodesrefinementstrategy[J].Journal of Astronautics, 2013, 34(7): 891-900. (闫循良, 廖守亿, 张金生, 等. 基于节点改善策略的伪谱轨迹优化[J].宇航学报, 2013, 34(7): 891-900.)

[8]RossIM,SekhavatP,FlemingA,etal.Optimalfeedbackcontrol:foundations,examples,andexperimentalresultsforanewapproach[J].Journal of Guidance, Control, and Dynamics, 2008, 31(2): 307-321.

[9]RossIM,GongQ,FahrooF,etal.Practicalstabilizationthroughreal-timeoptimalcontrol[C]∥Proc. of the American Control Conference, 2006:1-6.

[10]YanH,RossIM,AlfriendKT.Pseudospectralfeedbackcontrolforthree-axismagneticattitudestabilizationinellipticorbits[J].Journal of Guidance, Control, and Dynamics, 2007, 30(4): 1107-1115.

[11]BollinoKP,RossIM.Apseudospectralfeedbackmethodforreal-timeoptimalguidanceofreentryvehicles[C]∥Proc. of the IEEE American Control Conference, 2007: 3861-3867.

[12]ZhangYA,WangLY,ZhaoGR.Pseudospectral-basedfreesamplingreal-timeoptimalfeedbackcontrolanditsapplication[J].Control Theory & Applications, 2012, 29(9): 1151-1156. (张友安, 王丽英, 赵国荣. 基于伪谱法的自由采样实时最优反馈控制及应用[J].控制理论与应用, 2012, 29(9): 1151-1156.)

[13]YanXL,LiaoSY,HeT,etal.Modifiedpseudospectralfeedbackcontrolbasedclosed-loopguidanceforlong-rangeorbitmaneuver[J].Journal of Astronautics, 2016, 37(1): 84-93. (闫循良, 廖守亿, 何泰, 等. 基于改进伪谱反馈控制的远程变轨闭环制导[J].宇航学报, 2016, 37(1): 84-93.)

[14]GargD,PattersonMA,HagerWW.Anoverviewofthreepseudospectralmethodsforthenumericalsolutionofoptimalproblems[J].Adances in the Astronautical Sciences,2009,135:1-17.

[15]RossIM,GongQ,SekhavatP.Low-thrust,high-accuracytrajectoryoptimization[J].Journal of Guidance, Control, and Dynamics, 2007, 30(4): 921-933.

Sampled-data feedback control for near optimal guidance via pseudospectral trajectory reconfiguration

YAN Xun-liang, LIAO Shou-yi, WANG Shi-cheng

(DepartmentofControlEngineering,RocketForceUniversityofEngineering,Xi’an710025,China)

Two closed-loop near optimal guidance schemes, which are based on sampled-data optimal feedback control and pseudospectral trajectory reconfiguration, are studied and proposed for long-range rendezvous with finite thrust. They are defined respectively as the fixed sampling period(FSP) feedback and adaptive sampling period(ASP) feedback schemes according to different sampling period. Firstly, the dynamics model and fuel-optimal guidance problem are described. Combining the characteristics of the dynamics model with the pseudospectral method, a computational efficiency refinement method with the reduced state parameters, is proposed to improve the efficiency of trajectory optimization. Starting from the sampled-data optimal feedback control theory, the control command for closed-loop guidance can be updated and fed back continuously through successive trajectory reconfiguration using sampled data. The Simulation results indicate that the algorithms can not only supply excellent near optimal solution for practical mission, but can manage numerical errors, disturbances, and the J2 perturbation. Furthermore, the adaptive sampling period guidance scheme is not only more autonomous, but it has a better convergence for guidance accuracy with higher computation and fuel expense. Consequently, a favorable decision should be made for two schemes in application.

long-range rendezvous; closed-loop guidance; near optimal guidance; sampled-data feedback; pseudospectral trajectory reconfiguration

2015-06-03;

2016-03-23;网络优先出版日期:2016-06-22。

中国博士后科学基金特别项目(2014T70974)资助课题

V 421.4

A

10.3969/j.issn.1001-506X.2016.09.23

闫循良(1984-),男,讲师,博士,主要研究方向为飞行动力学与控制、制导及轨迹优化。

E-mail:xly_nwpu@126.com

廖守亿(1974-),男,副教授,博士,主要研究方向为飞行器制导、复杂系统建模与仿真。

E-mail:6127725@qq.com

王仕成(1962-),男,教授,博士,主要研究方向为飞行器制导、控制与仿真。

E-mail:wsc@vip.163.com

网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160622.1118.002.html

猜你喜欢

变轨交会制导
2019年,水交会来了!
基于MPSC和CPN制导方法的协同制导律
基于在线轨迹迭代的自适应再入制导
“朱诺”变轨时间将推至明年2月
立方体星交会对接和空间飞行演示
例析人造卫星的圆周运动及变轨问题
人造卫星变轨问题
带有攻击角约束的无抖振滑模制导律设计
卫星“在轨运行”与“变轨运行”的特点分析
一切以交易的名义——首届黑马创交会揭秘