基于径向基函数神经网络与扩张状态观测器的无人直升机控制
2021-10-10侯捷,陈谋,刘楠
侯 捷,陈 谋,刘 楠
(南京航空航天大学自动化学院,江苏南京 211106)
1 引言
无人直升机具有轻便,能够垂直起降、空中悬停、灵活飞行等特点,并可根据任务需求搭载各种载荷,具有广阔的应用前景,是目前国内外研究的热点.由于无人直升机的运动学和空气动力学问题较为复杂,因而高性能飞行控制是无人直升机研究的重要内容之一.无人直升机具有高度的非线性和复杂的动力学特性,并且其操纵通道多、耦合较强,是一种稳定性较差、控制较难的欠驱动飞行器,其飞行控制相比固定翼无人机与多旋翼无人机更为困难[1].由于无人直升机难以进行精确建模,且通常在无人直升机悬停状态下完成建模,所得到的模型较难涵盖机动中直升机的特性,并且模型中的各项参数在测量时也不可避免地出现各种偏差或难以获取.由此可以看出无人直升机的数学模型存在不确定性,若使用需要精确数学模型的控制方法,如动态逆等,势必会造成控制精度不高、存在稳态误差等问题.因而为获得更好的控制效果,需要对系统不确定性进行有效处理.
针对系统不确定性问题,文献[2]提出使用一种基于强化学习与超螺旋相结合的非线性控制算法提高无人直升机系统的鲁棒性.文献[3]采用神经网络增强无人直升机姿态控制回路鲁棒性能,并采用二型非劣排序遗传算法(non-dominated sorting genetic algorithm II,NSGA–II)对神经网络调参进行优化,取得了较好的控制效果.文献[4]针对无人机状态观测以及输出反馈控制等多个问题使用神经网络进行飞行控制器设计,以降低外部干扰和内部建模误差对飞行控制的影响.针对现有方法对直升机动力学模型的先验信息依赖较大的问题,文献[5]基于增强学习提出了一种无人直升机姿态控制方法.文献[6]基于类脑发育技术提出了一种无人机的防碰撞控制方法,并进行了算法验证.为处理建模不精确问题,文献[7]使用基于神经网络的增量非线性动态逆方法对无人机姿态进行控制.文献[8]研究了基于神经网络的有限时间反步控制以解决在未知输入饱和下的四旋翼无人机轨迹跟踪和姿态控制问题.文献[9]将递归小波神经网络与反步滑模控制方法相结合,降低了六旋翼无人机模型不确定性对飞行控制的影响.文献[10]使用了自适应神经网络配合周期性事件触发控制律对一类非线性切换系统进行控制,通过神经网络避免了控制器对系统切换信号的依赖.此外神经网络在无人机受损后控制[11]和编队飞行控制[12]等方面也有具体应用.以上成果表明神经网络在无人飞行器控制中得到了深入研究,但神经网络在逼近过程中存在逼近误差,并且在无人直升机的飞行过程中,会受到阵风等外部干扰因素影响,导致控制器控制精度下降,甚至失稳等问题,所以抗干扰性能是控制器设计时的一个重要考量.为了提升系统的抗干扰能力,需要在控制器设计时引入专门的方法以补偿干扰对系统的影响.
为解决上述两个问题,对系统干扰进行估计并补偿到控制器中是一种应用较多的策略,常见的干扰观测器设计方法包括基于名义逆模型的干扰观测器、非线性干扰观测器和扩张状态观测器(extended state observer,ESO)等.ESO相较于前两者对原系统模型精确性要求更低且不会向系统中引入高频噪声[13].ESO是自抗扰控制技术的核心之一,其借用状态观测器的思想,将系统所受扰动等扩张成新的状态变量,并对该状态变量进行观测.文献[14]采用ESO观测六自由度无人直升机所受外部干扰,以增强滑模控制器的抗扰能力.文献[15]使用基于ESO的反步法控制器以补偿无人直升机所受的阵风影响.在文献[16–17]中也使用了ESO结合其他控制方法,以提高无人直升机的抗扰能力与鲁棒性.
本文对上述方法进行了控制仿真,并与传统动态逆控制方法进行了对比,仿真结果表明所设计的基于径向基函数神经网络(radial basis function neural network,RBFNN)和ESO 的控制方法有效性.
2 问题描述
2.1 受不确定性和外部干扰影响的直升机模型
本文根据无人直升机的特点,在文献[18]基础上,忽略机体产生弹性振动与形变,假设无人直升机是一个对称的六自由度刚体,则机体惯性积IxyIyz0.根据牛顿―欧拉方程,无人直升机的仿射非线性模型描述如式(1)所示:
式中:C表示余弦函数,S表示正弦函数,T表示正切函数;P[x y z]T为无人直升机在地面坐标系下的位置;V[u v w]T为无人直升机在地面坐标系下的速度;Θ[ϕ θ ψ]T为机体坐标系中的直升机滚转角、俯仰角、偏航角;Ω[p q r]T为机体坐标系中直升机三轴角速度;Υ[a b]T为主旋翼挥舞角,a为后倒角,b为侧倾角;F[FxFyFz]T为无人直升机机体坐标系下3个方向的合力,悬停状态下F[0 0Tmr]T,Tmr为无人直升机主旋翼拉力;u[a b Ttr]T为无人直升机姿态角速率回路控制输入,Ttr为无人直升机尾旋翼拉力;T[TaTb]T为无人直升机挥舞运动控制输入;fi为系统函数向量,gi为系统函数控制增益矩阵,i1,2,3,4,5;g为当地重力加速度;Ixx,Iyy,Izz为无人直升机绕机体坐标轴的3个惯性矩;Cm为主旋翼刚度系数;Qmr为主旋翼反扭距;L[LxLyLz]T为主旋翼中心到无人直升机重心的三轴距离;H[HxHyHz]T为尾旋翼中心到无人直升机重心的三轴距离;τs是旋翼有效时间常数;Alon和Blat分别为纵向和横向有效稳定增益.
在式(1)的基础上,进一步考虑V,Θ和Ω子系统中存在不确定性,即
对式(1)中gP,gV,gΘ,gΩ和gΥ进行分析,易得4个矩阵的行列式分别为
由式(3)可知,在使用实际无人直升机参数时,gP,gV,gΘ,gΩ和gΥ均存在逆矩阵.
2.2 控制目标
本文的目标为设计基于RBFNN与ESO的无人直升机鲁棒飞行控制律,使得式(1)描述的无人直升机在受到系统不确定性和外界干扰综合影响下能跟踪给定的期望信号.为便于控制律设计,给出以下引理与假设.
引理1在有界的初始条件下,如果存在一个C1连续且正定的Lyapunov函数V(x)满足π1(‖x‖)≤V(x)≤π2(‖x‖),使得≤−κV(x)+c,其中:π1,π2:Rn →R 为一类K∞函数;κ,c为正常数,则函数V(x)的解x(t)一致有界[19].
引理2RBFNN可用于逼近连续函数f(Z):Rq→R,其表达式如下:
式中:Z[z1z2··· zq]T∈Rq为RBFNN的输入向量;ϕ(Z)[ϕ1(Z)ΦV(Z)··· ϕp(Z)]T∈Rp为基函数;∈Rp为权值向量;ε为RBFNN的逼近误差.存在一个最优权值向量W∗,使得
式中:ε∗为最优逼近误差;0为RBFNN逼近误差的上界[19].
假设1时变未知外部干扰d1(t)与d2(t)及其导数有界.
假设2对于t>0,存在已知正常值M0,使得无人直升机位置回路期望跟踪信号Pc满足如下集合[20]:
假设3无人直升机的滚转角ϕ与俯仰角θ位于区间(−)[20].
3 控制律设计
针对无人直升机数学模型的不确定性,采用RBFNN对其进行逼近,同时对神经网络估计误差和系统外部干扰使用ESO进行估计,具体设计过程如下.
3.1 位置回路控制律设计
考虑式(1)中无人直升机的位置系统:
则可定义跟踪误差:
式中:Pc[xcyczc]T为无人直升机期望轨迹输入;Vc[ucvcwc]T为位置子系统的虚拟控制律.
对eP求导可得
由式(9)可设计虚拟控制律Vc为
式中KP为设计的正定矩阵.将式(10)代入式(9)可得
对eV求导:
针对Vc求导,使用动态面控制方法以避免直接求导计算量过大等问题.引入一阶滤波器λV,使Vc通过如下滤波器[21]:
式中tV>0为滤波器设计参数.由式(13)可得滤波误差
对eλV求导可得
式中MV(,eP)为ΠV(,eP)上的光滑函数向量,则由文献[22]可知,MV(,eP)存在一个上界
针对ΔfV,设计使用RBFNN进行逼近,并由ESO跟踪RBFNN的逼近误差和系统外部干扰,如式(16)所示:
参考文献[23],定义
则式(17)可改写为
ηVi >0,i1,2,3为设计常数.若选取
则易得AVi为Hurwitz矩阵,因此可知,存在一个对称正定矩阵PVi,i1,2,3满足如下方程:
式中:Q为正定矩阵,设计为2I.
定义GV−gV·m·[0 0 1]T,则根据式(1)中F[0 0−Tmr]T,速度子系统模型可修改为
由上式可以设计速度控制律为
式中KV>0为待设计控制器增益矩阵,控制器设计的主要目标是为了使eV收敛,从而保证速度子系统能够跟踪上期望信号.由式(21)可得
神经网络自适应律设计如下:
式中:ΛV>0,σV>0为设计常数.
取GVTmr[F1F2F3]T,给定偏航角期望信号ψc,定义θc,ϕc为无人直升机姿态回路的参考信号,则按θc,ϕc和Tmr的顺序求解可以得到[24]
定义γi[γ1i γ2i]T,对位置子系统,选择如下Lyapunov函数:
则V1关于时间求导可得
通过前文对位置子系统跟踪误差、滤波器误差和神经网络的分析,可以得到如下不等式:
上式中第2项和第3项有如下不等式:
式中MVPB≥‖PViBVi‖‖ΦVi‖.
由假设1可知,存在δVi≥‖li‖,MVPC‖PViCVi‖,τV1>0和τV2>0为设计参数.
将式(33)–(34)代入式(32)可得
综合式(27)–(37),则式(26)可改写为
3.2 姿态回路控制律设计
考虑式(1)中无人直升机的姿态系统:
定义跟踪误差:
式中:Θc[ϕcθcψc]T为无人直升机期望姿态角信号;Ωc[pcqcrc]T为姿态角系统的虚拟控制律.
针对姿态回路中的不确定性ΔfΘ和ΔfΩ,分别设计使用RBFNN进行逼近,并由ESO观测RBFNN的逼近误差.同时,姿态角速率回路中的外界干扰d2(t)也由角速率系统ESO一并观测.如式(39)–(40)所示:
式中:
同样的,为避免直接求导,引入一阶滤波器λΘ与λΩ:
式中tΘ>0和tΩ>0为设计参数.
定义eλΘλΘ−Θc,eλΩλΩ−Ωc.分别对eλΘ,eλΩ求导:
式中MΘ,MΩ分别存在上界
由式(39)和式(47)设计姿态角虚拟控制律:
式中KΘ为待设计正定矩阵.
设计姿态角速率控制律:
式中KΩ>0为待设计控制器增益矩阵.对式(50)和式(51)分别选取神经网络自适应律为
将V2关于时间求导可得
对eΘ和eΩ求导,考虑:
式中:MΘP1,i,MΩP1,i,MΘP2,i和MΩP2,i的形式与式(35)中类似,包含设计参数τΘ1>0,τΘ2>0,τΩ1>0和τΩ2>0.
综合上述分析可以得到如下不等式:
3.3 挥舞运动控制律设计
取gΩu[U1U2U3]T,由式(1)和式(51)可得
式中ac和bc为无人直升机主旋翼挥舞运动的参考信号.则考虑式(1)中主旋翼挥舞运动系统:
定义挥舞角期望信号Υc[acbc]T,则挥舞角运动的跟踪误差为
在控制器的设计过程中,为避免对主旋翼挥舞运动的参考信号直接求导,引入一阶滤波器:
式中tab>0为设计参数.定义eλabλab−Υc,对eλab求导可得
式中Mab存在上界
设计挥舞运动控制律:
式中KΥ>0为待设计控制器增益矩阵.
对无人直升机挥舞运动系统设计如下Lyapunov函数:
将V3关于时间求导可得
3.4 稳定性分析
综合上述基于RBFNN与ESO的无人直升机飞行控制设计,可以得到如下定理.
定理1考虑由式(1)–(2)表达的具有系统不确定性和外部有界干扰的无人直升机非线性模型,神经网络自适应律按式(23)(52)设计,ESO设计为式(16)(39)的形式.通过适当选取设计参数,则所设计的基于RBFNN与ESO的控制器(10)(21)(50)–(51)和式(65),可以使无人直升机的闭环系统误差信号最终均一致有界,实现对给定期望信号的跟踪.
证对于无人直升机位置和姿态回路组成的闭环控制系统,选取Lyapunov函数:
结合式(36)(59)和式(67),对V4求导:
则由式(69)与引理1可得,当参数选取合理时,有
证毕.
3.5 控制器设计算法
综合第3节的论述,本文所提出的基于RBFNN与ESO的无人直升机非线性控制律的设计算法如下:
步骤1确定系统期望信号Pc,系统存在的不确定性ΔfV,ΔfΘ,ΔfΩ与外部干扰d1(t),d2(t);
步骤2根据位置系统的跟踪误差eP,eV设计位置虚拟控制器如式(10)所示,KP取值为KP>
步骤3通过对eV进行分析,根据式(12),引入一阶滤波器tV避免对Vc直接求导,滤波器参数tV为三阶对角矩阵,矩阵元素取值范围为(0,1);
步骤4针对ΔfV,使用RBFNN逼近.RBFNN参数σV>0的选取根据神经网络的学习率取值经验选定取值范围为(0,1),ΛV>0则根据仿真效果调整;
步骤5设计ESO估计D1.ESO的参数设计使用极点配置思想,由式(18)选定参数k2i >0和ηVi >0,以保证式(18)中AVi是Hurwitz的;
步骤6综合步骤3–5可以设计速度控制器如式(21)所示,控制器参数
并通过式(21)可以求解姿态角和Tmr的期望信号如式(24);
步骤7根据式(24)的期望信号,形同步骤3–6设计姿态角虚拟控制器式(50)以及滤波器参数tΘ,ESO参数k3i与ηΘi和RBFNN的参数σΘ与ΛΘ.KΘ取值为
步骤8姿态角速率控制器式(51)和滤波器参数tΩ、ESO 参数k4i与ηΩi和RBFNN的参 数σΩ与ΛΩ也根据步骤3–6进行类似设计.KΩ取值为
步骤9通过姿态角速率控制器可以求解挥舞角与尾旋翼拉力的期望信号如式(60),由此设计挥舞角控制器式(65).滤波器参数tab设计与前述类似,
4 仿真分析
为验证本文提出的控制方法有效性,以文献[25]中无人直升机数据为依据进行仿真验证.直升机的初始状态为悬停,设直升机姿态角速率系统的不确定性为ΔfΩ,姿态角系统的不确定性为ΔfΘ0.3 sin(0.2πΘ),速度系统的不确定性为ΔfV0.25×sin(0.3πV),系统外部干扰为
选取控制器参数
ESO的参数设计参考了文献[26]的思想,将姿态角速率、姿态角以及速度控制回路ESO的极点均配置在−10.ESO的参数选取为
RBFNN的参数设计为
动态面控制的滤波器时间常数设计tVtΘtΩ0.2I3×3,tab0.2I2×2.
无人直升机系统跟踪“8”字形轨迹的能力是检验无人直升机飞行控制器跟踪能力的一种常用的手段.定义偏航角期望ψd0,选取带爬升速率的“8”字型飞行轨迹,则其表达式为
使用上述期望信号进行仿真,无人机初始位置设为(10,0,0),由于本文的控制方法主要基于动态逆控制,因此仿真时将其引入作为对比,仿真时两种控制律受到的外部干扰与内部系统不确定性均相同,动态逆控制器的增益也与本文中选取的控制器参数KP–KΥ相同,仿真结果如图1–2.
图1 三维轨迹跟踪曲线Fig.1 3-D trajectory tracking result
从三维曲线仿真结果可看出,相较于动态逆控制,本文提出的控制器能有效控制无人直升机跟踪期望轨迹,且受系统不确定性与外界干扰影响较小.
为更细致地说明本文提出的控制器效果,下面以滚转角控制为例,固定俯仰角和偏航角输入为0,对滚转角输入幅值为0.5,频率为0.15 Hz,经过一阶滤波器平滑的方波信号指令进行仿真.无人直升机滚转角起始值为−0.5 rad.仿真结果如图3–7所示.其中,图3为无人直升机滚转角对上述方波信号的跟踪输出曲线,并加入了动态逆方法的跟踪输出曲线进行对比.由图3可见,在跟踪方波指令时,动态逆控制方法受系统不确定性与外界干扰影响较大,响应结果产生了较大误差,而在引入RBFNN与ESO 后,系统鲁棒性与抗干扰能力明显增强.
图2 三维轨迹跟踪曲线顶视图Fig.2 3-D trajectory tracking result in top view
图3 滚转角ϕ的跟踪曲线Fig.3 Roll angle(ϕ)tracking result
图4–5给出了滚转角与滚转角速率系统的RBFNN对系统不确定性的逼近输出曲线,由图可知,在本文给出的设计下,RBFNN可以有效逼近系统不确定性.
图4 滚转角速率系统不确定性RBFNN逼近曲线Fig.4 RBFNN response of roll angle angular velocity system uncertainty
图5 滚转角系统不确定性RBFNN逼近曲线Fig.5 RBFNN response of Roll angle system uncertainty
图6–7给出了无人直升机滚转通道的ESO对系统所受干扰的跟踪曲线,可以看出本文设计的ESO能有效估计外部干扰与神经网络的逼近误差.受方波信号上升和下降沿影响,图7中出现的多个振荡.
图6 滚转角速率系统干扰ESO跟踪结果Fig.6 ESO tracking result of the disturbance of roll angle angular velocity system
图7 滚转角系统干扰ESO跟踪结果Fig.7 ESO tracking result of the disturbance of roll angle system
从仿真结果可以看出,本文使用神经网络与扩张状态观测器增强无人直升机闭环系统控制性能是可行的,可以有效提高系统鲁棒性与抗干扰能力.
5 结论
针对无人直升机非线性系统存在不确定与外界干扰的问题,本文引入径向基神经网络逼近系统不确定性,再由扩张状态观测器估计神经网络的逼近误差与系统所受外部干扰.利用神经网络和扩张状态观测器的输出,提出了一种鲁棒自适应飞行控制方法.仿真结果表明,本文设计的控制律相比传统动态逆控制有效提高了系统抗干扰能力与鲁棒性,并弱化了对系统精确建模的需求.