APP下载

面向输出约束基于神经网络观测器的发射平台输出反馈控制

2023-08-08宋秋雨胡健姚建勇白艳春杨正银

兵工学报 2023年7期
关键词:单元格观测器权值

宋秋雨, 胡健,2, 姚建勇, 白艳春, 杨正银

(1.南京理工大学 机械工程学院, 江苏 南京 210094; 2.中南大学 高性能复杂制造国家重点实验室, 湖南 长沙 410083)

0 引言

电机驱动的发射平台是典型的机电一体化伺服系统,通常由传感器(如光电编码器)、作动器(如交流伺服电机)、机械传动机构(如转塔、机架、减速机等)、负载和控制器组成[1],同时也是一个典型的多变量强耦合非线性系统。发射平台主要用于发射动能载荷、击中目标,广泛应用于军事和民用领域,如防空反导打击入侵目标、人工降雨击中目标积雨云等。如何提高发射平台的跟踪精度和鲁棒性,一直是国内外学者研究的热点问题。目前,提高发射平台的综合控制性能主要面临以下挑战:1)动载荷发射时,会产生强烈的燃气气流冲击力矩以及不平衡力矩,对系统产生强烈的瞬态外部干扰;2)动载荷发射后,系统惯量、不平衡转矩等许多重要的参数会发生显著变化,严重影响系统的控制精度和后续载荷的发射精度。这些也是所有机电伺服系统共有的挑战。为了解决以上问题,近几十年来国内外学者发展了众多高性能非线性控制方法,例如反馈线性化控制[2]、滑模控制[3]、自适应鲁棒控制[4]、自抗扰控制[5]等。

对于已知的非线性,可以采用反馈线性化技术。然而,无论动态非线性和参数辨识的数学模型如何精确,都不可能捕捉到整个非线性行为和实际非线性效应的精确参数,从而对其进行完美的补偿。系统总是存在参数偏差(一种建模不确定性)和显式函数无法表达的未建模不确定性。

为了减少参数不确定性的影响,自适应控制器被广泛应用[6-7]。然而,这些控制器很少处理未建模的不确定性。而且在某些情况下,未建模不确定性可能是发展高精度跟踪控制的主要障碍,因此自适应控制会导致系统的基本性能退化,甚至不稳定。鲁棒控制作为另一种选择,为了减弱物理系统中的干扰,也已被一些研究者研究[8-9]。例如,文献[10-11]将滑模控制应用于火箭炮变负载特性和抗燃气流冲击力矩的鲁棒控制中,取得了较好的控制效果,但并未考虑安装平台的刚度和动力学、运动学因素的影响,也没有明确考虑参数不确定性。

为了在一个控制器中同时处理建模和未建模的不确定性,有相关学者提出了自适应鲁棒控制(ARC),并将其应用于多个被控对象中。特别是在文献[12]中,研究人员给出了具有各种约束条件的主动悬架系统ARC设计方法。这些ARC控制器保证了给定的输出跟踪瞬态性能和最终跟踪精度,同时实现了存在未建模不确定性情况下的渐近稳定跟踪。虽然ARC控制器在正常工作条件下可以获得良好的跟踪性能,但在实际实现中经常通过使用较大的反馈增益来获得较高的跟踪精度,从而容易产生抖震。

为了克服精确跟踪控制中系统存在的未建模不确定性的影响,文献[13]提出了一种鲁棒控制策略,称为自抗扰控制(ADRC),用于对动态和外部干扰中具有大量不确定性的对象进行处理,该方法不需要太多的模型信息,因此适合于补偿未建模不确定性[14]。这种新控制结构的一个重要优点是它使用了扩展状态观测器(ESO)来估计广义扰动并以前馈方式对其进行补偿。该特性已被许多应用例子验证。在文献[15]中,针对火箭炮发射时存在燃气流冲击等强干扰的问题,对含有速度闭环的实际伺服系统进行频域分析,并以此分别构建了火箭炮伺服系统2阶和3阶线性扩张状态观测器,设计了相应的自抗扰控制律,有效抑制了燃气流冲击干扰,但其把建模和未建模的不确定性统一为集中扰动进行估计和补偿,当系统中仅存在参数不确定性时性能不如自适应鲁棒控制器好。

上面提到的文献均需要全状态反馈信息,即要求电机位置和速度均可测量。然而在实际应用中,出于空间、质量、成本等因素的考虑,系统往往难以配备所有状态测量所需的传感器,因此基于全状态反馈的控制器便难以被应用[16]。

文献[17]设计了一种扩展状态观测器,用以对系统不可测量状态和模型匹配不确定性进行估计,并通过线性反馈补偿控制实现了柔性关节机械臂的跟踪控制。针对系统部分状态不可测的情况,文献[18]设计了一种基于神经自适应观测器的动态面输出反馈控制器。从相关文献可以看出,如果想要实现输出反馈控制,就必须设计性能较好的状态观测器,例如滑模观测器、高增益观测器等。其中ESO观测器具有极好的稳定观测性能,在有限时间内可以快速地把观测误差控制在一定范围内,同时提供可用的状态观测信号,用于反馈控制器的设计。

近年来,神经网络已被证明对系统参数不确定性和未知的外部干扰具有很强的逼近能力。例如,文献[19-20]将径向基函数(RBF)神经网络应用于无人机控制系统,对系统的参数不确定性和未知的时变干扰进行了逼近和补偿控制。小脑模型关节控制器神经网络(CMAC)是一种局部逼近的神经网络,相比RBF等全局逼近的神经网络,CMAC是局部学习,每次修改的权值少,学习速度快,适合在线学习,并具有一定的泛化能力,即相近输入产生相近输出,不同输入给出不同输出。文献[21]引入了二进制CMAC用来设计控制器,实现了渐进稳定控制,但是二进制CMAC神经网络存在输出不连续的问题,会降低控制器的性能。文献[22]中提出了一种样条CMAC(Spline CMAC)神经网络,它的输出是连续的,提高了控制性能。

另一方面,机电作动系统的约束控制问题也慢慢成为控制界的关注热点。火箭炮发射平台在实际工作时由于物理结构的限制,往往存在最大回转角和最大俯仰角的约束问题,同时考虑到控制系统的控制精度和收敛速度,对系统的输出结果加以约束就很有必要。针对控制系统中的输出约束问题,近些年来已经有很多学者进行了研究。文献[23]利用时变正切型障碍Lyapunov函数,提出了一种自适应控制策略,解决了带有输出约束和模型不确定的柔性关节机械臂轨迹跟踪响应速度较慢的问题。

本文针对发射平台机电伺服系统建立系统数学模型,针对系统中的输出约束问题,基于障碍Lyapunov函数分析法设计一种输出反馈控制策略,针对系统中存在的参数不确定性,设计ESO,针对系统中的未知扰动设计一种改进的Spline CMAC神经网络观测器。该复合控制方法不仅提高了控制器的控制精度、收敛速率以及稳定性,同时解决了系统在实际工作中难以获得速度信号和受到约束的问题。另外,通过引入改进的Spline CMAC神经网络,避免了传统二进制CMAC神经网络出现的输出不连续问题,并解决了普通Spline CMAC神经网络权值漂移的问题,进一步提高了控制系统抵抗外界干扰的能力。

1 问题描述及系统建模

发射平台由方位轴伺服子系统和俯仰轴伺服子系统组成,如图1所示。为了提高系统的控制性能,在建立系统模型时,需要考虑许多非线性因素的影响,如结构不确定性和参数不确定性以及未知的时变扰动等。此外,由于机电伺服系统电响应速度远高于机械响应速度,建模时只考虑了机械动态特性,忽略了电流动态特性。

图1 发射平台系统框图

由于回转轴伺服子系统的数学模型与俯仰轴伺服系统的数学模型基本一致,本文首先以回转轴伺服子系统为研究对象。系统的执行器为永磁同步电机,其工作模式为转矩模式,即控制器的输出控制值为电压,与永磁同步电机的输出转矩呈正比。则综合上述因素,回转轴伺服系统的数学模型可以表示为

(1)

式中:J为负载折算到电机端的转动惯量;y为电机位置输出量;Ku为电机力矩系数;u为实际控制量,一般为输入给实际系统的电压量;B为作动器系统折算到电机的黏性阻尼系数;dn为系统的常值扰动;f(t)为系统的时变扰动。将式(1)转化为状态空间形式,选取系统状态变量x=[x1,x2]T=[y1,y2]T,则系统的状态空间方程为

(2)

假设1为了设计出可行性较好的控制器,上述动力学模型中的参数都当作常量处理。

假设2f是有界的且上下界已知,即|f|≤E,E为一正常值。

假设3所有的系统参数均有界,上下界已知。即|θi|≤G,G为一个正常值。

2 观测器设计

2.1 基于改进神经网络的扰动观测器设计

CMAC是基于局部学习的神经网络控制器,CMAC采用其特有的寻址方式完成非线性空间映射,学习速度快,泛化能力强,适用于逼近复杂函数,然而传统的CMAC基函数是二进制的,在单元边界上具有基函数的不连续变化,对许多实际应用是非常不利的。

Spline CMAC的基函数及其斜率在CMAC单元的边界上趋近于零,将产生连续可微的输出,在许多应用中,比原始的二进制CMAC具有显著的优势,其结构如图2所示。

图2 一个三层二输入的Spline CMAC神经网络:只显示由输入索引的激活基函数

Spline神经网络的激活函数可以表示为

(3)

式中:hj为当前单元格中维度j的归一化输入;n为神经网络的层数,n=3。

但是,由于普通Spline CMAC神经网络每层只有一个基函数,在单元格的边界处仍可能发生权值漂移。本文采用改进的Spline CMAC神经网络,在该方法中,每层激活的基函数不再是一个,而是两个重叠的激活基函数。即当一个索引从一个单元格移动到另一个单元格(后续相邻单元格)时,与第1个单元格相关联的基函数将在后续单元格的索引期间保持激活状态(非零值)。随后的单元格将作为预测保存在内存中。因此,在该单元格被索引的任何时间,它都有一个预测的后续单元格。基函数将在预测的后续单元格的边界处有一个非零值,基函数将被设计成确保它跨越当前单元格和预测单元格(见图3(a))。假设预测的单元格变化沿输入k方向,则沿第k个输入维的基函数分量为

图3 假设预测是正确的(索引从左向右移动):在时间1,索引基函数预测下一个索引单元格将在右边(图3(a));在时间2,原始的基函数仍然被激活(图3(b)),它与时间2索引层上的新基函数重叠(图3(c))

(4)

式中:i表示节点;k=2;c和σ为自选的常数,用来保证基函数在单元格中有一个最大值,c将根据预测单元格沿输入j的方向而改变;Hj表示第j个输入时两个单元组合在一起的归一化位置,H的取值根据CMAC神经网络的分层数设计。

如果索引确实移动到预测单元格(如果预测单元格变成当前单元格),则基函数仍然激活,并仍然按照式(4)计算,其中Hj为新的当前单元格中沿输入j的归一化位置(见图3(b))。由于基函数的计算是相同的,基函数在跨越单元边界时是连续的(但非零)。需要注意的是,新的当前单元格也将有一个基函数(见图3(c)),因此实际上在同一层上有两个重叠的基函数(一个与当前单元格相关,一个与前一个单元格相关)。

保持两个基函数同时激活是抑制权值漂移的关键,当振荡发生于单元格之间时,改进的Spline CMAC会同时有正权值更新和负权值更新。而普通的Spline CMAC神经网络就仅有正权值更新或负权值更新,从而容易产生权值漂移。

因此总的激活函数为

(5)

定义

g(t)=ω*Γi+ξR
(t)=TΓi

(6)

(7)

(8)

式中:e2为速度期望值和速度虚拟控制量之间的差值。

2.2 基于ESO的状态观测器设计

(9)

(10)

设计扩张状态空间观测器为

(11)

(12)

(13)

合理设计ω0,使A是Hurwitz的,则有定理:对于任意给定的对称正定阵I,存在一个正定矩阵P,满足式(14):

ATP+PA=-I

(14)

3 考虑输出约束的自适应神经网络输出反馈控制器设计

步骤1设计虚拟控制量x2eq

由式(9)、式(10)、式(11)知,系统的状态方程可表示为

(15)

定义期望轨迹为xd,则系统的误差函数可表示为

(16)

(17)

步骤2设计实际控制量u。

由于模型不确定性和参数漂移以及未知扰动,用一个ESO进行反馈控制,并用名义参数取代真实参数,然后设计一个CMAC神经网络对未知的时变扰动进行估计并补偿

u=ua+us

(18)

设计的控制器如下:

(19)

式中:k3为一个正常值。

式(19)中,ua作为基于模型的前馈控制项,用于通过式(11)给出的在线状态估计实现一个改进的模型补偿;us作为鲁棒控制项,用于稳定运动系统的标称模型。把式(18)代入式(17)中,误差动力学方程变为

(20)

(21)

4 稳定性证明

引理2b∈R是任意正常数,对于任意满足|x|<|b|的x∈R,下面的不等式成立:

(22)

下面的式子成立:

(23)

式中:λmin(I)为正定矩阵I的最小特征根。

θ2ξ2ξTPB2≤θ2|ξ2|·‖ξT‖·‖PB2‖≤
θ2(|ξ1|+|ξ2|+|ξ3|)·‖ξT‖·‖PB2‖≤
θ2‖PB2‖·‖ξ‖2

(24)

(25)

(26)

定理选择合适的k1、k2、k3、ω0、b1、b2使ρ>0,则本文设计的算法(式(6)、式(8)、式(11)、式(19))可以使得控制器和观测器都达到有界稳定,从而使系统达到有界稳定。

证明在考虑输出约束的情况下,定义一个障碍Lyapunov函数形式如下:

(27)

式中:bi为约束上限;ei为式(16)的误差函数,n=2。对式(27)进行求导,得

(28)

选择第2个Lyapunov函数

(29)

求导可得

(30)

将式(19)代入式(29),可得

(31)

由于

(32)

则结合式(31),有

(33)

选择第3个Lyapunov函数:

(34)

对式(34)求导,可得

(35)

将式(8)代入式(35),有

(36)

由引理1和引理2以及式(23)~式(26),可得

(37)

(38)

(39)

式中:ρ=min[-α,-β,-ki]。由此可知,闭环系统的跟踪误差和神经网络的估计误差一致有界,并且可以通过调节参数使跟踪误差收敛到零附近一个任意大小的领域内。具体控制策略图如图4所示。

图4 控制策略图

5 仿真结果与分析

为了验证本文提出的控制策略的有效性,利用MATLAB软件对该基于输出约束以及输出反馈的智能复合控制器(OF_ESO_ Spline CMAC)、基于输出反馈的复合控制器(OF_ESO)、传统径向基神经网络控制器(OF_ESO_RBF)、传统二进制CMAC神经网络控制器(OF_ESO_CMAC)进行仿真研究。仿真的总时间为50 s,期望位置信号设为

yd=10×(1-e-0.5t)sin(πt)

(40)

系统参数如表1所示。

表1 发射平台机电作动系统的参数值

发射平台在实际工作中会遇见各种各样的干扰因素,例如时变扰动、死区、非线性等,本文在仿真过程中采取了一种更复杂的干扰因素,即引入位置-速度-输出扰动。在仿真过程中该干扰因素设为f=0.1×x1×x2-0.1×u,系统参数名义值以及观测器参数取:bd=12,θ1n=30,θ2n=1,θ3n=1.52,α1=6,α2=12,α3=14。

4种控制策略仿真参数选取方法如下:

1) OF_ESO:输出反馈控制,是指对非线性系统施加状态反馈使所得到的闭环系统稳定。根据实际调试,参数设置如下:k1=150;k2=100,gama=dig[1,1,1]。

2) OF_ESO_RBF:这是一种结合了径向基神经网络的复合反馈线性化控制器,其中RBF神经网络用来估计系统中的时变扰动。该控制器的参数设置为k1=300,k2=100,神经网络学习速率α=0.6,权值初值为0,权值自适应速率xite=0.1。

3) OF_ESO_CMAC:这是一种采用文献[22]中的二元小脑模型神经网络来估计系统中的时变扰动。该控制器的参数设置为:k1=500,k2=70,神经网络学习速率α=0.8,权值自适应速率xite=0.01,M2=10,N2=9,C2=3,权值初值为0。

4) OF_ESO_ Spline CMAC:这是本文提出的结合了改进的Spline CMAC神经网络与输出反馈的反馈线性化控制器,其中还考虑了系统面向约束的问题。该控制器的参数设置为:k1=600,k2=200,α=0.7,xite=0.8,C2=3,c1=[-10,0,10],M2=10,N2=9,c2=[-10,0,10],b1=[20,20,20],b2=[20,20,20]。指令信号曲线如图5所示。

图5 指令信号输出曲线

图6和图7分别为OF_ESO_ Spline CMAC的位置曲线和跟踪误差。从图6和图7中可以看出,即使在较差的工作状态下,本文提出的控制器也能有效地跟踪系统的位置状态,从而获得满意的控制性能。

图6 OF_ESO_ Spline CMAC的位置曲线

图7 OF_ESO_ Spline CMAC的跟踪误差

图8为3种神经网络估计值与误差对比。由 图8 可以看出,改进的Spline CMAC神经网络的估计误差精度比RBF和普通二进制CMAC神经网络的精度要高,可以准确估计扰动引起的模型不确定性,这是因为改进的样条神经网络解决了输入不连续和权值漂移的问题。图9为4种控制器的跟踪误差对比,表2为仿真跟踪误差指标。从图9和表2中可以看出,OF_ESO_Spline CMAC神经网络的控制器具有最佳的性能,可见在系统中参数不确定性其他干扰同时存在,且干扰的组成非常复杂的情况下,OF_ESO_Spline CMAC复合控制器依然能够有效解决扰动的影响,表明Spline CMAC神经网络的基函数改进后,神经网络观测器效果更好,权值自适应能力更强,体现出复合控制器OF_ESO_ Spline CMAC应对多重扰动并存工况的优越性。

表2 仿真跟踪误差指标

图8 3种神经网络估计值与误差对比

图9 4种控制器的跟踪误差对比

6 实验结果与分析

实验发射平台与控制电路板如图10所示。该发射平台由运载火箭车、回转轴伺服子系统和俯仰轴伺服子系统组成。该控制电路板采用了两个解析-数字转换芯片AD2S83,可采集两支转轮的模拟信号,并将其转换为发射平台俯仰角和回转角的数字信号。表3为发射平台实验装置机电作动系统的系统参数。

表3 发射平台实验装置机电作动系统的系统参数

图10 发射平台以及基于DSP的控制电路板(上为发射平台,下为控制电路板)

为了进一步验证本文控制策略的有效性,实验环节选择5个控制器和3种工况作为仿真环节来比较跟踪性能。其中3种工况如下:

1) 工况Ⅰ:系统的扰动非常小,以至于可以忽略,这时可以认为是只有参数不确定性的影响。

2) 工况Ⅱ:通过修改D/A板的输出函数,对实际系统施加0.1u来实现输入扰动,其中u是通过各种控制策略计算得到的。由式(1)可知,这种类型的扰动会使参数θ发生较大的变化,用于验证本文控制器的参数学习能力和对大结构不确定性的跟踪性能。

3) 工况Ⅲ:引入位置-速度-输入扰动,扰动设为f=0.1×x1×x2-0.1×u。

对如下5个控制器进行比较,5个控制器的实验参数如下:

1) PID:选择比例增益kP=10,积分增益kI=0.5,微分增益kD=5为控制参数。比例部分与误差信号在时间上是一致的,只要误差一出现,比例部分就能及时地产生与误差呈正比例的调节作用,具有调节及时的特点。比例增益kP越大,比例调节作用越强,系统的稳态精度越高,但过大会使系统的输出量振荡加剧,稳定性降低;积分部分与误差的大小和历史有关,只要误差不为零,积分就一直起作用,直到误差消失。因此积分部分可以消除稳态误差,提高控制精度。积分增益kI越大,系统的稳定性可能有所改善,但积分动作越缓慢,消除稳态误差的速度减慢;微分部分反映了被控量变化的趋势(误差变化速度),较比例调节更为及时,具有超前和预测的特点。微分增益kD增大,超调量减小,动态性能得到改善,但系统抑制高频干扰的能力下降。

2) OF_ESO:参数设置为k1=50,k2=100gama=dig[1,1,1],bd=12;系统参数名义值取θ1n=2.5,θ2n=1.4,θ3n=4.5α1=6,α2=12,α3=14,在保证输出不发生抖震的情况下,增大增益参数k,gama为参数自适应率,适当增大其值可以增加系统收敛速度。

3) OF_ESO_RBF:该控制器的参数设置为k1=100,k2=100,神经网络学习速率α=0.7,权值初值为0,权值自适应速率xite=0.8,c=[-10,0,10;-10,0,10],b=[18,18,18],高斯基函数宽度向量值b和第j个隐层神经元的中心点向量值cj要设计在网络输入有效的映射范围内,否则会导致RBF网络失效,在保证梯度下降法不发散的情况下,可以适当增加学习速率η以及权值自适应率xite,以提升神经网络收敛速度。

4) OF_ESO_CMAC:该控制器的参数设置为k1=500,k2=20,神经网络学习速率α=0.99,权值自适应速率xite=0.01,M2=10,N2=9,C2=3,权值初值为0。要保证输入个数c远远小于中间层基函数量化级数M及在实际映射时保证c≪N≤M,N为一个常数。

5) OF_ESO_ Spline CMAC:该控制器的参数设置为k1=150,k2=500,α=0.7,xite=0.8,M2=10,N2=9,C2=3,c1=[-10,0,10],c2=[-10,0,10],b1=[20,20,20],b2=[20,20,20],bd=12。

图11为5个控制器在正常工作情况下得到的的运动轨迹。从图11中可以看出,OF_ESO_ Spline CMAC复合控制器比其他4个控制器具有更高的跟踪性能,因为它对系统模型的未知扰动具有较强的学习能力,进一步验证了本文提出的控制器的有效性。

图11 工况Ⅰ下5种控制器跟踪误差对比

为了检验本文提出的控制算法对结构不确定性的有效性,进行输入扰动实验。在这种情况下,5个控制器的跟踪性能如图12所示。在这种情况下,除了PID控制器,其余所有控制器的跟踪误差都有减小。然而,OF_ESO_Spline CMAC复合控制器的性能仍然是所有控制器中最好的,验证了本文提出的自适应控制的有效性。由于PID控制器不具有工况学习能力,对不确定性只具有很小的鲁棒性,其他4个控制器的精度均高于PID控制器。在OF_ESO控制器中,参数名义值取代了参数真值,ESO能够通过前馈补偿克服一定的模型不确定性,因此其性能优于PID。而其他3种基于神经网络的OF_ESO控制器都可以通过基于神经网络的扰动估计对未知扰动进行补偿,因此它们都优于PID和OF_ESO控制器。在3种神经网络中,改进Spline CMAC的逼近性能最好,这也是OF_ESO_Spline CMAC复合控制器性能最好的原因。

图12 工况Ⅱ下5种控制器跟踪误差对比

为了进一步测试该算法的鲁棒性和实用性,引入了位置-速度输入干扰。在这种情况下,参数不确定性和未知扰动大大增加。5个控制器的跟踪性能如图13所示。由图13可见,只有本文提出的OF_ESO_Spline CMAC控制器的跟踪误差精度远远高于其他控制器,表明其他控制器不能很好地处理这种严重的干扰,并且存在较大的跟踪误差,进一步体现出了本文所设计的控制器的优越性。

图13 工况Ⅲ下5种控制器跟踪误差对比

7 结论

本文设计了一种考虑输出约束的自适应神经网络输出反馈复合控制器,用于识别和补偿发射平台机电伺服系统中的参数不确定性和未知的扰动。首先,引入ESO用于估计参数不确定性,并将观测得到的速度值用来输出反馈控制;其次,将系统中无法精确建模的多重非线性因素合并处理为时变扰动,并引入改进的样条形神经网络对其进行估计补偿。最后,利用障碍Lyapunov分析法设计输出反馈控制率并证明本文所提的控制器一致有界稳定。仿真和实验结果表明,本文提出的改进OF_ESO_Spline CMAC控制器有效地提高了发射平台机电驱动系统的跟踪性能和鲁棒性。

猜你喜欢

单元格观测器权值
一种融合时间权值和用户行为序列的电影推荐模型
流水账分类统计巧实现
CONTENTS
玩转方格
玩转方格
浅谈Excel中常见统计个数函数的用法
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
基于观测器的列车网络控制
基于非线性未知输入观测器的航天器故障诊断