改进的输出误差法用于不稳定飞机参数辨识

2022-12-14汪志刚李爱军王力浩孙小锋

哈尔滨工业大学学报 2022年12期

汪志刚，李爱军,2，王力浩，孙小锋

(1.西北工业大学自动化学院,西安 710072; 2.陕西省飞行控制与仿真技术重点实验室(西北工业大学),西安 710072)

系统辨识技术基于飞行试验中飞行运动和控制变量的测量值，建立输入输出量间的关系。飞机系统辨识是飞机研发过程中的一个重要环节，对控制律的设计、飞行模拟器的设计和飞行包线的扩展都有重要的意义[1]。飞机系统辨识技术分为频域辨识和时域辨识，频域辨识方法建立系统的线性模型，时域识别方法可用于提取线性模型和非线性模型[2]。目前最常用的时域飞机系统辨识方法是方程误差法以及输出误差法。方程误差法是一种直接方法，受自变量中的测量噪声影响，其估计结果是有偏差的。输出误差法基于极大似然原理，通过最小化测量值和模型输出的均方差来估计参数，其估计结果是渐近无偏的。针对稳定飞机，输出误差法是最常用的参数辨识方法之一[3]。

不稳定飞机的主要特点为：1)飞行试验过程中需要引入控制器；2)求解不稳定飞机的模型输出时，若参数选取稍有不适，求解过程将发散。如图1所示，针对不稳定飞机，系统辨识有两种可能的方法，即闭环辨识和开环辨识[4]。经典的闭环辨识方法建模飞行员输入δp与测量值z之间的动力学关系，不会产生任何数值问题，因为整个系统是稳定的。此方法的局限是只能得到闭环系统的等价模型，若要从中推导出开环动力学模型，还需要精确的控制器回路动力学模型，而这通常是不容易得到的。

图1 不稳定飞机的闭环与开环辨识

开环辨识方法直接建模飞机舵面输入δe与测量值z之间的动力学关系。然而，输出误差法不能直接应用于不稳定飞机。输出误差法需要求解待辨识系统的运动方程，应用于不稳定的飞机时，会产生数值发散问题，导致参数估计过程失败[4]。

近年来，随着神经网络学科的发展，神经网络方法逐渐应用于飞机系统辨识领域[5-7]。Hess[8]通过神经网络直接建模飞机的气动系数。Ghosh等[9]基于前向神经网络，使用Delta法和Zero法提取飞机的气动导数。Peyada等[10]提出了一种新的思想——将神经网络与输出误差法相结合，以神经网络代替飞机动力学模型，并采用高斯-牛顿法最小化网络输出与试验测量值间的均方差，从而进行参数估计。随后多位学者[11-13]遵循类似的思路，应用不同的网络或者对不同的对象进行辨识。但是，这些文献都是基于高斯-牛顿法来最小化代价函数的。高斯-牛顿法具有固有的缺陷，即容易陷入局部最小值[2]。本文基于粒子群优化对LM (levenberg-marquardt)方法进行了改进，以改进的LM算法代替高斯-牛顿法，并与神经网络方法相结合，形成一种改进的输出误差法，用于不稳定飞机的参数辨识。

1 神经网络建模

神经网络由于其强大的非线性映射能力，可以直接应用于对非线性动力学特性建模。网络输入向量选取为动力学系统第k时刻的输入量以及状态量，网络输出向量选取为第(k+1)时刻的输出量，经过大量样本训练后，神经网络可以依据第k时刻(当前时刻)的状态和输入，对第k+1时刻(下一时刻)的状态量进行预测。换句话说，神经网络用于近似系统的动力学特性，其作用相当于线性或者非线性动力学系统的运动方程。

本文选择了常用的BP神经网络[4]，其网络结构如图2所示。

图2 BP神经网络结构

BP神经网络分为输入层、隐含层和输出层。W1、W2分别为输入层到隐含层和隐含层到输出层的权重以及偏差矩阵，网络的传播遵循式(1)～(4)，其中f(x)为非线性S形激活函数。xr为网络输入向量，x1、x2分别为隐含层和输出层的输入向量，xh、xo分别为隐含层和输出层的输出向量。

x1=W1xr+W1b

(1)

xh=f(x1)

(2)

x2=W2xh+W2b

(3)

xo=f(x2)

(4)

S形激活函数选择双曲正切函数：

(5)

如上所述，网络输入向量U选取为动力学系统k时刻的输入以及状态量，网络输出Z选取为k+1时刻的状态向量。即

(6)

(7)

通过连续调整网络参数W1和W2，可以最大程度地减小网络输出和测量值之间的误差。在第k个离散数据点上，将成本函数选择为第k步的局部输出误差,即

(8)

基于最速下降法，网络参数W1,W2通过式(9)、(10)进行调整：

(9)

(10)

激活函数的导数为

(11)

网络参数W1,W2通过迭代更新之后，网络将具有满意的拟合性能，网络的最终拟合性能通过均方差(MSE)进行衡量，即

(12)

2 基于粒子群优化改进的输出误差法

本文详细陈述基于粒子群优化改进的输出误差法，以及应用神经网络和改进的输出误差法进行参数辨识的算法流程。

2.1 粒子群优化

粒子群优化算法(Particle swarm optimization,PSO)最初是由Eberhant等[14]于1995年提出的一种基于直接搜索的优化算法。此算法基于个体粒子之间的协作与竞争，经过数次迭代后实现复杂空间中最优解的搜索。PSO算法是一种有记忆能力的算法,对于低维优化问题十分有效[15]。粒子群中的每个粒子，都是所求优化问题的一个潜在的解。而粒子的品质由事先设定好的适应度函数来评价。假设在n维搜索空间中，有m个粒子,第h个粒子的位置表示为xh=(xh1,xh2,…,xhn)T，速度表示为vh=(vh1,vh2,…,vhn)T，将xh代入适应度函数中计算出其适应度值，以评价其优劣。ph表示第h个粒子的历史最佳位置，pg表示整个粒子群经历过的最优位置。在标准粒子群算法中，粒子的速度和位置更新如式(13)、(14)，其中下标d表示vh、xh、ph和pg的第d个分量，t为迭代次数，ω、ξ1、ξ1分别为3个可调参数，r1，r2，r3为 (0, 1)之间的3个随机数。

vhd(t+1)=ωr1vhd(t)+ξ1r2(phd(t)-xhd(t))+

ξ2r3(pgd(t)-xhd(t))

(13)

xhd(t+1)=xhd(t)+vhd(t+1)

(14)

2.2 传统输出误差算法

神经网络训练完成后，基于LM算法对代价函数进行优化，使得网络输出和测量输出的均方差最小，从而对未知参数进行辨识。LM算法是对高斯-牛顿法的改进，为解释LM算法，首先简要介绍基于高斯-牛顿法的传统输出误差算法[3]。

(15)

(16)

式中R为协方差矩阵，R的极大似然估计如式(17)所示。高斯-牛顿法通过式(18)、(19)求解未知参数。

(17)

Θi+1=Θi+ΔΘ

(18)

FΔΘ=-G

(19)

其中F、G分别为Hessian矩阵和梯度向量，即：

(20)

(21)

(22)

2.3 粒子群改进的LM算法

LM算法由Levenberg[16]和Marquardt[17]提出，其结合了高斯-牛顿法和最速下降法，LM算法在两个梯度方向上优化代价函数，因此包含更宽的收敛范围[4]。与高斯-牛顿法相比，LM算法中添加了一个非负阻尼因子λ，其参数迭代计算如式(23)、(24)所示，其中，Hessian矩阵F和梯度向量G按照式(20)、(21)计算，与高斯-牛顿法一致。当阻尼因子接近于0时，LM算法的性能与高斯-牛顿法一致；而当阻尼因子充分大时，LM算法的性能接近于最速下降法。

Θi+1=Θi+ΔΘ

(23)

(F+λI)ΔΘ=-G

(24)

传统的LM算法根据代价函数的增减对阻尼因子进行某种调整，例如通过对阻尼因子乘以10或除以10以保证代价函数的下降[4]。然而这种调整得到的阻尼因子并不是最佳的，从而限制了算法性能提升的效果。在本文中，LM算法的每次迭代时采用粒子群算法来求解最佳阻尼因子，即，基于粒子群算法最小化代价函数(25)，以确保求解的阻尼因子是局部最优的，或者说是次最优的。需要指出的是，增加粒子群算法的粒子数以及搜索次数后，还可以找到最优的阻尼因子，但是这样会增加计算代价，这是非必要的。本文设置了20个粒子，最多搜索5次。结果表明这样的设置对于改善LM算法的性能是足够的。

J(Θi+1)=J(Θi+ΔΘ)=J1(Θi,λi,F,G)=J2(λi)

(25)

2.4 神经网络LM(NN-LM)算法流程

最终的神经网络LM(NN-LM)参数辨识算法包含了两部分：神经网络训练以及参数估计。整个算法的流程如图3所示。

图3 神经网络LM(NNLM)算法流程图

算法的求解步骤如下：

1)从飞行试验数据中提取状态量和输入量，构成神经网络的输入向量U(k)；从飞行试验数据中提取输出量，构成神经网络的输出向量Z(k+1)，例如本文的应用算例中，U(k)，Z(k+1)分别为式(31)、(32)；并按照式(9)～(11)进行网络训练。

3)基于传统输出误差法，分别根据式(22)计算灵敏度矩阵∂Y(k)/∂Θ，式(20)计算Hessian矩阵F,以及式(21)计算梯度向量G。

4)将粒子群中每个粒子的适应度函数取为代价函数(25)，基于粒子群优化过程，即式(13)、(14)求解局部最优阻尼因子λ。

5)基于LM算法，根据式(23)、(24)更新待辨识参数Θi。

重复步骤2)～5)，直至算法收敛。

3 不稳定飞机模型与仿真试验数据

本文应用了De Havilland DHC-2 “BEAVER“测试机[4,18]的不稳定短周期模型。“BEAVER“飞机的短周期状态方程为：

(26)

式中：w为纵向速度，q为俯仰角速率，az为纵向加速度，δe为升降舵偏转量。

模型的观测方程为：

(27)

在本文的研究中，这些模型参数构成了待辨识的未知参数向量，即

Θ=[Zw,Zq,Zδe,Mw,Mq,Mδe]T

(28)

式中Zw,Zq,Zδe,Mw,Mq,Mδe为模型参数，其标称值见表1。

系统矩阵A如式(29)所示，将U0和表1中模型参数的标称值Θ代入系统矩阵A，可计算出其两个特征值分别为0.693 4和-5.825 0，其中正的特征值对应着不稳定模态。这种不稳定飞机的仿真飞行试验只能在引入控制器后(闭环条件下)进行。文献中对此模型引入了垂直速度比例反馈控制器(30)，并进行了闭环机动试验，其中δp为飞行员输入[4]。

(29)

δe=δp+Kw

(30)

表1 模型参数的标称值以及基于3种方法的估计结果

尽管仿真飞行试验是在闭环条件下进行的，本文对模型参数的估计在开环条件下进行，将升降舵偏转量δe视为模型输入，进行开环辨识，在辨识过程中并未使用飞行员输入δp的信息。使用JATEGAONKAR[4]设计的输入信号激励仿真模型，模型的试验数据如图4所示。

图4 “BEAVER“飞机短周期模型的仿真试验数据

4 参数辨识结果

本文基于NN-LM方法，从仿真数据中提取模型参数。首先，选取神经网络输入向量为仿真模型第k时刻的状态及输入为

(31)

式中w(k)为k时刻的纵向速度采样值。

选取网络输出向量为仿真模型第k+1时刻的输出Z(k+1)为

(32)

(33)

综上所述，传统的输出误差法需要参数的先验信息，将参数初值设置在标称值附近，否则算法将发散或者收敛至局部极小值点。而改进的LM算法具有更宽的收敛范围，即不需要参数的先验信息。本文参数估计过程中，所有的未知参数向量Θ均以[-2,2]范围内的随机数初始化，从不同的初始值开始迭代时算法均可以收敛。图5、6为选取不同随机初始值时，参数Zδe和Mw的收敛过程。可以看出，参数初值选取不同时，算法均可在7步内收敛，参数初始值离标称值较远时，算法收敛较慢，参数初始值离标称值较近时，算法收敛较快。

图5 参数Zδe收敛过程以及对应的标准差

图6 参数Mw收敛过程以及对应的标准差

将3种方法估计的参数代入运动方程(26)，得到3种估计模型，并且由仿真试验中的升降舵偏转驱动3种模型，模型的输出如图7所示。并结合Theil不等系数(Theil’s inequality coefficient，TIC)[19]来评价3种模型的输出量对试验值的拟合效果。输出量的TIC定义如式(34)，其中zi为仿真试验测量值，yi为模型的输出值，N为离散测量数据点的个数。TIC值越低表示模型输出与试验测量值符合度越高，TIC值低于0.25～0.30代表了较好的拟合效果[4]。3种模型的各个输出量的TIC值见表2。

(34)

由图6可以看出，基于NN-LM方法辨识的模型可以很好地拟合仿真试验数据，效果优于传统的最小二乘法(LS)和人工稳定的输出误差方法(SOEM)。由表2中的TIC值可以看出，对于NN-LM辨识出的模型，其各个输出量的TIC值均低于LS方法和SOME方法，且远小于0.25，说明了此模型的输出对试验测量值的拟合效果更好。