APP下载

基于改进神经网络的非线性系统观测器设计

2011-05-17徐志超周玉国于凤满

网络安全与数据管理 2011年8期
关键词:观测器权值神经网络

徐志超,周玉国,于凤满

(青岛理工大学 自动化工程学院,山东 青岛266033)

近年来,鉴于神经网络的特性和发展潜力,神经网络成为研究的热点之一。伴随着控制对象复杂性的提高,系统存在的不确定因素和难以确切描述的非线性特性也随之增多,神经网络的研究和发展显得尤为重要。与传统控制系统状态观测器相比,神经网络状态观测器具有更强的逼近非线性函数的能力和容错性,尤其适用于多输入多输出系统。

与线性定常系统中的设计[2]相比,本文是在非线性系统中利用前馈神经网络的函数逼近能力,设计出了一种神经网络观测器,并对观测器的稳定性进行了分析。本文采用了LM优化算法来改进BP网络,由于其算法可以比标准梯度下降法网络训练速度提高几十甚至上百倍[3],从而大大提高了工作效率。仿真结果说明了设计的合理性和有效性。

1 观测器设计原理

神经网络观测器的原理与传统状态观测器相似,都是利用重构的思想。神经网络的主要作用是来逼近系统中的非线性函数。首先将输入量u、状态变量x作为BP神经网络的输入,对神经网络进行训练,使其逼近非线性函数h(x,u);然后将训练好的网络用于构成观测器,并通过神经网络观测器的输出y^与原来系统的输出y的差值来确定调整BP网络的权值,使其获得想要的状态估计变量x^。系统只有y可以直接测量。

设计一个神经网络观测器关键是找一个神经网络去识别非线性,并且利用传统的观测器思想去重构状态。因此,神经网络观测器模型如图1所示。

2 神经网络非线性系统观测器的建立

给定如下的非线性系统:

其中,x(t)∈Rn状态变量,u(t)∈Rq表示输入变量,y(t)∈Rm表示输出变量,h(x,u)表示r维未知非线性函数向量,A∈Rn×n、C∈Rm×n为已知定常矩阵,(A,C)是可观测的。

因此,系统(1)的状态观测器描述为:

给出BP网络输入与输出的关系y=WTf(VTx),依据前馈神经网络函数具有任意精度逼近的性能,在给定逼近误差ε(x)>0情况下,一定有三层BP网络在ε(x)允许的范围内逼近非线性函数h(x,u)。用η(x)作为一个光滑函数从 Rn→Rm。表示如下:

式中,f(·)是 Sigmoid型函数作为激励函数,V表示第一层输入层到第二层隐含层的权值矩阵,即VT=[v21],且第一列包含着阈值向量μ=[μ1,μ2, …,μr];W 表示第二层隐含层到第三层输出层的权值矩阵,即 WT=[w32];ε(x)是神经网络逼近误差,满足||ε(x)||≤εN。 εN是边界函数,由隐含层神经元数r决定。假定权值W和V有界限,则有||W||F≤WM和||V||F≤VM。

依据神经网络逼近性能,在系统(1)中用η(x)来代替光滑非线性函数h(x,u),得:

其中 z=[x u]。

因此,神经网络函数估计如下:

所以描述观测器的式(2)被替换为:

其中,eW=W-为神经网络权值估计误差,H=A-LC为渐近稳定的Hurwitz矩阵,是一个有界的干扰,满足||ξ(t)||≤,是正常数。

3 神经网络观测器稳定性分析

为了训练神经网络,在一定条件下定义一个恰当的学习规则,就是要保证观测器的稳定性。本文神经网络观测器稳定性的主要思想是采用权值校正机制,通过选择Lyapunov函数,使其变成负定来达到稳定。此外,网络的权值校正是基于BP算法增加一些修正量来保证观测器的稳定的一种办法。

定理基于系统模型(1)和观测器模型(6),对神经网络参数线性化的权值进行校正:

根据定理得到修正好的神经网络权值,表示如下:

其中,

η1η2>0是学习率,ρ是一个很小的正数。矩阵 S和 T是控制收敛速度的任意常数矩阵,根据式(10)、式(11)的权值误差为eW=W-和eV=V-。

所以可以表示为:

选择正定的Lyapunov函数[5]如下:

其中P=PT>0满足:

P是Q为正定矩阵时的正定解。

将式(14)求导如下并将式(12)、(13)、(15)代入得:

其次,为了说明式(16)是一个负半定的函数,依据tr(ABT)=BTA和下面的不等式[5]得:

其中 ,WM=sup(W),VM=sup(V),fM=sup(f)。 然后再通过使用fm(1-fm)≤fm,||||=||W-eW||≤WM+||eW||和式(19),得下面不等式为:

定义 K1、K2和 K3为:

然后,在式(16)右侧分别加上 K12||eW||2||e||,K22||e||,分别减去||eV||2||e||、K23||e||,得到:

其中,λmin(Q)表示 Q的最小特征值。 假定ρ≥K12且ρ≥1,则式(22)变为:

为了保证τ˙是负半定的即τ˙≤0,能获得下面的||e||:

因此,根据标准的Lyapunov定理,能说明可观测的误差e是一致最终有界。此外,为了表示权值误差eW的界限,等式(10)可表示为:

其次,由于量ρS||e||是正的,因此有限输入式(25)系统是稳定的,eW有界得到保证。

同理,当将式(11)变成下面的形式:

式(26)代表了一个稳定有界输入的线性系统,根据所有它有界的包括f(·)和量ρT||e||是正的,因此eV有界。

综上所述,通过上面的分析得到了稳定的神经网络观测器。

4 系统仿真

本文以一个单机械手的轨迹跟踪为例,状态方程如下:

其中 u(t)=sin(t),t=[0,10]。

本文给出了观测器设计的过程,具体步骤为:

(1)给出的矩阵对(A,C)是可观测的,再通过(A-LC)渐进稳定求出常增益矩阵L。

(2)通过观测器的稳定性分析,得到相关参数,并在训练网络时利用函数trainlm来提高训练速度。

所以,该系统仿真参数有 L=[400 800],x=[0 0.5]T,=[0.1 0]T,ρ=0.001,S=diag[5×104],T=diag[5×103]。从仿真结果可以看出,神经网络观测器对系统状态变量有良好的逼近能力,如图2所示。

本文在非线性系统下建立了神经网络观测器,其具有很好的逼近非线性函数的能力。仿真结果说明了其有效性。

[1]周东华,叶银忠.现代故障诊断与容错控制[M].北京:清华大学出版社,2000.

[2]田建兵,郑晟.基于神经网络的状态观测器设计[J].机械工程与自动化,2008,16(3):22-25.

[3]高雪鹏,丛爽.BP网络改进算法的性能对比研究[J].控制与决策,2001,16(2):167-172.

[4]LAKHAL A N,TLILI A S,BRAIEK N B.Neural network observer for nonlinear systems application to induction motors[J].International Journal of Control and Automation,2010,3(1).

[5]ABDOLLAHI F,TALEBI H A.A stable neural network observe-based observer with application to flexible joint manipulators[J].IEEE Transaction on Neural Network.2006(1):118-129.

[6]武宏伟,戴琼海,王普,等.基于神经网络的非线性系统的观测器设计[J].清华大学学报,2000,40(3):11-15.

[7]丛爽.面向MATLAB工具箱的神经网络理论与应用[M].北京:中国科学技术出版社,2009.

猜你喜欢

观测器权值神经网络
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
基于滑模观测器的PMSM无位置传感器控制策略
基于非线性干扰观测器的航天器相对姿轨耦合控制
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于滑模观测器的机翼颤振主动抑制设计
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
基于神经网络的拉矫机控制模型建立