基于准ARX 模型和SVR 算法的非线性系统切换控制*
2022-12-27董宜平曹进德
王 兰, 董宜平, 曹进德
(1. 无锡职业技术学院 基础课部,江苏 无锡 214121;2. 中科芯集成电路有限公司,江苏 无锡 214063;3. 东南大学 数学学院,南京 211189)
引 言
非线性系统的自适应控制问题一直是控制领域的研究重点. 部分研究者基于局部线性化的思想,即将非线性系统分解为线性系统,提出了非线性系统的自适应控制方法[1-5]. 然而,局部线性化的方法并不能很好地表达系统的非线性特性,因此该模型面临着精确性问题. 近年来,机器学习网络由于其可以无限逼近于非线性函数而吸引了越来越多的研究者关注[6-12]. 非参数化和参数化模型的界限一直比较模糊,机器学习的方法弱化了模型类型的区别,并作为一种基于输入输出数据的一般性学习算法在建模及参数估计方面得到了研究和发展,例如基于核函数的辨识方法[8]、基于神经网络的辨识方法[7,12]、基于模糊逻辑[1,5]的辨识方法等. 然而,在设计和使用该类控制系统的过程中,必须充分考虑参数辨识、控制律推导以及控制系统稳定性和鲁棒性等问题.
为了解决这些问题,一种特殊的模块化模型:含有外部输入项的准线性自回归(autoregressive with eXogenous inputs, ARX) 模型被提出. 文献[1]对该模型的建立和特点进行了详细说明. 近年来,该模型已成功应用于非线性系统的控制器设计、真实系统的辨识与控制、时序预测等领域[5,8,13]. 准ARX 模型通过模型的多模块来实现不同功能并表达系统特性,主要优势在于将模型线性和非线性分离于不同模块中,从而使得模型稳定性可通过线性部分来确保. 因为可以通过切换机制提高线性控制的精度,同时又可以给非线性控制提供稳定性保障,所以控制切换的思想在很多文献中被采用[11,14-15]. 文献[11]提出了一种包含切换机制的准ARX 网络模型,基于模型的线性部分和非线性部分的预测误差,建立了切换判定函数. 基于该模型的切换控制系统既可以保障控制的精度,又可以解决稳定性问题.
然而,该控制系统仍然面临三个挑战:基于神经网络的准ARX 模型的参数并没有充分利用先验知识,其参数没有可用的解释;当系统具有较大的扰动时,原有的控制器设计方法并不具有很好的鲁棒性;切换机制引入预测系统,基于预测模型设计的控制器还是多个.
基于上述讨论,本文采用径向基函数(radial basis function, RBF) 网络代替准线性ARX 模型中非线性部分的神经网络.RBF 网络具有简单的拓扑结构和计算精度高等优点,被广泛用于非线性系统控制.同时,采用近邻传播聚类(affinity propagation, AP)聚类方法生成系统的数据分布信息,每个RBF 网络的参数根据距离其他中心的距离来设置,从而为准ARX 模型提供一种可解释的辨识方法.引入切换机制,设计一个基于线性部分和非线性部分误差的切换控制器,给出稳定性说明.支持向量回归(support vector regression, SVR)在模式识别和函数估计中可以确保参数的稳健性,尤其是控制对象存在很大的扰动时[16-17].为了提高控制系统的鲁棒性,利用一个线性SVR 算法取代最小二乘算法算法.
本文的结构如下:第1 节进行了问题的描述;第2 节提出了一种改进的准ARX 切换模型;第3 节给出了模型参数辨识方法;第4 节基于预测模型设计了系统的控制器,并分析了其稳定性,同时通过仿真例子说明了模型的有效性;第5 节给出了全文的总结.
1 问 题 描 述
本文研究如下单输入单输出(SISO)非线性时不变系统[18],其输入输出关系记作
其中 φ (t)=[y(t-1) ···y(t-n)u(t-d) ···u(t-m-d+1)]T,u(t)∈R,y(t)∈R,v(t)∈R 分别是t时刻系统的输入、输出以及零均值的随机噪声;m和n分别为未知的输入、输出最大时滞,d为已知的整数时延; φ(t)∈Rs,s=n+m是对应的回归变量;g(·) 是非线性函数.给出如下假设[1]:
假设1 (ⅰ)g(·) 是一个连续函数, 在 φ (t)=0 处是C∞连续;(ⅱ) 系统具有全局一致渐近稳定的零动态特性;(ⅲ) 系统是可控的,且存在一个控制器可以表示为:u(t)=ρ(ξ(t)), 其中ξ(t)=[y(t) ···y(t-n)u(t-1) ···u(t-m)y*(t+1) ···y*(t+1-l)]T(y*(t) 表示参考输出).
2 改进的准 ARX 预测模型
2.1 回归表示
在假设条件下,系统(1)的函数g(·)在 φ (t)=0 邻域内进行Taylor 展开,可以得到
2.2 d-步预测器
基于文献[1]中的推导方法,得到预测器的表达式为
2.3 基于RBF 的准ARX 模型
其中 Ωj={λj,Zj} 是RBF 网络的参数集;Zj为网络的中心; λj表示基函数的宽度参数;算子 ‖ ·‖2表示向量的2 范数;M代表基函数的个数; ξ (t),χ(t) 是RBF 网络的输入项,在前面已经定义.
3 模型参数辨识
模型 (11)的参数分为两类:线性部分参数 Θ 以及非线性部分参数 ϖ ,Ωj.分别采用不同的参数辨识方法进行.
3.1 线性部分参数
3.2 非线性部分参数
3.2.1 聚类方法
中心参数的选择对RBF 型网络的性能起着重要的作用.本文中,该部分参数是通过聚类方法利用先验知识得到而不是通过最小化训练误差的均方来估计的.需要指出的是,在RBF 网络中使用聚类方法来初始化中心参数并不是一个新的思路,而本文采用的参数辨识方法,具有有意义的解释[8].
通过聚类算法生成数据的局部线性信息,其中簇的数目(线性子空间)等于RBF 基函数的数目M,并且每个聚类中心被设置为相关RBF 的中心参数Zj.为了适当地确定每个局部线性子模型的操作区域,设置每个RBF 的宽度 λj以很好地覆盖相应的子空间.本文采用系数 ρ 乘以训练数据之间最大距离.
3.2.2 支持向量回归方法
该优化问题可以变换为寻找相关Lagrange 函数的鞍点问题:
3.3 切换律
4 控 制 仿 真
4.1 控制器设计
该部分非线性系统的控制器设计包含两个步骤:第一步辨识改进的准ARX 预测模型;第二步控制序列的推导和实施.通过前面的推导,我们可以得到被辨识的预测模型为
基于文献[19]的方法,分析可得非线性系统(3)的自适应控制器(23)的稳定性:输入输出信号在闭环系统内是有界的.此外,当选取合适的径向基函数网络时,系统的跟踪误差收敛于0.
4.2 仿真例子
考虑非线性系统表达式如下:
其中噪声函数v(t) 为v(t)=(1+0.3q-1)e(t),e(t)∈N(0,0.02) 为白噪声.
其中r(t)=sin(2πt/25).
基于该例子的仿真,将本节提供的切换控制方法,与线性控制方法(linear control)、基于神经网络的控制方法(NN control)[19]以及非切换自适应控制方法(third control)进行比较. 非线性部分的径向基函数网络参数选为M=6, ρ=0.2, 参数 Ωj则利用聚类算法进行离线训练得到. 利用线性SVR 算法每10 步计算一次参数ϖ. 切换判别函数中的参数选为c=2.4,N=3.
图 1 给出了控制结果的展示. 其中,图1(a) 给出了控制输出,实线为控制输出y(t), 虚线为期望输出y*(t);图1(b) 给出了控制输入u(t); 图1(c)中为切换序列 χ(t). 显而易见,所提供的控制方法可以很好地在任意时刻实现对期望输出的追踪.
图1 仿真例子的控制结果图:(a) 控制输出 y (t), 期望输出 y *(t) ;(b) 输入序列 u (t) ;(c)切换序列χ(t)Fig. 1 Control results of the example: (a) control output y (t) and desired output y *(t) ; (b) control input u (t) ; (c) switching sequenceχ(t)
表 1 给出了4 种控制方法误差的均值和方差数据,通过对比可以看出,本文所研究的切换自适应控制在噪声较大情况下,效果比其他方法控制效果更好.
表1 基于噪声v (t)情 况下控制误差对比表v(t)Table 1 Comparison of errors with the noise
5 总 结
本文提出了一种基于改进的准ARX RBF 预测模型的新型非线性系统自适应切换控制器. 一方面,采用聚类方法来揭示预测模型非线性部分的局部线性信息. 虽然在RBF 网络的参数估计中出现了类似的方法,但对于准ARX 模型的非线性参数给出了有意义的解释. 另一方面,将SVR 用于模型的线性参数估计. 与基于神经网络的控制系统不同的是,所提出的控制模型,参数可以通过先验知识确定,并且对于较大的扰动具有鲁棒性. 最后,通过仿真体现所提供的控制方法的有效性.
参考文献( References ) :
[1]H U J, HIRASAWA K, KUMAMARU K. A neurofuzzy-based adaptive predictor for control of nonlinear systems[J].Transactions of the Society of Instrument and Control Engineers, 1999, 35(8): 1060-1068.
[2] 赵 玮, 任凤丽. 基于自适应控制的四元数时滞神经网络的有限时间同步[J]. 应用数学和力学, 2022, 43(1): 94-103.(ZHAO Wei, REN Fengli. Finite time adaptive synchronization of quaternion-value neural networks with time delays[J].Applied Mathematics and Mechanics, 2022, 43(1): 94-103.(in Chinese))
[3]Y OUNG P C, MCKENNA P, BRUUN J. Identification of non-linear stochastic systems by state dependent parameter estimation[J].International Journal of Control, 2001, 74(18): 1837-1857.
[4]X I Y G, LI D W, LIN S. Model predictive control-status and challenges[J].Acta Automatica Sinica, 2013, 39(3):222-236.
[5] 王 兰, 谢达, 董宜平, 等. 基于准 ARX 多层学习网络模型的非线性系统自适应控制[J]. 应用数学和力学, 2019,40(11): 1214-1223. (WANG Lan, XIE Da, DONG Yiping, et al. Adaptive control of nonlinear systems based on quasi-ARX multilayer learning network models[J].Applied Mathematics and Mechanics, 2019, 40(11): 1214-1223.(in Chinese))
[6]N ARENDRA K S, PARTHASARATHY K. Identification and control of dynamical systems using neural networks[J].IEEE Transactions on Neural Networks, 1990, 1(1): 4-27.
[7]L I D P, LIU Y J, TONG S C, et al. Neural networks-based adaptive control for nonlinear state constrained systems with input delay[J].IEEE Transactions on Cybernetics, 2019, 49(4): 1249-1258.
[8]W ANG L, CHENG Y, HU J, et al. Nonlinear system identification using quasi-ARX RBFN models with a parameter-classified scheme[J].Complexity, 2017, 2017: 1-12.
[9]W U J, SUN W, SU S F, et al. Neural-based adaptive control for nonlinear systems with quantized input and the output constraint[J].Applied Mathematics and Computation, 2022, 413: 126637.
[10]B ILLINGS S A, WEI H L. A new class of wavelet networks for nonlinear system identification[J].IEEE Transactions on Neural Networks, 2005, 16(4): 862-874.
[11]W ANG L, CHENG Y, HU J. Stabilizing switching control for nonlinear system based on quasi-ARX RBFN model[J].IEEJ Transactions on Electrical and Electronic Engineering, 2012, 7(4): 390-396.
[12]C HENG L, WANG Z, JIANG F, et al. Adaptive neural network control of nonlinear systems with unknown dynamics[J].Advances in Space Research, 2021, 67(3): 1114-1123.
[13]J ANOT A, YOUNG P C, GAUTIER M. Identification and control of electro-mechanical systems using state-dependent parameter estimation[J].International Journal of Control, 2017, 90(4): 643-660.
[14]Y ANG D, LI X, QIU J. Output tracking control of delayed switched systems via state-dependent switching and dynamic output feedback[J].Nonlinear Analysis: Hybrid Systems, 2019, 32: 294-305.
[15]B ECHLIOULIS C P, ROVITHAKIS G A. Prescribed performance adaptive control for multi-input multi-output affine in the control nonlinear systems[J].IEEE Transactions on Automatic Control, 2010, 55(5): 1220-1226.
[16]A WAD M, KHANNA R.Support Vector Regression[M]//Efficient Learning Machines.Berkeley: Apress, 2015:67-80.
[17]T OIVONEN H T, TÖTTERMAN S, ÅKESSON B M. Identification of state-dependent parameter models with support vector regression[J].International Journal of Control, 2007, 80(9): 1454-1470.
[18]G OOGWIN G C, SIN K S.Adaptive Filtering Prediction and Control[M]. Dover Publications, 1984.
[19]W ANG L, CHENG Y, HU J. A quasi-ARX neural network with switching mechanism to adaptive control of nonlinear systems[J].SICE Journal of Control, Measurement, and System Integration, 2010, 3(4): 246-252.