严格反馈系统约束迭代学习控制
2021-06-19陈建勇孙明轩
陈建勇孙明轩
(1.浙江工业大学信息工程学院,浙江 杭州 310023;2.温州科技职业学院信息技术学院,浙江温州 325000)
1 引言
迭代学习控制(iterative learning control,ILC)方法适用于处理具有重复运动性质的被控对象.它通过寻找合适的控制输入,实现系统实际输出在有限时间区间上精确跟踪参考信号.自适应控制方法是处理非线性常参数不确定系统的主要技术,通过结合反推技术可以解决不满足匹配条件系统的全局自适应控制问题[1].随着自适应控制的深入研究,人们逐渐从自适应控制角度去设计学习控制,也利用学习控制来改善自适应过渡过程的动态品质.两种控制方法的结合,可以取长补短并拓宽各自的适用范围,从而不断完善自适应迭代学习控制理论[2–3].迭代学习控制方法要求零初始误差条件[4–5],即每次迭代时系统初值与期望轨迹初值一致.然而,受限于设备复位精度,实际操作时可能会产生重置偏差.因此,如何处理该初始条件(也称为初值问题)是迭代学习控制研究的基本问题之一.目前,Lyapunov-like 方法下初值问题研究日益受到人们的关注,包括时变边界层法[6–7]、有限时间吸引子法[8–9]、变期望轨迹校正[10].值得关注的是文献[11]构造了一种期望误差轨迹,首次提出了误差跟踪设计方法.该方法的新颖之处在于每次迭代时不用重新设计初始段轨迹,只需要保证期望误差轨迹初值与实际误差轨迹初值一致,从而拓宽了迭代学习控制的应用范围.
人们在设计自适应控制器或自适应学习控制器时,为了提升系统的鲁棒性,通常会对控制输入或参数估计采取饱和函数或投影算子等限幅手段.然而,只对控制输入或参数估计限幅是不够的,为了满足系统性能和安全方面的要求,需要对位移–速度等系统状态进行约束.因此,在控制器设计时考虑状态约束问题是值得研究的课题.近年来,障碍李雅普诺夫函数(barrier Lyapunov function,BLF)技术逐渐发展成为处理非线性系统,如严格反馈系统[12–14]、纯反馈系统[15–16]以及Brunovsky系统[17]约束问题的有效方法.在现有相关文献中,学者们已经提出BLF的3种主要类型.a)对数型BLF函数.文献[12]研究了一类输出受限的严格反馈系统的控制问题,并提出一种新的对数分段BLF函数,即非对称对数BLF函数.文献[16]利用均值定理将非仿射系统转化为仿射系统,并引入对数BLF函数设计了全状态受约束控制器.文献[18]基于非对称对数BLF函数,提出了动态面控制方案用于解决一类非线性系统的时变输出约束.b)积分型BLF函数.文献[19]设计了一种能兼顾状态约束和响应特性的积分型BLF函数.c)正切型BLF函数.文献[20]设计了一种自适应容错控制器,并采用正切时变BLF函数实现状态约束.文献[21]提出一类正切障碍复合能量函数,解决了带有参数和非参数不确定性系统的迭代学习控制问题.相较于上面的3类BLF函数形式,文献[22]首次提出新的BLF函数:二次分式型障碍李雅普诺夫函数(quadratic-fraction BLF,QFBLF)用于控制器设计.该二次分式型BLF函数只包含简单分式,且数值计算简单,更有利于实际系统中的实现.文献[23]考虑了一类非参数不确定系统的学习控制问题,利用QFBLF函数设计控制器,实现控制过程中的状态约束.尽管基于BLF函数思路来解决系统的状态约束或输出约束问题已经有了一些研究成果,仍需要进一步深入探讨.
本文考虑一类严格反馈非线性系统的状态约束学习控制问题,拟构造QFBLF函数的两种典型形式:对称QFBLF 函数(symmetric QFBLF,SQFBLF)和非对称QFBLF函数(asymmetric QFBLF,AQFBLF)来分别设计控制器.前者采用微分学习律估计未知参数,后者采用微分–差分学习律估计未知参数.同时,文中引入一级数收敛序列消除扰动对系统跟踪性能的影响.分析表明,两种控制算法均能实现系统输出在预指定作业区间上对参考信号的精确跟踪.同时,通过将跟踪误差囿于预设的界内,从而保持系统状态在约束区间内.
2 问题描述和预备
2.1 问题描述
考虑在有限时间区间[0,T]上的严格反馈非线性系统
定义状态误差
其中αi,k是虚拟控制,将在后面给出.
假设1存在已知常数δi,满足
一般地,重复作业系统的复位点不一定与期望轨迹初态一致,但复位点落在以期望轨迹初态为中心的某一邻域内,这一点是可以被允许的,因此假设1是合理的.
由于系统(1)中存在扰动,为了防止系统发散,需要借助一级数收敛序列{∆k}.
定义1级数收敛序列{∆k}定义为[5]
其中:k=1,2,···;给定常数q0∈R,m2∈N.
对式(5)两边关于k求和,并取极限,得到
2.2 期望误差轨迹设计
式中:i=1,2,···,n;t1∈[0,T]是从非0到0的过渡点;ξi(t)用于描述ei,k的衰减性能.对于ξi(t)的表达式,除了它是时间区间[0,t1]上的单调递减函数外,还需满足下面的条件:
1)ξi(0)=1;
2)ξi(t1)=0;
定义跟踪误差
其中t∈[0,T].由式(7)和条件(1)知,εi,k在t=0时满足εi,k(0)=0,∀k.
本文的控制目标是,设计学习控制器uk,使得迭代学习中跟踪误差囿于预设的界内,从而保持系统状态在约束区间内;同时实现系统输出在预指定作业区间(t1,T]上精确跟踪参考信号.
2.3 二次分式型BLF函数
为了设计约束学习控制器的需要,这里先给出QFBLF函数的两种典型形式.
1) 对称QFBLF函数的形式为
2) 非对称QFBLF函数的形式为
式中:i=1,2,···,n,常数bi1>0∈R,bi2>0∈R,且bi1bi2.应用式(10)时,需假设实现时系统所受到的各种干扰无法使得εi,k <−bi1及εi,k >b2i.
为表达简便,在不引起混淆之处,文中略去函数的时间自变量.
3 学习控制器的设计与性能分析
针对系统(1),文中将基于二次分式型障碍李雅普诺夫函数,并结合反推技术进行控制器的设计.在步骤1到步骤n−1中设计虚拟控制量αi,k;步骤n中设计控制律uk.由于系统中存在扰动,在控制器的设计过程中,利用定义1的级数收敛序列来防止系统发散.
3.1 对称QFBLF函数情形
系统(1)的控制器设计基于对称QFBLF函数(9),且未知参数θ采用微分学习律进行估计.
步骤1令ω1,k=φ1,k,D1,k=d1,k,对ε1,k求导,得
假设2其中ψ1为未知参数;p1,k:RR+是已知光滑函数.
由Young′s不等式,根据假设2,有如下不等式成立:
取如下对称QFBLF函数:
步骤i(2in−1) 类似于步骤1,对εi,k求导,得
假设3其 中ψi是未知参数,pi,k:是已知光滑函数.
由Young′s 不等式,根据假设3,有如下不等式成立:
取如下对称QFBLF函数:
步骤n对εn,k求导,得
假设4其中ψn是未知参数,pn,k:是已知光滑函数.
由Young′s不等式,根据假设4,有如下不等式成立:
设计控制律
微分学习律
将式(26)代入式(24),结合假设4及式(25),得
取如下对称QFBLF函数:
定理1非线性系统(1),满足假设1–5,并且满足初值条件|xi,k(0)|<,采用控制律(26)以及微分学习律(27),则系统有以下性质:
i) 系统中所有信号有界,且
ii) 保证迭代运行过程中,|εi,k| 证 i)变量有界性和系统收敛性. 式(30)代入式(32),取k=1,2,···,N并求和,得 ii) 系统状态的有界约束. 在各次迭代过程中,有|εi,k| 证毕. 由定理1可以看出,运用本节构造的对称二次分式型障碍Lyapunov函数,通过囿于εi,k在预设的界内,从而实现状态约束. 相比于对称障碍Lyapunov 函数,非对称障碍Lyapunov函数更具一般性.后者在控制器设计时能获得更好的控制性能,但同时也增加了设计难度.进一步地,自适应迭代学习控制中的参数估计通常基于时间域的自适应律[3]或者迭代域的学习律[6].文献[2]中的参数估计采用微分–差分学习律,有效结合了时间域–迭代域两个维度的估计信息.针对系统(1),下面将基于非对称QFBLF函数(10)设计控制器,参数估计采用微分–差分学习律. 本节控制器设计过程中使用的假设以及变量同第3.1节的描述,这里只给出不相同的变量及其说明. 在第3.1节中使用了式(12)(19)(25),下面分析时需要使用类似的不等式 取如下非对称QFBLF函数: 式中:η是常数,且η∈[0,1).对V1,k求导,将式(40)代入,结合假设2及式(38),得 对Vi,k求导,将式(44)代入,结合假设3及式(38),得 设计控制律 取如下非对称QFBLF函数: 对Vn,k求导,将式(48)–(49)代入,结合假设4及式(38),得 i) 系统中所有信号有界,且 ii) 保证迭代运行过程中,−bi1<εi,k 证 i)变量有界性和系统收敛性. 选择第k次的障碍Lyapunov泛函为 连续2次迭代周期的差分为 由(B−A)Γ−1(2A−2C)+(B−A)Γ−1(B−A)−(B−C)Γ−1(B−C)=−(C−A)TΓ−1(C−A),则式(54)的最后两项得到 ii) 系统状态的有界约束. 由定理2可以看出,运用本节构造的非对称二次分式型障碍Lyapunov函数,通过将εi,k囿于预设的界内,亦能实现状态约束. 综上,本文通过构造期望误差轨迹来解决迭代学习控制的初值问题,且期望误差轨迹的设计方法简单.给出了QFBLF函数的两种典型形式并分别设计了带约束机制的控制器.由定理1–2的分析和证明部分可以看出,系统跟踪误差在迭代过程中囿于预设的界内,从而实现对系统状态的有界约束. 为了验证所提控制算法的有效性,考虑如下二阶严格反馈非线性系统: 给定参考信号为[cos(2πt)−2πsin(2πt)]T.设定各个参数值以及参数估计初值如下: 取φ1,k=[1x1,k]T,φ2,k=[x1,k+x2,k1]T.外部扰动为 状态初值为 根据对称QFBLF函数和非对称QFBLF函数这两种情形,分别进行仿真. 1)对称QFBLF函数情形. 设定|x1,k|<1.7,|x2,k|<8.28以及b1=0.1,b2=2,采用控制律(26)以及微分学习律(27),迭代5次的仿真结果如图1–4所示. 图1 情形1下的x1(t)及参考信号r1(t)Fig.1 x1(t)and the reference signal r1(t)in Case 1 图3 情形1下的e1(t)及期望误差轨迹Fig.3 e1(t)and the expected error trajectoryin Case 1 图4 情形1下的误差性能指标JkFig.4 Error performance index Jk in Case 1 为了比较,采用无约束学习控制律 以及微分学习律 进行仿真.期望误差轨迹的构造形式及各参数值选取同对称QFBLF函数的仿真.图5是控制律(60)作用下,|ε1,k|随迭代次数(k=20)变化的情况.可以看出,学习律参照式(61)的无约束学习控制算法不能保证Jkb1,且需要的迭代次数更多. 图5 情形1下无约束的Jk收敛过程Fig.5 Jk without SQFBLF in Case 1 2) 非对称QFBLF函数情形. 设定−1.7 采用控制律(47)以及微分–差分学习律(48),迭代5次后的仿真结果如图6–9所示. 图6 情形2下的x1(t)及参考信号r1(t)Fig.6 x1(t)and the reference signal r1(t)in Case 2 图8 情形2下的e1(t)及期望误差轨迹Fig.8 e1(t)and the expected error trajectory in Case 2 图9 情形2下的误差性能指标JkFig.9 Error performance index Jk in Case 2 同样为了比较,采用控制律(60),并使用微分–差分学习律 进行仿真.期望误差轨迹的构造形式及各参数值选取同非对称QFBLF函数情形仿真.图10是控制律(60)作用下,|ε1,k|随迭代次数(k=20)变化的情况.可以看出,学习律参照式(62)的无约束学习控制算法亦不能保证Jkb1. 图10 情形2下无约束的Jk收敛过程Fig.10 Jk without AQFBLF in Case 2 图1和图6表明,从时间0.2 s起系统输出精确跟踪上参考信号;图3和图8表明,所提出的两种控制算法均能在任意初值下实现状态误差在整个作业区间上完全跟踪期望误差轨迹;图4和图9可以看出,在迭代过程中|ε1,k(t)|,t∈[0,T]被限制于[0,b1]区间内. 针对一类严格反馈非线性系统,文中给出能够实现状态约束的迭代学习控制算法.通过构造两类形式简单的二次分式型障碍Lyapunov函数,结合反推技术分别设计控制器,使得系统状态在迭代过程中保持在约束区间内.控制器设计过程中考虑了扰动对系统跟踪性能的影响,为防止系统发散引入了级数收敛序列.构造期望误差轨迹解决了迭代学习控制中的初值问题,经迭代学习,实现系统输出在预指定作业区间上精确跟踪参考信号.由仿真结果对比可以看出,采用约束机制设计的控制器可以得到更好的控制性能.需要说明的是,文中提出的二次分式型障碍Lyapunov函数是新颖的,基于它的控制器设计方法适用于更广泛的动态系统,有待进一步研究.3.2 非对称QFBLF函数情形
4 数值仿真
5 结论