非线性分布参数切换系统事件触发采样迭代学习控制
2024-11-05盛程相戴喜生
摘 要:本文研究了一类非线性分布参数切换系统事件触发采样迭代学习控制问题。基于系统的输入和系统的输出数据采样,利用Lyapunov函数的方法得出事件触发条件,使得控制器只在事件触发条件被满足时才更新,有效地减少了迭代学习过程中控制器的更新。通过严格的数学推导证明了事件触发采样迭代学习控制的收敛性。最后,通过数值仿真实验验证了算法的有效性。
关键词:分布参数切换系统;数据采样;迭代学习控制;事件触发
中图分类号:TP273 DOI:10.16375/j.cnki.cn45-1395/t.2024.04.008
0 引言
切换系统由子系统和子系统之间的切换规律组成,其作为一类典型的特殊混杂系统,被广泛应用于电力系统[1]、交通控制系统[2]、化学过程[3]中。采样控制是一种基于离散信号的控制策略,控制器会在固定的周期上获取系统的信息,并通过采样得到的数据对系统进行控制。关于切换系统采样控制的研究,目前已在自适应控制[4]、T-S模糊系统[5]、Markovian切换[6]等相关研究上取得了一些成果。文献[7]研究了具有异步现象的连续时间切换T-S模糊系统的量化采样数据控制问题。文献[8]研究了二阶非线性系统异构多智能体切换系统的采样数据一致性问题。类似于集中参数系统,分布参数系统的采样控制也得到了学者们的广泛关注,最早可追溯至1988年[9]。目前,随着数字控制技术的发展,分布参数系统的采样控制已成为研究热点,在指数稳定[10]、鲁棒控制[11]、模糊控制[12]、分布参数时滞系统[13]、非线性抛物型分布参数系统[14]等方面都有相应的研究成果。
迭代学习控制是一种具有广泛应用前景的智能控制方法,其以优异的跟踪控制性能有效地应对重复性和周期性的控制任务;同时由于其在工业领域的重要价值和应用潜力,迭代学习控制已成为一个备受关注的研究领域。文献[15]研究了一类具有高相对度的非正则离散抛物型分布参数系统的迭代学习控制问题。相比于传统的迭代学习控制,采样迭代学习控制更加符合实际工业数字控制的要求。文献[16]研究了一种具有不确定性的非线性连续系统,并提出了一种采样迭代学习控制器。文献[17]针对非线性系统提出了一种任意相对度的采样迭代学习控制,该学习算法不需要对跟踪误差进行任何阶次的数值微分。文献[18]研究了时滞非线性系统的采样迭代学习问题,当不存在初值误差和不确定扰动时,算法可以使其在采样点实现完全跟踪。文献[19]研究了具有局部Lipschitz连续的非线性非仿射系统的数据采样迭代学习控制问题。根据现有的切换系统采样控制研究,尚未发现针对分布参数切换系统采样的研究。因此,对本文所涉及的切换系统进行采样迭代学习控制研究具有重要意义。
事件触发控制较早可以追溯到2002年,在文献[20]中作者将其称为Lebesgue采样控制,并对比线性随机系统在时间触发和事件触发2种机制作用下的不同,得出了事件触发机制具有更好性能的结论。文献[21] 针对带有输入限制的多智能体系统中存在通信带宽限制的问题,提出了基于编码-解码器量化器的事件触发条件,有效降低了控制器的更新频率,节约了系统资源的消耗。近十年,学者们为了节约在迭代学习控制过程中控制器的资源利用问题,将事件触发机制应用到迭代学习控制的研究当中。在关于事件触发迭代学习控制问题的研究中,事件触发条件设计的合理性是整个研究过程的核心问题,也是学者最关心的问题之一。文献[22-23]采用了一种Lyapunov函数的方法推导出事件触发条件。文献[24-25]通过2D系统建模的方法对事件触发迭代学习控制的收敛性进行了分析。事件触发迭代学习控制能够有效地解决复杂系统的跟踪控制问题,在多智能体方面,学者们对其进行了大量的研究,目前已在带有量化器的多智能体系统[26]、非同阶分数阶多智能体系统[27]、固定有向图下的无模型多智能体系统[28]、非仿射非线性离散时间多智能体系统[29-30]、具有切换拓扑的异构网络多智能体系统[31]、数据丢包的多智能体系统[32]、多地铁列车系统[33]等取得了相关的成果。文献[34]进一步分析了局部Lipschitz非线性多智能体系统的鲁棒跟踪问题,提出了一种基于观测器的分布式事件触发迭代学习控制框架。
本文针对非线性分布参数切换系统,提出了事件触发采样迭代学习控制方法。根据Lyapunov函数的方法得出事件触发条件,在每次迭代过程中依据事件触发条件的判断情况进行更新学习。通过足够次数的迭代后,可以使得系统输出在采样时刻上达到完全跟踪。采用本文对控制器的设计方法,控制器的更新频率低于传统迭代学习,能有效地节约资源。
本文中,[Rn]和[Rn×m]分别表示[n]维Euclidean空间和[n×m]维实数矩阵空间。对于[n]维向量[c=(c1,c2,…,cn)],其范数的定义为[‖c‖=l=1nc2l]。对于[n×m]维矩阵[A],其范数的定义为[‖A‖=λmax(ATA)],其中[λmax(⋅)]是矩阵最大特征值。[L2(Ω)]是定义在有界开子集[Ω]上的平方可积函数组成的Banach空间。对于[ω(x)∈L2(Ω)⋂Rn],其[L2]范数的定义为[‖ω‖L2=(ΩωT(x)ω(x)dx)12]。对于[f(x,s):Ω×N→Rn],[f(⋅,s)∈L2(Ω)⋂Rn],[s∈N],[N]为自然数,其[(L2, λ)]范数的定义为[‖f‖(L2, λ)=sups∈[0,n]{a-λs‖f(⋅,sh)‖2L2}],其中[a>1],[λ>0],h为采样时间,是一个固定的常数。
1 问题描述
考虑如下重复运行在[[0,T]]上的分布参数切换系统
[∂Qk(x,t)∂t=ΔQk(x,t)+fα(t)(t,Qk(x,t),uk(x,t)),yk(x,t)=gα(t)(t,Qk(x,t))+Gα(t)(t)uk(x,t),]
(1)
式中:[Qk∈Rn]是系统状态向量,其中[k]是迭代批次;[x]是空间变量,[t]是时间变量,[(x,t)∈Ω×[0,T]],[Ω∈Rq]是带有光滑边界的有界开子集;[Δ]是定义在[Ω]上的Laplace算子,即[Δ=z=1q∂2/∂x2z];[fα(t)],[gα(t)]是一系列非线性函数;[uk∈Rm]是控制输入向量;[yk∈Rw]是系统输出向量;[Gα(t)(t)]是具有合适维数的矩阵;[α(t)]是切换规则,[α(t):[0,T]→M=[1,2,… ,m]]。
假设1 对于上述系统,其第一个子系统的初始状态和期望的初始状态相同,边界条件为Dirichlet边界条件,即[Q(0,t)=Q(l,t)=0],[l>0]。
假设2 对于给定的期望轨线[yd(x,t)],存在唯一的期望输入[ud(x,t)]和期望状态[Qd(x,t)]。
假设3 任意一个子系统只激活1次,子系统的切换规则:
[α(t)=i=1, 0≤t<t1,2, t1≤t<t2, …m, tm-1≤t≤T.] (2)
假设4 [fi,gi : L2(Ω)→L2(Ω)⋂Rn],存在常数[Lfi、Lgi>0],[i=1,2,… ,m],使得
[‖fi(t,Q1,u1) -fi(t,Q2,u2)‖= ][Lfi(‖Q1-Q2‖+‖u1-u2‖),] (3)
[‖gi(t,Q1)-gi(t,Q2)‖=Lgi‖Q1-Q2‖.] [(4)]
本文将采样控制器应用于非线性分布参数切换系统中。在每一个被激活的切换子系统中采样[ni+1]次,采用符号[ts,i]表示采样时刻,其中[i]表示被激活的子系统,[s]表示在被激活的子系统[i]中的采样时刻,[s∈{0,1,… ,ni}]。在任意2个相邻的采样时刻之间的采样区间是一个固定的常数[h],这意味着系统的控制输入表示为[uk(x,t)=uk(x,ts,i)],[t∈(ts,i,ts,i+h)]。为了确保在每一个被激活的子系统中至少存在一个采样时刻,切换子系统的最小运行时间[τd]应大于采样区间常数[h]。本文提出的事件触发采样迭代学习控制的控制目标是在非线性分布参数切换系统的采样时刻实现完全跟踪。
2 主要结论
2.1 事件触发条件
首先,定义事件触发误差为[δek(x,ts,i),]有[δek(x,ts,i)=][ekl-1(x,ts,i)-ek(x,ts,i)],其中[ekl-1(x,ts,i)=ykl-1(x,ts,i)-yd(x,ts,i)],[ek(x,ts,i)=] [yk(x,ts,i)-] [yd(x,ts,i)]。[ts,i]时刻的触发误差是该时刻上一次事件触发的输出误差与该时刻第[k]次迭代的输出误差之间的差值,[k>kl-1]。根据Lyapunov函数的原理,沿迭代方向上建立一个正定的函数[V(k,ts,i)=‖ek(⋅,ts,i)‖2L2]。
[ΔV(k,ts,i)=V(k,ts,i)-V(k-1,ts,i)= ‖ek(⋅,ts,i)‖2L2-‖ek-1(⋅,ts,i)‖2L2= ‖ekl-1(⋅,ts,i)-eet,k(⋅,ts,i)‖2L2-‖ek-1(⋅,ts,i)‖2L2.(5)]
注1 其中的事件触发误差为第[k]次的事件触发误差。须经过事件触发条AuHwAKVpOJU2TqYNFmsMyw==件的判断才能确定第[k]次是否为[kl]。因此,第[k]次的系统输入应该保持与[kl-1]一致,即[δek(x,ts,i)=gi(ts,i,Qkl-1(x,ts,i))-gi(ts,i,Qk(x,ts,i))]。
当[ΔV(k,ts,i)<0],则可以在控制输入不变的情况下保证系统收敛;当[ΔV(k,ts,i)≥0],则当前的控制输入不能保证系统收敛,需要对控制器进行更新。在此基础上引入一个可调节的事件触发参数[β],得到本文的事件触发为
[kl=inf{k>kl-1‖ekl-1(⋅,ts,i)-eet,k(⋅,ts,i)‖2L2- β‖ek-1(⋅,ts,i)‖2L2≥0}.] (6)
注2 事件触发参数[β∈[0,1]],其能够有效地改变事件触发机制的松弛度。当事件触发参数[β=0]时,事件触发机制将失去其筛选数据的效果。
2.2 控制器设计和收敛性分析
带有零阶保持器的开环事件触发采样迭代学习控制器设计如下,
[uk(x,t)=ukl-1(x,ts,i)+Γekl-1(x,ts,i), k=kl,ukl-1(x,ts,i), k∈(kl-1,kl),] (7)
式中:[t∈[ts,i,ts,i+h)];[Γ]是开环迭代学习控制增益。
注3 在采样时刻上,当满足事件触发条件(6)时,该控制器会进行更新;当不满足事件触发条件(6)时,该控制器保持上一次迭代学习控制的输入。在采样区间上,通过零阶保持器对控制输入进行保持。
定理1 对于满足假设1—假设3的分布参数切换系统,在开环事件触发迭代学习控制(7)以及事件触发条件(6)的作用下,若下面不等式成立:
[2λGiΓ<1, i=1, 2 ,… , m][,]
其中[λGiΓ=maxn∈[0,ni]λmax((I+Gi(nh)Γ)T(I+Gi(nh)Γ))],则系统在[k→∞]时,[‖ek(⋅,ts,i)‖2L2]收敛到0。
证明 根据事件触发和非事件触发这2种情况来证明事件触发采样迭代学习控制的收敛性。
步骤1 考虑事件触发的情况,即[k=kl]。
1)当第一个子系统被激活时,[t∈[0,t1)]。
在采样区间[[(n-1)h,nh]]上有
[∂∂tQkl(x,t)=ΔQkl(x,t)+(f1(t,Qkl(x,t),ukl(x,t))-]
[f1(t,Qkl-1(x,t),ukl-1(x,t))).] (8)
对式(8)两边同时乘[Qkl(x,t)],可以得到
[12∂∂t(QTkl(x,t)Qkl(x,t))=QTkl(x,t)ΔQkl(x,t)+]
[QTkl(x,t)(f1(t,Qkl(x,t),ukl(x,t))- f1(t,Qkl-1(x,t),ukl-1(x,t)),] fsJZ3ChLlfiiUtAhWSZQZg== (9)
式中:[Qkl(x,t)=Qkl(x,t)-Qkl-1(x,t)]。
将式(9)两边对[x]进行积分,根据[L2]范数的定义,得到
[ddt(‖Qki(⋅,t)‖2L2)=2ΩQTkl(x,t)ΔQkl(x,t)dx+][2ΩQTkl(x,t)(f1(t,Qkl(x,t),ukl(x,t))-]
[f1(t,Qkl-1(x,t),ukl-1(x,t))]<C:\Users\PC64\Desktop\2wzr广西科技大学学报第4期\Image\W方括号.eps> [dx≤2QTkl(x,t)∇Qkl(x,t)|x∈∂Ω-]
[2ΩQTkl(x,t)∇Qkl(x,t)dx+(Lf1+1)‖Qkl(⋅,t)‖2L2+]
[Lf1‖ukl(⋅,t)‖2L2,] (10)
式中:[ukl(x,t)=ukl(x,t)-ukl-bL3tatZWRC6NC92DsVJtrg==1(x,t)]。
对不等式(10)两边关于[t]进行积分,并使用Bellman-Gronwall不等式,得到
[ ‖Qkl(⋅,nh)‖2L2 ≤‖Qkl(⋅,(n-1)h)‖2L2+(n-1)hnh(ξ‖Qkl(⋅,τ)‖2L2+ ζ‖ukl(⋅,τ)‖2L2)dτ ≤exp(ξnh)‖Qkl(⋅,(n-1)h)‖2L2+(n-1)hnhexpξ(nh-τ)ζ‖ukl(⋅,τ)‖2L2dτ ≤exp(ξT)‖Qkl(⋅,(n-1)h)‖2L2+ζ‖ukl(⋅,(n-1)h)‖2L2(n-1)hnhexpξ(nh-τ)dτ =κ‖Qkl(⋅,(n-1)h)‖2L2+φ‖ukl(⋅,(n-1)h)‖2L2 ≤κn‖Qkl(⋅,t0,1)‖2L2+φj=0n-1κn-1-j‖ukl(⋅, jh)‖2L2, (11)]式中:[ξ=maxi∈MLfi+1],[ζ=maxi∈MLfi],[κ=exp(ξT)],[φ=ζ((exp(ξh)-1)/ξ)]。
在采样时刻[nh]上有
[ukl(x,nh)-ukl-1(x,nh)=Γekl-1(x,nh),] (12)
[ekl(x,nh)=ekl-1(x,nh)+ykl(x,nh)-ykl-1(x,nh)=]
[(g1(nh,Qkl(x,nh))-g1(nh,Qkl-1(x,nh)))+ekl-1(x,nh),]
(13)
其中[ekl-1(x,nh)=(I+G1(nh)Γ)ekl-1(x,nh)]。
依据式(12)、式(13)可以得到
[uTkl(x,nh)ukl(x,nh)≤λΓeTkl-1(x,nh)ekl-1(x,nh),] (14)
[eTkl(x,nh)ekl(x,nh)≤2λG1ΓeTkl-1(x,nh)ekl-1(x,nh)+]
[ 2(g1(nh,Qkl(x,nh))-g1(nh,Qkl-1(x,nh)))T× (g1(nh,Qkl(x,nh))-g1(nh,Qkl-1(x,nh))), (15)]
其中[λΓ=λmax(ΓTΓ)] ,[λG1Γ=maxn∈[0,n1]λmax(I+G1(nh)Γ)T×]
[(I+G1(nh)Γ)]。
将式(14)、式(15)两边对[x]进行积分,根据[L2]范数的定义,得到
[‖ukl(⋅,nh)-ukl-1(⋅,nh)‖2L2≤λΓ‖ekl-1(⋅,nh)‖2L2,] (16)
[‖ekl(⋅,nh)‖2L2≤2λG1Γ‖ekl-1(⋅,nh)‖2L2+2L2g1‖Qkl(⋅,nh)‖2L2≤ 2λG1Γ‖ekl-1(⋅,nh)‖2L2+2L2g1λΓφj=0n-1κn-1-j‖ukl(⋅,jh)‖2L2+][ ][2L2g1κ‖Qkl(⋅,t0,1)‖2L2.] (17)
对不等式(17)两边同时乘[κ-λn],根据[(L2,λ)]范数的定义,得到
[ ‖ekl‖(L2,λ)≤2λG1Γ‖ekl-1‖(L2,λ)+2L2g1λΓφsupn∈[0,n1]κ-λnj=0n-1κn-1-j‖ekl-1(⋅,jh)‖2L2+2L2g1supn∈[0,n1]κ-λnκn‖Qkl(⋅,t0,1)‖2L2, (18)]
式中:
[supn∈[0,n1]κ-λnj=0n-1κn-1-j‖ekl-1(⋅,jh)‖2L2= κ-1supn∈[0,n1](j=0n-1κ-λj‖ekl-1(⋅,jh)‖2L2κ(λ-1)(j-n))≤ κ-1supn∈[0,n1](j=0n-1supn∈[0,n1]κ-λj‖ekl-1(⋅,jh)‖2L2κ(λ-1)(j-n))= ‖ekl-1‖(L2,λ)×κ-1supn∈[0,n1]j=0n-1κ(λ-1)(j-n)= ‖ekl-1‖(L2,λ)×1-κ-(λ-1)n1κλ-κ, (19)]
根据式(18)、式(19)可以得到
[‖ekl‖(L2, λ)≤(2λG1Γ+2L2g1λΓφ×1-κ-(λ-1)n1κλ-κ)‖ekl-1‖(L2, λ).] (20)
根据定理1的条件,取足够大的[λ],使下面不等式成立:
[2λG1Γ+2L2g1λΓφ×1-κ-(λ-1)n1κλ-κ≤ρ1<1,]
可得到第一个子系统[limkl→∞‖ekl‖(L2, λ)→0]的结论。
2)当第二个子系统被激活时,[t∈[t1,t2).]
情况1:在采样区间内不发生切换,切换序列[α(t)=i],[t∈[tn1,1,t0,2)]。
[‖Qkl(⋅,t0,2)‖2L2≤φj=0n1κn1-j‖ukl(⋅,jh)‖2L2.] (21)
情况2:在采样区间内发生切换,切换序列[α(t)=i],[t∈[tn1,1,t1)];[α(t)=l],[t∈[t1,t0,2)]。
[‖Qkl(⋅,t0,2)‖2L2≤κφj=0n1κn1-j‖ukl(⋅,jh)‖2L2+φ‖ukl(⋅,n1h)‖2L2.] (22)
在第一个子系统的收敛性的证明中,可以得到[limkl→∞‖ekl‖(L2, λ)→0]的结论,进一步可以得到[limkl→∞‖ukl‖(L2, λ)→0],依据[(L2,λ)]的定义可以得到[limkl→∞‖ukl(⋅,ts,1)‖L2→0]。结合对第二个子系统第一个采样时刻的分析,得出[limkl→∞‖Qkl(⋅,t0,2)‖L2→0] 。
类似地,根据不等式(20)可以得到
[‖ekl‖(L2, λ)≤(2λG2Γ+2L2g2λΓφ×1-κ-(λ-1)n2κλ-κ)‖ekl-1‖(L2, λ).] (23)
根据定理1的条件,取足够大的[λ],使下面不等式成立:
[2λG2Γ+2L2g2λΓφ×1-κ-(λ-1)n2κλ-κ≤ρ2<1,]
可得到第二个子系统[limkl→∞‖ekl‖(L2, λ)→0]的结论。
以此类推,同样可以证明在[[t2,t3),… ,[ti-1,T]]上,[‖ekl‖(L2, λ)]收敛到0,即[limkl→∞‖ykl(⋅,ts,i)-yd(⋅,ts,i)‖L2→0]。
步骤2 考虑非事件触发的情况,即[k∈(kl-1,kl)]。当第一个子系统被激活时,
[yk(x,nh)-ykl-1(x,nh)=]
[g1(nh,Qk(x,nh))-g1(nh,Qkl-1(x,nh)).] (24)
进一步可以得到
[‖ykl(⋅,nh)‖2L2≤L2g1‖Qkl(⋅,nh)‖2L2,] (25)
式中:[ykl(x,nh)=yk(x,nh)-ykl-1(x,nh)],[Qkl(x,nh)=Qk(x,nh)-Qkl-1(x,nh)]。
依据不等式(11),同理可得
[‖Qkl(⋅,nh)‖2L2≤κn‖Qkl(⋅,t0,1)‖2L2+ φj=0n-1κn-1-j‖ukl(⋅,jh)‖2L2,] (26)
式中:[ukl(x,nh)=uk(x,nh)-ukl-1(x,nh)]。
对不等式(26)两边同时乘[κ-λn],根据[(L2, λ)]范数的定义,得到
[‖ykl‖(L2, λ)≤κ-λnL2g1φj=0n-1κn-1-j‖ukl(⋅, jh)‖2L2+ L2g1κ-λnκn‖Qkl(⋅,t0,1)‖2L2≤ L2g1φ‖ukl‖(L2, λ)×1-κ-(λ-1)n1κλ-κ. (27)]
在同一迭代批次中,非事件触发时刻的系统输入保持不变;事件触发时刻的系统输入[limkl→∞‖ukl‖(L2, λ)→0]。因此可知[limkl→∞‖ukl‖(L2, λ)→0],进一步得到[limkl→∞‖ykl‖(L2, λ)→0]。以此类推,同样可以证明在[[t1,t2),… ,[ti-1,T]]上[limkl→∞‖ykl‖(L2, λ)→0]。依据[(L2, λ)]的定义可以得到[limkl→∞‖yk(⋅,ts,i)-ykl-1(⋅,ts,i)‖L2→0],[i=1,2,… ,m]。
总结上述步骤1和步骤2可知,系统的输出将随着事件触发迭代学习收敛到0,而在非事件触发情况下,系统的输出将会沿上一次事件触发的系统输出收敛。
3 仿真算例
本节通过一个数值仿真的例子来验efe2e6023ab8dbef5a22ce5ac4d48dba81a6da61f505c57fc7fc882efe51057f证分布参数切换系统事件触发采样迭代学习控制的有效性。考虑具有2个子系统的分布参数切换系统,其相对应的参数如下:
[f1(x,t)=1.5sin t0.20.8-2.5cos(Qk,1(x,t))cos(Qk,2(x,t))+]
[-1.1e-t0.80.2-1.3][ uk,1(x,t)uk,2(x,t),]
[f2(x,t)=1.50.8cos t0.5-2cos(Qk,1(x,t))cos(Qk,2(x,t))+]
[-0.50.50-1.5sin tuk,1(x,t)uk,2(x,t)][ ,]
[g1(x,t)=0.61.3cos t0.62.4sin(Qk,1(x,t))sin(Qk,2(x,t))][ ,]
[g2(x,t)=0.510.9e-t2sin(Qk,1(x,t))sin(Qk,2(x,t))][ ,]
[G1=-cos t00-1][ ,]
[G2=-cos t00-1][ ,]
式中:[(x,t)∈[0,1]×[0,1]]。给定参数[β=0.995],[Γ=[0.8 0;0 0.5]]。2个子系统之间的切换规则如图1所示。
给出期望轨迹的表达式:
[yd(x,t)=5sin(5t)sin(πx)-10sin(2πt)sin(πx).]
该期望轨线如图2和图3所示。
图4和图5是系统在事件触发采样迭代学习控制方案下迭代第50次的输出,与图2和图3的期望轨迹接近重合。图6和图7是系统输出误差轨线,从图6和图7中得出最大的输出误差分别为3.77×10-5和4.71×10-5。
图8和图9描述的是在事件触发和非事件触发2种机制下,采样迭代学习控制的输出误差的L2范数的收敛情况。
注4 依据注2中对于事件触发参数[β]的描述,将事件触发参数[β]设置为0,这也就意味着事件触发条件失去了筛选数据的效果,在每次迭代过程中控制器在所有采样时刻都进行学习、更新,因此得到非事件触发采样迭代学习控制,也就是传统的采样迭代学习控制。
对比事件触发采样迭代学习和非事件触发采样迭代学习2种方案下的系统输出误差(图8和图9),可以看到,2种方案都可以使得系统的输出误差趋向于0,这意味着在2种控制方案下都可以使得系统输出渐进趋向于期望轨迹。图10表示在50次迭代过程中每一次迭代学习发生事件触发的采样时刻的数量,即相邻2次迭代之间控制器更新的数量,没发生事件触发的采样时刻也就意味着减少了控制器的更新,节省了资源。通过计算得出在50次迭代中,事件触发采样迭代学习控制相比于非事件触发采样迭代学习控制节约了39.8%。
注5 从图8和图9中看出,虽然事件触发采样迭代学习控制的输出误差的收敛速度相比于非事件触发采样迭代学习控制而言会相对较慢,但是仍然能够使得系统收敛到期望轨迹上。相比于输出误差的收敛速度变慢,事件触发采样迭代学习控制能够有效地节约每一次迭代学习控制器的更新。
4 结论
本文针对非线性分布参数切换系统,提出了一种基于事件触发机制的采样迭代学习控制算法,并利用Lyapunov函数设计事件触发条件。当满足事件触发条件时,控制器采用开环学习律对事件触发的采样时刻的控制输出进行更新学习。在事件触发和非事件触发2种情况下,对非线性分布参数切换系统事件触发采样迭代学习控制的收敛性进行了严格的分析。最后,通过数值仿真验证了文中提出的事件触发采样迭代学习控制在节省资源方面的优势。
参考文献
[1] OOBA T,FUNAHASHI Y. On a common quadratic Lyapunov function for widely distant systems[J]. IEEE Transactions on Automatic Control,1997,42(12):1697-1699.
[2] BALLUCHI A,DI BENEDETTO M D,PINELLO C,et al.Hybrid control in automotive applications:the cut-off control[J]. Automatica,1999,35(3):519-535.
[3] LENNARTSON B,TITTUS M,EGARDT B,et al.Hybrid systems in process control[J]. IEEE Control Systems Magazine,1996,16(5):45-56.
[4] LI S,AHN C K,CHADLI M,et al.Sampled-data adaptive fuzzy control of switched large-scale nonlinear delay systems[J]. IEEE Transactions on Fuzzy Systems,2021,30(4):1014-1024.
[5] SANG H,ZHAO J.Passivity and passification for switched T-S fuzzy systems with sampled-data implementation[J]. IEEE Transactions on Fuzzy Systems,2020,28(7):1219-1229.
[6] YANG T,HUANG X,WANG Z,et al.Aperiodic sampled-data synchronization of Markovian jump neural networks with partially known switching transition rates[J]. Communications in Nonlinear Science and Numerical Simulation,2023,126:107448.
[7] GUAN C X,CHEN W Z,YANG L,et al.Sampled-data asynchronous control for switched nonlinear systems with relaxed switching rules[J]. IEEE Transactions on Cybernetics,2022,52(11):11549-11560.
[8] ZOU W C,GUO J,AHN C K,et al.Sampled-data consensus protocols for a class of second-order switched nonlinear multiagent systems[J]. IEEE Transactions on Cybernetics,2023,53(6):3726-3737.
[9] TARN T J,ZAVGREN J R JR,ZENG X M.Stabilization of infinite-dimensional systems with periodic feedback gains and sampled output[J]. Automatica,1988,24(1):95-99.
[10] TAN Y,NEŠIĆ D.Sampled-data output feedback control of distributed parameter systems via semi-discretization in space[J]. IFAC Proceedings Volumes,2008,41(2):7749-7754.
[11] FRIDMAN E,BAR AM N.Sampled-data distributed H∞ control of a class of parabolic systems[C]//2012 IEEE 51st IEEE Conference on Decision and Control (CDC).Maui,HI,USA. 2012:7529-7534.
[12] WANG Z P,WU H N.Finite dimensional guaranteed cost sampled-data fuzzy control for a class of nonlinear distributed parameter systems[J]. Information Sciences,2016,327:21-39.
[13] WANG Z P,WU H N,WANG X H.Sampled-data control for linear time-delay distributed parameter systems[J]. ISA Transactions,2019,92:75-83.
[14] WANG J W,LI H X,WU H N.A membership-function-dependent approach to design fuzzy pointwise state feedback controller for nonlinear parabolic distributed parameter systems with spatially discrete actuators[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2017,47(7):1486-1499.
[15] 梅三各,戴喜生,余莎丽,等.高相对度非正则离散抛物分布参数系统迭代学习控制[J]. 广西科技大学学报,2019,30(1):31-38.
[16] CHIEN C J.The sampled-data iterative learning control for nonlinear systems[C]//Proceedings of the 36th IEEE Conference on Decision and Control.San Diego,CA,USA,1997:4306-4311.
[17] SUN M X,WANG D W.Sampled-data iterative learning control for nonlinear systems with arbitrary relative degree[J]. Automatica,2001,37(2):283-289.
[18] 姚仲舒,杨成梧.时滞非线性系统的采样迭代学习控制[J]. 控制理论与应用,2003,20(3):459-463.
[19] CHI R H,HUI Y,CHIEN C J,et al.Convergence analysis of sampled-data ILC for locally lipschitz continuous nonlinear nonaffine systems with nonrepetitive uncertainties[J]. IEEE Transactions on Automatic Control,2021,66(7):3347-3354.
[20] ASTROM K J,BERNHARDSSON B M.Comparison of Riemann and Lebesgue sampling for first order stochastic systems[C]//Proceedings of the 41st IEEE Conference on Decision and Control.Las Vegas,NV,USA,2002:2011-2016.
[21] 张海江,文家燕,谢广明,等.饱和约束下事件触发多智能体系统量化通信环形编队控制[J]. 广西科技大学学报,2022,33(4):44-50,69.
[22] LI H Y,LIN N,CHI R H.Event-triggered iterative learning control for linear time-varying systems[J]. International Journal of Systems Science,2022,53(5):1110-1124.
[23] LIN N,CHI R H,HUANG B,et al.Event-triggered nonlinear iterative learning control[J]. IEEE Transactions on Neural Networks and Learning Systems,2021,32(11):5118-5128.
[24] 余威,卜旭辉,梁嘉琪.基于二维系统的迭代学习事件触发鲁棒控制[J]. 控制理论与应用,2020,37(8):1701-1708.
[25] QI Y W,QU Z Y,YAO Z H,et al.Event-triggered iterative learning control for asynchronously switchedb5235d9da7ea93b8c180f8632809042f systems[J]. Applied Mathematics and Computation,2023,440:127662.
[26] ZHANG T,LI J M.Event-triggered iterative learning control for multi-agent systems with quantization[J]. Asian Journal of Control,2018,20(3):1088-1101.
[27] WANG L M,ZHANG G S.Event-triggered iterative learning control for perfect consensus tracking of non-identical fractional order multi-agent systems[J]. International Journal of Control,Automation and Systems,2021,19(3):1426-1442.
[28] HUA C C,QIU Y F,GUAN X P. Event-triggered iterative learning containment control of model-free multiagent systems[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2021,51(12):7719-7726.
[29] ZHAO H R,YU H N,PENG L.Event-triggered distributed data-driven iterative learning bipartite formation control for unknown nonlinear multiagent systems[J]. IEEE Transactions on Neural Networks and Learning Systems,2022,42(6):256-263.
[30] 赵华荣,彭力,谢林柏,等.多智能体系统的事件触发无模型迭代学习双向一致性[J]. 控制与决策,2022,37(10):2552-2558.
[31] LIN N,CHI R H,HUANG B.Event-triggered ILC for optimal consensus at specified data points of heterogeneous networked agents with switching topologies[J]. IEEE Transactions on Cybernetics,2022,52(9):8951-8961.
[32] 王宏伟,李昊哲.数据丢包下事件驱动的非线性多智能体迭代学习控制[J]. 控制理论与应用,2022,39(9):1688-1698.
[33] WANG Q,JIN S T,HOU Z S.Event-triggered cooperative model-free adaptive iterative learning control for multiple subway trains with actuator faults[J]. IEEE Transactions on Cybernetics,2023,53(9):6041-6052.
[34] LI H Y,LUO J H,MA H,et al. Observer-based event-triggered iterative learning consensus for locally lipschitz nonlinear MASs[J]. IEEE Transactions on Cognitive and Developmental Systems,2024,16(1):46-56.
Event-triggered sampled iterative learning control for nonlinear
distributed parameter switched system
SHENG Chengxiang1, 2 , DAI Xisheng*1, 2
(1. School of Automation, Guangxi University of Science and Technology, Liuzhou 545616, China; 2. Institute of Intelligent Systems and Control(Guangxi University of Science and Technology), Liuzhou 545616, China)
Abstract: In this paper, we studied the event-triggered sampled iterative learning control problem for a nonlinear distributed parameter switched system. Based on the sampling of the system input and system output, the method of Lyapunov function was used to obtain the event-triggered conditions, and the controller would be updated when the event-triggered conditions were satisfied, which effectively reduced the update of the controller in the iterative learning process. The convergence of the event-triggered sampled iterative learning control was proved through strict mathematical derivation. The effectiveness of the algorithm was verified by numerical simulation experiments.
Keywords: distributed parameter switched system; data sampling; iterative learning control; event-triggered
(责任编辑:黎 娅)
收稿日期:2023-10-19;修回日期:2024-01-05
基金项目:国家自然科学基金项目(62363002,61863004)资助
第一作者:盛程相,在读硕士研究生
*通信作者:戴喜生,博士,教授,研究方向:分布参数系统迭代学习控制,E-mail:mathdxs@163.com