考虑数据量化的改进无模型自适应迭代学习控制算法

2020-06-11朱盼盼卜旭辉梁嘉琪闫帅明

控制理论与应用 2020年5期

朱盼盼,卜旭辉,梁嘉琪,闫帅明

(河南理工大学电气工程与自动化学院,河南焦作 454000)

1 引言

迭代学习控制(iterative learning control,ILC)[1–3]是一种针对有限时间区间执行重复控制任务系统的有效控制手段.该方法利用上一次循环的系统输出误差和控制输入信号构建当前循环的控制输入信号,以获得比上一次循环更好的控制效果.经过了30多年的发展,迭代学习控制已经取得了丰富的理论结果,并在很多实际系统中得到了应用.值得说明的是,无模型自适应迭代学习控制是一种针对未知非线性系统的有效方法,它可以不需要系统模型的任何信息,就能实现迭代学习控制算法的设计和收敛性分析.目前,无模型自适应迭代学习控制已经取得了一些研究结果[4–6].

另一方面,实际中,控制系统已逐步由点对点方式的结构转换为网络控制系统(network control system,NCS)的结构.NCS具有减少系统布线、便于系统诊断和维护、增加系统的灵活性和稳定性等优点.然而,NCS也伴随着许多待解决的问题[7–8],例如数据量化[9]、网络引起的延迟[10]、数据丢失[11]等.其中,由于网络和闭环系统中一些设备(如A/D和D/A转换器)的传输容量有限,实际的NCS中传输的数据需要在发送到下一个网络节点之前进行量化.为了减少NCS中的传输负担,就必须要考虑数据量化的问题.

迭代学习控制的量化问题已有一些研究结果[12–16].文献[13–14]通过系统输出信号量化的研究,提出了一种基于对数量化器的迭代学习控制方法,并用扇形界的方法证明所提方法的跟踪误差收敛性.文献[15]设计了一种状态重置动态量化反馈控制器,用以抑制量化跳变对系统的影响,并验证了状态重置反馈控制系统是渐近稳定的.文献[16–18]研究了一类具有数据量化问题的迭代学习控制系统,针对均匀量化器进行了适当的优化,提出一种编码和解码机制.该机制与迭代学习控制相结合,结果证明其可以在线性和非线性系统中解决数据量化问题.但是目前针对模型未知系统的量化尚无研究.因此,本文针对存在数据量化的模型未知非线性系统,研究基于编码解码量化机制的无模型自适应迭代学习控制方法.

2 问题描述

考虑如下有限时间区间上重复运行的非线性离散时间单输入单输出(single input single output,SISO)系统:

其中:y(k,i)和u(k,i)分别表示第i次迭代和第k个采样时刻的系统输入和输出信号;k∈[0,1,…,T],i=1,2,…;ny和nu是两个未知的正整数;f(·)是一个未知非线性标量函数.

系统(1)满足以下两个假设:

假设1除了有限时刻点外,f(·)关于第(nu+2)个变量的偏导存在且连续.

假设2系统(1)沿迭代轴方向满足Lipschitz条件,即∀k∈[0,1,…,T]和∀i=1,2,…,若|∆u(k,i)|0,则下式成立:

其中:∆y(k+1,i)=y(k+1,i)−y(k+1,i −1),∆u(k,i)=u(k,i)−u(k,i −1),c>0是一个常数.

注1假设1和2对于许多实际控制系统是合理且容易满足的.对一般非线性系统,假设1是控制系统中的一种典型约束条件.对由于控制输入沿迭代轴方向变化引起的系统输出变化,假设2是对这种变化率上界的一种限制.很多实际系统都能满足这种假设,例如温度控制系统,压力控制系统和液位控制系统等.

引理1[4]对于满足假设1和2的系统(1),当|∆u(k,i)|0时,一定存在PPD的迭代相关的时变参数ϕ(k,i),使得系统(1)可以转化为如下形式的迭代轴上的紧格式动态线性化(CFDL)数据模型:

其中ϕ(k,i)是有界的.

注2数据模型(2)是非线性系统(1)的等效动态线性表示.它是一个线性时变数据模型,ϕ(k,i)本质上是个迭代相关的时变参数,且对任意迭代过程i的任意时刻k均有界.

由于网络带宽限制,系统(1)在实际执行时数据需要经过量化处理.本文考虑实际中使用较多的均匀量化器[18],其函数表达式表示如下:

注3为了更直观的研究量化器的结构,这里绘制了函数(3)的图像如图1 所示.定义量化误差信号为θ(k,i)=Q(y(k,i))−y(k,i),由标准均匀量化器(3)的性质可以明显看出,θ(k,i)是有界的.这种有界性与输出的具体值无关.本文用到的均匀量化器(3)满足不等式

图1 均匀量化器Q(v)的函数曲线图Fig.1 The function graph of uniform quantizer Q(v)

本文的目标是针对非线性系统(1),使用均匀量化器(3)处理量化过程,并通过对算法的设计实现对期望轨迹的零误差跟踪.若用yd(k)表示时刻k的系统期望值,即实现

3 控制方案

3.1 编码解码机制设计

研究表明,只依靠均匀量化器完成数据量化的过程,难以实现系统对期望轨迹完全跟踪的效果.为了实现零误差的跟踪目标,本小节为均匀量化器(3)增加编码解码机制.编码器和解码器的设计可参考文献[10],相关编码设计为

解码设计为

其中:y(k+1,i+1)和s(k,i+1)分别是编码器的输入信号和输出信号;s(k,i+1)是解码器的输入信号;(k+1,i)和∆(k,i)是解码器的输出信号.这里,b(i)起调整系统输出和编码器估计之间差异大小的作用.

3.2 控制算法设计

考虑带有编码解码机制(4)–(5)的均匀量化器(3),本小节对无模型自适应迭代控制算法的设计如下:

注4注意算法是基于可以重写为引理1的数据模型的系统,使用的均匀量化器的编码和解码机制由式(3)–(5)设置,另外,在式(6)–(8)中设计了控制器的算法.

为了更直观地表达控制器设计,图2中绘制了系统结构图.很明显,整个控制系统由受控系统,控制器,存储器和带有编码解码算法的均匀量化器组成.在控制器设计的中,控制器的算法由参数估计算法(6)、重置算法(7)和控制输入算法(8)组成.这里需要被量化的信号有系统输出信号与两时刻间输出信号差.

图2 带有编码解码的MFAILC系统结构图Fig.2 Structure diagram of MFAILC system with encoding and decoding mechaism

4 主要结果

针对非线性系统(1)设计的无模型自适应迭代学习控制算法,可得如下定理:

定理1对于满足假设1–3的系统(1),应用带有编码解码量化机制(3)–(5)的无模型自适应迭代学习控制算法(6)–(8),考虑一个满足yd(k)=yd=constant 的期望轨迹,存在0<η1,µ>µmin,是一个满足条件0

证本节分为a)b)c)3个部分去证明所提方法的收敛性.

a)带有编码解码机制量化器的性质.

在分析所提出的算法(6)–(8)的收敛性之前,有必要先研究编码和解码机制的重要特性.将编码器算法(4)的s(k,i+1)代入式(5)中系统输出的估计(k+1),可以得到

τ(k,i+1)代表量化器的输入输出信号误差,显然,∀k∈[0,1,…,T],∀i=1,2,…,有0|τ(k,i+1)|此外,由编码算法(4)和解码算法(5),容易推出

同样地,当输出误差信号∆y(k+1,i)被作为量化信号时,有

其中γ(k,i+1)表示信号∆(k+1,i+1)的量化误差,并且有

其中由量化器的性质易知,∀i=1,2,…,∀k∈[0,1,…,T],有

其中∆ϕ(k,i)=ϕ(k,i)−ϕ(k,i −1),由假设2 知|ϕ(k,i)|c,因此,|∆ϕ(k,i)|2c.

对式(13)两端取绝对值,有

通过之前的分析,得到γ(k,i+1)有界于1/2的结论.给定|b(i)|有界于1.由于函数

对于变量|∆u(k,i −1)|是先增后减的,所以存在一个最大值.当系统满足0<η1,µ>µmin,µmin=和0

值得指出的是,这里只需要证明d1,d2的存在,而不需要它们的确切值.

把式(15)–(16)代入到式(14)中,易得

c)跟踪误差的收敛性.

接下来,讨论跟踪误差e(k+1,i)的收敛性,定义

将式(18)代入到式(2)中,根据式(11)的结论,可以得出

对式(19)两端取绝对值,有

由于b(i)是有界的,且因此函数(20)可以被重写为

由式(23),当选择0<ρ1和λ>λmin时,一定存在一个常数满足0

结合式(22)和式(24),可以得出

同理递推,可以得到

因为调节函数b(i)满足所以可以得出δ(i)同时也满足条件如果i是一个奇数,则

证毕.

5 仿真示例

本节通过一个离散时间系统的仿真数例来验证所提方案的有效性.值得指出的是,控制方案中没有用到系统的任何模型信息,包括系统结构的线性或非线性特征、系统阶数以及相对度等.仿真中给出的系统模型仅是为了产生系统的I/O数据,并不参与控制器的设计.

考虑非线性系统结构如下:

期望输出信号为

受控系统的初始条件设置为u(0,1)=0,y(0,1)=3.伪偏导数初值设置为ˆϕ(1:2,i)=0.5.算法中的步长因子选取为µ=1,η=1,ρ=0.2,λ=0.15,参数ε设为10−5,量化器编码解码机制中的调节参数b(i)

仿真结果如图3–6所示,由图3仿真结果可以看出,当迭代次数为60次时,系统量化输出(k+1,i)、实际输出y(k+1,i)与期望轨迹3条曲线基本重复,这表明系统的跟踪性能在第60次迭代时就达到跟踪误差为零的目标.图4与图5挑出第8,15,60次迭代时的系统输出、实际输出与期望轨迹,更直观的表示出系统随迭代轴的跟踪性能变化.最后,取出每次迭代过程中的最大跟踪误差做出图6,从迭代域显示了所提方法的有效性.

图3 第8,15,60次迭代时的系统实际输出y(k+1,i)曲线与期望轨迹Fig.3 Actual output y(k+1,i)of the system at the 8th,15th,and 60th iterations and desired trajectory curve

图4 第8,15,60次迭代时的系统量化输出(k+1,i)曲线与期望轨迹Fig.4 System quantized output (k+1,i)of the system at the 8th,15th,and 60th iterations and desired trajectory curve

图5 第60次迭代时系统量化输出(k+1,i)、实际输出y(k+1,i)与期望轨迹Fig.5 System quantized output (k+1,i),actual output y(k+1,i)and expected trajectory at the 60th iteration

图6 系统沿迭代轴最大跟踪误差Fig.6 Maximum tracking error of the system along the iterative axis

通过仿真实验结果,可以看出系统在考虑数据量化过程后,仅需要很少次数的重复迭代过程就可以实现较好的数据传输,仍能实现系统对期望轨迹的完全跟踪.

6 结论

本文针对一类非线性离散时间SISO系统,提出了一种基于编码解码量化机制的无模型自适应迭代学习控制方案.并通过压缩映射的方法给出了系统收敛结果的充分条件.结果表明,所提算法对于存在数据量化的非线性系统,仍能保证系统的收敛性.该控制方案仅利用较少被控系统的I/O数据,就使得被控非线性系统在传输带宽有限的情况下,仍能完成对期望轨迹的完全跟踪.在未来的研究中,将考虑把所得结果扩展到非线性多输入多输出(MIMO)系统中.