非线性预测控制终端约束集的优化

2022-02-17于树友冯阳阳KIMJungSu

自动化学报 2022年1期

于树友冯阳阳 KIM Jung-Su 陈虹 4

预测控制是对工业控制工程具有重大影响的先进控制算法[1],大量应用于化工、冶金制造等过程控制领域[2].预测控制要求在每一个采样时刻,根据系统当前时刻的状态采样值,最小化系统的目标函数(性能指标),获得有限时域的开环控制序列或者无限时域的闭环反馈控制律.但只把控制序列或者反馈控制律的第一个片段作用于系统,在下一个采样时刻根据新的测量值重新求解优化问题.由于采用了开环滚动优化、闭环反馈矫正的形式,预测控制可以解决非线性、约束系统的最优控制问题[3−6];也由于在每一个采样时刻重新求解优化问题,在线修正预测轨迹,因而具有很强的抗干扰能力[7−8].

Grüne 在假设系统可控和优化问题具有滚动可行性的基础上,提出了保证非线性预测控制稳定性的策略[9].为了保证预测控制的稳定性,另一种方法是在优化问题中加入终端约束集和终端惩罚函数[10−11].Grüne 的方法被称为无(终端)约束预测控制;与之相对应,Chen 等[10]和Mayne 等[11]的方法被称为具有终端约束条件的预测控制.通过合理地选择终端惩罚函数和终端约束集,在假设优化问题在初始时刻具有可行解的条件下,具有终端约束条件的预测控制能够保证优化问题具有滚动可行性和受控系统的渐近稳定性.文献[12]深入分析了在优化问题中引入终端约束集和终端惩罚函数的优点和缺点.

终端惩罚函数、终端约束集和终端控制律构成了保证稳定性的非线性预测控制方法中优化问题的基本要素,三者需要离线求解,共同决定了在线计算负担和闭环系统的性能.如果系统是局部Lipschitz 连续的,文献[10]给出了连续时间约束非线性系统终端约束集存在的充分条件.Mayne 等在总结预测控制已有成果的基础上,给出保证受控系统渐近稳定的终端要素需要满足的“公理性”条件[11].文献[13−14]将文献[10]给出的终端约束集存在的充分条件推广至离散时间非线性系统.由于预测控制中终端约束集的大小决定了预测时域的选择,而后者又决定了系统的在线计算负担,因而很多工作着眼于如何求得更大的终端约束集.利用非线性系统的局部线性微分包含,文献[15−16]分别给出了椭球体和多面体型的终端约束集的求解方法.考虑线性时不变系统,文献[17]提出了时变的终端惩罚函数和时变的终端约束集的求取方法,其中终端约束集是一族终端约束集的凸包,并且凸包的加权系数是时变的.在文献[17]工作的基础上,文献[18]进一步研究了终端约束集族的构造方法.文献[19]讨论了有限步终端惩罚函数和有限步终端约束集的构造方法,可以得到更大的可行域(吸引域);当步数选为1 时,该方法就还原为经典的终端惩罚函数和终端约束集的构造方法.文献[20]给出了非线性系统时变终端约束集和时变终端惩罚函数的计算方法,其中终端控制律可以是线性的,也可以是非线性的.通过估计非线性系统的高阶非线性项,文献[21−22]给出了两种求解非线性预测控制终端约束集的方法,可以用来求解高维非线性系统的终端惩罚函数和终端约束集.上述方法都将终端约束集选择为终端惩罚函数的水平截集.

本文提出了一种非线性预测控制终端约束集、终端惩罚函数和终端控制律的优化方法.与已有的方法相比,终端约束集不再是终端惩罚函数的水平截集.终端控制律将终端约束集和终端惩罚函数联系起来:当系统状态位于终端约束集时,在终端控制律的作用下,系统状态保持在终端约束集中(正不变性);系统的终端惩罚函数是系统无穷维阶段代价的上界.终端惩罚项和终端约束集的“解耦”通过在优化问题中引入新的优化变量实现,因而提供了新的自由度,降低了求解的保守性.

符号说明.记 R 为实数域,Rn为n维欧几里得空间,Z 为非负的整数,Z+为正整数,Z[1,N]是指区间[1,N] 内的整数.符号k+i|k代表在k时刻预测一个(无限或者有限维) 序列时,该序列在k+i时刻的预测值.记M为n×n维的实数矩阵,M ≻0和M ⪰0 分别表示矩阵M是正定对称的、半正定对称的,M ≺0 和M ⪯0 分别表示矩阵M是负定对称的、半负定对称的.对于向量v ∈Rn,∥v∥Q=其中矩阵Q ∈Rn×n,Q ⪰0.矩阵I代表具有适当维数的单位矩阵;对称矩阵中的∗代表对称矩阵中按照对角线对称的对应元素;det(X)是指方阵X的行列式.

1 保证稳定性的非线性预测控制策略

考虑离散时间非线性系统

考虑系统的输入和状态约束

其中,X和U为包含原点的有界闭集.

本文中假设系统的状态xk是实时可测量的,并且不考虑外部扰动、模型不确定性和测量噪声对系统动态的影响.

假设f:是二次连续的,(0,0)是系统的唯一平衡点.

定义k时刻的控制输入序列

则k时刻预测控制的有限时域优化问题可以描述为:

问题 1.

其中,N为预测时域;N∈Z+;xk+i|k是在控制uk+i|k的作用下系统起始于xk|k的预测状态轨迹;l(·,·) 是阶段代价(Cost stage)函数,目标函数

阶段代价l(x,u):X ×U →U关于自变量x和u均是连续的,并且满足l(0,0)=0 和对所有的 (x,u)∈X ×U {0,0},l(x,u)>0.

终端约束集Xf是平衡点的一个邻域;终端惩罚函数E(x) 是半正定的,并且当且仅当x=0 时,E(x)=0.记κf(x) 为终端控制律,通常终端控制仅用来求解终端约束集Xf和终端惩罚函数E(x),不会直接作用于系统.

下面的引理给出了为保证受控系统渐近稳定,终端控制律、终端约束集和终端惩罚函数需要满足的条件.在文献[11]中Mayne 等将上述条件称为保证预测控制系统渐近稳定的“公理(Axioms)”.

引理 1[11].如果优化问题1 在初始时刻k=0 有可行解,并且终端约束集Xf、终端控制律κf(x) 和终端惩罚函数E(x) 满足如下的条件:

1)Xf ⊆X,Xf是一个闭集,0∈Xf;

2)κf(x)∈U,∀x ∈Xf;

3)f(x,κf(x))∈Xf,∀x ∈Xf;

4)E(xk+i+1|k)−E(xk+i|k) +l(xk+i|k,κ(xk+i|k))≤0,∀x ∈Xf.

其中,终端惩罚函数E(·) 是非线性系统 (1)的一个局部的Lyapunov 函数.则

1)优化问题1 在任意时刻k ≥0 均有可行解;

2)在预测控制的作用下,系统渐近稳定.

条件1)和2)表明在终端约束集中状态约束和控制约束均得到满足;条件3)表明在终端控制律的作用下,终端约束集是一个控制的不变集(即在终端控制律的作用下,如果当前时刻系统的状态在终端约束集中,则下一时刻系统的状态仍然在终端约束集中);条件4) 表明在终端约束集内,在终端控制律的作用下,代价函数沿着系统轨迹单调递减.

记系统(1)在平衡点 (0,0) 的局部Lipschitz 线性化系统为

假设系统 (6)是可镇定的,即存在一个线性反馈控制律Fx使得A+BF的特征根在单位圆内.选择终端惩罚函数为系统局部的Lyapunov 函数,终端约束集为终端代价函数的水平截集.针对连续时间非线性系统和离散时间非线性系统,文献[10,13]分别给出了终端约束集、终端控制律和终端惩罚函数存在的充分条件.

如果选取终端约束集为终端代价函数的水平截集

则条件4)就内在地包含了条件3).此时,终端惩罚函数、终端约束集和终端控制律需要满足的4个条件就相应地简化为3 个条件:

针对离散时间非线性系统,本文讨论非线性预测控制终端约束集、终端控制律和终端惩罚项的优化方法.本文的结果中,终端惩罚函数和终端约束集内的局部Lyapunov 函数是不同的,终端约束集也可以不再是终端惩罚函数的水平截集.

2 非线性预测控制终端约束集优化策略

为简化,考虑如下多面体形式的状态约束和控制输入约束

2.1 非线性系统的多胞体线性微分包含

本节首先介绍非线性系统 (1)的多胞体线性微分包含[23−24],在此基础上讨论非线性预测控制终端约束集和终端代价函数的求解方法.非线性系统的线性微分包含本质上是一个由系统构成的集合,非线性系统只是集合内的一个“元素”.如果集合(非线性系统的线性微分包含) 具有某种属性,则作为集合中的一个特定元素的非线性系统也具有这一属性.

假设

其中,

Co代表元素的凸组合,即存在L个非负的标量使得λi,i=1,2,···,L,

注 1.终端约束集是系统平衡点的某一个邻域,因而在求取终端约束集时可以只关心平衡点某一邻域的微分包含.具体地,可以寻找C0⊂C使得

其中,Ω0是平衡点邻域C0的线性微分包含.当然,在求取了终端约束集Xf后还需要检查是否满足Xf ⊆Ω0.

2.2 非线性系统的终端控制律、终端惩罚函数和终端约束集

下面的定理给出了求取非线性系统 (1) 终端约束集、终端惩罚函数和终端控制律的方法.

定理 1.对非线性系统 (1),假设系统的一个多胞体线性微分包含为式 (8).如果存在矩阵G,Y和对称正定矩阵X1,X2,使得

则:

1)线性反馈控制律u=Fx,F=Y G−1可以选作系统的终端控制律;

2)椭圆域Xf:=可以选作系统的终端约束集;

证明.下面将逐一证明按照这种方式选择的终端控制律、终端惩罚函数和终端约束集满足引理1列举的4 个条件.

1) 考虑线性反馈控制律u=Fx和二次终端惩罚函数条件

成立等价于

上式成立的充分条件[25−26]是对于任意的i=1,2,···,L,有

式(10)中{2,2}项表明X1⪰0;{1,1}项表明G+GT⪰X1.由于X1⪰0 和G+GT⪰X1,矩阵G是非奇异的.进一步地,由于X1⪰0 和(G −X1)T×⪰0,所以

考虑到F=Y G−1和式 (10) 表明

对式 (15) 两端分别左乘 diag{X1G−T,I,I,I}和右乘 diag{G−1X1,I,I,I},可以得到式 (13) 成立.即在终端控制律的作用下,沿着系统的状态轨迹优化问题的代价函数是最优的.

2) 采用与上述相似的推理,可以得到

考虑到F=Y G−1和,式 (11) 表明

对式 (17) 两端分别左乘 diag{X2G−T,I}和右乘 diag{G−1X2,I},可以得到

利用Schur 补定理[23],有

如果在某一时刻h0,∈Xf,则对于任意的k ≥h0,xk ∈Xf.即在状态反馈控制律u=Fx的作用下,椭圆域Xf是非线性系统 (1) 的不变集.

3) 考虑到F=Y G−1和0⪯G+GT−X2⪯GT×G,式 (12) 表明

对式 (20) 两端分别左乘 diag{X2G−T,I}和右乘可以得到diag{G−1X2,I},

利用Schur 补定理,上式等价于

注 2.从形式上看,定理 1 中终端约束集Xf:={x ∈≤1}不再是终端惩罚函数的水平截集.

注 3.终端控制律没有真正作用于系统;终端控制律使得系统在终端约束集中是正不变的(系统状态进入终端约束集后将不再离开终端约束集);在终端控制律的作用下,在终端约束集中系统满足输出约束 (7);终端控制律使得系统的动态轨迹具有某种最优性(最优代价).

2.3 终端约束集的优化方法

椭圆域Xf:=的容量(椭圆域包含点的个数)与 det(X2) 成正比[23].目标函数 det(·) 不是变量的凸函数,但是可以通过对数变换[27]或者求取特征值的几何均值[28]将求取对称矩阵最大行列式的非凸优化问题转变为凸优化问题.本文采用文献[28]介绍的求取特征值的几何均值方法.

考虑如下的优化问题:

问题 2.

问题 2 是一个凸优化问题[28].通过求解凸优化问题 2 可以得到参数矩阵X1,X2,Y和G.在此基础上,利用F=Y G−1得到终端控制律u=Fx;相应系统的终端惩罚项为系统的终端约束集为Xf:=

离散系统终端约束集也可以通过求解下面的优化问题得到[29−30].

问题 3.

在问题 2 中,如果选择X1=X2=G,则问题2和问题 3 等价,从而由于在优化问题中引入了新的自由变量X2和G,因而可以从理论上保证求取问题 2 得到的终端约束集更大.求取问题2和问题 3 得到的终端约束集均为椭圆集,区别在于求取问题 3 得到的终端约束集是终端惩罚函数的水平截集,求取问题 2 得到的终端约束集与增加的一个自由变量X2相关,是正定函数xTX2x的水平截集.进一步地,由于均采用线性矩阵不等式求解优化问题,并且求取过程是离线进行,设计过程复杂性的有限提高仍然在可接受范围内.

需要强调的是,终端约束集变大有可能导致系统动态性能变差.

3 一个数值算例

考虑离散时间非线性系统

非线性系统(25)在平衡点 (0,0) 处Jacobi 线性化得到的线性系统是开环不稳定的,但是可控的.

考虑控制约束

阶段代价函数l(x,u)=xTQx+uTRu中的权矩阵Q和R分别为

将系统(25)写成如下形式

其中,µ=uk可以视为一个时变参数.考虑到uk ∈[−1,1],则系统的一个多面体线性微分包含为

其中,

分别采用文献[30]和本文介绍的方法求取系统的终端不变域,相应的系统终端约束集如图1,其中虚线对应的椭圆是采用文献[30]中介绍的方法(求解问题 3) 得到的,实线对应的椭圆是采用本文介绍的方法得到的.从图中可以看出,采用本文介绍的方法扩大了系统的终端约束集.

图1 终端约束集Fig.1 Terminal constraint set

图2～图4 给出了初始状态为x0=[−1.5 1.5]T时系统的动态响应,实线为采用本文方法求取的终端约束条件对应的系统动态,虚线为采用文献[30]中介绍的方法求取的终端约束条件对应的系统动态.从图中可以看出,在满足控制输入约束的情况下系统动态轨迹渐近趋于平衡点;并且采用本文介绍的方法并没有使得系统的动态性能变差.上述仿真中,预测时域和控制时域相等,均为5.

图2 系统的动态响应:x1Fig.2 Dynamic response of the system:x1

图3 系统的动态响应:x2Fig.3 Dynamic response of the system:x2

图4 系统的动态响应:uFig.4 Dynamic response of the system:u

需要指出的是,在状态空间的某些点处,在相同的预测时域和控制时域下,本文介绍的方法有可行解,而采用文献[30]中介绍的方法没有可行解.

4 结论

针对离散时间非线性系统,本文提出了一种非线性预测控制终端约束集的优化方法.从内容上看,本文提出的优化方法比文献[29−30]中的经典优化算法多了自由变量,因而可以从理论上保证所求得的终端约束集比该经典优化方法更大,进而可以通过选择更短的预测时域来降低预测控制在线计算负担;从形式上看,本文提出的方法可以实现终端惩罚函数和终端约束集的某种解耦,即终端约束集不再是终端惩罚函数的水平截集.但终端约束集和终端惩罚函数仍然通过终端控制律联系起来:终端约束集是受控系统在终端控制律作用下的不变集;当系统状态在终端约束集时,在终端控制律的作用下,终端惩罚函数是系统的无穷时域阶段代价的上界.最后通过仿真算例验证了所提方法的有效性.