网络系统的马尔科夫时滞预测控制

2015-03-28黄玲施菲菲谢文博王凯

电机与控制学报 2015年6期

关键词：时滞遗传算法建模

黄玲，施菲菲，谢文博，王凯

(哈尔滨理工大学自动化学院，哈尔滨黑龙江150080)

网络系统的马尔科夫时滞预测控制

黄玲，施菲菲，谢文博，王凯

(哈尔滨理工大学自动化学院，哈尔滨黑龙江150080)

针对非线性网络控制系统存在网络诱导时延的问题，提出一种时滞补偿控制方法。首先建立非线性网络系统的T－S模糊模型，将网络诱导时延视为系统输入时滞;利用马尔科夫链对网络诱导时滞进行建模，在此基础上计算状态转移概率矩阵，依据最大转移概率法对下一步的时滞进行预测;采用遗传算法对状态反馈控制器进行寻优，得到T－S模糊模型每个子系统针对各个时滞的最优状态反馈控制律;通过时滞时间的隶属度函数融合得到非线性网络控制系统的模糊预测控制器;仿真算例验证该方法的可行性与有效性。

网络控制系统;T－S模糊模型;Markov链;时延;补偿

0引言

近年来，随着信息技术、远程控制、分散控制的发展，致使网络控制系统得到不断发展和普及，随着被控对象对控制实时性要求不断提高，越来越多的学者关注对网络控制系统时滞补偿的研究。网络控制系统(network control system，NCS)是指分布在不同地理位置的传感器、执行器、控制器和被控对象通过网络相互连接，相互通信，形成闭环控制系统的一种分布式实时反馈控制网络。在NCS中，多个网络节点共享网络信道。由于网络带宽有限且网络中的数据流量变化不规则，当多个节点通过网络交换数据时，常常出现数据碰撞、连接中断、网络拥塞等现象，因而不可避免的出现信息交换延迟，这种由网络引起的时延称网络诱导时延。若该时延过大，超过系统能够接受的最大传输时滞，则无法实现对系统的实时控制，所以对网络控制系统进行时滞补偿是必要的。

T－S模糊控制系统利用对分段线性系统的隶属度融合实现对非线性系统的逼近，在处理非线性系统方面具有很大优势。基于T－S模糊控制策略处理网络控制系统的非线性是一个既有理论深度又具有广泛应用前景的方向，吸引了控制理论与应用领域学者、专家的广泛关注。

文献［1］基于观测器研究了离散网络控制系统，在前向和反馈通道时滞建模为常时滞和随机时滞条件下的网络预测控制，利用开关系统理论研究了闭环系统稳定的充要条件。文献［2］将前向和反馈通道时滞建立为Markov链，利用输出反馈研究系统的时滞补偿控制，锥补线性化用于计算补偿控制器的增益。文献［3］针对T－S模糊系统，采用状态反馈和输出反馈研究了网络时滞补偿问题。基于广义系统理论，建立了控制器存在的LMI条件，同时给出了控制器的显式表示。文献［4－5］在控制器端设置了观测器和预估控制产生器，在执行器端设置了网络时延补偿器。文献［6］基于状态预估的方法，提出了一种预测补偿控制方案来解决时延问题。本文首先将网络诱导时滞建模为Markov链，从而对时滞进行预测，再利用遗传算法对时滞控制器进行优化，从而设计出时滞预测控制器，对时滞进行预测补偿，减小时滞对系统性能的影响。

1 网络控制系统建模

网络控制系统的典型结构如图1所示。

传感器从被控对象采集实时信息，通过信号处理单元后经控制算法计算得到控制信号，通过网络传输到执行器作用于被控对象。

考虑存在时滞时的网络控制系统建T－S模糊模型。

模糊规则i:

其中θi(t)，i=1，2…，g为系统的前件变量，而Fij，i=1，2，…，r，j=1，2，…，g是模糊集合，r是模糊规则数。xi(t)∈Rn是系统的状态变量，Adi、Ai是系统矩阵，τ＞0是子系统的时滞时间，u(t－τ)是控制输入。给定一组u，x，t，τ，式(1)经过模糊加权能够得出式(2):

2 预测控制器设计

2.1 时滞建模

在NCS中，将网络诱导时滞建成一个Markov链随机序列，符合网络控制系统实际，因为某一时刻的时滞，往往只和上一时刻有关，可以用上一时刻的时滞对这一时刻进行预测。预测步骤如图2所示。

首先生成一组随机数据作为传输网络中的传输时滞，这可以认为是一组实验的结果，即先对网络时滞作多次测试实验，得到一段时间内的网络时滞，再对这组时滞数据计算状态转移表，从而得到状态转移矩阵，再利用这组网络时滞和计算得到的状态转移矩阵得到一组新的Markov链预测时滞。

假设某一系统或事物只有3个可能状态1，2，3。其中的一次状态统计数据如表1。

问:第16个时刻的状态最有可能是什么?

为了得到状态转移矩阵，需要先统计状态转移概率，可以通过以上数据建立表2状态转移表。

第一行和第一列分别表示可能的全部状态，表中数据则表示从状态i，i=1，2，3转移到下一时刻状态j，j=1，2，3的个数，可建立表3的状态转移概率矩阵。

从状态转移概率矩阵的每行可以看出，符合状态转移概率的特性，第15个状态是3，从第3行可以看出，转移到状态1，2，3的概率分别为2/5，3/5和0/5，按最大概率转移方法，可以预测第16个状态是2。这就是一步状态转移的计算方法。

2.2 预测控制器设计

设计非线性网络控制系统的时滞预测模糊控制器时，利用遗传算法得到每个子系统的最优状态反馈控制器，利用Markov链预测的时滞，得到具有时滞预测的预测模糊控制器。基本模型如公式(3)。

对于第i个子系统，在时滞为di时的控制输入为

其中，0≤di≤dimax表示系统某一时刻存在的时滞，ui(t－di)，i=1，2，…，r表示第i个子系统的控制器输出，ki1，ki2，…，kin为不同系统状态在时滞为di情况下的最优状态反馈控制律，通过遗传算法寻优得出，x1(t－di)，x2(t－di)，…，xn(t－di)表示系统的状态信号传输存在时滞，ui(t－di)表示控制器传输存在时滞。

系统输出为

其中，u^(t－di)表示经模糊化后，作用于系统的最终控制器输出序列。

首先设定子模型i和时滞参数di，子模型一般为状态空间模型，利用遗传算法对状态反馈控制器ki1，ki2，…，ki

n进行编码、选择、交叉、变异得到一组新的状态反馈控制器，计算目标函数值，这里根据预测控制的基本思想，目标轨迹为平衡位置0，因此目标函数如

其中，xi(t)表示在t时刻第n个状态的响应，目标函数为所有所选择的状态所有时间的响应的平方和，为了明确目标函数为状态和平衡位置的差的概念，这里把平衡位置的表示0写出。再判断是否达到收敛条件，收敛条件可以是最大寻优次数或者自定义目标函数值，如果不满足则返回遗传算法模块继续寻优，如果满足则得到对应子模型对应时滞的最优状态反馈控制器，并返回重新设定子模型和时滞，直到遍历所有时滞和子模型，得到每个子模型对应于每个可能时滞的最优状态反馈控制器。这样就可得式(3)和式(4)的模糊时滞控制器，为了得到具有Markov链预测的时滞预测控制器，只需把式(3)中的时滞d给定为Markov链预测的时滞，便可以得到具有Markov链预测的时滞预测控制器如式(6)。第i个子系统对di=Mdi，预测时滞为Mdi时的控制输入为

其中Mdi表示Markov链预测时滞。

控制器输出为

其中u^(t－Md)为具有Markov链预测时滞的预测控制器输出。

3 仿真验证

二级倒立摆系统结构示意图如图3所示，假设该倒立摆通过网络进行控制。

其运动过程为:连接在摆杆上的两个角度编码器分别检测两个摆杆与竖直方向的夹角，连接在小车上的位移编码器检测出小车的水平位移，检测出的信号经放大，调理，把数据通过网络传递给电脑(控制单元)，通过一定的算法(这里可以是LQR控制)得出使二级倒立摆向稳定方向运动的小车需要的加速度，通过网络送给运动控制卡，把信号传递给电机，驱动电机运动，电机通过履带带动小车运动，从而带动两个摆杆运动，设计合理的运动算法，可以控制两个摆杆达到平衡状态。在这个过程中，控制信号的延时主要是由在控制网络中传递引起的，且网络诱导时滞不固定，可用Markov链预测。

利用拉格朗日方程推导运动学方程再经过整理可得二级倒立摆系统的状态空间形式:

其中X= [x θ1θ2·x θ1θ2]为系统被控变量。各个参数的含义如下:x为小车的水平位移;θ1为摆杆1与竖直方向夹角;θ2为摆杆2与竖直方向夹角; A和B为参数矩阵，且

从参数矩阵M可以看出，其参数具有非线性形式。

利用分段线性思想对二级倒立摆系统进行T－S模糊建模，综合考虑3个变量x，θ1，θ2和参数矩阵A，B，选择以下5个位置来分别建立其T－S模糊子模型。

位置1:x=0，θ1=0，θ2=0;

位置2:x=0，θ1=0，θ2=±8°;

位置3:x=0，θ1=±10°，θ2=0;

位置4:x=0，θ1=±10°，θ2=±8°;

位置5:x=0，θ1=禾10°，θ2=±8°。

首先对5个子系统在时滞［0，0.001，0.002，…，0.009］下分别利用遗传算法得出对应子系统在对应不同时滞的最优状态反馈控制器，这里目标函数中的状态为位移和两个摆角。

把遗传算法的初始值设定为LQR控制器的状态反馈律，并把上一次的寻优结果作为下一次的初始值继续寻优避免过早收敛于局部最优点。图4为位置1在时滞0.006 s情况下的寻优结果，最终收敛值为2.117 8。

寻优前和寻优后的两种状态反馈控制律如下:

其中:ko为寻优前的状态反馈控制律，k10.006为寻优后的状态反馈控制律。这里只给出时滞0.006 s的平衡位置的子模型的寻优结果，其他位置对应不同时滞的结果均可按同样的步骤得出。

时滞的隶属度函数如图5所示。

时滞的隶属度函数中包含了预先定义的10种可能的是时滞情况。模糊预测控制器的后件部分为通过遗传算法寻优得出的不同时滞情况下的最优状态反馈控制器。没有预测和存在预测的仿真对比结果如图6～图9所示。从图6～图9可以看出，两种控制方法都可以使具有控制器时滞的二级倒立摆系统稳定，但加入Markov链预测控制的结果具有较好平稳性。

图6～图8为被控状态的变化对比图，x1为位移，x2为一级摆角，x3为二级摆角。从图6中可以看出，有预测控制的情况下，可以更快地达到稳定的平衡位置，这从图9的控制器输出变化也可以看出，加入预测控制后，系统的控制器输出平稳。加入Markov链的预测的控制优化了控制效果，使系统平稳快速地到达平衡状态。

4结论

本文首先利用分段线性系统逼近非线性系统的方法，将网络控制系统建模为T－S模糊模型，再对系统的时滞进行预测，把预测时滞作为前件变量，利用遗传算法对每种时滞情况下的子系统分别寻优，分别得到最优控制器，经隶属度函数融合后，建立具有Markov链预测时滞的预测模糊控制器，其输入为系统状态和预测时滞。仿真分析表明，预测控制器可以得到更加平稳快速的控制效果，可以减弱原系统因网络时滞导致的系统状态抖动现象。

［1］ LIU Guoping，XIA Yuanqing，CHEN Jie，et al．Networked predictive control of systems with random network delays in both forward and feedback channels［J］．IEEE Transactions on Industrial Electronics，2007，54(3):1282－1297．

［2］ YANG Rongni，LIU Guoping，SHIPeng，et al．Predictive output feedback control for networked control systems［J］．IEEE Transactions on Industrial Electronics．2014，61(1):512－520．

［3］ ZHANG Jinhui，SHIPeng，XIA Yuanqing．Fuzzy delay compensa-tion control for T－S Fuzzy systems over network［J］．IEEE Transactions on Cybernetics，2013，43(1):259－268．

［4］ XIA Yuanqing．，LIU Guoping，FU M，et al．Predictive control of networked systems with random delay and data dropout［J］．IET Control Theory Application，2009，3(11):1476－1486．

［5］李德伟，席裕庚．预估网络控制系统的设计和分析［J］．控制与决策，2007，22(9):1065－1069．LIDewei，XIYugeng．Design and analysisof predictive networked control system［J］．Control and Decision，2007，22(9):1065－1069．

［6］ CHEN Tihung，KUNG ChungChun，LIN Chiheng．T-S fuzzy control for a class of networked control system［J］．Fuzzy Theory and Its Applications，2012，16(8):12－17．

［7］于水情，李俊民．变采样周期网络控制系统的模态依赖的H∞预测控制［J］．西安电子科技大学学报(自然科学版)，2012，39(5):147－155．YU Shuiqing，LI Junmin．Mode dependent H∞predictive control of networked control system under variable-period sampling［J］．Journal of Xidian University，2012，39(5):147－155．

［8］刘俊豪，张皓，陈启军．具有均匀量化器的非线性网络控制系统的一致有界性［J］．控制理论与应用，2012，29(11):1388－1396．LIU Junhao，ZHANGHao，CHENQijun．Uniformly-bounded nonlinear network control systems with uniform quantizer［J］．Theory and Applications，2012，29(11):1388－1396．

［9］席裕庚，李德伟，林姝．模型预测控制—现状与挑战［J］．自动化学报，2013，39(3):222－236．XIYugeng，LI Dewei，LIN Shu．Model predictive control-status and challenges［J］．Acta Automatica Sinica，2013，39(3):222－236．

［10］李兴鹏，石庆均，江全元．双模糊控制法在光伏并网发电系统MPPT中的应用［J］．电力自动化设备，2012，32(8):113－117．LI Xingpeng，SHI Qingjun，JIANG Quanyuan．Application of double fuzzy control in MPPT of grid-connected photovoltaic generation system［J］．Electric Power Automation Equipment，2012，32(8):113－117．

［11］杨建伟，董军哲，李捷．基于变论域模糊控制的磁流变半主动悬架多目标优化［J］．汽车工程，2012，34(3):260－265．YANG Jianwei，DONG Junzhe，LIJie．Multi-objective optimization on MR suspension based on variable universe fuzzy control［J］．Automotive Engineering，2012，34(3):260－265．

［12］王瑞敏，费树岷，柴琳．网络控制系统的预测补偿［J］．控制理论与应用，2011，28(10):1473－1479．WANG Ruimin， FEI Shumin， CHAI Lin． Predictive compensation for networked control systems［J］．Control Theory and Applications，2011，28(10):1473－1479．

［13］郭超勇，刘建强，游小杰，等．高速动车组列车网络控制系统仿真与建模研究［J］．系统仿真学报，2012，24(6):1165－1169．GUO Chaoyong，LIU Jianqiang，YOU Xiaojie，et al．Simulation and modeling of train networked control system on high-speed electricmultiple unit［J］．Journal of System Simulation，2012，24 (6):1165－1169．

［14］陈惠英，李祖欣．无线网络控制系统研究现状及方向［J］．工矿自动化，2013，39(1):59－63．CHEN Huiying，LIZuxin．Research status and direction ofwireless networked control system［J］．Industry and Mine Automation，2013，39(1):59－63．

［15］肖会芹，何勇，吴敏，等．基于T－S模糊模型非线性网络控制系统改进H∞跟踪控制［J］．控制理论与应用，2012，29(1): 71－78．XIAO huiqin，HE Yong，WU Min，et al．Improved H-infinity tracking control for nonlinear networked control systems based on T-S fuzzymodel［J］．Control Theory and Applications，2012，29 (1):71－78．

(编辑:刘素菊)

Markov delay predictive control for network systems

HUANG Ling， SHIFei-fei， XIEWen-bo， WANG Kai
(College of Automation，Harbin University of Science and Technology，Harbin 150080，China)

In view of network induced time delay in nonlinear networked control systems，a time delay compensation control theme was proposed．T-S fuzzymodelwas established for nonlinear network control systems firstly．Then the network induced delay wasmodeled as Markov chain，and delay was predicted．In the following，by using genetic algorithm，the optimal state feedback control law for each subsystem with each delay was established．And then fuzzy predictive controller of the nonlinear networked control systemswas obtained throughmembership function．Simulation example shows the effectiveness of the proposed method．

networked control system;T-S fuzzymodel;Markov chain;time delay;compensation

10．15938/j．emc．2015．06．014

TP 13

1007－449X(2015)06－0089－06

2014－11－10

国家自然科学基金(61304046);黑龙江省教育厅科技项目(12541118)

黄玲(1975—)，女，博士，教授，硕士生导师，研究方向为网络系统分析与控制，信号处理(滤波);

施菲菲(1991—)，女，硕士研究生，研究方向为网络控制系统的时滞补偿及应用;

谢文博(1985—)，男，讲师，研究方向为模糊系统理论及应用等;

王凯(1989—)，男，硕士，研究方向为模糊建模及模糊控制。

黄玲