一种新型多智能体固定目标控制算法①

2017-11-01秦补枝

化工自动化及仪表 2017年3期

关键词：控制算法耦合矩阵

秦补枝

(南京科技职业学院自动控制系)

一种新型多智能体固定目标控制算法①

秦补枝

(南京科技职业学院自动控制系)

提出一种新型的多智能体固定目标控制算法。某个智能体到达固定目标的附近区域时，在该智能体与目标之间增加反馈控制器，使得智能体与固定目标之间的通信量减少。最后通过仿真证明了该算法的有效性。

多智能体固定目标控制算法

随着计算机技术和通信网络的迅速发展，复杂网络的研究已经渗透到很多方面，如疾病的传播、交通运输及电力传输等。研究者从复杂网络理论的角度对它们进行分析研究，将这些问题归纳为一个复杂网络系统，每一个执行环节作为一个节点，并且为智能节点，具有复杂动力学行为，由这些节点组成的网络行为就变得异常复杂。因此，分析和控制这些网络的复杂行为成为研究的热点之一[1～18]。由于网络的拓扑结构和动力学行为相互影响，使这个问题更加难以解决。特别是通过对网络中的少数节点增加线性误差反馈控制，使得整个网络稳定到一个均匀的平衡点状态，即网络中的每个节点的状态都稳定到单个节点的平衡点上[1～3]。这种控制方法增加了每一时刻节点之间的通信量，不易实现。为了减少智能体与固定目标之间的及时通信量，笔者提出了一种基于事件驱动的固定目标跟踪策略，即当某个智能体的状态与固定目标的状态接近时，对该智能体施加反馈控制，使得智能体与固定目标之间的通信量减少，跟踪速度加快，提高跟踪效率。

1 基于事件驱动的多智能体固定目标跟踪方法

假设一个网络由N个相同的节点组成，构成了连续时间耗散耦合的动态网络，其中第i个节点的状态方程为：

(1)

当t→∞时：

x1(t)=x2(t)=…=xN(t)=s(t)

(2)

智能体i的事件驱动函数定义为：

αi(t)=‖xi(t)-s‖-β,i=1,2,…,N

(3)

其中β>0 ,‖·‖ 代表欧几里德范数。笔者设计的控制率为：

ui(t)=-γicμ(xi(t)-s)

(4)

其中μ是跟踪目标与智能体之间的耦合强度；γi由事件驱动函数αi(t) 的符号决定：

(5)

定义矩阵B为：

B={bij}N×N=A-μ·diag[γ1(t),γ2(t),…,γN(t)]

(6)

由文献 [1，2]可知矩阵B是负定，其特征值可以写为0≥λ1(B)≥λ2(B)≥…≥λN(B)。因为事件驱动函数的存在，使得在某些时刻存在所有的智能体都不在跟踪目标的吸引区域内，而不触发事件驱动函数，因此有可能使得式(6)的第2项为0，导致矩阵B的最大特征值为0。

定理1 考虑多智能体(1)，其控制输入(4)在事件驱动函数(5)的作用下，如果矩阵Df(s)+ηIn×n的所有特征值具有负实部，则该多智能体系统能够局部指数稳定到系统的独立状态(2)中的s。其中In×n为n维单位阵，η<0。有：

cλ1(B)≤η

(7)

证明将式(1)在平衡点s附近进行线性化得到：

(8)

其中Df(s)∈Rn×n是函数f()在s上的雅可比矩阵，φ=(φ1,φ2,…,φN)T,φi(t)=xi(t)-s。

由式(6)知：

Bφi=λi(B)φi,i=1,2,…,N

(9)

将式(9)代入式(8)得到：

=(Df(s)+cλi(B)I)φi

(10)

i=1,2,…,N

由于0≥λ1(B)≥λ2(B)≥…≥λN(B)，即只需要满足(Df(s)+cλ1(B)I)<0即可使得式(10)中的N个方程式满足指数稳定的条件。由式(7)可知，对于一个非线性函数，其雅可比矩阵可以确定得到，这样选择合适的节点之间的耦合强度c可使得N个方程式满足指数稳定。

在系统的初期，可能会存在所有智能体的状态都不能触发事件驱动函数，即所有的节点状态与所需要达到的固定目标距离比较远，此时对应的λ1(B)=0，因此式 (7)不能写成：

(11)

为了能在系统初始时对选择智能体之间的耦合强度提供一个依据，笔者建议系统初始的耦合强度取为：

(12)

其中ν>0为一个无穷小的正数。

由于混沌系统存在各态历经性，随着时间的推移，必然有智能体的状态接近固定目标，从而触发事件驱动函数，使得整个系统能够达到跟踪固定目标的目的。

2 仿真结果

复杂动态网络中单个节点的状态为典型的陈系统，其动力学方程为：

(13)

此时，陈系统节点为一个混沌系统(图1)[19]。

图1 混沌的陈系统示意图

令式(13)右端等于零，得到陈系统的一个平衡点(7.9373, 7.9373,21)，将它作为本次仿真的固定目标。

考虑一个经典的由100个节点组成的BA无标度网络模型，它的生成算法可参考文献[20]，初始节点为3个，每增加一个节点增加3条边,单个节点的动力学为陈系统。

假设每个节点代表一个智能体，它要跟踪的目标为100个智能体的平均状态。在图2、3中，采用的是相同的无标度网络模型，并且节点和跟踪目标之间的耦合强度都设为12，每个智能体的初始状态都随机分布在[-5,5],只有事件驱动函数的参数β发生了变化。

a. xi1

b. xi2

c. xi3

a. xi1

b. xi2

c. xi3

仿真结果表明，所有的智能体都能很好地跟踪固定目标。通过对比图2、3，不难发现事件驱动函数的发生阈值β越大，多智能体越早完成了跟踪任务。

3 结束语

提出一种新型的基于事件驱动的多智能体固定目标跟踪算法。理论和仿真结果表明，随机分配系统中所有智能体的初始状态，经过一段时间的调整，最后系统能够跟踪到目标，并且进入稳定状态。即该固定目标跟踪控制算法是切实可行的。

[1] Wang X F, Chen G R.Pinning Control of Scale-free Dynamical Networks[J]. Physica A:Statistical Mechanics and Its Applications，2002, 310(3-4):521～531.

[2] Li X, Wang X F,Chen G R.Pinning a Complex Dynamical Network to Its Equilibrium[J].IEEE Transactions on Circuits and Systems I: Regular Papers,2004, 51(10):2074～2087.

[3] Lu W L, Chen T P. New Approach to Synchronization Analysis of Linearly Coupled Ordinary Differential Systems[J].Physica D:Nonlinear Phenomena, 2006, 213(2):214～230.

[4] Olfati-Saber R,Jalalkamali P.Coupled Distributed Estimation and Control for Mobile Sensor Networks[J].IEEE Transactions on Automatic Control, 2012, 57(10):2609～2614.

[5] Gupta R, Bandyopadhyay B, Kulkarni A M.Power System Stabilizer for Multi-machine Power Systems Using Robust Decentralized Periodic output Feedback[J].IEEE Proceedings of Control Theory and Applications, 2005,152 (1):3～8.

[6] Chen T P, Liu X,Lu W L. Pinning Complex Networks by a Single Controller[J].IEEE Transactions on Circuits and Systems I-Regular Papers,2007, 54(6):1317～1326.

[7] Zhan M, Gao J H,Wu Y,et al.Chaos Synchronization in Coupled Systems by Appling Pinning Control[J].Physical Review E, 2007, 76:36203.

[8] Lu W L. Adaptive Dynamical Networks via Neighborhood Information：Synchronization and Pinning Control[J].Chaos: An Interdisciplinary Journal of Nonlinear Science, 2007, 17(2):23122.

[9] Zhou J, Lu J A,Lu J H. Pinning Adaptive Synchronization of a General Complex Dynamical Network[J].Automatica,2007, 44(4):996～1003.

[10] Sorrentino F,Bernardo M D,Garofalo F,et al. Controllability of Complex Networks via Pinning[J].Physical Review E，2007, 75:46103.

[11] Amaral L A N,Guimera R. Lies, Damned Lies and Statistics[J].Nature Physics，2006, 2(2):75～76.

[12] McGraw P N, Menzinger M. Clustering and the Synchronization of Oscillator Networks[J].Physical Review E,2005, 72:15101.

[13] Kim B J. Performance of Networks of Artificial Neurons: The Role of Clustering[J].Physical Review E,2004, 69:45101.

[14] Li X, Chen G R.A Local-world Evolving Network Model[J].Physica A: Statistical Mechanics and Its Applications,2003, 328(1-2):274～286.

[15] Barrat A, Weigt M. On the Properties of Small-world Network Models[J].European Physical Journal B,2000, 13(3):547～560.

[16] Boccaletti S, Latorab V, Moreno Y,et al.Complex Networks:Structure and Dynamics[J].Physics Reports,2006, 424(4-5):175～308.

[17] Li X, Wang X F.Controlling the Spreading in Small-world Evolving Networks: Stability, Oscillation,and Topology[J].IEEE Transactions on Automatic Control,2006, 51(3):534～540.

[18] Restrepo J G, Ott E,Hunt B R.Onset of Synchronization in Large Networks of Coupled Oscillators[J].Physical Review E,2005, 71:36151.

[19] Chen G, Ueta T.Yet another Chaotic Attractor[J]. International Journal of Bifurcation and Chaos,1999，9(7)： 1465～1466.

[20] Barabasi A L. Linked: The New Science of Networks[M]. Massachusetts: Persus Publishing，2002.

ANovelControlAlgorithmforMulti-agentFixedTarget

QIN Bu-zhi

(DepartmentofAutomation,NanjingPolytechnicInstitute)

A novel control algorithm for multi-agent fixed targets was proposed. When an agent reaches the region nearby the fixed target, adding a feedback controller between this agent and the tracking target can reduce communication load there effectively. Simulation result proves effectiveness of this algorithm proposed.

multi-agent, fixed target, control algorithm

TP393

1000-3932(2017)03-0258-04

江苏省2014年青蓝工程资助项目；江苏省第五期“333高层次人才培养工程”培养对象项目。

秦补枝(1975-)，副教授，主要从事非线性控制和复杂网络分析与控制方向的研究，68084819@qq.com。

2016-09-26)