地面无人平台集群协同控制的研究进展
2022-11-29马清文张荣华
马清文,徐 昕,张荣华
(国防科技大学智能科学学院,长沙 410073)
1 引 言
随着通信设备、传感器和处理器等软硬件价格的下降和性能的提高,以轮式地面无人平台(如图1所示)为代表的典型地面无人平台被广泛应用到各个领域[1-6]。因此,地面无人平台成为当今研究的热点领域之一。地面无人平台主要有轮式、履带式、足式等几类,其中轮式地面无人平台具有移动速度快、控制方便、工作效率高等优点,被用于执行各种任务[7-8]。此外,作为一种地面无人平台,地面无人车辆(如图2所示)在交通运输等方面具有巨大的应用前景[9],使得地面无人平台的研究得到广泛关注。然而,在实际应用中,许多复杂的任务对于单个无人平台提出了很高的性能要求,甚至是单个无人平台无法完成的。与单个地面无人平台相比,地面无人平台集群协同在面对复杂的工作任务时具有更强的鲁棒性和容错能力,且随着软硬件成本的降低,使用低成本的地面无人平台集群分布式协同工作代替单个复杂的地面无人平台,具有更好的经济效益。总之,地面无人平台集群协同既能发挥地面无人平台集群工作的优势,又能避免因单个无人平台能力限制导致的执行任务受限问题,是地面无人平台一个重要的发展方向[10]。
图1 轮式地面无人平台Fig.1 Wheeled unmanned ground platforms
图2 地面无人车辆Fig.2 Unmanned ground vehicle
在工作时,地面无人平台集群协同需要通过相应的协同控制任务来实现。这些协同控制任务可以分为一致性[11]、编队[12]、环航[13]等,有许多关于轮式地面无人平台集群协同控制研究工作集中在编队控制上。根据协同的工作方式,地面无人平台集群可以分为三大类:集中式、分散式和分布式[14]。在集中式和分散式中,集群中的个体只与主节点进行信息交互,不存在邻居平台之间的信息交互。这两种工作方式使系统过度依赖中心节点或主节点,且不利于系统扩展。而分布式的工作方式根据任务需求,邻居无人平台之间通过传感器观测或进行通信实现信息交互,且无须中心节点统一调度,能很好地克服这些问题。在现有工作中,针对于地面无人平台集群(如图3所示)的协同控制方法主要可以分类为虚拟结构法[15]、基于领航-跟随者法[16]、基于行为的方法[17]和基于图论的方法。
图3 二维平面下地面无人平台集群[14]Fig.3 Clusters of ground unmanned platforms in two-dimensional planes[14]
在实际情况下,由于工作地面湿滑、结冰等不良因素的影响,轮式地面无人平台在运动控制过程中易发生侧滑和轮胎打滑或者空转现象[18]。地面无人平台集群协同的工作环境通常存在各种环境噪声及未知的外界扰动[19]。此外,受自身模型参数变化和负载等因素的影响,难以获得准确的地面无人平台模型。在执行协同控制任务时,这些不利因素对于地面无人平台集群协同控制器的鲁棒性提出了更高的要求。在地面无人平台集群协同工作时,邻居无人平台之间通过传感器观测或者通信实现信息交互,由于受单个无人平台携带的计算资源和通信资源的限制等原因,尤其是在执行协同控制任务时集群中地面无人平台的数量比较多时,容易引起信道阻塞,这时信息交互无法顺利进行,不可避免地对无人平台集群协同控制的性能造成不利影响[10,20]。
本文主要考虑在不利因素(不确定性、外界扰动、平台打滑和侧滑)影响以及通信或者计算资源受限条件下,对于轮式地面无人平台集群协同控制进行综述。首先,介绍轮式地面无人平台的模型及几种处理其非完整约束的方法;其次,对地面无人平台集群的典型协同控制任务进行简要回顾;再次,分别综述了近几年来地面无人平台集群鲁棒协同控制和基于事件触发协同控制的研究成果;最后,指出地面无人平台集群协同控制值得深入研究的问题,并展望其未来的发展前景。
2 典型地面无人平台的运动学与动力学建模
地面无人平台主要有轮式、履带式和足式等几种。其中,轮式地面无人平台因具有移动速度快、控制方便等优点,得到了广泛应用。本文主要针对近几年来轮式地面无人平台集群协同控制的研究进展进行综述。目前,很多关于轮式地面无人平台集群协同控制的研究工作主要针对其运动学模型,也有部分工作同时针对轮式地面无人平台的运动学和动力学模型进行研究。首先,对于一般的轮式地面无人平台运动学和动力学进行建模;然后,介绍了协同控制中处理轮式地面无人平台非完整约束的几种方法。
以轮式地面无人平台集群领航-跟随者法为例,假设集群中包含1个领导者和n个跟随者轮式地面无人平台,第i个跟随者轮式地面无人平台一般运动学模型为
定义qi=[xi,yi,θi]T为状态向量,[xi,yi]T描述第i个跟随者轮式地面无人平台的位置,iθ表示平台的运动方向与坐标轴x的夹角,vi,iω分别为轮式地面无人平台线速度和角速度。
轮式地面无人平台动力学可建模为
轮式地面无人平台与普通的非线性智能体不同,其运动学模型具有非完整约束特性。根据文献调研,给出轮式地面无人平台集群协同控制中处理非完整约束问题的几种方法。
(1)反馈线性化[21]。通过定义输入输出函数或等价的微分状态,利用反馈线性化将轮式地面无人平台非线性模型转换为二阶积分线性模型。引入新的输入变量ui,满足
则通过反馈线性化,轮式地面无人平台的运动学模型(1)可转换为二阶线性模型
(2)非线性链式法[22-24]。为了处理协同控制中轮式地面无人平台非完整约束问题,将平台的运动学模型(1)转换成非线性链式系统。选取坐标变化
则轮式地面无人平台模型(1)可变换为如下非线性链式系统
式中,u1,i=-ωi,u2,i=vi+x2,iωi。
(3)选取轮式地面无人平台朝向前一点Hi作为参考,令Hi= [hxi,hyi]T,则轮式地面无人平台的运动学模型(1)运动学方程可表示为[25-26]
式中,Li为点Hi到平台中心的距离,则点Hi的运动可由以下方程来描述
对式(9)求导可得
其中,
3 地面无人平台集群的典型协同控制任务
地面无人平台集群协同工作时,不同的工作场景有不同的控制任务需求,这些控制任务主要有一致性、编队、环航、蜂拥等。接下来将对地面无人平台集群的典型协同控制任务:一致性、编队和环航,分别进行简要介绍。
一致性控制是地面无人平台集群协同控制的基础,其思想是以地面无人平台集群中个体状态的差异作为反馈,然后通过一致性协议使集群中的个体状态收敛到相同值。局部跟踪一致性误差定义[27-28]
式中,ξi(i= 1 ,2,…,n)表示集群中第i个地面无人平台的状态,ξr为地面无人平台集群需要达到一致性的目标值。aij表示地面无人平台集群中个体之间的信息流,当aij> 0 时,集群中的个体ı˙可以接收或者观测到来自个体j的信息;当aij= 0 时,个体ı˙和个体j无信息交互。ai0表示地面无人平台集群中的个体能否直接接收或者观测到一致性的目标值。当能直接接收或观测到时,ai0>0;否则,ai0= 0 。一致性渐近收敛的控制目标数学描述形式
地面无人平台集群的编队控制技术被应用到许多领域,比如地面无人车辆编队运输,轮式机器人编队协同搬运等。编队控制的目的使地面无人平台之间根据其任务特点形成特定的队形,通常地面无人平台的编队形状可由地面无人平台集群相邻个体之间的偏置向量pij来定义,其编队的局部一致性误差可定义为
式中,ξi,ξr,aij,ai0的含义同式(12),pi0表示编队中第i个地面无人平台同期望的参考轨迹ξr的偏置量。地面无人平台集群编队渐进收敛的控制目标数学描述形式[29]
地面无人平台集群的环航控制是一种被称为围绕目标环形导航或者追逐的协同控制策略,可以被用来执行巡逻、护送、覆盖等任务。环航控制的目的是使地面无人平台集群中的个体始终环绕以目标T为中心、半径为r的圆轨迹进行运动,其控制目标的数学表述形式[30]
式中,ξT,ξi分别为目标T和地面无人平台集群中第i个无人平台的状态向量;vi表示第i个无人平台的速度;ψi是第i个无人平台与其邻居同目标T之间的夹角(i= 1 ,2,… ,n)。
4 地面无人平台集群的鲁棒协同控制
在实际情况下,地面无人平台集群协同执行任务时,由于外界扰动、模型参数不确定性等因素影响,所设计的协同控制器对于这些不利因素应具有鲁棒性。因此,科研人员对于地面无人平台集群协同控制的鲁棒性问题进行研究,取得许多成果[31-32]。接下来,从轮式地面无人平台集群鲁棒协同控制的角度综述近年来的相关文献(如表1所示)。
表1 地面无人平台集群协同控制的鲁棒性增强方法Table 1 Approaches of robustness enhancement in cooperative control for unmanned ground platforms clusters
观测器通过附加的辅助系统,利用系统信息估计不确定性和外部扰动并补偿到控制器中或者估计未知的系统状态,以增强控制系统的鲁棒性,被应用于轮式地面无人平台集群协同控制算法设计[33-34]。针对轮式地面无人平台运动学模型,Chang等[19]提出了固定时间收敛的编队控制策略,设计固定时间收敛的分布式扩张状态观测器用于估计补偿扰动,实现了控制器对于外部扰动和不确定性的鲁棒性。文献[22]针对非完整链式模型设计基于观测器的有限时间收敛的一致性跟踪控制算法,并将其应用到轮式地面无人平台运动学模型编队控制。在存在外部扰动和模型不确定性条件下,文献[35]针对于轮式地面无人平台运动学模型,提出基于分布式有限时间收敛干扰观测器的一致性鲁棒控制策略。然而文献[19,22,35]针对于轮式地面无人平台集群协同仅考虑了轮式地面无人平台的运动学模型,基于运动学模型的控制器设计为了保证闭环系统的稳定性,需要假定存在“完美的速度跟踪”,即系统的实际控制输入等于期望控制输入[36]。事实上,大多数实际的轮式地面无人平台系统都是动态系统,并具有不确定性,实际的运动学控制输入不等于期望的控制输入。因此,在设计轮式地面无人平台集群协同控制器时还应考虑平台动力学模型。文献[37]针对轮式地面无人平台的运动学和动力学模型存在不确定性的情况,设计了一种复合分布式鲁棒协同控制策略,利用非线性干扰观测器增强分布式协同控制器对于不确定性的抑制能力。针对执行器饱和现象,文献[38]考虑轮式地面无人平台的运动学和动力学模型研究其编队控制,通过饱和观测器来有效补偿执行器的饱和非线性。
作为一种非线性鲁棒控制方法,滑模控制自提出以来被应用到各个领域[39]。滑模控制与其他非线性控制方法的不同之处在于其变化的系统结构,一旦系统进入滑动模态就会保持在其上运动,对于匹配不确定性和扰动具有很强的抑制能力和适应性。因此,对解决不确定性和扰动条件下非线性轮式地面无人平台集群的协同控制问题有独特的优势[40]。文献[37]基于滑模控制提出了一种复合的分布式鲁棒协同控制策略,增强控制器对于不确定性的抑制能力。文献[25]设计了有限时间收敛的滑模控制策略抑制模型不确定性对于控制性能的影响,另外通过预设性能对控制器的性能进行约束。为了加快轮式地面无人平台编队收敛速度,文献[41]通过领航-跟随者法将轮式地面无人平台的编队问题转化为跟踪控制问题,提出了一种双幂次滑模编队控制策略,实现了编队快速收敛。在外部扰动存在的条件下,文献[23]针对高阶链式非完整多智能体系统,设计了分布式有边界的快速终端滑模一致性协议,通过有限时间收敛的观测器估计领导者信息,并将其应用到轮式地面无人平台集群一致性控制中。针对轮式地面无人平台编队控制,文献[42]基于积分滑模提出了有限时间一致性控制算法,采用观测器估计外部扰动和平台速度信息,进一步增强编队控制算法对于外界扰动的鲁棒性和适应性。同样考虑外部扰动,文献[26]针对轮式地面无人平台的运动学特性,结合滑模控制和最优控制理论提出一种最优滑模控制策略,通过递归神经网络逼近最优解,使控制器在保持鲁棒性的同时具有优化性。针对存在输入扰动的轮式地面无人平台一致性跟踪问题,文献[43]基于滑模控制提出了分布式控制算法,实现轮式地面无人平台集群位置和方向的一致性。
尽管上述关于轮式地面无人平台协同鲁棒控制的研究已有许多成果,这些研究结果大都基于轮式地面无人平台“纯滚动而不打滑”的假设,或者未考虑轮式地面无人平台轮胎未知的打滑和滑动,不能在滑移环境下保持轮式地面无人平台集群协同跟踪控制的鲁棒性。文献[44]考虑轮式地面无人平台打滑和侧滑的情况,设计轮式地面无人平台集群编队控制算法,利用滑模控制增强算法的鲁棒性。在轮式地面无人平台发生侧滑和打滑的情况下,文献[15]基于动态面控制设计轮式地面无人平台集群编队跟踪控制算法,通过自适应补偿律消除未知的打滑与侧滑对于轮式地面无人平台编队控制性能的不利影响。文献[18]研究打滑与侧滑条件下轮式地面无人平台集群的分布式编队控制,设计补偿未知滑移效应的自适应律,实现控制器对于轮式地面无人平台动力学未知和滑移效应的鲁棒性。考虑打滑、侧滑和执行器死区特性,文献[45]基于零和差分博弈理论研究轮式地面无人平台集群的一致性控制,并利用H∞控制增强系统的鲁棒性。
近年来,随着智能控制技术的发展,智能控制与地面无人平台集群协同控制交叉研究也取得了许多成果,比如神经网络、模糊控制、迭代学习等智能方法应用到轮式地面无人平台集群协同控制算法设计中。神经网络具有优良的逼近特性和自适应能力,不依靠精确的系统模型,通过学习或自适应逼近未知扰动和模型未知部分然后进行补偿,其作用类似观测器。考虑存在不确定性的轮式地面无人平台模型,文献[46]采用径向基函数神经网络学习和估计系统参数,并补偿模型不确定性,以增强轮式地面无人平台集群编队控制的鲁棒性。文献[47]利用自适应控制和神经网络补偿轮式地面无人平台集群协同系统中的参数不确定、未建模动态和外部干扰。针对动态扰动和模型未知条件下的轮式地面无人平台集群,文献[24]设计基于障碍李雅普诺夫函数的一致性控制策略,通过神经网络逼近扰动和模型未知部分,以增强控制器的鲁棒性和适应性。模糊控制类似神经网络,能根据系统信息对模型不确定性和扰动进行逼近补偿,使控制器具有抑制扰动的能力。文献[48]基于模糊逻辑控制设计轮式地面无人平台集群编队控制器,增强控制器对于模型不确定性的鲁棒性。作为一种智能控制方法,迭代学习控制不同于神经网络和模糊逻辑控制,迭代学习控制通过迭代修正输出量逐步减少跟踪误差进而抑制系统中的噪声和不确定性。文献[49-51]基于迭代学习设计了轮式地面无人平台集群的分布式一致性/编队控制器,抑制扰动和不确定性对于集群系统控制性能的不利影响。
关于轮式地面无人平台集群鲁棒协同控制的研究已经取得了许多成果,但是协同控制器的鲁棒性使控制器具有一定的保守性,从而导致地面无人平台集群协同控制性能的降低。Rahmani等[26]基于优化控制设计一种最优滑模分布式协同控制策略,使协同控制器在保持鲁棒性的同时具有性能优化能力,提升协同控制器的性能。结合智能控制、最优控制等技术优化地面无人平台集群的鲁棒协同控制策略,使协同控制器具有鲁棒性和优化性,值得深入研究。
5 基于事件触发的地面无人平台集群协同控制
地面无人平台集群能够协同完成任务的重要因素是平台之间通过相互通信或者观测进行交互信息,然后根据自己获得的信息(位置、速度、姿态等)调整控制策略。然而,单个地面无人平台所携带的嵌入式微处理器和无线网络资源是有限的,通信和控制器更新通常是连续或周期执行的。连续更新方案和具有周期的更新方案都会导致通信和计算资源的浪费。事件触发控制凭借其节约资源的优势而被广泛关注。事件触发控制在违反设定事件触发条件后,控制律就会进行更新。事件触发条件通常由系统的状态/输出函数建立,因此是否执行通信和控制器更新由系统信息决定。自提出以来,事件触发控制在线性和非线性系统以及网络控制领域得到了广泛的研究[52-53]。为了降低地面无人平台集群对通信和计算资源的消耗,研究人员将事件触发的机制应用到地面无人平台的集群协同控制中[54-56]。
文献[57]设计了有限时间收敛的轮式地面无人平台集群事件触发编队控制算法,同时利用快速趋近律提高系统收敛速度。同样针对轮式地面无人平台集群编队控制,文献[58]设计了基于事件触发的分布式控制策略,并在降低计算资源消耗的同时利用滑模控制增强分布式控制器的鲁棒性。尽管文献[57-58]将滑模控制和事件触发相结合,保持轮式地面无人平台集群协同控制器对于扰动的鲁棒性,但是分析其触发条件,这类事件触发方式依赖于邻居实时状态信息,这就需要机器人之间进行连续的信息交互,仅降低控制律的更新频率和减少平台的计算资源消耗,实质上并没有减少通信资源的消耗。为了减轻通信资源负担,文献[20]基于事件触发控制研究轮式地面无人平台集群的分布式双向一致性和编队控制,从理论上排除了Zeno现象。文献[21]通过动态反馈线性化,将轮式地面无人平台的非线性模型转换为二阶积分器模型,基于转换后的模型提出了事件触发的轮式地面无人平台集群编队控制方案,并分析排除Zeno现象。在考虑变拓扑的情况下,文献[59]提出基于事件触发的轮式地面无人平台协同编队控制策略,同时为了减少触发条件对于邻居信息的依赖,设计的事件触发条件仅依赖于自身状态,减少通信网络的资源消耗,但是没有分析排除Zeno现象。文献[60]针对双向一致性,基于时变的比例函数提出了预设时间收敛的事件触发控制策略,分析排除 Zeno现象,并将其应用到轮式地面无人平台一致性控制中。上述基于连续事件触发(如图4所示)设计的轮式地面无人平台集群协同控制器均需考虑排除Zeno现象,Zeno现象的发生通常与事件触发条件设计有关。为了避免 Zeno现象的发生,通常在设计触发条件时保证连续的两个触发之间有一个最小的时间间隔。
图4 基于连续事件触发的地面无人平台集群协同控制Fig.4 Cooperative control of clusters for groundunmanned platforms based on continuous event triggering
不同于连续的事件触发机制,基于周期性事件触发机制(如图5所示)的轮式地面无人平台集群协同控制器不需要排除 Zeno现象,两次触发间隔的下限即为最小周期,从根本上避免Zeno现象的发生。且连续事件触发机制需要持续监测轮式地面无人平台和其邻居的状态判断是否满足触发条件,同样会增加计算资源的消耗。文献[61]基于周期性事件触发机制研究轮式地面无人平台集群朝向一致性和编队控制,进一步降低通信和计算资源的消耗。文献[62]考虑轮式地面无人平台集群编队的实际应用,提出一种周期事件触发编队控制策略,利用邻居状态的估计值设计触发条件,减少事件触发条件对于邻居实时状态信息的依赖。考虑通信网络时间延迟,文献[63]针对轮式地面无人平台提出了基于事件触发分布式一致性控制算法,设计了仅在采样时间检测的积分触发条件,但是该事件触发条件基于通信网络延迟时间严格小于事件触发探测周期的假设,在实际情况下无法验证是否满足假设条件,这将阻碍该算法的实际应用。为了降低通信网络资源消耗和进一步提升控制性能,文献[64]提出了一种动态阈值的周期事件触发轮式地面无人平台集群分布式编队控制策略,在减少通信资源消耗和保持控制性能之间达到更好的平衡。
图5 基于周期事件触发的地面无人平台集群协同控制Fig.5 Cooperative control of clusters for ground unmannedplatforms based on periodic event triggering
此外,为了进一步减少轮式地面无人平台之间的通信资源消耗,文献[10]采用传感器探测邻居平台的位置,通过滑模微分器估计邻居平台的速度信息,设计基于事件触发的分布式轮式地面无人平台集群编队控制策略,避免控制器的连续更新,减小集群中每个平台的计算资源消耗。文献[65]将轮式地面无人平台集群系统分为中间层和底层,设计混合触发的轮式地面无人平台集群编队控制策略,其中中间层的轮式地面无人平台能够通过自身传感器观测到领导者信息,且通过观测器估计领导者的速度信息,采用基于连续事件触发的控制策略。在集群中不能够直接观测领导者信息的轮式地面无人平台为底层平台,它们采用周期事件触发控制策略,通过轮式地面无人平台与邻居间通信间接获取领导者信息,利用观测器估计领导者的速度和位置信息。
基于事件触发的地面无人平台集群协同控制本质上是通过离散的控制量控制集群系统协同工作,事件触发的频率增加时,必然会导致更多的通信、计算资源消耗。因此,在地面无人平台集群协同控制性能和通信、计算资源的节约之间存在一个平衡[10]。如何进一步在这个平衡中寻求减少通信和计算资源消耗,并提升控制性能值得进一步研究。
6 结束语
伴随着多智能体协同控制的发展,针对地面无人平台集群协同控制的研究已取得一些成果。但是具有非完整约束特性的典型地面无人平台不同于一般非线性智能体。考虑地面无人平台的实际应用及其工作环境,地面无人平台集群协同控制仍有许多问题值得深入研究。
(1)高机动条件下地面无人平台集群协同控制。高机动条件下,地面无人平台会发生大幅度的滑移和打滑,许多工作基于“纯滚动而不打滑”的假设或未考虑无人平台未知的打滑和滑动,一般的地面无人平台集群协同控制方法不再适用,如何在发生大幅度滑移和打滑条件下保证地面无人平台集群协同控制器鲁棒性是一个具有挑战性的问题。同时,高机动条件下,要求地面无人平台之间能够快速获取邻居信息,如何高效利用有限的通信和计算资源快速有效地控制每个地面无人平台也是一个重要问题。
(2)地面无人平台集群分布式鲁棒优化协同控制。尽管关于单个地面无人平台鲁棒优化控制的研究已经有许多工作,但是在外界扰动、建模不确定性等不利因素的影响下,地面无人平台集群协同控制在保持鲁棒性的同时,如何实现分布式优化仍是一个开放性问题。
(3)通信和计算资源约束条件下地面无人平台集群协同优化控制。在集群系统中,每一个地面无人平台所拥有的计算和通信资源都是有限的,基于事件触发的协同控制策略尽管能减少通信和计算资源的浪费,但是也在一定程度上限制了地面无人平台协同的控制性能。因此,如何在有限的通信和计算资源条件下优化地面无人平台集群协同的控制性能也是一个值得研究的问题。
未来地面无人平台集群协同完成的任务将会越来越复杂和繁琐,且任务的精确度要求将会越来越高,因此对于其协同控制算法也提出了更高的要求。智能控制是未来的发展趋势,未来地面无人平台集群协同控制必将与智能控制算法紧密结合。随着地面无人平台集群协同控制技术的发展与进步,地面无人平台将会有更广泛的应用前景。