APP下载

基于动态事件触发策略的多AUV 一致控制

2022-09-02胡满江王智炜杜长坤叶俊边有钢

关键词:领航者跟随者编队

胡满江,王智炜,杜长坤,叶俊,边有钢†

(1.湖南大学机械与运载工程学院,湖南长沙 410082;2.北京理工大学机电学院,北京 100081;3.湖南大学无锡智能控制研究院,江苏无锡 214072)

随着海洋资源争夺的日益激烈,作为海洋探测开发的工具,自主水下机器人(Autonomous Underwater Vehicle,AUV)的研究引起了众多学者的关注.目前,对AUV 的研究主要集中在单个AUV 的智能控制上.在一些特殊的场合中,单个AUV 因功能单一、承载空间有限、无法携带大量配置等,无法完成某些指定任务,如:对某一指定区域进行监测、海底测绘、复杂的战术进攻围捕等.因此,多AUV 协同系统的研究日益重要.多AUV 系统不是单个AUV 的简单叠加,而是涉及通信、队形结构等的编队问题,通过建立合理的编队协同机制,使多个AUV 保持期望的位姿,完成特定的任务[1].

目前,编队控制方法多应用于船舶、飞行器、车辆[2-3]等,应用于多AUV 系统则相对较少.常见的多AUV编队控制方法分为协调路径跟踪和协调目标跟踪.协调路径跟踪[4]的控制目标是跟踪一个参数化的预定路径,协调目标跟踪的控制目标是跟踪领航者附近的一个参考点或目标点[5].如Cui 等[6]研究了欠驱动AUV 在水平面上运动的领航者-跟随者(Leader-Follower)编队控制问题,其中跟随者根据领航者的位置和预定的队列跟踪参考轨迹,而无需领航者的速度,减小了通信负担.Millán 等[7]将AUV 视为单车模型,利用运动学关系和泰勒公式展开定理,对单车模型进行线性化处理,保持编队转弯能力,使编队通过跟踪共同参考航线向目标方向航行.高振宇等[8]将AUV 不确定模型参数及海洋扰动视为复合扰动,设计了复合扰动观测器,实现对扰动的精确估计,而后基于反步法提出一种固定时间编队控制律,使编队在固定时间达到期望队形.需要注意的是,上述方法均需要领航者信息,通过跟踪领航者或者跟踪依靠领航者信息生成的预设路径,以实现渐近稳定的编队控制,本质上都是跟踪问题.此外,上述方法要求多AUV 间进行连续通信,并在每一个采样时刻将自身AUV 的状态广播给邻居.连续通信会带来较高的通信负担和能量消耗,这对作业中只能依靠自身携带能源的AUV 来说是一个不小的负担.因此,在满足控制性能的前提下,减少通信次数具有很强的现实意义.

近年来,基于事件触发的编队控制策略得到了广泛研究.该控制策略在AUV 满足特定触发条件时才会对其邻居广播自身的状态信息,并同时更新自身的控制律,可有效降低通信负担和能量消耗,为解决上述问题提供了有效手段.

目前,事件触发的编队控制研究多集中于多智能体系统[9-13]和车辆队列[14-15]系统.Behera等[16]采用事件触发策略,利用滑模控制解决了受外部干扰的非线性系统的鲁棒镇定问题.Li 等[17]提出了一个新的事件触发方案,解决了非线性动力学和时间变化延迟的多智能体系统的共识问题.Liu等[18]通过构造底层变量,设计了拉格朗日系统的事件触发控制策略,并结合滑模控制方法,解决了无向图下具有拉格朗日动力学的多智能体系统的共识问题.Gao 等[19]针对AUV 平动模型,通过间歇性采样进行通信机制设计,并结合反步法设计了AUV 触发策略,实现了基于领航者-跟随者的固定时间AUV 编队控制.Su等[20]考虑AUV 的水平面模型,基于事件触发策略,运用反步法设计了具有外部不确定性的固定时间编队控制器,通过仿真验证了用于多AUV 系统的固定时间事件触发编队协议的有效性.

上述研究所采用的均为静态触发策略.为了增大触发时刻间隔、进一步降低通信负担,动态事件触发策略得到了关注,通过设计动态参数,让触发阈值随状态的变化而改变,有效地增加了触发间隔.Yi等[21]针对一阶系统的一致控制问题,设计了两种动态事件触发策略,并提出了自触发算法,仿真结果表明,动态触发策略可有效降低能耗.Du 等[22]针对一阶跟随者-领航者跟随问题,首先提出了集中事件触发机制;然后,通过引入内部变量设计了分布式动态触发策略,在两种情况下,根据设计的事件触发规则排除了Zeno现象.

本文研究基于动态事件触发策略的多AUV 一致控制问题,主要贡献包括:首先,提出了一种动态事件触发通信策略,根据触发时刻的AUV 与邻居的状态改变动态参数,让触发阈值随状态的变化而改变.在设计的控制策略中,AUV 只在满足触发条件时才会对邻居广播自身的状态信息,并同时更新自身的控制律,该策略可以显著减小AUV 之间通信造成的能耗.其次,基于一致性理论、滑模变结构控制方法,设计了考虑环境干扰的多AUV 鲁棒一致控制器,并通过构建辅助变量简化了控制律的设计过程.最后,利用反证法,证明了触发间隔存在一个严格大于0的数,排除了Zeno现象.

1 预备知识与问题描述

1.1 符号和图论

文中用到的符号如下:

本文中AUV 编队通信网络结构用图表示.跟随者AUV 的通信拓扑表示为无向图G=(V,ε,A),其中V={1,2,…,N}是节点集合,ε⊂V×V是弧集,表示两节点之间的连接通道,A=[aij]∈RN×N是一个对称矩阵,当节点i和节点j连通时,aij=aji=1;否则aij=0.集合Ni={j∈V:(i,j) ∈ε}表示与节点i邻接的节点集合,|Ni|表示与节点i邻接的节点的个数.对角矩阵D=diag{d11,d22,…,dNN}∈RN×N是度矩阵,其中dii=

设无向图G的拉普拉斯矩阵L=[lij]∈RN×N定义为:

其中,L矩阵的元素定义为:

对角矩阵B定义为:

当第i个跟随者与领航者连通时,ai0>0;否则,ai0=0.

1.2 问题描述

对于一个领航者-跟随者系统,用下标i=0 表示领航者AUV,i=1,…,N表示跟随者AUV.基于领航者间歇性运动,考虑多AUV 编队的一致问题.在领航者间歇性运动间隙,领航者固定不动,只发送自身状态信息.AUV 的运动可以通过地面坐标系G-abc和载体坐标系O-abc两个坐标系来描述.

假设1在AUV 中,一般横倾运动都是自稳定,因此忽略横倾运动对AUV 的影响,即横滚角恒为0.纵倾角范围为[-π∕6,π∕6].

假设2AUV 是上下、左右、前后高度对称的模型;AUV 低速运行,低速情况下AUV 的水动力参数近似看作不变;重心与浮心重合;AUV工作在海面以下,故忽略海风、海浪对AUV 的影响,仅考虑海流,其大小有界且缓慢变化.

假设3跟随者间的通信拓扑图G无向且连通.

AUV运动学方程[23-24]为:

AUV动力学方程[23-24]为:

式中:ηi=[xi,yi,zi,θi,ψi]T表示地面坐标系下的位姿坐标,xi为纵向轴位移,yi为横向轴位移,zi为垂向轴位移,以垂直向下为z轴的正方向,θi为纵倾角,ψi为航向角;Θi=[θi,ψi]T表示地面坐标系下的姿态角;vi=[ui,ςi,wi,qi,ri]T为载体坐标系下AUV 的线速度与角速度,ui为纵向速度,ςi为侧向速度,wi为垂向速度,qi为纵向角速度,ri为航向角速度.J1(Θi) ∈R3×3表示线速度从载体坐标系到地面坐标系的转换矩阵;J2(Θi) ∈R2×2表示角速度从载体坐标系到地面坐标系的转换矩阵;Mi为惯性矩阵;C(vi)为科氏及向心力矩阵;D(vi)为阻尼矩阵;g(Θi)为回复力向量;τi为输入;根据假设2,ϖ为有界扰动,‖ϖi‖1≤bi,bi为干扰的上界值.

定 义cosψi=cψi,sinψi=sψi,cosθi=cθi,sinθi=sθi,有

1.3 控制目标

本文的控制目标是设计基于动态触发的跟随者AUV 控制律,当领航者AUV 保持静止时,使其与领航者AUV保持期望的相对位置与相对姿态,即

式中:η0(t)=Ω,用来表示领航者AUV 的固定状态信息,Ω为5维常数列向量;vi(t) ∈R5×1;di0∈R5×1代表跟随者i与领航者之间期望的相对位置与相对姿态.后文中η0(t)简写为η0.

2 分布式动态触发一致性协议设计

本节针对AUV 编队的一致性问题,提出一种结合分布式控制器与动态触发律的分布式动态事件触发一致性协议.排除了Zeno 现象,保证了协议的可行性.

2.1 控制器设计

为实现AUV 编队的一致性,受文献[18]的启发,针对系统存在外部干扰的情况,采用以下分布式控制器:

注2定义辅助变量ξi(t)来简化AUV模型,根据一阶微分方程的性质,当ξi(t)收敛到一个确定的值T时,vi(t)逐渐收敛到0,ηi(t)逐渐收敛到T.

注3上述设计的控制器把广义位置ηi(t)与载体速度vi(t)的一致控制转化为对辅助变量ξi(t)的一致控制,通过引入参考变量σi(t)构建上层参考模型,利用滑模控制保证ξi(t)对σi()t的跟踪效果,进而实现编队的一致性.

注4通过引入ξi(t)和σi(t)构建分级控制框架,将相邻信息交互与分布式动态控制分离开,简化设计过程.动态触发律基于σi(t)设计,以实现σi(t)一致.相较于同时考虑AUV运动学模型与AUV动力学模型设计控制器,通过引入ξi(t)简化AUV 动力学模型,使分布式控制器可以仅在简化后的AUV 动力学模型上进一步设计,并通过保证ξi(t)对σi(t)的跟踪效果来实现编队的一致性.

岩性、构造、地貌及水系,是贵州观赏石资源形成的重要控制因素。形、质、色、纹、韵四种审美元素在贵州观赏石资源上体现得十分充分和典型。其中,“色彩”是贵州观赏石的显著特点,可概括和解读为“十大色系”,展现出观赏石资源中“多彩贵州”的无限魅力。

2.2 动态事件触发律设计

对于每一个跟随者i,定义状态测量误差:

动态事件触发律设计如下:

结合式(24)、式(25)得:

2.3 主要结果

结合式(6)、式(19),得到最终的控制系统为:

定理1在假设1—假设3 下,触发律(24)和控制律(19)可以使跟随者系统(28)收敛到指定位姿.

当ki>0且ϵi>bi时,有

将式(41)代入式(40),有

根据式(32),对V3求导,得

将式(38)、式(42)和式(43)代入式(29),有

所以

所以有ei(t)=ej(t),σic(t)=σjc(t),σi(t)=σj(t).根据式(20),有ξi(t)=σi(t).当t→∞,ξi(t)=ξj(t)时,(ηi(t) -ηj(t)) +vi(t) -vj(t)=0.根据一阶微分方程性质,得t→∞,ηi(t) -ηj(t)=0,vi(t) -vj(t)=0.由上述分析可知,当且仅当V˙=0 时,多AUV 系统能够实现一致.因此,多AUV 系统最终能收敛到期望队形.

证毕.

定理2在假设1—假设3 下,触发律(24)和控制律(19)可以使跟随者系统(28)无Zeno现象.

保证式(51)一定成立的情况下,设定如下条件:

与式(50)比较,得在触发律(24)和控制律(19)条件下,可以使跟随者系统(28)无Zeno现象.

证毕.

3 仿真研究

本文以4 艘跟随者与一艘领航者组成的系统进行编队研究,通过仿真验证所提出定理的正确性和控制算法的有效性.

3.1 仿真条件

领航者AUV 与跟随者AUV 同质,AUV 动力学方程中的标称矩阵M、C(v)、D(v)参数如表1 所示,跟随者AUV 的控制系统参数如表2 所示,通信拓扑如图1 所示.领航者的固定位姿为η0=[0,0,0,0,π∕6]T,4 个跟随者的初始位姿分别为η1=[-4.5,-5,1,π∕6,-π∕3]T,η2=[-4,-5,1,-π∕6,-π∕6]T,η3=[6,-5,2,π∕12,π∕3]T,η4=[10,-5,3,-π∕12,π∕6]T.

图1 AUV的通信拓扑图Fig.1 Communication topology map of AUV

表1 AUV模型参数Tab.1 Model parameter of AUV

表2 动态触发控制系统参数Tab.2 Parameter of dynamic triggering control system

领航者固定,4 个跟随者的初始速度v1=v2=v3=v4=[0,0,0,0,0]T,期望的编队构型d10=[2,2,0,0,0.152]T,d20=[1,4,0,0,0.152]T,d30=[-1,4,0,0,-0.152]T,d40=[-2,2,0,0,-0.152]T.AUV 重力Fi等于浮力Ti,Fi=Ti.海洋扰动

为体现动态触发策略优越性,对静态触发策略进行仿真.静态触发函数作为动态触发函数的一种特殊情况,当额外动态变量ρi(t)=0 时,得到静态触发函数:

静态触发仿真的AUV 模型参数见表1,控制系统参数见表3,初始速度、初始位姿、编队构型、通信拓扑、浮力重力以及海洋扰动的选取均与动态触发仿真一致.

表3 静态触发控制系统参数Tab.3 Parameter of static triggering control system

注6图1 展示了AUV 编队通过分布式动态事件触发协议期望达到的最终队形,这里控制目标是使领航者与跟随者从不同平面收敛到同一水平面,纵倾角均收敛为0,跟随者航向角均与领航者的航向角保持各自期望的偏差值.

图1 展示了水下机器人之间的通信拓扑关系,其中领航者与跟随者间的通信拓扑用邻接矩阵B表示.

跟随者之间的通信拓扑用拉普拉斯矩阵L表示.

3.2 仿真结果

图2 为AUV 在x、y、z方向上的位置变化.由图2可知,当时间到达6 s 以后,各个跟随者AUV 均收敛到期望位置.图3 给出了AUV 纵倾角与航向角的变化,由图3 可知,当时间到达6 s 以后,各个跟随者AUV 均收敛到期望姿态角.根据图2 与图3 可以得出,跟随者AUV 在本文设计的控制器下可以收敛到期望位姿,AUV 编队可以保持期望队形.图4给出了AUV 的线速度变化,由图4 可知,当时间到达8 s 以后,各个跟随者AUV 的线速度均可收敛至0.图5 给出了AUV 的角速度变化,由图5 可知,当时间到达8 s以后,各个跟随者AUV的角速度均可收敛至0.图6 给出了各个AUV 的测量误差与阈值,由图6 可知,各个AUV 的测量误差与阈值逐渐收敛至0,证明跟随者AUV 在本文设计的控制器下可以收敛到期望位姿,AUV 编队可以保持期望队形.图7(a)给出了各个跟随者AUV 在静态触发策略下的触发时刻,可以看出3 s以后跟随者AUV的触发极其密集,无法达成减少触发次数的目的;图7(b)给出了各个跟随者AUV 在动态触发策略下的触发时刻.对比图7(a)(b),可以明显看出,基于动态触发的控制策略显著增大了触发间隔,从而减小了触发次数.图7(b)验证了跟随者AUV 在所设计的动态触发控制律下不存在Zeno现象.表4为不同触发策略下的触发次数,由表4 可以看出,动态触发策略能显著减少触发次数,节省大量的通信资源.

表4 不同触发策略下的触发次数Tab.4 The number of triggering under different triggering strategies

图2 各个AUV的位置Fig.2 Position of each AUV

图3 各个AUV的姿态Fig.3 Posture of each AUV

图4 各个AUV的线速度Fig.4 Linear velocity of each AUV

图7 AUV触发时刻Fig.7 The triggering instants of AUV

上述仿真试验验证了所设计的动态触发律与协同编队控制律的有效性与正确性,并排除了Zeno现象.

4 结论

本文研究了基于动态事件触发的AUV 分布式一致控制问题.通过一致性理论、滑模变结构控制,设计了基于动态触发的AUV 分布式控制策略.通过李雅普诺方程证明了所提出控制律与触发律的正确性,并通过反证法,证明了触发间隔存在一个正定下界,排除了Zeno 现象.仿真结果表明,所提出方法在考虑了具有外界干扰的情况下可以让AUV 队列收敛到期望位置,与连续通信相比,降低了能耗,减小了通信负担;与静态触发的通信策略相比,触发间隔更大,可进一步减小通信消耗.

在实际工程中,通信数据很有可能出现丢包或延迟的现象,而且实际AUV 的执行器具有输出约束,往往指令输入信号与实际执行信号之间存在巨大差异,但这两个问题在本文中均被忽略了.因此,未来的研究工作将集中在:1)考虑丢包和时延对触发控制的影响;2)考虑执行器输入饱和以及故障发生的情况,对控制器进行补偿.

猜你喜欢

领航者跟随者编队
“益源庆”打造中国高品质食醋领航者
基于改进的跟随领航者与人工势场的CGF队形控制及避障∗
GP One轻型飞机专用模拟器
基于事件驱动的多飞行器编队协同控制
由城市台的“跟随者”到县域“三农”媒体的 “领导者”
从“跟随者”到“引领者”的跨越
从“跟随者”到“引领者”
—— 瓮福集团PPA项目成为搅动市场的“鲶鱼”
跟随者
电磁航天器编队位置跟踪自适应协同控制
基于RQPSO-DMPC的多无人机编队自主重构控制方法