基于有限状态机的UUV 集群围捕策略研究
2022-03-31李亚哲姚尧冯景祥尤
李亚哲姚 尧冯景祥尤 岳
(江苏自动化研究所,江苏 连云港 222006)
0 引言
无人水下航行器(UUV)自20世纪60年代发展至今,已广泛应用于各大领域,包括近海石油勘探、水下安保、水下通信线路的铺设与维修等民用领域以及水下搜索、侦察、猎雷、反潜作战等军用领域。然而随着海洋资源进一步的开发以及水下作业力度的加大,单个UUV 在获取信息、任务处理以及控制执行力等方面有明显的局限性,难以独自完成复杂的工作任务。因此UUV 技术必然会朝着鲁棒性更强、容错性更好的UUV 集群的方向发展。UUV 集群技术在水下侦察、搜救、围捕等任务中也得到了广泛应用。其中UUV 集群围捕任务经常被用来检测和评价UUV 集群系统的性能。随着智能无人集群体系理论的发展,其仿真及验证也得到了极大的提高。近年来,该问题成为UUV 集群领域的一个热点课题。
文献[6]根据人类的认知活动提出了一种基于群体意志统一的无人机围捕策略,有效解决了不同数量的无人机集群围捕问题,但该方法局限于固定环境下的围捕。文献[7]在每个机器人都能获取全局态势的前提下利用循环追踪策略解决了围捕问题。文献[8]通过预测虚拟目标提出一种使用相位差的神经振荡器的基于极限环的算法,成功完成了多机器人围捕目标的任务,但未考虑被围捕目标的逃跑策略。文献[9]使用强化学习的方法来训练机器人集群模型对目标的围捕,但强化学习有训练时间长、学习到的新策略无法保证最优等固有缺陷。关于集群围捕的研究,围捕策略的设计是能否完成围捕任务的关键技术之一。
现有的绝大多数研究均建立在围捕UUV 的性能优于被围捕UUV 性能的前提下,然而这是不现实的。因此,本文设定被围捕UUV 的速度大于围捕UUV,且被围捕UUV 将采用智能的逃跑策略,这大大增加了UUV 集群围捕的难度。本文将采用基于阿波罗尼斯(Apollonius)圆的围捕模型,然后提出基于有限状态机的围捕策略,通过仿真验证,成功实现了对目标UUV 的围捕。
1 问题描述
本文研究的围捕问题建立在无限且无障碍物的二维平面上,由(≥3)个围捕UUV 对1个目标UUV 进行围捕,最终形成以目标UUV 为中心的一个包围圈,如图1所示。
图1 UUV 集群围捕目标
图1中,{,,…,U },表示个围捕UUV 的集合,表示被围捕的目标UUV,用V 表示围捕UUV 的速度,V 表示目标UUV 的速度。为提高所设计的围捕策略的普适性,本文允许V >V 。
围捕任务开始后,围捕UUV 按照UUV 集群尾部策略进行围捕,同时目标UUV 按照设定的逃逸策略进行逃逸。当围捕UUV 包围目标UUV 并在其周围形成封闭的Apollonius圆时,视为围捕成功。
2 模型构建
2.1 UUV 运动学模型
本文采用国际水池会议(ITTC)及造船工程学会(SNAME)推荐的坐标系和参数符号描述UUV的运动。对UUV 的建模过程参考文献[10]。
根据研究的需要,不考虑UUV 在垂直方向上的运动,即假设UUV 只在水平面内运动。这里定义[,,],为运载体坐标系在地面坐标系下的广义位置坐标,如图2 所示。定义[,,],为UUV 的广义速度。其中,和分别表示UUV 在运载体坐标系下沿水平面的2个坐标轴方向的速度,为艏向角速度。
图2 UUV 水平面运动图示
则UUV 的运动学模型为:
2.2 UUV 集群围捕模型
根据围捕UUV 与目标UUV 会同时到达Apollonius圆上一点这一特性,设计UUV 集群围捕模型如图3所示。
图3 为个 围 捕UUV 即,,,…,U 与目标之间构建基于Apollonius圆的UUV 集群围捕模型。其中,点,,,…,O 为Apollonius圆的圆心。当某2个相邻的Apollonius圆没有相切或相交时,目标UUV 可利用速度优势,凭借智能逃逸策略突破包围圈,进行逃逸;当所有相邻的2个Apollonius圆相切或相交时,个围捕UUV形成封闭Apollonius圆域,围捕成功。
图3 UUV 集群围捕模型
2.3 目标UUV 逃逸策略
目前围捕问题中被围捕者的传统逃逸策略为将所有追捕者的速度方向进行矢量叠加,并朝着叠加后的总速度方向以最大速度进行逃逸,然而传统的逃逸策略不够智能化。本文将以UUV 集群是否对目标UUV 形成包围圈作为研究,提出一种智能的逃逸策略,讨论如下:
(1) 如图4所示,目标UUV 计算以目标为顶点、相邻UUV 与自身所形成的角度,当有角度大于或等于180°时,即≥180°,判定为UUV 集群未对目标UUV 形成包围圈,这时目标UUV 采用传统的逃逸策略,以最大速度朝的方向逃逸。
图4 目标UUV 未被包围逃逸方向示意图
(2) 当目标UUV 计算相邻UUV 与自身所形成的夹角,所有夹角均小于180°时,如图5 所示,<<<180°,判定为UUV 集群未对目标UUV 形成包围圈。此时目标UUV 采取“最大夹角”逃逸策略,即选择形成最大夹角的2个围捕UUV(和)连线的中点方向V 作为逃逸方向。
图5 目标UUV 被包围逃逸方向示意图
3 基于有限状态机的UUV 集群围捕策略
3.1 有限状态机基本理论
有限状态机是系统根据用户定义的规则在有限的状态之间进行转换,最终处于结束状态或消亡状态的一种数学模型。
由于目标UUV 的性能高于围捕UUV,UUV集群无法追捕目标。因此本章主要分析在UUV 集群围捕过程中设置合理的诱捕策略进行围捕,即在实时策略选择过程中对UUV 集群状态进行转换的策略。建立有限状态机模型,对UUV 集群状态转换规则进行详细研究,最终实现了UUV 集群围捕的有效决策。
3.2 基于有限状态机的UUV 集群围捕策略设计
3.2.1 UUV 集群围捕策略状态设计
UUV 集群围捕就是对目标形成包围圈并缩小的过程。假设所有的UUV 均匀速运动,且V >V ,UUV 集群无法通过简单的追捕捕获目标,本章设计了合适的伏击围捕策略,每个决策阶段都由多个基本状态构成,包括潜伏状态、追捕状态、拦截状态和合围状态。
(1) 潜伏状态
围捕UUV 进入潜伏状态时,停止运动且仅打开被动声纳,噪音极小,无法被目标UUV 发现,即围捕UUV 处于潜伏状态时不会对目标UUV 的运动产生任何影响。
(2) 追捕状态
当处于追捕状态时,围捕UUV 以最快的速度朝向目标运动。
(3) 拦截状态
拦截状态是指相邻2个围捕UUV 相互靠近、缺口变小的运动状态。
(4) 合围状态
合围状态是指UUV 集群成功包围目标,且形成封闭Apollonius 圆域,即UUV 集群成功围捕目标。
3.2.2 UUV 集群围捕策略设计
当UUV 集群在无速度优势的条件下对目标UUV 实施围捕时,可以通过潜伏、诱导等策略对其进行围捕。对于单目标UUV 来说,围捕UUV 的数量越多,围捕越容易,成功率越高,本文取最小值=3,如图6所示,正三角形虚线区域为伏击圈。此时如果能找到一个合适的围捕策略,使得3个围捕UUV 包围目标并形成封闭Apollonius圆域,就能围捕成功。
对于围捕UUV 的策略选择,输出的控制量为启动信号和转角方向,对应的是围捕UUV 的状态转换,各状态记为(,,,),其中s (0,1,2,3)分别表示UUV 的潜伏状态、追捕状态、拦截状态和合围状态。定义(,,,)为输入集,其中用于判断目标是否进入伏击圈,即用1表示目标进入伏击圈,0表示目标未进入伏击圈。取或或,表示围捕UUV 与U (1,2,3)之间的距离大小,设为预设阈值,将d (1,2,3)的具体值分别在3个区间内进行匹配,分别为(0,),(,2),(2,∞),对应模糊归一化集合[小(),中(),大()]。在,,中取值,描述的是目标UUV 的运动方向。如图6所示,通过判断目标UUV 的运动方向与围捕UUV 和目标连线所成的夹角θ(1,2,3)可以决策进入拦截状态的围捕UUV。将θ(1,2,3)的当前值与3 个论域的值匹配,分别为(0°,30°),(30°,90°),(90°,180°),对应 模 糊 归一化集合[小(),中(),大()]。1表示所有围捕UUV全部脱离潜伏状态,反之至少有1个围捕UUV 处于潜伏状态。接下来对UUV 集群围捕策略进行设计。
图6 输入集示意图
由于V >V ,所以在目标UUV 进入伏击圈之前,各围捕UUV 保持潜伏状态。目标进入伏击圈后,与目标之间的距离小于设定启动阈值的围捕UUV 进入追捕状态。根据目标UUV 的智能逃逸策略,当3个围捕UUV 全部进入追捕状态时,目标UUV 将采取“最大夹角”逃逸策略,因此目标运动方向上相邻的2个围捕UUV 将进入拦截状态。在此期间,为缩小包围圈,当目标UUV 运动方向与自身和某围捕者U 连线所成夹角小于某阈值时,U 将处于追捕状态。在追捕状态和拦截状态下,UUV集群包围圈将逐渐缩小,最终成功围捕目标UUV。UUV 集群围捕示意图如图7所示。
图7 UUV 集群围捕示意图
基于上文设计的围捕策略,本文首先设定UUV 集群围捕目标UUV 的任务为。反映了围捕UUV 状态转换和选择的规则,用简化的四元组表示为(,,,)(由于最终状态只有一个,所以这里忽略了最终状态的集合),其中表示从一个状态变换到另一状态的转换规则,→。
状态转移规则如下:
if0 andandand0 then围捕者选择状态;
if1 andandand0 then围捕者选择状态;
……
因为围捕者、、完全等价,所以各围捕者具有相同的状态转移规则,以为例,其全部状态转移规则如表1所示。
表1 围捕者UUV状态转移规则
4 仿真研究
本实验使用的是Matlab仿真环境。假定目标UUV 一直处于可以被UUV 集群感知的状态,且目标UUV 只能探测到处于运动状态的目标,无法探测到处于潜伏状态的围捕者。围捕UUV 和目标UUV 的运动均受单位时间内最大角速度的限制。UUV 集群围捕失败的判定条件为目标UUV 移动到包围圈之外。实验相关参数设置如下:
预设启动阈值为70 m;围捕成功阈值为25 m;目标UUV 的速度V 为1.4 m/s;围捕UUV的速度V 为1.2 m/s;围捕UUV 初始位置坐标为(1 000,214),(200,1 600),(1 800,1 600)。
如图8所示,围捕初始时刻,围捕UUV 集群保持三角伏击阵型并处于潜伏状态,目标UUV 从起点(1 400,1 800)以最大速度1.4 m/s出发。UUV集群围捕第24 s 时刻,目标UUV 进入伏击圈,UUV满足启动阈值,进入追捕状态,UUV与UUV未满足启动阈值条件,仍处于潜伏状态,目标UUV 判定自身未被包围,采取传统的逃逸策略。在处于UUV集群围捕第58 s时刻,UUV与UUV先后满足启动阈值条件,进入追捕状态。第58 s后目标UUV 判定自身处于围捕包围圈,采用“最大夹角”逃逸策略。此后,为缩小包围圈,围捕UUV 依据目标逃逸方向在追捕状态和拦截状态中切换,目标被围捕UUV 形成相邻的Apollonius圆无缝隙地包围。最终UUV 集群将目标UUV 限制在了一个较小区域,且各围捕UUV 均满足围捕成功阈值条件,判定为围捕成功。整个围捕过程持续154 s。
图8 UUV 集群围捕仿真图
5 结束语
本文在被围捕目标速度性能高于围捕者的前提下,提出一种基于有限状态机的UUV 集群围捕策略。针对进入UUV 集群围捕伏击圈内部目标的围捕,设计了4种围捕者状态,并对状态转换规则进行了详细设计。最后,在Matlab仿真环境下验证了所提出围捕策略的有效性。