基于URWPGSim2D仿真平台的抢球博弈策略
2020-04-19郑新宇
郑新宇
(西南石油大学 四川 成都 610500)
引言
近年来,仿生学机器人已经被运用到多个领域,尤其是以水中机器仿生鱼为导向的机器人更是在自动控制、物资传递、灾害救援和海底勘探等多个方面扮演着重要角色。2D仿真平台真实模拟仿生机器鱼各个关节的位姿变化、运动状态变化情况及机器鱼水球比赛运行等情况[1],一方面,可以更好的研究机器鱼的运动理论和碰撞理论;另一方面,还可以让更多的研究人员、学生参与到平台的开发和比赛中,为水中机器人技术的发展做出一定的贡献。比赛项目提供了模拟真实场景的平台,能够更有效的模拟机器鱼在真实场景的状况[2],本文阐述的是在2D仿真平台上基于快速得分的抢球策略,尽可能多得分,保证在大概率上发挥主场优势。
一、抢球博弈简介
(一)比赛场地介绍。抢球博弈项目是2D仿真鱼的子项目,2D仿真抢球项目采用模拟标准化场地,真实还原水中动态环境,开场初始位置的仿真机器鱼以及所需要的场地元素如图1所示。
图1 抢球博弈比赛场地
双方队伍各有两条机器鱼,对称分布于赛场的左右两半部分,9个仿真水球中有三个3分水球位于赛场中央,其余两个2分水球和四个1分水球对称分布于机器鱼的两侧。场地的左右方都有三块绿色障碍物所围成对方队伍的目标球门,被称为左球门和右球门。
(二)比赛过程。在比赛开始后,参赛队伍通过加载策略驱动仿真机器鱼进行抢球、射门、推球、带球等动作,目标是将仿真水球推进己方的目标球门。经过裁判允许后,方可在比赛过程中更换策略,在比赛时间递减到一半时,服务端会弹出“Pause”的指令,提示暂停比赛,待双方队伍交换场地之后,执行“Continue”指令继续比赛,在比赛时间递减为0时,服务端会弹出提示,经过裁判确认比赛后,比赛结束。
二、运球策略
在2D抢球博弈仿真平台中,除交换半场的时机外,每支队伍都可在每个半场提出一次更换策略的请求,分析对方采用的策略并及时更换己方策略显得尤为重要,以下研究了开场策略、下半场策略以及全场区域划分策略。
(一)开场策略。在双方队伍开场阶段,由于平台仿真的客观因素,导致机器鱼携带3分球不稳定。根据平台提供的运球函数,机器仿真鱼在水中的运行速度也比较慢,并且3分球的表面较为光滑,开场携带3分球易造成失误。针对此类情况,可以通过充分利用场地边角来实现快速得分。开场让机器鱼1和机器鱼2运动到边角,再顺着墙壁带着球运动,待机器鱼通过转弯,再带动球沿着竖直的墙壁同时向中心点运动,最后通过控制速度和角度,让机器鱼更快地进球得分,最终达到开场六分的好成绩。
通过对场地的分析测试,基于区域不同进行了不同的速度规划,在机器鱼1和机器鱼2到达场地边之前,先进行加速,再寻找目标位置点,最后稳定减速在球旁边,考虑到可能存在对方鱼干扰的因素,在鱼到场地边界这一小步中加入对方鱼头距离检测变量来检测对方所处位置,一旦对方鱼头超过我方鱼头,我方鱼头会朝向对方鱼头的侧方向进行加速攻击,进而达到挤开对方机器鱼的目的。
除此之外,为了防止机器鱼在场地边界出现失控的情况,需要在控制机器鱼运动的控制程序中加入许多逻辑控制变量来进行判决,让机器鱼能够顺利进行带球、补球等一系列操作,进而确保作为控制对象的机器鱼能够快速拿下6分的成绩。
(二)下半场策略。依据本场比赛的规则,充分利用上下半场各有一次更换策略的机会,并根据对方队伍的抢球策略及时更换不同的策略。在开局采取快速进攻的策略取得六分后,请求暂停,将当前的策略换为“一鱼进攻,一鱼带球”,具体表现为:根据时间参数设定好攻击对方机器鱼的周期,用己方一条机器鱼去带一个3分球,另一条机器鱼每隔一分钟轮流攻击对方的两条鱼。
参赛选手可以通过修改攻击对方机器鱼的周期参数来获取更多策略,可以将参数设定为1分钟、30秒等等,结合具体情况来确定数值。采用该策略能够实现最大程度干扰对方以及己方进球机会最大化,同时还要针对球所处的位置来编写机器鱼的各种运球策略,方便在比赛时更换使用。
(三)全场划分区域策略。比赛场地划分为4个区域[3]:中央区域、死角区域、进球区域、球门区域。中央区域包含左区域和右区域,根据不同的区域来设定机器鱼的不同目标点、速度、角速度以及判定条件,让机器鱼带动球运动时避免仿真系统里随机模拟的水波以及仿真机器鱼和场地边缘相互作用而产生的失真情况,进而能够稳定地带动球朝目标区域移动。
大多数队伍倾向于先确定水球和目标点的位置,让机器鱼、水球和目标点都在一条直线上,通过机器鱼头部顶球的方式直线运球,慢慢靠近己方球门的目标区域[4],倘若三者不在同一条直线上,通过降低机器鱼前进的速度,同时增大角速度,使得鱼体迅速调整方向,再将水球带入指定目标区域。
三、策略优缺点分析
本文所提策略包含开场策略、下半场策略以及全场划分区域策略,能够在赛场上快速得到较高的分数,尽快占据主场优势,经过试验机器鱼的运行轨迹与编程轨迹大体相同,并且易于控制处于特殊位置的机器鱼,最终能够取得不错的成绩。
限于仿真平台模拟真实场景并带有干扰函数的特点,难免会出现一些失控的情况,机器鱼在带球过程中会出现头部穿过水球以及卡在绿色障碍物的情况,极少出现机器鱼带球失误而出现在场地中围绕进球门绕圈的状况。
四、结束语
抢球博弈策略充分考虑平台仿真环境、机器鱼的运动状态以及水球自身特征等因素,基于区域划分比赛场地,充分利用机器鱼的身体部位进行运球,从而能够更好地占据开场优势,同时依照对方队伍机器鱼的运动轨迹及时更换策略,在策略上压制对方。通过对本文策略的多次试验,结果表明大多数情况下都能够较快取得不错的成绩。