APP下载

RoboCup3D守门员的防守策略研究

2016-08-18王伟健杨为民李凯李志文

电脑知识与技术 2016年19期

王伟健 杨为民 李凯 李志文

摘要:在Robocup3D比赛中,防守一直是一个重要的研究方向。该文提出了一种基于迭代扩展卡尔曼滤波(IEKF)的足球定位方法。这种方法能为为守门员提供精确的足球位置信息,从而提高守门员的扑球与截球成功率。守门员的防守策略包括扑球、主动截球解围等动作,在不同情况下做出合适的选择才能够的更好地提高防守效率与成功率。

关键词:迭代扩展卡尔曼滤波;扑球;防守策略

中图分类号:TP242 文献标识码:A 文章编号:1009-3044(2016)19-0152-04

Research on Defensive Strategy of Goalkeeper in RobocCup3D

WANG Wei-jian, YANG Wei-min, LI Kai, LI Zhi-wen

(1.Department of Computer Science and Technology, Anhui University, Hefei 230601, China)

Abstract: Defense is always a critical research target in the match of RoboCup3D.This paper proposed a method to locate soccer ball based on Iteraative Extend Kalman Filter(IEKF).This method can provide goalkeeper accurate information of soccer ball which aimed to improve the success rates of catching and intercepting.Goalkeepers strategy consists of many action such as ball-catching and ball-intercepting,making correct choices in different cases can improve success rates and enable goalkeepers to defense more effectively.

Key words: Iteraative Extend Kalman Filter; ball-catching; defensive strategy

1 概述

Robocup3D即机器人世界杯足球锦标赛仿真组比赛,其比赛环境是3D的,世界模型与机器人模型也都依赖于物理引擎,这使得比赛更加逼近真实的足球比赛。没有复杂的硬件问题,研究人员可以更好地将精力投入到比赛中机器人的决策问题上。其研究背景以MAS(多智能体系统)和DAI(分布式人工智能)【1】为主,通过实时异步、分布式控制的平台对比赛中机器人与世界模型进行仿真模拟,可以实现机器人的各种行为动作,测试机器人的进攻与防守决策系统。比赛目标是在2050年之前组建一支可以打败人类世界杯足球赛冠军的机器人球队。近年来该项目以其新颖的比赛模式、具有挑战性的技术难度吸引了国内外许多高校队伍。

比赛中的得分方式是将球带入或踢入对方球门,所以这就需要制定合适高效的进攻策略,相应地,这也要求我们在面对对方球员的带球进攻下,组织有效的防守。当比赛结束时双方战平,则会采用点球进行胜负判别。在点球比赛阶段,每个队伍都只有一名球员在球场上,即进攻队点球球员和防守队守门员。守门员作为球门的最后一道防线起着至关重要的作用。守门员通过对足球的定位与运动路线的预测,结合场上不同的情况,做出不同的防守动作,如扑球,主动截球,大脚解围等。本文介绍了一种基于卡尔曼滤波【2】的足球定位方法,为守门员提供足球的准确位置信息并详细介绍了守门员的模型构建,防守策略。

2 守门员的结构模型

2.1 NAO模型简介

NAO是由 Aldebaran Robotics公司开发的双足结构仿人智能机器人[3],在学术领域世界范围内被广泛运用。NAO参与的研究项目包括语音识别、视频处理、模式识别、多智能体、自闭症治疗系统、自动化、讯号处理、全身运动以及路径规划等。2007年,机器人世界杯足球锦标赛RoboCup组委会将NAO定为比赛标准平台。

NAO高度约为57cm,质量接近4.5Kg ,拥有22个关节感应器。这22个关节使得NAO更具移动性,可以灵活地完成各种复杂的高难度动作,其关节结构图见图1[4]。

2.2 NAO模型的异构

比赛采用NAO型仿真机器人作为球员(Agent),但球员的结构模型并非完全一样,其中存在着异构现象。虽然机器人的关节包括头部摄像机都是相同的,但是手臂,左右腿的长度以及脚掌结构却存在着区别。RoboCup3D比赛服务器 Rcssserver3D (最新版本0.6.10 )规定了几种类型的机器人异构。具体模型见图2(a,b,c)。

由图2可以看出,b型异构机器人的手臂与双腿较长,防守范围比其他类型机器人防守范围大,结合守门员的扑球动作可以有效地进行防守。

3 守门员的防守策略

3.1扑球与快速起身

当对方球员带球至禁区或射门时,守门员需要快速做出判断,选择合适的扑球动作。目前使用的最多的扑球动作有(a)侧身倒地扑球;(b)劈叉倒地扑球[5]。

对方进攻球员射门时,守门员对球速与球的轨迹进行预测,当足球越过扑球分界线并且球速超过预定安全阈值,则判定为一次有效的射门,并采取相应地扑球动作。足球方向朝向守门员站位时,采取劈叉倒地扑球的方式,否则采取侧身倒地扑球的方式。两种方式各具优缺点,侧身倒地扑球的防守范围大,大约可以挡住球门的一半,但是从动作开始执行到完成扑球大约需要1.0~1.3S。而劈叉倒地扑球的方式虽然防守范围小了一点,但是动作执行时间仅需0.8~0.9S。

当守门员扑球成功后,但没有己方后卫协助防守时,对方进攻球员可能发动二次进攻,此时敌方在禁区内会对我方造成很大的威胁。所以这就需要守门员在倒地后快速起身,实行相应地防守策略。为实现快速起身可以采取“俯卧撑式”起身动作[6]。守门员倒地后,膝盖关节弯曲,双手撑地,身体向上抬起,以膝关节为轴转动,与此同时需要踝关节进行弯曲,在直立过程中支撑点由膝关节转移到腿部实现快速稳定的原地起身。

3.2防守解围

比赛中可能出现足球在禁区内低速运动的情况,如果此时守门员采取扑球策略,不但不能有效地进行扑球防守,对方进攻队员可能在守门员倒地与起身的时间里抓住时机进行射门。针对这种特殊情况,可以设置球速的最低值供守门员进行决策判断。当足球在防守的危险区内且球速低于设定的最低值,守门员可以离开小禁区,主动上前,传球给最近的队友或直接大脚将球踢出禁区以完成解围。

图3根据上述论述的不同情况给出了抽象的防守流程图。其中分别为设定的供守门员判断的足球速度最小值与足球进如守门员防守范围时的速度,其中由经验给出。定义防守范围为以守门员为中心,半径为腿长加上足球半径的圆形区域。见公式(1)。

4 守门员对足球进行定位

守门员防守策略的核心是对足球的定位与足球到达防守区域时速度的预测。守门员根据这两个信息做出不同情况下的防守决策,所以足球的精准定位起着至关重要的作用。

4.1 足球位置信息的获取

机器人每隔两个仿真周期( Rcssserver3D 0.6.10重新规定了一个周期为0.01)从服务器获得自身的视觉信息,其中包括机器人看到的标杆位置信息,己方与敌方机器人的位置信息和各关节角度信息,与足球位置信息。视觉信息(d,θ,φ)是相对于机器人摄像头的极坐标位置,其中为世界模型中的物体与机器人之间的距离,θ为物体与机器人的水平角,φ为摄像头与物体之间的仰角。机器人自身位置信息可以采用一个标志杆法、多个标志杆法、基于卡尔曼滤波的定位方法等获得,当机器人自身绝对位置(不考虑轴方向)确定后,足球的绝对位置坐标也可以更具视觉信息求出。其中:

为了模拟真实的比赛环境,rcssserver3D 0.6.1 版服务器就在视觉信息中加入了视觉噪声。视觉噪声服从以为中心的正态分布,其中距离误差的σ=0.0965;水平角度误差的σ=0.1225;竖直角度误差的σ=0.1480。在加入视觉噪声后,守门员对足球的定位精确率下降,导致扑球成功率与防守决策系统也相应受到影响。针对这种符合正态分布的高斯白噪声,且足球的运动为非线性系统,本文提出了基于迭代扩展卡尔曼滤波IEKF的足球定位方法。

4.2 迭代扩展卡尔曼滤波

卡尔曼滤波为线性、高斯条件下的递推贝叶斯估计问题提供了最优解的形式,但是在一般的非线性系统中,满足最优解的条件不再成立。一种解决方法是对非线性系统函数进行近似化处理,利用泰勒级数展开技术得到非线性函数的多项式近似表示,在此基础上提出了扩展卡尔曼滤波算法EKF【7】,而其衍生算法IEKF近似精度更高。首先介绍EKF:

第二步:预测

(1)计算状态模型的雅可比矩阵

(2)更新时间

(1)计算观测模型的雅可比矩阵

(2)测量更新

4.3 基于IEKF的足球定位

足球位置的状态模型可由球速衰减经验公式【8】式(18)推导出:

<

式(19)即是足球位置的状态函数。

观测模型为机器人通过视觉信息获得的足球相对自身的极坐标位置,经过式(2)、(3)转化得到,过程噪声Wk在世界模型下可以看做为0,观测噪声Vk即是视觉信息中加入的噪声。通过4.2介绍的IEKF算法对足球位置进行最优估计。

4.4实验结果分析

为验证IEKF算法在实际比赛中对足球定位的精确性,通过真实比赛对抗,记录800个仿真周期内足球位置的观测值与经过IEKF滤波处理的最优估计值,通过MATLAB对实验数据进行处理。比赛仿真环境为Ubuntu14.10系统,服务器为rcssserver3d0.6.10,Simspark 0.2.3。足球起始位置为(0,0),实验结果见图4、图5。

实验表明迭代的扩展卡尔曼滤波算法能够很好地跟踪足球位置,具有良好的估计性能。守门员通过该算法可以得到更为精确的足球位置,为守门员作出防守决策提供了坚实基础。

5 结束语

结合迭代的扩展卡尔曼滤波处理的足球位置信息与守门员自身的决策系统,可以极大地提高守门员在比赛中的防守效率,帮助球队在比赛中取得好成绩。

参考文献:

[1] 陈涛.RoboCup3D仿真足球机器人的研究与实现[D].马鞍山:安徽工业大学,2014.

[2] 张青,李龙澍,刘跃.基于卡尔曼滤波的仿真机器人定位方法[J].计算机仿真,2013,30(12):317-320.

[3] 王凡,李龙澍.实时解析法在NAO模型运动学求逆解中的应用[J].计算机应用,2011,31(10):2825-2827.

[4] JoschkaBoedecker.SimSparkUsersManual[EB/OL].http://simspa rk.sourceforge.net

[5] 陈涛,陈业斌,张学峰.关于RoboCup3D仿真系统中守门员关键技术研究[J].宿州学院学报,2014,29(3):78-81.

[6] 陈天皓,钱成,谈英姿.类人足球仿真机器人快速起身方法的实现[C].济南:济南大学学报,2007.

[7] 占荣辉,张军.非线性滤波理论与目标跟踪应用[M].北京:国防工业出版社,2013.40-45.

[8] 黄儒,许元,谈英姿.RoboCup守门员动作与策略的研究和实现[J].中国科技信息,2008(21):36-37.