机器人班组协同定位理论与技术研究*
2022-07-25于镇滔曾建潮卢志刚马跃东
刘 鹏,于镇滔,曾建潮,张 鹏,卢志刚,马跃东
(1.中北大学,太原 030051;2.北方自动控制技术研究所,太原 030006)
0 引言
“机器人士兵”已从科幻描述走向现实应用,其参战可追溯到二战时德军研制的“歌利亚遥控炸弹”反坦克武器,以色列在巴黎航展上展出的“哈比”无人机武器能够自主发现和摧毁敌方雷达,美国研制出被称作“普罗拉”的机器人士兵。近来,为提升全球军事竞争能力,各大国纷纷制定该国关于机器人战略的发展规划,美国在2013 年制定的发展规划中将研制军用机器人的费用大幅提高,提升美军无人装备的使用比例达到30%。德国2013 年推出“工业4.0”战略,日本则于2015 年发布了“日本机器人新战略”。我国也发布了《中国制造2025》规划,明确提出突破智能机器人领域的关键技术,应对新形势下的无人化、智能化挑战。
随着人工智能技术的发展,无人机器作战系统将是未来战争中的冲锋部队,具有造价低、便于维护、出勤率高、时效性强等特点,“机器人”(包括无人车、无人机等作战系统)冲锋陷阵是目前热战争模式中的最优方案,能够做到真正的全天候待命。机器人部队执行任务时需要具有精确的敌我位置信息。
1 可定位性与多机器人定位
机器人的准确位置是其实现移动行走、环境感知、编队导航的基础,定位精度和实时性决定了其执行任务的效果。机器人部队作为步兵作战辅助装备,在城市巷战复杂地形下可实现对敌火力干扰和压制,但前提是能够确定敌我双方的位置。现阶段关于机器人的研究多为单机器人的性能提升,与单一系统相比,多机器人具有冗余配置、并行计算等优势,通过协作可拓展感知范围,拥有出色抗扰能力。这里针对机器人的可定位性和协同定位展开阐述。
1.1 机器人可定位性
已知彼此的精确方位是智能机器士兵执行自主移动、导航规划、任务分派等任务的基础。可定位性是机器人对位置实现准确定位能力的一种度量,机器人具有可定位性时方可设计各种定位算法。Roy 利用定位概率分布的熵值来描述海洋机器人的可定位性,此熵值为一维变量,反映了可定位整体性能,但无法刻画定位时的方向性。Censi 用Fisher 信息矩阵来反映移动机器人定位的整体性能和方向性,但地图信息的不确定性会影响到定位评估效果。对机器人相应栅格进行离散化,可将Fisher信息矩阵应用于概率栅格地图,引入动态评估因子后可用动态Fisher 矩阵来评价定位性能。借助无线物联网之间的可定位性原理,可利用判定多点协同定位方法给出智能机器系统可定位性条件。对机器人运动过程建立数学模型,采用Kalman 滤波与信息融合理论,来分析基于激光雷达的地图匹配定位方法,从而分析出影响可定位性的主要因素。
1.2 多机器人定位
机器人具有多个感知单元,执行分布式高级算法,通过协作在恶劣环境、国防军事领域已开始使用。机器人系统协同作业时,通过无线相互通信获得邻居的相对观测量或运动信息,利用这些信息可提高机器人系统的定位精度。多机器人系统亦可使用便携式路标法来提高每个机器人的定位精度,但观测信息丢失会导致定位误差增大,以致机器人迷失方向。装配不同传感器的异构机器人,采用任务分解与分配算法,使得各机器人物尽其用,更显合作定位的优势。智能移动机器人的自主定位与导航规划依赖于应用背景和实验平台,需要考虑综合使用多机器人的感知信息来实现高效自主定位,进而考虑如何在避免任务冲突时实现多机器人的导航定位。任务分解及导航规划的过程均需要考虑多机器人系统的可定位性问题,然而对定位能力和定位误差的估计仍然是多机器人领域的难题之一。
2 多机器人定位模型与相关算法分析
多机器人定位模型主要有运动学方程建模和优化问题建模两类。针对不同的模型方程,应用不同的技术策略进行定位,具体架构如图1 所示。
图1 机器人定位框架
2.1 多机器人定位模型
建立精准的运动方程和匹配合适的定位模型是机器士兵执行任务的前提,为设计高效实时定位算法提供依据。
2.1.1 运动学方程建模
其中,p和p是待估计的移动机器人位置。
2.2 相关定位算法分析
智能移动机器人根据建模原理的不同,对应着不同的定位算法,这里主要从信息融合与优化的角度进行综述。
2.2.1 基于信息融合
机器人系统根据所携各类传感器确定其在给定环境中的位姿时,由于传感器与执行器存在的随机误差会影响到定位精度,故可将信息融合策略用于机器人的自主定位。常用的融合估计方法分为最小二乘拟合法和贝叶斯型估计方法两大类。前者以残差平方总和最小为准则进行静态数据处理,后者处理动态过程估计。
移动机器人的状态方程与观测方程一般用条件概率分布来描述,大部分移动机器人的定位算法都为贝叶斯估计算法的延伸,结构上均采用“预测-更正”两步来实现。利用高斯分布来描述机器人状态分布时的估计方法称为高斯滤波算法,其代表是Kalman 滤波器。现实建立的机器人模型为非线性形式,低非线性时使用形式简洁、计算高效的扩展Kalman 滤波器;状态局部非线性化程度高时,扩展Kalman 滤波器性能受限。对此,研究人员提出利用无迹Kalman 滤波和中心差分Kalman 滤波两种算法进行移动机器人定位,它们避免了计算雅克比矩阵,虽提高了鲁棒性,但容易导致数值不稳定,此时可以将地图数据库信息作为约束条件,设计具有约束条件的滤波算法或平方根滤波算法进行定位。对于作战机器士兵来说,需要已知实时态势感知和位置,以粒子滤波为基础的蒙特卡罗定位算法成为移动机器人领域流行的定位方法。粒子滤波算法是利用随机采样的样本来近似机器人的状态空间,可表示比高斯分布更广泛的分布空间,适用于复杂环境的机器人定位。Fox 等人对马尔科夫定位算法进行了扩展,利用概率分布来描述不同机器人的位姿信息,借助邻居的额外信息重新定义得到新的概率分布,通过室内和室外环境的现场验证得出该定位算法精度要高于其他定位算法精度的结论。多传感器利用信息冗余来减小不同滤波算法的误差协方差矩阵来提高定位精度,也可通过分布式计算来进行信息融合和定位。
除此之外,不同的定位策略可被引入到多机器人系统的同时定位与地图构建问题中来,以改进现有机器人的定位与构图算法精度。上述以Kalman滤波器、扩展Kalman 滤波器、粒子滤波为代表的算法使用前提是假设机器人当前状态仅与前一时刻状态有关,因此,这些定位算法可以统称为马尔可夫定位。当机器人状态与之前所有时刻的状态都相关时,便要考虑利用非线性优化框架进行定位。
2.2.2 基于优化算法
基于优化理论的移动机器人系统定位方法和基于信息融合策略定位的思想不同。优化方法是通过对待定位参数建立目标函数,机器人实际运行环境限制作为约束方程,通过优化求解(解析法或数值法)目标函数的极值来得到各机器人的位置或姿态。根据建立的优化模型(线性、非线性、随机模型等),采用的优化算法主要有:梯度下降法、滚动时域法、粒子群优化,以及神经网络、深度学习、分布式优化等。不同的求解方法有着不同的优缺点和使用范围,实际采用的可行算法,由目标函数和约束条件来决定。下面对几种常见算法的优缺点和使用条件进行说明。
梯度下降法作为经典的优化算法,被用于多机器人系统进行位姿确定。外置传感器测量机器人之间的局部距离或相对方位信息,同时机器人根据内置传感器得到的位姿估计值,来计算机器人间的相对距离或相对方位,利用测量值与估计值之间的均方差作为目标函数,求解该目标函数的极值获得机器人的最佳估计位置。滚动时域估计是一种动态滚动式的优化算法,此算法的优化计算窗口为固定时间域长度,滚动更新机制设置为先入先出形式,考虑机器人间的状态约束,性能指标函数由窗口开始时刻的机器人系统的位姿数据、窗内各时刻状态噪声与到达代价函数构成。通过最小化该性能指标函数得到时间窗结束时刻的多个机器人的位姿信息。智能机器人要像人一样在未知环境中自主移动的关键是解决机器人在未知环境中的自我感知、识别以及定位等问题。在多机器定位系统中,利用深度学习算法进行目标识别,卷积神经网络进行目标检测。强化学习中神经网络的Q- 学习控制策略与PID 控制方法相结合,使得海上半潜平台机器人在未知海况下可寻找到最优控制区间进而提高可靠性。神经网络适用于非线性映射,并能辅助非线性滤波算法以提高滤波估计性能,但会存在收敛速度慢、计算复杂度高等问题。计算机视觉定位方法是通过图像匹配或图像分类的方式来实现机器人的定位,该方法无需未知环境中提前布置硬件设备,不受环境影响,可与其他定位方法进行组合使用来拓展机器人的定位范围。
3 多机器人协同定位
协同定位是在一个特定环境中存在已知节点(锚节点,即功能完善的节点)和未知节点,节点之间通过无线通信进行信息交互,也可利用外置传感器进行测距、测向或邻近探测,综合利用过去的位置信息实现对未知节点当前位置的确定。协同定位的目标是通过节点间的协作提升单个或整体机器人节点的位置精度。该技术应用在无线传感网络、多机器人系统、水下自主航行器、战机编队及卫星定位等领域。多机器人协同定位由Ryo 最早提出,基本思想为利用相邻机器间的额外测量信息来提升整个机器人系统的定位精度和可靠性,应用场景如下页图2 所示。
图2 多机器人协同定位
多机器人协同定位是保证多个移动智能机器人协作导航与环境探索的基础。根据各自的功能和结构分为同构多移动机器人系统和异构多移动机器人系统。同构多移动机器人系统中各机器人的功能、结构、配置传感器完全相同,一般采用并行运行方式,可在不同区域同时执行任务;异构多移动机器人系统中各机器人的功能、结构、配置传感器存在差异,通常采用“主-从”运行方式通过协作在不同区域同时执行不同任务。现有智能机器人系统协同定位方法主要有集中式处理和分布式处理两类:集中式协同定位需要中心处理单元来接收和发送相关传输信息,中心处理机器人出现故障会引起整个系统定位失效;分布式处理时,每一个体的地位平等,单一个体的故障不会对整个系统产生影响。相比较而言,分布式定位方法是现在以及未来一段时间的研究热点。定位的相对观测量有:相对距离、相对方位和相对航向,这里将相对航向也视为方位类。
3.1 基于距离定位
无线电测距传感器具有高精度和低成本的特点,可在机器人上配置此传感器,利用距离测量来进行目标定位。不考虑观测站坐标误差时,利用约束总体最小二乘法处理固定观测站时差信息进行定位时精度较高,但存在噪声和误差时,定位精度下降。利用斜距离解析进行目标定位时,定位精度与坐标测量误差相关,坐标测量误差大,定位精度低。作为衡量均方误差理论下限的克拉美-罗下界(Fisher 信息矩阵的逆),可以用来分析机器士兵间的相对位置结构对其定位精度的影响。针对多自主水下航行器移动长基线定位系统,利用克拉美-罗下界和Fisher 信息矩阵,建立与队形结构参数相关的定位性能评价函数,优化该评价函数来得到最佳位置,当行列式最大时,多自主水下航行器具有最佳的编队队形。在此基础上,文献[8]探讨了基于距离相关噪声模型下的多自主水下航行器最优队形,以及协同定位性能与噪声因子的敏感关系。进一步,文献[1]研究目标定位精度与水面浮标到水下目标之间距离的关系,得到最优定位几何结构时的最优距离。蒙特卡罗定位是多机器人协同定位的一种统计算法,借助获取的相对位置信息,利用检测模型的概率分布,融合自身位置信息和相对位置信息,从而得到高精度的全局位置信息。Howard在多机器人协同定位领域进行了大量研究,提出基于相对位置测量的协同定位方法,机器人之间的通信拓扑为完全图,每个机器人对来自其他个体的测量信息利用粒子滤波估计位置,无需GPS、地图等外部传感器,适于未知复杂环境中多机器人之间的定位。但完全图通信拓扑使得机器人定位时的计算量随个体数目急剧增长,Howard 还提出用无线信号强度和分布式数值优化等方法,来确定机器人之间的相对距离、角度和航向。卡耐基-梅隆大学开发的小型模块化的异构机器人群,通过超声波测距和最大似然估计法进行协同定位。Martinelli 建立对相对距离和角度同时适用的测量方程,利用扩展Kalman 滤波器处理协同定位方程。国防科技大学研究人员将该方程应用到双轮差速移动机器人,得到更为实用的方程,进而利用非线性估计器进行协同定位,定位效果较好。
3.2 基于方位定位
红外雷达、被动雷达等被动探测系统具有探测距离远、信号隐蔽性高等优点,因而引起研究者的充分重视。被动探测系统用来观测目标的方位角或俯仰角信息,该信息含有测量噪声,需要多个传感器协同估计目标的位置。一种常见的探测方式为双机协同纯角度被动探测,此方法在实际作战中已有应用。Kalman 滤波算法用于双观测站被动跟踪系统时,可得角度信息变化率与估计精度之间的关联性。分析定位理论与仅含角度测量的单站目标跟踪可知,跟踪定位效果与观测站运动轨迹相关,为了达到较高的跟踪定位精度,观测站机动加速度要高于目标机动的阶次。仅有角度测量的多站目标跟踪,当观测站固定时,观测站之间及观测站与目标之间的几何构型会影响跟踪定位的精度;当观测站运动时,合理规划运动路径后才能得到高精度的跟踪定位精度。无锚节点的多机器人协同定位利用多边法将定位后的机器人作为虚拟锚节点,该定位过程与机器人的组网结构相关。利用扩展Kalman 滤波器进行机器人的相对位姿测量时,同时需要机器人的位置和方位信息。相比于距离测量,一般相对方位容易测量,对方位传感器并无特殊要求,相对方位能改善机器人定位的精度,为了兼顾机器人系统的定位精度和实时性,采用相对方位作为观测量时协同定位的效果好。
4 现存问题与发展趋势
多智能机器人平台之间的协同定位理论和技术已经开展多年,取得了一定的研究成果。随着通信技术、计算机技术和智能算法的发展,现有协同定位理论也面临着理论约束和技术限制,需对未来机器人协同定位趋势进行分析和判断。
4.1 协同定位现存问题
多机器人通过分布式的信息处理方式可提升单机器人的数据处理能力。我国协作机器人虽有进步,但与发达国家在机器人装备水平的想象力方面还有一定差距。同时,现有多机器人系统协同定位技术存在下述问题:
1)复杂未知工作环境。现有机器人理论与技术多是在提前预设环境中进行验证,而实际战场的态势瞬息变化,这就需要智能自主的机器人在复杂未知环境中进行自我管理、自我规划、自我探测。适应环境方面,多机器人协同系统明显会优于单个机器人系统,但未考虑机器人协同时的真实环境状态对协作定位的影响。
2)传感器类型与融合方式。现有多机器人定位理论侧重于定位算法的研究,以提高定位精度和实时性为目的。针对传感器类型进行机器人协同定位融合算法的分析较少,尤其是对于异构机器人协同定位时不同机器人优势的发挥。
3)智能定位算法。现有多机器人协同定位时采用的算法比较成熟,对于智能算法在机器人战队中的运用较少。
4.2 协同定位发展趋势
理想的战斗模式是单兵通过简单指令实现对机器军团的有效操控,这就要对机器人进行智能化设计,使其具有智能定位、导航、作战等能力,作战效能达到或接近人类士兵的水平。在机器人战队协同定位方面,可考虑下面研究方向:
1)强化对周围环境的感知和适应能力。环境感知是机器人与周围环境进行信息交互的前提,感知的目的是使机器人能够更好地模仿人类去理解外界环境的态势。根据作战环境的不同,选择微波雷达进行测距或激光雷达进行测角,雷达对周围环境定位后可建立周围环境的地图模型,构建机器人对外界环境的理解系统。随着视觉传感器精度的提高,可利用相机对周围环境进行感知,经过模式识别、图像处理等方法处理来获得周围环境全面的信息。
2)联合使用定位方法和协同方式。从信息融合的角度看,如何组合传感器和选择合理的融合结构,以保证融合系统发挥最大优势来满足定位精度值得考虑。根据机器人配置传感器精度和功能的不同,采用主-从式协同定位算法,建立运动学模型,分析模型特点并设计合适的定位算法,借助信息融合理论或最优化技术来实现所有机器人的绝对位置。研究无全局定位装置的多个体之间的自主协同定位技术,利用机器人之间无线传输的信息量,设计合理的定位算法来确定相对位置。考虑惯性导航装置与其他测量信息之间的融合,结合分布式优化技术来提高机器人之间的定位精度。
3)探索智能化协同目标定位与巡航控制。机器学习和人工智能等技术的发展促使无人系统的智能化成为趋势。设计基于人工智能算法的未知环境下可引导、可信任、可进化的多机器人协同目标定位与巡航控制。借助深度学习算法对陌生区域进行环境感知与目标识别,进而通过强化学习来训练自主控制策略,使机器人能够模仿现实世界中的运动。
5 结论
基于位置作战是现代战争的突出特点,以机器人代替人类进行战略突袭是战争形式转变的趋势之一。多机器人协同作战是典型的基于位置的未来新型作战单元,多机器人的协同定位精度直接影响着作战的效果。从机器人系统的可定位性出发,建立了两种定位模型。针对不同模型,分析了现有多机器人协同定位系统常用的算法。多机器人之间是通过交换相对距离、角度等信息实现它们的导航、定位相关信息分享,采用最优化理论和数据融合算法来确定不同机器人的位置信息。最后对多机器人系统协同定位时的问题和趋势进行了阐述。