移动机器人定位方法研究综述
2024-01-10张梦轩苏治宝索旭东
张梦轩, 苏治宝, 索旭东
(1.中国北方车辆研究所,北京 100072;2.智能移动机器人(中山)研究院,中山市 528437)
定位问题是移动机器人的一项重要研究内容,也是移动机器人实现路径规划、自主导航和决策的前提.在定位过程中,机器人利用内部及外部传感器不断感知周边环境信息,经过一定的数据处理从而得到自身的位姿.传统的基于模型的定位方法有相对定位和绝对定位两种,它们容易受到来自环境及系统自身的不确定误差的影响,对此研究者们提出了概率定位,构建系统的运动模型与观测模型,并基于贝叶斯滤波原理实现位姿估计.近年来,随着人工智能的兴起,基于数据驱动的深度学习定位也得到了一定的发展.上述定位方法之间的关系如图1所示.在传感器配置方面,由于单一传感器获取信息存在局限性,且会受到自身性能的影响,多传感器信息融合技术在移动机器人定位领域受到了越来越广泛的关注,它充分利用不同传感器的互补输出信息,将融合后的结果作为位姿估计,从而提高了移动机器人的定位精度及可靠性[1].文中对几类典型的移动机器人定位方法进行研究与比较,并总结多传感器信息融合技术对于定位问题的重要意义,最后对移动机器人定位系统的发展提出展望.
图1 移动机器人定位方法关系图
1 相对定位
相对定位法又被称为航位推算法,是移动机器人在给定初始位姿的条件下,依靠内部传感器来估计每一时刻相对于前一时刻的位移和航向角的变化,从而确定当前位姿的方法[2],常用传感器有光电编码器和惯性测量单元(IMU)[3],见图2.
图2 Kuebler光电编码器和TDK惯性测量单元
相对定位方法具有装置简单、成本低的优点,但由于其基本思想是随时间整合增量运动信息,这便不可避免地导致了累积误差,因此,该方法通常只能在短时间内使用.
2 绝对定位
绝对定位法又被称为全局定位法,是移动机器人在全局参考框架下获取位姿信息的方法,主要包括活动信标法、地标定位法和地图匹配法3种.
2.1 活动信标法
活动信标系统是移动机器人领域一种常见的辅助设备,最典型的有源信标系统基于三边测量法的原理(图3)进行定位.在系统中通常有三个或多个位置已知的信号源,利用飞行时间信息,系统可以计算出固定信号源和机载接收器之间的距离,从而确定机器人的位置.全球定位系统(GPS)就是三边测量法的一个应用实例[4].目前,使用GPS进行定位导航还面临遮挡物或地形导致的周期性信号阻塞,以及多路径干扰等问题.
图3 三边测量法原理图
活动信标法的优点是允许高采样率且具有可靠性,但较高的安装和维护成本对其应用产生了一定的限制.
2.2 地标定位法
地标是通过机器人的传感器感知识别的特征信息,它具有固定且已知的位置,可以是矩形、圆形、直线等几何形状,也可以是条形码等附加信息,通常分为自然地标和人造地标两种.自然地标是环境的一部分,具有机器人导航以外的功能,两种常用的辅助机器人定位的特征提取算法是SIFT[5-6]和SURF[7-8].人造地标是指人为放置在环境中的物体或特殊设计的标记,可以通过激光、红外、声纳和视觉传感器进行检测,仅为移动机器人定位导航功能服务.有研究者[9]使用二维码作为人造地标,让每个二维码存储唯一的文本字符串,指向室内环境的绝对坐标,如图4.由此开发出高精度、高可靠性的室内导航系统.
图4 以二维码为人造地标的室内导航
地标定位法的优点是快速且使用方便,但特征的选取会直接影响特征描述、特征检测和特征匹配的复杂性.
2.3 地图匹配法
地图匹配法[10],是机器人利用传感器创建环境地图,再将局部映射与先前存储的全局映射进行匹配,从而计算出自身在环境中位姿的技术,主要分为视觉定位和激光雷达定位.
2.3.1 视觉定位法
视觉定位是通过相邻帧图像特征匹配实现相机运动估计,可分为单目相机定位[11]、双目相机定位[12]和深度相机定位[13].为了克服视觉定位在闭环时的累积漂移和姿态跳跃等问题,有研究者提出一种基于先验地图进行2D-3D线条匹配的单目相机定位方法[14],从地图中离线提取几何3D线条,从视频序列中在线提取2D线条,利用VIO的姿态预测和最小化对应关系进行匹配,从而实现位姿估计,见图5.
图5 基于2D-3D线条匹配的视觉定位效果图
视觉定位法的优点是精度高、速度快,但是相机容易受到光照条件的影响,而且视角较小,一般不适用于室外环境的定位.
2.3.2 激光雷达定位法
激光雷达定位的中心思想是点云匹配[15].ICP(Iterative Closest Point)算法是影响最大、应用最广的点云匹配算法,它利用最小二乘法使得源点云和目标点云对应点之间的欧氏距离最小,从而求解运动位姿;NDT(Normal Distributions Transform)算法是位姿跟踪的另一经典算法,它将参考点云数据转换成二维空间分段连续的概率密度函数,然后将当前帧进行旋转平移,使得数据在参考帧的得分最高(图6).
图6 NDT配准示意图
ICP族算法的优点在于匹配精度高,最初收敛过程较快,但缺点是难以保证实时性且对初始位置要求严格,对于该算法的改进主要集中在对于高密度点云进行筛选、提取描述子进行匹配、重新设计匹配方案3个角度[16-18];NDT族算法的优点在于实时性强,鲁棒性好,对初始位置的要求不高,而缺点在于精度较差,对于该算法的改进主要集中在对于点云栅格化的策略、统计学参数的选取、更新目标函数三个角度[19-21].
3 概率定位
无论是相对定位还是绝对定位,都会面临不确定误差的干扰.因此,基于概率统计的定位方法被提出,它的理论基础是贝叶斯滤波[22],核心步骤包括预测和更新两步,前者利用上一时刻的系统状态及里程计数据来预测这一时刻的系统状态,后者利用点云匹配结果来更新这一时刻的系统状态估计,不断递归调用这两个步骤,最终输出迭代优化后的位姿估计(图7).
根据滤波原理的不同,概率定位方法可以分为卡尔曼滤波定位法[23]、马尔可夫定位法[24]和蒙特卡洛定位法[25].卡尔曼滤波定位法用于处理线性高斯系统,可以估计移动物体的位置和速度,并在可见条件下对物体进行跟踪,后来研究者们又提出用于处理非线性系统的无迹卡尔曼滤波(UKF)[26]和扩展卡尔曼滤波(EKF)[27].为了突破卡尔曼滤波单峰高斯分布假设的限制,马尔可夫定位法被提出,根据对状态空间及模型表示方法的不同,分为拓扑马尔可夫定位和栅格马尔可夫定位.蒙特卡洛定位法(MCL)的基本原理是粒子滤波(PF),相比与卡尔曼滤波方法,它易于实现且不受限于噪声高斯分布;相比于马尔可夫定位法,它有更高的计算效率,尤其在处理高维问题时不会弱化性能,因此在移动机器人领域得到了最为广泛的应用.
MIGUEL等[28]基于MCL算法,利用3D雷达信息和GNSS信息提高户外环境中移动机器人的定位精度,同时解决移动机器人的绑架问题;LIU等[29]基于MCL算法,利用视觉传感器和2D激光测距仪实现室内定位,并提高了移动机器人在室内场景中重定位的精度;GE等[30]通过使用环境语义信息和雷达扫描信息,提出Text-MCL定位方法,提高了移动机器人全局定位的速度和成功率.
概率定位将相对定位与绝对定位进行了优势互补,在保证计算效率的同时极大地降低了各种不确定误差的干扰,提高了定位的精度与可靠性,但建模的准确性将直接影响其定位效果.
4 深度学习定位
相对定位、绝对定位和概率定位均为基于模型的定位方法,在建模过程中会面临无特征区域、运动模糊、精确的相机校准等挑战[31].而深度学习则通过数据驱动的方式为解决定位问题提供了新思路,学习方法可以利用高度压缩的深度神经网络作为通用近似器,并自动提取与任务相关的特征.YANG等[32]在视觉里程计中引入数据驱动(图8),显著提高了系统的鲁棒性;MA等[33]利用深度学习的方法完成SLAM中的语义标记,将抽象元素与人类可理解的术语联系起来,用于解决定位问题;ZHOU等[34]通过将视图合成作为一种自监督信号,从未标记的视频中恢复自身的运动和深度;通过构建任务驱动图,深度学习的表示还可以进一步支持高级任务,如路径规划[35]和决策[36].
深度学习定位对各种环境具有较好的适应性,可以在新场景中自行发现新的解决方案,但是学习技术要依赖于海量数据集才能提取统计上有意义的模式,并且相比于基于模型的方法,它的计算成本往往更大[37].
5 多传感器信息融合技术
当面对复杂且不确定的环境及对象时,单一传感器获取的信息存在一定的局限性,同时还会受到自身性能的影响.因此,多传感器信息融合技术在移动机器人定位领域得到了越来越广泛的关注,它充分利用了不同定位传感器的互补输出信息,将融合后的结果作为机器人的位姿估计.
5.1 多传感器信息融合算法
传感器融合系统是一个复杂的信息系统,各种传感器实时收集信息,各种信息之间也存在相互约束和影响[38].因此,信息融合算法是多传感器融合定位的核心[39],目前主要分为4类,分别是推理法[40]、分类法[41]、人工智能法[42]和滤波估计法[43].推理法主要基于D-S理论,该理论为处理传感器信息的模糊性和不确定性提供了很好的解决方案;分类法中常用的聚类和融合算法是K-means,它基于欧几里德距离来判断目标数据,从而将具有更大相似度的数据收集并融合在一起以实现分类[44];人工智能方法主要基于多源数据信息融合的人工神经网络,通过学习算法分配网络权重,同时推理多传感数据的不确定性,然后利用神经网络的信号处理能力和自动推理功能实现数据融合[45].滤波器估计方法利用相应的滤波器对系统状态进行估计,由于其在动态和复杂状态下具有更好的鲁棒性和适用性,已成为最为广泛使用的方法.
5.2 多传感器信息融合技术在定位问题中的应用
为了解决模糊度问题,WAN等[46]提出一种可以在不同城市场景中实现厘米级定位精度的定位系统(图9),其中GNSS-RTK模块基于卡尔曼滤波(KF)融合框架,最终实现了5-10 cm的RMS精度;为了解决移动机器人定位过程中对大角度旋转的适应性问题,LI等[47]提出一种基于递归卷积神经网络(RCNN)的架构用于融合点云数据和IMU数据,以增强定位系统的鲁棒性和准确性;为了解决ESKF算法在高度非线性条件下估计精度下降的问题,SHAUKAT等人[48]提出RBF-ESKF多传感器融合算法,利用RBF神经网络改进误差项来补偿ESKF性能的不足,通过最速下降优化方法最小化来设计RBF神经网络的权重和中心,实验证明该方法相比于传统的ESKF法具有更高的精度和可靠性.
图9 城市场景中多传感器融合定位效果图
与单传感器系统相比,多传感器系统可以显著降低不确定性的影响,并且在系统部分出现故障的情况下依然能够提供有效信息,同时还有利于扩大测量范围、提高分辨率,因此,在移动机器人定位问题中具有较高的研究价值.
6 结 论
文中对几类典型的定位方法进行比较与分析.其中,概率定位基于贝叶斯滤波原理,将相对定位与绝对定位的结果同时用于系统状态的估计,有效降低了不确定误差的干扰,但建模的准确性是其主要限制;深度学习定位则凭借数据驱动的计算方式避免了建模难题,但对海量数据集的依赖和较高的计算成本是其主要限制.此外,随着融合算法的发展,多传感器信息融合技术被越来越广泛地应用于移动机器人定位领域,该技术能够有效提高系统的鲁棒性,从而更好地适用于实际工程问题.综上所述,对于移动机器人定位系统,有以下几个方向值得深入研究:
1)深度学习方法的开发:随着相关数据集的丰富与完善,深度学习方法将在点云匹配及信息融合技术中发挥更大的作用.
2)概率定位与深度学习定位融合:目前已有研究者尝试将这两种方法进行优势互补,但相关领域依然存在较大的探索空间.