APP下载

共融机器人导航技术综述

2020-11-23刘公绪

无线电工程 2020年12期
关键词:共融滤波传感器

刘公绪

(1.西安电子科技大学 电子工程学院,陕西 西安 710071 2.超高速电路设计与电磁兼容教育部重点实验室,陕西 西安 710071)

0 引言

当前,物联网技术已取得全面发展,人工智能技术持续赋能各行各业,5G等新基建已基本完成,北斗第三代卫星导航系统也完成全面组网,火星探测计划已经开始,新技术革命浪潮下各种新兴技术、朝阳产业和技术生态方兴未艾。在新时期下,人们对导航及相关基于位置服务的需求日益迫切,其中机器人导航问题引起了越来越多的关注。文献[1]建立了古典图灵模型和自然计算模型,论述了机器人的形态与其感知和控制的关系,明确指出:依赖于特定形态和特定环境的机器人的感知和控制,其应用是受限的,甚至是不实用的。机器人导航要求已经从之前简单的功能实现提升到可靠性、通用性、高效率上来,因此对其相关技术提出了更高的要求,在非结构化环境下机器人自主导航难题仍没有得到很好的解决。众所周知,与结构环境相比,非结构化环境中没有人工搭建的软硬件辅助设备如无线传感网络、通信电缆等,且环境中物体的材质性能不均匀,其结构及尺寸变化规律不稳定。简言之,非结构化环境的环境信息是未知的、动态的和复杂的。因此,非结构化环境的应用需求给机器人导航技术带来新的挑战。

随着人工智能时代的发展,学者们提出了与传统机器人不同的概念——共融机器人[2-4]。它是指结构柔顺灵巧、感知多源融合、控制灵活多样、交互自主智能,具有人/机/环境彼此共存、协作与认知功能的机器人,可以普遍应用在避障、路径规划、虚拟现实、消防急救、单兵作战等导航相关领域。共融机器人导航问题的核心则是如何使机器人更好地感知环境和认知环境,这就需要研究多传感器融合与控制方法[5-8]。

1 共融机器人导航问题分析

本质上,共融机器人导航问题主要包括以下两大问题。

1.1 传感问题

传感问题是机器人感知环境的基础,通过对机器人自身及外部障碍物位姿信息的检测及处理,获取有效的环境信息,为决策系统提供保障。由于单一传感器很难采集到决策系统所需的全部环境信息,多传感器信息融合的概念应运而生。多传感器信息融合是指充分利用多传感器间的冗余信息,将不同传感器反馈的局部信息整合,从而提高系统的决策及规划的准确性。具体的方法包括加权平均法、贝叶斯估计法、卡尔曼滤波法、模糊积分法、确定性理论法、人工神经网络法[9-10]以及D-S推理法等。此外,在温度变化较大的环境下,必须考虑温度等外界条件对传感器精度的影响[11];在动态环境下必须考虑振动对各传感器的影响,如动态时,磁传感器的失真补偿等[12];多传感器在融合时,必须能够做到同步和信息协同更新,这需要建立多传感器系统的通信拓扑图和一致性协议,来解决多传感器系统信号传输的一致性与通信网络中信号的同步问题[13-14]。

1.2 控制问题

传感器将实时探测到的工作环境信息反馈给机器人,从而获得障碍物的形状、尺寸及位置信息,并做出局部路径规划。事实上,在非结构化环境下,由于环境的未知性、动态性和复杂性,往往需要对障碍物进行多次测试,通过训练样本,建立模型,再用测试样本验证模型。整个过程用到很多新兴的智能算法如机器学习方法中的各种分类算法:支持向量机(SVM)[15-17]、决策树(DT)[18]、神经网络(NN)[19]、集成学习算法如随机森林(Random Forests)[20]、AdaBoost[21]、RegionBoost[22]等来研究机器人导航中的最优化控制问题。

2 机器人导航技术介绍

目前,已有许多技术/方法用来解决机器人导航问题,从底层传感器来说,用于机器人导航的声、光、电、磁等传感器就达数十种,机器人所装备的传感器示意图如图1所示。

图1 机器人所装备的传感器示意Fig.1 Robots equipped with sensors

下面就几类典型基于传感器的机器人导航技术进行介绍。

2.1 基于超声波传感器的机器人导航

超声波传感器[23]检测距离原理是测出前后2次发出超声波的时间差,同时根据声速计算出物体的距离。超声波传感器一般作用距离较短,普通的有效探测距离都在5~10 m。利用实时监测长距离超声波传感器,为机器人搜索开阔路径。当机器人离障碍物还有一定距离时,超声波传感器就能检测到相关信息,并据此控制机器人避开障碍物。超声传感器的成本低,实现方法简单,技术成熟,是移动机器人中常用的传感器。由于超声波在空气中的速度与温湿度有关,因此在比较精确的测量中,需考虑温湿度等因素。此外,超声波探测存在最小探测盲区,无法对近距离物体探测,若在小转弯角处遇到平滑的表面,则存在漏检测,导致导航失败。

2.2 基于红外传感器的机器人导航

大多数红外传感器[24]测距都是基于三角测量原理。红外发射器按照一定的角度发射红外光束,当遇到物体以后,光束会反射回来,反射回来的红外光线被CCD检测器检测到以后,会获得一个偏移距,利用三角关系,在知道发射角度、偏移距、中心矩以及滤镜的焦距等信息以后,即可通过几何关系计算出传感器到物体的距离。红外传感器不受可见光影响,白天黑夜均可测量,角度灵敏度高,结构简单,价格较便宜,可以快速感知物体的存在,但测量时受环境影响很大,障碍物的颜色、方向及其周围的光线都能导致测量误差,使测量不够精确。

2.3 基于视觉传感器的机器人导航

视觉传感器[25-28]的优点是探测范围广,获取信息丰富,实际应用中常使用多个视觉传感器或者与其他传感器配合使用,通过一定的算法可以得到物体的形状、距离、速度等诸多信息,或是利用一个摄像机的序列图像来计算目标的距离和速度,还可采用SSD(Sum of Squared Differences)算法,根据一个镜头的运动图像来计算机器人与目标的相对位移。在图像处理中,边缘锐化特征提取等图像处理方法计算量大,实时性差,对处理机要求高,且视觉测距法不能检测到玻璃等透明障碍物的存在,受视场光线强弱和烟雾的影响很大。

2.4 基于激光雷达的机器人导航

激光雷达测距传感器[29-32]利用激光来测量机器人到目标的距离及目标的运动速度等参数。由脉冲激光器发出持续时间极短的脉冲激光,射到被测目标,由光电探测器接收回波信号。根据主波信号和回波信号的间隔,计算出待测目标的距离。若要求精度非常高,常用三角法、相位法等方法测量。与其他距离传感器相比,激光雷达能够同时考虑精度要求和速度要求,可全天候工作,但安装精度要求高、价格比较昂贵。

2.5 基于人工势场的机器人导航

人工势场[33]属于仿生学范畴。通过建立机器人工作空间中的虚拟势场,按照虚拟势场力的方向,实现局部路径规划。通过构造目标位姿引力场和障碍物周围斥力场共同作用的人工势场,来搜索势函数的下降方向,然后寻找无碰撞路径。由于没有考虑障碍物的速度和加速度的影响,不适合动态导航控制,只寻找能够导航的可行路径,没有研究最优路径。此外,关于仿生学传感器在共融机器人领域的研究参考文献[34-36],其中涉及到软体机器人、电子皮肤和生物传感器等。

3 用于共融体制的信息融合方法

对于共融机器人导航来说,其共融体制在控制问题上可以理解为信息融合,包括基于概率模型的方法如加权平均、卡尔曼滤波、贝叶斯估计、极大似然估计和统计决策理论等;基于规则推理的方法如D-S证据理论、产生式规则、模糊逻辑和粗糙集理论等;基于机器学习和数据挖掘的方法等等。它们的描述和特性如表1所示,融合控制的对比如表2所示。

表1 典型信息融合算法的介绍Tab.1 Introduction of typical information fusion algorithms

特别地,栅格法、模糊控制、人工神经网络和遗传算法是最常见的机器人导航技术,分别介绍如下。

3.1 基于栅格法的机器人导航

属于启发式算法,栅格法[37]以基本元素为最小栅格粒度,将地图进行栅格划分,比如基本元素位于自由区取值为0,处在障碍物区或包含障碍物区为1,直到每个区域中所包含的基本单元全为0或全为1,这样在计算机中较容易建立一幅可用于路径规划的地图。赋予每个栅格一个通行因子,路径规划问题就变成在栅格网上寻求2个栅格节点间的最优路径问题。搜索过程多采用四叉树或八叉树表示工作空间。栅格粒度越小,障碍物的表示会越精确,也就更好导航。但往往会占用大量的储存空间,而且算法复杂度也将按指数增加。类似的算法还有蒙特卡罗定位算法[38]和贝叶斯估计算法。

3.2 基于模糊逻辑控制的机器人导航

该控制方法应用模糊集合理论[39],将专家知识或操作人员的经验形成的语言规则直接转化为自动控制策略。通常使用模糊规则查询表,用语言知识模型来设计和修正控制算法。为了智能地控制移动机器人的导航行为,模糊控制需要完成障碍物距离值的模糊化、导航模糊关系的运算、模糊决策以及导航决策结果的非模糊化处理等重要过程,不必创建可分析的环境模型。当前研究工作的新趋势之一是它的渐增本质,特别是在模糊控制规则的自动生成方面,即自动获取模糊数据,在线模糊规则学习能力等。

3.3 基于人工神经网络的机器人导航

人工神经网络[40-41]是按照一定的拓扑结构相互连接而成的一种具有并行计算能力的网络系统,具有较强的非线性拟合能力和多输入多输出协同处理能力。传统的神经网络路径规划方法往往是建立一个关于机器人从初始位置到目标位置行走路径的神经网络模型,模型输入传感器信息和机器人前一位置及其方位,通过对模型训练输出机器人下一位置及其方位。该方法的优点是可大规模地并行处理和分布式信息存储,具有良好的自适应、自组织性,以及很强的学习功能、联想功能和容错功能,接近人脑的信息处理模式。缺点是模型的可解释性差,在一些条件下容易陷入局部极小点。

3.4 基于遗传算法的机器人导航

遗传算法[42-45]属于进化算法范畴,是计算数学中用于解决最优化问题的搜索算法。进化算法是借鉴了生物学中的遗传、突变、自然选择以及杂交等进化现象而发展起来的。遗传算法采用从自然进化中抽象出来的几个算子对参数编码的字符串进行遗传操作,包括复制或选择算子(RS)、交叉算子(Crossover)、变异算子(Mutation)采用群体方式对目标函数空间进行多线索的并行搜索,不会陷入局部极小点;只需要可行解目标函数的值,而不需要其他信息,对目标函数的连续性、可微性没有要求,使用方便;以概率方式产生和选择优化结果,因此具有较强的适应能力和鲁棒性。许多类问题如特征选择、分类问题、聚类问题都可以用遗传算法解决,但其工作机理很难用数学方式进行精准描述,整个求解过程运算量较大,且需要调整多个参数如样本大小、杂交率、变异率和选择策略等等。

4 机器人位姿估计方法

在共融机器人导航中,机器人本身的位置和姿态的估计非常关键,常见的机器人位姿估计方法有两大类,即基于卡尔曼滤波(Kalman Filter,KF)的相关方法和基于互补滤波的相关方法,分别介绍如下。

4.1 基于卡尔曼滤波的方法

KF[46]是经典的位姿估计方法。通过建立状态空间的运动方程和传感器观测方程,估计当前状态参数及其协方差,并预测出下一时刻的状态及其预测协方差,实现人员的定位定向。在线性高斯假设条件下,KF是一种最优线性滤波方法,在准确获得过程噪声和观测噪声二阶矩的情况下,可以最大限度地消除观测噪声的影响。然而,实际情况中人员的运动模型不能准确得知,运动方程和观测方程是非线性的,导致KF工作的条件不满足,进而导致滤波发散,引起定位定向误差增大。针对非线性滤波问题,至今没有最优解。因此有学者提出扩展卡尔曼滤波(Extended Kalman Filter,EKF)[47],即基于泰勒级数展开,将非线性滤波问题转化为局部线性滤波问题。EKF可以得到次优的状态估计,二阶EKF性能和计算复杂性远大于一阶EKF,阶数再高性能提高不大,考虑到计算复杂性,工程上多使用一阶EKF。当泰勒展开的高阶项不能忽略时,局部线性化导致的误差仍会影响精度的提高,甚至会使协方差矩阵呈现病态,导致滤波结果发散。转换量测KF(Coverted Measurement Kalman Filter,CMKF)[48]是指将量测转换后重新构造线性量测方程,导出量测误差协方差,然后进行滤波。对于非线性系统,CMKF性能优于EKF。此外,有学者提出无迹卡尔曼滤波(Unscented Kalman Filter,UKF)[49],UKF是用多个高斯分布的样本点来逼近状态的概率密度函数(Probability Density Function,PDF),通过非线性变换来传递随机量的统计特性,用加权统计线性回归方法估计随机量的一阶矩和二阶矩,无需计算雅可比矩阵或者Hessian 矩阵,就可以达到近似二阶EKF的精度。缺点是计算量比KF或一阶EKF大;更重要的是若系统状态的后验概率密度函数是非高斯分布时,滤波器性能显著下降。容积KF(Cubature Kalman Filter,CKF)[50]是一种基于容积数值积分原则的Sigma点滤波算法,对非线性高斯系统的估计能达到三阶精度。针对非高斯非线性系统,有学者提出粒子滤波 (Particle Filter,PF)[51]方法,又称序贯蒙特卡洛(Sequential Monte Carlo,SMC)方法,是最优的贝叶斯估计方法,它将状态矢量表示为一组带有权值的粒子,并基于粒子估计状态,可以得到与UKF相似的性能。虽然PF适用于各种环境下的状态模型和观测模型,但粒子在迭代计算过程中会出现退化现象。通常需要进行重要性概率密度选择或进行重抽样以减弱粒子退化。PF的另一缺点是计算复杂度,当粒子达到一定数目时,计算量会非常大。此外值得一提的是,上述大多数滤波器都无记忆功能,依赖初始状态估计,受一致能观性影响,因此也有学者提出因子图或图优化理论[52]进行滤波或状态估计。

4.2 基于互补滤波的方法

互补滤波(Complementary Filter,CF)[53-54]的思想是在频域内设计有互补特性的全通带滤波器,其滤波器增益为Kp,算法适用范围是低动态,且环境噪声没有太大突变。自适应互补滤波(Adaptive Complementary Filter,ACF)[55-57],即参数Kp可调节。尤其当环境的噪声发生突变或者载体处于动态时,参数Kp可以根据阈值[58]适时调整,或可以基于分段函数[59]实现,其中每段函数对应不同的权重。该方法较CF有更大的实用性和更高的精度。显式互补滤波(Explicit Complementary Filter,ECF)[60-63],在CF方法的补偿环中加入了积分器,来进一步消除陀螺仪的常值漂移误差,因此算法中有比例Kp和积分Ki两个可调节的参数,但是参数Kp,Ki的选择一般是通过工程整定的方法,不易寻找。自适应显式互补滤波(Adaptive Explicit Complementary Filter,AECF)[64]算法,即参数Kp,Ki均可调。值得一提的是,上述在频域上进行互补滤波实现的方法均可以在时域上用基于梯度下降的方法来实现[65-67]。

5 展望

在未来,共融机器人有望与以下技术进行深度融合,为人们提供更好的导航和其他基于位置的服务。

5.1 共融机器人与人工智能

共融机器人与人工智能的深度融合。不论是共融架构还是共融算法,人工智能算法都是共融机器人的关键技术。目前传统算法及大部分智能算法都有其适用范围,如何克服相关算法的局限性是当下研究的热点。通过传统算法与智能算法相融合,甚至多个智能算法相融合,克服单个算法的缺陷,增强系统的鲁棒性。另外,由于非结构化环境是动态的、未知的和复杂的,因此,迫切需要研究可以自我学习,不断进化的算法,以适应不同的非结构化环境需求。在非结构化环境中,通过现有技术和手段或研究新的方法,使共融机器人自主地认知环境、识别目标并做出响应,实现与环境交互共融和智能导航,是未来机器人导航问题完美解决的可行路径之一。

5.2 共融机器人与5G

共融机器人与5G的深度融合。未来几年,基于5G的通信导航一体化技术[68]将得到全面发展,对基于5G的数据网和定位网进行两网合一,同时将共融机器人融入该通信导航一体化架构中,更好地提供局域化的共融导航服务。

5.3 共融机器人与BDS-3

我国的BDS-3于2020年7月份全面完成组网,天上北斗已建好,地上北斗如何用好尤为关键。将BDS-3与共融机器人融合,提供广域下大集群机器人的协同导航,为森林灭火、抗震救灾、边境无人值守等保驾护航。

6 结束语

随着信息化和智能化技术的快速发展,涉及多学科交叉领域的共融机器人导航问题引起学者们的广泛兴趣和研究。本文从共融机器人的导航问题出发,系统回顾了共融机器人的导航技术,介绍了相关的信息融合方法和机器人位姿估计方法。综述表明,传统的导航技术已不能满足新时期人们对导航和基于位置服务的需求,当前共融机器人的导航问题仍没有有效解决。如何从传感器层面到信息融合层面,研究新的信息共传、共感、共融理论尤为关键,此外结合AI新技术、5G新基建、BDS-3新战略开展共融机器人导航技术的跨学科基础和应用研究是未来的发展趋势。

猜你喜欢

共融滤波传感器
船岸通信技术下舰船导航信号非线性滤波
共融共建共育,构建教育新生态
康奈尔大学制造出可拉伸传感器
简述传感器在物联网中的应用
一种考虑GPS信号中断的导航滤波算法
高效LCL滤波电路的分析与设计
跟踪导练(三)2
基于EKF滤波的UWB无人机室内定位研究
光电传感器在自动检测和分拣中的应用
共融机器人