军用无人系统协同感知与分布式滤波技术*
2024-04-16李诗航孙玉洁崔建峰曾建潮卢志刚
李诗航,孙玉洁,崔建峰,,曾建潮,卢志刚
(1.中北大学,太原 030051;2.北方自动控制技术研究所,太原 030006)
0 引言
无人战争时代已经到来,由美军研制的军用无人机动平台“弹簧刀”无人机已在俄乌战争中得到验证,2022 年初,搭载并发射“弹簧刀”无人机的TRX 履带式无人机动车辆在美国通用动力公司进行公开展示[1]。美国军方已将无人化装备比例提高至近30%,俄罗斯国防部也计划在2025 年将无人作战系统的装备占比提升到30%。美国定期发布《无人系统综合路线图》《地面无人系统路线图》等文件,统筹规划军用无人系统与相关技术的发展,其半自主地面无人系统已经列装,还在大力发展四足机器人、人形机器人、攀爬机器人等形式多样的仿生机器人,同时探索无人协同、无人集群、脑机融合、分布式感知与定位等前沿技术[2-5]。种种迹象表明,具有高级决策能力的无人平台在现代军事行动中所占的比重将会越来越高。
面对日益复杂的国际局势以及局部区域的军事对抗,信息化战争与传统战争相比已发生了质的变化,分布式滤波与协同控制的研究应用已经扩展至大规模复杂网络和系统开发中[6-13]。2021 年10月美国通用动力陆地系统公司设计生产的可远程操纵及半自动控制的MUTT(multi-utility tactical transport),可以在士兵进入战区之前进行侦察和探测伏击。为提高作战时效性,德国开发了一款可根据任务需要搭载多种载荷,拥有全地形通过能力的无人战车“任务大师-XT”,具有集成到每个平台独特的北约组织标准战斗管理系统,能够共享和交换来自邻居车辆和模块传感器的信息,以提升团队作战力量。由乌克兰设计制造的“骆驼”地面无人战车可以装配各种传感器来收集和传输数据,以及实现制导和跟踪目的,可以通过遍历预定义的航路点进行自主导航,具有很高的便利自主性[14]。目前,我国海、陆、空各军种已将无人作战系统的开发列入研究计划,某集团及其下属各研究所为代表,在空中无人机装备研发、地面无人车作战平台开发上已取得显著成绩。中国最新轻型多用途无人战车“尖兵”UGV 通过遥控方式进行操作,同时具备有限的人工智能,包括自主导航避障、人员跟随、目标跟踪和识别能力等功能[15]。VU-T10 履带式地面无人作战平台也在2021 年首次亮相第13 届中国航展。在《中国制造2025》规划中我国也明确提出突破视觉SLAM 与微惯性导航等无人化领域的关键技术[16-18],以应对无人作战平台提升智能化水平时面临的挑战。
1 军用无人系统的组成和特点
1.1 基本组成
军用无人运动平台是一种能够感知环境并与环境交互,用于完成军事任务的遥控式、半自主式、平台中心自主式和网络中心自主式的车辆或机器人,是以智能信息化处理技术和通信技术为核心的智能化武器装备。常见军用无人运动平台虽然在设计方案、传感器配置、功能实现上各不相同,但是在系统组成上仍存在着共同点,都包含环境建模、路径规划、识别跟踪、侦察通讯等子系统。这些子系统通过联调测试来提升无人平台的作业能力,多个无人平台之间通过电台或数据链通信组成班组或连队级军用无人系统,可以实现现代化多兵种的协同作战或联合区域作战,如图1 所示。根据无人系统实现功能的不同和智能化程度的差异,有些还设有遥控站点、多车通信系统、上级指挥系统、协同火力控制系统等次级网络。
图1 无人系统协同作战示意图Fig.1 Schematic diagram of the cooperative operation of the unmanned system
1.2 技术特点
与机器人技术一样,无人运动平台作为移动机器人领域的一个重要研究分支,同样适用于多机器人系统的理论范畴,并在实际战场作战中不断演化出独有的技术要求和优势。
由于特殊的用途和背景,军用无人运动平台相比普通移动机器人的行驶速度速度要更高,速度动态范围更大,需要更强的承载能力和更长的续航能力。与普通移动机器人作业环境相比,军用无人运动平台的工作环境更加复杂,未知范围更大,不仅在结构化道路环境中能够正常行驶,也要在非结构化道路环境中正常行驶。在野外极端环境下,面对复杂地形、震动冲击、烟雾沙尘、高低温等因素,这就要求军用无人运动平台具有更高的可靠性与稳定性。此外,搭载有武器系统或补给物资的军用无人运动平台工作时,不可避免地与指战员或载人驾驶车辆发生信息交互,因此,相比工业机器人、家居机器人等民用领域,需要具有更加智能和完善的跨平台控制系统。这些技术特点实现的前提是,无人系统具有高度智能的环境感知能力、信息处理能力和实时构图能力。
2 军用无人系统协同作战关键技术
2.1 协同感知与信息处理
随着智能化进程的不断推进,无人车辆协同定位和导航技术受到科研人员的极大关注。多车辆协同定位是指车辆与车辆、车辆与标识物以及车辆与士兵之间通过信息交换,获取自身与邻居车辆的姿态角度、到达时间、接收信号强度、载波频率偏移等相关量,进而确定出每个车辆的相对位置或绝对位置以及姿态。有别于传统车辆的状态感知,军用车辆协同定位提供的全时空动态信息需要满足实时性要求。配置不同传感器的各军用平台可利用协同感知策略得到多源多尺度环境信息,并采用信息融合技术实现复杂环境下跨平台多视角协同感知。
与结构化环境相比,作战车辆面对的路况为未知非结构型,这就要求车辆在实际工况下具有更加智能的环境信息获取和处理能力。更严重的是,多车辆环境感知和路径规划的过程会产生因果循环,不同区域车辆规划的结果会互相影响,难以获得最优的运动轨迹。针对智能化无人车群在特殊环境下协同感知的复杂性和开放性等问题,引入分布式协同感知与决策控制策略。其核心思想是将多维度问题划分为有限时空范围内的若干小集群问题。随着车辆之间实时的协同感知与信息交互,将目标车辆的状态信息依次交互至不同的集群中,从而实现不同区域内邻居车辆之间的单独协调。此外,利用邻近区域的车辆信息,设计相应的基于预测的协调策略,保证邻近区域之间协作的稳定性和可靠性,从而使车群更快地完成规划决策,获得更高的行驶效率,提高协同感知系统的鲁棒性。
基于车辆与车辆的协同定位网络中,利用北斗卫星导航系统(BeiDou navigation satellite system,BDS)、航位推算(dead reckoning,DR)以及车辆之间的到达时间测量进行分布式协同定位。DR 是一种独立定位技术,指已知上一时刻导航状态速度、位置等,根据传感器观测值推算出下一时刻的导航状态,成本低廉且易于实现,随着时间推移其定位误差不断累积与BDS 存在优势互补关系。
在军用车辆与车辆的协同场景下,对于每个任务车辆而言,既是待估车辆,同时又是其他车辆的辅助车辆。而基于到达时间的测量模型具有强非线性特征,采用一般的扩展卡尔曼滤波器(extended kalman filter,EKF)进行估计,误差较大,难以获得理想的状态值。
针对此种情况,这里提出一种改进的无迹卡尔曼滤波器(unscented Kalman filter,UKF)算法,通过将随机参数扩维到状态向量来提升算法性能。扩维后的运动方程和观测方程可描述为
经过理论分析表明,在非线性系统中噪声概率密度函数是正态分布的情况下,通过改进的无迹变换得到的近似均值和协方差具有三阶近似精度。该技术方法对协同定位网络中的每个军用待估车辆,利用测距雷达来获取其他辅助车辆的到达时间观测,通过车辆与车辆的协同信息传递获取辅助车辆的位置信息,并结合自身的航位推算运动模型,采用改进的无迹卡尔曼滤波器进行分布式计算,得到自身及其他军用车辆的位置估计,然后各军用车辆将计算得到的估计值,通过车与车之间的协同通信进行信息传输。每辆车将收到的信息通过滤波器进行数据融合得到上一时刻的信息,然后通过既定的信息流向将下一刻的状态向量,以及协方差矩阵传输给邻近的其他车辆,从而实现分布式协同定位。
2.2 分布式状态估计技术
在军事作战中,任务目标随战场态势瞬息万变,依靠单一的无人运动平台性能指标的提升已经无法满足任务要求,因此,将多个平台进行编队协作,构建成无人运动平台群体。此时,对多个目标的状态估计需要采用分布式滤波技术,即把多个目标看作一个整体,根据链路拓扑结构进行分簇划分,对配置在簇目标上的传感器获取的状态信息(参数)进行拆分解析,将簇目标的统计信息:均值方差、功率谱密度、概率密度函数等传输给对应的子滤波器,进而对簇目标进行定位和跟踪预测。并利用新的测量值更新后验概率,在主滤波器上完成对整个目标的状态估计。
复杂战场环境时,士兵为了更好地控制无人机动平台实践各运动模态,还需要对某些反映运动平台特性的姿态变量进行补偿,以便对各军用装备进行准确的操控。实际作战环境呈现出未知非结构的特点,俯仰、侧倾、横滚、纵滑和侧滑等现象不可避免,这些与车辆相关的变量不易直接测量,车轮的扰动无法预知,可能受到测量噪声的影响产生一定的误差。而无人机动平台的状态估计主要是将多种传感器:陀螺仪、全球定位系统(global positioning system,GPS)、BDS、加速度计、位移计、惯性测量单元(inertial measurement unit,IMU)等读取信息进行融合,考虑到传感器的增多会增加系统设计的成本,并且会降低系统的可靠性,因此,引入分布式状态滤波器。利用一些可直接测量得到的状态变量来估计车辆的姿态、速度,以及相对或绝对位置等关联信息。为了确定和估计这些状态变量的数值,建立最优的估计算法,需要判断平台系统中有关的状态变量是否可观测或者协同可观测。考虑到动态系统模型的实用性,运行分布式滤波器的前提是,已建立的状态方程和测量方程必须满足协同可检测性。
目前采用的组合导航定位方法,是通过卡尔曼滤波算法器(Kalman filter,KF)、EKF、UKF 或粒子滤波器(particle filter,PF)融合全球卫星导航系统(global navigation satellite system,GNSS)和惯性导航系统(inertial navigation system,INS)定位的数据进行状态估计。这里将上述组合定位核心算法扩展到分布式滤波的形式,这样即使单一车辆不满足可观测性但多个车辆协同可观测时,滤波器仍能正常工作。一般地,当获取了预测向量的协方差矩阵估计,以及与之间的协方差矩阵估计时,可将分布式滤波算法的预测更新表示成如下形式:
其中,下标i 表示第i 个平台,Ni表示与第i 个平台有链路通信的所有平台的集合。
然而,在丛林、深谷、湍流及地下等复杂环境中都可能导致卫星导航信号瞬间丢失无法使用,导致定位效果变差或定位失败。惯性导航元件虽然不受外界环境的干扰,但随着使用时间的累积,其惯性测量数据存在漂移等失真现象,会产生较大误差。除了对BDS-INS 组合导航系统进行深入研究外,另一种可行方案是对多机器人系统进行同时创建地图与定位(simultaneous localization and mapping,SLAM)和基于视觉里程计(visual odometry,VO)的状态估计。
2.3 协同SLAM 技术
SLAM 技术是指无人平台在非结构未知环境运动时,利用自身携带的视觉、激光、超声等传感器,识别该环境中的特征并估计其相对传感器的位置,同时利用自身携带的航位推算系统或惯性系统等传感器估计运动平台的全局坐标。将这两个过程通过状态扩展,同步估计平台和环境特征的全局坐标,并建立有效的环境地图。
协同SLAM 方法使用分布式滤波器对无人平台的姿态和地图进行状态估计。首先利用激光测距系统、摄像机系统等环境感知设备,获取环境数据并提取环境特征,将观测的特征数据与已存在的地图和人工信标进行数据关联,得到相应的观测值;其次使用里程计、电子罗盘、微惯性系统等本体状态感知设备得到运动模型;联合观测值和运动模型,使用分布式EKF、分布式UKF、分布式稀疏扩展信息滤波、分布式PF 等技术实现路标估计、轨迹估计和车辆位置估计;最后与BDS 和人工地图进行对比校验,检查状态估计的准确性。协同SLAM在解决大范围动态环境,特别是卫星导航信号较弱或是不稳定区域中无人机动平台的长时间地图重建和定位问题方面有着巨大潜力。因此,越来越多的科研人员将该策略用于地面无人机动平台在复杂环境中的定位。协同SLAM 技术系统架构如下页图2 所示。
图2 协同SLAM 技术系统架构Fig.2 The system architecture of collaborative SLAM technology
基于视觉里程计的状态估计方法,其实质是将SLAM 扩展为视觉同时创建地图与定位(visual simultaneous localization and mapping,VSLAM)方法。该方法包括前端VO 和后端优化(loop closure)。视觉里程计用于计算连续两帧图像的位姿变换,通过闭环检测减小累积误差[19]。在基于图优化的VSLAM中,由闭环检测带来的额外约束,可以使优化算法得到一致性更强的结果,明显提升运动平台的定位度。2015 年以来,多国研究人员将微惯性导航组合引入传感器信息源,通过三维地图创建获取了丰富的真实环境信息,在此基础上提取了可服务于无人平台路径规划的可通行区域;并采用基于分支限界(branch and bound search,BBS)的旋转直方图匹配(rotated histogram matching,RHM)——迭代最近邻匹配算法(iterative closest points algorithm,ICP)实现了三维野外环境下实时的闭环检测[20];利用IMU添加动力学约束,通过用稀疏位姿调整(sparse pose adjustment,SPA)算法对平台6 自由度全局位姿进行优化;全局位姿优化使无人平台在卫星导航信号较弱甚至丢失时,也可以获得精确的位姿信息。IMU 能够获得传感器本体的三轴角速度和线加速度信息,具有不受外界环境影响的优势,但测量数据会随时间发生漂移。因此,视觉和惯性器件获取的信息具有很强的互补性,可以提高SLAM 的鲁棒性。
面向单目标的VSLAM 技术已相对成熟,但其误差会随着算法的运行时间和累积里程的增加而增加。针对军事背景下的多维度环境建图,单个无人平台构建地图的精度还会受到外界干扰的影响,或者出现突发故障而无法继续完成既定任务,导致建图失败。为了提升协同感知效率和建图精确度,解决多源多模态数据融合等问题,引入分布式协同VSLAM 策略,促使无人车、无人机和仿生机器人等多智能体之间相互协作,将来源不同坐标系的数据融合为全局一致的三维空间信息。各个无人平台运行单目标VSLAM,遍历自己的整个区域,完成地图构建与信息采集。前端完成VO 估计和建图,后端通过闭环检测优化前端数据,同时把接收并优化后的位姿数据、地图信息与其他无人平台相交互,共享并融合地图,使自身获取更多对环境的感知信息,完成对自身位姿的调整与地图的实时更新。进而基于多无人平台的协同感知,构建多目标协同的回环约束,进行整体性的优化处理,从而得到融合后全局一致的VSLAM 结果。
2.4 军用无人运动平台技术发展
当前无人平台能够自主运动,但仍存在诸多问题[21],为实现编组作战的指挥与控制智能化[22-23],它还需要学会如何理解更多的东西,以及更好地规划自己的行动。例如当遇到岔路口时,要学会如何选择更平稳快捷的道路;当发现自己陷入死胡同时,就教会它退回并重新寻找替代路线。未来,无人运动平台将学习模仿人的战术行为,如出现敌人时快跑或躲避;如果其他运动平台出现故障时,它必须学会请求援助。这就需要研究无人运动平台的神经系统,以便能够利用以前获取的经验,达到真正的自主学习。这里将军用无人运动平台今后的研究重点归结为:
1)探索具有协同认知能力的新型传感器[24]。目前的传感技术主要是通过使用大量传感器来提高数据采集能力。然而,如何从读取的海量数据中获取有效的高价值数据,以此提升传感器感知和信息处理的智能化程度,并实现多个平台体之间的协同通信是面临的主要挑战之一。随着类人工智能、全面互联、云计算、边缘计算等技术的发展,构建拥有模拟自认知机制的新型传感器微系统,将为智能传感系统打开新的篇章。
2)优化不同环境下组合导航定位系统的切换方案[25]。目前的无人平台技术对导航系统的可靠性要求越来越高。在集中式和分散式信息融合中,高维矩阵运算非常复杂,一旦某一个导航设备出现故障,整个系统就会受到干扰,滤波就会发散,这就需要开发适用于未知环境的智能化分布式滤波器。鉴于无人系统中惯性器件和相机传感器组成的导航模块所存在的优缺点,开发提升BDS、INS、VO、SLAM 和VSLAM 等各定位子系统的协作能力,设计一种基于导航切换策略的集成容错系统成为必要,以提高导航系统的智能化和可视化程度,更有效地实现对多目标的协同观测和自身的导航定位。
3)研究基于深度学习和人机混合智能的多车定位控制方法[26]。现有的机器学习方法是建立在内存理论的基础上,无法同时进行多个算法的处理。这种情况限制了无人平台的学习能力,并使其难以在复杂多变的环境中保持更新迭代。因此,需要借鉴认知计算、人工智能、信息融合等技术,充分利用传感数据和交互设备,开发下一代发现理论与交互模型,以保持持续的学习能力,精确反映目标对象的模式,提高预测和决策能力。针对某种控制方法的限制因素,采用分布式和并行计算的方式进行分治策略的实施,可以规避掉噪音数据和冗余干扰,同时提高学习算法的运行效率和控制方法的实用价值。
4)借鉴引入多智能体智能算法[27]。从之前的描述可知,未来战争需要设计更加适应于军事领域的人工智能算法。如何在非结构未知环境中将数据驱动与知识驱动有机高效结合,来效仿人类的认知过程和逻辑思考能力,实时高效地执行任务算法具有极大挑战。与传统的优化算法相比,多智能体智能算法具有实时学习能力,使得目标之间通讯更频繁,便于群体之间的信息更新,从而加快算法的收敛速度,加强对未知状况的适应能力,更好地优化无人平台在实战中的反馈机制,找到最优方案。
3 结论
本文阐述了国内外军用无人运动平台的研究现状,总结并分析了无人运动平台涉及的关键技术:信息获取的协同感知技术,信息处理的分布式滤波技术和信息使用的协同SLAM 技术,对无迹滤波法、导航定位法和环境建图法进行重点阐述。进一步指出了现有军用无人平台在协同状态观测和智能认知技术中存在的问题,明确了未来军用无人运动平台分布式技术将呈现出智能化、集成化、创新化的发展特点。当前世界军事力量随着科技的发展不断升级换代,现代化战争的信息化程度不断提高,高智能化特征也日益凸显,作为应对未来高科技作战的无人运动平台需要持续进行技术更新。