APP下载

移动机器人跨域跃质关键技术综述

2023-10-07苏波江磊刘宇飞邢伯阳李泳耀谭森起王志瑞

兵工学报 2023年9期
关键词:跨域移动机器人介质

苏波, 江磊, 刘宇飞*, 邢伯阳, 李泳耀, 谭森起, 王志瑞

(1.中国北方车辆研究所 无人中心, 北京 100072; 2.中兵智能创新研究院有限公司, 北京 100072;3.群体协同与自主实验室, 北京 100072)

0 引言

近年来,人类探索陆、海、空、天等领域的脚步从未停止,新域新质力量是被寄予厚望的“游戏规则改变者”。移动机器人在高度非结构化环境中的应用,例如进行多地形观测、多介质作业、多环境探查等,对其跨域跃质能力有着广泛的潜在需求。移动机器人的跨域跃质能力即在多域-多介质环境下的移动能力,使移动机器人在复杂多域环境下保持高通过性和高机动行为,是其跨域跃质能力的综合体现。目前,移动机器人在跨域机动能力方面存在诸多挑战,亟需进一步提升机器人在多域环境中执行任务的能力。

近年来,祝融号火星车、玉兔号月球车正行驶在广阔无垠的深空环境;软体机器人深入到海底 10 km 的马里亚纳海沟;扑翼仿生飞鸟一次次突破飞行续航极限;仿生四足机器人像牦牛一样爬上5 km海拔的高原环境;还有更多的机器人与自主系统走向更广的陆面、更高的蓝天、更远的深空、更深的海底,在探索新域新质的路上发挥着越来越重要的作用。

在深空勘探方面,Ling等[1]研究了玉兔号对嫦娥三号着陆点附近的地质勘探情况,发现了一种新型岩石;Balaram等[2]开发了一架用于火星飞行的小型直升机,该机质量约850 g,预期被用于携带或取回小型样品以及对目的地的侦察。在海域场景中,Picardi等[3]受海洋底栖动物启发,研制了一种名为SILVER2的水下仿生足式机器人,该机器人可以穿越海底的不规则地形,能够做到精确定位,在低环境干扰下运行,并且低噪声、低能耗,可以在 0.5~12 m深度范围内的真实海情条件下完成任务。Li等[4]受深海狮子鱼结构的启发,开发了一种用于深海勘探的无缆软体机器人,该机器人的拍动鳍所用的介电弹性体材料经过精心设计,使机器人能够在马里亚纳海沟10 900 m深的实地测试中成功启动,并在南中国海3 224 m深的海域自由游泳。An等[5]设计了一种仿生父子水下机器人(FURS),用于水下目标物体的图像采集与识别,球形水下机器人作为FURS的父级水下机器人,具有较强的动平衡能力和良好的机动性,能够实现快速接近目标区域,并对目标物体进行巡航和环绕,子水下机器人具有多自由度,实现了游泳和步行两种运动模式,该子水下机器人可以向水下目标物体移动,安装视觉系统,使FURS能够在摄像机的帮助下获取目标物体的图像信息,并能够识别目标物体。

在空域场景中,Ajanic等[6]通过观察苍鹰在捕食与巡航时不同的飞行姿态,设计了一种可折叠机翼与尾翼的无人机,通过改变不同的飞行姿态来更好地应对多种复杂场景;Phan等[7]通过研究双叉犀金龟在飞行碰撞中的多种生物力学策略,设计了一种通过使用被动折叠翼来使悬停扑翼机器人在碰撞后快速恢复飞行的方案,为解决碰撞问题提供了一种有效的方法;Helps等[8]设计了一种高性能的静电扑翼驱动系统——液体放大拉链制动器,消除了以往必须添加在制动器和机翼之间的传动系统,大大减少了能量的损失。

面对最常见且复杂多变的地面介质时,Baines等[9]设计了一种使机器人能够重新配置身体形态(体型)和相应地调整它们的行为策略,以便其能够在不同环境中运动;Galati等[10]介绍了一种用于工业应用的机器人设计和测试方法,由于使用了麦克纳姆轮,该机器人具有全方位性;Ruppert等[11]设计了一个机器人Morti,它有被动弹性腿,实现了灵活的运动性能,减少了控制工作量和能源效率;Shin等[12]开发了基于三轮的爬楼梯机器人,并设计了5个尾部机制用于解决基于三轮的爬楼梯机器人的局限性;Ze等[13]设计了一种具有平面内收缩的磁驱动小型折纸爬行器,收缩机制通过由两个具有两级对称性的Kresling偶极子组成的四单元Kresling折纸组件实现,该磁性折纸爬行器可以作为一种微创设备用于生物医学应用。

本文介绍基于上述场景和研究的机器人跨域跃质最新进展,沿着科学目标、基础理论、关键技术、应用展望构成全文的组织结构,同时综述与跨域跃质移动机器人相关的代表研究成果。当前机器人跨域跃质的特点主要表现在:1)机器人的移动性能显著依赖于其同接触介质之间的能量交换关系,特别是对轮式、履带式、足式、飞行、游泳、飞跃等类型机器人有着明显的影响;2)机器人的控制性能受到来自于复杂时空扰动而带来的稳定性影响,稳定性能越好其控制性能越佳;3)机器人的智能化水平显著依赖于Boyd循环(观察-调整-决策-行动,即OODA)理论,且机器人能够通过大量OODA的循环迭代获得经验,并实现一定程度上的技能涌现。

对上述问题的进一步延伸,或阐明其背后科学问题、基础理论和重大关键技术,有利于体系化地优化和改进现有移动机器人,可以对移动机器人学科重点解决多域-多介质机器人既有机动性和作业智能性问题提出建议,形成原创性和颠覆性机器人概念,进而为加速无人智能化力量提供理论和实践指引。

1 跨域技术发展现状

陆域的介质包括硬质/松软表层路面,轮/履/足与土壤的相互作用力关系是研究移动机器人越野性的基础。地面力学理论于1913年第一次提出,用模型评估地面沉陷量与垂直载荷之间的关系,从而促进提升轮/履/足机构的地形通过能力。陆域移动机器人通常包括轮式机器人[14]、履带机器人[15-16]、轮-履机器人、足式机器人[17]以及地下空间的仿生蛇[18]等。基于地面力学的认知,陆域越野环境对机器人存在以下3个挑战:1)三维表面、种类繁多的障碍物类别;2)有限的地图数据和不精确的定位信息;3)没有明确的道路网络或共驾规则。

稀薄的大气和常年的风化作用使星球表面土壤呈现沙质化,由于星球的重力加速度低于地球的重力加速度,使得星球表面土壤呈现松软的特质,与地球陆域相比在介质上也有所不同。玉兔号星球车[19]已经在月球远侧的恶劣地外环境下展开了地质探测,在月面风化、陨石坑、岩石硬/软质突变的环境下,克服了月面环境下的土壤凝聚力突变、承载力不均、月面轮-地打滑等,高效地完成了对月球背面环境的理解。星球车的深空探测也是天域的典型代表。

空域的介质同样会带来机构和介质相互作用的问题,仿生扑翼飞行器囊括了面向飞行的柔性机翼和折翼理念,获得更加高效的飞行效能[20];旋翼飞行机器人可以在高度混乱的野外环境中避开障碍,集群飞行[21]穿过低矮的灌木、倾斜的竹竿、起伏的地面、稠密的树枝,依靠的是飞行机器人与低空介质之间的交互作用。深海极端压力、浪涌等介质条件的影响同样导致机器人性能的跃变,深海狮子鱼“头部骨骼分散融合在软组织中”的生理特征揭示了深海极端压力条件下软机器人功能器件破坏及驱动失效的内在机制[22],而实现10 km以下的低温、高压海底深潜和驱动,依靠的是软体机器人与海底介质间的交互作用。同理,在外太空和大气层内运行的飞行器面临的天/空介质约束,并通过有效的转变实现跨域飞行。

如图1所示,研究跨域和跨介质移动技术的实际价值在于:1)未来机器人是在多样化的介质中并存、并用、并行,通过自身多维度、多介质融合,实现广域的完备性,该特征越显著,机器人与人的能力越接近;2)陆、海、空、天各物理介质与移动机器人之间的作用关系存在共性机理,融合研究有助于促进某个单一物理域问题的快速解决;3)信息域、电磁域和认知域对各物理域移动机器人影响具有共存和趋同的特点,未来必将开展整体性融合研究,主要涉及机器人跨域跃质自主作业、机器人跨域跃质协同作业两方面。

图1 跨域跃质机器人

1.1 机器人跨域跃质自主作业

目前,国内外对机器人跨域跃质自主作业的研究尚处于初始探索阶段,主要涉及水空跨域机器人、水陆两栖机器人、陆空跨域机器人等,如图1所示。水空跨域机器人兼具水下航行高隐蔽性和空中飞行高机动性的特点[23],逐渐成为新的研究热点。例如,Li等[24]受鱼吸盘形态启发,开发一种空中-水上搭便车的机器人,可在粗糙、不完整的空中或水下物体表面快速附着和脱离,跨越空气-水边界的时间为0.35 s,并以最小振荡实现长时间附着。水空跨域机器人的跨域方式通常可分为直接跨域式和分步跨域式,前者通过机器人俯冲或滑行在水面降落入水,并以喷射方式获取动能而脱离水面,后者以旋翼构型机器人方式实现水面起飞和降落,并通过浮力调节等方式实现水空之间的跨域作业。水陆两栖机器人拥有陆上、水下作业能力,可广泛应用于各类高风险任务,如海底采样、污染探测等[25]。目前,水陆两栖机器人在水中的主要推进方式包括平板浆推进、仿鱼鳍推进、波动推进等,陆地上的推进方式主要有腿式推进、轮腿复合推进、蛇形蜿蜒推进、球形推进等,例如,Karakasiliotis等[26]设计一种仿生蝾螈两栖机器人PleuRobot,可实现游泳、爬行和走路等功能。受陆生和水生龟的启发,Baines等[27]通过“形态自适应”设计一种可在多栖环境中运动的机器人,该机器人通过改变四肢形状、刚度和行为来适应不同的环境。陆空跨域机器人具备灵活的机动能力,越来越多的国家将陆空机器人应用到军事侦察方面。由于在侦查过程中很难对机器人进行跟踪控制,对机器人的自主运行能力提出了挑战。为了更好地发挥陆空机器人的跨域越障特性,王建中等[28]针对变结构陆空机器人平台,提出一种基于深度图像检测的自主跨域越障策略。此外,为了提高机器人的续航能力,平台工作时以地面模式为主、空中机动为辅。

1.2 机器人跨域跃质协同作业

在美国的MARS2020项目中,实现了空地跨域协同作战的雏形。如图2(a)所示,该项目首先利用空中无人系统(无人机)对目标区域进行探寻,在发现预期的目标坐标之后,将定位信息、目标周围环境信息等相关数据发送到地面控制中心。地面控制中心在确认信息后将信息发送至地面无人系统,最终由地面无人系统进行精细的目标探测、目标锁定等任务[29]。

图2 国内外跨域协同研究项目

此外,空地跨域协同还可以应用于灾难救援领域。例如,欧洲的SHERPA项目利用地面和空中无人平台系统实现协同救援。首先,可以利用空中无人平台的机动性,在最短的时间内发现需要被营救的目标(登山失踪人员和雪崩掩埋人员等)。随后,派出负载能力及可操作能力更强的地面无人平台进行挖掘和救援等具体任务,如图2(b)[30]所示。

研究人员还将空地跨域协同拓展到环境监测领域。例如,葡萄牙的ROBOSAMPLER项目,利用地面和空中无人平台系统实现了对人类难以到达环境的样本采集和指标监测。如图2(c)所示,在实际应用中,首先利用空中无人平台系统对目标区域进行探测扫描,在发现待采集样本后由地面无人系统进行样本的精确采集和运输[31]。

近年来,随着全球化进程的不断加速,海洋安全得到重视。欧盟提出OCEAN2020无人海上态势感知项目。该项目旨在广阔海域上实现实时目标监测,包括可预见的军事目标,以方便提前下达部署拦截任务并展开相应的干预措施。在具体的实施过程中,首先利用空中无人平台系统对大范围海域进行监测,当发现敌情时调动更多的海上防御力量进行有效应对[32]。

国内目前也已开展了一些空地跨域协同项目。例如,中国科学院沈阳自动化研究所针对群众活动的安全保障提出系列解决方案,其主要分为事前勘测、事中巡逻、异常监测等实施步骤。如图2(d)所示,首先,采用固定翼和多旋翼空中无人平台系统对空间环境进行重新建模,从3D空间对现场实现全方位的理解,为指挥提供便利。随后利用无人车赶往现场进行操作处理、拦截阻击等具体任务[33]。

2 科学目标与技术体系

从新质新域出发,机器人在全域介质中的行动能力,其科学目标就是“快”和“远”。“快”是指移动机器人要实现越来越快的机动速度,因此快速机动是移动机器人的一个重要科学目标;“远”是指超越极限、跨越介质、真正实现移动机器人跨域跃质的无所不至,这也是跨域机器人研究的另一个科学目标。

综上,跨域跃质的移动机器人研究主要面向以下三类共同的基础性科学问题。

1)能量域:支撑与牵引问题

在能量域下,其关键问题是如何将动力系统的能量通过支撑、摩擦、形变和剪切转化为牵引力,因此关于机器人与新材料、新原理、增材制造、地面力学、接触面结构设计、刚-柔-软耦合机构设计等成为该方向的关键技术。

2)时空域:速度与稳定问题

在时空域下,移动机器人面临着异常复杂、大扰动或突变的环境,需要在紧密的、连续的时间和空间约束下,实现高速、高效并保持身体的基本稳定。这一问题的难点在于高维度的全身力矩模型、行为与视觉的高速反馈、行为范式与类人或仿生控制等。研究学者在这一领域的研究持续探索,期望解决诸如人类或动物的腿足式行走、飞鸟的长距离迁徙、深海的遨游等问题。

3)信息域:交互与协同问题

在信息域下,移动机器人是一种具有高动态性的移动物体,面临着机器人个体在复杂环境中的高自主适应性问题,以及在信息不完全、动态环境和角色可变条件下的机器人与机器人之间的默契协同问题。如何实现移动机器人的OODA环的学习与智能发育,是目前不同介质下移动机器人系统演进演化的重点方向。

移动机器人在能量域-时空域-信息域的耦合关系如图3所示。

图3 移动机器人跨域耦合关系

3 基础理论与关键技术

3.1 支撑与牵引技术

机器人的移动性能显著依赖于接触介质之间的能量交换关系,无论是何种介质,机器人与介质之间的能量交换方式都可抽象为支撑和牵引作用。其中,支撑作用使机器人获得空间Z轴上的力,并通常保持平衡;牵引作用使机器人获得空间X轴和Y轴上的运动能力,可实现前进、后退、静止和转向。

机器人移动行为是典型的能量按需转化问题及过程。机器人运动过程中,通过控制能量转化方向、能量转化效率、能量转化进程,使机器人完成指定行为动作。主要技术包括:1)能量-机构-动作转化与输出技术;2)驱动力传递与多点分布技术;3)机器人与介质接触作用力控制技术;4)附着与减阻控制技术;5)动态储能、释能、缓冲技术。

研究机器人与介质之间的能量交换机理,可以获得优化和改善机器人机构的方法,增加作动执行器的爆发力和顺应性,提高能量的转换效率,加快能量转换进程,使机器人能够在短时间内实现改变速度、高度(深度)等行为,进而增加对移动介质动态变化的适应能力。此外,机构优化携带可使机器人在必要的运动过程中进行自身动能与势能的相互转化,以适应不同的介质条件与运动需求,从而减少电能等能量的消耗,提升运动效率和续航历程。

研究地面域环境下的能量-机构方面,以美国波士顿动力公司的Bigdog四足机器人为代表,意大利技术研究院的HyQ、瑞士苏黎世理工大学(ETH)的ANYmal、中国北方车辆研究所的“牦牛”和“警犬”、山东大学的Scalf、宇树科技公司的B1、云深处科技公司的“绝影”等一系列四足仿生机器人[34-35],基于犬类原型的串联式腿足机构,研制了12自由度或16自由度的四足机器人,实现了自然路面的稳定行走。为了提高机器人的行走速度和敏捷性,国内外学者开展了仿生躯干的探索:美国麻省理工学院(MIT)在Cheetah四足机器人上实现了柔性躯干,为高速奔跑提供了爆发式的能量,但柔性结构降低了机器人的稳定性和承载力[36];美国波士顿动力公司在Cheetah和WildCat机器人上实现了多连杆躯干,通过主动驱动连杆释放能量,平坦路面的奔跑速度达到25 km/h,但连杆机构与动物躯干的生理结构差别较大,柔顺度欠缺。上述研究通过能量释放提升了奔跑速度,但奔跑时稳定性和灵活性受到地形和机构制约,易发生摔倒和碰撞。因此,研究地面域机器人高速越野时机器人与地面之间的时空特性,实现机器人爆发性、稳定性和敏捷性协调问题,是提升支撑与牵引技术中的关键能力。

在驱动与控制方面,地面域机器人的液压驱动具有响应快、爆发力强的优点,但存在系统复杂、效率低、噪音大的问题。针对液压驱动的问题,瑞士ETH的ANYmal、美国波士顿动力公司的SpotMini、美国MIT的Cheetah、中国北方车辆研究所的“警犬”、宇树科技公司的B1、云深处科技公司的“绝影”等机器人采用电机驱动方式,实现了低噪音、轻量化腿部机构,如图4所示,但由于电机功率密度和扭矩不足,动态响应能力和爆发力不足,仅能在轻小型机器人上应用,且越野速度不高。为解决上述问题,机器人领域提出了大扭矩、高功率密度空心电机和驱动的需求[36-37],但目前在驱动力传递方面尚未形成有效的应用成果。因此,高爆发力的躯干与大扭矩的驱动机构,以及该类机构与其他机构的一体化融合问题,是当前地面域高机动机器人关注的重点问题。

图4 Cheetah前腿的肩部模块截面图

在机器人行为控制方面,美国MIT提出了基于动力学模型的全身控制算法,在Cheetah四足机器人上开展了应用[38],实现了自主移动中的轨迹优化与稳定平衡结合,但复杂地形下高速奔跑时的鲁棒性不足;英国爱丁堡大学与浙江大学联合提出了基于深度强化学习的多专家体系结构控制方法,实现了未知环境下足式机器人的自主行走控制[39];瑞士ETH提出了无模型的强化学习方法,并在ANYmal四足机器人上应用[40-41],实现了复杂地形的自适应行走,如图5所示。上述研究虽然实现了足式移动机器人在复杂地形上的稳定行走和避障,但仅限于单一节律和步幅的行走方式,无法在高速奔跑时灵活选择步频和步幅,故仅限于低速行走的稳定性,在高速奔跑时容易失稳和碰撞,因此针对越野域机器人奔跑中的加速、制动、跳跃、躲闪等基本行为能力,亟待提高不受固定频率和步幅限制的自由行走控制能力。

图5 足式机器人复杂地形下的自适应行走

3.2 速度与稳定技术

时空域下机器人速度与稳定研究包含3个层次的问题:首先是确定时刻下解的确定性问题,即在先验的环境静态信息下,或不存在时间约束条件时最优控制量的求解问题;其次是广域时空维度下全局一致最优解的搜索问题,自然环境种类复杂多样,引入环境约束后的控制模型非常复杂,机器人既要稳定又要规避障碍物,还需要满足时间约束条件;最后是未来时间段的状态预测问题,即需要以系统的历史状态以及环境历史状态序列为基础,构建未来时间维度上的状态轨迹跟踪模型,解决高动态机动控制与扰动控制的问题。

针对移动机器人速度与稳定研究的核心问题,重点开展以下3方面研究:1)移动机器人在开放环境的局部自治控制研究,运用视觉、力觉、触觉融合的狭窄通道、非连续路径等移动机器人实时运动规划;2)开放动态环境下的增强态势感知研究,实现实施环境信息的多属性多尺度多层级构建与关联增强研究,实现多维态势构建及动态优化调整;3)基于知识引导和环境驱动的运动规划建模方法研究,实现复杂环境下长距离时空任务级指令的实时动态规划。

动态地面域环境下遮挡严重,机器人个体之间通讯困难,机器人群体只能利用自身传感器获得外部信息;在越野环境下机器人运动起伏性大、稳定需求高,更加依赖群体的协同感知、交互与融合途径。因此,国内外学者重点关注多机器人协同感知、信息交互、多源感知信息融合等方向。

图6 多机器人协同感知

Hinostroza等[45]提出了多机器人感知融合的复杂环境下对目标的认知方法,形成更精细划分的认知结果;Xiao等[46]提出了空中-水面协同环境感知和辅助导航方法,实现了协同海上救援。

当前在机器人群体协同感知、信息交互和信息融合研究领域,侧重于通过协同多源融合和组网重构等方式进行信息补偿,未涉及不完备感知的多源信息关联机制与群体联合建模、基于集群自组织机制的信息交互、环境变化的协同感知与信息关联推理等方面的研究,因此尚未解决信息缺失条件下未知情境的协同感知、交互与认知推理问题。

开放动态环境的时空变化特性,给移动机器人高速机动的稳定性、安全性带来极大挑战:尽管当前相关机器人研究取得了重大进展,但仍处在程式化的跳跃翻腾、飞行游泳等初级水平。研究机器人的时空与控制技术,其目的是为了解决机器人对环境的动态顺应问题,进而实现移动机器人个体性能强环境适应问题。

3.3 交互与协同技术

移动机器人信息与智能控制在群体协作中面临特有的挑战:一是复杂的地形地貌下,群体内机器人难以获得持续精准的定位信息,特殊的情况下(如森林、涵洞等),甚至整个集群定位和通信受阻,使群体面临突出的不确定性决策问题;二是开放的作业场景中,伴有随机的人员、动物、车辆等合作或非合作动态目标,难以保证群体在全局状态空间和操作空间的鲁棒性和敏捷性;三是协作任务的持续延伸带来群体内机器人角色的不断转变,进而带来群体结构稳定性与灵活性之间的矛盾。上述问题是“环境-任务-角色”三元素耦合作用带来的挑战,本质上要建立一种默契协同与智能合作的机制,需要从能量域、时空域和信息域学交叉融合角度寻求突破。

针对移动机器人交互与协同研究中的核心问题,重点开展:1)基于知识引导和数据驱动的对手决策建模方法研究,实现任务级指令实时动态规划;2)基于融合规划调度与深度强化学习自主执行的分层决策框架研究,完成分层智能体的群体智能自主决策训练;3)复杂对抗条件下面向人机交互指令的结构化指令搜索优化问题研究,实现结构化指令搜索优化;4)基于反事实推理的决策指令策略持续演进方法研究,实现群体智能体在任务决策指令间的实时调度;5)面向场景窗口的强化学习的群体决策执行方法研究,提升群体智能策略的鲁棒性和适应性。

李德毅院士在第九届中国指挥控制大会上用脑和认知科学将指挥与控制科学带到新高度,感知智能、行为智能和认知智能的发展带动了智能化时代的到来。如图7所示,通过对OODA环的解读,观察和行动在物理空间,判断和决策在认知空间,箭头代表时间t的螺旋,反映了时间、物理空间、认知空间之间的关系。

图7 OODA环的物理空间和认知空间关系

在认知与交互方面,李德毅院士认为应该把人脑的认知和整个脑科学适当区分开,把智能和意识区分开,做一个有感知、有认知、有行动、可交互、能训练、自生长的移动机器人,其中最重要的是研究清楚驾驶脑、驾驶认知中的OODA环。在新一代人工智能中提出感知智能、认知智能和行为智能,感知智能和认知智能也可称为交互智能,行为智能、认知智能中含有计算智能、记忆智能,高阶认知产生记忆智能和计算智能。

群体协同运动方面,Reynolds[47]提出了模拟鸟群协同运动的理论模型,该模型给出了个体遵循的3个简单规则:碰撞避免、速度匹配和向群体中心运动,如图8所示。为模拟仿真结果,Couzin等[48]进一步构建了3层规则模型,以排斥、吸引、对齐为基本相互作用重现了鱼群的多种协同运动行为;Vicsek等[49]从统计物理的角度提出了基于邻居间相互作用建立个体运动方向的方法,实现了自驱动粒子的一致性运动;Cucker等[50]研究了三维空间内群聚现象,提出通过其他单体作用调整自身速度,解决了群体内速度不统一问题。针对个体之间不具备互动与协作能力问题,Spears等[51]提出了一种基于势能和力平衡方程的物理学分析方法,建立了自然物理定律驱动的虚拟力预测模型,用于集群内大量移动物理代理的分布式预测。2019—2020年,美国谷歌Deepmind团队的AlphaStar[52],国内启元科技团队的多智能体SCC[53],先后在星际争霸比赛中战胜人类,证明了多类别大规模集群实施中心化协同控制的可行性。

图8 模拟鸟群协同运动仿真

在面向场景的群体决策智能协同与博弈方面,Lowe等[54]提出了多智能体深度确定性策略梯度模型,实现中心化训练,去中心化执行;美国宾夕法尼亚大学Jadbabaie教授提出了基于群体生物行为的群智合作与竞争等激发模式,在SWARMS项目物理系统中得到了成功应用;美国分布智能实验室Parker教授提出了运用群智激发汇聚机理的目标搜索方法,在智能群体机器人的室内搜索项目中实现了物理应用[55]。

当前的群体协同运动研究主要基于Vicsek模型和Cucker-Smale模型实现了运动方向和速度的协调,群体动力学研究主要基于虚拟力模型和随机状态机模型实现了理想条件与简单任务约束下的粒子群运动规划,均未考虑机器人多点接触地面时的运动学和动力学影响,缺少群体与地面之间的共融关系。上述研究同样适用于空中、水上和均匀介质的平台地面,难以解决开放动态环境下快速移动地面群体适应复杂地面环境的问题。因此,需要针对多末端系统的行为特征建立机器人群体运动规划和动力学模型,以解决群体与地面环境之间的共融问题。

除了上述提及的技术外,跨越能量域-时空域-信息域,以及土壤、水、空气等支承-摩擦介质的交叉融合学科也越来越受到重视,例如:1)全维态势感知与智能传感技术,提高移动机器人对地形语义、材质等细粒度特征的精确判别;2)在判断环中融合超算神经网络,用于快速、准确地判断和预测环境态势及变化,大幅度提高海量数据的搜索、存储、计算、挖掘的能力;3)在决策环中应用混合现实、脑机接口等技术,提高移动机器人在未知复杂战场环境下的自治共驾、沉浸交互能力,真正实现“人-机”智能交互,达到“化身级”自适应协同一致的能力;4)在行动环中运用智能控制技术,通过预测控制、全身动力学控制以及强化学习等新技术,提高移动机器人行为动作执行精度与自演化能力;5)基于OODA循环竞争机制实现粗粒度演进优化、细粒度迭代优化,解决目前移动机器人系统演进难、学习能力不足的问题。综上,总结移动机器人跨域跃质技术体系,如图9所示。

图9 移动机器人跨域跃质技术体系

4 跨域典型成果分析

为提升任务效能,国内涌现出很多跨域移动机器人系统。下面围绕机器人跨域跃质自主作业、机器人跨域跃质协同作业两大方面,以某单位近期开展的陆-空跨域移动机器人任务作业产生的应用效果展开介绍。

为了提升陆域城市攻防能力,开展陆-空跨域一体机器人研制,如图10所示。面向街巷纵横、高楼林立的建筑物群场景,开展集成陆域-空域一体的机器人研究,集地面行走与空中飞行功能为一体,突破跨域机器人结构设计、行走控制、四旋翼飞行控制、机器人失稳姿态控制、定位导航等关键技术,具备复杂地面机动、低空飞行与悬停以及目标搜索等性能,实现陆-空跨域机器人紧耦合机动控制,提升跨域足式机器人平台在复杂城市环境下的跨域机动能力。

图10 跨域足式机器人移动平台

针对越野非结构环境下兼容动力学差异性的跨域异构平台实时协同控制问题,如图11所示,在异构平台的协同运动分析过程中引入虚拟关节,产生虚拟作用力,对异构平台的运动状态进行约束。图11中,Oxyz为机器人关节坐标系,θx、θy、θz分别为相对于关节坐标系的角度。结合异构平台的协作模式,通过单支链串联机构的运动学/动力学分析,将地空异构平台的行为关系映射到协同状态模型构建中,构建基于动力学耦合机制的协同平台集成动力学模型,实现地空异构协同平台紧耦合越野机动控制,提升跨域异构平台在越野环境下的协同机动能力。

未来跨域机器人的方向可以分为三个方面,一是跨域空间拓展,深空探测的美国宇航局火星车和嫦娥月球车,为了保证机器人在外星球上的机动,首先需要完成很多对于月球地形、地质、土壤力学特点的分析,这样才能对在地球上设计的控制和导航策略进行针对性调整;二是群体协作,揭示多构型机器人与复杂跨域环境的共融机理和群体协作,完成变化任务的群体共融机理,推动机器人多领域、多学科“融”的研究;三是仿生/仿人机动,仿生机器人在地面力学特征多变、传感器受限、外界通信拒止极域环境中,能够进行越野环境下高速机动、灵活探索亟需突破的关键技术。在陆/空跨域介质下,未来通过对仿人机动系统的改进,实现穿戴式奔跑-飞行异构仿人装备,实现未来作战的陆-空跨域作战新质力量,同样适用于陆、天、空、海跨域融合的新质新域作战力量。

5 应用与发展展望

跨域跃质环境下的移动机器人作业,需要增加任务系统,实现机器人在不同介质环境下的推广和实用化;同时,机器人的协同应用紧迫,不同介质环境下移动机器人与人、移动机器人之间要进行协同,真正实现多域机器人在深空作业、深海探测、高原山地等环境下的应用。

多域更是越野学未来发展的重点,一是越野空间的拓展,由地面到深空其他星球表面的机器人、到地下空间行走和水底爬行的机器人,都在越野机器人基础理论上发展;二是机器人越野技术理论和成果对于其他域的机器人运动能力具有参考、借鉴和支撑作用,例如飞行:鸟既能飞又能跑,是地面越野和空中飞翔的融合;两栖龙虾、龟等既能游又能上岸跑或水底爬行,也是游和走的越野理论融合。

跨域跃质机器人是应对日益复杂环境和使命的重要技术途径和应用手段,将为无人系统的发展提供更广阔的空间,同时也为无人系统本身的发展提出了更多更高的要求,有望进一步促进无人系统本身的多样化发展。可以预见,未来一些面向跨域应用的新概念平台和技术势必大量涌现。

6 结论

本文沿着跨域跃质的陆-海-空-天机器人研究路线进行了总体阐述,归纳了跨域跃质移动机器人的支撑与牵引技术、速度与稳定技术、交互与协同技术路线,分类总结了移动机器人在多域环境的科学目标与关键技术。针对陆-空跨域典型成果的分析,介绍了跨域足式机器人及跨域异构平台在真实应用效果方面的优势。最后,展望了跨域跃质移动机器人的研究发展趋势。

通过广泛分析现阶段国内外研究现状可知,跨域跃质环境下的移动机器人作业,需要增加任务系统,实现机器人在不同介质环境下的推广和实用化;同时,机器人的协同应用紧迫,不同介质环境下,移动机器人与人、移动机器人之间要进行协同,真正实现多域机器人在深空作业、深海探测、高原山地等环境下的应用。

猜你喜欢

跨域移动机器人介质
跨域异构体系对抗联合仿真试验平台
基于多标签协同学习的跨域行人重识别
移动机器人自主动态避障方法
信息交流介质的演化与选择偏好
为群众办实事,崂山区打出“跨域通办”组合拳
G-SRv6 Policy在跨域端到端组网中的应用
淬火冷却介质在航空工业的应用
基于Twincat的移动机器人制孔系统
极坐标系下移动机器人的点镇定
基于引导角的非完整移动机器人轨迹跟踪控制