APP下载

足式越野机器人集群系统关键技术与应用展望

2023-10-07许威苏波江磊闫曈许鹏王志瑞邱天奇

兵工学报 2023年9期
关键词:越野集群群体

许威, 苏波*, 江磊, 闫曈, 许鹏, 王志瑞, 邱天奇

(1.中国北方车辆研究所 无人中心, 北京 100072; 2.中兵智能创新研究院有限公司, 北京 100072;3.群体协同与自主实验室, 北京 100072)

0 引言

足式越野机器人集群是指能够在复杂地形环境下协同移动作业的自主系统,它是山地、丛林等复杂环境作战和污染、废墟等复杂场景救援的重要装备,在军民领域有着紧迫的应用需求,其基础理论和关键技术既是当前学术领域研究的重点和热点,也属于面向国家重大需求的经济社会发展和国防建设所需要解决的短板和弱项。

集群协同攻防是陆战场典型的作战样式(见图1)。现代战争正在由传统的大规模集群遭遇战向小规模集群夺控战和袭扰战转变,战场环境也由原来的野外开阔阵地向山地、丛林、城市废墟等恶劣环境转变,传统轮、履式战车的编队集群在上述环境中行动受限、协同不畅,难以发挥群体攻击的优势,因此对高机动足式越野机器人战斗集群的需求迫切;在民用领域,自然灾害和恐怖事件的现场充斥着废墟和危险,普通车辆难以深度介入,人员随时面临二次损伤和被攻击的威胁,进而造成救援不及时和救援人员伤亡事件,因此急需能够越过废墟或在野外极端地形下开展探测危险物品、搜寻遇难人员的足式越野机器人,并通过多机器人协作实施营救行动。

紧迫的需求带动了学术研究的热点和方向。2019—2022年,足式机器人研究多次登上Science Robotics、Nature等顶级期刊,并被选为封面文章;谷歌学术对Swarm Robotics的引用次数呈倍率级增长,显示出足式机器人和群体协同的研究热度。将足式机器人与群体协同理论结合,集成验证能够在复杂未知环境下快速移动和高效协作的集群,可以为无人系统进入人类难以抵达的极端环境提供新思路,相关的理论研究是当今机器人领域的热点,符合国际前沿科技的发展趋势。

为进一步探索足式越野机器人集群协作的技术途径,本文从足式机器人集群协作的仿生学机理出发,以陆域复杂环境下足式机器人集群系统高机动越野运动、高效率协同感知与高智能协同作业为总体需求,深入调研并分析了国内外相关研究机构在机器人群体仿生学机理、单体足式越野机器人、集群感知与协作和集成演示与应用等方面的研究现状,提出当前足式越野机器人集群系统面临的技术挑战和科学问题,并深入剖析了亟待解决的核心关键技术,最后对足式越野机器人集群在军民领域的发展前景提出了设想和建议。

1 国内外研究现状综述

高机动足式越野机器人群体协作主要面向足式越野机器人单体与环境共融和机器人群体共融研究。足式机器人研究开始于20世纪中叶,并一直保持着热点趋势。机器人群体协作研究起步于20世纪末,被认为是有可能带来颠覆性变革的新技术而广受关注。基于上述背景,国内外研究者取得了大量的研究成果,下面分别从基于仿生学的机器人群体共融机理、群体中的单体机器人、机器人群体感知与协作技术、机器人群体集成演示与示范应用等方面介绍研究进展。

1.1 基于仿生学的群体共融机理研究

集群协同源于对动物行为的模仿,而动物的群体行为主要体现在特征抽取、协作分工和组织架构等三个方面。

在特征抽取方面,Reynolds[1]提出了Boid模型,基于靠近、对齐和避碰规则,复现出自然界中鸟类动物的集群行为;Couzin等[2]通过改变排斥区、适应区和吸引区的大小,模拟不同生物群体的运动。在协作分工方面,Ulrich等[3]通过克隆蚁群行为跟踪试验,揭示了蚁群规模与劳动分工机理;段海滨团队结合狼群的等级特性与社会组织,建立了狼群合作狩猎运动模型。上述研究主要基于社会学理论揭示了群体内的等级和分工[4]。在组织架构方面,Cassidy等[5]通过对狼群的长期实证观察和分析,指出自发形成的种群规模和构成方式是影响其猎捕攻击目标的主要因素;Ducatelle等[6]研究蚂蚁的协同导航行为,构建了自组织机器人集群,实现了复杂环境自组织路径搜索。上述研究主要基于外部任务触发建立群体自重构理论。

1.2 群体中的单体机器人研究

机器人群体由一定规模的同构或异构的、单功能或多功能的单体机器人共同组成[7],机器人主要来源有两种途径,一是根据群体的需要新研制的特定机器人;二是在已有单体机器人的基础上优化改进的机器人。足式机器人群体适应复杂环境的基础条件是单体机器人的高机动性、强鲁棒性和智能性,当前研究的重点包括新型腿足/躯干机构与结构、高效驱动与控制、敏捷步态与行为控制等。

在腿足结构方面,以美国波士顿动力公司的Bigdog四足机器人为代表,意大利技术研究院的HyQ、瑞士苏黎世联邦理工大学(ETH)的ANYmal、中国北方车辆研究所的“大狗”(见图2)和“牦牛”(见图3)、山东大学的Scalf、宇树科技公司的B1、云深处科技公司的“绝影”等一系列四足仿生机器人[8-12],基于犬类原型的串联式腿足机构研制了12自由度或16自由度四足机器人,实现了自然路面的稳定行走;日本早稻田大学的WL-X、上海交通大学的“章鱼”[13]等足式机器人,采用并联式腿足机构,实现了高承载行走。上述机器人均采用整体式刚性机身加对称分布的腿足构型,适合低速行走。为了提高机器人的行走速度和敏捷性,国内外学者开展了仿生躯干的探索:美国麻省理工学院(MIT)在Cheetah1四足机器人上实现了柔性躯干,为高速奔跑提供了爆发式的能量,但柔性结构降低了机器人的稳定性和承载力[14];美国波士顿动力公司在Cheetah和WildCat机器人上实现了多连杆躯干,通过主动驱动连杆释放能量,平坦路面的奔跑速度达到25 km/h,但连杆机构与动物躯干的生理结构差别较大,柔顺度欠缺。上述研究通过能量释放提升了奔跑速度,但奔跑时稳定性和灵活性受到了机构制约,易发生摔倒和碰撞。因此,如何实现高速越野奔跑的腿足与躯干机构,并解决其爆发性、稳定性和敏捷性协调问题,是目前亟待解决的问题。

图3 央视四足机器人专题报道

在驱动与控制方面,美国波士顿动力公司的Bigdog、LS3、Wildcat,意大利理工学院的HyQ,中国北方车辆研究所的“Runner”,山东大学的Scalf等机器人采用液压驱动方式[15-16],具有响应快、爆发力强的优点,但存在系统复杂、效率低、噪音大的问题。针对液压驱动的问题,瑞士ETH的ANYmal、美国波士顿动力公司的SpotMini、美国MIT的Cheetah、中国北方车辆研究所的“警犬”(见图4)、宇树科技公司的B1、云深处科技公司的“绝影”等机器人采用电机驱动方式,实现了低噪音、轻量化腿部机构,但由于电机功率密度和扭矩不足,动态响应能力和爆发力不足,仅在轻小型机器人上应用,且越野速度不高。为解决上述问题,机器人领域提出了大扭矩、高功率密度空心电机和驱动的需求[10,17],但目前尚未形成有效的应用成果。因此,高爆发力的躯干与大扭矩的驱动机构,以及该类机构与其他机构的一体化融合问题,是当前高机动足式越野机器人关注的重点问题。

图4 Panda5 四足仿生机器人

在步态与行为控制方面,美国MIT提出了基于动力学模型的全身控制算法,在Cheetah四足机器人上应用[18],实现了自主移动中的轨迹优化与稳定平衡结合,但复杂地形下高速奔跑时鲁棒性不足;英国爱丁堡大学与浙江大学联合提出了基于深度强化学习的多专家体系结构控制方法,实现了未知环境下足式机器人的自主行走控制[19];瑞士ETH提出了无模型的强化学习方法,在ANYmal四足机器人上得到应用[20-21],实现了复杂地形的自适应行走。但上述研究限于低速行走的稳定性,在高速奔跑时容易失稳和碰撞。因此,面向任务信息链和行为特征链关联的奔跑和变速行为步态,是足式机器人高速奔跑亟待解决的问题。

根据群体需要研制特定机器人具有较好的针对性和集群特征,因此得到广泛关注。Wei等[22]针对群体移动作业需求研究一种Sambot机器人,通过重构和重组集群实现了蠕动、滚动等多种移动方式。Dorigo等[23]针对非结构环境的群体移动任务,研究了一种swarm-bot机器人,可通过履带机构组合链式形态,从而跨越壕沟。上述研究主要通过群体重构方式提升机器人的移动能力。更多的群体机器人是在已有的单体机器人基础上进行优化改进。Jdeed等[24]针对群体机器人实验需求改进了一款小型六足机器人,使其可以协同移动。Howard等[25]针对建筑物内测绘需求,研究了一款轮式机器人,实现了资源以及成本的有效分配和利用。由于多数群体机器人多处于实验室研究、算法验证阶段,使用环境单一,需求量大,基于低成本轮式小车底盘进行改进依旧为群体机器人的主要形式,难以满足开放越野环境下的集群作业需求。

1.3 群体感知与协作技术研究

机器人群体在未知开放动态环境下协同作业,既需要感知环境及任务态势,还需要解决系统及环境不确定性情况下群体全局状态空间和操作空间的时变问题。为此,国内外学者分别从协同环境及任务态势感知、群体智能协作等方面展开研究,并取得一批有价值的研究成果。

在协同环境及任务态势感知方面,Zhu等[26]提出了异构机器人的空间型分布式感知-跟踪算法,实现了机器人先验知识与交互信息的融合建模;Papaioannou等[27]研究了不完全信息条件下多机器人协同定位问题,实现了干扰场景下的环境建模;Sung等[28]研究了多机联合感知和自动分组问题,建立了集群变结构时的环境建模方法。Franchi等[29]提出了应用估计滤波的分布式算法,实现了未知载荷惯性参数的感知。Habibi等[30]提出了分布式树状算法,实现了未知载荷形心的感知测算,使机器人协同运输过程中的运动更加平稳灵活。上述研究以多源分布信息的融合为基础,解决了群体局部信息不完备情况下的环境及任务态势感知问题。

在多机器人信息融合方面,Banfi等[31]提出了基于高斯过程的信号分布模型,引导智能体在信息交互中进行数据采集;Paliotta等[32]提出了一种基于领导者-跟随者的多目标自动寻源方法,通过多机器人间的信息交互来指导整个集群系统的航向;Shorinwa等[33]基于深度图像处理技术,提出了一种可拓展的分布式滑动窗口跟踪方法,通过集群内各单体机器人减轻遮挡和通信影响;Hinostroza等[34]提出了多机器人感知融合的复杂环境下对目标的认知方法,形成更精细划分的认知结果;Xiao等[35]提出了空中-水面协同环境感知和辅助导航方法,实现了协同海上救援。上述研究以机器人间的能力差异性为基础,提出了基于多源异构传感器的信息融合办法,但未涉及本体高机动扰动和环境遮挡带来的突变性、碎片化交互信息的融合问题。

群体协同运动方面,Reynolds[36]提出了模拟鸟群协同运动的理论模型,个体遵循3个简单的规则:碰撞避免、速度匹配和向群体中心运动;Couzin等[37]进一步构建了3层规则模型,以排斥、吸引、对齐为基本相互作用,重现了鱼群的多种协同运动行为;Vicsek等[38]从统计物理的角度,提出了基于邻居间相互作用建立个体运动方向的方法,实现了自驱动粒子的一致性运动;Cucker等[39]研究了空间内群聚现象,提出通过其他单体作用调整自身速度,解决了群体内速度不统一的问题。上述研究通过构建具备群体同步规则的粒子点集群模型,实现了机器人群体的协调高效移动,但均以协同一致性为主要目标,未考虑个体之间的分工,个体之间不具备互动与协作能力。针对以上问题,Spears等[40]提出了一种基于势能和力平衡方程的物理学分析方法,建立了自然物理定律驱动的虚拟力预测模型,用于集群内大量移动物理代理的分布式预测;Soysal等[41]提出了随机有限状态机的模型,将群体机器人抽象为若干状态,通过状态转换实现机器人的聚集;Theraulaz等[42]提出了反应-阈值模型,用于随机状态机转移,实现了集群决策与任务分配。上述研究通过动力学模型与有限状态切换的方法建立集群行为规则,但动力学约束下的粒子点模型无法描述多末端机器人行为状态,清晰边界下的状态切换不适用于存在环境噪声、随机因素、信息受限的陆域环境。

在群体智能协作方面,Sung等[43]提出了基于网络认知的机器人编组协同方法,增强了群体的任务执行能力;2019年,以谷歌Deepmind团队AlphaStar[44]为代表的智能群体,通过在星际争霸中战胜人类而获得广泛关注;2020年,启元科技团队运用多智能体SCC[45]在星际争霸中击败人类全国冠军,证明了多类别大规模集群实施中心化协同控制的可行性。针对群体智能的训练和执行,Lowe等[46]提出了多智能体深度确定性策略梯度模型,实现了中心化训练、去中心化执行;Foerster等[47]提出了基于反事实的多智能体策略梯度模型,解决了多智能体信用分配问题。上述研究在数字化场景中得到了较好的验证,但由于模型对边界条件具有一定的依赖,在开放环境和物理实体应用还存在一定距离。

Kim等[48]提出了对多智能体之间通信动态特性的仿真,拉近了仿真与现实之间的差距。美国分布智能实验室Parker教授提出了运用群智激发汇聚机理的目标搜索方法,在智能群体机器人的室内搜索项目中实现了物理应用[49]。上述研究在物理系统中进行了验证,但仅解决清晰边界和设定场景下的智能体协同对抗问题,未考虑环境的对抗性,因此环境变化时泛化性欠缺,无法满足复杂开放环境的群体动态协同需求。

综上所述,当前的机器人群体协同运动研究主要基于Vicsek模型和Cucker-Smale模型实现运动方向和速度的协调,群体动力学研究主要基于虚拟力模型和随机状态机模型实现理想条件与简单任务约束下的粒子群运动规划,均未考虑机器人多点接触地面时运动学和动力学影响,缺少群体与地面之间的共融关系。上述研究适用于空中、水上和均匀材质的平台地面,难以解决开放动态环境下快速移动地面群体适应复杂地面环境的问题[50]。因此,需要针对多末端系统的行为特征建立机器人群体运动规划和动力学模型,以解决群体与地面环境之间的共融问题。在群体协同博弈与围捕方面,当前研究主要集中在特定环境边界下与围捕目标的对抗博弈,无法解决开放环境下实体智能群体的对抗问题。因此,需要将环境和目标同时作为对抗主体,建立环境与目标(对抗者)结盟的三方对抗的博弈研究,解决未知环境与动态目标的群体协作围攻问题。

1.4 群体集成演示与示范应用研究

在单体机器人技术趋于成熟和明确的群体协同作业需求下,国内外研究团队先后开展了大量空中、水面、水下集群机器人的构建和验证,并逐渐开始地面机器人集群的应用探索[51]。

在空中集群构建方面,Hauert等[52]基于蜂群特征研究了多架固定翼飞机在空旷地形的无碰撞飞行;Vásárhelyi等[53]研究了大量四旋翼无人机在受限区域内的自组织蜂拥飞行;Soria等[54]基于鸟群特征提出了模型预测控制方法,实现了无人机集群在复杂环境下的飞行;Zhou等[55]利用时空轨迹规划方法,在定位、计算条件受限的情况下,实现了无人机集群在密集丛林中的分布式穿越、队型保持、目标跟踪等任务。美国国防部高级研究计划局(DARPA)提出了“进攻性蜂群使能战术(OFFSET)”集成项目(见图5),针对蜂群战术、蜂群自治、人机组队、虚拟环境、物理实验平台等方面进行城市作战场景下的无人机与地面无人车异构蜂群系统演示示范。上述研究从实用化角度验证了空中群体构建基础理论,促进了空中群体协同技术的广泛应用,但研究主要基于空中环境特征,仅考虑了遮挡和阻拦问题,未涉及环境作用力扰动问题,难以解决地面环境下群体高机动协同问题。

图5 OFFSET想象图(Northrop Grumman)

在水域集群构建方面,研究主要集中在弱信息交互条件下的舰船编队和基于仿生鱼群的多机器人攻防。水上集群验证方面,2014年,美国海军开展了13艘水面无人艇集群协同搜索、围捕的试验,验证了人工辅助条件下分散与数据自动融合系统(DADFS)和机器人智能感知系统控制体系架构CARACaS的有效性[56];2018年,云洲智能团队进行了56艘无人艇集群协同避障等任务的演示示范[57]。在水下集群验证方面,2009年,欧盟的GREX项目验证了有限通信条件下的编队航行[58];2016年,美国海军在分布式侦察与探测的协作自主性系统CADRE协同框架下开展并验证了无人水下机器集群扫雷任务[59];2020年,哈尔滨工程大学进行了小型无人水下机器人集群的中继通信、动态组网、航行控制等试验[60],验证了分布式优化算法对降低通信影响的可行性。上述研究基于物理场景和实际任务验证了水域集群构建的基础理论,促进了群体协同技术在水面和水下环境的应用,其中水下信息不完全条件下的协同方法可以为地面群体协同提供参考,但研究主要基于水域环境特征,仅考虑了通信干扰问题,同样未涉及环境作用力扰动问题,难以解决地面环境下的群体高机动协同问题。

在地面集群构建方面,目前只有少数实验成功地演示了自治自组织机器人,而集群机器人的实践应用仍是一片空白[61],美国陆军于2017年发布了《机器人与自主系统战略》,指出无人作战系统发展的远期目标(2030—2040年)应实现多个机器人系统的组合作战。显然,当前的能力水平落后于需求:一方面,由于未解决开放环境对地面集群行为级的致命影响,大量研究成果局限在既有规则的封闭环境下运用,无法适应来自诸如地形地貌等方面的环境干扰;另一方面,空中、水域机器人集群的广泛应用和地面集群的需求,不断激发出对地面机器人集群的期待,进而产生大量的应用需求概念。上述研究动态和趋势,进一步表明开展高机动足式越野机器人集群构建和集成验证的必要性和紧迫性。

综上所述,当前空中、水上和水下机器人集群构建的基础理论已经趋于成熟,地面机器人集群构建面临复杂环境的挑战,尚处于简单环境验证或复杂环境概念研究阶段。因此,需要设计、开发和部署一个融合地面复杂环境因素的集群系统开放式验证架构,用于在虚拟环境和物理现实中进行地面集群系统的新功能验证与测试评估,以达到机器人集群与地面环境、集群内机器人之间以及人与群体之间共融的科学目标。

2 面临挑战与科学问题

2.1 面临的主要挑战

尽管当前单体足式越野机器人可以实现在特定环境下行走,但还没有足式越野机器人集群能达到在山地、密林中协同作业的能力,其主要挑战是地面复杂环境带来的地形复杂未知、信息不完全、角色动态变化。其中:

1)地形复杂未知:战场和救援环境是未知、复杂和动态变化的,影响机器人群体安全的地形信息出现在机器人前方1~2 m空间位置和1~2 s的临机时刻,难以预测,要求机器人奔跑时既快又稳,尤其不能相互碰撞,但目前这三者在时空上难以统一。

2)信息不完全:地面复杂环境普遍存在通信受阻、卫星受限、视觉遮挡等情况,足式机器人集群既缺少精确现场地图、也缺少精确的目标与本体定位,难以同指挥中心建立畅通的联系,甚至群体内交互信息也时断时续,造成单体感知信息不完全、群体态势不准确。

3)角色动态变化:地面机器人群体协同作业过程中时刻面临着环境动态变化、目标动态变化的情况,由此带来群体内角色分工与任务分配的动态变化,要求群体具备根据环境和目标变化情况实现动态角色分工和单体行为约束的能力。上述问题是制约陆域集群系统发展与应用的关键,需要从仿生学、力学、机械、信息等多角度进行探索,以获得实质性突破。

首先,在群体协作机理研究方面,当前研究主要体现在特征抽取、协作分工和组织架构单方面的成果,但动物群体协作蕴含于三者的紧密耦合之中,需要开展动态环境群体行为建模、动态角色/任务分配和不完全信息下的自组织演化机制研究,从根本上揭示动物群体共融的内在机理。

其次,目前对地面群体中的单体机器人研究较少,主要采用轮式、履带或多足方式,满足室内或平坦环境使用。尽管近年来足式机器人发展迅速,但主要面向单体机器人的应用,尚未从群体共融和应用的角度开展研究。自然界中的狼群等具有高度越野机动能力、敏捷攻击能力和较高智能的群体对单体具有特定的需求,如奔袭能力、敏捷避让等,进而影响到机器人的形态与功能。因此,具有类似功能特点的足式机器人是实现越野机器人集群的基础,开展相关研究极为重要。

再次,群体在未知环境下的灵活移动依赖于面向整个群体的环境模型,群体的精准协同作业依赖于当前任务情景态势模型及群体协作决策模型。开放动态环境下,群体快速移动并协同作业时,上述模型紧密耦合,并伴随信息的缺失和突变。该问题是越野群体共融系统感知与协同作业的难题,尽管国内外针对群体联合建模、群体联合情景感知、群体协作技术开展了大量的研究工作并取得一定成果,但目前仍未解决定位信息完全缺失的建模、快速奔袭下的群体内角色动态分配与规划调度等问题。需要基于动物群体行为机理,探索仿生感知途径、群体内部信息交互及融合机制、基于专家先验知识的多层多时间尺度群体决策方法。

最后,在现阶段集成应用方面,典型案例仅针对地面、空中、水面等简单场景进行了集群协作技术的部署与演示验证,尚未开展对不完全信息、开放环境、角色变换应用场景下的地面集群共融协作的集成演示示范研究。

2.2 科学问题

足式机器人集群在地面上面临特有的环境挑战:一是复杂的地形地貌下,群体内机器人难以获得持续精准的定位信息,特殊情况下甚至整个集群定位和通信受阻,使群体面临突出的不确定性决策问题;二是开放的作业场景中,伴有随机的人员、动物、车辆等合作或非合作动态目标,同时机器人集群自身快速奔袭带来感知和操作扰动,难以保证群体在全局状态空间和操作空间的鲁棒性和敏捷性;协作任务的持续延伸带来群体内机器人角色不断的转变,进而带来群体结构稳定性与灵活性之间的矛盾。上述问题是环境-任务-角色三元素耦合作用带来的挑战,本质上要建立一种群体内默契协同与合作的机-机共融机制,需要从心理学、社会学和能量学交叉融合角度寻求突破。

开放动态环境给足式机器人奔袭的稳定性、安全性带来极大挑战。尽管当前足式机器人研究取得了重大进展,但仍处在程式化跳跃翻腾、跌倒后自救、操作阀门等初级水平,既未实现野外复杂地形快速奔袭,也未研究多机器人奔跑中的避让与稳定问题。狼群在开放动态环境下既表现出极强的奔袭能力,又表现出敏捷的形态与行为,一是因为狼本身具有强大的柔性躯干和头/尾等平衡器官,二是因为狼在奔袭过程中可以采取变节律、变步幅方式保持高速稳定,对于仿狼群系统中的足式机器人,本质上不是形态,而是行为上具备上述能力,即需要解决机器人对环境的动态顺应问题,进而突破基于群体交互、视觉、力学感知驱动的奔袭步态和满足该步态的机构结构。

3 关键技术

3.1 足式越野机器人高机动越野技术

单体机器人的高机动越野能力是足式越野机器人集群系统的关键。足式越野机器人高机动越野技术主要是基于仿生学与地面力学理论,研究越野环境与动物机动行为之间的内在耦合关系,揭示环境与机器人结构/行为的耦合机理;研究典型环境几何与力学特征,建立地形支撑和牵引性模型;研究脊椎动物行走时骨骼结构/触地机构与地面作用关系,建立静力学耦合模型;研究脊椎动物行走规律、时空特征和能量转换方式,建立动态力学耦合模型。

在足式行走机器人构型设计方面,基于映射仿生方法,开展多源仿生机构之间的功能聚类、仿生机构与非仿生机构的耦合;研究多自由度仿生躯干和附着-支撑-缓冲-储能功能一体化的四关节仿生腿足构型,并进行运动学、动力学优化迭代。

在足式行走步态与动态稳定、柔顺控制方面,研究基于地形环境感知和地面力学信息的大闭环稳定与柔顺控制,建立包含地形理解与行为步态的大闭环行为步态节律控制模型;基于欠驱动控制原理和模型预测与优化控制思想,建立多接触点支撑的力分配模型,优化复杂地形行走效率;基于模糊聚类的行为辨识,建立多步态自主切换模型。

在传统研究方法的基础上,借助当前蓬勃发展的强化学习技术,可以有效提高足式机器人的越野能力。基于模型的步态规划要求对机器人行走过程中的每个细节进行详细描述,机器人行走的实际效果对模型的精确度要求高,设计高可靠的在线修正控制算法十分复杂。当前,在机器人领域很多任务可以使用强化学习的框架进行描述。将深度强化学习应用到四足机器人的运动控制上,一项重要的工作就是训练环境的设计,其中包含机器人状态空间、动作空间和奖励函数的设计,这项工作往往需要根据具体学习的任务目标制定。在训练过程中策略网络是不断更新的,更新的过程也就是深度强化学习算法训练运动控制器的过程。当前存在的一个普遍问题就是从仿真环境移植到物理平台极其困难。需要在仿真环境中导入更精准的机器人动力学模型;同时,由于足式机器人是一个典型的欠驱动复杂动力学系统,现有的足地接触动力学仿真环境很难模拟真实环境中的机械足与复杂陆域地面环境的各种力学接触特性,需要在仿真环境中引入大量精确的足壤力学模型,减小与物理平台的误差,同时加入一些其他未知干扰量,增强系统的鲁棒性。

3.2 群体自组织机理与集群协作决策控制技术

地面集群中个体行为的独立性与组织机制变化时刻受到地面环境因素的影响与制约。需要以地面仿生集群自组织行为为研究对象,重点围绕群体协作奔袭、狩猎等典型场景,研究群体在角色分工、个体自治行为,以及复杂环境中自组织自重构机理。通过群体协作行为特征提取与数学表征,构建群体感知、奔袭、围攻等典型行为模型;开展群体角色分配/分工机制研究,解析动物群体等级特性及演化机制,建立群体柔性角色分工模型;构建群体中的智能单体自治行为模型,建立满足群体协作行为需求的智能单体行为库;揭示群体自组织自重构机理,研究复杂动态环境中的生物群体自组织自重构能力构建机制,形成群体自组织自重构策略模型。

战场环境下集群系统多任务决策规划控制技术是足式越野机器人集群系统关键技术的核心[62]。集群融合态势感知能够对未知环境形成更大范围的态势理解,依靠可靠的集群通信网络,或者在通信不畅条件下基于视觉传感形成相对位置判断,根据战场任务完成对足式集群的决策规划与统筹控制。研究基于知识引导和数据驱动的对手决策建模方法,实现任务级指令的实时动态规划;建立基于融合规划调度与深度强化学习自主执行的分层决策框架,完成分层智能体的群体智能自主决策训练;探讨复杂对抗条件下面向人机交互指令的结构化指令搜索优化问题,实现结构化指令搜索优化;形成基于反事实推理的决策指令策略持续演进方法,实现群体智能体在任务决策指令间的实时调度;研究面向场景窗口的强化学习的群体决策执行方法,以提升群体智能策略的鲁棒性和适应性。

3.3 群体协同态势感知技术

群体在开放动态环境下的态势感知与情境认知是群体智能产生的前提,陆域集群系统区别于空域、水域集群系统的特征之一,是更加突出了群体分布对未知环境的主动适应性。开展开放动态环境下的地图信息多维度构建与关联增强研究,实现多维地图集构建及动态优化调整;研究面向动态环境和任务的关联情境认知与行为约束的激励生成,提出基于多属性地图集的认知模型集联方法;形成面向协同感知的集群自组织机制及能力自涌现方法,增强群体之间的交互主动性和智能性;研究应对环境变化的协同感知自主演化方法与动态调控策略,提升机器人的情境认知能力。

信息不完全条件下的群体协同感知、交互与认知推理研究主要围绕足式越野机器人集群对动态目标搜寻、围捕的作业任务中机器人和目标动态遮挡、感知信息缺失的需求,按照信息感知、认知、交互、融合推理的递进方式开展。在感知方面,侧重于面向不完备感知的多源信息关联机制与群体联合建模,为认知提供基础信息;在认知方面,重点突破环境和任务启发的情景认知与行为约束机制,实现主动感知;在交互方面,重点研究基于集群自组织机制的信息交互,建立主动交互机制;在融合推理方面,重点研究基于关联语境的信息融合和认知推理,实现智能机-机协作。在群体协同态势感知领域,足式越野集群系统的研究侧重多机器人的相互关联、启发、自组织、交互和融合,通过多机器人的信息互补性解决个体机器人信息不完全的问题,实现机器人与机器人的共融。面向不完备感知的多源信息关联机制与群体联合建模,需要将多源异构感知数据统一到一个共同框架下进行一致性表征与处理,建立面向非结构化环境的多尺度多层次地图及跨层级耦合增强模块。针对复杂动态场景中的环境特征多种多样且属性变化不定的特点,则需要研究动态场景语义建模与关联理解方法和复杂情境-安全行为的关系模型。

3.4 通讯自组网与应用验证

对于足式越野机器人集群系统,从理论到实践的关键步骤在于搭建高可靠低延时的通讯网络,通信与网络既是单体足式机器人到集群系统的桥梁,也是连接前端数据采集和后端数据处理的纽带以及集群系统信息化和智能化的前置条件。

对于足式越野机器人集群系统,数据采集端的集群化仿生机器狗与显示控制端及智能识别端之间存在一定的距离,并且很可能存在障碍物的阻隔,这会导致无线电波信号产生大幅度的衰减和反射,极大地影响通信传输的质量和容量。多个机器狗组成的集群与显示控制端及智能识别端共同构建了一个无线通信网络(见图6),网络中存在测控、图像等多种业务数据,不同的业务数据对网络质量的需求不同,需要网络能够对不同业务数据进行差异化的质量保障。无线通信网络中的机器狗在工作时处于运动状态,随时可能存在新的机器狗加入网络和原有机器狗退出网络的情况,导致网络拓扑处于不稳定的变化状态,这要求无线网络具备极高的稳健性和可靠性,满足上述“动中通”的应用需求。此外,仿生机器狗属于小型化的无人机动平台,具有长续航的要求,因此安装于机器狗的通信网络载荷的质量、功率和体积均需要进行严格控制。

最后,构建基于足式越野机器人的集群系统,并在仿真及物理环境中进行开放动态场景应用验证与评估,是推动足式越野机器人集群技术加速发展的直接动力。首先需要应用基于仿生学的机构设计方法,同时集成多模信息融合感知平台,构建多型异构高机动足式越野机器人智能平台;突破基于陆域集群系统的分布式虚拟仿真总体技术,进行开放动态环境足式机器人集群仿真平台设计与开发,完成集群协同感知与协作控制策略的仿真验证;突破集成智能行为控制、集群态势感知、智能协作控制核心算法,构建与验证集群系统控制体系架构;在通信方面,设计开发分布式实时通讯平台,构建可拓扑重构的集群通讯网络;面向典型地面集群场景应用目标,构建开放动态物理环境,开展足式越野机器人集群系统的应用验证。

4 应用展望与发展建议

在军事领域,集群协同攻防是陆域战场的典型作战样式。高机动足式越野机器人集群作战将会对未来陆域作战模式变革起到重大的推动作用,主要表现在以下三方面:

一是未来战争必然是以军用越野机器人士兵为杀手锏的智能化战争,战斗机器人的加入明显是一个时代变换的里程碑标志物(见图7)。双方军事力量的对抗将不仅是人类,而是大量的无人机器。足式越野机器人集群在陆域战场的高机动适应能力、灵巧作业能力和信息获取能力更强。同时,军用机器人集群作战取代有人作战的意义很大一部分是降低士兵死亡率,能够有效对敌军进行巨大的心理威慑。

图7 四足机器人发展概况

二是推动群体智能理论的创新式发展,为未来多域无人系统集群提供技术支撑,随着足式越野机器人应用领域的扩展及需求的日益复杂,机器人集群系统实现了在动态乃至未知环境中执行任务(见图8)。单一足式机器人系统受体积、质量、载荷以及处理能力等方面的约束,难以独立应对复杂的任务需求。而机器人协同作战有效解决了单个机器人作业时载荷相对较小、信息感知处理能力相对较弱的问题。当然,这都离不开群体智能理论和共性关键技术的持续攻关。

图8 四足机器人群体协同技术

三是足式机器人集群研究必将极大地推进人工智能在军事战场的应用落地。陆域机器人集群智能协同是人工智能+陆域无人系统深度融合发展的一项基础性创新性技术(见图9)。应用人工智能技术,在足式机器人集群协同技术的信息共享、协同感知、协同决策、认知协同等基础理论算法方面展开系统深入的研究。

图9 人工智能技术与四足机器人技术融合

在民用领域,足式机器人集群系统可以大量应用在地下空间探索、灾害场景救援等复杂的陆域环境。通过搭建多角色/多场景/多任务的集群协作集成示范环境,按照多维度综合评估体系,进行面向应用场景的集群系统综合测试评估,验证足式机器人集群系统在复杂开放场景下的集群协作能力。

5 结论

本文针对足式机器人集群在陆域场景上面临的环境-任务-角色耦合动态变化挑战,围绕解决机器人群体默契协同与合作和开放动态环境顺应性的科学问题,立足地面仿生集群共融机理,从机构学、力学、控制学和信息学多学科交叉研究的方法入手,提出了开展足式越野机器人群体共融基础研究与集群构建的关键技术和解决途径。

本文工作为陆域集群系统协同作业提供了一个可供参考的总体研究思路。陆域集群系统是一个与地面环境强相关的动态复杂大系统,在前期设计计算、集群仿真环境的搭建与验证是一个十分重要的研究方向。限于篇幅,本文未对此部分内容详细展开。下一步工作的重点是开展基于陆域环境的集群系统仿真与测试评估等基础内容研究,以期为集群协同感知与规划算法开发提供支撑。

猜你喜欢

越野集群群体
北京越野BJ60
通过自然感染获得群体免疫有多可怕
海上小型无人机集群的反制装备需求与应对之策研究
“群体失语”需要警惕——“为官不言”也是腐败
北汽越野独立
一种无人机集群发射回收装置的控制系统设计
定向越野
Python与Spark集群在收费数据分析中的应用
勤快又呆萌的集群机器人
BRP独行侠 换装越野