有人/无人集群任务规划系统集成框架

2023-04-24邹明胤朱晓敏包卫东刘大千

指挥与控制学报 2023年1期

邹明胤朱晓敏包卫东王吉刘大千

1.国防科技大学大数据与决策实验室湖南长沙 410073 2.军事科学院战略评估咨询中心北京 100097

近年来,在人工智能、大数据、云计算、物联网等先进技术的推动下,无人平台已经被广泛应用到物品投送、环境保护、抢险救灾、农药喷洒、灯光表演、地图测绘、侦察追踪等领域,在极大解放劳动力的同时,还能够替代人类执行枯燥、恶劣、危险的任务,正在国民经济建设和国防领域扮演着越来越重要的角色[1].

随着所承担任务的工作量和复杂性不断增加,无人平台在载荷、续航、决策等方面的负担不断加剧,逐渐暴露出任务执行能力弱、效率低、灵活性差等问题. 因受制于现有技术和成本,依靠无人平台的作业能力难以胜任不断涌现的新任务需求. 无人平台的研究在工业生产、抢险救灾等实际环境中具有时代意义. 近些年,研究者们面向多无人平台协同任务规划方法研究,依靠无人集群实现目标侦察、跟踪与围捕等实时任务规划,在实际的环境中具有广阔的应用前景. 特别是在军事领域,可以实现对入侵者的侦察、监视、打击、毁伤评估等,提高了军队各类设备的智能化程度,在安全保障方面提供了新思路、新方式.

各军事强国对无人集群任务规划能力高度重视,视之为改变未来战争制胜规则的颠覆性力量. 2018年8月,美国国防部发布了《无人系统综合路线图2017-2042》[2],提出了美国无人系统领域发展的4 大主题和19 项关键技术. 4 大主题是互用性、自主性、网络安全和人机协同. 19 项关键技术包括了机器人技术、人工智能、集群能力等. 美正在开展的代表性项目如“小精灵”项目、“进攻性蜂群使能战术”、“试验性验证网关演习”项目等均取得了突破性进展[3].2021年10月,“小精灵”项目空中回收“小精灵”无人机实验成功,迈出无人集群韧性灵活执行任务的关键一步[4]. 2021年12月,“进攻性蜂群使能战术”项目融合虚实结合技术,通过沉浸式蜂群界面对蜂群指挥控制,为有人/无人协同执行任务提供了技术支持[5]. 2022年4月,“试验性验证网关演习”完成了由30 架无人机组成的无人集群作战试验. 此次试验采用空地协同、分批发射与分布式控制的方式,依次完成侦察、防空压制、打击与毁伤评估任务. 集群作战概念由“无人机蜂群”转变成“无人机狼群”,是低成本无人机集群作战的全新作战理念[6]. 在实际战场中,2020年9月,阿塞拜疆部署由6 架异构无人机组成的无人机集群,摧毁了亚美尼亚的防空系统,导致亚美尼亚地面资产遭受大量破坏[7].

在国内,2021年11月,中国电子技术标准化研究院发布《智能无人集群系统发展白皮书》,指出智能无人集群系统的任务复杂度普遍提升,对于集群系统的智能化、鲁棒性提出了更高的功能与性能要求[8]. 2018年1月,国防科技大学智能科学学院无人机系统创新团队开展了20 余架次的无人机集群自主协同飞行试验,验证了空中集结编队、定向编队飞行和编队协同侦察等任务执行能力[9]. 2020年9月国内民营企业,成功地组织了3 051 架无人机同时集群飞行,创下了集群控制新的世界记录[10]. 这些项目在无人集群任务规划相关技术进行了大量深入的探索.

值得注意的是,目前无人平台的自主性处于“弱智能”阶段,无人集群协同感知、决策、控制能力略显不足,逐渐暴露出灵活性差、计算能力低、环境感知能力差、任务执行能力差等问题,有人系统与无人集群之间存在态势把控难、实时信息交互慢等问题.传统的无人集群在态势感知、资源整合、组织协同等信息力方面的缺陷直接制约了有人系统与无人集群协同执行任务的完成率和时效性. 与此同时,考虑在复杂环境中目标具有动态性,任务具有实时性等特点,进一步增加了执行任务的难度. 因此,如何建立智能有人/无人集群任务规划系统集成框架,有效地组织、管理无人集群,实现单无人平台自主行为规划、无人集群自主协同、有人系统与无人集群协同,具有十分重要的研究价值.

1 任务规划研究现状

近年来,在各发达国家的军事技术发展布局中,无人集群任务规划在战场物资投送[11]、战场监视[12]、协同侦察打击[13]等实际应用中的广泛性明显增加. 当前,对于无人集群任务规划的研究思路主要集中在路径规划和资源调度两方面,并开展了丰富的研究,取得了如下成果.

路径规划是无人集群完成多样化任务的重要保证. 在不断变化的新形式任务环境中,具有自主决策和优秀感知能力的无人平台才能快速高效地完成任务. 由于微型无人平台搭载的硬件设施能力有限,面对复杂多变的任务环境,无人平台由于自身侦察范围有限,往往不能有效的执行任务. 因此,需要多无人平台实时路径规划算法,来保持多无人平台的高机动性和避障功能. 为了合理制定任务方案并减少无人集群的成本,许多研究人员已经开发出有效的策略应对这一问题[14]. 李瑞阳等提出了基于列生成算法的无人机路径规划方法[15],以飞行成本最小为目标函数,充分考虑时间约束的前提下建立无人机路径规划优化模型. 该方法采用列生成算法对飞行方案进行优化选择,提高了任务的完成效率. 当面对动态任务和不确定的环境时,去中心化无人集群路径规划方法受到了广泛关注. KIM 等针对无人机编队在未知区域协同执行搜索攻击任务的路径规划问题,提出了一种分布式路径规划方法[16]. 该方法能够利用平衡资源消耗的方式有效地利用现有资源,从而通过保留更多可用的无人机以顺利应对动态任务. 经验证明该方法获得了较高的资源保障和快速攻击响应的能力. LEMAIRE 等针对多机器人系统的任务规划问题,提出了一个完全分布式的结构[17]. 为了平衡工作负载,减低系统成员间工作负荷的不均衡性,引入了一个公平系数进行调节,进而保持系统完全分布式. LUO 等提出了一种适用于异构多机器人系统的分布式任务规划算法[18]. 该算法将任务划分为若干个不相交的组,并且限定完成每组任务的机器人数量（包括在整个任务内以及在不同的任务组内）. 由于每个机器人均在任务执行中获得一定的收益,因此,该任务规划方法的目标函数是最大化群机器人总收益. 该方法通过分布式算法迭代地计算每个机器人在执行任务中的成本,从而构建群机器人的任务规划方式. LIU 等针对不确定环境下的监视问题提出了多无人机协同路径规划模型[19],以能量消耗和传输不可靠为代价,在不确定障碍区域情况下,根据实时障碍情况,建立不同的约束机制,通过调整无人机监视的位置来提高目标监视性能. ZOU 等针对未知环境下的编队问题提出了多目标优化控制框架[20].在该框架,无人机集群可以在保持编队相似,编队密度一致和快速编队的同时,自由变换队形.

然而在复杂未知环境下,上述无人集群任务规划方法未考虑目标及无人平台动态变化的情况,尤其是对无人平台资源调度的问题缺乏进一步讨论[21].资源调度是保证任务质量、提高系统资源利用率、减少系统能耗的有效手段. 由于未知环境中充满动态性、不确定性、突发性和复杂性等特征导致无人平台具有易损性,因此,如何在任务完成的前提下,最大限度的利用现有资源,是无人系统所要面对的重要问题. 此外,由于无人资源的异构性,资源模块需具有灵活的按需供给能力. 针对上述无人平台资源调度问题,近年来,许多研究者从静态资源调度和动态资源调度两个方面展开研究. 静态资源调度存在约束条件简单,目标函数单一的问题. 针对这一问题,考虑无人资源合理分配和高效运用,皇甫莹丽等提出了一种面向灾害救援的无人机资源优化配置方法[22],该方法以多目标规划和聚类技术为核心的优化策略,建立了多目标规划模型,在同时满足最大搜救和中继需求的情况下,解决无人机资源的优化配置问题. 考虑无人机负荷有限的约束,蔡伟等提出了一种对观察窗口侦察资源的协同优化调度方法[23]. 该方法通过优化当前场面下各机电子侦察的瞬时空-频域覆盖选择,提高无源定位中每个定位参数对定位结果的效用,降低获取定位参数所需要的对侦察资源的占用,从而提升无人机集群能够同时应对的目标数. 考虑最少任务约束的大规模资源调度问题,邓敏等设计成本、效益等多维指标,利用层次分析法计算指标权重,结合并行遗传模型有效求解大规模复杂资源调度问题,可以有效求解大规模复杂资源调度问题[24].针对动态资源调度问题,考虑实现应急情况下多无人机动态资源调度问题,FEI 等提出了一种基于滚动激励的异构无人机应急任务调度方法[25]. 为保证应急任务能够实时分配给无人机,该算法设计了一种基于密度峰值聚类算法的任务分组策略,能够对到达系统的任务快速选择性能匹配的无人机. 该算法在确保应急任务完成率的同时,降低多无人机的飞行成本,为应急救援,智能交通等提供可靠地算法支撑. 考虑动态资源调度的扰动因素,刘文文等设计调度收益以及最小方案变动作为目标函数,根据不同扰动因素构建不同的动态资源调度模型,结合多目标优化算法为动态资源调度提供解决方案[26]. 此外,为了提高动态资源部署的计算效率,FEI 等提出了基于数据聚类的弹性资源调度方法[27],通过任务聚类,任务量预测与动态资源调度完成资源灵活调配.

值得注意的是,由于在复杂多变的环境下,无人平台易发生损毁,系统内呈现出高度动态的特性,拓扑结构不断变化. 要实现无人集群动态、实时任务规划,不仅需要精确高效的实时规划算法,更需要系统集成技术,将无人平台、无人集群与有人系统有机地整合在一起,以发挥出体系效益. 针对上述问题,赵林等面向协同感知,任务规划与路径规划等任务,提出了分布式协同框架[28]. 该框架包含任务分解、任务调整、执行条件约束、计算规划等关键技术. 通过预先计算和任务预先分配的方式,无人集群按照既定方案执行任务. 向锦武等面向区域搜索、资源调度等任务需求,结合“感知-判断-决策-行动”（oberve-orient-decide-act,OODA）循环,建立复杂环境下无人集群自主协同系统集成框架[29]. 该框架通过高维态势感知与认知、智能决策与规划与自主协同控制三类关键技术,完成非结构化的信息协同采集、无中心的自组织任务规划与分布式强鲁邦控制. 王祥科等融合OODA 回路与集群协同的关键技术,在感知部分,应用协同观测技术；在判断部分,应用协同侦察、协同定位与建图技术；在决策部分,应用任务分配与任务规划技术；在行动部分,应用聚集、蜂拥与编队技术[30].尽管上述这些文献结合系统工程思想与OODA 循环,提出了无人集群自主任务规划系统集成框架. 然而,针对复杂环境以及有人无人协同下的任务规划问题,现如今缺少一定的系统集成框架. 因此,如何实现无人平台多功能集成,无人集群系统集成与有人/无人系统集成,仍需开展进一步研究.

2 任务规划系统模型描述

任务规划是针对已知任务和已知平台信息的优化求解过程. 常见的任务规划系统流程如图1 所示.指挥员下达命令生成任务列表,这些任务根据功能和约束分类成任务流,这些任务流经过任务调度、资源分配和路径规划最终得到任务规划方案.

无人集群任务规划是智能无人系统研究中的热点问题之一,主旨是在感知未知环境中的可能目标后,如何利用资源调度优化模型对现有可利用资源进行整合评估,以最大可能地挖掘各个无人平台的潜力,达到无人平台的合理部署,从而完成任务规划[31]. 如图2 所示,无人集群任务规划问题具体可以分为路径规划与资源调度两部分,路径规划问题是考虑环境约束下的平台位置与任务位置之间的组合优化问题. 而资源调度是考虑资源与需求之间的匹配机制,使得路径规划的平台与任务在确保任务完成时间的同时确保资源保障到位.

图2 无人集群任务规划模型Fig.2 Unmanned swarm mission planning model

然而,在复杂环境下,这些任务规划流程与模型无法适应动态多变的实际环境、无法考虑集群内部的协同、有人/无人集群之间的协同. 基于此,提出了如图3 所示的有人/无人任务规划系统集成框架. 该系统集成框架将规划决策、无人平台、有人系统组合起来解决无人集群实时任务规划问题. 集成的各个子部分包含无人平台自主行为规划系统集成、无人集群分布式系统集成与有人/无人集群系统集成.无人平台自主行为规划系统通过感知、认知、决策与控制完成自主行为规划. 不同无人平台之间通过交互感知-通信信息,平台-任务信息,资源-需求信息与决策信息,完成对无人集群分布式系统集成. 有人系统参与无人集群在准备阶段的预先规划、执行任务阶段的实时规划与完成任务后的事后评估过程,使得有人系统与无人系统实时协同交互,进而完成有人/无人集群系统集成.

图3 有人/无人任务规划系统集成框架Fig.3 Integration framework of manned/unmanned mission planning system

3 无人平台自主行为规划系统集成

无人平台的行为规划通常需要提前进行充分的计算和分配,每个无人平台按照既定的方案执行,这很难适应动态变化和复杂的环境. 为了完成自主行为规划,将无人平台自主行为规划系统解耦成4 个层面：感知层、认知层、决策层与控制层. 无人平台通过感知层获取外部环境与无人集群的相关信息,这些信息汇总到认知层,经过决策层,最终通过控制层反馈给外部环境和无人集群. 通过无人平台与外部环境、无人集群之间的交互,最终完成自主行为规划循环,具体过程如图4 所示.

图4 无人平台自主行为规划系统集成Fig.4 Autonomous behavior planning system integration for unmanned platform

如图5 所示,感知层行为具体为无人平台对外界信息的收集. 外界信息主要包括图像信息和通信信息. 而在图像信息中,既包含对静态地图的构建,同时又包含对任务目标的检测. 因此,感知层行为主要包含静态地图构建、任务目标检测与通信信号接受三类任务. 其中,静态地图构建（simultaneous localization and mapping,SLAM）,为无人集群提供基础地图和定位参考. 根据无人平台所携带的传感器的不同,可以将静态地图构建分为激光SLAM,视觉SLAM 以及多传感器融合SLAM[32]. 激光SLAM 通过搭载激光雷达,扫描外界环境,获得外界环境的点信息,根据不同点的信息差异,获取环境信息和无人平台的位姿信息[33]. 视觉SLAM 通过搭载单目相机、多目相机以及深度相机等记录外界环境的图像信息,根据和环境纹理信息提取,深度信息判断,获取环境信息和位姿信息[34]. 多传感器融合SLAM 通过搭载包含激光雷达、多目相机以及惯性测量单元（IMU）等多类传感器,获取多维环境信息,利用多传感器数据融合算法,获取误差较小的环境信息和位姿信息[35].任务目标检测需要对无人平台的视野中的任务目标进行准确识别,是无人集群态势理解的基础. 常见的目标检测算法可以分为传统目标检测算法和基于深度学习的目标检测算法. 传统目标检测算法通过区域选择器对视野内图像不断进行框选,接着通过特征提取算法分析这些框选区域,最后根据预训练好的分类器对特征进行分类并最终完成目标检测[36]. 然而,传统目标检测算法由于算法时间复杂度高、求解效率低、精度低、泛化能力差等缺点而无法满足目标检测需求. 而深度学习目标检测算法包含单阶段检测算法、双阶段检测算法、对抗学习算法等[37],可以在较短时间内完成目标精确识别的同时,具有较强的泛化性能,更适合于无人集群自主任务规划场景. 在通信信号接收中,无人平台既需要接收来自其他无人平台所感知的态势信息,同时也需要接收来自有人系统的命令.

图5 感知层行为Fig.5 Perceptual layer behavior

如图6 所示,认知层行为具体为无人平台对感知信息的整合、汇总,并生成优化问题. 随着感知信息的不断更新,认知层需要将这些信息不断地融合在整个态势中. 这里的态势信息指的是通过感知层信息构成的地图以及地图内各个要素的参数信息.认知融合算法需要根据多无人平台搭载传感器（可见光、多光谱、红外、合成孔径雷达等）以及多无人平台间通信所传回的相关数据转换到统一的“时-空”坐标系中[38]. 常见的融合方式包含估计理论数据融合方法（卡尔曼滤波方法、最小二乘法等）、分类数据融合方法（聚类分析法、随机森林方法等）、推理数据融合方法（贝叶斯估计法、DS 证据推理法等）以及人工智能融合方法（模糊逻辑法、神经网络法等）. 例如,秦武韬等针对无人集群任务规划中目标的准确可靠定位问题,提出了层次化分布式多无人机容错定位滤波结构[39],该结构既有完全分布式结构的通信带宽低、系统容错强的优点,同时又有中心式结构的信息集中处理的优点,提高了信息融合的容错性和可靠性. 对于存在冲突以及缺失的信息,认知层通过推理得到统一的态势信息. 李洪瑶等针对无人集群大区域巡视问题中多无人机对目标位置和类比的信息感知的偏差,设计了基于动态切换机制的多机融合识别方法[40],自适应选择DS 证据推理理论以及DSmT 信息融合算法,有效提高无人集群巡视系统的检测精度. 周治国等针对无人艇水面目标跟踪任务中,存在遮挡、光照变化、摄像头抖动等导致信息偏差的问题,提出了时空信息融合算法,在空间层面应用深度学习算法提取图像语义特征[41],在时间层应用相关滤波跟踪算法,计算与空间层相关特征的相关性. 该方法能够在多源信息存在冲突的情况下,确保了目标检测与跟踪的鲁棒性与实时性. 通过该态势信息,认知层通过自动建模获取得到决策变量、目标函数以及约束条件最终传递到决策层中. 关于认知建模算法,魏瑞轩等针对多无人机协同搜索中的搜索策略选择问题,借鉴人在搜索行为中的认知决策方式,提出了3 层结构模糊认知决策方法[42],可以在感知环境信息后,自主选择优化目标是全域覆盖搜索还是针对性目标搜索. 针对不同优化目标,根据模糊聚类算法完成搜索路径匹配,使得无人机集群的行动轨迹可以集中于目标最可能出现的区域,从而提高搜索效率. 吴子沉等针对无人机集群围捕任务的环境适应能力差的问题,设计基于认知发育的围捕方法[43],通过建立知识库的方式,将无人机集群感知的态势状态信息与优化目标、围捕策略等的匹配规则建立规则匹配库,再根据优化目标结合强化学习算法（deep Q-network,DQN）训练无人机的围捕动作. 根据该算法,无人机集群可以在不同环境下高效完成围捕任务.

图6 认知层行为Fig.6 Cognitive layer behavior

如图7 所示,决策层行为具体为无人平台对优化问题的优化求解. 根据认知层获得的态势信息,决策层可以对不同的决策方案进行仿真推演,并根据不同的评估函数对不同的决策方案进行评估. 通过最优化算法、启发式算法以及贪心算法等对决策优化,最终得到当前认知态势下的优化决策. 值得注意的是,由于感知层信息的不断变化,导致认知态势的不断变化. 这对决策的实时响应要求极高. 为此,设计优化结果库可以根据不同的优化问题给出之前结果的变种. 在决策过程中,认知层获得的实时动态任务规划任务会根据规划算法库中算法并行计算. 这些算法根据运行时间分为3 类：1）快速算法：这类算法无法求得精确解,但是可以在短时间内快速获得有效解. 常见算法包括贪心算法[44]、聚类算法[45]等.2）动态启发式算法：这类算法通过不断迭代,获得优化的解决方案. 其中,动态启发式算法由于环境的变化导致目标函数、决策变量的变化,需要对优化结果库中的相似优化结果进行重建,并最终反馈给动态优化算法加速迭代计算[46]. 3）精确算法：这类算法最后计算得到精确的优化结果,但往往需要大量的计算时间.这类算法包含分支限界算法[47]、动态规划算法[48]等. 这3 类算法得到结果都会记录在优化结果库中,通过筛选,取得实时最佳结果到控制层去执行.

图7 决策层行为Fig.7 Decision-making layer behavior

如图8 所示,控制层行为具体为无人平台自身对外界环境的影响. 主要包含无人平台的移动控制、资源控制以及通信输出. 在移动控制中,除了要根据决策层获得的位置进行移动,同时要注意环境中的静态目标与动态目标,根据目标信息及时完成避障、避险控制. MA 等针对障碍环境下的无人集群协同编队飞行问题,结合蜂拥模型以及优化算法,设计含参的无人集群避障避险规则以及行动规则[49],应用优化算法在多种不同的障碍环境中优化求解行动规则的参数,并最终获取无人集群的行动规则. 该算法可以在不同环境中保证无人集群的自主飞行与避障避险.WU 等针对障碍环境下无人集群协同编队飞行与编队围捕任务,设计同质-异质基因调控网络,自适应设计无人集群的避障避险规则以及行动规则及其相关参数[50],根据基因调控网络自适应训练获取优化后的无人集群避障避险规则. 该方法可以适应不同环境下无人集群完成高效的协同编队与协同围捕任务.在资源控制中,无人平台需要完成对物资、弹药等载荷的释放和对不同传感器的控制. 在通信输出中,无人平台除了对其他无人平台发送通信感知、平台任务、资源需求与决策的交互信息. 同时也需要将信息反馈给有人系统中.

图8 控制层行为Fig.8 Control layer behavior

根据无人平台自主行为规划,无人平台从感知层获得态势地图要素传递给认知层中. 认知层通过融合、推理、建模最终生成态势地图与问题建模传递给决策层. 决策层通过优化计算获得决策结果传递给控制层进行执行. 控制层反馈移动控制与资源控制到外界环境中,同时将当前交互信息反馈给无人集群中. 不同层次之间数据流如图9 所示.

图9 自主行为规划系统数据流Fig.9 Data flow of autonomous behavior planning system

4 无人集群分布式系统集成

在复杂多变的动态环境中,无人集群任务规划更加侧重于将动态到达的各类任务规划至合适的无人平台,以使集群内各无人平台在时间、空间上形成有序的协同行为并发挥出各无人平台的能力,最终聚合形成无人集群协同体系. 因此,动态任务规划是智能无人集群系统自主协同的关键. 复杂环境中对抗性强、通信稳定性差、任务时效性要求高等特点都加大了无人集群动态任务规划的难度. 在复杂环境中,任务和无人机资源存在动态变化的情况. 其中,任务动态变化通常指任务目标的位置发生变化和任务目标的新增等. 任务和资源动态变化通常是指无人机存在损毁以及无人机增援等情况. 任务与资源的动态变化往往带来优化问题的解向量空间的动态变化.

针对任务与资源动态变化问题,提出了如图10的无人集群分布式系统集成体系架构. 在该体系架构中,每个无人平台通过感知、认知、决策与控制,完成自主行为规划. 为适应复杂多变的动态环境,完成无人集群分布式自主控制,每个无人平台均为决策主体,平台间以交互信息、彼此决策的方式完成协同. 其中,无人平台之间通过交互通信感知信息、平台任务信息、资源需求信息与决策信息等可协同信息到自身认知层协助决策,进而完成平台间自主协同. 整个无人集群通过交互信息,涌现出集群感知、集群认知、集群决策与集群控制,进而完成无人集群分布式自主控制.

图10 无人集群任务规划体系架构Fig.10 Architecture of unmanned swarm mission planning

在传统的无人集群任务规划模型中,无人集群的协作方式分为基于中心式以及基于分布式两种方式. 基于中心决策式的方法通过中间节点计算整个集群的路径规划和资源调度,再通过分发的形式传递给无人集群的各个无人平台. 这种方式存在通信带宽过高,任务响应时间过长等问题[51]. 而基于分布式决策的方法一般通过拍卖协商机制,发现任务目标的无人平台通过招标的方式把任务分发给其他无人平台,其他无人平台通过竞标的方式来获取对应的任务[52].在基于拍卖协商机制的分布式决策过程中,为了进一步探讨无人平台的交互模式,将交互过程的主体分成我方、友方、敌方与环境4 部分. 基于此,构建了如图11 的感知决策交互模式. 该模式中,交互信息自下而上分别考虑了通信-态势、平台-任务、资源-需求和决策. 其中,不同的交互层具有不同的交互任务以及交互算法,如图12 所示. 通信-态势层应用深度学习多传感器融合与定位算法等相关技术完成态势感知与目标检测任务. 我方设备通过通信与友方设备进行交互. 与此同时,我方设备通过计算机视觉技术对友方设备、敌方设备、环境、任务等进行识别；平台-任务层应用启发式算法、行为树、强化学习、复杂网络等相关技术完成路径规划、编队控制、目标跟踪、目标围捕等任务；资源-需求层应用贪心/聚类算法、数学规划、演化计算等相关技术完成资源匹配、资源调度等任务；决策层应用GMCR冲突分析图模型、因果理论和博弈论等相关技术完成战术博弈与冲突分析等任务. 我方决策与友方决策、敌方决策之间组成合作博弈,同时与任务之间进行匹配,进而获得最佳决策.

图11 感知决策交互模式Fig.11 Perceptual decision-making interaction mode

图12 感知决策交互任务与算法Fig.12 Perceptual decision-making interaction task and algorithm

基于感知决策交互模式,无人平台在集群中通过交互信息、交互任务、交互算法完成对自身认知的提升的同时,实现无人平台与友方协同，环境交互和敌方博弈,进而涌现出群体感知、群体认知、群体决策与群体控制,从而实现无人集群的分布式系统集成.

5 有人/无人集群任务规划系统集成

为了构建有人系统与无人集群的感知、认知、决策与控制的交互,本文设计了有人/无人集群任务规划系统框架如图13 所示. 该系统自下而上通过服务层、应用层与数据层支持与平台层中的无人集群进行数据交互.

图13 有人/无人任务规划系统框架Fig.13 Manned/unmanned mission planning system framework

服务层主要包含规划方案库、态势实时数据库、任务规划算法库与决策评估库,为预先规划、实时规划以及事后评估提供服务保障. 应用层主要分为3个阶段：1）预先规划. 2）实时规划. 3）事后评估. 在预先规划阶段,指挥员通过对所需规划任务分析完成对规划计划、无人资源以及任务目标的指派. 并将规划任务放入任务规划算法库中进行预先任务规划,获得任务规划预案发送到无人集群；实时规划首先需要对整个任务的执行过程进行监控,并对实时态势进行统计分析,利用实时任务规划算法获得实时规划指令发送给无人集群；事后评估阶段首先评估专家根据评估问题构建评估指标体系,之后通过集群收集到的全局交互信息进行态势分析溯源,并对规划方案进行评估,最终生成事后分析报告. 数据层是无人集群与任务规划系统交互的桥梁. 应用层获得的任务规划预案与实时规划指令传递给集群感知层.而集群控制层将实时交互信息反馈给任务规划系统应用层中及时进行实时规划.

5.1 预先规划阶段

预先规划是有人/无人集群协同任务规划的前提和基础. 通过预先规划,可以使人与无人平台对任务的了解情况保持一致,为后续协同执行任务打下基础. 在预先规划阶段,有人/无人任务规划系统需要在已知部分任务目标以及环境信息的情况下,通过规划任务分析、预先任务规划、规划计划筛选,最终制定任务预案,并传递给无人集群的认知层中. 胡月等针对有人/无人直升机协同打击地面目标问题,提出了有人/无人直升机任务规划系统[53]. 该系统包含规划台、规划推演系统以及规划结果检验3 部分组成.规划台负责任务的预先任务规划,任务推演系统通过互动仿真的形式,完成对规划任务仿真推演. 最后根据规划结果检验,将任务方案通过交互平台传递给有人直升机,再依次传递给各个无人直升机. 然而,该方法的有人系统仅仅参与了预先任务规划的信息获取部分,没有参与预先规划的计算部分. 为了提高有人/无人集群任务规划的高效自主协同,本节设计的预先规划流程与方法如图14 所示. 在该系统中,指挥员与专家需要进行规划任务分析. 具体包含明确任务目标、管理无人资源与制定规划计划3 部分.由于人为制定计划往往存在单一性、片面性等缺点,因此,需要通过预先任务规划进行规划计划优化. 预先任务规划在规划算法库中,包含规划计划评估、规划计划优选与规划计划修改3 个部分,通过不断迭代,最终获取具有不同侧重的规划计划. 这些计划通过指挥员筛选出最合适的计划生成任务预案并存入规划方案库中. 每个预案包含执行任务的无人平台编号、任务分工、以及具体任务. 这些任务为某个时刻需要到达某个位置执行某些任务. 在图13 中,如任务预案1 中,无人平台1 需要在22年8月31日15 时08 分到达27°51′,112°59′ 的位置执行侦察任务. 这些预案同时会存储在无人集群的认知层中,等待任务开始时,无人集群可以按照任务预案高效执行任务.

图14 预先规划流程与方法Fig.14 Pre-planning processes and methods

5.2 实时规划阶段

实时规划是有人/无人集群协同任务规划的核心.通过实时规划,可以使人与无人平台在复杂环境中适时作出合理调整,提高有人/无人集群协同任务规划的有效性和鲁棒性. 在实时规划阶段,有人/无人任务规划系统通过实时态势监控获取从无人集群控制层发出的实时交互信息,并通过态势统计分析、实时态势分析、实时任务规划以及规划计划重筛等获得实时规划指令并传递给无人集群的感知层中. 柳文林等针对有人/无人机实时协同编队问题,设计了有人/无人机协同作战指挥控制结构[54]. 该架构通过任务规划层、协调控制层与功能实现层3 层架构实现有人/无人机之间在没有地面基站以及操作人员的情况下的协同编队飞行. 其中,任务规划层为有人/无人协同的关键部分. 在任务规划层中,无人机通过通信数据链系统向任务规划层传入图像和数据等信息.任务规划层将这些数据整合形成战场态势,并展示在有人机的人机交互界面上. 人机交互界面同时还提供辅助决策和在线规划等功能,并最终生成指令通过通信数据链系统发送给无人机. 然而该架构仅仅可以进行较为简单任务规划,无法应对复杂环境下的任务规划问题. 为了适应复杂环境下有人/无人集群协同任务规划,本节提出的实时规划流程与方法如图15 所示. 在该系统中,无人集群所产生的实时态势数据与系统所产生的实时计划数据通过实时态势监控,实时记录在态势实时数据库中. 这些数据经过态势分析统计,传递给指挥员与专家进行实时态势分析. 分析过程主要包含对任务目标的重构,对无人资源的管理以及对规划计划的重置. 当任务场景发生变化时,指挥员与专家首先需要分析当前任务目标与当前态势,判断当前任务是否需要作出改变,并更新任务所需资源. 这些更新后的任务目标、资源以及约束条件等通过有人/无人系统传递给无人系统中的规划算法库中. 规划算法库将预先规划方案以及作出改变前的规划方案通过重构生成适合当前任务内容的任务规划方法. 重置后的规划计划经过实时规划算法计算最终生成实时指令. 具体而言,需要规划算法库首先对规划计划进行重构,并对计划进行评估、优选、修改的迭代. 最终获得的优化实时指令记录在规划方案库中并传递给无人集群的感知层中. 这些实时指令主要是执行任务的无人平台编号、以及具体任务. 在图13 中,实时指令1 为无人平台1 需要在22年8月31日15 时08 分在27°51′,112°59′完成协同侦察任务.

图15 实时规划流程与方法Fig.15 Real-time planning processes and methods

5.3 事后评估阶段

事后评估阶段为有人/无人集群协同任务规划提供决策可解释性. 通过事后评估,可以分析不同决策对任务进程的影响,并通过复盘从而发现新的优化决策. 在事后评估阶段,有人/无人任务规划系统通过评估模型构建,态势分析溯源与规划方案评估最终生成事后分析报告. 左钦文等针对复杂仿真下的评估科学性问题,提出了基于大数据及机器学习的作战评估技术总体框架[55]. 该框架通过指标体系智能构建、作战网络评估分析、体系评估视图构建的方式,为作战方案评估提供新的解决方案. 尽管这类方法可以有效评估不同任务方案的优劣,然而,这类方法缺少对任务方案的溯源与分析. 因此,本节提出的事后评估流程与方法如图16 所示. 在该系统中,指挥员与评估专家首先完成评估模型建立. 具体包含确立评估问题、设计评估指标以及指标体系构建. 评估模型传递给决策评估库中. 同时,整个任务执行过程中无人集群所产生的全局态势数据与系统所产生的全局计划数据会传递给决策评估库中,完成态势溯源、低效决策搜索、决策分析修改以及决策推演评估. 最后,评估专家根据决策评估分析结果撰写事后分析报告.

图16 事后评估流程与方法Fig.16 Post-assessment processes and methods

6 结论

针对动态环境下,无人集群任务规划问题,从路径规划与资源调度两个问题分析了任务规划研究现状,构建了有人/无人集群任务规划系统集成架构. 该系统集成架构主要包含无人平台自主行为规划系统、无人集群分布式系统与有人/无人集群任务规划系统.无人平台自主行为规划系统集成感知、认知、决策与交互完成自主行为规划. 无人平台依据交互信息,彼此决策的方式,构建了无人集群分布式系统. 无人平台间的交互包含通信感知、平台任务、资源需求和决策信息. 基于该体系架构,设计了有人/无人集群任务规划系统,支持指挥员在预先规划、实时规划与事后评估阶段与无人集群的实时协同交互.