基于类脑智能的无人集群设计初探及关键技术浅析
2024-01-05张融恺
张融恺,闫 镔
(1. 智能博弈与决策实验室,北京 100091;2. 信息工程大学信息系统工程学院,郑州 450001)
1 引 言
无人集群是面向未来的热点研究领域,其具有低成本、低伤亡、高密度、高容错的特点,智能化无人集群更凸显了分布式分摊风险(100-1>0)和协同式聚合能效(1+1>2)的优势,成为各国科技角力的核心科研领域[1]。各军事强国纷纷开展了分布式、小规模的集群作战平台研究[2],着眼未来战争,发展智能化、协同化的无人作战系统[3]。目前无人系统已基本实现多无人机控制能力[4],美国开展了多项无人项目,包括“小精灵”“郊狼”“山鹑”[5],欧盟提出压制防空无人机蜂群领域合作[6]。无人集群具备数量多、密集高、规模化的优势[7],国内也已完成3051 架次的多无人机的同时控制[8]。
多无人机进一步发展为无人集群,需要从数量优势向智能化、协同化的质量优势逐步演进。全球人工智能和机器人峰会构想无人集群具有5S需求[9],包括集群化、智能化、小型化、安全性、敏捷性。美国规划2025 年无人集群将实现高度自组织控制并具有战场认知能力[10]。目前无人集群的智能协同能力仍处于起步阶段,研究场景多为静态及可控的任务,控制主要依赖预组织和预定义的程序,而未来无人集群需要面向动态复杂的高不确定性环境[11]。要实现无人集群智能协同能力的提升,脑驱智能启发算法作为无人系统的大脑,是无人机集群感知、协同、控制能力的重要来源。
模仿生物群体智能是当下无人集群的主要方案,借鉴自然生物群落如蚁群、蜂群、狼群的集群行为,运用简单的内部规则条件控制整体行动,促进早期无人系统控制获得一定的自主能力。然而在面向复杂动态环境时,生物群体涌现的集群智能具有一定局限性,例如生物群体启发的无人集群组成要素相对单一,各模块间交互方式较为固定,智能形式呈现初级的自下而上模式。仿生集群方案可能面临发展受限的问题在整体迁移性和适用性方面有待提升,难以实现在复杂多任务场景中的有效应用。
随着脑科学及神经科学在近几十年的快速发展[12],脑启发算法为无人集群智能演化提供了另一种仿生思路。大脑作为自然界公认的高级智能系统,借鉴类脑智能的感知、决策、规划能力成为多领域研究的发展趋势。类脑智能是指受脑机制和人类认知过程启发,基于计算建模通过软硬件结合实现的机器智能[13]。人造系统经过了漫长的迭代升级,然而目前没有一种通用智能系统能达到人脑的智力水平[12]。因此大量研究均面向人脑的多维感知能力、环境适应能力、自主学习能力,以促进人造智能系统在相关领域能力的突破。目前类脑研究主要包括两个方面,模拟大脑神经元模型的类脑芯片,以及智能感知的类脑机器人。类脑智能在无人系统领域已开展了初步的探索,包括多维复杂态势信息感知、分布式任务的方案优化、无人机故障排查、无人系统实时路径规划等[13]。欧盟启动的脑计划研究中部署了人脑模型的高级计算架构,通过模仿人脑的工作模式启发未来的计算机及机器人开发。类脑模型的SOAR(State,Operator,and Result,状态、操作者和结果)架构[14]也广泛应用于计算科学、机器人控制、智能感知等领域。此外,脑模型在硬件领域启发了类脑芯片的研发和应用,未来的高性能计算架构将获得类脑的低功耗和高并行能力[15]。目前广泛研究的人工神经网络也参考大脑的功能结构,全连接网络层借鉴了神经元的连接模式,卷积神经网络模仿视觉系统的感受野,长短时记忆网络的优异性能受到记忆机制启发,脉冲神经网络融入了神经元的激活和抑制特性。脑系统作为通用智能的参考模板,科研人员希望能够充分学习其出色的知识迁移能力和自组织能力[16]。
现有无人集群的类脑研究处于起步阶段,人工神经网络应用成为当下主流的仿脑模式,集群的脑启发形式仍以应用人工神经网络为标志,这与现有计算设备的硬件与软件约束有关。然而,人工网络的仿脑原理与脑启发的类脑机制不同,其在硬件构成和功能实现上与真实大脑仍有差异。研究人员逐渐重视真实大脑与无人集群的关系,借鉴大脑模型构建无人系统,在类脑的宏观层面上开展了无人集群的交叉研究。Zhao等[17]受到脑机制的启发,研究模仿人脑记忆通路的无人集群决策模块,构建个体知识库以实现熟悉场景的快速洞察。无人系统模仿人脑路径规划能力,在复杂环境中动态规划最优路径。魏瑞轩等[18]的研究中,运用高密度无人集群解决碰撞问题,构建丘脑-基底核-额叶皮层的类脑通路,协助无人集群获得“条件反射”的实时快速调整方案。
类脑与无人系统的混合智能组合模式,一方面借鉴了人脑的智能决策能力,另一方面充分发挥了无人系统在危险恶劣环境中的执行能力,人机结合能够相互取长补短,为无人系统赋人脑智能将有效融合二者优势。研究人员已在多种无人系统中探索类脑方法[19],在多种无人集群的现实任务中获得效能增益。强化学习是借鉴人与环境的交互模式[20],通过模仿人类在环境中获得收益或惩罚的反馈通路 ,优化无人机间的通信策略[21],训练无人系统与想定环境实时交互以获得性能的快速迭代优化,通过自学习过程实现自动的增量知识获取。此外,类脑的智能无人集群应进一步拓展应用领域,集群模型框架不应约束无人机的运行空间,系统应面向体系和框架的构建,从而打破空域壁垒实现跨域协同。无人集群智能的类脑启发路线仍处于初步探索阶段,脑科学的快速发展也发掘出多种创新的认知理论。无人集群与类脑集合是人脑智能的复刻、拓展、延伸,多层次的脑机制模仿和运用为无人系统提供了广阔的融合发展空间。
本文对无人集群系统提出了多角度的探索思路,从端、边、云三个角度讨论了脑机制与无人系统的结合方式,为类脑和无人集群的混合智能构建了具体方案。首先,对单体无人机的构成要素进行分析,参考神经元和脑功能结构提出通用异构的无人机设计思路。其次,借鉴脑机制的神经通路模型,将高效、低功耗优势应用于无人集群的拓扑和链路方案。此外,基于人脑双向、多循环的视觉加工机制,构建无人系统从感知到决策的环形信息交互体系。综合上述类脑无人集群的基础架构,模仿人脑的自修复、自组织、自适应、自学习等高级认知功能,进一步提升无人集群的长期稳定和自我进化能力。最后,面向现阶段的无人集群和类脑研究基础,展望后续类脑无人智能集群的探索方向。
2 脑启发的个体无人机设计
个体无人机模仿大脑神经元的基本结构,探索单体无人机在节点层面的设计方法。个体无人机是无人集群的基本实体单位,承担观察、通信、决策等细分任务。人脑的基本单元结构是神经元,在处理复杂事项时也可将脑功能区作为细分模块。无人机的层次化划分与大脑分层结构具有共通性。本文从神经元和脑功能区两个类脑尺度进行分析,讨论脑启发的未来个体无人机结构。
2.1 通用异构的个体无人机
平台通用、载荷异构的个体无人机形态具有低成本、高复用的优势,有利于提升无人集群整体构建的共融协同能力。平台通用提升了无人机间的沟通效率,并节约了开发多平台的时间和经济成本。载荷异构为无人机的任务多样化提供了可能,便于无人集群在执行复杂任务时细化分配子任务。前期规范化的无人机个体设计有利于集群间协作,并提升集群的再组织能力。
个体无人机可参考脑结构中神经元这一基本结构和功能单位,在底层模型构件中尽量趋同相似以实现平台同构,在子任务中细化要素形成载荷异构。大脑的神经元基础形态由胞体和轴突组成,各脑区神经元的分子组成和主要形态并无显著区别,根据各神经元的任务需要演化为多种功能特质,各神经元的胞体突起大小、轴突长短、释放神经递质种类可能存在显著差异。参考大脑的神经元分类方法,感觉神经元负责刺激的传入和感知,联络神经元担任神经脉冲的任务传递,运动神经元主要指导骨骼肌的运动。如图1 所示,感知无人机可根据任务分工搭载功能性模块,观测无人机挂载红外、雷达等感知模组,通信无人机配备链路交互单元,执行无人机装载执行任务的专用仪器。无人集群可模仿人脑工作模式,在实际任务执行中借鉴大脑的信息处理机制。类脑智能的无人集群在遂行任务中遵循OODA(Observation 观察、Orientation 判断、Decision 决策、Action执行)环路,其常规协同流程如下:感知无人机类似无人集群的眼睛,主要负责观察不同阶段以获取前方态势信息,并将态势信息源源不断上传至临近通信无人机;通信无人机类似无人集群的大脑和嘴巴,负责态势信息的收集、整合和沟通,主要实现判断和决策任务,一方面将感兴趣目标信息反馈回感知无人机进行进一步观测,另一方面指挥执行无人机完成预期任务;执行无人机类似无人集群的双手,主要负责执行阶段,基于搭载设备实现有利于集群的现实操作。神经元在生物演化中进化出整体形态相近、功能细化不同的通用异构形态,兼具低成本、高平替的特性,可以作为个体无人机规划的参考模型。
图1 通用异构无人机的类脑设计Fig.1 Brain-inspired design of general heterogeneous UAV swarm
通用异构设计方案与美军最新的马赛克作战思想契合[19],运用统一的开放式架构,应用成熟的商用接口,面向特定任务为通用无人机部署特种功能[22]。马赛克作战思想[23]是基于大量单一、可平替的低成本平台,构建灵活自适应的无人集群,以提升无人机间互操作性和自适应性[24]。一方面,无人集群的底层个体元素由统一规范接口的通用无人机组成,可有效提升内部数据共享及信息传输效能。另一方面,根据任务需求设计无人机的异构方案,有利于集群的灵活组合和功能复用,提升无人系统整体针对动态复杂环境任务的执行能力。
2.2 无人机的模块化层级架构
无人集群与个体无人机间一般存在多个层级,中间层级增设可提升底层组织能力和模块间协同效率。部分无人机组成的中间层级可借鉴脑功能区的规划模式,底层个体按照相近功能进行聚合。
研究人员发现大脑的信息加工主体为脑功能区,目前公认的布洛德曼分区将大脑划分为52 个区。解剖学研究发现刺激相应脑区会影响特定认知功能,荧光蛋白标记研究验证了大脑工作依靠脑功能区间的协作。这些负责特定感知信息处理的脑功能区包括:处理视觉信息的枕叶视觉功能区、控制肢体运动的顶叶运动皮层、加工听觉信息的颞叶听觉皮层。功能区内部的神经元结构和功能相近,能够集中高效处理特定的任务信息。Tang 等模仿大脑的功能区分布提出了SPAUN 脑模拟器[25],在SPAUN 脑模拟器[26]中设置了250 万个模拟神经元,并将其划分为10 个模拟脑功能区,这项多脑区协同计算模型具有开创性意义。无人集群的子部分可以模拟脑功能区的聚合形式,缩小功能相近的无人机间的距离。需要注意的是,无人机间的距离减小可以是空间距离,也可以延伸为拓扑结构的连接距离,其主要目标都是降低相近信息整合与交互过程中的通信损耗。此外,无人集群的分层设计可以借鉴视觉区V1、V2、V3的大脑层级架构,聚合单体神经元的视觉能力,形成处理亮度、轮廓、纹理的高级功能。分布式的无人机个体通过聚合集中,形成超越个体的群体处理能力,得以完成高级复杂任务。
目前的无人集群主要执行短时间的在外任务,执行长时任务需要对无人机功能分层管理。无人集群在外长期执行任务,需要稳定可靠的生存能力,同时要具备持续更新的自学习能力。如图2所示,大脑在进化中逐渐发展为三层结构,底层爬虫脑负责呼吸、体温等生命维持功能,中层哺乳脑发育出捕食及社交能力,高层的皮质脑进化出人类的感知、决策和判断功能。爬虫脑、哺乳脑和皮质脑分别代表了人类的生存需求、生活需求和进化需求。当下无人集群的发展处于爬虫脑向哺乳脑的进化阶段,可借鉴人脑的进化路径增加相应功能,首先实现自组织的通信和观测能力,再逐步拓展自学习的进化迭代功能。
图2 类脑无人集群的功能分层管理Fig.2 Functional hierarchical management of brain-inspired UAV swarm
3 无人集群的类脑交互模式
无人集群的分布式结构可抽象为边和节点的关系,个体元素间穿点成线形成集群整体,通过沟通连接共同完成任务。无人机间的连接和分布可参考大脑信息加工模式,脑系统进化过程中筛选出的拓扑结构和连接模式是优质模板。本文基于脑启发的通信等级、交互环路、网络组织三个层次探讨无人集群的类脑交互模式。通信等级划分中,对海量信息进行取舍并排序加工优先级,预设专属链路实现重要信息优先处理。交互环路设计中,双向内外循环的指挥链路形成指令反馈环路并提升信息交互效率。网络组织规划中,节点拓扑组织形式模仿稳定高效的“小世界”脑网络。
3.1 预设重要信息加工通路
无人集群在执行任务时有大量信息排队等待处理,包括原始环境采集数据和海量中间处理文件。无人系统对信息重要性排序并优先处理关键任务,将提升整体任务规划能力并优化数据加工流程。无人集群经常面对目标价值排序和任务优先级设置问题,在规划多任务时可参考脑系统中的通路设置,以类脑的专属通路和预设通路为例,启发无人系统的任务分配方案。
无人集群在分布式协作时首先要分清敌我,敌我识别的混乱将混淆任务对象和合作伙伴。大脑在进化过程中为自我认知构建了专属通路,以回答“谁是我们的敌人?谁是我们的朋友?”脑机制的自我识别功能中最具代表性的是“鸡尾酒原理”,即人们在嘈杂的鸡尾酒会中也能清晰地听到自己的名字。研究发现人脑在潜意识下也在自动捕捉自我相关信息,当自我属性信息出现时会唤醒大范围的大脑皮层。在心理学实验中被试对自我姓名和面部的按键反应更快,并且对自我信息的灵敏度更高。核磁扫描发现大脑对自我信息有特异性反应,包括自我识别的专属通路和右前额叶脑区的特异性激活。无人集群在自我识别时也可参照大脑机制,一方面通过设置专属通路提升敌我识别加工的优先性,另一方面分配部分线程进行自动持续的身份验证。无人集群对自我识别的优先处理有利于敌我态势的实时感知,及时评估集群现存的行动能力,快速调整任务规划并提供信息支撑。
无人集群大多采用固定处理流程加工环境信息,通用处理模板的多样性感知信息能力仍有待提升,集群可以对感知信息预先分类并分配至预设通路进行针对性加工。例如,无人集群的目标检测及定位可参考大脑视觉的工作模式,信息的分类加工可以参考大脑视觉处理的两条预设通路。进行物体的视觉加工任务时,物体的识别通过大脑腹侧的“what”通路加工,而物体的位置和运动信息通过大脑背侧的“where”通路处理。“what”和“where”通路分别预设了不同的视觉加工能力,前期视觉任务分类后会归属到特定通路进行针对性加工。无人集群在任务处理时可借鉴预设通路的模式,预设多种人工神经网络结构处理多样化数据。如图3 所示,以集群收集到的图像、时序、拓扑信息为例,采集到的视觉图像数据应用卷积神经网络,音频及雷达等时序信号使用长短时记忆网络,集群的拓扑图信息运用图神经网络等,发挥神经网络各自优势处理类型匹配的环境数据。将不同任务分配给专业的信息加工通路,提升差异性任务的定制化加工能力。
图3 无人集群处理多模态数据的专属通路Fig.3 The exclusive path of the UAV swarm processes multimodal data
3.2 双向内外循环的指令链路
无人集群任务执行中的信息主要在感受节点和决策节点间传递,信息传递方向大多为从感受节点到决策节点的单向自下而上模式,以及决策节点实时控制末端节点的单向自上而下模式[27]。如图4所示,OODA 模型提出后,部分无人集群采用观察、判断、决策、行动的4 步骤,形成周期性重复的单向闭环,规范了无人系统任务执行的操作流程。现有OODA 模型仍可以进一步优化创新,包括缩短环路运行周期,以及提升信息利用效率。本文提出类脑的双向内外循环的信息传输环路,双向通路促进了层级间信息流向的多样化,内外循环增加了外部数据及中间信息的复用效率。
图4 无人集群的指令链路Fig.4 The instruction link of UAV swarm
外部信息的通路可以参考多级视觉皮层的信息流向,视觉信息加工框架可以应用到无人集群的通信过程中。研究人员起初认为视觉信息从低级V1 区逐渐向高级区V2、V3、V5 传递,进一步研究发现高级视觉区能够指导低级区的信息处理,形成了双向的信息交互通路,例如高级认知分配更多注意力调整低级视觉区关注感兴趣的图像细节。更深入的研究发现V2、V3、V4 存在内部信息的循环交互,信息处理中产生的亮度、颜色、轮廓等特征经历了循环加工,内部信息循环有效提升了数据利用率。研究人员在人工智能领域中,探索使用过双向循环的类脑模型,例如图灵奖得主、深度学习先驱 Geoffrey Hinton 提出未来人工智能将应用“前向-前向”的前向网络,在反向传播的基础上推广了更接近大脑机制的正向传播算法。
无人集群的防碰撞研究正在探索双向内外循环的交互方式,Girard等将脑启发的碰撞规避原理应用于无人集群的碰撞规避[28],其提出的基底核-丘脑-额叶交互模式中包含双向通路和多层循环。魏瑞轩等提出自主心智发育的无人机防碰撞控制架构[18],借鉴类脑模型中的避障航路方法,构建了以知识库、避障策略、威胁模式为功能节点的双线循环通路。ACT-R模型[29]应用脑启发的功能区环路建模,实现了特定任务中的活动预测。
3.3 稳定高效的小世界网络
目前无人集群的主要拓扑结构包括:星形组网、中心式组网、网状组网、分层混合组网等。现实中根据任务难度评估无人集群所需的稳定性、效率、交互性等因素,侧重任务需求选择相应的拓扑结构。然而人为预设定的拓扑方式难以满足动态的环境变化,任务牵引的无人集群自适应拓扑方式更符合复杂多变的现实任务。其中,为无人集群设计优质的默认网络结构将大大降低自适应难度,促进集群在默认网络基础上的优化改进。
大脑在长期进化中发展出一套高效稳定的基础网络结构,“小世界”的拓扑形式在多种脑网络中得以验证[30]。如图5所示,“小世界”规律是指融合了相邻节点的密集连接以及远距离节点的长程连接,其结合了正则网络的稳定性优势和随机网络的效率优势,既稳固了相近节点的合作又降低了信息长传的中转次数,在聚类能力和连接代价中保持了平衡。已有多项研究将“小世界”模型应用在城市交通和社区建设中。上文将个体无人机类比大脑神经元或功能区,脑网络的拓扑方法同样可以移植应用于无人机集群,提升功能相似无人机的通信频率,增加处理任务时同类无人机的协作能力,保留部分长程中继通信能力,为无人集群间的远距离交互留有沟通链路。无人集群根据环境进行自适应调整时,只需在默认“小世界”拓扑结构中调整临近聚类密度和长程连接数量,这将有效降低网络优化难度和重组织时间。
图5 无人集群的交互连接方式Fig.5 Interactive connection mode of UAV swarm
4 类脑无人集群的高级智能呈现
通过在个体无人机与集群交互的底层框架基础上构成静态骨架,织线成面的无人集群将进化出更高的协同智能,实现动态组织和自我进化的软实力提升。目前的无人系统在高损伤情况下难以达到与脑系统一样的鲁棒性,并且在复杂环境中缺少稳定的自组织协同能力。类脑无人集群借鉴人脑的自修复性提升抗毁自愈能力,应用脑机制的自组织方案改善整体协调功能,参考脑启发的自学习模式促进集群持续优化迭代。
4.1 自修复与自组织能力
无人集群运行时会面临部分节点失灵或损毁情况,子功能损伤可能引起上下游信息拥堵,节点损坏会进一步导致整体性能缺陷。目前应对突发情况通常设置紧急预案,评估集群整体损伤等级后执行备选方案。有限固定方案难以精确应对复杂损伤问题,无人集群仍需提升针对现实受损情况的自我修复能力。无人集群可以参照大脑强大的自我修复功能,极端案例表明,患者在失去一半大脑后仍有机会存活。本文以大脑的日常修复、部分损伤、严重损伤为例,讨论无人集群的类脑修复方案。
日常维护是保证无人集群稳定运行的基础,无人机的状态评估和诊断预测将有效降低其老化受损风险。无人机自我诊断领域逐渐使用深度学习方法[31],Guo 等利用卷积神经网络预测无人机传感器的故障[32],彭军等应用深度信念网络进行发动机的故障分类[33]。无人集群进行周期性的测试检修,其检修频率可以参考大脑睡眠周期。通常大脑在夜间睡眠时会进行白天受损神经元的修复,在评估白天工作量和神经元受损状态后调整睡眠休整时长。无人集群可借鉴大脑调整工作强度与睡眠时长的规律,评估无人集群的任务难度以调整检修频率,交替排布无人机的检修和工作时间表。
无人集群的部分损伤可通过链路重分配方式,从全局角度寻找重组方案来尽可能保持集群的整体性能。如图6 所示,这种全局寻优的修复方式可参考大脑机制,例如视力障碍患者的触觉听觉功能得到加强,肢体永久损伤对应脑区的神经元会被近邻脑功能区延伸占用。神经元功能复用和重分配有效缓解了部分节点损失,可以延伸应用到受损节点的周围无人机,与集群整体重新建立连接。通过充分利用剩余无人机构建新的上下游连接,保障和加强集群内其他功能通路的有效运行,实现功能自愈并保持整体执行能力。在集群设计初期应预留容错空间,布设一定比例的冗余节点,实现损伤个体无人机的快速替换。若预留的冗余无人机仍难以填充现有损失缺口,可以参考大脑中神经干细胞的更新方式,整合各损伤无人机中完好的部分零件,拼凑重新组合成新的组装无人机,维持集群的基本运行。
图6 无人集群的自修复、自组织功能Fig.6 The self-repairing and self-organizing functions of UAV swarm
4.2 自学习能力
目前无人集群出厂及行动前被植入基础功能,使用目标相似任务数据库进行离线学习。然而,离线学习数据库的方式有一定的时间滞后性,并且需要将数据库在目标任务间迁移,难以适应动态未知的现实任务环境。知识的获取有利于无人集群智能化的提升,可以参考人脑对新知识的学习模式,增加无人集群在任务中的自学习能力,获取真实环境中的动态知识。如图7 所示,类脑无人集群的学习可以分为3 个阶段:在学习库中存储知识、与环境交互过程中掌握知识、开辟空间持续拓展知识。
图7 无人集群的自学习流程Fig.7 Self-learning process of UAV swarm
无人集群通过任务获取的数据不断扩大知识库,提炼整合感知的信息加入自身知识库是自学习功能的第一步。记忆功能可参考大脑海马体和丘脑的存储模式,将任务经历重演形成知识库的长期记忆。知识库的构建将动态信息持续整合形成经验累积[34],同时便于相近任务决策时的知识快速检索,缩短无人机的反应时间。研究学者受大脑记忆模式启发,提出了可塑突出形态的赫布法则[35],深度学习领域也将模拟人脑神经元的脉冲神经网络应用于机器的记忆能力研究[17]。在无人系统的知识库构建研究中, 魏瑞轩等在无人机避障方法中引用规避策略知识库,模拟丘脑对知识的增量获取功能,提升无人机预防碰撞的策略发育[18]。
无人集群在知识库的基础上还需反复强化运用新知识,与环境交互测试中强化新知识记忆通路和运用能力,在真实场景下改善无人系统的环境自适应性。强化学习模仿大脑的学习过程[36],通过环境反馈的奖励结果优化现有知识结构,这种无需人工干预和标记的方法,被广泛应用于机器智能体的自学习过程中。Qiao 等模拟内颞叶皮层对视觉能力设计了强化学习框架,提升了智能体物体识别在遮蔽、旋转等不同视角下的鲁棒性[37]。Jafari 等提出了大脑情绪模型启发的智能控制器,情绪机制启发的无人系统具有小型化和实时性优势,在无人机飞行测试中展现出更强的抗干扰能力[38]。机器凭借自身算力优势,强化学习的智能体在个别领域的能力甚至超越人类,例如DeepMind 提出的AlphaGo Zero 展现出极强的围棋技术,以及Neural Turing Machine 在多智能体协同的星际争霸游戏中击败了人类世界级选手。
强化学习的运用提升了无人集群的学习技能,增量学习将进一步提升无人系统的终身学习能力。无人集群对新知识的增量学习促进系统保持长久的进化趋势,同时系统应保持新旧知识的更替,替换失效旧知识为新知识提供记忆空间。新旧知识替换过程可以借鉴大脑的遗忘机制,频繁使用的知识会加强记忆通路,而长久未用的知识遵循遗忘曲线规律而逐渐忘记。研究人员提出了类脑的HAM人类关联记忆模型[39],人工神经网络中的增量学习借鉴大脑遗忘模式,通过冻结旧神经元和增补新神经元获得记忆空间,分配新记忆通路或重组记忆网络获得新知识。机器人实际应用场景中,Sandini等[40]应用增量学习思想提出了类脑的认知发育机器人,Gao 等[41]应用增量式特征提取改善机器人的辨认和识别能力。
5 类脑无人集群的未来展望
类脑的无人集群研究是前沿的交叉领域,其整体性能的提升依靠各自学科的研究发展,混合智能效果呈现交互的螺旋上升趋势。现有脑启发的无人系统仍处于起步阶段,从整体架构到细节设计均有待探索和完善。本章列举类脑无人集群在多个研究领域的未来增长点,多方向形成合力协助无人集群的智能化发展。
5.1 类脑芯片助力无人集群成为忠诚守望者
未来无人集群将负责更多的巡航、观察等态势感知任务,持续不间断的信息采集成为无人集群的重要功能。大脑可以在消耗极低能量的情况下调控维持人体的生理功能,并在低功率状态下完成与外界的多种交互。未来的类脑芯片使用将大大降低机器功耗,通过将脉冲神经网络、忆阻器等应用于类脑无人机,可显著提升无人机的续航功能。低功耗的无人机可完成更长时间、长距离、高复杂度的任务内容,提升个体无人机的连续工作能力,在接力侦察和周期巡逻中降低无人机架次。此外,对于处于静默状态的无人机,低功耗优势将延长其待机和寿命年限,可在更早期部署而不需担忧短期能源问题。
5.2 强化对抗训练无人集群成为持续学习者
目前无人集群的学习方式主要基于离线数据库训练,缺少自我学习的迭代更新能力,并且需要根据目标任务挑选相关数据进行预先学习。研究发现填鸭式教学收效快但难以迭代和创新,而面向环境和现实问题的互动启发式教学可以调动智能体的积极性。无人集群作为智能体可借鉴交互式的训练方法,在现实场景交互过程中学习针对性知识,并根据不断变换的外部环境更新和优化现有知识库。此外,可参考教学中的辩论和讨论形式,形成智能体间的对抗[41]和博弈模型,择优留存性能最佳的模型样本,或针对不同智能体优势构建多场景的后台预案。
5.3 脑机交互促进无人集群成为敏捷执行者
目前无人集群任务执行仍需人工在环路的指导和辅助,这需要人与机器间高效准确的交互沟通,快速变换的复杂任务场景尤其需要对无人机的精确控制。类脑无人集群模仿人脑的信息加工模式,将提升中间数据处理结果的直观性和解释性,间接帮助操作人员对态势信息进行判读和分析,有益于后方人员快速下达准确的操作命令。短期内可借助增强现实、混合现实等沉浸式的交互应用技术,将外界信息直接刺激个人感官系统,协助操作员获得全方位的态势信息。此外,目前人机交互模式为键盘鼠标及操控摇杆,随着脑机接口技术的不断发展,脑机交互可能逐渐替代外周神经系统间接控制的肢体交互,人脑将实现与机器的直接互联通信。研究发现肢体操作信号仅占大脑神经指令的一小部分,大脑信息的直接传输将提升人机交互效率和指令准确性。
6 结 论
类脑无人集群是无人系统实现智能化和协同化的创新方法,脑驱智能将助力无人集群获得类脑的感知和认知能力。本文从个体无人机设计、集群环路搭建、高级智能呈现三个角度讨论了脑启发的无人系统应用。类脑无人集群融合了人脑机制与机器结构形成混合智能,将充分发挥人类智能的认知优势和无人系统的执行优势。本文借鉴人脑机制启发无人集群的感知和决策能力,分析了无人集群与人脑系统的共性,并对未来无人集群的类脑方案提出研究设想及建议,为无人集群在智能化和协同化道路上的发展提供了参考。