APP下载

面向不确定环境的航天器智能自主控制技术

2021-09-07

宇航学报 2021年7期
关键词:航天器框架决策

袁 利

(1. 北京控制工程研究所,北京 100094; 2. 空间智能控制技术重点实验室,北京 100094)

0 引 言

当前,随着空间探索愈加活跃,航天器所需执行的空间任务也日趋复杂:日本隼鸟2号[1-3]和美国OSIRIS-Rex探测器[4-6]分别于2018年和2019年对先验知识较少的小行星实施了探测任务;用于深入研究火星内部的“洞察号”于2018年成功着陆于火星表面[7-8];2020年“毅力号”探测器开始了其搜寻火星远古生命迹象、研究陨坑地质结构、采集并保存火星样本的火星之旅[9-11];“凤凰计划”(Phoenix Project)[12]和“任务延寿飞行器”(MEV)[13]分别采用空间操控和自主交会对接的方式对即将退役的航天器实施在轨服务。

航天器在应对上述空间任务中的不确定性因素时,通常采用“地面测定轨+遥测下传→情况判定→决策规划→上注指令→在轨执行”的方式。这种“星地大回路”的控制方式存在窗口和弧段时空约束多、星地回路时间链条长、运维指控人为因素多等问题,无法针对不确定性进行实时决策,致使一些任务的执行过程并非一帆风顺:OSIRIS-Rex探测器在对小行星“贝努”着陆探测的过程中发现其地表情况复杂,并持续向外喷射高速颗粒羽流,导致OSIRIS-Rex无法按照预定计划实施着陆,研究人员不得不花费一年之久根据遥测信息重新规划着陆;“洞察号”利用热探测器执行自主钻地任务时,由于对火星地质实时信息感知和理解不足,造成钻头在距离地表30 cm处卡住,无法完成预定的探测任务。

另外,轨道空间日益拥挤、碰撞风险激增,太空竞争加剧、袭扰增多,给航天器任务执行带来了更多不确定性因素。例如,2021年3月美国气象卫星NOAA-17爆炸,当前已追踪16块空间碎片;2014年以来,GSSAP卫星进行了数百次机动,以抵近侦察的方式对我国多颗商业卫星实施袭扰。可见,若无法对空间威胁进行有效处置,将严重影响航天器在轨运行的安全性和业务的连续性。同时,为了避免“星地大回路”造成的时延,就必须增强航天器自主及时处置空间威胁等不确定性的能力。

本文首先对航天器智能自主控制技术所涉及的感知、决策和控制执行技术的发展现状进行了分析,总结了目前存在的不足。针对现有问题,结合航天器未来的发展需求,提出了一种新型“感知(Observation)-演化(Evolution)-决策(Decision)-执行(Action)”星上闭环控制框架,以提升航天器任务场景高层次理解、角色演化和自主决策等能力。针对该新型控制框架,探讨了其功能和所涉及的理论与方法,并就其实际应用和进一步发展给出了需要解决的关键科学问题。

1 智能自主控制技术研究现状

考虑到智能自主控制技术针对复杂且不确定环境具有较强的应对能力[14],杨嘉墀先生早在1995年就指出大力发展空间智能自主控制技术的必要性[15],经过多年发展,已提出基于特征模型的智能自适应控制[16]、模块级进化容错控制[17]和自抗扰控制[18]等先进的理论方法,使无人系统在一定程度上实现了针对不确定性的鲁棒自主控制[19]。近年来,人工智能技术的快速发展,为智能自主控制技术注入了新的活力[20-21]。智能自主控制所涉及的关键技术主要包括自主感知、自主决策和控制执行三个方面[22],本章将分别对其研究现状进行介绍。

1.1 自主感知技术

自主感知技术主要包括目标形态特征提取、行为特征提取和态势评估三个方面。

在形态特征提取方面,考虑到航天器通常安装有太阳帆板、发动机喷嘴、交会对接环和帆板支架等几何形状规则的部件,上述部件可作为空间目标的典型形态特征,常采用Hough变换[23-24]和Canny边缘检测[25]等图像处理方法对矩形、椭圆形或三角形等规则特征进行提取。对于不规则几何特征的情况,角点等局部特征通常被应用于空间特征提取中。角点检测算法主要包括基于图像边缘和基于图像灰度两类方法,其中后者运行速度快、精度高,为主流算法,经典算法主要包括Fast[26]、Harris[27]和Shi-Tomasi[28]等,许多学者对上述工作进行了适应性改进,以提高鲁棒性、快速性等性能[29-31]。由于受目标剧烈运动以及光照条件的影响,目标的形态特征存在尺度变化较大的问题,单纯依靠角点易造成误匹配,因此通常需要进一步对关键点附近区域进行描述,获得具有光照、旋转和尺度不变性的特征描述符。常用的二维特征描述符包括SIFT和SURF等。文献[32]利用粒子滤波方法减小了SIFT特征点的匹配误差;文献[33]将SURF特征描述与Fast角点检测法相结合,实现了较低采样频率下的特征点提取。近年来,FCOS网络[34]、VoxelNet网络[35]和全卷积网络[36]等人工智能方法也被应用于目标形态特征的提取中。然而,由于特征描述法和人工智能法所需计算量较大,其空间的实施应用受航天器有限计算资源的制约[37]。

在轨道目标行为特征提取方面,当相对距离较远时,被测航天器在敏感器视野中仅为点目标,此时只能获得目标的视线信息。当能够通过多个航天器合作获取同一非合作目标的多条视线信息时,可通过卡尔曼滤波及其改进方法估计出目标的运动状态[38]。然而,当只有单视线测量信息时,由于对目标的仅测角无源定位跟踪存在观测量几何约束弱、系统可观度低的问题,往往需要我方航天器通过一定的轨道机动在多个位置均给出视线测量量,才能对非合作目标的运动状态进行有效估计[39-40]。航天器与目标相对距离较近时,可获得目标的深度点云及图像信息,此时则可利用基于卷积神经网络的联合滤波器[41]或基于自监督模型的自适应融合机制[42]等方法将点云与图像信息进行融合,估计目标的运动状态。然而,由于轨道空间受平行光影响,易出现目标局部过亮或过暗的情况,可能造成无法连续提取目标的形态或行为特征的情况。

空间态势评估是引导航天器进行空间活动的基础,是自主完成空间任务的关键,因此研究态势评估方法显得尤为重要。传统的态势评估算法主要基于专家系统[43]、模板技术[44]和贝叶斯网络推理[45]等方法进行设计,大多对人的先验知识具有较强的依赖性,可能受设计者的主观因素影响较大。为避免该问题,该领域的学者提出了多种基于大量样本数据进行学习训练的推理网络参数确定方法[46],但当样本数量有限时则无法保证训练效果。通过引入先验知识可减小推理网络参数的搜索空间,从而降低对样本数量的依赖;文献[47]将推理网络参数的单调性约束作为先验知识,提出了一种基于估计算法的参数学习方法,该方法具有较高的准确性和稳定性;文献[48]则将推理网络参数的取值范围和部分参数的大小关系作为先验知识,给出了一种进化学习算法,保证了小样本条件下网络参数的全局收敛性。

1.2 自主决策技术

自主决策技术最早源于机器人和无人驾驶领域[49-50],随着航天任务需求的提升和交叉学科的发展,多种决策技术在航天领域得到广泛应用。目前航天器自主决策规划研究主要包括航天器轨道运动规划和姿态运动规划。

针对航天器轨道运动规划问题,文献[51]提出了一种分布式集群航天器的自适应种群变异鸽群算法,实现了航天器集群在复杂约束条件下的轨道自主规划,避免了传统鸽群算法中演化停滞以及易陷入局部最优解的问题。文献[52]考虑空间交会中目标航天器周围有小卫星环绕的情况,提出了一种混合遗传算法,将遗传算法全局搜索能力和模拟退火算法的局部搜索能力进行整合,并以航天器轨道路径安全、任务时间、燃料消耗等为约束条件,实现了轨道机动的最优路径规划;文献[53]建立了一种航天器与非合作目标的追逃博弈模型,采用基于分支深度的强化学习方法进行求解,给出航天器空间交会策略。文献[54]针对载人航天器交会对接飞行任务的规划问题,以测控、光照等因素为约束条件,以飞行事件为状态,利用有限状态机建立飞行过程的图形化任务规划模型,并通过求解该模型得到了最优规划策略。文献[55]研究了航天器与非合作目标潜在交会威胁下的最优规避机动策略问题,通过建立非合作目标的多脉冲最优交会模型,给出潜在威胁区的计算方法,并以其弧长为优化目标,建立航天器的最优规避模型,采用遗传算法进行优化,从而得到有效威胁规避策略。文献[56]考虑机动目标空间交会过程中的轨迹规划问题,基于微分对策理论建立了无需目标航天器机动测量的追逃双方微分对策模型,并提出了利用非线性规划求解微分对策问题的方法实现了最优控制与对策论相结合。针对近地轨道附近时间固定的两航天器追逃问题,文献[57]为获得追逃双方在对策条件下的最优策略,运用微分博弈对航天器的整个追逃过程进行了数学描述,并提出了基于半直接配点法的追逃双方最优控制策略数值求解方法,避免了求解非线性两点边值问题。

针对航天器姿态运动规划问题,文献[58]采用直接打靶法分析大角度姿态机动过程,从而得到带参数约束的非线性方程组,并通过序列二次规划优化算法进行求解,得到最优姿态规划结果。文献[59]针对有限时域的最优姿态控制,将端值约束以及控制变量的二次型积分引入到性能函数中,利用罚函数法设计了系统姿态规划的最优解。文献[60]采用伪谱法规划了考虑姿态机动时间、控制力矩陀螺峰值角动量以及机动能量等参数的单目标和多目标最优姿态机动路径。文献[61]提出了一种粒子群算法用以规划航天器姿态运动,解决了姿态规划过程中的欠驱动问题。文献[62]通过伪谱法把带有非完整约束的欠驱动航天器姿态控制问题转化为离散点的非线性规划,并利用优化算法寻找最优姿态规划结果。

1.3 控制执行技术

目前,PID、模型参数化和自适应等经典控制方法在航天器控制领域已形成了一套比较成熟的理论体系[63-65],但随着空间任务复杂性的增强,航天器的模型非线性和不确定性也愈加显著,经典方法缺少泛化学习能力,在应对不确定性时能力有限。考虑到人工智能方法可有效逼近不确定性和模型非线性[66-67],很多学者提出了多种智能控制方法,用于解决较强不确定下的控制问题。

对于存在外部干扰、模型参数不确定和执行机构故障情况下的航天器姿态控制问题,文献[68]和[69]利用神经网络的泛化拟合和学习能力,构建了自适应神经网络姿态控制器,实现了多种不确定因素下的姿态跟踪控制。在实际工程任务中,航天器控制系统中的测量和执行机构使用频率较高,易发生故障,而大部分故障无法提前预知,并且维修成本较高,可能在短时间内造成航天器姿态测量值或真实值发散,进而导致任务失败[70-71]。为此,文献[72]提出了一种模糊自适应观测器用于姿态和角速度的高精度估计,并通过设计模糊自适应容错控制器,实现了在系统具有不确定性和执行机构故障情况下的姿态稳定控制。

在轨道控制方面,远距离的轨道机动一般先通过智能优化算法进行轨迹规划,然后设计相应的脉冲控制律,涉及的智能控制执行方法较少。在近距离交会时,为了提高控制精度,需要考虑姿态与轨道控制通道之间的耦合影响,设计姿轨联合控制律。文献[73]针对空间非合作目标交会对接问题,考虑姿态与轨道控制通道交叉耦合、目标未知控制加速度和追踪器控制力矩不确定性等影响,利用小增益定理和反步设计法给出了可保证姿态和轨道控制通道整体上具有稳定性的姿轨联合控制方法,有效提高了控制效率和控制精度。文献[74]采用T-S模糊方法获得非线性系统的参考模型,并基于该模型设计模糊自适应位置和姿态跟踪控制器,通过保障系统的H∞性能获得了较强的鲁棒性。文献[75]考虑在存在外部干扰和模型参数不确定性时,利用模糊方法对不确定性进行拟合,通过在线学习自适应调整参数,并结合滑模控制方法,设计了模糊自适应姿轨联合控制器,实现了姿态和轨道的高精度控制。文献[76]考虑存在外部干扰和执行机构故障等多种不确定性的情况,构建了深度强化学习神经网络,通过在线学习调整参数,设计了对不确定性具有强鲁棒性的自适应智能控制器,解决了航天器非合作目标跟踪姿轨联合控制问题。

在空间在轨维护任务中,利用空间机器人对目标进行操控是目前主要的实施手段,其操控精度是需要重点考虑的问题[77]。作为典型的空间多体系统,空间机器人自由度多、动力学复杂,机械臂在动作时将对基座产生干扰力矩,因此在控制器设计时必须给予考虑[78-79]。文献[80]研究了空间机械臂的跟踪控制问题,分析了机械臂与基座之间的耦合特性和碰撞约束,考虑了外部干扰不确定、模型不确定和执行机构饱和等情况,利用径向基神经网络对操作过程中的不确定性进行估计,在此基础上设计了自适应终端滑模控制器,实现了机械臂和载荷的一体化控制。文献[81]为了改善基于传统神经网络的自适应控制方法在空间操控应用中的性能,提出了一种基于量子干扰原理的新型人工神经网络,并建立了新的激活函数,通过在线学习规则获得更快速的学习效率和更好的拟合性能,据此设计了空间操控自适应控制器,实现了干扰的估计补偿,从而有效提升了空间操控的精度。文献[82]考虑高度耦合动力学特性和未知空间环境干扰的情况,研究了一类自由飞行的空间操作机器人的操控问题,为了避免传统滑模控制的高频抖动特性对执行机构指向精度和使用寿命造成的不良影响,提出了一种基于强化学习的模糊自适应滑模控制器,在实现高精度跟踪控制的同时减少了控制器的抖动。

1.4 目前存在的问题

可以看出,经过多年研究,智能自主控制技术已取得了较大进展,并已应用在无人驾驶汽车[83-84]和无人机[85-87]等无人系统中。然而,由于航天器需要考虑抗辐照和可靠性等因素,所配备的计算机、存储等资源严重受限,而目前大多数先进的智能自主控制技术均需要较强的算力作为支持,这导致其在航天器中应用受限。目前大多数在轨航天器的控制系统主要依据“测量-控制-执行”的传统思想进行设计,仅能较好应对既定任务,所涉及的不确定因素仅包含内部模型不确定性以及外部扰动,当任务类型、目标以及环境发生变化或具有较强不确定性时则需重新设计控制系统,泛化能力有限。少数用于执行地外天体探测、对地观测等任务的航天器将部分智能算法引入控制回路中,以增强其自主性,提升业务能力,但现阶段其控制系统仅在单一环节上实现了“点”的突破,尚未形成控制框架层面上的整体改进。

未来航天器所需自主完成的非合作目标在轨服务、地外天体着陆及探测等复杂空间任务具有先验信息少、探测手段欠缺、通信条件恶劣、星上资源受限等特点,这些因素均给航天器的控制系统提出了更高的要求,即需要航天器在难以与地面进行及时通讯的前提下,利用有限的先验信息和实时感知信息自主实现对任务场景的高层次抽象理解,并据此快速给出任务决策及动作规划结果。同时,由于航天器属于高价值空间资产,发射成本高,若单一航天器具备应对多种任务场景的能力,则可有效提高航天器的效费比。综上,未来航天器应具备类人的自主感知与认知、角色演化及自主决策能力,而目前的控制系统无法满足上述要求,需从控制系统整体上实现突破和升级,形成新的控制框架。

2 航天器智能自主控制技术新思考

本文通过引入演化机制,提出一种“感知(Obse-rvation)-演化(Evolution)-决策(Decision)-执行(Action)”星上闭环控制框架,使航天器具备深层次理解任务场景的感知能力、根据不同任务改变自身角色的演化能力和自主应对空间不确定性的决策能力,从而提升航天器的智能自主水平。

2.1 “感知-演化-决策-执行”控制框架

OEDA控制框架的示意图如图1所示,包括三个回路:“OA”对应传统的航天器控制回路,以姿轨测量信息为反馈量,进行姿态机动或变轨等动作;“ODA”回路通过引入决策环节,以目标特征和意图等高层次信息作为反馈量,实现航天器在空间任务具有较大不确定时的自主调整;“OEDA”回路则在此基础上引入演化环节,基于场景理解结果使航天器通过角色定义、自组织软硬件资源应对不同目标和多种任务场景,解决未知场景下的连续、适度、可控的任务遂行。

图1 航天器“感知-演化-决策-执行”星上闭环控制框架

2.2 “感知-演化-决策-执行”控制框架的特点及功能

新的OEDA控制框架以感知、演化、决策和执行为功能模块,由传统“测量-控制-执行”的单层串行机制升级为“感知-演化-决策-执行”的多层并行机制,可使航天器在执行任务过程中应对不确定性的能力得以有效提升。其特点和功能提升主要体现在:

1)在感知层面,OEDA控制框架中被控对象由航天器升级为广义被控对象,包括航天器、空间环境、任务目标等,对应的测量过程也由传统的姿轨测量升级为广义感知。在姿态轨道测量的基础上,利用多源信息融合手段,对任务目标和空间环境进行多层次的特征提取和融合,完成空间威胁预警、空间目标识别、自主定位与跟踪,根据任务特征通过推理认知实现对当前任务场景的高层次理解。

2)OEDA控制框架引入了演化机制,可使航天器根据感知结果在自身能力约束下对任务的态势发展进行推演,确定航天器当前所需角色及对应的能力范围,并据此通过自组织软硬件资源,动态、连续地调整自身状态,适度地利用星上资源,有效应对不同目标和任务,提升航天器执行任务的泛化能力。

3)OEDA控制框架中的决策直接面向任务和环境,针对顶层任务需求,对感知和演化结果进行综合分析,通过知识推理和迭代优化,形成序列化的最优决策和动作规划,使航天器能够根据具体任务、运行环境和自身状态,自主完成任务调整、分解、规划与编排。

4)OEDA控制框架中的执行环节是根据决策结果,精确解算执行机构指令实施变轨方案、姿态指向、载荷开关机、载荷指向等动作,以保证任务完成。

总体来讲,所提出的OEDA控制框架以人工智能为关键使能技术,实现了从测量到感知理解、从模式切换到角色演化、从程序化驱动到决策规划的星上自主运行,赋予了航天器类人行为属性的自主控制能力,降低了对地面的依赖,从而提高了能力和效益。

2.3 “感知-演化-决策-执行”控制框架的理论与方法

OEDA控制框架通过引入演化环节使得架构层次更为丰富,易通过分层递阶的方式提升智能水平,有效增强航天器面对多变任务时的泛化能力。然而,若依然采用传统的串联式架构实现OEDA星上闭环,外部信息需通过逐级传递形式完成决策及演化交互,当航天器面向实时性要求较高的复杂不确定任务场景时,此种架构形式难以支撑任务高效遂行[88]。为此,本文提出的OEDA控制框架采用多层并联的混合式架构,提高控制框架智能水平的同时,在串联架构中融入并联思想,通过感知环节将框架各层高效联通,使得OEDA框架中演化、决策、执行环节能够快速获取任务及环境信息,有效提升系统实时性。本文所提OEDA控制框架中所涉及的相关理论与方法具体体现在信息获取、角色演化、任务遂行三个方面,三者与控制执行环节的内在联系如图2所示。

图2 OEDA控制框架各环节中的理论与方法

信息获取主要涉及目标形态特征提取、行为特征提取、意图判断与场景理解。首先采用图像、点云等信息进行互补,克服任务目标可见性随时空、光照、辐射特性变化差异性大的不利条件,完成目标及特征部件的快速分割和准确识别,得出任务目标的形态特征及其表达;同时,将目标姿轨运动检测、估计与行为信息进行关联,实现多时空非完备信息下任务目标的行为特征提取与表达;最后,在知识引导下基于有限样本学习方法实现推理模型的构建与优化,并结合具体任务环境及历史信息,利用所提取的任务目标形态特征和行为特征进行融合推理,从而实现对目标特征的提取、意图的判断以及任务场景的理解。

角色演化主要涉及能力模型构建、模型优化求解以及任务场景推演三个方面。首先通过给出航天器软硬件资源到角色能力的映射关系,得到复杂系统综合能力的高度抽象化归纳,实现系统能力与内在指标的精准关联,为角色演化提供依据;在此基础上,根据具体任务场景,以能力模型为约束、能力要素为优化变量、能力指标为优化目标,通过求解多目标优化问题,得出当前时刻下最优或次优的若干能力要素;最后,根据所得不同能力要素解以及感知环节给出的当前任务场景理解结果,对任务场景发展进行多分支推演,得到当前时刻应选择的能力要素和最优能力边界,据此通过自组织软硬件资源驱动航天器完成角色转变。

任务遂行主要涉及决策反馈机制构建、自主快速决策。首先应考虑感知、决策、执行的耦合特性,刻画任务预判结果、既定任务、能力约束等与目标应对策略间的内在关联关系,形成决策反馈机制;进而,根据感知所得的目标特征及意图,实时对策略子空间进行降维,并在线简化决策参数辨识过程,实现在机动能力、计算能力等多种复杂约束条件下复杂任务的自主快速决策。

可以看出,上述理论方法的使用,可使航天器具备类人的目标意图判断及任务场景高层次理解能力、根据不同任务实现角色定义的自身调节能力、根据目标特征及意图对不确定性的动态策略实时调整能力。

3 发展与展望

将OEDA控制框架实际应用于空间任务时,面临系统建模及分析、智能训练与评价、集群化拓展等多方面难点。为此,需解决多个关键科学问题,具体为:

1)广义系统的模型表达及分析

OEDA控制框架下的广义系统模型是闭环控制系统设计和性能分析的基础,包含航天器对象动力学特性、空间环境特征和控制任务目标及性能等,其作用是实现对感知、演化、决策和执行等行为的综合表征。由于广义系统模型中既存在逻辑变量,又存在状态变量,既存在连续变量,又存在离散变量,既存在确定性参数变量,又存在随机性参数变量等,因此需探索使用何种数学工具有效、合理的刻画广义系统内部状态之间相互依赖、竞争、关联等复杂作用关系,建立其特征表达模型。在此基础上,研究OEDA闭环控制框架下的系统可控性和可观性分析方法,解决OEDA闭环设计问题。此外,针对所建立的广义系统特征表达模型,还需探究采用何种手段对模型的正确性和可信性进行验证,并研究模型校正方法,使得所建立的表达模型更符合实际情况,解决OEDA控制框架的可靠性和安全性设计问题。

2)智能学习训练及可评价性问题

智能学习训练和可评价性研究是基于OEDA控制框架的智能系统实现从设计到应用的核心。对于智能学习训练,一方面是构建在物理模型、环境模型及行为特征等方面接近真实的平行训练场景,从而生成高精度和高可信的训练数据,解决训练样本生成问题;另一方面是考虑任务之间相互关联,网络结构离散参数维度高且相互依赖等特点,研究多任务多目标复杂深度神经网络的高可靠精简方法,突破其所涉及的奖励设计、约束设计、动作空间设计等关键技术,解决以深度神经网络为代表的学习算法在资源受限航天器系统中的应用部装问题。对于智能系统评价,首先应构建功能完善、性能优良的集成仿真验证系统,解决智能系统高保真模拟运行问题;其次还需要研究如何构建合理的系统状态特征,用于关联航天器在轨完成任务能力,建立智能水平验证体系及具体量化评级指标,保证航天器在应对不确定任务场景过程中感知、演化、决策和执行能力是可量化和可评价的,解决OEDA控制框架由理论方法研究转入实际工程应用中面临的可行性、可靠性和安全性问题。

3)OEDA的集群化问题

在感知层面,对于复杂多样的空间任务环境,仅通过单个航天器可能难以获取充足和准确的环境及目标信息,可应用多航天器的信息共享与互补,提高对外部环境的感知与认知能力[88],此时则需研究多层次敏感器、多平台及多源数据的采集、分析、融合处理问题,实现多航天器协同感知与认知,为其角色演化、任务决策与动作规划提供充分依据;在角色演化层面,对于诸如小行星带探测[89-90]、月背探测[91-92]等空间任务,需要多航天器以不同角色协同配合完成,此时应研究根据每个航天器的能力模型、任务类型以及空间部署等因素的航天器角色协同演化方法,以实现航天器集群最优能力部署;当多航天器协同完成复杂空间任务时,各航天器任务区域可能存在时空交叠,导致碰撞风险激增、任务冲突加剧,因此,在自主决策层面,需要研究高效协同决策与动作规划方法,实现多航天器的冲突消解、群智涌现。

此外,随着脑科学、量子科学等前沿科学的发展,未来有望实现上述技术与人工智能的有机融合[93-95], 进一步提升OEDA控制框架的智能自主水平和体系适应能力,促进航天器更智能地融入陆、海、空、天一体化体系架构中,实现全域异构多方位、多视角协同类人应对不确定任务场景。

4 结束语

目前,航天器的控制系统无法实现对场景的透彻理解、不能根据多变的任务进行角色演化、难以在不确定任务场景中进行自主决策,造成其泛化能力有限,制约了未来空间任务的有效实施。为解决上述问题,本文提出了一种新型“感知(Observation)-演化(Evolution)-决策(Decision)-执行(Action)”星上闭环控制框架,讨论了其特点、功能以及所涉及的理论和方法。同时,针对这种新型星上闭环的工程应用,给出了需要研究的关键科学问题。本文所提出的OEDA控制框架,可赋予航天器类人行为属性的自主应对不确定性能力,为未来航天器的发展提供重要技术储备。

猜你喜欢

航天器框架决策
2022 年第二季度航天器发射统计
有机框架材料的后合成交换
2021年第4季度航天器发射统计
《航天器工程》征稿简则
2021年第3季度航天器发射统计
框架
浅谈框架网页的学习
决策大数据
决策大数据
决策大数据