自主航天器天地协同控制模式与技术综述

2023-06-21崔晓峰

宇航学报 2023年5期

崔晓峰

(北京航天飞行控制中心，北京 100094)

0 引言

随着计算软硬件等技术的发展,航天器的自主能力得到不断增强。关于航天器上各类自主功能的需求和设计实现,已经得到大量研究和应用[1-3]。

自主性的发展并不意味着地面对航天器的控制会从一个航天器的整个运行生命周期中完全消失。如Jónsson等[4]所说,“制造人的控制不可及的航天器显然不是人的本意。”现实中,即使对于特别需要器上自主能力的深空探测等任务,在条件允许的情况下,地面的干预和支持仍然是确保航天器安全和任务成功的必要手段[5]。实际上,航天器的“高度自主”与地面控制并非矛盾而是互补,二者在微观上可以是分时的,在宏观上则是共存的。即使对于“全自主”的特定功能,地面仍然可能在其之前、之后甚至之中介入,实施预置、决策、应急等。

另一方面,从技术优化的角度,关于自主性的大量研究和实践均指出,除了特殊场景和运行时段需要完全依靠机器的自主能力,更多情况下,将人完全排除在外的“全自主”并非最有效和高效的系统运行模式,相反,人机结合是比全自主控制更优的选择[6-8]。单纯的“替代人类”,是自动化、机器人等领域研究的早期目标[8-9],“与人组队”则由于更高的应用实效以及经济性、可行性,成为越来越得到强调重视的自主性内涵和发展方向[10-11]。

因而无论从现实还是理论角度,都可以说自主控制与地面控制的共同作用,是自主航天器运行生命周期中必然存在的运行场景和重要特征。这里所说的共同作用,既包括在相同(或相近)时间的两个来源的控制,也包括存在时间先后但有关联关系的两个来源的控制。这种共同控制具有自身的特殊性,也是实践证明容易出现不协调性等问题的根源。另外,要实现上面所说的“与人组队”的自主,还需要新的方法、技术作为支撑,解决好“人与自主”相互依赖以及高效协作等问题[8,12]。当前关于航天器上的各类自主功能已得到大量研究、实现和应用[1-3],针对自主航天器的地面操作流程、工具等也有所探讨[13],但是对于自主航天器天地协同控制的相关问题还关注较少,缺乏系统化的认识和阐述。

1 自主性概念和自主航天器概述

自主性的问题在控制和人工智能(AI)等领域得到了大量研究和实践,但是在现实语境中对其内涵与外延的认识仍存在很大的差异。“独立于人或者其它主体的干预”[14-15]通常被认为是自主的基本特征。除此以外,在有些定义中强调目标导向[16-18]或目标驱动[19],即自主系统按照设定或生成的目标进行行为的规划并加以实施。还有观点认为自主性需要体现在与外部的交互和协作上[6,20],或者突出对环境的适应性[21-22],以及强调具备自学习性[6,21]等等。对于以上各类特性,需要同时具备还是具备其中的某一项或几项即可称为“自主”,并未得到统一。

从词源上,除了主要来源于哲学、社会学等的自主性(autonomous)概念,关于自主性的研究中还存在一种来源于生理学的自主(autonomic)概念。IBM由此提出的自主计算(autonomic computing)[23],基本思想是通过类似自主神经的自管理,解决信息系统的复杂性问题。自管理能力由称之为“self-CHOP”的4个特性组成,分别是自配置、自治愈、自优化和自保护。自主计算也扩展到了包括航天在内的不同领域,例如NASA概念性的自主纳技术蜂群(ANTS)系统架构[16]支持在大规模的探测器群体上实现“self-CHOP”特性。

基于自主性实现程度的多样性,对自主性进行层级的划分成为一个经常的话题。这种划分起源于自动化领域的自动化分级(LOA)[11,24],其中得到广泛引用的是Sheridan等[25]和Endsley等[26]的10级划分法,由此发展的有Beer等[27]的机器人自主性分级(LORA)等。基于这种划分,自主性被认为是从“完全人控”到“完全自主”的一个连续谱段,位于谱段中间的点即为“半自主”。通常按照人与机器的分工对“半自主”的方式进行细分[27],这种基于“人与机器谁更优”(HABA-MABA)思维的分工观念,对于具有动态复杂性的人与自主的协同关系是一种局限[20]。此外,“全自主”的概念容易误导认为“人的排除”即是自主的最高境界,实际上,有观点[28-29]指出人与机器以队友方式工作时的双方都是全自主的。

在航天领域,欧洲航天局(ESA)给出了一个对航天器自主性进行划分的模型[30],提出了4种航天器自主等级,其中“主要由地面控制,器上存在有限安全管理”为E1级;“器上执行预先规划的、地面定义的任务操作,一般是按预置时间执行”为E2级;“器上执行适应性任务操作,一般是设计好的控制规程”为E3级;“器上执行面向目标的任务操作,即面向目标的规划”为E4级。该模型比较符合航天领域的实际,但是包含的自主性概念比较有限,如前所述的关于自主性的多种能力没有得到体现。

从航天工程实践看,通常所说的航天器自主,实际是指能够在其运行生命周期的某个或某些时段中,脱离对地面的实时依赖,在器上实现的各种功能操作。航天器的各种自主功能在应用目标、范围、时段、方式等方面可以有很大不同。这里基于自主性技术的研究和实践现状,从实现特点和能力的角度对航天器上的自主性进行辨识,将其划分为4种类型:程序式自主,是指通过执行事先固化的程序实现自主操作;反应式自主,是指基于对环境或自身状态的响应执行自主操作;目标式自主,是指针对设置的目标通过规划实现器上功能;协同式自主,是指器上具备与地面协同方式工作的能力。此外,目标式自主和协同式自主都可以融入适应、学习和演化等特性。以上四种类型的划分,基本覆盖了研究领域提出的各类自主性概念,并对应当前和(近期)未来航天器自主性具有的特征和能力。

2 自主航天器的天地控制模式划分

这里针对自主航天器的天地控制问题,基于相关研究和实践现状,总结提出自主航天器天地控制的3种模式。图1说明了3种控制模式及其与4种自主类型(以及完全人工控制的“无自主”和完全器上控制的“全自主”两种特殊情况)的关系。

图1 航天器自主类型和天地控制模式Fig.1 Types of spacecraft autonomy and space-ground control modes

指令直接控制模式是指由地面发送指令对航天器进行直接控制。该模式可作用于4种自主类型以及“无自主”和“全自主”航天器,如图1中控制线①～⑥所示。对于程序式和反应式自主航天器,这是一种当前通常使用的控制方式。对于目标式和协同式以及“全自主”航天器,这是一种辅助性的控制方式(图中虚线表示),作用是实现直接干预。

目标策略控制模式是指通过设置目标和策略实现对航天器的控制。该模式主要作用于具有目标式自主能力的航天器,如图1中控制线⑦所示。对于协同式自主航天器,这里认为其应具备向下兼容目标式自主的能力,因此也能够辅助使用目标策略控制模式,如控制线⑧所示。

协同交互控制模式是指通过地面与航天器之间的协同与交互,实现对航天器的控制和共同完成任务目标。这种控制模式只能作用于具备协同式自主能力的航天器,如图1中控制线⑨所示。

图1所示的4种自主类型以及无自主和全自主两种特殊情况,在实际中通常是一个航天器的不同自主状态,而非某个固化类型的航天器。一个实际航天器通常是多种不同作用和实现方式自主功能的组合体,并在整个运行生命周期中动态转化,这种转化又称为自主性调节或动态自主性[28]。

从自动化与机器人控制的角度,对于带有部分自主性的机器进行的控制,即介于完全手工控制与完全自主运行之间的方式,通常称为监督控制[25,31]。按照这个概念,图1中对除了无自主和全自主两种情况以外的自主类型进行的控制,即控制线②～⑤和⑦～⑨,均可认为属于监督控制的范畴。

3 自主航天器的指令直接控制模式

3.1 指令直接控制模式的概念

指令直接控制,是指地面发送指令(序列),航天器严格依照每条指令执行相应的动作,不对指令进行任何改变性操作。这种控制是一种最传统和基本的控制方式,也是当前仍大量使用的控制方式。

指令直接控制属于手工控制[26]、直接操纵[32]的控制方式。指令直接控制的航天器如果没有自主功能,则地面指令就完全决定了航天器的后续状态,这等同于机器人控制中的遥操作[27]。如果航天器具有一定的自主功能,例如自主健康管理等,则航天器的后续状态实际是由地面指令和器上自主控制共同作用的结果,这是一种特殊的控制形式,类似于机器人控制中的共享控制[25]。鉴于当前的航天器几乎没有例外地都带有一定的自主能力,因此这种共同控制的形式是一种实际最常见的应用场景。

3.2 指令直接控制模式的问题

对于指令直接控制模式,已有对其存在不足的讨论主要是相比器上自主控制方式而言,包括器上控制不闭环、不能适应变化、地面工作复杂等[33-34]。如前所述,当前实际存在的普遍情况是对具有一定自主性的航天器使用直接控制方式,由此带来的问题还较少得到关注。在这种场景下,航天器接受地面和自主两种来源控制的共同作用,可能发生地面指令执行后的实际状态与预期不同,甚至更严重的危害。实践证明该类问题现实存在甚至时常发生,以下通过一个假设的简化例子加以具体说明。

例1.地面欲使器上在指定时刻(t2)断开控温回路并在之后保持断开状态。为此地面发送指令在t1和t2分别执行禁止自主控温和断开控温回路的指令,预期在t2之后,控温回路能够持续为断开状态。图2(a)示意了预期的指令执行时序,即在t1之前允许器上进行自主控温(例如在ta),在t1之后则自主功能被禁止,于是在t2执行了断开控温回路指令之后,器上不会再有自主指令又将控温回路接通,因而断开状态可以得到保持。

图2 例1的预期控制结果与实际控制结果Fig.2 Expected and actual control results in the Example 1

以上虽然地面已经考虑到了器上的自主功能可能会影响预期的控制目的,采取了先在t1禁止自主控温的措施,但实际却仍然会发生非预期的结果,即在t2之后某个时刻控温回路又变为接通状态。这是由于器上自主控温功能的实现方式是首先检测温度是否超限,如果超限则发出接通控温回路的指令,而从检测到接通(ta1到ta2)实际存在一个微小的时间间隔,于是就可能出现如图2(b)所示的时序,即在t2执行了地面发送的断开控温回路指令之后,在ta2又执行了自主发出的接通控温回路指令,因而控温回路最终处于接通状态。

上述结果虽然作为个例有其具体原因,但实质上代表性地说明了对自主航天器采用指令直接控制方式时的天地指令冲突问题。进一步分析发现,问题的根源在于这种方式实际建立在地面能够准确预测器上每时每刻状态和指令执行细节的假设前提上。然而在这种假设实际通常难以成立,因为地面不掌握器上自主触发动作的确切时机,无法精准预测和匹配天地指令的时序关系,由此使得二者之间产生不匹配不协调,器上最终出现非地面预期的结果。

3.3 指令直接控制模式问题的检测与解决

在采用指令直接控制方式时,为了避免出现上述问题,要求地面对器上的控制执行机制做到深入细致的掌握,并通过严密分析以及概率仿真,发现可能的时序错误和指令冲突,有些问题需要在单个时钟周期的粒度才能发现,难度要求很高。

为此这里另外给出一种程序模拟的方法,就是将地面指令和器上自主指令的执行逻辑模拟为并行程序进行分析。其基本思想是,地面指令与器上指令发生冲突的根本原因是二者的并行执行以及对同一状态进行不相容的操作,而操作的时序对最终的结果有决定性作用。因此通过并行程序模拟的方法,可以比较简单有效地达到发现该类问题的目的。

对于上节例子,可以将地面指令和器上指令分别用图3所示的伪码程序进行模拟,其中自主控温的状态和控温回路的状态作为系统共享变量进行描述。从该程序就可以比较容易分析出,器上程序和地面程序作为并行程序实际存在一个竞争条件,即两段代码在不同的执行顺序下将出现非唯一的执行结果。具体而言,假设初始状态是自主使能(au=ON)且温度超限,则程序在一些情况下(例如代码块执行顺序为B1-B2-B3或B3-B1-B2时)的执行结果符合预期(sw=OFF);而在另一些情况下(例如代码块的执行顺序为B1-B3-B2时),则会出现不符合预期的另一种结果(sw=ON)。

图3 地面指令与器上自主指令的并行程序模拟Fig.3 Parallel program analogy of ground commands and onboard autonomous commands

此外,除了上述静态分析的方法,还可以采用形式化建模的方法对并行程序的特性进行验证。例如对上述程序可以转换为PROMELA语言的形式化表示,使用模型检测工具SPIN对期望的属性“sw最终值为OFF”(线性时态逻辑表示为◇sw==OFF)进行检测,能够自动检测出该属性的不满足,即说明会出现与预期不同的并行程序执行结果。

可以看到,通过上述分析和检测的方法,能够有效发现地面控制指令与器上自主行为可能存在的耦合关系和不唯一结果。上述方法的有利之处是不需要对器上的处理细节有很具体的了解,仅从天地控制逻辑的并行关系分析潜在冲突,虽然并不严格代表器上状态,但能够快速发现存在问题的可能,从而避免了地面指令编排时对器上状态预测的困难,并且能够实现一定程度的自动化验证。

从问题解决的角度,一旦能够发现该类问题,则可以针对具体情况采取相应的解决措施。例如对于本例,可以采取拉长地面两条指令间隔(原则上大于ta1到ta2的最大时长即可),或者在器上程序中使用临界区(将自主检测到执行的代码设置为不可打断的临界区)从而避免产生竞争条件等方法,在此不再详述。这里需要指出的是,由于指令直接控制模式的本质特点,各种应对方法实际都还难以成为从根本上实现天地协调的系统化途径。

4 自主航天器的目标策略控制模式

4.1 目标策略控制模式的概念

“目标”是意图的抽象,代表一组期望的世界状态[40]。目标能够通过行为(序列)获得,从目标推导出该行为序列的过程即为规划[35]。目标式自主即是通过行动获取目标的自主能力[18]。对航天器实施目标控制就是由地面设定预期的目标,由器上通过规划确定实现该目标的动作并加以实施。

NASA的远程Agent(RA)作为一个自主性架构,首次实现在轨航天器的基于目标的操作(GBO)[34],并在深空1号(DS-1)探测器上得到成功验证[5]。地面对RA的控制是通过发送称为任务剖面的目标文件,建立和调整器上管理的任务目标。此外,NASA运行于地球观测1号(EO-1)卫星的自主科学航天器试验(ASE)[36]架构、运行于火星科学实验室(MSL)探测器的任务数据系统(MDS)[37]架构等,都实现了类似的面向目标控制方式。除了这些在系统级实现目标控制[38]的范例,还有许多器上特定功能的实现也可归为目标控制类型,例如指定控制效果的轨道控制、指定目标点的移动控制等,这类控制方式在现有航天器上已得到大量运用。

“策略”在有些语境下的含义等同于计划,即“获取目标的行动”[39]。策略的另一层含义是“指导行为的原则”,在许多方法中通常表示为条件-行动规则[39],或者更基本的规则例如阈值、优先级等[40]。策略管理是针对复杂系统管理而产生的概念和方法,基本思想是通过对策略的操作改变系统的行为,而不是对系统进行直接的控制,达到简化设计与管理的目的[40]。自主计算[23]以基于策略的管理(PBM)作为主要实现机制,其中策略是对自主行为和特征的期望要求的一种标准化的外部表示[41]。

策略方法应用于航天器控制,就是由地面指定器上规划等各种处理所使用的规则、方法、知识、条件等,从而引导和限定器上行为使之符合地面的期望。作为一种基于策略的方法,Pea等[42]提出了MacMAS方法,用于对系统的自主属性进行规约,基于该规约进行策略的构造,并将该方法运用在NASA的ANTS自主系统架构上。此外,其它通过设置阈值或各种参数数据对航天器上的自主管理,或者自主导航、自主探测等特定功能进行调谐导向的方式,也都可以从广义上认为属于策略控制。

综上所述,目标与策略的概念具有内在的共同点,即都是在比具体操作更高层次上的、可用于支配系统行为的抽象。因此这里综合二者归纳为“目标策略控制”模式,即地面通过对航天器设置目标以及对相关模型和规则进行调整,由器上通过自主规划和执行,实现目标和策略导向的自主运行。

4.2 目标策略控制模式的特点优势

基于目标和策略对系统进行控制的方式都是通过提高抽象层次,避免了在实施细节上进行操作的复杂性[40]。具体而言,目标策略控制模式的优势主要包括以下几个方面。

首先是能够实现控制的匹配性,从根源上杜绝指令冲突。由于在该模式下所有的指令都是由器上生成,目标导向的航天器能够结合器上的具体状态,完整处理所有的约束和冲突,统筹目标的全集,在确保目标实现的同时,也确保了指令的协调性,提高了器上控制的效率和实现地面控制意图的可能。

同样以第3节中的例子,给出一种目标策略控制模式的实现,说明其比指令直接控制模式杜绝指令冲突问题的有效性。为简化起见,这里假设使用一种简单的目标处理方法,即首先从每个目标推导(规划)出其对应的动作,继而对动作集合进行冲突检测,根据优先级确定动作的执行和取消。本例的具体控制可以表示为两个目标G0和G1,分别为器上的默认目标和地面的设置目标,图4说明了每个目标的含义及其在不同情况下导出的动作。

基于建立的上述目标,即可以在任意时刻通过目标处理,得到最终执行的动作,并确保无冲突的发生。图5给出了各种可能结果中的3个示例,其中(a)和(c)两种情况下的动作与目标无冲突而得到执行,(b)中的动作与目标冲突而得到取消。

图5 例1的3个控制实例和结果Fig.5 Three control cases and results of the Example 1

从该例可以看出,基于目标的控制方式能够有效杜绝指令直接控制方式的指令冲突和结果非预期问题,并且天地的控制逻辑都得到简化和清晰。从地面角度,只需指定期望的目标,无需关心器上执行时的状态,更不必人为禁止自主功能;从器上角度,通过目标处理算法的通用化,以及目标规约的相互解耦,在确保不会出现指令冲突的同时,实现了“关注点隔离”的良好设计理念。

第二方面的优势是实现的灵活性,能够更大程度保证目标的获得。在该模式下,地面传递给航天器的实质上是高层的意图和规则而不是固化的指令,航天器只需保证的是意图的实现和规则的遵守,而使用的指令和发令的时间都可以进行灵活调整,使得计划避免由于固化而失败。例如在RA架构中,地面发送给器上的目标文件以及器上规划的结果都最大限度保留允许灵活变化的指令时间,从而在执行环节能够尽可能保证计划的成功实施[5]。

第三方面的优势是地面的关注点从实现层向目标层转移,效率得到提高。指令直接控制方式下的地面指令编排工作量和无差错要求是巨大的压力负担[34]。在目标策略控制模式下,地面不再关注具体指令及其时序而只需聚焦目标和规则,有利于在更高层面上筹划和分析任务。在基于ASE的EO-1卫星运行过程中,据统计从观测发现到重新观测的时间从12～26 d缩短至6 h,获得有效科学数据增加了100倍,运行成本节约100万美元/年[43]。

4.3 目标策略控制模式的实现框架

这里给出目标策略控制模式的一个天地综合实现框架,如图6所示,其中传统的指令和数据处理等底层功能作为实现目标策略控制的基础。

图6 目标策略控制模式的实现框架Fig.6 Framework of the goal-policy control mode

地面系统主要包含目标策略的规约、推演、设置、跟踪等逻辑单元。目标策略规约实现对控制意图的捕捉和规格化定义。目标策略经过推演验证确保一致性和可行性。验证后的目标策略通过上行对航天器进行设置。通过下行数据信息还原出器上的自主规划、决策、执行过程和结果,对行为和状态进行评估及预测,做出目标策略调整的控制。

4.4 目标策略控制模式的关键技术

为实现目标策略控制模式和上述基本框架,需要一系列不同于传统指令控制模式的关键技术作为支撑,以下简述其中的主要方面和研究现状。

(1)目标建模与验证:目标建模即建立目标模型(GM),是对目标进行规划、验证、推理等操作的基础,目的是实现目标的准确、显式描述。在需求工程、Agent等领域的研究中,已经提出KAOS[44]、Tropos[45],以及形式化的约束目标模型(CGM)[46]等多种不同的目标模型。Braubach等[47]给出的目标显式化模型,包含一个通用化的目标生命周期,描述了目标在运行时的状态和转换关系,以及四个带有特定执行行为的目标类型。

目标验证是对目标(集合)的一致性、可满足性进行判定。KAOS和Tropos都支持基于线性时态逻辑(LTL)对约束进行形式化规约和分析[46]。Nguyen等[46]基于CMG模型对偏好和数字属性的表达,使用解析器实现输入模型精化和偏好最大化的自动推理。Thanagarajah等[48]给出了目标的显式化表示,支持目标一致性检测和冲突解决。

(2)目标规划与执行:目标规划即通过规划算法从目标导出行为序列。目标规划是实现目标式自主的核心功能,相关技术已有丰富的研究和应用[49]。针对航天任务的特点,基于时间线的时态约束规划模型得到广泛应用,例如PS[34]、CASPER[36]、PLASMA[38]、EUROPA[50]等规划器和框架。

目标的执行就是将目标规划的结果转化为末端的行为序列并加以实施,但是单向的执行过程在遇到某个步骤失败时只能以目标的放弃而退出。在RA架构[51]中,通过对目标的执行过程进行监视,并进行基于模型的问题识别和重构方案的建立,最大程度保证计划的继续进行和目标的实现。

(3)目标谋划和目标推理:在目标导向的自主运行过程中,一味追求目标集合的全部满足可能并不可行或者效果并非最优。目标谋划(goal delibe-ration)的作用即是解决目标之间的交织问题,确定选择哪些目标付诸实施,以及对哪些目标进行延缓或放弃[47,52],这是自主系统具备“理性行为”的基本要求[53]。基于意图理论[54]的信念愿望意图(BDI)方法为目标谋划提供了一种基础框架[55],作为该类方法,Pokahr等[52]在Jadex BDI推理引擎上实现了一个用于目标谋划的解释器架构。

目标推理(goal reasoning)是指自主系统通过对正在执行的目标进行推理而改变目标,包括当前目标的暂停、退出以及新目标的生成等[56]。作为自主系统的一种重要能力,目标生成实现了应对变化的环境条件,包括通过生成新目标从而捕捉到新出现的机会,以及解决新出现的问题[57]。Molineaux等[19]和Aha等[56]提出的目标驱动的自主(GDA)给出了在动态未知环境下生成新目标的概念框架。

其余地区都存在综合效率不足的问题，其中荆门、咸宁和随州的农业发展规模报酬都是呈现递增状态，那么在今后的发展过程中应扩大农业生产的规模，同时注重农业生产技术的提高，从而达到纯技术效率有效的状态。

(4)目标设置与跟踪:目标控制模式下,目标的设置和调整是地面对航天器的主要作用方式。为了实现正确合理的目标设置,地面应当具备与自主航天器等同的目标规划执行、谋划推理等处理能力,从而能够对将要设置的目标进行事先的检查、仿真、验证。此外,地面还要对器上的模型库、知识库等进行更新维护,确保器上自主功能的正常运行。在DS-1的RA试验中,即成功演示了地面与器上以异步方式进行目标、模型等更新的操作[5]。

目标具有比指令更高的抽象层级,更长和复杂的生命周期[47]。目标导向的自主行为比传统模式下具有更多的选择性和多样性。地面必须实现目标的跟踪,不仅需要获取目标执行的结果,还需要目标规划和执行的轨迹。为此,器上需要进行信息收集、提炼、下行,地面则需要对器上的目标规划、决策、执行过程等进行还原、判断。针对目标式自主航天器地面操作的新型数据分析、预测、显示工具,Rajan等[58]和Castao等[13]给出了探讨和示例。

(5)策略规约与执行:策略的规约就是实现策略的建立和表示,是策略管理的基础。对规约的策略进行管理并加载、解释、执行,是实现策略控制的关键[40]。Dulay等[59]提出了一种策略规约语言Ponder和基于Ponder的策略部署模型。针对自主航天器,Tipaldi等[60]基于所提出的器上实现自主性的三层结构(功能层、操作层、决策层),初步探讨了地面生成与维护器上运行所需策略的挑战。策略方法在航天领域的系统化研究和实践还有待深化。

5 自主航天器的协同交互控制模式

5.1 协同交互控制模式的概念

目标策略控制模式与指令直接控制模式虽然有根本差别,但二者也存在一个共同点,就是地面与航天器之间均为一种“控制-被控制”的关系。协同交互控制模式则在这一点上又有了质的改变,在这种新的控制模式下,地面与航天器以团队的方式运行,通过协作更有效和高效地完成更复杂的任务。

如前所述,能够支持协同交互控制的航天器需要具备协同式自主能力。协同式自主的相关概念在机器人、AI等领域中已得到广泛重视,包括协同自主[20]、共享自主[61]、以人为中心的自主(HCA)[62]等。协同自主是从协同的视角定义自主,如McNeese等[63]提出“自主是一种能够与人作为队友工作,包含其核心任务工作和团队工作功能的技术”。Dorais等[62]提出以人为中心的自主替代与人没有交互的黑盒式自主,实现人与自主系统的灵活交互。

与协同自主概念相应的,人对具有协同自主能力的系统进行的控制,即为协同控制[64]。Fong等[65]提出协同控制的概念,即人与机器人作为队友共同完成任务目标。人与自主组队(HAT)[6,11]也是以人与自主系统组合的方式实现高效团队工作。Bradshaw等[66]针对航天应用中的人与机器人的协作,提出采用以团队工作为中心的自主,而不是以自主为中心,其中人与自主系统并行工作,任务执行的过程具有增量式、协商式、应变式的特点。

综上所述,这里提出的自主航天器的协同交互控制模式,是机器人、AI等领域中的协同控制等理念和技术在航天器控制问题上的映射。在航天领域中,相关的研究和应用主要关注空间机器人一类的控制对象,此外对于在轨航天器的天地协同式管控方面有一些积极的探索[67-68],总的来讲,针对广泛意义航天器的研究应用还在起步阶段。

5.2 协同交互控制模式的特点优势

对协同自主和协同控制重要性的认识来自实践与研究。在传统的自动化领域中,忽视人与机器的关系而造成的“自动化惊讶”[9],以及由此总结的“自动化反讽”[69],均揭示出对于自动化系统,关注人的交互问题的重要性。同样针对自主系统可以说,自主并没有消除人机交互的需要,而是对其有了更特殊的依赖性和更高的要求。以下从3个方面进一步说明协同交互控制模式的重要意义。

首先,对于后果影响特别重要的应用,如军事、航空、航天等,人应当具有对机器的掌控权力,即人需要在回路中[4,10],这是得到普遍认可并付诸实践的系统原则。航天器和航天任务的特殊价值无疑使之不会在有条件的情况下排除人的监督与控制。协同交互提供了人在回路的控制方式,并且这种交互不是简单的“控制-被控制”,而是能够充分发挥自主能力同时以高效方式实现人的参与和支配。

其次,大量的研究和实践已经共同证实,人与自主相协同的方式是比完全人工或完全自主都更高效的运行模式,特别是在不确定性的环境中[6-8]。人的经验、直觉、判断、决策能力与机器的存储、计算、严格能力具有很大的互补性,并且对航天任务而言,地面的计算能力和数据资源与航天器上未能下传的感知信息也是互补,人与器、天与地相结合的方式可以成为实现整体增强的高效途径。

最后,人与自主的协同有望做到更有效的差错避免。人与机器的差异不仅体现在能力上,还体现在人可能由于情绪、注意力等原因出现疏忽性错误,机器则不会;机器会由于设计缺陷造成荒谬性错误并浑然不知,而人却很容易发现。此外,机器掌握最即时和全面的状态,更利于发现人由于掌握信息不够导致的不合理操作。因此,通过人机协作互助纠错,能够为系统整体安全性提供更大保证。

5.3 协同交互控制模式的实现框架

这里给出协同交互控制模式下的一个天地综合实现框架,如图7所示,其中目标策略控制和传统的指令与数据处理功能作为协同交互控制的基础。

图7 协同交互控制模式的实现框架Fig.7 Framework of the collaborative interaction control mode

航天器上主要包含协同交互会话、地面意图理解、自感知与信息提炼等逻辑单元。通过协同交互会话,从地面上行信息中提取地面意图,经过理解,成为引导器上行为的依据;另一方面,器上通过基于状态的自感知与信息提炼加工,形成主动传送的信息,通过协同交互会话下行给地面。

地面系统主要包含协同交互会话、器上态势感知、地面决策与响应等逻辑单元。通过对下行信息的处理,获得器上的态势感知,基于态势感知进行地面的决策与响应,并通过协同交互会话,实现与航天器的协同交互控制过程。

5.4 协同交互控制模式的关键技术

为实现协同交互控制模式和上述基本框架,需要一系列不同于前述两种控制模式的关键技术作为支撑,这些关键技术当前主要在人与机器人交互(HRI)等领域中得到研究与实践,如何适应航天器天地协同的问题特点进行发展运用,相关的研究和验证都还较少,这里给出初步的分析探讨。

(1)协同实现机理:基于人类团队活动研究的联合活动等理论[70],为人与自主系统的交互问题提供了协同机理的基本指导。联合活动是指团队基于共同目标开展的协同活动,Klein等[71]提出其4个基本需求,即基本契约、共同基础、可预测和可导向。基本契约是指对共同目标和参与协同的认可;共同基础是指共享的相关知识、信念、假设等;可预测是指行为对于队友具有可预测性;可导向是指能够接受队友的指示影响。

作为联合活动的一种主要形式,混合驱动的交互[41]是协同交互控制模式有别于传统控制的基本特征之一。在混合驱动的交互中,地面与航天器都可以成为交互的主导者,进行主动给予、主动支持、主动请求等,具体的方式可以包括问询/回答、请求/响应,以及迭代会话等,并实现合作式的规划、决策、诊断、学习等特定功能。作为航天器与地面交互新模式的范例,一些器上主动按需向地面请求管控和服务的方法得到提出[67-68]。还有更多的协同交互场景与技术有待发掘与实践,例如在环境不确定的小天体探测中的应用等。

另外需要指出的是,人与机器的协同与人类之间的协同不尽相同[70],地面与在轨航天器的协同和人与机器人的协同又有很大不同,因此协同交互控制模式的实现需要紧密结合本领域的需求和特点,使得协同得以有效和高效实现,这个问题的进一步认识和良好解决也应是后续研究的一个重点。

(2)交互机制与策略:交互是通过信号传递[70]实现联合活动的基本手段,交互的机制与策略包括交互语言、交互协议、交互内容等,是实现交互的物理支撑。航天任务中地面与航天器之间均为远程交互,并存在特征的多样性,主要体现在时延和间断性的差异。这里用四象限法将其定性地划分为四种类型,分别是持续(近)实时交互(例如通信全覆盖的地球空间站)、间断(近)实时交互(例如测控站断续跟踪的近地卫星)、持续延迟交互(例如长时间测控可见的深空飞行器)、间断延迟交互(例如通过轨道器中继的行星表面巡视器)。

可以看到,地面与航天器的协同所基于的交互特点与通常环境中的人机交互[28]有很大不同,通信条件的限制使得交互可能难以及时或持续进行,一些通常使用的基于实时会话的交互机制和技术将不适用。如何在此条件下设计合理高效的交互机制,为地面与航天器之间的协同交互提供底层支持,是针对领域特点要解决的基础问题。

(3)团队态势感知:态势感知(SA)是“对环境中的要素的知觉、理解和预测”[72]。自主性的提高使得对人而言的不确定性和不可预测性大大增加[61],因而增加了态势感知的困难。为此,航天器需要增强自我感知能力,即对自身状态的获取、分析、判断以及主动传递。地面与航天器还需要实现团队态势感知(TSA)[73],就是对自身、队友,以及共同的目标、对方的意图、协作的进展等各方面状态的掌握。许多研究特别强调了系统透明性的概念[61],即系统行为的可观察性、可预测性、可解释性等,以及人的透明性,即理解人的意图和行为[74]。

人机界面是态势信息传递给人的通道和帮助理解的工具,因而是实现透明性的关键要素[61]。作为一个设计范例,Gersh等[75]通过建立“手段-目的”抽象层级,对航天器的目标、功能、部件等的关系进行描述,基于该层级结构驱动特定事件相关信息的动态呈现。Chen等[76]提出了一种基于态势感知的Agent透明性(SAT)模型,通过人机界面提供对意图、表现、计划、推理的理解。

(4)自主性调节:一个航天器的自主能力和控制模式在其运行生命周期中不应是固化不变,而是可以动态转换的。航天器需要具备针对不同场景的需要呈现不同自主性特征的能力,这种变化的自主性即为可调节自主性[62]。自主性调节的关键问题是确保调节前后的状态正确,避免由于调节而丧失原有的态势感知,破坏运行的连续性和正确性,如同Kortenkamp等[29]指出的交换控制中的问题。

自主性的调节可能由地面驱动,也可能由器上发起。器上的认知失效[34]设计,使之能够识别到任务或功能执行的不成功而实施失效处置,包括触发监督模块进行自主性调节[62]。地面对航天器自主性进行调节时,可以通过操作器上的目标库、模型库等实现改变。Bradshaw等[41]提出了利用策略机制实现自主性调节的方法,可以认为是前述目标策略控制模式的一种结合应用。

(5)协同效能评估与提升:协同交互控制模式下,地面与航天器各自的工作效能以及整体工作效能,是衡量该模式成功与否的关键标准之一。航天器自主性的提高对于人的工作强度具有减轻作用,但是也存在负面影响的风险,包括注意力降低、态势跟踪不及时、快速响应能力退化等,在自主性动态变化的情境下,还对地面的正确响应与处置能力提出更高的要求。

6 结束语

随着航天器自主能力的不断提升和自主性航天任务的不断增多,如何实现对自主航天器的天地相协调的控制,并不断提高任务执行的效能,是需要加以关注的重要问题。指令直接控制代表了传统的“人工控制”理念,自主行为与地面指令存在天然的难协调性;目标策略控制代表了“机器控制”的理念,为从根本上实现全局一致性提供了可能;协同交互控制则代表了“人机协同”的理念,有望实现协调高效的“人与器”的团队协作。

在当前的工程实践中,针对在轨航天器的指令直接控制仍为使用最多的控制模式,目标策略控制的系统级实现还较少,协同交互控制的相关研究和应用则整体还处在起步阶段。随着技术的发展,航天器自主能力的持续增强,不仅体现在其独立于地面工作的能力,还体现在其与地面高效交互、协同合作从而完成更具挑战性任务的能力,这种人机协同的方式,将是航天器运行与控制的一个重要发展方向和有待进一步研究探索的领域。