APP下载

面向任务的复杂系统韧性评估方法

2021-04-07白光晗陶俊勇张云安方依宁

系统工程与电子技术 2021年4期
关键词:韧性扰动节点

刘 涛, 白光晗, 陶俊勇, 张云安, 方依宁

(国防科技大学智能科学学院装备综合保障技术重点实验室, 湖南 长沙 410073)

0 引 言

韧性源于拉丁文“resiliere”,意为反弹,迅速恢复。国内部分学者也将该词译为弹性、恢复力,即表征一个实体或系统在发生破坏其状态的事件后恢复正常状态的能力。1973年文献[1]将“韧性”定义为“生态系统持久能力以及系统吸收变化和干扰后仍然保持种群或状态变量之间的关系的能力”,从此将韧性一词引入科学领域。至今,韧性研究已涉及诸如经济系统[2-3]、社会政治[4-5]、工业工程[6-9]、军事[10-13]等多个领域。从军事领域角度,韧性是反映系统在遭受敌方干扰或攻击造成毁伤或性能降级后,进行相应恢复手段后仍然能够完成任务的能力。

韧性通常用于评估和提高系统从扰动事件恢复到正常状态的能力,其中一个重要研究内容是系统韧性的度量与评价[14]。目前,主要有两种韧性评估方法,即定性评估方法和定量评估方法。其中定性评估方法通过设计一系列问题和指标来评判对象的韧性情况,而非量化韧性结果[15-17]。定量评估方法是从系统性能随扰动产生的变化出发,通过韧性模型量化系统的韧性过程,以数值的形式表现系统的韧性情况[18]。

Bruneau首先提出了经典的韧性三角形,用一个确定性静态参量来衡量一个地区震后基础设施的韧性损失[19]。该指标认为系统的性能下降和恢复都是立即的,且经过一段时间后能够恢复到100%性能水平。在经典韧性三角形的基础上,Zobei提出一种韧性预测三角形模型,将韧性指标计算的时间范围设定为足够长以使系统能够完成100%恢复[20],并随后改进该模型使其可以衡量连续多次扰动[21]。但韧性三角形和韧性预测三角形模型在韧性中间过程的刻画上过于简单。因此,部分学者进一步关注指标描述整个韧性动态过程的能力。例如,Henry等把系统的韧性过程分为初始阶段、扰动阶段、扰动完成阶段、恢复阶段、恢复完成阶段5个过程,并提出一个以时间为变量的韧性指标,用恢复开始之后指定时刻系统恢复程度与系统发生扰动时性能损失程度的比值作为该时刻的韧性度量[22]。Nan等把单个韧性过程分为初始过程、扰动过程、恢复过程及新的稳定过程,把5个描述系统中间过程的参数整合成一个刻画整个韧性过程的指标[23]。Tran同样设计并整合从不同角度刻画系统韧性的参数,并将该指标推广到多次独立韧性过程[24]。Nan和Tran的指标都是基于相对时间尺度的,因此Cheng进一步引入绝对时间尺度的指标[25],但该指标中时间参数在毁伤和恢复阶段表现相同的作用,即毁伤时间短和恢复时间短均有正向影响韧性指标,但实际上毁伤时间越短,越是代表对系统负向影响较大。

以上韧性度量指标主要基于系统自身性能的变化,用数学模型刻画这些变化过程,用以衡量系统遭遇扰动后的韧性。这些指标均在相关的领域得到一定的应用,但实际生产生活中,某些系统具有明确的任务特性,特别是在军事系统中,例如无人机集群[26]、军事投递网络[13]、保障网络[27]等。此类系统面临战场态势多变、扰动随机性强、恢复策略多样等复杂情况,并且在不同的任务中所扮演的角色也不尽相同。从可靠性领域来看,文献[28]对基本可靠性和任务可靠性的区别进行了阐述,认为后者和任务需求具有很强关联。同样的,文献[29]认为韧性具有两层含义:维持体系正常运行和保障任务顺利完成,所以针对特定任务来说,系统的韧性不应仅仅包含系统自身的性能变化情况,还应包括对于任务的支撑情况。因此,本文从任务执行需求出发,分析任务对系统韧性度量的影响,提出一种面向任务的系统韧性评估方法,即可以描述系统单一韧性过程也可以刻画系统多次随机扰动下的韧性情况。此外,该韧性指标能在具体任务的需求及任务时间下反映系统韧性过程与任务之间的关系,是一个绝对时间尺度下的韧性度量指标。

1 面向任务的系统韧性评估特点

面向任务的系统韧性评估与一般通用韧性评估方法相比,除考虑系统自身的性能变化外,其最大的差别在于具体任务设置会影响相应韧性的评估结果。本节从任务时间相关性、任务过程的不确定性和任务需求相关性3个方面对面向任务的系统韧性评估特点进行分析,并结合实例讨论现有韧性评估指标针对上述特点存在的不足和缺陷。

1.1 任务时间相关性

任何任务都与时间挂钩,不同任务时间下,系统受损情况、恢复策略选择、恢复程度等方面均会有所不同。针对韧性评估的时间方面,现有的韧性指标大体有两种情况,第一类如韧性三角形[19]、Nan[23]等提出的指标,其韧性评估的时间范围是从系统遭遇扰动到系统完成恢复。另一类指标如预测三角形[20-21]、Tran[24]等则是把评估的终止时间设定为系统恢复之后,以使评估的过程包含完整的韧性过程。面向任务的系统必然要与任务时间相关联,而任务时间与任务需求相关,可以是固定时间段,也可以随态势变化。因此,面向任务的系统韧性则需要反映系统在任意时刻的韧性情况,而不仅仅考虑一个或几个完整的韧性周期。文献[22]中Henry的指标虽然以时间为函数变量,但缺乏系统在任务时间内性能变化过程的描述。

1.2 任务过程的不确定性

在系统执行任务的过程中,不可能完全预知扰动发生的时间及规模,特别在高对抗的复杂战场环境下,扰动具有较强随机性。当前指标大多把系统的整个韧性过程划分为几个不同的阶段,例如初始稳定阶段、扰动吸收阶段、系统恢复阶段、恢复稳定阶段等,即使是韧性三角形[19],也通过假设扰动的吸收为瞬态过程,从而简化扰动吸收阶段,直接从系统恢复阶段开始评估,并且认为系统恢复到100%为终点。由于扰动的随机性,当下一次扰动行为发生和当前恢复过程发生重叠时,该方法难以对系统的各个阶段进行准确划分。同时用以描述相应各阶段的指标也难以准确反映当前混合阶段的情况,因此文献[24]中Tran的指标即使可以衡量多个扰动,但也需要各韧性过程不发生重叠。此外,此类指标虽然考虑了韧性过程的各个阶段,形成各阶段相应的一些指标,但其综合指标大多是各阶段指标的简单加权,对于各阶段各参数的权重并无明确的界定。例如恢复程度和毁伤程度孰轻孰重,或者恢复过程中恢复时间和恢复程度哪个权重更大。Ouyang提出的指标考虑了扰动(飓风)以泊松过程的随机形式出现,以当前性能与期望性能之差的累积来衡量韧性,并推广到多种扰动同时发生的情况[30-31]。

1.3 任务需求相关性

系统完成相关任务必然要求系统具备一定的能力,比如侦察预警能力、火力打击能力、综合保障能力等。任务对系统能力是有最低阈值的,即只有系统具备最低阈值以上的性能时,系统方可完成基本任务。以下将通过一个例子来说明当考虑任务需求时,传统的韧性评估方法的不足。军用通信保障系统要求在任务时间内保障两地之间的通信能力,并要求系统的最低传输能力为系统理想性能的70%。如图1所示,在任务执行到第5小时,由于原有光缆遭到破坏,系统只能依靠无线链路维持较低性能通信(如报文、语音等)。此时有两种手段进行系统恢复,一种敷设临时通信电缆,使系统在5 h内恢复至理想性能的75%(恢复策略1),另一种手段为定位故障点并修复光缆,花费8 h,使系统输出回到100%理想性能(恢复策略2)。针对两种情况,分别使用已有的韧性度量方法进行计算,具体计算方法可参考文献[22-24],其中Nan的指标需要计算扰动吸收时间,因此假设两种情况下的扰动吸收时间均为1 h。各韧性指标计算结果如表1所示,采用策略2的韧性要优于策略1的韧性。但结合任务需求来说,策略1在经过临时电缆敷设后,在第10 h恢复系统75%的通信能力,已满足其任务工作需求,在总共20 h的任务时间中,达到任务要求的总时长为15 h。而策略2的系统虽然最终恢复到100%通信能力,但满足任务要求时长总共为12 h。当任务总时长为20 h,就系统满足任务最低工作要求时间占比分析,策略1要优于策略2,因此当前的韧性评估指标在系统任务背景下无法准确评估系统的韧性。

图1 通信保障系统性能曲线

表1 现有韧性指标评估结果

面对这样的情况,某些指标引入性能期望来进一步衡量系统韧性,Bai[32]在Tran[24]的研究中引入了一个系统参考性能标准代替以前指标中的扰动前性能,但仍然不足以体现任务需求,按Bai[32]的方法计算上述问题(期望性能设为75%)可得策略1的韧性值为0.431,策略2的韧性值为0.522,同样得出策略2优于策略1的结论。此外,Tran[24]、Nan[23]以及Bai[32]的指标均考虑的是相对时间尺度的韧性,缺乏绝对时间的度量。Ouyang[30]的韧性指标同样引入了一个期望性能作为参考,认为系统在每次扰动后均以恢复到期望性能为目的,并以系统工作时间周期为自变量计算韧性,对上述军用通信保障系统示例而言,假设系统期望性为100%性能,若取不同的结束时间(均在系统完成恢复之后)计算其韧性如表2所示,随着任务时间的延长,策略2的韧性优于策略1,但从任务可执行时间看,策略1的可执行时间总是优于策略2的可执行时间。因此,Ouyang的指标并没有考虑最低任务需求,而只考虑了系统性能在期望性能下的累计情况。从以上的示例可以看出,当利用传统韧性评估方法度量具有任务需求的系统时,任务需求所带来的影响并没有被纳入考虑。

表2 Ouyang的韧性指标评估结果

综上所述,面向任务的系统在韧性评估时不仅需要考虑系统的性能变化,而且应考虑任务时间、任务需求以及扰动的随机特性。因此,亟需建立一个面向任务的系统韧性评估方法,它应结合任务时间和需求,能够反映系统在绝对时间尺度下面对随机扰动的韧性情况。

2 面向任务的系统韧性评估

2.1 韧性评估框架

面向任务的系统韧性评估框架如图2所示。

图2 系统韧性评估框架

其评估过程共为6步:系统描述、任务描述、潜在扰动分析、恢复策略分析、系统性能度量及系统韧性指标计算。该框架涉及系统设计、任务设置、任务执行、任务评估整个任务过程。

(1)系统描述

面向任务的系统韧性评估首先需要明确评估对象,所要评估的系统可以是待改进的旧系统,也可以是将要设计的新系统。系统的类型可以为独立复杂系统(例如发动机、飞行器等),也可以是由多子系统组成的复杂系统(如保障网络、无人机集群等)。此外,韧性评估应将系统能够提供的理想性能作为重要参考,其理想性能表现为一个随时间变化的性能曲线,例如通信系统的传输质量、保障网络的任务可靠度、无人机集群的侦察覆盖范围等。

(2)任务描述

任务描述包含两方面内容:第一,与系统描述相对应,任务描述应说明系统在执行当前任务需要的最低性能要求;第二,任务描述应包含任务时间说明。因为任务最低性能要求可随任务进展而变化,故两者可由一时间性能曲线表示。一个系统可能在不同的任务时间下完成需求不同的任务,因此合理的系统设计应使系统在考虑韧性及合理的成本下覆盖大部分任务最低性能要求。因此,该框架要考虑系统在不同任务下韧性情况,以便系统工程师进一步分析系统。

(3)潜在扰动、毁伤分析

韧性是考虑系统在任务过程中可能遭受扰动和毁伤的情况,识别任务中可能出现的扰动是极为必要的。简单的说一个系统具有韧性是无法准确描述一个系统的,例如一个地区的保障系统设计为具有较强的抗震能力,在面对地震这样的灾害时具有很强的韧性,但不能说该系统对诸如泥石流等扰动也具有很强的韧性。

此外,战场对抗激烈、环境复杂、难以获取完备信息,敌方的毁伤模式、打击间隔、攻击强度等均具有不确定性,因此面向任务的韧性评估可在分析任务中的潜在扰动与毁伤时引入相关随机过程,以便更真实地反映战场情况。

(4)韧性策略分析

在分析潜在扰动的基础上韧性策略的分析也随之产生,例如通信系统对于电磁干扰或恶意节点攻击的防御及恢复策略是不同的,并且在不同任务场景下可能采用不同策略。一些常见的韧性策略包括器件冗余、受损部件修复、受损部件更换、系统重新配置等。韧性策略在实施过程中同样面临实施时间、恢复程度等方面的随机性。因此,在其恢复过程建模中也应到考虑随机过程所带来的影响。

(5)系统性能度量

系统韧性评估并不是直接检测系统韧性数值,而是以系统性能变化数据为基础,计算出相应系统韧性指标。理想情况下,应采用待评估系统在对应任务下的实际性能作为计算韧性的基础,但系统性能的实际测度在很多情况下较为困难,特别是对于一些大型复杂系统,因此可通过建模与仿真以模拟系统在指定场景下的性能输出情况。例如将装备保障系统通过网络建模和将无人机集群以多agent的方式建模等。

(6)系统韧性指标计算

基于上述步骤获取的数据,即可通过系统韧性评估指标对系统在当前任务下的韧性进行定量评估,具体评估方法详见第2.2节。

2.2 韧性评估指标

一个系统在任务时间(T0~T)内的性能曲线如图3所示。

图3 系统性能曲线图

(1)

式中,[P]为艾弗森括号,仅当P为真时[P]=1,否则[P]=0;α∈{0,1}为时间韧性和性能韧性之间的切换参数。

(2)

则有0≤R1(T)≤R0(T)≤1。由此可看出R0(T)为R1(T)的最优情况,即系统在恢复到最低任务要求时即同时达到最优性能状态。

由上述推导可知,R0(T)考虑了系统满足最低任务要求的累积时间情况,并未考虑系统在任务需求能力之上的性能程度。R1(T)侧重于性能恢复程度,缺乏对任务满足时间的反映。因此,结合时间和性能两个维度的韧性指标,根据对任务的评价倾向设计如下的系统综合韧性指标:

R(T)=βR0(T)+(1-β)R1(T)

(3)

式中,β为系统韧性侧重因子,0≤β≤1,有0≤R(T)≤1。当系统工程师侧重于了解系统在遭受扰动后能够保持最低需求性能继续工作的能力时,可设置较大的β值,使综合韧性指标侧重于任务时间韧性;当系统工程师更加想了解系统遭受扰动后,在任务时间内性能恢复程度及累积情况(如系统产能、累积工作量等)可设置较小的β值,表示综合韧性值侧重于任务性能韧性。

2.3 面向任务韧性评估特点

(1)由式(1)和式(3)可知,面向任务的韧性评估指标是以任务时间T为自变量的函数,即使相同系统面对同样扰动,在不同任务时刻下也会呈现不同韧性值。因此,该指标既可利用韧性随时间的变化预测系统趋势,又可对完整任务时间内综合韧性进行评估。

(2)该韧性评估方法充分利用系统性能曲线Q(t),并未对韧性中间过程进行阶段划分,因此不受扰动及恢复过程随机特性的影响,可以实现系统韧性过程重叠情况下的韧性指标评估。

(3)该方法同时考虑任务最低性能要求和理想性能期望的因素,可更准确地反映当前系统对任务的支撑程度。

(4)该评估方法可衡量系统对于不同任务的韧性,以辅助系统工程师根据所需要求对系统进行配置,例如对于性能要求不高的任务可通过重新配置资源降低系统最优性能以提高系统抗扰动能力。

(5)该指标从时间和性能两个维度反映系统韧性,结合韧性侧重因子,系统工程师可根据实际需求,侧重时间或性能对系统韧性进行评估。

2.4 计算示例

表3 所提韧性指标计算结果

3 基于保障信息交互网络的案例

随着现代高新技术特别是信息在军事领域的广泛应用,战争形态已经从传统的机械化战争逐步转变为以网络为中心的信息化战争,网络中心战将成为未来作的主要模式。因此,装备保障模式逐步向以信息技术为基础的智能化、网络化保障模式转变,即基于信息系统的装备保障模式。诸如装备状态信息、保障调度信息、装备维修信息等保障信息能否在任务执行过程中高效流转决定了保障网络的效能。因此,本节以保障信息交互网络为例,进一步说明所提韧性度量方法的应用。

3.1 保障信息交互网络系统及任务描述

信息交互网络系统可以抽象成由节点和边组成的网络模型[24,33],对于装备保障信息网络来说,节点表示装备保障节点,边表示装备保障节点之间的信息流。该信息交互网络的作用是实现保障节点之间的保障需求上报、保障指挥信息下达和保障态势共享等。信息交互则表现为网络中特定信息通过链路从起始保障节点流向指定保障节点。

文献[34]对装备保障模型进行研究,发现保障网络具有的无标度特性,因此本案例假设保障网络是一个由Barabsi-Albert(BA)模型[35]生成的N节点两状态无向单层网络。该网络初始有m0个相互连通的节点及N-m0个未连接的节点。随后每一次从剩余未连通节点中选择一个节点,并在已连通的网络中依偏好选中m个节点与之建立连接。定义代表新增节点与节点i建立连接的概率,其中ki为节点i的度。假设系统每个时间间隔内,每个节点选择另一个节点向其发送一条信息,定义t时刻网络总信息交换数为其中Nt为当前节点数量,mi(t)为节点i在t时刻接收的消息数,为第j条信息的传播路径长度(源点到目标点的最短路径[36]),Δ∈[0,1]是时间敏感参数。保障网络信息交互数Q(t)即可表示系统实时性能。系统理想性能输出PQ(t)可视为系统正常工作(无扰动、毁伤发生)时的性能。对于具体的保障任务,要求系统工作在某一性能要求以上,设置任务需求参数γ(t)∈[0,1],即

3.2 扰动、毁伤模型

3.3 韧性恢复模型

针对保障节点遭受打击而失效,本案例考虑两种韧性恢复策略如下。

(1)重连

图4 网络重连示意图

(2)修复

当节点i被攻击毁伤后,其连接的边也相应失效,通过修复或更换的手段使毁伤的节点恢复,届时失效的边也相应恢复连接,假设节点i修复时间服从均匀分布TRi~U(ar,br)。

3.4 仿真实验与韧性评估

本保障信息交互网络基本仿真参数如表4所示,仿真实验在不同的毁伤模型、恢复策略及任务时间下对系统的韧性进行评估。值得注意的是,为了让评估结果有对比参考性,设置了网络最大节点失效数w,即一次任务中,遭受打击而失效的节点最多为w个。系统每个时间步长均会统计当前时刻系统信息交互数Q(t),作为系统当前性能指标。

表4 仿真参数

3.4.1 同等任务时间下各场景韧性对比

任务时间为1 000时间步长时的场景韧性对比如图5所示,保障信息交互网络在两种毁伤模式及两种恢复模式下的韧性情况。

图5 相同任务时间下各场景韧性分布

其中,每种场景分别计算了网络最低任务要求性能为期望性能的20%,40%,60%,80%及100%(即γ(t)设为0.2,0.4,0.6,0.8和1)5种情况时网络时间任务韧性和任务性能韧性值,并以两者作为横纵坐标,将仿真结果以散点图的形式反映在坐标系上。因为网络的毁伤及恢复均为随机过程,因此每种场景均进行了20次仿真。表5和表6为两种毁伤模型下,各场景平均时间韧性、平均性能韧性及网络综合韧性评估。

表5 随机毁伤下系统韧性统计

表6 蓄意毁伤下系统韧性统计

从实验中可以得出以下结论:

(1)对于无标度网络,在相同的恢复策略下,随机毁伤时网络的韧性分布相比蓄意毁伤时的韧性分布整体更靠近坐标(1,1),即无标度网络在随机毁伤下,无论时间韧性还是性能韧性,在各最低期望性能下均优于蓄意毁伤下网络的韧性,这符合无标度网络对随机毁伤具有较强抗毁性,而对蓄意毁伤较为脆弱的特点。

(2)无论是重连还是修复策略,其时间韧性和性能韧性均随最低性能要求的升高而降低。特别是对于重连策略,其最低任务性能要求在期望性能的60%及以下时,系统具有较好的韧性,当最低任务性能要求超过期望性能的60%时,系统韧性迅速下降,这是因为网络失去节点后,重连策略可以通过新建连边恢复一部分信息交互能力,但网络的总节点数量不会恢复,因此系统信息交换数量也无法超过网络节点数,故无法恢复到期望性能。相对的,修复策略则能通过恢复被毁伤的节点进而恢复信息通讯能力,最终使信息交互数量达到期望值。

(3)无论对于随机毁伤还是蓄意毁伤,重连策略在最低性能要求相对较低时具有较高的任务时间韧性。这是因为重连策略花费的时间较短,系统能够快速恢复到一定性能水平。但由于受网络节点数量未修复的限制,其任务性能韧性低于修复策略,特别当最低性能要求提高时,其时间韧性和性能韧性均明显低于修复策略下韧性。

3.4.2 不同任务时间下各场景韧性对比

如图6为系统任务时间分别为1 000和2 000,考虑随机毁伤以及重连和修复两种恢复策略,同样将各场景20次仿真结果的平均值描绘在时间、性能韧性坐标系上(图6中L代表重连策略结果,R代表修复策略结果)。任务时间为1 000,在较低任务性能要求时(期望性能60%及以下),重连策略虽然性能韧性不如修复策略,但其时间韧性优于恢复策略。任务时间为2 000时,修复策略的时间韧性即使在较低的任务要求下也接近并超过重连策略。此外,修复策略的性能韧性优势也愈发明显,这是因为修复策略虽然费时较长,但若放在越来越长的总任务时间来看,其占比也越来越少,而其性能占比反而越来越高。因此任务时间的长短应作为恢复策略选择的一个重要参考。

图6 不同任务时间下各场景韧性分布

3.4.3 韧性恢复策略分析

以上案例中主要包括重连和修复两种韧性恢复策略,从恢复效果来说,重连策略以较少的时间达到相比修复策略较低的性能恢复程度,而修复策略则以较长的恢复时间达到期望的恢复性能。针对不同的毁伤情况及任务要求,不同的恢复策略各有优劣。从实验结果可以看出,当任务时间不长且最低任务要求不高时(例如需将少量信息快速交互),重连策略可以快速使系统达到可工作状态,进而继续完成任务。当系统执行一个相对长时间的任务,且对数据交互的总量有较高要求时,修复策略虽然在恢复过程花费时间较长,但能使系统恢复到任务要求的性能,并在之后的时间继续以这样高性能工作,使系统在总的任务时间内具有较强的韧性。因此,当系统遭受扰动时应同时考虑扰动情况、任务执行时间、任务性能需求及各恢复策略特点,选择适合于当前态势的韧性恢复策略。

4 结 论

系统韧性作为一种系统抵抗扰动及恢复的方法,为管理者和指挥官提供了新的系统设计思路和分析角度。韧性的评估是韧性研究中的重要组成部分,当前韧性评估方法主要刻画系统性能在扰动下的恢复情况,并未考虑系统执行具体任务的需求。因此,本文从任务需求和任务时间出发,设计了一种结合系统遭受扰动后性能和时间两个维度的韧性指标。相对于已有方法,该指标既能从系统性能角度反应系统在扰动抵御、吸收、恢复等过程的变化,又可在任务时间内刻画任务需求完成的情况。以战时保障信息交互网络为例,当系统在任务执行过程中发生具有随机特性的毁伤和恢复时,所提出的韧性度量方法可以准确刻画系统面临敌方毁伤时,在不同任务需求及任务时间下的韧性情况。下一步工作将以面向任务的韧性评估为基础,开展韧性系统及恢复策略设计,为我军应对未来多维度、强对抗和快节奏作战,提升我军体系作战能力提供科学指导。

猜你喜欢

韧性扰动节点
强化粮食供应链韧性
Bernoulli泛函上典则酉对合的扰动
CM节点控制在船舶上的应用
Analysis of the characteristics of electronic equipment usage distance for common users
基于AutoCAD的门窗节点图快速构建
(h)性质及其扰动
房地产市场韧性犹存
韧性,让成长更美好
小噪声扰动的二维扩散的极大似然估计
笑中带泪的韧性成长