分布式装备保障体系任务分配模型
2019-01-25曹军海宋太亮
高 龙, 曹军海, 宋太亮, 邢 彪, 闫 旭
(1. 陆军装甲兵学院装备保障与再制造系, 北京 100072; 2. 中国国防科技信息中心, 北京 100142;3. 武警工程大学乌鲁木齐校区装甲车技术系, 新疆 乌鲁木齐 830049)
在信息化联合作战条件下,分布式保障指挥与控制将是网络化装备保障体系的主要指挥控制形式[1-3]。它突破了集中式指控方式的局限性,秉承“权利下放”和“去中心化”的思想,各指控节点在保障体系运行中能根据当前战场态势与保障态势等进行自主决策与信息共享,采用对话、协商和谈判等方式灵活调整任务分配方案,最大程度地满足装备体系的保障需求[4]。
目前,装备保障任务分配研究主要针对集中式保障任务分配问题[5-7],较少涉及分布式保障任务分配问题,而在其他领域中有关分布式任务分配问题研究主要是对分配问题的框架、方法、模型及求解算法等进行了探索。如:李娟等[8]提出了基于改进合同网算法的异构多自主式水下航行器(Autonomous Underwater Vehicle,AUV)协同任务分配策略;费爱国等[9]基于多Agent拍卖算法提出了分布式多机协同火力分配方法和模型,可同时考虑任务分配的收益和代价;黎子芬等[10]设计了基于分布式拍卖算法的多机编队协同攻击目标分配方法,可最大程度地发挥编队的攻击能力;陈侠等[11]提出了基于分布式邀请拍卖算法的多机协同空战决策方法,采用邀请机制来解决多机任务协同问题。
综合来看,一方面受经济学中市场机制的启发,研究者先后提出了适用于分布式控制机制的合同网算法[12]和拍卖算法[13],特别是拍卖算法因其具有良好的并行计算、分布式通信、可扩展性和鲁棒性特点,在分布式任务分配问题中被广泛应用;另一方面,由于分布式人工智能中的Agent系统具有自主性、分布性和协调性,并表现出较好的自组织能力、自学习能力和推理能力等[14-16],被广泛用于分布式任务分配的描述与建模。同时,在许多复杂系统的任务分配问题中,将多Agent系统理论和基于市场机制的算法相结合,利用Agent理论对实际问题的描述能力和基于市场机制的算法求解能力来实现分布式任务分配问题的建模与求解,已取得了良好效果。因此,为了突破集中式保障指控形式下任务分配的局限性,构建适用于未来作战中分布式装备保障体系任务分配方法与模型,笔者针对面向作战任务的分布式装备保障体系任务分配的要求和特点,建立基于多Agent的分布式保障任务分配框架,基于装备体系任务成功率构建保障任务分配模型,并通过分布式拍卖算法进行求解。
1 问题分析与描述
由于在分布式装备保障体系任务分配过程中,涉及的保障实体类型与数量众多,保障过程交互频繁、复杂,保障需求分布地域范围广、结构分散、管理独立,导致分布式保障任务分配问题描述困难、建模复杂。Agent理论与技术能够较好地解决分布式环境中的系统问题,对于复杂系统的行为与特性等研究优势明显[15-19]。Agent具有良好的自主性、反应性、社交性和智能性,非常适合描述装备保障体系中保障单元的自主性、智能化等特性;多Agent系统具有自治性、协作性和自适应性,可较好地描述装备保障体系中保障单元在完成保障任务过程中的交互与协同等特性;分布式多Agent系统的松散耦合、去中心化的组织结构形态能够较好地反映装备保障体系的分布式保障指控形式,满足信息化联合作战对装备保障体系反应速度快、灵活性高、适应性强等要求。因此,笔者基于多Agent理论构建分布式保障任务分配框架来描述分布式保障任务分配问题。
1.1 基于多Agent的分布式保障任务分配框架
分布式装备保障体系以信息网络为支撑,以装备保障态势实时感知共享为基础,将各级保障要素融为一体,形成一个部署空间离散、能力依网聚合的模块化有机整体。其在面向任务、分布交互和科学规范的保障指挥下,基于态势需求驱动和行动规则约束进行广泛的协同,实现保障信息共享、保障力量协同、保障资源优化配置与调度[1-4,17]。根据分布式保障指挥的特征、保障任务分配的特点与要求及Agent理论与技术的优势,笔者构建了基于多Agent的分布式装备保障体系任务分配框架,如图1所示。
在分布式保障任务分配中,保障任务来源于装备体系遂行作战或训练任务时产生的装备保障需求。根据保障需求的地域、类型及保障力量体系的特点,可将保障需求分解为一系列待分配的保障任务。装备保障单元是装备保障体系中遂行保障任务的主体,可被抽象描述为具有不同属性、状态、行为的保障单元Agent(简称“单元Agent”),典型单元Agent的结构如图2所示。其中:具有分散特征且相对独立的单元Agent通过保障网络集成为一个分布式的多Agent系统,且单元Agent具有如下属性:1)单元Agent能在一定环境下独立自主地运行,既作用于环境又受环境影响,且能通过从环境中获取知识来提高自身的能力;2)单元Agent在保障任务分配时可根据自身的属性、状态及交互规则等进行竞争、谈判及协商等;3)单元Agent执行保障任务的效能通过作战单元Agent完成作战任务的结果来评判;4)单元Agent在多次交互与调整中完成保障任务分配,最终实现单元Agent与保障任务之间的最佳匹配。
1.2 保障任务分配问题描述
1.2.1 保障单元
单元Agent具有单独承担某项或某几项保障任务的能力,在保障任务分配时段内单元Agent可描述为
W={{Wi},YW,{AWi}|i=1,2,…,NW},
(1)
式中:W为所有单元Agent构成的多Agent系统;Wi为第i个单元Agent,NW为保障单元数;YW为保障单元间存在的指控、隶属等约束关系构成的集合;AWi为单元Wi的属性构成的集合。
∀Wi∈W,其属性主要有:单元Agent的位置DWi=(XWi,YWi),其中XWi和YWi分别为单元Agent的位置横、纵坐标;单元Agent的移动速度VWi;保障单元具备的初始保障能力向量CWi=(CWil)1×L,L为所有保障单元所具有的保障能力类型数,其中CWil为保障单元Wi的第l(1≤l≤L)项保障能力,若CWil=0,则表示保障单元Wi不具备第l项保障能力。
1.2.2 保障任务
装备作战单元在执行作战任务过程中会产生多种不同的保障需求,从而形成不同的装备保障任务,为了便于分工协同,需要将其进一步分解为可执行的任务序列。具体描述如下:
T={{Tj},ET,ATj|j=1,2,…,NT},
(2)
(3)
假设在保障体系中至少有一个保障单元能够完成保障任务Tj,则保障任务的能力需求向量CTj=(CTjl)1×L,其中CTjl为成功完成保障任务Tj所需的第l(1≤l≤L)项保障能力。
1.2.3 保障任务分配收益
(4)
1) 保障任务价值vj
装备保障体系是为装备体系执行作战任务提供支持的系统,保障任务分配需要面向作战任务,以确保装备体系获得最大的任务成功性。因此,保障任务Tj的价值vj可通过装备体系的任务成功率来间接度量。
设ESoS={Ub|b=1,2,…,N},为给定的装备体系,其中Ub={ubf|f=1,2,…,Fb},为第b个装备作战单元,其由Fb个相互独立的基本作战单元ubf并联而成,N为装备作战单元数;Ybf为ubf的当前状态变量,Yb为Ub的当前状态变量,则
(5)
(6)
设pbf为状态完好的ubf执行作战任务时产生装备保障需求的概率,则下一个任务结束时ubf的任务成功率(即ubf在作战任务结束时的完好概率)
Pr(Xbf=1)=(1-pbf)·Xbf,
(7)
(8)
式中:rubf为ubf的任务可靠度;θbf为作战任务的环境因子。可以看出:作战任务持续时间越长、环境越恶劣,作战单元产生保障需求的概率越大。
对于装备作战单元Ub,若有rb个基本作战单元ubf成功完成任务,则判定Ub成功完成了所担负的作战任务,因此作战单元Ub的任务成功率
(9)
对于装备体系ESoS,若有r个装备作战单元Ub成功完成任务,则判定装备体系ESoS成功完成了所担负的作战任务,则装备体系ESoS的任务成功率
(10)
(11)
(12)
式中:
(13)
(14)
(15)
(16)
(17)
(18)
1.2.4 保障任务分配决策变量
定义xij为单元Wi和保障任务Tj之间的分配决策变量,且
1.2.5 保障任务关系
(19)
综上所述,面向作战任务并考虑保障任务逻辑约束关系的装备保障体系任务分配问题可描述为:在某一时段内,装备保障体系有NW个保障单元,装备保障需求转化分解后形成NT个保障任务,并被划分为NR个独立的任务子集,1个保障单元可执行多个不同任务子集中的任务,1个保障单元最多只能执行同一任务子集中的1个任务,保障任务分配的目标是使分配方案的整体收益最大化。其数学模型为
(20)
(21)
2 分布式拍卖算法
2.1 传统拍卖算法的基本思想
拍卖算法的基本思想是拍卖品对应任务,任务的分配方和接收方分别根据自己的收益函数和出价策略对任务进行拍卖和竞拍[9-11,14],在保障任务分配问题中的应用如下:保障任务都存在一个变动的价格pj,获得该任务的保障单元必须支付pj,每个单元Agent都希望分配到价值最大的任务,当所有单元Agent都分配到价值最大的保障任务时,则称整个任务分配方案收益与价格达到均衡,即
(22)
(23)
(24)
在装备保障体系中,当满足式(24)时,则认为单元Wi是满意的,当所有保障单元都达到满意时,则认为整个保障任务分配方案收益与价格达到均衡。为了避免多个保障单元竞争价值相同的任务,但出价不变而导致算法陷入死循环的情况,笔者给定增量ε>0来保证出价是递增的,即确保每次出价后价格至少以ε增加。若分配给单元Wi的所有保障任务都满足条件
(25)
则认为单元Wi是满意的。
(26)
(27)
2.2 算法改进
在传统拍卖算法中,默认存在一个拍卖中心或共享存储中心来负责收集价格信息,并向所有竞拍对象通告。但在分布式装备保障体系中则不存在能够感知全局的保障指控中心,单元Wi并不能直接获取保障任务Tj的全局最高价格,只能通过与其相邻的保障单元进行信息交互来获取。因此,笔者在传统拍卖算法的基础上,通过增加保障单元信息交互环节,设计了不带拍卖中心或共享存储中心的分布式求解算法,具体改进如下:
设装备保障体系网络是连通的,即在网络中任意2个节点至少存在一条链路,任意2个保障单元在通信距离之内就可直接进行信息交互。因此,在每轮迭代开始之前,单元Wi只通过与其相连的邻接节点更新本地任务价格,即
(28)
2.3 算法实现步骤
设pij为装备保障体系中单元Wi对保障任务Tj的出价,分布式拍卖算法的具体实现步骤如下:
1) 初始化参数。设置τ=0,pj(τ)=0,j=1,2,…,NT。
2) 存储价格更新。单元Wi通过网络并依据式(28)更新本地任务价格。
4) 任务价格一致性检验。令pj(τ+1)=max(pij(τ+1)),j=1,2,…,NT,并通过网络传递价格信息pj(τ+1),同时标记出价为pj(τ+1)的保障单元。若pj(τ+1)=pj(τ),则运算终止;否则,令τ=τ+1,转向步骤2)。
3 仿真实验与分析
以某战区陆军装备体系执行地面防御作战任务保障为例,构建仿真实验并验证所提算法的合理性与有效性。
根据作战部署,执行地面防御作战任务的装备体系由3个作战单元构成,整体呈现环形防御态势,装备保障体系中有4个保障单元,防御作战整体部署情况如图4所示。装备体系遂行作战任务时各作战单元与作战任务的基本参数如表1所示。装备体系中各基本作战单元在执行作战任务过程中会产生多种不同的保障需求,并形成多个不同的装备保障任务。设装备体系在作战任务通知时刻的保障需求分解形成一个包含21个可执行的保障任务集合,该集合中各保障任务的具体属性如表2所示。
装备保障任务集合T={Tj|j=1,2,…,21}中各保障任务之间的时序与逻辑关系如图5所示。
笔者采用AnyLogic平台进行仿真实验与分析。在分布式拍卖算法中,ε(ε>0)为其关键参数,直接影响算法的求解效率和解的性能。在其他参数设置不变的前提下,ε的取值对保障任务分配方案总体收益的影响如图6所示。
表1 各作战单元与作战任务的基本参数
表2 保障任务属性
装备保障单元是遂行保障任务的主体,在作战任务通知时刻装备保障体系中各保障单元的属性如表3所示。装备保障单元执行保障任务获得收益的控制因子α=0.25,β=0.15,则单元Wi单独完成保障任务Tj的保障时间矩阵TW为
表3 装备保障单元属性
由图6可以看出:当ε逐渐增大时,装备保障体系任务分配方案的总收益逐渐减小;当ε增大到某一阈值后,分配方案的总收益趋于稳定,但却大幅度增加了仿真平台的运行时间,则此时的总收益为最优任务分配方案的总收益。
ε的取值对分布式拍卖算法迭代次数的影响如图7所示。可以看出:当ε不断增大时,算法停止所需迭代次数(即保障单元投标次数)逐渐减少;当ε>2.5时,算法迭代次数基本保持在20次左右。
综合分析图6、7可知:参数ε的取值对算法的求解效率和解的性能影响较大,ε的取值范围[0.1,4.5]为算法的敏感区。当ε=0.1时,总收益虽然接近最优任务分配方案的总收益,但此时迭代次数接近110次,求解速度较慢;当ε=3.5时,算法迭代15次左右即可收敛,且解的误差不超过3%。
综合考虑分布式装备保障体系任务分配中解的性能和求解效率,笔者以ε=2.0来确定保障任务分配方案,该方案中保障单元与保障任务之间的匹配关系如表4所示。装备保障体系中的保障单元按照该方案执行保障任务可获得的总收益为7.316 9。
保障单元Wi保障任务TjW1T7≻T13≻T11≻T12≻T15≻T10W2T1≻T5≻T8≻T14≻T19≻T10W3T2≻T20≻T9≻T3≻T4≻T21W4T16≻T17≻T9≻T6≻T18≻T21
4 结论
与传统的集中式保障任务分配框架和模型相比,笔者搭建的分布式保障任务分配框架及构建的分配模型在可扩展性和鲁棒性上都有较大程度的提升,为装备保障体系运行指挥方式由集中式向分布式转变提供了一定的参考价值。下一步,将重点研究分布式装备保障体系中保障单元的智能行为与决策、分布式保障指控网络的分析与建模及保障信息交互中的网络特性等。