基于全能Agent的分布式优化油料保障模型
2015-05-07
(后勤工程学院,重庆 401311)
1 引言
油料保障联盟呈现地域分布特征,致使在整个油料保障链中,每个保障实体可能以局部最大利益来采取保障行动及其优化各自区域的局部保障性能。这一现象不符合油料保障链总体目标要求[1]。应将保障链中的不同地域、不同环节的分布式油料保障决策集成,以便提供强劲的油料保障性能,而这却常被保障链某些短期目标和局部视角缺陷所隐匿。
对于高度集中式油料保障链决策,以往使用分析方法,重点研究如何提高整个保障链中各保障实体的运作效率,而不是提高其综合保障效能[2,3]。虽然,一般情况下,油料保障联盟拥有全局性油料保障规划总体方案,试图考虑作为其成员的各保障实体的主要活动、目标、所触发的行为复杂性,这使得难于集成其保障效能[4,5]。此外,即使油料保障链集中式规划系统简单得足于运作,但油料保障环境的频繁和不可预见的变化,导致油料保障规划方案滞后或过时,难于快速响应保障环境态势。
油料保障链中各保障实体呈地域自然分布,但紧耦合为一个网络。因此,分布式约束优化方法适合用于解决油料保障链管理问题,它使得Agent的局域自利本性符合全局油料保障优化要求。它允许Agent以异步和较有效方式来运行,使用与相邻Agent的局域通信,对此,具有单个中央Agent的通信是难于做到的[6,7]。
本文应用约束网络与Holonic Agent技术,对分布式优化油料保障模型进行研究。将分布保障实体所考虑的涉及局部保障因素的算法内嵌到多角色Holon,调用分布式约束多目标最优化智能算法,以便实现油料保障资源调度与配置。
2 分布式油料保障问题域
对于油料保障链中分布式油料保障问题,Agent尝试寻找对一组受到约束变量的分配。假设Agent子集具有每个给定约束的知识,Agent可以分布式异步方式,只与相邻Agent通信,来优化全局函数。这不同于涉及自益Agent的其它相关形式,它尝试单个最大限度地发挥自己的效用。Agent通过所选择最优解决方案,最大限度地发挥其所累积的效应。
2.1 问题描述
将分布式约束优化油料保障链问题描述为5元组(A,X,D,C,F),其中:A=a1,a2,…,an是 Agent集;X=x1,x2,…,xn是油料保障变量集;D=d1,d2,…,dn是有限离散域集,每个域与对应变量相关联。 C=cij:Di×Dj→N(i,j=1,2,…,n,i≠j)是用每对变量xi和xj的保障成本函数cij所表示的约束集。目标函数为:
只有Agent具有知识,控制和分配与其相关联变量的值。Agent的目标是为所有变量选择估值,以便最大化目标函数F,该目标被建模为一组值的约束。
2.2 影响因素与决策变量
油料保障链在给定时间域T演变,T被划分为期间Γε,ε ∈ {1 ,...,T},通过其索引ε来表示。在每个周期的开始时,根据过去和将来决策知识来做出决策。时间域H中的一系列决策被称为决策策略集Q。决策意味着向所有决策变量分配数值。油料保障链涉及不同层次众多保障资源,根据全局保障目标和不同层次油料保障计划puε来调配,从每个时期ε、每个保障实体u所产生的保障计划离散集中,选择确定相应保障计划。
另一方面,对于每个时期t,每个油库w,选择最优油品库存量Qbest={Qmin,Qmax},Qmin表示安全库存,Qmax表示库存容量限制,来处理每种油品的库存管理。通过补充或发放所需的油品数量,确保在时期ε结束时,相应的库存水平等于Invwoε。
决策变量有:
(1)Puε:期间ε由保障实体u的保障计划;
(2)Invwoε:期间ε结束时,在油库(或加油站)w中,油品o的库存水平。ε∈{1 ,...,T},e∈E(油料装备集),o∈O(油品集),p∈P=E⋃O。
输入参数有:
(1)In(e;o;puε):在期间ε,使用保障计划puε,保障实体u所处理的油品o的数量;
(2)Out(u;e;put):在期间ε,使用保障计划puε,保障实体u所处理的油料装备e的数量;
(3)Dmweε:在期间ε,在油库w所对应的保障区域,所预测的油料装备e的需求量;
(4)preCostue:保障实体u调运油料装备e的一个单位成本;
(5)ProCosto:油品o的单位价格;
(6)InvCostwo(Invwot):在期间ε,油库w的库存油品o,库存水平的库存成本函数Invwoε;
(7)RfRateRo:在油料保障区R,油品o的运价;
(8)WZfRateWZo:在战区WZ,各油料保障区域之间的油品o的运价;
(9)SfRateo:供应商与战区之间油品o的运价。
2.3 油料保障实体holarchy结构
根据油料保障仿真约束、计算资源,对所仿真行为的复杂性和真实性进行调整。在角色和交互方面,使用油料保障实体组织模型来定义油料保障实体行为,采用holon对油料保障实体建模,构建油料保障实体holarchy结构如图1所示。
图1 油料保障实体holarchy结构
该结构描述油料保障实体行为,保障执行器和保障感知器分别提供保障实体在油料保障环境中行为和感知的手段。油料保障实体角色,根据holon目标,将感知与行动计算、保障环境约束相集成。在holarchy的较低层次,超级holon的油料保障实体行为是相同成员,但感知和行为被汇总,然后使用聚合油料保障实体的行为。
内部油料保障人员在保障链的各个层次、各自holon中承担head角色作用,负责保障链中保障任务的执行,负责反馈相应保障区域油品及其装备的消耗和需求信息,确保保障实体与被保障单位之间的供需资源平衡与匹配。上级油料保障人员,代表保障决策指挥角色,可由软件或油料保障专家来扮演。承担油料保障调运计划制定、保障任务分配、保障资源配置等作用,还负责预测每种油品及其装备的总需求。
3 分布式优化油料保障模型
油料保障链由许多用约束所连接的保障实体节点组成,属于非结构化约束网络,表示保障实体之间的关系。将Agent技术与约束网络集成,每个Agent被分配来对保障实体进行建模,关系可被定义为这些Agent之间的约束,以便支持油料保障链的保障实体之间的信息协作和共享。
当Agent之间关系由约束来建模时,它们可以被集成为一个网络,全局优化成为可能。这些关系涉及油品如何从保障实体单位流动到被保障单位,如何用油品数量、成本或调度与运输等保障行为来表示这些关系。油料保障环境对保障链施加约束限制,采用约束变量表示约束限制,约束变量值在有限域内被分配给定。因此,该约束模型考虑变量有限集,它们与有限域、约束集相关联。
3.1 油料保障约束函数
用决策变量和输入参数表示模型的约束。为简化起见,采用因变量,定义如下:
式中,Δuot为在期间ε对应于保障实体u,油品o的接收数量与发送数量之差。
将分布式油料保障问题域分为“部队”、“保障区”和“战区”3个层次,使用所有变量和参数,表示每个层次的约束函数。
过去和未来油料保障规划之间的约束关系,将出现在“保障区”和“战区”层次(即全局),它来自于与保障链实体之间油品调运相关物理时间约束。在“部队”层次,假设在单位时间周期内,一个相同区域的两个不同油库,足够接近运送彼此之间的油品。因时间周期受到限制,即ε∈{1 ,...,T },应考虑边界条件:
3.2 油料保障目标函数
油料保障链管理涉及选择保障决策策略Φ(puε,Invwpε),以便确保保障链绩效指标最优。油料保障链绩效指标是在H期间整个保障链的效能。假设油品供应商可提供无限量的任何油品,向所有被保障单位需求提供保障。因此,优化目标是最大化保障链总效能。总效能TE(Total effectiveness,缩写为TE)表示为:
式中:ESendo:向被保障单位发送油品的效能;ESende:向被保障单位发送油料装备的效能;PurCosto:油品采购成本;PurCoste:油料装备采购成本;TraCostT:油品和油料装备运输总运费。由每个部队内运输油品和油料装备的总运费;(Tra-CostMi_Tε):在不同地点之间,每个地点(Meuwε)内运输油品和油料装备的总运费;(TraCostMe_Tε):在保障区和供应商间每个区域(Me_Suwε)内运输油品和油料装备的总运费(TraCostMe_S_Tε)所获得;InvCost:在期间H油品和油料装备总库存成本。
3.3 基于Holonic Agent的模型求解模式
记油料保障人员为“POLstaff”,对于每个元组(o,ε),创建一个Agnet。在POLstaff角色的情形下,单个Agnet对应于一个保障实体。由于所有层次的POLstaff Agnet具有相同head角色,它们负责因变量的运算,根据保障决策变量分配更新因变量,从POLstaff Agnet向上发送到位于上一层次的其它POL-staff Agnet。此外,当在保障区中观层次和战区宏局层次,平衡油品及其装备供应量与被保障单位需求时,正确时间段之间的适当匹配,也是相关POLstaff Agnet的责任。肩负油品及其装备管理角色的Agnet,管理和控制决策变量puε,而库存管理者角色的Agnet关注决策变量Invwoε。
式中,数值约束函数被定义为两个相邻Agnet之间的关系。在所关注的holonic模型,一对Agnet中,一个Agnet总是具有POLstaff角色(L),而另一个Agnet则扮演其它任一角色(α)。随着一对相邻Agnet、由它们以及参数之间所交换的变量,提出所有这些函数,因为这些后面的参数可以根据油料保障环境动态地变化。
在holon的情形下,其后面跟随着head Agnet(symbol≡),它表示在通信中的全部holon。所有变量直接作用于目标函数。内部层次约束表示为:
4 结束语
本文将约束网络方法与Holonic Agent方法相结合,建立分布式约束优化油料保障模型,用于支持油料保障链的协作和管理。分析分布式油料保障问题域特点,确定影响因素与决策变量。采用holon对油料保障实体建模,构建油料保障实体holarchy结构,将感知与保障行为响应、保障环境约束相集成。将油料保障链总效能作为优化目标,建立相关约束函数。论述了基于Holonic Agent的优化模型求解模式。该模型通过约束网络将在空间和时间分布的油料保障实体紧密集成,并使其油料保障行为优化,对于增强油料保障链整体效能具有重要意义。
[1]周庆忠.军队油料勤务学[M].北京:国防出版社,2015.
[2]Klusch M,Gerber A.Dynamic coalition formation among rational agents[J].IEEE Intelligent Systems,2002,17(1):42-47.
[3]McQuay W K.Distributed collaborative environments for systems engineering[J].IEEE Aerospace and Electronic Systems,2005,20(1):7-12.
[4]周庆忠,曾慧娥.基于多智能体的装备动态优化调拨系统研究[J].机械工程学报,2005,41(2):97-101.
[5]Montana D,J Herrero.A Multi-Agent Society for Military Transportation Scheduling[J].Journal of Scheduling,2000,13(4):324-341.
[6]李必鑫,李永红.基于Agent的油料保障资源发现模型[J].物流技术,2011,30(11):129-131.
[7]周庆忠,王冰,陆思锡.面向油料保障的自治协同建模[J].四川兵工学报,2013,34(9):52-55.