APP下载

合成分队双层主从决策模型研究*

2016-08-03孔德鹏徐克虎陈金玉

火力与指挥控制 2016年4期
关键词:粒子群算法

孔德鹏,徐克虎,陈金玉

(1.装甲兵工程学院,北京 100072;2.解放军78098部队,成都 611237)

合成分队双层主从决策模型研究*

孔德鹏1,徐克虎1,陈金玉2

(1.装甲兵工程学院,北京100072;2.解放军78098部队,成都611237)

摘要:针对合成分队不同指挥层级之间的决策交互优化问题,提出了基于主从决策的双层武器目标分配模型。该模型能够体现上下指挥层级之间交互式决策协调优化的特点:上层目标为主攻方向我方遭受威胁最小,下层目标为对敌打击最大。结合合成分队作战决策的特点和要求,提出了一种求解该模型的改进型粒子群优化算法。仿真结果表明,该模型合理有效,改进的求解算法能够获得满意解。

关键词:合成分队,主从决策,二层规划,粒子群算法

0 引言

诸兵种分队级合成是信息化条件下作战力量变化的一个重要方面。信息化武器装备的广泛使用使得战场信息更加多元复杂,对指挥员作出科学及时的决策带来了巨大的挑战[1]。传统的武器目标分配模型(WTA)较好地解决了同一指挥层级下武器之间的协同优化问题[2-3],但是这种模型是基于传统的“烟囱式”指挥方式下进行的,无法获得整体和局部、上级和下级协调交互的最优决策,从而限制了整体作战效能的发挥。因此,建立一种主从递阶的指挥决策模型,进行及时有效的战场信息处理,获得对于我方最有价值的作战决策是当前新型合成分队作战效能生成的关键。

1 双层主从决策

主从决策主要用来解决不同层级的决策协调优化问题,最早在经济领域提出并使用,由此获得广泛关注[4]。在主从决策过程中,一般上级决策者自上而下地对下级决策者行使某种控制、引导权,而下级决策者在上级决策的前提下,亦可在所辖范围内行使一定的决策权。越高层级的决策者目标越重要、越具有权威性和全局性,不同指挥层级的决策者具有不同的目标,最终的决策需要寻求各层之间的某种协调方案,使得最高层级决策者的目标获得最优,同时下层的决策者也在自己的决策目标上获得最优[5]。

双层主从决策是主从决策的基础,也是多层决策优化实现的基本方式,其一般模型为[6]:

式中,x为上层决策者的决策变量,y是下层决策者的决策变量;F(x,y)是上层决策者的目标函数,f(x,y)是下层决策者的目标函数;G(x,y)和g(x,y)分别是上下层的约束条件;Rn1为上层决策变量x的范围,Rn2为下层决策变量y的范围。

2 合成分队双层主从决策模型

2.1相关符号说明

合成分队的作战环境复杂,武器装备类型较多,为了方便建立数学模型,对相关符号进行说明。

xij表示我方第i节点对敌第j目标的火力(兵力)分配值。yij表示下层决策值。用X,Y来描述上下层决策矩阵:

Tij表示敌方第i目标对我方第j节点的威胁程度,用T表示战场威胁度矩阵:

Pij表示我方第i节点对敌第j目标的毁伤概率,用P表示毁伤概率矩阵:

2.2数学描述模型

双层主从决策模型已经运用在无人机的对地攻击中[7-8],选择的上下层目标分别为对敌打击最大和航路最短。合成分队相对于空战比较复杂,涉及到攻击力量的分配部署。合成分队作战时上层目标主要体现整体作战意图,因此,为了保证作战意图的顺利实现,选取关键作战方向上遭受威胁最小为上层目标。相应的下层决策者希望在自己的作战任务内获得最优的作战效果,因此,下层目标选取对敌打击最大,即敌方生存的武器装备战场价值最小。为了兼顾分队整体所受的威胁,引入作战决心系数η,表示对主要进攻方向的重视程度,1-η表示对其他攻击方向的重视程度,不同的指挥员、作战环境、作战时机设置不同的值。上下层的约束条件包括武器平台的数量,集火规模,打击限制等[9]。合成分队的双层主从决策模型如下:

式中上标we的代表我方,上标enemy代表敌方;W代表我方的武器平台,E代表敌方武器平台;Wup和Wdown分别表示我方上下层所控制的武器平台,Wmain和Wassist分别表示我方助攻方向和助攻方向武器平台;F(x,y)和f(x,y)分别表示上下层目标函数;Pijup和 Pijdown分别表示我方上下层所控制的装备对敌第j目标的击毁概率;vi表示各武器平台的战场价值系数和

η的取值表现决策者完成当前任务的决心,式(2)中目标函数为主攻方向和助攻方向遭受敌方威胁之和,η则表示对不同任务的重视程度,其值选取与决心关系如下页表1。

表1 作战决心系数

3 基于改进粒子群算法的模型求解

3.1粒子群算法

主从决策问题实际上是非线性二层规划问题,传统的方法如极点搜索法、分枝定界法等在问题规模变大时求解时间迅速增加,很难获得全局最优解[10]。粒子群算法是一种应用广泛的群智能优化算法,对于求解这类复杂的非线性规划问题有着比较好的效果[11]。PSO算法初始化具有速度和位置信息的粒子,通过迭代根据个体最优解和全局最优解来更新自己。粒子一般用D维向量表示。位置Xi=(xi1xi2… xiD)T,速度Vi=(vi1vi2… viD)T,通常按照下式进行速度和位置更新[12-13]。

式(6)为速度更新公式,式(7)为速度约束;式(8)为位置更新公式。w为惯性系数,c1和c2为学习因子,通常选取c1=c2=2,rand为区间(0,1)上均匀分布的随机数。

3.2改进粒子群算法求解二层规划问题

为求解主从决策问题,需要对传统的粒子群进行改进。改进的粒子群算法分别应用于上下两层进行求解。决策矩阵XN×M和XK×P中的决策变量都为0、1整数,采用0、1编码的方式对决策变量进行编码,上层Xi=(xi1xi2… xiD)T,D=N×M,下层Yi=(yi1yi2…yiD)T,D=K×P,这里借用遗传算法的思想进行改进[14],加大搜索范围,提高收敛速度。

(1)位置更新:粒子的状态只有0,1两种情况,因此,取消了粒子的速度项,直接对位置进行更新。以下层粒子更新为例,每一次迭代中通过适应度值比较,选取全局最优粒子Ygbest,然后借鉴遗传算法中交叉和变异的思想进行位置更新。对于下层的粒子Yi=(yi1yi2… yiD)T,D=K×P,每P维看成一个基因片段,则每个粒子共有K个基因片段。每个粒子Yi与全局最优粒子Ygbest进行等位基因交叉,然后以一定的概率对基因片段进行变异操作。为了使得适应度好的粒子能够传递到下一代,能够获得较大的收索范围,防止陷入局部极值点,交叉和变异的概率选取为随迭代次数相应变化,交叉概率随着迭代次数线性递减,变异概率随着迭代次数线性递增。

(2)约束处理:主从决策用于合成分队武器目标分配优化,约束项一般为武器数量、集火规模、打击限制等,在实际的作战过程中,资源约束项一般都会取得最值。即目标函数取得最优时,资源约束项不等式一般取等号[15]。武器打击量约束加入到粒子的位置生成和更新中,对粒子的基因片段进行限制,如每个武器平台只能攻击一个目标,yi1,yi2,…,yiD中第(k-1)×M+1维到k×M维(k=1,2,…,K),只确定一个为1,其余为0。对于集火约束,需要对粒子的状态进行验证,如果不满足设定条件,则随机生成一个粒子进行取代。

3.3改进的双层粒子群算法的具体步骤

Step1:初始化种群。在初始化范围内,对上下层种群X和Y进行随机初始化。

Step2:根据上层的决策X,计算下层每个粒子的适应度。

Step3:下层粒子最优位置更新。对于下层每个粒子,把它的适应度和全局最好位置的适应度作对比,如果较好,则把目前粒子所在的位置更新为最好位置。

Step4:下层粒子通过交叉变异更新。对下层粒子群中的每一个粒子,进行交叉和变异操作。

Step5:下层结束判断。是否满足迭代要求,若不满足,则返回Step2。

Step6:根据下层获得的全局最优Ygbest,计算上层适应度值。

Step7:上层粒子最优位置更新。如果适应度值优于全局最优值,则把当前上层粒子更新为全局最优位置,适应度值更新为上层最优适应度值。

Step8:上层粒子位置更新。通过交叉和变异操作,更新上层粒子。

Step9:上层结束判断。是否满足迭代要求,若不满足,则返回Step2,否则算法结束。

4 仿真算例

4.1作战想定

敌某分队占领我重要作战位置,企图对我军事基地进行破坏。我方通过军用卫星发现其位置,通过侦查分队的侦查获得了敌装备情况及其部署。我方合成分队进行立即出动进行打击,但对于驻守在战术要地的敌坦克、装甲车的打击能力不足,上级派出武装直升机进行支援,受到地形和敌防空导弹的限制,我方的武装直升机只能打击部分敌目标,而且遭受到较大威胁。战场态势如图1所示,相关的参数信息如表2~表4所示。

表2 敌我双方武器类型及战场价值

表3 敌各武器对我方威胁

表4 我方各武器平台对敌打击度

4.2基于主从决策的火力分配

经过研究,制定出如下作战方案:右翼坦克5、坦克6迅速前出,对敌左侧阵地进行突击,尽快占领敌左后方有利地形,破坏其防空导弹的作战效能发挥;其他坦克进行火力压制,消灭对突击坦克威胁大的目标,保证突击的顺利实施;武装直升机进行火力增援,待突击坦克破坏敌防空导弹发射时,迅速对敌目标进行打击,完成作战任务。

图1 合成分队作战态势图

由上下层决策矩阵可以获得我方武器平台火力打击的目标分配,如图3所示。

图2 上层目标适应度值

图3 上下层武器平台目标打击分配

5 结论

合成分队传统的作战指挥决策方式主要是层次指挥,上下层级进行独立决策,没有进行充分的决策交互,上层和下层都很难获得自身最优决策。本文通过分析合成分队作战的特点及要求,建立了合成分队作战的一种主从决策模型,并提出了一种改进的粒子群算法对模型进行求解。仿真结果表明,建立的模型和求解算法能够获得合成分队上下两层决策优化的满意解。该决策模型是适应合成分队信息化作战需要的一种重要方式,是提高作战效能的有效途径之一,具有一定的实用价值。

参考文献:

[1]喻涛.网络中心战的发展动向与分析[J].舰船电子工程,2012,28(3):17-20.

[2]刘洪引,李体方,王立安.基于改进人工免疫算法的火力分配[J].火力与指挥控制,2014,39(10):171-174.

[3]武从猛,王公宝.遗传-蚁群算法在目标分配问题中的应用研究[J].兵工自动化,2014,33(4):8-11.

[4]韩莉莉.主从递阶决策问题的相关理论与算法[D].曲阜:曲阜师范大学,2001.

[5]张莉,张安.多编队对地攻防对抗多层决策分析仿真与研究[J].系统仿真学报,2007,19(1):106-109.

[6]郑征.一类新型双层主从决策问题的研究[J].云南民族大学学报:自然科学版,2008,17(2):97-102.

[7]张雷,孙金萍,刘向民.基于主从递阶决策的战术级防空武器目标分配模型[J].系统工程与电子技术,2005,27 (4):676-677.

[8]刘毅,李为民,邢清华,等.基于双层规划的攻击无人机协同目标分配优化[J].系统工程与电子技术,2010,32(3):579-582.

[9]黄大山,徐克虎,王天召.坦克分队火力优化配置模型[J].火力与指挥控制,2013,38(11):95-98.

[10]王广民,万仲平,王先甲.二(双)层规划综述[J].数学进展,2007,36(5):516-529.

[11]NIEP.Anotherbileveloptimizationproblems[J].International Journal of Applied Mathematical Sciences,2005,2(1):31-38.

[12]KENNEDY J,EBERHART R C.Particle swarm optimization [C]//Proc IEEE Inter-national Conference on Neural Networks,IV Piscataway,NJ:IEEE Service Center,1995:1942-1948.

[13]李响,高常海,刘梁.求解二层规划问题的改进粒子群算法[J].徐州工程学院学报:自然科学版,2009,24(2):21-24.

[14]ODUGUWA V,ROY R.Bi-level optimization using genetic algorithm[C]//IEEE International Conference on Artificial Intelligence Systems,2002,322-327.

[15]AMOUZEGAR M A.A global optimization method for nonlinear bilevel programming problems[C]//IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,1999,29(6):771-777.

中图分类号:O221

文献标识码:A

文章编号:1002-0640(2016)04-0061-05

收稿日期:2015-03-21修回日期:2015-04-23

*基金项目:军队科研计划基金资助项目

作者简介:孔德鹏(1990-),男,安徽蚌埠人,硕士。研究方向:指挥控制决策优化。

Research on Bilevel Leader-follower Decision Making Model of Synthesis Unit

KONG De-peng1,XU Ke-hu1,CHEN Jin-yu2
(1.Academy of Armored Force Engineering,Beijing 100072,China;2.Unit 611237 of PLA,Chengdu 611237,China)

Abstract:Aimed at interactive decision optimization problems of command and control process in synthesis unit,a bilevel weapon target assignment model based on leader-follower decision is proposed. The model can reflect the characteristics of the interactive coordination optimization decision between the upper and lower command unit,the upper target as the minimum threat in main combat direction and lower target as the maximum hitting effect to enemy.Combined with the actual synthetic unit characteristics and requirements of decision-making,an improved particle swarm optimization algorithm for solving the model is presented.The simulation results show that the model is reasonable and improved algorithm can obtain the satisfactory solution.

Key words:synthesis unit,leader-follower decision,bilevel programming,particle swarm optimization

猜你喜欢

粒子群算法
几种改进的萤火虫算法性能比较及应用
基于支持向量机的短期电力负荷预测
基于云计算平台的资源调度优化研究
一种基于高维粒子群算法的神经网络结构优化研究
基于PSODE混合算法优化的自抗扰控制器设计
蚁群算法的运用及其优化分析
电力市场交易背景下水电站优化调度研究
基于粒子群算法的产业技术创新生态系统运行稳定性组合评价研究
无线传感器网络联盟初始结构生成研究
交通堵塞扰动下多车场车辆路径优化