战机空战决策方法及分析
2013-11-20傅莉,李伟
傅 莉,李 伟
(沈阳航空航天大学 自动化学院,沈阳 110136)
随着现代空战模式的转变以及先进战斗机技术的飞速发展,战机在未来战场中的作用越来越重要。自战斗机投入到战场以来,空战决策问题一直是贯穿战争始末的关键问题,空战决策是整个现代空战的核心和关键,空战决策的优劣将直接影响整个空战任务完成的质量,乃至空战任务的成败,针对战斗机空战决策的研究一直以来都受到世界各航空大国的高度关注。随着航空电子的发展,战场信息越来越复杂,对空战决策的实时性和稳定性的要求有所提高,向战斗机之间的空中格斗提出了挑战,空战决策是战斗机的"灵魂"和"大脑",是真正实现战斗机空战自主决策的关键。整个空战过程实质上就是一个动态决策过程,在我机规避敌机攻击的同时,调整战机自身状态,以达到攻击敌机的目的,从而做到“先敌攻击”。本文主要介绍了目前国内外的典型空战决策方法,并分析了每种空战决策方法的应用。由于空战决策在现代空战中占据着重要地位,针对空战决策,国内外学者和专家做了大量的研究。目前国内外空战决策主要的研究方法有微分对策法[1]、影响图法[2]、专家系统法[3]、神经网络法[4]、遗传算法[5]和滚动时域控制法等[6]。
1 空战决策问题
1.1 空战决策内涵
空战决策实质上就是指借助机载设备获取敌我当前态势以及敌方战机型号,计算出当前态势优势函数值和敌我双方战机空空作战效能函数值,根据优势评估结果和所建立的空战战术规则及空战目的做出空战机动决策,直到完成空战任务。不同的空战决策方法选取的评价指标不尽相同,所建空战战术规则也不相同。
1.2 空战决策问题研究难点
空战决策是一个极其复杂的动态决策过程,根据敌我双方战机的空战态势信息参量,建立合理有效的机动决策模型是研究现代战斗机空战的难点和重点。
1.2.1 空战优势函数建立
目前存在的空战优势函数的建立大都是基于非参量法的优势函数评估,此种方法需要分别建立角度优势函数、速度优势函数、高度优势函数、距离优势函数以及飞机空战能力优势函数。在角度优势函数中,目前存在的角度优势函数一般只考虑方位角,所以,合理的将方位角和进入角引入到优势函数中是目前角度优势函数建立的难点。对于高度优势函数和速度优势函数,在大多数论文中称之为能量优势函数,将两者按一定的权重联系在一起,相关事实证明,分别建立单独的优势函数更加合理。在建立综合的空战优势函数时,每个空战优势函数分量的权重值的分配,成为目前建立空战优势函数的难点,采用变权重法能很好的解决此问题,使其更贴近现实空战。
1.2.2 空战决策模型建立
目前国内外存在的空战决策方法的各有利弊,建立一个实时性好、精度高的、稳定性好的空战决策模型是整个空战过程的核心。对于微分对策在空战决策中的应用,选取合适的支付函数是建立空战决策模型的难点,支付函数选取的好坏将直接影响空战决策的有效性。由于不同的微分对策模型有不同的求解方法,所以,找到一种适合模型的快速求解方法也是解决微分对策问题的关键。在影响图法、神经网络、遗传算法中实时性的好坏是空战决策模型的,降低计算复杂程度,简化空战决策模型才能很好的解决空战决策实时性的问题。在专家系统中,规则库和动作库的建立是整个空战决策的核心,因为,它们的建立需要专家经验,空战中遇到的每种情况需在规则库和动作库中有映射,所以,专家经验的好坏会直接影响到空战决策的质量,甚至无法完成空战任务。基于滚动时域法的空战决策是目前一种较新的空战决策方法,它的战术优势函数的选取和决策目标集的建立都需要经验者来建立和划分,在这个问题上和专家系统是类似的,对于经验的选取是空战决策好坏的关键。
2 空战决策方法研究现状
2.1 微分对策法
通过微分方程来描述对象及对象规律的对策方法称之为微分对策。微分对策是在经典对策论考虑动态情况下的一种动态对策方法。由于空战信息的动态性,用微分对策法来研究和解决空战决策问题是最直接且最有效的途径。利用微分对策来分析空战决策问题,首先需选取合适的支付函数J,
(1)
式中:x(t)—战机空战状态;u(t)—我机控制变量;v(t)—敌机控制变量。
然后构造Hamilton函数
H[x(t),u(t),v(t),λ(t),t]=L[x(t),u(t),v(t),t]+λT(t)f[x(t),u(t),v(t),t]
(2)
其中,f[x(t),u(t),v(t),t]为战机的状态方程。
根据最优控制极小值原理,支付函数J和Hamiltion函数同时取得极值。于是,微分对策就把攻防对策化为双边极值问题而后求解,通过求解双边极值问题而得到最优控制策略。
文献[7-8]利用微分对策方法将空战中敌我战机间的对抗问题转化为空空导弹与敌机间的对抗问题,选取空战中两机的距离作为支付函数,并采用动态规划和参数优化求解决策的数值解。文献[9]中,姜玉宪等人首次将智能微分对策法引入到现代空战的思想,该方法的思想是利用人工智能方法预测敌机的决策策略,对敌我双方做全局态势评估。该方法通过预测双方战机的空战态势信息,将微分对策的双边极值问题转化为单边极值问题,降低了模型解算的计算难度,提高了空战决策的实时性。文献[10-11]主要针对三维空间中的双方追-逃对抗的问题,建立微分对策模型,然后构造对策模型的界栅,通过对模型界栅的求解,从而获取空战的最优策略。
微分对策理论在空战决策领域的应用解决了许多历史性的决策难题。但是,关于微分对策的求解问题自始至终都是其研究领域内的重点和难点。由于微分对策自身的复杂性,会导致其求解非常困难,实际中一般将其数值解作为微分对策的解。目前关于微分对策数值解的求解方法主要有梯度法、奇异摂动法、多项式法、次优法、参数法、泛函分析法、线性反馈解等求解方法。
2.2 影响图法
影响图法是一种用于决策分析的图示表征求解方法,它是由结合点集合N和有向弧集合A组成的有向图。因为此方法主要针对不确定性问题,所以其在空战决策分析中被广泛应用。
在影响图决策模型中,决策者的偏好用效用函数表示,为了更加有效的分析空战对策,在决策模型中还将局势概率与空战状态结合在一起。最终的机动决策结果要根据决策者制定的决策标准而定,在任意一种空战态势下必须进行灵敏度分析以判断哪些因素为主导因素。在空战决策中采用效用期望值EU作为决策标准。即
(3)
Ui—效用函数。
然后,运用单步预测法,求得效能函数取得极值时的控制变量值,即最优空战策略。文献[12-14]中,董彦非等人将影响图引入到空战决策中,将影响图与对策论结合在一起,并将其运用到一对一的空战决策分析中,把空战态势评估结果作为空战决策的理论依据,将空战决策过程用影响图法表示出来,并建立基于影响图法的空战决策模型。文献[15]把影响图法在空战决策中的应用拓展到三维空战决策中,认真分析了空战态势不确定性对空战决策的影响,使得影响图法在空战决策中的应用更加符合实战的要求。文献[16]首次将多级影响图引入到空战决策中来,将协同因子引入对空战决策中,对当前局势概率进行修正,从而把一对一空战拓展为多机协同空战,拓展了影响图法在空战决策中的应用。
虽然影响图决策方法能够形象地表示出变量间的条件独立关系以及决策问题的结构特征,也能解决在空战态势实时变化情况下的空战决策问题。但是,最终空战决策结果受到空战经验和习惯的限制,具有一定的局限性。而且,影响图决策方法在进行决策时需要把空战中遇到的各种情况都考虑一遍,计算量比较大,实时性相对较差,并且对航空电子硬件设备要求较高。
2.3 专家系统法
专家系统可以简单的描述为一个"知识库"和"推理机"的结合体。知识库是专家系统的经验知识的一系列映射,反映在实际空战中主要包括敌我双方空战态势评估函数(SA,SD,SV,SH)、双方飞机空战能力评估函数SC,空空导弹攻击区以及单发空空导弹杀伤概率评估等。推理机则是利用专家知识进行推理的能力在计算机中的映射,是一系列空战规则的组合。在空战中根据当前双方的空战态势参量与空战规则前提条件相匹配,以此确定我机的空战机动决策。一个完整的空战决策模块包括典型机动动作库[17-18]、规则库和推理机[19]。
文献[20-21]中,高正红等人建立了基于机动动作库的空战决策模型,也就是所谓的专家系统模型,建立了三代战机的25种典型战术动作库,并建立了相应的专家知识库与其一一对应,实现了根据实时的空战态势信息参量进行相应机动决策的目的,从而形成了一套完整的空战决策模型。文献[22]中,通过加入指挥引导模型库增强可了空战决策模型的自主决策能力,有效的提高了空战决策的实时性和可靠性。文献[23]提出了一种基于神经网络与专家系统的战斗机决策系统,克服了在规则不完善、战场信息不完全情况下决策失败的问题,其思想是利用神经网络推理机引导专家系统决策模型,利用神经网络自身的学习功能学习新的专家经验,完善知识库,从而更好的完成空战决策。
基于专家系统的空战决策方法在实际空战中具有高速、准确、高效等其它方法无法比拟的优点。空战专家系统技术成熟,容易实现和修改,在军事领域已广泛使用。但是专家系统也有它致命的缺陷,因为空战规则库是空战开始前专家制定好的,空战过程采用的是IF-THEN的形式,所以,一旦在空战中出现意外情况,则战斗机将无法进行空战决策,专家系统必然失效。在专家系统中"专家"的角色很重要,空战规则库和机动动作库的建立一直以来是一个难题,对专家系统的应用是一个挑战,随着规则库、动作库的丰富,专家系统在空战中的应用将更为广泛。
2.4 神经网络法
在现代空战中,神经网络法可以预测目标机的空战态势,以此做出更好的态势评估效果。由于神经网络的良好并行性,能有效的改善空战决策中的实时性问题,并且神经网络相对来说比较稳定,即使现实空战中有个别决策环节出现问题,整个网络依然能正常运行。由此可见,在空战决策领域神经网络法有着较为广泛的应用前景。
文献[24]中,佟明安等人利用协同优先权算法提出了一种针对多目标的空战决策方法,利用协同优先权算法先进行目标分配,然后用3层B-P神经网络针对空战战场信息的复杂性、动态性和不确定性来实现核心空战决策算法,并用SOFM网络对目标进行攻击排序,该方法能有效的解决复杂动态环境下的空战决策问题。文献[25]从空战环境出发对机群分类,然后根据敌我双方的空战态势评估结果及空空作战能力评估结果进行任务分配,一次攻击结束后进行评估,计算双方损失,再次对空战态势进行评估,进行二次攻击决策,直到空战结束。
神经网络在空战中的应用解决了战斗机在战场信息复杂情况下的决策问题,并通过自身的自学习能力,使未来空战决策更有效。但神经网络法需要大量的样本进行训练,在现实中真实的空战数据很难获得,难以对神经网络进行学习训练。所以,大量的实战样本称为神经网络在空战决策中应用的瓶颈。
2.5 遗传算法
遗传算法源于自然生物界进化过程,是一种随机化搜索算法。由美国J H Holland[26]教授于20世纪70年代首次提出。由于遗传算法具有很强的适应能力,它可以解决其他优化算法所无法解决的问题。和其它传统的优化算法相比,遗传算法占用资源较小,处理复杂问题能力较强,算法对搜索空间没有特殊要求。通过适当的改进能够收敛到全局最优,因此遗传算法在空战决策领域有着广泛的应用[27]。
文献[28-29]在空战逃逸策略中,从规划报偿和规则激活度的角度研究了规则信度分配问题,为解决复杂的空战决策问题提供了一种全新的方法,使其在较大的状态空间中搜索到最优机动策略,有效的实现逃逸机动策略,很好的躲避了地方的追击。文献[30]中,借助该遗传算法的并行处理数据的能力,完善了空战决策有效性,使得整个空战决策更加准确。文献[31-32]中,把空战态势优势函数和空战能力优势函数作为空战决策的依据,采用遗传算法解决空战决策问题,根据所建立的优势函数构建空战决策模型,进而完成空战决策。
遗传算法在空战中的应用取得了较为满意的成果,能使整个空战过程达到全局最优,但其在空战决策中存在实时性较差的缺点,解决空战决策延时问题成为此方法在空战决策中应用的关键。
2.6 滚动时域控制法
滚动时域控制方法(Rolling Horizon Control,RHC)是一种近似、分解方法。它的实质是用随机时间反复进行的一系列小规模优化问题求解的过程取代一个静态的大规模优化问题求解的过程,以达到在优化的前提下降低计算量并适应不确定性变化的目的。滚动时域控制是一种十分有效的控制策略[33-34],通过在线实时求解有限时域或无限时域目标函数的优化解[35](考虑其约束条件),进而求得飞行控制量。
在基于滚动时域控制的空战决策中,主要思想是根据敌我战机空战态势和战机自身性能,构建机动决策目标集
S=S1US2U…SiU…Sn
(4)
式中:Si—第i步机动决策。
以及战术优势函数,将机动决策问题转化为最优控制问题。根据敌我双方战场信息计算出战术优势函数值,再根据战术指标函数的考虑因素以及终端条件,求出最优飞行控制解,然后执行机动指令,再次获得新的飞行控制量,不断重复,直到找到满足导弹攻击条件的飞行控制量,完成空战任务。
目前,滚动时域控制方法在航空领域有着广泛的应用,但是对滚动时域在空战决策中应用还较少。文献[36]运用滚动时域控制方法控制战斗机的编队问题,在一定程度上提高了空战任务的完成效率。,文献[37]首次将滚动时域控制方法运用到空战决策中,利用敌我空战态势和战机自身作战能力,建立评估函数,得到决策的目标集,综合考虑战机的战术优势,攻击时间和自身损耗,建立总的指标函数,再根据空战的终端条件要求,然后求出模型的数值解,得到最优飞行控制量,完成空战任务。
滚动时域控制法在空战决策中的应用从缩短机动时间上入手,使空战决策更加清晰易懂,避开从角度、距离等间接因素进行空战决策。但是滚动时域控制方法中战术优势函数和机动决策目标集是进行空战决策的基础,而这两部分在实际空战中是不容易建立的,只能根据经验者来建立和划分,它们的准确与否将会直接影响空战决策结果。
3 空战决策技术的未来研究方向
伴随着中远程空空导弹的发展,超视距空战称为空战的主角,未来空战决策应侧重于基于导弹是否满足发射条件以及其命中概率作为决策优先考虑的因素。空战逐渐演变为使敌机尽早进入我机导弹攻击区的同时我机尽量避免落入敌机导弹攻击区的空战过程。由于战斗机自身的超机动性能,所以在未来战斗机空战中,建立一种全面的、高精度的、高实时性的适合战斗机的空战决策方案是未来空战决策发展的趋势。无论用什么方法,建立的空战决策模型必须符合现代空战的要求,使决策方法更加贴近实战,以击落敌机保全自身作为目的,避免单纯的追求机动动作最优。
参考文献(References):
[1] 方绍琨,李登峰.微分对策及其在军事领域的研究进展[J].指挥控制与仿真,2008,30(1):114-117.
[2] 万伟,姜长生,吴庆宪.单步预测影响图法在空战机动决策中的应用[J].电光与控制,2009,16(7):13-16.
[3] 赵威.基于专家系统的双机协同攻击决策技术研究[D].西安:西北工业大学,2007:6-14.
[4] 王凯,李望西,轩永波.基于BP神经网络的空空攻击区解算即仿真[J].弹箭与制导学报,2010,30(1):75-78.
[5] 黄家成,谢奇峰.基于遗传算法的协同多目标攻击空战决策方法[J].火力与指挥控制,2004,29(1):49-52.
[6] 张涛,于雷,周中良,等.基于人工势场启发粒子群算法的空战机动决策[J].电光与控制,2013,20(1):77-82.
[7] Jamark B.A missile duel between two aircrafts[J].Journal of Guidance,1985,8(4):508-513.
[8] Horie K,Conway B A.Optimal fighter pursuit-evasion in maneuvers found via two-side optimization[J].Journal of Guidance,Control and Dynamics,2006,29(1):105-111.
[9] 王义宁,姜玉宪.空战决策中的智能微分对策法[J].飞行力学,2003,21(1):66-70.
[10] 秦艳琳,吴晓平,杨广.基于梯度迭代法的一类追逃对抗模型研究[J].海军工程大学学报,2005,17(4):108-112.
[11] 吴文海.考虑约束追踪对策最优开环对策的必要条件[J].飞机设计,2003,2(3):60-65.
[12] 罗德林,沈春林,吴文海,等.空战格斗决策研究[J].应用科学学报,2006,24(1):89-93.
[13] 董彦非,申洋,张恒喜.空战机动决策中的影响图法[J].电光与控制,2001,8(1):49-53.
[14] 钟麟,佟明安,钟卫,等.基于影响图的空战机动决策模型[J].系统仿真学报,2007,19(8):1796-1798.
[15] 梅丹,吴文海,徐家义,等.决策影响图方法在三维空战决策中的应用[J].电光与控制,2008,15(2):66-69.
[16] 刘正敏,昂亮,姜长生,等.多级影响图在无人机群协同空战机动决策中的应用[J].电光与控制,2010,17(10):10-13.
[17] 王嘉.几种典型机动动作的自动飞行仿真研究[D].西安:西北工业大学,2007,11-27.
[18] 胡秉科.歼击机一对一空战模拟系统及其应用[J].航空系统工程,1992,5:35-43.
[19] 蔡自兴,约翰.德尔金,龚涛.高级专家系统:原理、设计及应用[M].北京:科学出版社,2005:47-48.
[20] Guierrez L,Vachtsevanos G,Heck B.An approach to the adaptive mode transition control of unmanned aerial vechicle[C] .Procedings of 2003 American Control Conference,Denver,Colorado,2003.
[21] 魏强,周德云.基于专家系统的无人战斗机智能决策系统[J].火力与指挥控制,2007,32(2):115-119.
[22] 王刚,雷英杰,何晶.空战决策指挥引导专家系统[J].空军工程大学学报,2002,3(1):11-13.
[23] 祝世虎,董朝阳,张金鹏,等.基于神经网络与专家系统的智能决策支持系统[J].电光与控制,2006,13(1):8-11.
[24] 佟明安,李林森.协同多目标攻击空战决策及神经网络实现[J].航空学报,1999,20(4):309-312.
[25] 常勇,姜长生,陈志伟.基于模糊神经网络的多机多目标空战决策[J].电光与控制,2011,18(4):13-17.
[26] Holland J H.Adaptation in nature and artificial systems[M].Ann Arbor:MIT Press,1992.
[27] Luo D L,Shen C L,Wang B.Air combat decision-making for cooperative multiple target attack using heuristic adaptive genetic algorithm[C].Machine Learning and Cybernetics,2005.2005,l(1):473-478.
[28] 周锐,陈宗基.遗传算法在逃逸机动策略中的应用研究[J].控制与决策,2001,16(4):465-472.
[29] 戴邵武,左斌,胡云安.遗传模拟退火算法在机动逃逸策略中的应用[J].飞行力学,2006,24(2):77-80.
[30] 周德云,李锋,蒲小勃,等.基于遗传算法的飞机战术飞行动作决策[J].西北工业大学学报,2002,20(1):109-112.
[31] 张涛,于雷,周中良,等.基于变权重伪并行遗传算法的空战机动决策[J].飞行力学,2012,30(5):470-474.
[32] James S,Jonathan P,Brian W,et al.Air-combat strategy using approximate dynamic programming[J].Journal of Guidance,Control and Dynamic,2010,33(5):1641-1654.
[33] Mayne,D Q,Rawings,et al.Constrained model predictive control:stability and optimality[J].Automatica,2000,36(6):789-814.
[34] Lee Y I,Kouvaritakis B.A linear programming approach to constrained robust predictive control[J].IEEE Trans on Automatic Control,2000,45(9):1765-1770.
[35] Bin XU,Kurdila A,Stilwell D J.A hybrid receding horizon control method for path planning in uncertain environments[C].The 2009 IEEE/ RSJ International Conference on Intelligent Robots and Systems October 11-15,2009:4887-4892.
[36] 张祥银,段海滨,余亚翔.基于微分进化的多UAV紧密编队滚动时域控制[J].中国科学,2010,40(4):569-582.
[37] 付昭旺,李战武,强晓明,等.基于滚动时域控制的战斗机空战机动决策[J].电光与控制,2013,20(3):20-24.