基于极限学习机的体系作战效能评估建模方法
2019-12-19任天助辛万青严晞隽赵鸿宇
任天助,辛万青,严晞隽,赵鸿宇,周 桃
(1. 北京宇航系统工程研究所,北京,100076;2. 北京精密机电控制设备研究所,北京,100076)
0 引 言
随着现代战争的不断演化,先进武器装备在作战中扮演的角色越来越重要,单一兵种对抗逐渐被体系对抗的形式所取代。然而如何进行武器装备的作战效能评估,并分析其在体系中的贡献一直以来没有得到很好的解决。关于武器的效能评估问题,中国的学者较多采用通过结构化的方法建立评估模型,并对各个效能指标进行综合。文献[1]根据执行任务的不同对武器性能指标进行了归纳,得到武器装备体系应具备的基本作战能力为:机动能力、信息感知能力、指挥控制能力、火力打击能力、防护能力和综合保障能力等,将所有指标归纳到这些能力中利用层次分析法进行评估。文献[2]通过灰色关联分析法与层次分析法的集成,对结构化能力指标进行体系效能评估,但是数据来源于专家打分的结果,不可避免地带有主观随意性,同时能力层级的划分也存在着争议。文献[3]与文献[4]分别利用“折合系数”与模糊区间关系来试图分析体系指标的影响,这些方法初步体现了数据驱动的思想,但是方法的可靠性、合理性有待验证[5]。除了基于指标的评估方法之外,还有一种思路就是进行复杂的体系对抗仿真推演,利用作战仿真得到的数据来进行评估,然而这种方法一方面过程复杂、成本高,另一方面依赖作战想定的合理性,如果出现偏差结果的可信度反而不如利用能力指标进行评估。文献[6]中充分体现了数据驱动的思想,设计了堆栈自编码神经网络和支持向量回归机的混合预测模型用于体系作战效能评估,为这类问题打开了思路。然而其中选用了深度学习与大数据的方法,但在实际中这类军事工业部门所掌握的数据很难达到真正意义上的大数据,使用这类方法成本与收益不匹配。
本文试图延续文献[6]中的思路,利用一种数据驱动的思想,并将机器学习领域的极限学习机方法应用在体系作战效能评估当中,以提高方法的可靠性与合理性,解决评估过程中存在大量人为因素干扰与主观性的影响等问题。
1 数据驱动效能评估模型
国防工业部门在设计新型武器过程中,从提高效能的角度来看,往往从提升某个或某几个效能指标入手,研发出新一代武器装备。然而提高某一个或某几个指标并不代表整个武器的作战效能有所提高,许多指标间存在耦合性,而这种耦合性可以在试验数据中体现。但是已装备武器的试验数据无法直接迁移到还在设计论证中的装备中,如何建立新旧装备数据间的联系,并实现从局部指标的调整到体系作战效能的提升是一个需要解决的问题。因此,需要建立基于数据驱动的模型,如图1 所示。
图1 数据驱动模型原理 Fig.1 Data Driven Model Principle
构建数据驱动的模型由以下3 个步骤组成:a)模型所需数据的收集。通过物理试验和计算机仿真试验收集数据。对于研制新型武器,数据既来自于上代型号的试验数据,也来自于计算机仿真模拟。对于部分数据需要进行归一化处理再输入模型。b)数据驱动模型的学习与泛化。通过将这些数据输入到机器学习模型中,学习样本输入为型号自身的指标参数,输出为体系作战效能指标。利用学习模型的泛化能力让由数据驱动的模型具有连续的辨识能力,即使对于在设计论证的型号也能给定设想的指标进行体系作战效能评估。c)数据驱动模型的测试与验证。为了确保模型的可靠性,数据模型需要根据实际情况不断的修正,根据模型得到的数据通过更多的模拟与物理试验来确保可靠性。
近年来大数据和机器学习取得了长足的发展,但是在应用这些方法时应当注意到武器试验数据的特殊性。数据的来源包括飞行试验、地面试验等物理试验数据也包括计算机仿真数据。然而这与传统意义上的大数据还是有区别的,在整个武器研发期间所拥有的数据量相比某些互联网公司电子商务一天的数据量都少得多,因此不能照搬商业大数据与机器学习的方法,而是应该选用适合数据量小但数据质量很高的拟合学习算法,例如极限学习机方法。
2 极限学习机方法
极限学习机(Extreme Learning Machine,ELM)是黄广斌等[7]提出的一种在单隐层前馈神经网络(Single-hidden Layer Feed Forward Networks,SLFNs)的基础上发展起来的学习算法,具有学习速度快、泛化能力强等优点,目前已经在许多领域取得了广泛的应用[8,9]。相比较文献[6]中提到的深度学习与自编码神经网络而言,这种方法更加简单,也更加适用于武器的体系效能评估这类训练数据规模较小的问题。
式中 yj为神经网络的输出预测值;g ( w, x, b )为激发函数; wi和 bi分别为输入层与隐含层的权值系数与偏移量; βi为隐含层与输出层权值系数。如果写成矩阵形式,则表示成:
其中:
T 为训练集数据矩阵,即测试数据it 的向量形式,只要使得|| ||−T Y 尽可能接近0,即可以利用这个经过训练的神经网络模型来替代未知的黑箱系统。
在前人的基础上,黄广斌等提出了两个定理。根据定理可知,若隐含层神经元个数与训练集样本个数相等,则对于任意的 wi和 bi,SLFNs 都可以零误差逼近训练样本。且当激发函数 g ( w, x, b )无限可微时,SLFNs 的参数并不需要全部进行调整, wi和 bi在训练前可以随机选择,且在训练过程中保持不变。而隐含层和输出层的连接权值可以通过求解以下方程组的最小二乘解获得:
其解为
由于Η 是任意选取的,通过保证Η 满秩,Η+为Η的伪逆:
为了保证式(3)~(5)中的 ( ΗTΗ )−1的这一项一定可逆并避免出现病态情况,需要对这一项进行正则化,式(3)、式(4)改写为
由于 ΗTΗ 半正定且为实对称矩阵,只要保证λ> 0,就能保证 ΗTΗ +λI 这一项一定非奇异。其中λ 的值可由文献[10]中的方法进行确定。
然而在实际求解过程中如果输入的训练数据量维数比较大,直接进行求逆运算同样会出现矩阵的维数超出了计算机内存的限制问题,此时直接计算就会变得困难。此时可以采用矩阵奇异值分解(Singular Value Decomposition,SVD)解决这个问题。利用SVD 分解同样可以避免矩阵奇异的问题,并且避免了高维矩阵相乘的运算。根据:
则有:
其中:
其中, σi(i = 1,2, ⋅⋅⋅, r)为Η 的非零奇异值。此时式(4)可以写成:
此时不再需要更多的复杂计算,直接利用SVD 分解方法得到2 个酉矩阵U 和V 并与训练集数据矩阵相乘就可得到ELM 中的权值系数。
根据以上叙述,可以看出ELM 的优势在于参数设置非常简单,不像其他神经网络那样需要繁琐的调参、迭代、循环训练并最终收敛的过程,然而在训练数据量很大时也有高维矩阵求逆的缺陷。SVD 法能够在一定程度上改进这一缺陷,因此将其应用在武器体系作战效能评估建模上是可行的。
3 仿真试验
本文采用文献[11]的方法搭建弹道导弹体系攻防对抗模型,进攻方的效能指标包括不同类型的诱饵数、弹头个数、毁伤半径、精度误差等,防守方的效能指标包括目标发现概率、跟踪概率、诱饵识别概率、拦截策略、单发导弹拦截概率等。
试验由如下的几步进行:
a)获取数据。由于进行实际的弹道导弹攻防对抗试验很困难,因此本文的数据均来自于仿真试验,仿真试验共进行了7000 组。
b)数据处理。初始数据杂乱无章,又有不同的量纲,因此需要把所有数据都进行归一化。
c)建立ELM 模型。可以通过设置不同的数据节点数进行评估结果比较。
d)训练ELM 模型。将b)中的数据输入到模型中进行训练。
e)测试ELM 模型。用训练好的模型进行评估,与攻防仿真的结果进行比较。
假设根据试验,得到20 个指标7000 组数据和对应的效能评估值,为了方便进行数据学习,将所有指标进行编号并进行归一化。选取125 组数据作为测试集,其余作为训练集,得到的训练结果如图2 所示。表1 为不同隐含层节点数的学习效果。
图2 不同隐含层节点数的测试结果 Fig.2 Test Results of Different Hidden Layer Nodes
续图2
表1 不同隐含层节点数的学习效果 Tab.1 Learning Effect of Different Number of Hidden Layer Nodess
续表1
由图2 和表1 可知,随着节点数增加,收敛效果不断提升。通过以上结果看出ELM 算法的优越性,只要修改隐含层节点数目这一个唯一的参数就可以不断提升拟合的精度。而随着节点数的不断增加也会出现“过拟合”的问题(见表1 中节点数1000~5000 变化时均方差的变化情况),同样可以根据需要对隐含层节点数进行修改。
此时可以利用训练好的评估模型对弹道导弹体系作战的效能进行评估,某型弹道导弹的参数已知,利用评估模型对采用不同反导方案的目标进行效能评估值预测。假设其他参数不变,选取诱饵类型1、诱饵类型2 和弹头数3 个值,分别在同一基准上增加5 次,每次增加对应大致相同的载荷质量,选用2000 个隐含节点的极限学习机进行效能评估值计算。利用学习模型进行效能提高方案选择如图3 所示。
图3 利用学习模型进行效能提高方案选择 Fig.3 Select the Improvement Program by Using Learning Model
由图3 可知,增加弹头数量能显著提高效能评估值,增加同样质量的诱饵类型1 比诱饵2 的效能评估值提高效果明显。利用数据驱动的模型得到这个结论只需要几秒,而进行导弹攻防仿真需要数个小时,如果进行物理试验的成本则更加难以估计。可见,利用这种数据驱动模型可以更快、更简便地进行体系作战效能评估。
4 结 论
为有效解决体系作战效能评估建模问题,本文提出了基于数据驱动的体系作战效能评估建模思路,并利用极限学习机方法进行实践,得到可以一定程度上代替繁琐的模拟仿真和物理试验的学习模型。试验发现,极限学习机方法可通过有限的样本学习,利用非线性拟合能力将复杂的体系问题映射泛化到神经网络空间中,简化了评估的复杂性,提高了评估的效率。后续工作将采集更多武器装备试验数据对模型进一步开展验证;同时探究效能影响因素指标间的关系,利用各种数据方法对评价指标进行约简。