APP下载

基于M-ANFIS-PNN的目标威胁评估模型

2022-10-10于博文

系统工程与电子技术 2022年10期
关键词:定性聚类矩阵

于博文,于 琳,吕 明,张 捷

(南京理工大学自动化学院,江苏 南京 210094)

0 引 言

目标威胁评估是作战决策过程中的重要步骤,随着作战理论与先进作战装备的发展,部队战斗力迅猛提升,使得现代战争呈现强对抗性、强时效性的特点,对敌方目标威胁评估方法也提出了更高的要求。目标威胁评估根据敌我双方作战资源的性能,我方防御资源的重要程度和敌我作战策略等,对敌方目标的威胁程度进行定量估计,从而确定敌方目标的威胁程度[1]。对来袭目标进行准确的威胁评估,可为作战火力分配、作战资源调配、作战方案优选提供有效的辅助支撑。威胁评估结果可以有效帮助作战指挥人员了解战场态势,进而做出合理有效的作战决策[2]。因此,开展威胁评估的技术研究具有重要的现实意义。

当前,目标威胁评估的主要研究内容集中在评估模型的构建和评估方法的效率提升,评估方法主要包括层次分析法、多属性决策、人工神经网络、模糊综合评价法、灰色关联等,其大体可以分为基于模型的计算方法和基于人工智能的推理方法[3-4]。文献[4]提出了一种基于熵权法和模糊集对分析方法的目标威胁评估方法。文献[5]提出了一种基于深度学习的目标威胁评估方法,通过对称式的训练方法逐层对隐含层进行预训练,最后再对模型进行整体训练。文献[6-7]针对传统评估方法主观性较强的问题,提出了基于层次分析法与熵权法的空中目标威胁评估方法。文献[8]将三角模糊函数与毕达哥拉斯犹豫模糊相结合,提出了基于毕达哥拉斯三角犹豫模糊信息集成算子的威胁评估方法。文献[9]提出了基于可能性理论扩展灰关联的空中目标动态威胁评估方法,以克服探测信息对目标威胁评估的影响。上述方法为威胁评估方法技术的推进起到了积极的作用,但仍有一些问题没有得到解决,主要存在4个问题:①研究目标单一,人为主观因素影响较大;②大多方法都是依赖于定量的数值信息,难以处理非数值信息,如定性分类信息;③模型缺乏可解释性;④缺乏自适应能力,无法针对复杂的态势信息建立评估模型。

基于上述分析,本文在自适应模糊神经推理系统(adaptive network based fuzzy inference system,ANFIS)[10]模型结构的基础上提出一种具有混合数据输入和多项式神经网络(polynomial neural network,PNN)的ANFIS(ANFIS with mixed inputs and PNN,M-ANFIS-PNN)模型。针对混合属性数据建模问题,文献[11]提出了一种带有分类数据输入的ANFIS(ANFIS with categorical inputs,CANFIS)结构,但是其未考虑定性分类数据对模糊规则后件的影响。借鉴C-ANFIS中影响转移矩阵的特性,在ANFIS模型的基础上引入规则前件影响矩阵和规则后件影响矩阵,使定量数值数据和定性分类数据对规则前、后件参数同时产生影响;为了进一步提高模型的预测精度,将ANFIS的输出层替换为PNN[12]结构;针对不同定性属性对聚类分析的影响,通过信息熵对定性属性进行加权,优化近邻传播(affinity propagation,AP)[13]聚类算法的相似度计算公式,提出一种基于熵权和高氏距离的AP(AP based on entropy weight and Gower distance,EGAP)聚类算法,对M-ANFIS-PNN模型的规则进行初始化,从而完成对M-ANFISPNN的结构进行辨识。同时,提出一种基于M-ANFISPNN模型的目标威胁评估方法,对来袭目标的威胁程度进行预估。最后,仿真实验结果表明M-ANFIS-PNN模型相较于其他混合数据建模算法具有较高的可信度和较高的评估精度。

1 基于M-ANFIS-PNN的目标威胁评估模型

实际作战过程中,目标威胁评估的主要影响因素包括:目标距离、目标速度、目标航向角、目标高度、目标类别、目标攻击状态、目标被毁伤状态、目标指控能力等,其中包含定量数值信息和定性分类信息。针对d个来袭目标进行威胁评估,目标t d的特征信息A d记为A d={ai|i=1,2,…,n,n+1,…,n+m-1,N},其中有n个定量数值特征,m个定性分类特征,N=m+n。常用的目标威胁评估方法中,大多数方法仅对定量数值信息有效,难以处理包含定量数值信息与定性分类信息的混合属性数据。基于此,本文提出一种M-ANFIS-PNN模型,根据态势感知系统采集的来袭目标特征信息,以来袭目标状态信息作为输入,来袭目标威胁程度作为输出,建立目标威胁评估模型。

1.1 M-ANFIS-PNN的网络结构

传统的ANFIS模型仅对数值类型输入数据具有效果,当输入信息是包含定性分类信息和定量数值信息的混合数据时,传统的ANFIS模型无法对其进行有效的推理。假设,对某混合数据集进行推理模型建模,其中有两个定量数值输入信息和一个定性分类输入信息,ANFIS的第l条规则表示为:R l:Ifx1isandx2isandx Cis,Then。其中,x1、x2属于定量数值输入信息;x C属于定性分类输入信息为模糊子集;y l为第l条规则的后件输出。而规则Rl中的是无法直接进行计算的,因为x C属于定性分类数据。

针对传统的ANFIS模型无法有效处理包含定性分类信息和定量数值信息的混合属性信息的问题,文献[11]提出了C-ANFIS模型,在一定程度上解决了混合属性信息的处理问题。但是,该模型仅将定性分类信息的影响作用于规则前件,没有考虑定性分类信息对规则后件的影响。针对这一缺陷,本文在ANFIS模型结构的基础上引入规则前件影响矩阵和规则后件影响矩阵。同时,为了进一步提高模型的准确性,将整个ANFIS的输出层替换为PNN结构。PNN是一种自组织方法,以Kolmogorov-Gabor多项式为基础的复杂非线性系统的辨识方法,其拓扑结构不是预先固定的,而是在学习过程中根据输入变量、网络结构和网络参数逐步优化得到的,具有较强的非线性拟合能力,在处理稀少样本数据建模、预测等方面具有一定的优势[14-17]。基于此,本文提出一种M-ANFIS-PNN模型,其主要结构包括模糊层、规则层、规范化层、定性分类信息编码、前件影响矩阵A、前件混合激励层、后件影响矩阵C、后件混合激励层、PNN输出层,M-ANFIS-PNN模型的结构如图1所示。

图1 M-ANFIS-PNN结构图Fig.1 Structure diagram of M-ANFIS-PNN

各层输出如下所示。

第1层:模糊层。该层中的神经元对输入信息进行模糊化操作,每个神经元的输出都是对规则的激励强度。本文选取高斯函数作为隶属度函数,各神经元的输出可以表示为

式中:cij,σij为模糊规则的前件参数。

第2层:规则层。该层中的每个神经元将输入信息进行累乘,并输出其乘积。第l个神经元输出的结果为第l条模糊规则的激励强度w l:

第3层:规范化层。对各神经元的激励强度进行归一化。

第4层:前件混合激励层。该层神经元计算混合数据对各规则的激励强度。

式中:f l=SE·A l,SE为分类信息的独热编码,A l为规则前件影响矩阵的第l列,f l为分类信息对第l条规则的激励强度。

第5层:后件混合激励层。计算各规则的输出结果。

式中:p l=SE·C l,C l为规则后件影响矩阵的第l列,p l为分类信息对第l条规则的激励影响。

第6层:输出层。计算M-ANFIS-PNN的总输出。为了进一步提高模型的准确性,将PNN结构作为输出层,具体计算过程详见文献[18]。

1.2 M-ANFIS-PNN的结构辨识

ANFIS模型中基于网格划分的聚类方法会随着数据维度的增加导致聚类数量成几何倍数增长[19],不可避免地导致维度灾难,为了克服这一缺陷,本文提出EGAP聚类算法,用来对M-ANFIS-PNN模型进行结构辨识。AP聚类算法相对于其他聚类算法不需要预先指定聚类个数,具有较强的鲁棒性和较高的精准度[20-21]。AP算法中样本空间内各样本的相似性是通过欧式距离计算的,若样本信息中包含定性分类信息,AP算法就无法有效的对样本进行聚类[22-23]。如果仅对样本空间中的定量数值信息进行聚类,形成的模糊推理结构并不完备,忽略了样本空间中定性分类信息对结构辨识的影响。Gower距离[24]可以计算定性分类信息之间的距离,但是其计算结果只有0和1,这就使得具有相同距离的样本可能具有差异很大的属性值,忽视了各定性属性之间数据分布的差异性。基于此,EGAP算法将Gower距离和信息熵的概念引入到AP算法的相似度度量公式中,一方面充分利用AP算法的优势,另一方面借助改进后的相似度度量公式有效描述混合属性数据之间的相似性,使其可以有效对混合属性数据进行聚类分析,体现出定性分类信息对模型结构辨识的影响。

根据文献[25-26],定义样本空间中点x i和点x j之间的Gower距离为

在聚类分析过程中定性属性与定量属性对相似度的影响不同,定性属性作为目标对象的特殊特征,需要独立处理,而定量属性则更重视整体效应对相似度的影响[27-28],因此,EGAP算法中样本点x i和x j之间的相似度s(i,j)的计算公式定义为

EGAP聚类算法的主要步骤如下。

步骤1确定阻尼系数λ、最大迭代次数maxiter、稳定次数conviter,初始化吸引度矩阵R和归属度矩阵MA。

步骤2通过式(7)~式(9)计算相似矩阵S,并设置偏向参数p,p=median(S),令相似矩阵S中s(k,k)=p。

步骤3通过式(10)~式(12)更新吸引度矩阵R和归属度矩阵A。

步骤4迭代更新吸引度矩阵R和归属度矩阵MA,直至聚类中心连续conviter次迭代没有发生变化或达到最大迭代次数。

步骤5根据求解出的聚类中心对数据进行聚类。对于数据样本点i,有

如果k=i,样本点i为聚类中心;如果k≠i,样本点i为以样本点k为聚类中心的聚类集群成员。

1.3 M-ANFIS-PNN威胁评估模型建模步骤

M-ANFIS-PNN威胁评估模型的构建步骤如图2所示。

图2 M-ANFIS-PNN流程图Fig.2 Flow chart of M-ANFIS-PNN

下面将对M-ANFIS-PNN模型的构建步骤进行详细阐述:

步骤1将目标状态信息数据集划分为训练数据集和测试数据集。

步骤2选取模糊函数对目标状态属性中的定量数值信息进行模糊化。通过EGAP算法对混合属性数据进行结构辨识,根据聚类集群确定模糊规则的数量,同时确定隶属度函数及其数量。

步骤3通过独热编码方式对目标状态信息数据集中的定性分类信息进行编码。假设数据集中包含两个定性分类变量目标类别C1和目标攻击状态C2,其中C1的候选值为武装直升机、坦克、无后坐力炮,C2的候选值为一级攻击状态、二级攻击状态、三级攻击状态。

令C1=[C11,C12,C13]、C2=[C21,C22,C23],C1、C2定性分类变量的独热编码SE如表1所示。

表1 C1,C2分类变量的独热编码Table 1 1-out-of-n encoding of C1,C2 categorical variables

步骤4确定M-ANFIS模型的结构和模糊规则。通过对混合数据集的结构辨识得到L条模糊规则,其中第l条规则定义为R l:Ifx1isandx2isand…andx nisandx Cis SE,Thenx n+p l。其中,(x1,x2,…,x n)T为定量数值输入信息;x C=为定性分类输入信息。

步骤5确定与M-ANFIS相关的参数。在训练数据集和测试数据集的基础上,采用反向传播算法计算步骤2的前件参数,采用最小二乘误差法计算步骤4的后件参数、规则前件影响矩阵、规则后件影响矩阵。

步骤6确定与PNN相关的参数。将步骤5的输出引入到PNN部分,将各层输入两两交叉组合生成下一层参考模型,进一步拓展模型,参考模型一般采用非线性传递函数,参考模型的传递函数如下:

式中:A、B、C、D、E、F为多项式的系数;k为层数。若有L个输入变量,将相应地生成个传递函数,各传递函数的参数通过最小二乘误差法获得。

步骤7选择参考模型。选取Akaike信息准则[29]作为外部评价准则,其计算公式如下所示。

式中:f为参数的数量,q为样本数量,SSR为估计输出和实际输出之间的残差平方和。根据预先设定的各层模型保留个数,在测试集中以外部准则最小为原则进行模型优选,并将所有模型中最小外部准则值设为生成层的外部准则值。

步骤8评估外部标准。在参考模型优选的过程中,随着模型复杂度的增加,外部准则值会呈现出先变小后增大的趋势,当外部准则数值不再减少时,此时获得的模型即为最优模型[30],自适应组织过程自动停止;如果外部准则值没有获得极小值,则重复步骤6~步骤8。

步骤9将来袭目标ti的状态属性A i输入训练后的M-ANFIS-PNN模型中,通过其对来袭目标的威胁程度进行定量估计。

2 仿真实例与结果分析

本文的训练数据与测试数据为自建数据集,针对陆战中地面作战单元和低空作战单元的特点,按照文献[5]的方法生成样本数据集,其包含10个目标特征属性:目标距离D、目标速度V、目标航向角CA、目标高度H、目标有效射程FR、目标加速度AC、目标类别C、目标攻击状态A、目标被毁伤状态DS、目标指控能力CC,表2为目标特征属性的取值范围。

表2 目标特征属性的取值范围及属性值Table 2 Value range and attribute value of the target characteristic attribute

2.1 威胁评估实例分析

以要地防御作战为背景,根据作战想定,指定某野战部队驻守某重要资源,在进行资源调度和火力分配前,按需对来袭目标进行威胁评估。通过自建数据集完成M-ANFISPNN威胁评估模型的训练,使用训练后的威胁评估推理模型对18个典型目标进行威胁程度R的定量估计,如图3所示为典型目标示例图,其评估结果如表3所示。

表3 来袭目标特征信息Table 3 Incoming target feature information

图3 典型目标示例图Fig.3 Typical target example diagram

由表3可知目标1的特征信息为

将目标1的特征信息输入到M-ANFIS-PNN模糊推理机中,根据推理规则确定目标1的威胁程度估计值为0.994 1。目标1为装甲作战指挥车辆,具有较好的机动性,具有指挥周围作战单元进行协同作战的能力,具有较强的指控能力,对我方整体防御作战具有较大威胁。同理,目标2~目标7的威胁程度估计值分别为0.943 1、0.969 9、0.321 4、0.392 7、0.727 6、0.979 4。目 标2和 目标3处于近距离攻击状态,且目标3处于近距离定点攻击,同时拥有较好的攻击视野,所以目标3的威胁程度高于目标2,二者对我方防御目标具有较大威胁;目标4和目标5遭受到一定程度的毁伤,可能处于撤离状态或阵地转移状态,目标5相对于目标4与防御目标具有较近的距离,且移动速度较低,同时目标5具有较大的射程更容易进入攻击状态,所以目标5的威胁程度高于目标4;目标6处于作战支援状态,以高速状态向目标行进;目标7则处于低速低空攻击状态,可对地面作战资源实现火力压制,对防御目标和我方地面作战资源具有很大的威胁。目标威胁程度:目标1>目标7>目标3>目标2>目标6>目标5>目标4,上述评估结果与文献[3]和文献[4]的评估结果一致,符合实际情况,可以看出本文所提出的M-ANFIS-PNN模型可以有效对来袭目标的威胁程度进行评估。

2.2 威胁评估模型性能分析

针对本文提出的M-ANFIS-PNN模型,从模型结构影响分析、结构辨识影响分析和其他几种典型混合数据推理系统模型误差对比分析来验证本文所提出模型的性能。

初始参数设定:EGAP算法中阻尼因子λ设置为0.9、最大迭代次数为1 000,聚类中心连续10次不变为终止条件。M-ANFIS-PNN模型的训练周期为500,学习率设置为0.01,规则前、后件影响矩阵为[0,1]区间内的随机矩阵,采用反向传播(back propagation,BP)算法和最小二乘估计(least squares estimation,LSE)混合方法进行参数修正。

实验步骤:进行8组实验,每组随机从自建数据库中抽取70%作为训练集,抽取30%作为测试集。记录每组测试集的相关系数R、均方误差MSE、均方根误差RMSE、误差均值E-Mean和误差标准差E-St D,以此来评价预测模型的性能。

2.2.1 模型结构影响分析

C-ANFIS算法仅考虑分类数据信息对规则前件参数的影响,并未考虑其对规则后件参数的影响;同时,PNN模型的特性可以有效提高模型的准确性。为了进一步提高模型的准确性和处理混合数据的能力,本文在ANFIS的基础上引入规则前、后件参数影响矩阵和PNN结构。

这里通过自建数据集对M-ANFIS-PNN,C-ANFIS,M-ANFIS进行参数辨识,并对来袭目标的威胁程度进行预测。表4为进行8组实验后,上述3种模型在训练数据集、测试数据集和全部数据集中的性能表现,各性能指标取8组实验的平均值。从表4可以看出,在ANFIS基础上,增加规则前、后件影响矩阵得到的M-ANFIS模型相对于C-ANFIS模型具有更低的预测误差;而在M-ANFIS基础上引入PNN网络结构则进一步降低了模型的预测误差。图4为这3种模型的训练后的预测结果对比图,可以看出M-ANFIS-PNN模型的预测精度高于C-ANFIS和M-ANFIS模型。综上所述,本所提出的M-ANFIS-PNN模型相对于C-ANFIS具有更好的性能,有效地降低了模型的预测误差。

图4 C-ANFIS、M-ANFIS、M-ANFIS-PNN预测结果对比Fig.4 Comparison of prediction results of C-ANFIS,M-ANFIS,M-ANFIS-PNN

表4 C-ANFIS(C),M-ANFIS(M),M-ANFIS-PNN(M+PNN)算法性能对比Table 4 C-ANFIS(C),M-ANFIS(M),M-ANFIS-PNN(M+PNN)algorithm performance comparison

2.2.2 结构辨识影响分析

由于原ANFIS中网格划分聚类方法在处理混合属性数据上存在一定缺陷,本文针对此问题提出一种改进的AP聚类算法,用来对混合输入数据进行聚类,生成M-ANFISPNN模型的初始规则,从而完成M-ANFIS-PNN模型的结构辨识。自建数据集中有6个数值类型特征,4个分类类型特征。利用AP算法和EGAP算法对数据集进行聚类操作,依据聚类结果对M-ANFIS-PNN模型的规则进行初始化。从数据集中随机选取8组数据,进行性能对比,其中聚类数量对应着模型规则的数量,预测误差反映不同结构辨识方法对模型预测精度的影响。AP算法与EGAP算法聚类结果如表5所示。AP算法的聚类数目平均值为35,由于AP算法中的相似度计算采用欧式距离,仅对数值信息有效,无法有效反应实际情况;EGAP算法的聚类数目平均值为14,由于引入熵权法改进的Gower距离代替欧式距离,可以有效处理混合属性数据,聚类中心也明显减少。从表5可以看出,两种结构辨识方法的预测精度比较接近,但是EGAP方法生成的规则数目明显较少。数据集聚类数目直接影响到M-ANFIS-PNN模型结构的初始规则数目,较少的规则数目可以有效降低模型中的规则参数,有效提高模型参数的辨识速度。

表5 不同结构辨识方法的性能对比Table 5 Performance comparison of different structure identification methods

2.2.3 模型误差对比分析

为了验证本文所提算法在混合属性数据上的评估性能,选取C-ANFIS、F-ANFIS、N-ANFIS混合数据建模方法进行对比实验[11]。其中F-ANFIS(F)、N-ANFIS(N)、C-ANFIS(C)、M-ANFIS-PNN(M)均采用EGAP算法进行结构辨识。在全部数据集中进行8组实验,各性能指标为8组实验结果的平均值,表6为上述4种建模方法的性能表现,通过各评价指标的对比结果可以看出,本文提出的M-ANFIS-PNN模型相对于其他模型具有较小的预测误差,整体评估结果优于其他模型。

表6 各预测模型误差对比Table 6 Error comparison of each prediction model

3 结束语

针对混合属性信息的目标威胁评估问题,本文提出了一种基于M-ANFIS-PNN模型的目标威胁评估方法。针对现有威胁评估模型的局限性,提出M-ANFIS-PNN模型,在ANFIS的基础上引入前件影响矩阵和后件影响矩阵,使输入信息中的定性信息和定量信息共同作用于模糊规则的前件参数和后件参数,使评估模型具有处理混合属性数据的能力;进一步将ANFIS的输出层替换为PNN,依靠其自组织的特性提高模型的预测精度。同时,将熵权法改进的Gower距离作为EGAP算法的相似度度量,在M-ANFISPNN模型的结构辨识过程中使用EGAP算法,克服了原ANFIS模型无法处理混合数据的缺陷。实验结果表明,本文提出的M-ANFIS-PNN模型可以有效处理混合属性数据,具有较高的预测精度,可以有效完成目标威胁程度的定量评估,可为作战指挥决策提供有效的辅助支持,也为进一步研究目标威胁评估提供了方法参考。

本文所提出的M-ANFIS-PNN的目标威胁评估方法,可以有效完成目标威胁程度的定量评估,但是在实际应用中仍存在一些局限有待改进:M-ANFIS-PNN模型需要大量数据样本进行参数、结构辨识,若数据样本不充足,会对威胁评估结果产生影响;参数的调整过程采用梯度下降法和最小二乘法,该混合学习方法具有较好的效果,但容易陷入局部最优。下一步研究工作的重点将从以上两个问题开展,一方面改进模型以适应小样本数据集,另一方面结合元启发式算法对模型参数进行调整。

猜你喜欢

定性聚类矩阵
一种傅里叶域海量数据高速谱聚类方法
近红外光谱分析技术在纺织品定性定量分析上的应用
超声造影定性与定量分析诊断颈部浅表淋巴结病变的研究
基于知识图谱的k-modes文本聚类研究
基于数据降维与聚类的车联网数据分析应用
薄层色谱法在中药定性定量研究中的应用
基于模糊聚类和支持向量回归的成绩预测
二维不可压磁微极流体方程组的整体适定性和爆破准则
多项式理论在矩阵求逆中的应用
矩阵