基于PLS 特征提取的WNN 装备保障性评估
2019-09-17魏燕明甘旭升孙静娟孟祥伟
魏燕明,甘旭升,孙静娟,孟祥伟,王 宁
(1.西京学院,西安 710123;2.空军工程大学空管领航学院,西安 710051;3.中国兵器科学研究院,北京 100081)
0 引言
装备保障性评估是对装备系统在其寿命周期内,为达到经济而有效地保障所考虑的必需的各种保障组合,是否满足规定的定性和定量的保障性指标要求的评价。它可以帮助部队提高装备保障能力和装备作战使用效能,并使其寿命周期费用达到最低。对装备保障性进行准确评估是武器装备系统尽快形成保障能力和部队战斗力的重要手段。
装备保障性评估涉及的影响因素众多,且交互复杂,本质上是一个非线性评估问题。传统的装备保障性评估,多采用Delphi 法和层次分析法,仅能实现线性评估,无法进行非线性评估。文献[1-3]的研究都取得了一定成果,但都存在着主观性强和过于依赖专家经验等问题。神经网络技术的出现,为装备保障性评估提供一种全新的评估模式[4],它无需明确系统的内在关系,具有逼近任意非线性函数的能力,在解决非线性问题上具有广泛应用。然而,应用中其也存在精度不高、易陷入局部极小等问题,限制了其技术的推广。小波神经网络(Wavelet Neural Network,WNN)是一种基于小波理论的神经网络[5],但性能比传统神经网络有了本质提高,为公认的神经网络替代方法。当然,任何一种方法都不是万能的,WNN 也存在局限,其特征是建模过程无法提取样本。而本文研究的装备保障性评估指标较多,有些指标数据中携带的冗余信息,会对所构建模型的评估性能产生负面影响,有必要深入研究装备保障性评估WNN 建模前的特征提取问题。基于此,提出将偏最小二乘(Partial Least Square,PLS)特征提取技术和WNN 建模方法有机结合,提出一种组合的装备保障性评估方法。并通过实例验证其有效性和可行性。
1 装备保障性评估指标体系构建
影响装备保障性的因素众多,而且这些影响因素与保障性评估结果之间存在着复杂的非线性关系。在设计装备保障性评估指标体系时,应该从分析这些影响因素入手,根据装备保障问题特点,参照相关研究成果,征求专家的意见,选择具有代表性的评估指标,并兼顾指标测量问题,以客观地对装备的保障性进行科学评估[6]。通过对影响装备保障性因素的分析,在遵循指标体系设计原则基础上,按照科学、系统的指标体系构建步骤和流程,从诸多影响因素中筛选出装备保障性评估指标,通过专家问卷调査,对初选指标进行删减和补充,最终确定如图1 所示装备保障性评估指标体系[7]。
2 偏最小二乘分析
PLS 属于第二代多元统计分析技术。它既能够进行主元分析,又可以用于特征提取过程。使用PLS不仅能够筛选出数据中主要特征,而且还能够滤除其中的噪声、消除变量间的多重相关性[8-9]。
设自变量为x1,x2,…,xp,因变量为y1,y2,…,yq,其中,p 表示自变量个数,q 表示因变量个数。对于n个样本来说,可得到数据块X=[x1,x2,…,xp]n×p和Y =[y1,y2,…,yq]n×q。PLS 算法分别从X 和Y 中提取主元t1和u1(t1为x1,x2,…,xp的线性组合,u1为y1,y2,…,yq的线性组合)时,必须遵循:
1)t1和u1应该尽量包含X 和Y 中的变化信息,可表示为var(t1)→max,var(u1)→max,其中,var(·)表示方差算子;
图1 装备保障性评估指标体系
2)t1和u1的相关程度能达到最大,可表示为r(t1,u1)→max,其中,r(·)表示相关系数算子,其计算公式为
式中,n 为数据个数,t1,u1分别为t1,u1的均值。
上述两条准则可转化为如下约束优化问题
式中,E0和F0分别为X 和Y 的标准化矩阵,w1和c1分别为X 和Y 的第一主轴。通过PLS 获取第一主元t1和u1后,t1应该能够尽可能刻画X,同时,又能最好地解释Y。
完成提取t1和u1后,就可以在t1解释后X 和Y的残余信息基础上,提取第二主元t2。如此往复,直到满意精度为止。而将PLS 用于特征提取时,只要提取到所需主元个数m (m<A,A = rank(X),rank(·)表示矩阵求秩算子),即终止运算。PLS 特征提取流程如图2 所示。
图2 PLS特征提取流程
通过以上流程,可提取m 个主元T=[t1,t2,…,tm],并得到W =[w1,w2,…,wm]和S =[s1,s2,…,sm]。标准化矩阵E0的特征向量由下式得出
假设测试样本所形成的数据块为Xt,而其标准化矩阵为E0t,则由下式计算其主元投影矩阵
3 小波神经网络
WNN 是从小波分析理论基础上发展起来的一种新型神经网络,较好地融合了小波的时频局域特性和神经网络的自学习能力。较之于其他类型神经网络,WNN 在处理复杂非线性、不确定、未确知系统等问题上性能更为出色[6,10]。
对于多输入多输出情形,可得到图3 所示的WNN 结构。
则网络输出
图3 多输入多输出WNN
为提高建模效率,WNN 参数初始化可采用经验公式完成。
首先,针对连接权值wji,在[-1,1]区间随机产生均匀分布的初始值w'ji,然后,继续通过以下经验公式完成wji初始化
式中,d=(Xmax-Xmin)/2 表示数据中心值;Xmax=max(X)和Xmin=min(X)。
对于仅包含输入层、隐含层和输出层的三层WNN 结构来说,确定网络结构就是指选取网络的隐含层节点个数。隐含层节点个数的选取,对网络整体性能影响很大。若选取太少,网络能够正确映射出的信息太少,以致“匹配不足”,很难辨识样本;若选取太多,所需训练时间会过长,尤其在训练后期,学习样本中的误差会影响训练收敛方向,造成偏离全局最优,致使泛化能力降低,甚至出现过拟合。目前,选择隐含层节点个数尚缺少理想的解析式,往往通过多次实验以及人员经验来确定。采用文献[11]中的经验公式计算最佳隐含层节点个数:
4 装备保障性PLS-WNN 评估模型
装备系统内部组件间的耦合交互,使之呈现较强的非线性特征。尽管构建装备保障性评估指标体系过程中,遵循了科学的设计原则与构建流程,但仍难以保证各评估指标之间彼此独立,因此,构建WNN 模型前,需要消除各评估指标间存在的多重相关性。另外,由于数据采集和处理原因,指标数据中可能包含一定的噪声成份,对模型性能都可能造成不良影响。为解决上述问题,将PLS 特征提取与WNN 有机结合,构建PLS-WNN 模型用于评估装备保障性水平,其评估流程如图4 所示。也就是通过PLS 的特征提取功能,预先处理指标数据中存在的多重相关性和噪声、降低的输入维数,以期改善WNN 模型的评估效果,进而对装备保障性水平作出正确反映。该流程大致分为模型建立和模型测试两部分。模型建立部分是在训练样本基础上,提取主元特征,利用参数初始化和网络结构确定过程,构建装备保障性的WNN 评估模型;模型测试部分将测试样本输入数据在训练样本主元上的投影,输入所构建的WNN 评估模型进行测试,如果测试结果分析合理,输出结果;否则,转入模型建立部分,重新建立评估模型。
图4 装备保障性PLS-WNN 评估流程
PLS-WNN 本质上是一种组合回归机。它先利用PLS 对原始样本进行特征提取预处理,建立新的训练样本集,然后再使用这些样本集建立WNN 回归模型,完成回归预测任务。实际上,PLS 在该组合回归机中的主要作用包括:1)降低输入维数;2)消除噪声对数据的污染;3)解决自变量多重相关性对建模的影响。这样处理的好处是既降低了WNN 的建模难度,又提高了模型质量。该组合回归机的实现步骤可描述为:
4.1 主元提取
1)分别标准化X 和Y,得到E0和F0;
2)计算主元矩阵T 和矩阵E0的特征矩阵V;
3)利用式(4)计算测试样本的投影矩阵,建立新的测试样本集Ttest。
4.2 训练模型
以T 为训练输入,F0为训练输出,确定最优参数建立WNN 模型。
4.3 测试验证
以Ttest为测试输入,验证所建立的WNN 模型,标准化还原,输出测试结果和评价精度。
为消除量纲的影响,或者是为了突出某些指标的作用,输入数据必须作标准化处理。本文采用了最小-最大标准化法。假定amin和amax分别为属性A的最小和最大值,则最小-最大标准化通过下式,将属性A 的值a 映射到区间(L,H)中的a'
设定标准化区间并没有严格的标准和要求,标准化区间的上限和下限(L,H)取值对模型性能没有实质性影响,通常区间取为[0,1]、[-1,1]或(-0.5,0.5),本文对WNN 输入和输出数据进行标准化时,选取(-0.5,0.5)。
5 案例分析
为便于验证PLS-WNN 性能,算法实现环境:i5四核处理器,CPU 2.6 GHz,内存4 GB,操作系统Windows 7,程序编写编译Matlab2009,评估指标采用均方根误差(MSE),其计算公式为
式中,y 表示实际值,f 表示网络预测值,n 为样本数。
5.1 最优主元数的确定
表1 装备保障性评估样本
通过训练与测试,可得到采用不同主元数p 构建WNN 模型的测试MSE,则p 对MSE 的影响曲线如图5 所示。从给出的结果可以看出,PLS-WNN 的测试MSE 最小值,出现在主元数p 为12 时,之后,主元数变大,MSE 值也随之变大,并渐趋平稳。
图5 主元数p 对WNN 模型测试MSE 的影响
5.2 装备保障性评估
基于PLS-WNN 的装备保障性评估,就是通过PLS 特征提取,从19 个评估指标数据中提取12 主元,将其作为输入训练WNN 模型,进而实现装备保障性的正确评估。
表2 给出50 次重复训练得到的WNN 与PLS-WNN 模型的测试结果对比,其中,TE 表示通过50 次训练得到模型的平均测试输出;LT 表示50次测试输出与真实评价值的差小于真实评价值10%的次数。图6 对比了两个模型训练过程的收敛曲线,其中,MSE 表示均方根误差;Iter 表示训练次数;━代表PLS-WNN 模型,┉代表WNN 模型。
可以看出,对于测试样本,PLS-WNN 模型的平均相对误差为0.009 6,而单纯WNN 模型的平均相对误差为0.046 4,说明PLS-WNN 模型的评估值与真实评估值非常接近,也与装备保障性的实际水平相一致,更为重要的是,采用PLS 预先提取特征后建立的WNN 装备保障性评估模型,不仅简化了网络结构,降低了运算复杂性,从而验证了PLS-WNN用于装备保障性评估的可行性。
表2 装备保障性评估的测试结果对比
图6 两种模型训练的收敛曲线对比
需要指出的是,PLS-WNN 模型对编号11 和12样本得出的正确评估结果,是先由PLS 提取的最能反映装备的实际保障性水平的12 个主元实现的,这说明对于装备保障性评估问题,PLS 可对整个体系的指标进行有效优化,很大程度上消除了指标数据多重相关性,以及所含噪声的干扰,同时,也降低了WNN 输入维数,得到符合实际的评估结果。
6 结论
针对装备保障性评估问题,提出一种基于PLS特征提取与WNN 的集成评估方法,并结合实例,对装备保障性评估的适用性进行验证。仿真分析表明:将PLS 与WNN 有机结合,使所建模型保留WNN 模型的优点,同时,也使模型兼有了特征提取能力,评估性能比未经PLS 处理的WNN 有明显提高。将其用于装备保障性评估是可行有效的,从而为装备保障性评估贡献了一种新的手段和方法。