APP下载

基于自编码神经网络的装备体系评估指标约简方法

2013-12-03张乐刘忠张建强任雄伟

中南大学学报(自然科学版) 2013年10期
关键词:约简网络结构神经元

张乐 ,刘忠,张建强,任雄伟

(1.海军工程大学 电子工程学院,湖北 武汉,430033;2.武汉军械士官学校,湖北 武汉,430075)

武器装备体系(weapon system-of-systems,以下简称WSoS)是在一定的战略指导、作战指挥和保障条件下,为完成一定使命任务,而由功能上互相联系、相互作用的各种武器装备系统组成的更高层次系统。武器装备体系的评估工作是武器装备体系研究的根本点,对武器装备体系建设工作具有指导性意义,因此,科学准确的评估 WSoS的作战效能具有非常重要意义。然而,WSoS是个开放的复杂巨系统,所具有的各种功能和系统构成导致其作战效能评估指标的复杂性,指标间还存在冗余和相关性,直接采用这些指标会增加后续效能评估的时空复杂度,降低评估效率,因此对 WSoS复杂的评估指标体系进行约简,成为WSoS效能评估工作中不可缺少的关键步骤。目前针对不同的作战效能评估系统所使用的评估指标进行属性约简的方法有很多种,主要包括遗传算法[1]、绝对属性约简算法[2]、粗糙集理论等[3−5],这些方法在作战效能评估中针对指标集的约简取得了不错的效果,并得到了广泛应用,但也分别存在一些不足之处。Dong等[1]将遗传算法结合粗糙模糊集应用到卫星导航系统作战效能评估属性约简方面,降低了评估指标的个数,数据维数明显降低,但遗传算法易陷入局部最优、出现“早熟”现象等,使最终得到的结果不一定是最优的约简属性集。程恺等[2]采用绝对属性约简算法针对作战效能的指标进行属性约简,虽克服了分明矩阵法[6]的缺点,但当数据集过大时,约简效率比较低,而且目前的研究还不够深入。粗糙集理论对评估指标的约简已被广泛应用,高尚等[3−4]在作战飞机效能评估和在武器系统效能评估中分别采用粗糙集理论,取得了良好的约简效果,但对外部噪音比较敏感,仍有待改进。胡涛等[5]在装备费用效能评估中,提出采用粗糙集理论进行指标的约简,得到了较优的指标约简集,但其中所涉及的筛选依据仍有待验证。针对目前各种作战系统效能评估中采用的属性约简方法的不足,本文在创建 WSoS作战效能评估指标体系基础上,采用Hinton和 Salakhutdinov提出的自编码网络(Autoencoder network)[7]的深度学习方法实现武器装备体系评估指标集合的约简化,通过非线性映射将复杂的指标体系映射到低维的指标数据中,从而明显减少了数据的维数,保留了关键重要的指标,去除了冗余的指标。

1 武器装备体系指标体系的建立

在武器装备体系评估工作中,建立合理的作战效能评估指标体系对于评估的科学性、准确性是非常关键的。但影响作战效能的指标繁多,指标间还可能存在冗余和相关性,因此,建立WSoS作战效能评估指标体系是一个复杂的过程。

在构建评估指标体系时,本文使用层次分析法(AHP)。由于作战效能概念的量化尚没有统一的标准,因此,用AHP法通过效能对比来刻画装备体系的作战能力的方法具有可操作性。AHP法突出地反映了思维方式层次结构的特点,可以将复杂问题分解成递阶分层的有序结构。由于WSoS指标体系的复杂性,本文将指标体系分为5个层次,即体系能力—一级子能力指标—二级子能力指标—系统能力—装备性能指标,如图1所示。

图1 武器装备体系能力指标层次图Fig.1 WSoS capability indices hierarchical graph

在构建的原始评估指标体系的基础上,通常可采用问卷调查、专家评分的方式对指标进行筛选,构建科学的评估指标体系。

2 作战效能指标约简模型

2.1 作战效能指标数据及处理方法

由于WSoS本身的复杂性,使得评估指标也较复杂。其中:数据样本是指标的具体反映,指标又分为定性指标和定量指标,定量指标又可分为效益型指标、成本型指标、固定型指标和区间型指标等形式。定量指标数据可由历史数据获得,定性指标数据可通过得到的系统状态或者程度量化得到。这些历史数据均可作为训练集的数据进行训练。

在对数据样本进行分类处理的基础上,评估指标数据格式仍不统一,尚无法支持机器计算。如定量指标具有不同的量纲,而定性指标的描述方式不一致。针对定性指标要科学地进行量化,对于不同量纲的指标需要化为无量纲的标准化指标。因此,需进一步对指标数据进行量化、标准化和归一化处理。

针对定性指标的数据,本文采用“专家”调查表法,并分为9个等级对数据进行量化的处理,评估指标的参照标准可经过调研和以往经验获得。对于不同的指标所使用的量纲和单位都不一致,本文采用极差变换法进行标准化处理,从而消除指标间的差异性。

对于效益型指标y,

对于成本型指标y,

其中:x为原始的训练样本值,max(或min)为同一指标的样本数据的最大值(或最小值)。

在WSoS的作战效能的评估过程中,关键步骤是从众多指标中选出合理的、科学的指标体系,以减少由过多指标引起的不确定性。对于次要的或不重要的指标,进行评估时将会影响评估的客观性和科学性。因此,对于确定科学合理的指标体系,对于作战效能的评估是极其重要的。本文针对WSoS的指标特征,采用 Autoencoder方法进行属性约简,去除对评估过程影响不大的指标,减小评估过程所建模型的时空复杂度,有助于提高作战效能评估的效率。

2.2 作战效能指标约简的Autoencoder方法

为了得到更接近实际情况的评估模型,一般会参考很多的历史数据,从中提取出这些数据隐含的规律,但是输入的数据过多会导致评估模型过于复杂,评估效率也会严重下降。本文在进行效能评估前先对输入数据进行降维。影响作战效能的指标繁多,而且这些指标也不是同等重要的,还存在冗余,属性约简就是要求在保持系统分类或回归能力不受影响的条件下,去除一些不相关的或者不太重要的属性。本文根据WSoS的数据特征,采用 Autoencoder方法进行数据降维。

自编码神经网络是由Hinton等[7]于 2006年提出的一种用于学习高效编码的人工神经络,通过学习指定数据集的压缩编码,可达到数据降维的目的[8]。自编码神经网络的结构包括编码部分和解码部分,一般构造成3层或3层以上的网络结构,包括输入层,隐含层和输出层。其中隐含层可由多个层次构成,输入层和隐含层构成编码部分,隐含层和输出层构成解码部分。Autoencoder在编码部分压缩数据,并在解码部分重构数据,所以,一般输入层和输出层具有相同数量的神经元[9]。通过设置隐含层神经元的数目少于输入层和输出层神经元数目,可在隐含层得到输入层的压缩向量,从而达到数据降维的目的。

自编码神经网络的数据降维过程如图 2所示,Autoencoder包括3个步骤[10],分别是预训练过程,展开过程和微调过程。由图 2可以看出:Autoencoder包含多层网络结构,每一层网络均包含2层受限的玻尔兹曼机(restricted boltzmann machine, RBM)[11]。

2.2.1 预训练过程

RBM包括可见层神经元和隐含层神经元,其结构如图3所示。

在权值训练调整过程中,先更新隐含层神经元的状态,再更新可见层的神经元状态,得到调整的权值。其公式如下[12]:

图2 Autoencoder的网络结构Fig.2 Network structure of Autoencoder

图3 RBM的网络结构Fig.3 Network structure of RBM

其中:Δwij指的是权值调整量;wij(t)为连接权值(第 t步时第i和j神经元间);T为网络温度;η为学习速率,为正向平均关联(平均关联等于隐含神经元的输出与可见神经元的乘积);为反向平均关联。

若引入系数ε,且ε可看作迭代步长,此时式(3)可变为:

2.2.2 展开过程

预训练过程中,每一个 RBM隐含层神经元的输出作为下一个 RBM输入数据参与训练,完成预训练之后,合并每一个RBM输出神经元与下一个RBM输入神经元作为一层。这些原本独立的 RBM在预训练过程完成后,将会展开连接成一多层的神经网络。预训练过程中得到的权重即为初始权重,在Autoencoder微调的过程中将会再次调整初始权重,以便得到更好的降维效果。其中针对初始权重的好坏,引用交叉熵(Cross entropy)进行评判。在预训练过程中得到的RBM连接起来并将其展开得到需要的Autoencoder,如图4所示。

2.2.3 微调过程

微调过程就是在预训练过程中得到初始权重后,对该权重进行进一步调整,主要采用交叉熵函数[13]评估以得出最优的权重。交叉熵是度量目标概率分布与实际概率分布之间的差异性,越小说明目标概率分布越接近实际概率分布,效果越好。Autoencoder采用BP算法调整权值的交叉熵函数,公式如下:

其中:ti为特征i值;yi为数据样本重建后对应的特征值。

Autoencoder在微调过程中调整权值,输出层的权值调整为

其中:α为调整步长;Oj为上层神经元的输出。

图4 Autoencoder的展开过程Fig.4 Unrolling process of Autoencoderc

3 WSoS作战效能指标集合约简过程

3.1 样本构造

本文以海上远程精确打击体系(long-rang precision sea strike system-of-systems,LPSS)为例[14],对WSoS作战效能指标约简过程加以阐述。为了得到准确的评估结果,通过多位专家研讨和历史记录数据,选取一次打击条件下的指标数据值和其相应的打击效能值,作为1个样本。并将每个样本进行量化、标准化和归一化处理后,作为系统的输入。每个样本指标如表 1所示(具体效能指标表中未列出)。对指标数据进行预处理后,本文采用尺度变换的方法再对样本数据进行归一化处理[15],所使用的公式为:

其中:a和b为常数;min(y)和max(y)为同一指标数据y的最小值和最大值;y为原始数据;z为归一化处理后的数据。

表1 LPSS体系的每个样本指标及参数值Table 1 Sample indicators and parameters of LPSS

3.2 Autoencoder网络结构设计

Autoencoder由多层神经元网络组成。在图2中,由数据输入层与最终输出层以及中间3层RBM共同构成了 Autoencoder深度学习网络。中间的隐含层的层数决定了这种网络结构的非线性复杂程度。对于不同的高维数据,一般选取3至5层隐含层。

根据评估指标的复杂程度以及指标数目,针对指标体系中的51个指标,本文选用5层Autoencoder网络结构,采用3层隐含层网络结构来表示数据之间的非线性关系。其中隐含层中每层神经元的个数逐步递减最终编码成需要达到的维数,通常第一层隐含层取初始数据维数的10倍以内整数。设置输入层神经元的个数为 51个,其他各层所包含的神经元个数如图 5所示。

图5 每层网络结构图Fig.5 Network structure of each layer

Autoencoder是一种高度非线性的降维方法,在预训练过程中,Autoencoder通过比较编码后重构数据与原始数据之间的差异来确定网络之间的初始权重值,这种方法避免了多层隐含层带来的权重调整的复杂性。在微调阶段,数据的梯度信息和反馈学习方法被用于微调网络之间的权重。Autoencoder的这2个过程使得高度编码后的数据能够代替原有的高维数据。对于51维的指标数据,Autoencoder可以降维到个数维数的数据并用于后续工作。可以根据后续工作要求,使用trial-error方法来确定最终降维数据的维数,本文选取降维输出到5 维数据。

3.3 参数的设置

对实验中所使用的网络结构,本文通过10次训练调整网络结构以达到比较理想的约简效果。针对确定需要约简的属性个数,本文在微调过程中采用交叉熵函数进行判断。交叉熵值越小说明由约简后的属性重构原指标数据的误差越小,得到约简属性越接近原属性。根据LPSS指标特征以及约简后的个数。本文设置的网络结构中各层神经元的个数如下:输入层的神经元为 51个;3层隐含层的神经元分别为 200,100和50个;输出层的神经元为5个。通过实验所使用的Autoencoder网络结构,本文从51个指标属性约简到5个指标属性,而且对评估效果的影响不大,去除了很多无关的属性,大大降低了后期评估的复杂性,有助于提高作战效能评估的效率。

3.4 算法流程

本文针对海上 LPSS作战效能的指标体系采用Autoencoder算法进行约简,该算法的主要流程如下。

步骤 1:数据采集与处理。采用层次分析法得到指标体系,对所有样本数据中的每一个样本数据{x1,…,x51},根据式(1)和(2)进行预处理,得到{y1,…,y51}。根据式(7)得到归一化处理后的数据{z1,…,z51},并将处理后的数据作为 Autoencoder网络结构的输入数据。

步骤2:初始化参数。设置当前迭代次数t=0,预训练和微调的最大迭代次数均为 10。并设置Autoencoder为5层网络结构,进行属性约简实验。

步骤 3:预训练过程。输入使用处理后的指标数据{z1,…,z51},根据实际样本数据和重构数据的差别,由式(3)或(4)调整权重,直到达到设置的最大迭代次数,则获得 5 个属性值{z′1,z′2,z′3,z′4,z′5},该约简后的属性值并非具体的物理指标,但基本反映了原51个指标的特性。若未达到最大迭代次数,则继续对权重进行调整。

步骤4:微调过程。采用BP神经网路调整交叉熵函数,进而调整权重,使重构误差不断减小。输出层和隐含层权值的调整分别依据式(5)和式(6)进行。若达到设置的最大迭代次数,则停止并得到所需的结果,否则继续执行。

Autoencoder算法的流程图如图6所示。

图6 Autoencoder算法流程图Fig.6 Flowchart of Autoencoder

4 实验结果分析

由以上分析可知:样本的 51个指标数据归一到[0,1]区间后作为输入,然后,经过 RBM 中间层;最后,通过输出层输出。每层波耳兹曼机为对称的2层结构,其下层隐含层的输出作为上层 RBM的可视层的输入。经元单元有0和1共2种状态,其每层的神经元状态变化由概率函数来确定(其中 σ(·)为逻辑函数,bj为偏差,vi和 wij分别为可视层的状态和权重)。最高层隐含层的神经元的状态为实数值,并从同一方差的高斯分布中得到,其分布的期望值由下层的 RBM的逻辑函数输出确定。经过预训练和微调过程确定权重后,上层神经元更能够捕获下层神经元的高度关联的活动,进而描述数据之间的高度非线性关系作为最终输出。这样,原始数据中重要的特征被赋予较大的权重,冗余的特征赋予较小的权重值,最后,通过非线性映射得到输出特征值。

在本实验中,将训练样本与测试样本组成一个样本进行数据降维。例如在样本中依据导弹的不同类型,有A和B型导弹的2个样本,通过Autoencoder算法后约简为 5个实数值,样本约简后的属性值如表 2所示。

依据实验中 Autoencoder的输出层设计,可以看到约简后的样本只有5个特征,这些特征为原样本的51个指标非线性映射成的数据,代表样本数据原有的信息。Autoencoder能够将这51维的指标数据高度非线性映射到低维的数据,本实验中选择5维数据输出,也可以根据后续工作,选择合适维数输出,例如采用trial-error方法。为了分析这5个特征能否代表原有51个指标所包含的信息,Autoencoder以这5个特征数据进行重构生成原有的指标数据,图7所示为在预训练中每一层网络进行重构后的数据与原有数据之间的差异,用均方差来表示这种差异,由公式表示(其中:xj为指标特征值,x′为重构后的数据,n为样本个数)。

表2 采用Autoencoder约简样本属性值Table 2 Autoencoder reduction sample attribute value

图7所示为每层RBM网络映射时的MSE误差与迭代次数的关系,可以看出在迭代次数达到3后,平均平方差已经很小。依据上述实验结果,本实验设置迭代次数为 10。在微调过程中,Autoencoder利用回馈网络来微调网络的权重,从而使降维后的数据能够更加精准的代替原有的样本信息。微调过程的重构误差如图8所示。

图7 RBM预训练的重构误差Fig.7 Reconstruction error of pretraining process of RBM

图8 微调过程的重构误差Fig.8 Reconstruction errors of fine-tuning process

在本实验中,样本数据降维成 5维数据。通过Autoencoder方法,这些降维数据能够被完全重构成原有的数据。图8所示为这些重构的数据与原有的指标数据之间的差别,可以看到降维后的数据能够在较低维度中完全代表原有的信息量,从而大大降低了用于后续工作样本的维数,达到了指标约简的目的。

5 结论

(1) 针对WSoS作战指标体系的特征和复杂度,提出采用 Autoencoder算法进行属性约简,为后期的作战效能评估降低时间和空间的复杂度,明显提高了评估的效率。

(2) 采用Autoencoder约简后的属性集,重构原属性集的均方误差已经很小,取得了明显的效果,验证了本文所提出的基于Autoencoder网络的WSoS作战效能评估指标的约简方法的可行性和有效性。后续工作将通过和WSoS作战效能评估相结合,进一步检验指标约简的效果。

[1]DONG Chengxi, WU Dewei, HE Jing.Knowledge reduction of evaluation dataset based on genetic algorithm and fuzzy rough set[C]//2008 International Conference on Computer Science and Software Engineering.Wuhan: IEEE Computer Society, 2008:889−892.

[2]程恺, 车先明, 张宏军, 等.基于粗糙集和贝叶斯网络的作战效能评估[J].计算机工程, 2011, 37(1): 8−15.CHENG Kai, CHEN Xianming, ZHANG Hangjun, et al.Operational effectiveness evaluation based on rough set and Bayesian networks[J].Computer Engineering, 2011, 37(1):8−15.

[3]高尚.基于 Rough 集和支持向量机的作战飞机效能评估[J].计算机工程, 2006, 32(14): 184−186.GAO Shang.Assessing of battle plane effectiveness based on rough set and support vector machine[J].Computer Engineering,2006, 32(14): 184−186.

[4]高尚, 韩斌, 吴小俊, 等.基于粗糙集理论的武器系统效能评定[J].火力与指挥控制, 2004, 29(5): 104−107.GAO Shang, HAN Bin, WU Xiaojun, et al.Assessing the effectiveness of weapon system based on rough set theory[J].Fire Control & Command Control, 2004, 29(5): 104−107.

[5]胡涛, 杨建军, 高冠新, 等.基于ROUGH集理论的装备费用效能评估方法研究[J].科技进步与对策, 2005(2): 79−80.HU Tao, YANG Jianjun, GAO Guanxin, et al.Equipment cost effectiveness evaluation method based on rough set theory[J].Science & Technology Progress and Policy.2005(2): 79−80.

[6]Skowron A, Rauszer C.The discernibility matrices and function in information system[J].Fundameta Informaticae, 1991, 15(2):331−362.

[7]Hinton G E, Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science, 2006, 313(5786):504−507.

[8]Hinton G E.Products of experts by minimizing contrastive divergence[J].Neural Computation, 2002(14): 1771−1800.

[9]Hinton G E, Osindero S, The Y W.A fast learning algorithm for deep belief nets[J].Neural Computation, 2006(18): 1527−1554.

[10]赵杜娟, 刘高平, 黄华, 等.自编码神经网络车牌字符识别研究[C]//多媒体学术会议(NCMT2009).西安: 清化大学出版社,2009: 113−119.ZHAO Dujuan, LIU Gaoping, HUANG Hua, et al.License plate character recognition research with autoencoder[C]//National Conference on Multimedia Technology(NCMT2009).Xi’an:Tsinghua University Press, 2009: 113−119.

[11]Welling M, Rosen-Zvi M, Hinton G.Exponential family harmoniums with an application to information retrieval[M]//Advances in Neural Information Processing Systems.Cambridge:MA: MIT Press, 2005: 1481−1488.

[12]刘高平, 赵杜娟, 黄华.基于自编码神经网络重构的车牌数字识别[J].电子激光, 2011, 22(1): 144−148.LIU Gaoping, ZHAO Dujuan, HUANG Hua.Character recognition of license plate using autoencoder neural net-work reconstruction[J].Journal of Optoelectronics Laser, 2011, 22(1):144−148.

[13]ZHANG Jian, FAN Xiaoping, et al.Research on characters segmentation and characters recognition in intelligent LPR system[C]//Proceedings of the 25th Chinese Control Conference.Harbi: Beihang University Press, 2006: 7−11.

[14]刘占荣.海上远程精确打击体系[J].情报指挥控制系统与仿真技术, 2003, 183(9): 1−12.LIU Zhangrong.Constitution of long-rang precision sea strike system-of-system[J].Information Command Control System and Simulation Technology, 2003, 183(9): 1−12.

[15]郑玉军, 张金林, 李跃华.基于 GA-BP 神经网络的某型装备作战效能评估方法[J].空军雷达学院学报, 2012, 26(5):346−348.ZHENG Yujun, ZHANG Jinlin, LI Yaohua.Operational effectiveness evaluation method based on GA-BP neural network on a certain type of equipment[J].Journal of Air Force Radar Academy, 2012, 26(5): 346−348.

猜你喜欢

约简网络结构神经元
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
基于0-1规划的最小属性约简算法
AI讲座:神经网络的空间对应
快递网络结构研究进展
基于AutoML的保护区物种识别①
跃动的神经元——波兰Brain Embassy联合办公
近似边界精度信息熵的属性约简
研究人员精确定位控制饮酒的神经元
基于时效网络的空间信息网络结构脆弱性分析方法研究
基于互信息的贝叶斯网络结构学习