APP下载

熵权神经网络的信息系统安全评估

2018-07-19顾兆军

计算机工程与设计 2018年7期
关键词:权法信息系统神经元

顾兆军,辛 倩+

(1.中国民航大学 信息安全测评中心,天津 300300;2.中国民航大学 计算机科学与技术学院,天津 300300)

0 引 言

信息系统安全评估方法主要分为定性评估、定量评估和综合评估。由于信息系统的安全因素难以量化,大多数学者采用层次分析法、熵权法、模糊理论、故障树等[1-4]定性与定量相结合的综合评估方法建立信息系统安全评估模型,但计算复杂、评估结果受主观因素影响较大,且无法解决非线性问题。为避免这些缺陷,国内外学者采用DS证据理论、支持向量机、神经网络、贝叶斯网络等[5-7]人工智能算法构建信息系统安全评估模型,取得了较好的评估结果。de Gusmão A P H等[8]将事件树与模糊理论相结合,但在确定事件发生时没有统一的方法,导致不同方法设置事件发生的概率不同;赵刚等[9]使用熵权法计算指标权重,使模糊合成中的权重更加客观,但是当信息系统有较多互相关联的安全因素时,缺乏学习和自适应能力;马丽仪等[10]采用模糊神经网络评估信息系统的安全风险,将风险因子进行模糊化后输入到神经网络训练,提高了神经网络对模糊性的识别能力,但隶属度矩阵和权重均采用专家评判,客观性较差,在一定程度上影响整个模型的实用性;赵保华[11]采用层次分析法赋予指标权重,但由于信息系统安全指标较多,导致计算量大,且容易出现残缺判断矩阵。

为了进一步提高评估的准确性,针对当前信息系统安全影响因素较多、且各因素之间相互关联等特点,本文提出了熵权法优化BP神经网络(back-propagation neural network)的信息系统安全评估模型(熵权-BP),并通过具体实例对熵权-BP信息系统安全评估模型的性能进行检验。

1 信息系统安全评估过程

信息系统安全评估是非常复杂的过程,影响信息系统安全的因素很多,各因素之间又相互关联,使得安全因素与信息系统安全评估结果之间呈现出一种复杂的非线性关系。信息系统安全评估模型可以表示为

Y=f(x1,x2,…,xn)

(1)

式中:Y是信息系统安全评估结果,xi表示信息系统的安全影响因素,f()为非线性函数,所以信息系统安全评估结果的准确性与安全因素的选取以及非线性函数f()直接相关。本文根据等保测评要求构建评估指标体系,选择熵权法对评估指标进行重构,并采用具有高度非线性映射能力的BP神经网络建立信息系统安全评估模型,熵权-BP安全评估流程如图1所示。

图1 熵权-BP安全评估流程

2 熵权-BP神经网络评估模型

2.1 安全指标体系

评估信息系统的安全状况首先是构建评估指标,即安全影响因素。安全影响因素的选取是否科学合理,直接影响评估结果的真实性。本文根据《信息安全技术 信息系统安全等级保护测评要求》[12],从技术和管理两大层面构建了层次结构的信息系统安全评估指标体系,如图2所示。其中技术层面包括物理安全、网络安全和运行安全,管理层面包括制度、机构、人员、建设和运维安全管理。

图2 信息系统安全评估指标体系

2.2 熵权法确定指标权重

由于影响信息系统安全的因素众多,必然存在对评估结果无影响的因素,为避免无用信息对BP神经络学习过程的干扰,应提取重要指标作为BP神经网络的输入向量。在对信息系统安全评估时,通常用权重来表示指标的重要性。熵权法属于客观赋权法,通过实际数据利用严谨的数学理论得到较为客观的指标权重,避免了主观方法确定权重的严重缺陷,使指标权重更具有科学性和说服力。

信息论中的熵值反映了信息的无序化程度,可用来度量数据所提供信息量的大小。当某项指标在不同系统的变异度越大时,熵值越小,说明该指标传递的有效信息量就越大,在综合评估中起的作用就越大,则该指标的权重也应该越大;反之某项指标的变异度越小,该指标的权重也应越小。因此,本文利用同一评估指标在不同信息系统的变异度,通过信息熵计算得到各指标的权重。

2.2.1 构建评估指标矩阵

利用已完成安全测评的m个信息系统与其n个评估指标形成评估指标矩阵R=(rij)nm

(2)

式中:rij(i=1,2,…,n;j=1,2,…,m) 为第j个信息系统的第i个指标的实际评估结果。

2.2.2 指标权重计算

(1)根据指标矩阵R,计算第i个指标下第j个信息系统的指标值的比重pij

(3)

(2)计算第i个指标的熵权ei

(4)

(3)用lnm对各指标的熵权进行归一化处理

(5)

(4)引入差异系数1-ei来正向度量指标i的熵权,得到指标i的权重

(6)

2.3 熵权-BP神经网络结构

BP神经网络即误差反向传播神经网络,具有较强的自学习和自适应能力,目前被广泛用在综合评估领域。由于信息系统安全因素较多,且因素之间相互关联,为了避免BP神经网络在学习过程中陷入过拟合,采用熵权法得到评估指标权重,提取出重要指标并将其输入到BP神经网络中,从而提高评估指标的质量,消除无用指标对BP神经网络学习内部知识的干扰。熵权-BP神经网络结构如图3所示。

图3 熵权-BP神经网络结构

图中u表示指标体系的所有评估指标,x表示重要评估指标,y表示隐含层神经元的输出,z表示输出层神经元的网络输出值。wij和wj分别为传递层到隐含层与隐含层到输出层之间的连接权值。l、n和m分别比为输入层、传递层和隐含层神经元的个数。

参照上图,熵权-BP神经网络建模过程:

步骤1 第1层为输入层,其神经元的个数为评估指标体系中的19个指标;

步骤2 第2层为指标提取层,通过构造指标矩阵利用信息熵计算第1层各指标的权重,并提取出重要指标;

步骤3 第3层为传递层,将第2层选取出重要指标传递到BP神经网络中;

步骤4 第4层为隐含层,主要处理评估指标到评估结果间的非线性映射,隐含层神经元个数的选取是BP神经网络建模成功的关键,借助经验公式

(7)

式中:n表示传递层神经元个数,β∈[1,10]的常数。

步骤5 第5层是输出层,根据实际需要只设定一个神经元,代表信息系统安全评估结果。

此时,熵权-BP神经网络结构的构建已完成,接下里就是第3层到第4层之间与第4层到第5层之间权值的学习过程。

2.4 BP神经网络学习算法

BP神经网络学习过程:

(1)随机初始化BP神经网络所有的权值和阈值;

(2)BP神经网络正向传递信号,传递层到隐含层神经元样本p的计算公式

(8)

隐含层到输出层神经元样本p的计算公式

(9)

神经元作用函数为

(10)

式中:θj表示隐含层神经元j(j=1,2,…,m) 的阈值,θ表示输出层神经元的阈值;

(3)使用α-η联合算法反向修正权值和阈值;

传递层到隐含层以及隐含层到输出层之间的连接权值修正

(11)

隐含层和输出层的阈值修正

(12)

其中,δ和δj为误差项,输出层和隐含层神经元误差项

(13)

式中:f′表示对f求导,η∈(0,1)为学习速率,加快网络的收敛速度;α∈(0,1)为动量因子,避免BP网络陷入局部最优。

(4)h组样本拟合误差函数为

ΔE=E(t+1)-E(t)

(14)

(15)

ΔE<ε

(16)

其中,ε为误差精度,满足(0≤ε<1),当网络误差达到误差要求或者达到学习的最大次数T(t≤T),BP网络学习过程结束,否则转向步骤(2),继续学习直到满足条件为止。

3 实例研究

3.1 数据来源

本文收集民航已完成安全测评的30个信息系统作为样本数据。由于评估指标单位不同,对评估指标用最大最小法归一化处理

(17)

式中:ui为第i个评估指标的值,uimin和uimax分别为ui的最小值和最大值。

信息系统安全评估指标归一化后得到新数据,见表1。选择前22个作为熵权-BP模型的训练样本,其余作为测试样本,用于检验熵权-BP模型的安全评估效果。

表1 信息系统安全评估数据

3.2 熵权法提取重要指标

(1)使用已完成安全测评的30组指标数据形成一个指标矩阵R,即

(2)通过2.2.2节的计算步骤,得出各指标的权重

W=(0.17,0.008,0.006,0.24,0.02,0.03,0.03,0.039,0.04,0.1,0.17,0.09,0.01,0.01,0.02,0.035,0.05,0.08,0.06)

对评估指标权重进行排序,经验证改变权重小于0.05指标的取值对整个评估结果没有影响,可以作为数据噪声将其剔除,剩下8个重要指标

W′=(0.24,0.17,0.17,0.1,0.09,0.08,0.06,0.05)

8个重要指标分别为网络设备安全、物理设备安全、应用软件安全、终端设备安全、数据库安全、人员安全管理、运维安全管理和建设安全管理。

3.3 熵权-BP模型训练

将重要指标输入到BP模型中进行训练,BP神经网络的学习率η为0.5,动量因子α为0.85,最大学习次数T为6000,预设误差ε为0.001,根据经验公式得到隐含层神经元个数为6个。为了对比,同时对熵权-BP模型和BP模型两个模型进行训练,其训练过程如图4所示。

图4 BP神经网络训练过程

由图4可知,在相同学习目标下,以重要指标数据为输入的BP模型的训练次数明显比以原始指标数据为输入的BP神经网络模型的训练次数少。

训练结果表明,熵权-BP模型通过对重构后的8个重要评估指标数据进行训练,既保留了重要指标的特征,又减少了无用指标对BP神经网络学习的干扰,可以提高BP神经网络的训练速度。

3.4 熵权-BP神经网络模型检验

为了检验熵权-BP模型的评估结果,将测试样本分别输入到BPNN、AHP-BP和熵权-BP模型中进行安全评估。评估结果和评估精度分析结果分别如图5和表2所示。

图5 各模型的网络输出值和期望值之间的对比

模型评估精度/%BPNN86.72AHP-BP91.39熵权-BP96.41

从图5与表2可知,组合的熵权-BP和AHP-BP模型的评估精度高于单一BPNN模型的评估精度,因为这两种组合模型都对评估指标进行了重构,提取出重要指标,使得BP神经网络在反向传播过程中更加逼近真实权值;熵权-BP模型的评估精度高于AHP-BP模型的评估精度,因为熵权-BP模型通过样本数据计算得到指标的权重更加客观、真实地反映评估指标的权重,而AHP-BP模型通过专家构造判断矩阵计算指标权重,指标的权重受主观因素影响较大,可能会错误删除重要指标。总之,熵权-BP模型优于其它两种模型,利用其进行信息系统安全评估是可行的。

4 结束语

信息系统的安全状况受众多因素影响、且因素之间相互关联。BP神经网络模型训练速度慢且容易出现过拟合现象,为了提高评估结果的精度,本文构建了熵权神经网络的信息系统安全评估模型。采用熵权法提取出重要指标作为BP模型的输入,消除无用指标的干扰,提高模型的训练速度,同时具有高度非线性处理能力的BP神经网络能有效解决各因素之间的关联性,弥补传统数学评估方法无法处理非线性关系的不足。但安全指标体系的构建还存在缺点,本文只是从等保测评要求中选取了具有代表性的几大类安全影响因素,而每类因素还包括许多具体的因子,不同安全等级的信息系统每个安全因素的具体因子会有些许不同。后续需要结合实际情况对各类因素进行细分,使评估结果能够为系统管理员提供更有效的参考依据。

猜你喜欢

权法信息系统神经元
基于熵权法的BDS钟差组合预测模型的建立
企业信息系统安全防护
《从光子到神经元》书评
基于区块链的通航维护信息系统研究
跃动的神经元——波兰Brain Embassy联合办公
信息系统审计中计算机审计的应用
BP神经网络结合熵权法优化甘草皂苷提取工艺
基于熵权法*的广西能源安全评价
基于SG-I6000的信息系统运检自动化诊断实践
基于二次型单神经元PID的MPPT控制