基于人工免疫算法的网络安全态势预测
2018-04-20秦丽娜
秦丽娜
(山西警察学院网络安全保卫系,太原 030401)
0 引言
随着互联网技术的发展和网络的进一步应用,各类网络漏洞越来越多,网络攻击的手段呈现多样性,网络安全事件的检测呈现出多样性,虽然依靠防火墙、杀毒软件等保护系统能在一定程度上实现网络的安全评估,但是仍然难以在海量数据中保护网络的安全,无法实现相应的防范[1-3]。网络安全态势预测能基于管理者提供的历史信息和当前时刻的网络安全态势,对未来时段的网络安全态势进行预测,因此,目前已经成为了研究的热点和难点[4-5]。
Bass于1999年首次提出网络安全态势感知的概念,自此之后,学者们开始关注网络安全态势预测问题的研究。网络安全态势预测的本质就是一个回归问题[6-8]。与一般的回归问题不同的是,目前学术界并未给出网络安全态势评估的统一定义,但是网络攻击具有方式多变、攻击信息模型和非线性等特点。一些学者提出采用机器学习相关的方法来解决该问题。李洁等[9]提出了一种基于和声搜索和相关向量机的网络安全态势预测方法,归一化处理网络安全态势预测样本集,并对相空间进行重构,采用和声搜索算法来优化相关向量机的超参数,从而获得一个具有较高预测精度的网络预测模型。韩国彬[10]提出了一种基于混沌理论和LSSVM的网络攻击预测方法,在该方法中通过网络攻击频率时间序列对模型参数的值进行优化和预测,并采用粒子群优化算法来优化模型参数。杜璞[11]设计了一种基于自适应转发控制策略的大规模网络安全态势预测方法,首先构建层次化的网络安全模型对网络安全态势值进行计算,然后再引入转发控制机制,来控制不同节点在不同网络环境下的转发条件,求解网络安全态势回归方程,实现安全态势的预测。
本文在上述工作的基础上,提出了一种基于人工免疫的网络安全评估方法,采用人工免疫算法来优化神经网络的安全评估方法,并通过实验证明了该方法的有效性。
1 网络安全评估模型
网络安全评估是指对一个网络进行安全评估,通过对网络中的若干关键点的访问和操作等信息的获取,对一些未经授权的任何采用非法手段来获取计算机资源的网络安全威胁行为进行监测,来确定系统中发生的被攻击现象。基于非线性神经网络的网络安全评估模型如图1所示。
本文的网络安全评估模型是采用神经网络模型来建立网络安全预测模型,采用训练数据来训练网络安全预测模型,通过误差反向传播算法来实现输出层误差的反向传递,并通过误差来调整隐藏层与输出层的权重以及输出层的偏差,然后进一步反向传播,来调整输入层与隐藏层的权重以及隐藏层的偏差。网络的优化过程则通过人工免疫算法对网络参数的不断寻优来实现。
图1 基于人工免疫神经网络的 网络安全预测模型
2 基于人工免疫优化的神经网络网络安全预测
2.1 神经网络参数的初始化
神经网络参数的初始化过程就是采用训练样本来训练人工神经网络,即采用经典的BP算法来训练神经网络,获得网络参数的一组初始优化值,本文采用BP反向传播算法来训练网络,对网络进行训练的过程为:
步骤1:建立网络模型,建立3层的神经网络模型,即输入层、隐含层和输出层,输入层的神经元个数对应了数据的维数,输出层对应了网络对应的安全评估预测结果。
步骤2:将训练数据输入到网络模型中,得到输出结果,计算输出结果和标签值的差异,并计算网络的误差平方和:
(1)
(2)
式中η为参数学习率。
步骤4:将训练数据训练完网络后得到的参数作为网络的初始参数。
2.2 亲和度评价函数的定义
采用人工免疫算法对神经网络的参数进行优化时,需要定义亲和度评价函数,亲和度评估函数可以用于检测解的优劣,亲和度函数fit(x):S→R可以表示为:
(3)
从式(3)中可以发现,网络输出端的误差越小,参数优化的亲和度越大,则得到的方案越优。
2.3 抗体的复制和抑制
抗体的复制就是根据抗体的适应度来选择抗体的数量,即根据亲和度的值在整个群体中选择一些个体来进行复制,复制的数量为:
(4)
式中M为种群的大小,而F(x)则表示个体当前的亲和度。
为了增加算法的多样性,每个抗体编码长度为P,则所有抗体第k位的信息熵可以利用交叉熵,同时可以得到:
(5)
式中pi(k)表示第i个抗体的第k位基因相同的概率。从式(5)可以看出,当两个基因相同时,可以得到Hk(N)=0,Hk(N)的值越大则相似度越大,越接近于0则两者几乎完全一样,那么抗体需要被抑制。因此,任何两个抗体的亲和度的计算可以表示为:
(6)
2.4 改进免疫规划算法描述
在采用样本数据对神经网络模型进行训练后,需要对网络进一步优化,防止网络陷入局部最优,基于改进免疫规划算法的网络安全评估主要是从两个部分进行优化:
1)对神经网络的网络结构进行优化,得到网络的权值和阈值;
2)将优化后的参数代入网络,用该网络进行预测,然后对神经网络得到的预测结果进一步优化。
输入:抗体种群规模N,抗体长度为传感器节点个数P,记忆单元F,记忆单元规模σ,权重因子α,β,当前迭代次数λ=1,算法最大迭代次数为λmax;
输出:网络最优结构和算法的最优解。
步骤1:采用BP反向传播算法对网络进行训练,得到最优的网络参数的初始种群Aλ={Ab1,Ab2,…,AbN},同时采用训练数据输入到采用Aλ初始化的网络,得到网络预测结果的初始种群Cλ={Cb1,Cb2,…,CbM};
步骤2:根据式(3)计算抗体集Aλ={Ab1,Ab2,…,AbN}和抗体集Cλ={Cb1,Cb2,…,CbM}中所有抗体的亲和度,按从大到小的顺序,将较大的部分个体存入记忆单元F,将具有较大亲和度的抗体的部分编码基因作为疫苗;
步骤3:根据式(4)计算出抗体被复制的数量,然后随机选择其中部分个体来进行交叉和变异操作,直到这两个抗体集的数量分别达到N和M为止;
步骤4:对新的种群进行免疫检测,即测试所有个体的平均亲和度,当新一代所有抗体的平均亲和度不如父代时,则新的一代被父代重新取代;
步骤5:计算抗体之间的亲和度,对具有较大相互亲和度的个体,即相似的个体进行抑制,删除其中的部分个体,得到新一代抗体种群Aλ+1和Cλ+1;
步骤6:更新当前迭代次数λ=λ+1,并判断当前迭代次数λ是否达到最大值λmax,当达到最大值时,则算法结束,并输出记忆单元中的最优个体,即神经网络的最优参数以及网络的最优预测结果。
3 仿真实验
采用KDDCUP99作为仿真数据对本文基于人工免疫算法的网络安全态势预测模型进行验证,对应的攻击按大类可以划分为5类:Normal、Probe、DOS、U2R、R2L。为了有效地实现网络安全态势预测,采用训练数据对神经网络进行训练,获得神经网络的参数最优值,然后采用人工免疫算法来对网络参数和预测结果进一步优化,训练集中的记录共1 000条,测试集中的记录共800条。
文中算法的参数设置如下:抗体种群规模N=2 000,抗体长度为训练特征数据的维度P=40,记忆单元F=200,记忆单元规模σ=100,权重因子α=0.45,β=0.55,算法最大迭代次数λmax=500。
系统的性能评价指标主要有:训练的检测率DR、误检率FPR和漏报率MR:
(7)
(8)
(9)
误检率FPR的计算为:
FPR=KR+MR。
(10)
将文中方法与传统神经网络比较,得到4类攻击对应的检测率和异常误检率见表1。由表1可以明显看出,由于引入了人工免疫算法,本文提出的模型在检测率上远远高于传统的人工神经网络方法。
表1 本文方法与传统网络比较结果
为了进一步验证本文所提模型的优越性,将本文所提模型与文献[10]和[11]所示的方法进行比较,得到的结果见表2,从表2可以看出,文中方法具有最高的检测率,且异常误检率远远低于其他两种方法。
表2 本文方法与其他方法比较结果
4 结语
网络安全态势预测是保证网络正常运行的一个重要条件,而网络正常运行则是保证人们的生产生活顺利进行的重要保证。为此,本文提出了一种新的基于人工免疫算法的网络安全态势评估方法。人工免疫算法的作用可以分为两个方面:优化网络参数和优化网络输出结果。两层次优化的目标是为了避免算法陷入局部最优,尽可能寻求到全局最优解。为了验证文中所提模型的正确性,将所提方法与文献[10]和[11]进行比较,结果表明,文中方法不仅优于基本的神经网络,同时也优于其他比较模型。
[1] 杜璞.引入自适应转发控制的网络安全态势预测[J].科技通报,2014(10):58-60.
[2] 孙晓东,孙少华.论多元集对分析联系数AHP方法的网络安全评估[J].自动化与仪器仪表,2016(9):150-151.
[3] LEE C M,KO C N.Time series prediction using RBF neural networks with a nonlinear time-varying evolution PSO algorithm [J].Neuro-computing,2009,73(1):449- 460.
[4] LI Y,JING J.A method of improved support vector machine for network security situation forecasting [J].Advanced Materials Research,2011,187:291-296.
[5] 王庚,张景辉,吴娜.网络安全态势预测方法的应用研究[J].计算机仿真,2012,29(2):98-101.
[6] ZHANG S,LI B,WANG B.The application of an improved integration algorithm of support vector machine to the prediction of network security situation[J].Applied Mechanics and Materials,2014,513:2285-2288.
[7] 吴元立,司光亚,罗批.人工智能技术在网络空间安全防御中的应用[J].计算机应用研究,2015,32(8):2241-2244.
[8] 刘春.AFSA-BPNN在网络安全中的应用研究[J].智能计算机与应用,2015,5(3):84-87.
[9] 李洁,张兆薇.基于和声搜索算法和相关向量机的网络安全态势预测方法[J].计算机应用,2016,36(1):199-202.
[10] 韩国彬.基于混沌理论和LSSVM的网络攻击预测算法[J].科技通报,2012,28(8):140-141.
[11] 杜璞.引入自适应转发控制的网络安全态势预测[J].科技通报,2014(10):58-60.