APP下载

基于云模型BBO算法优化KELM的网络入侵检测

2018-10-22叶炼炼

关键词:学习机子群栖息地

叶炼炼



基于云模型BBO算法优化KELM的网络入侵检测

叶炼炼

厦门海洋职业技术学院 信息技术系, 福建 厦门 361012

鉴于核极限学习机的网络入侵检测结果易受正则化系数和核参数的影响,本文选择网络入侵检测的准确率为适应度,通过云模型BBO算法优化正则化系数和核参数,实现网络入侵的自适应检测,从而确立一种云模型BBO算法优化KELM的网络入侵检测算法。结果表明,该算法能够实现网络入侵的高精度检测。

生物地理学优化; 核极限学习机; 网络入侵检测

随着互联网规模的增加和扩大,网络环境错综复杂,网络安全问题日益突出,其中网络入侵问题是当前网络安全领域存在的突出问题。由于网络入侵行为的多样性、复杂性、隐蔽性等特点,因此高精度的网络入侵检测对网络安全的防范和控制具有重要意义。针对生物地理学优化算法[1](Biogeography-Based Optimization,BBO)易陷入“早熟”和局部最优的问题,将云模型理论引入BBO算法,改进BBO算法迁移算子的生成方式,提出一种云模型BBO算法(Cloud Biogeography-Based Optimization,CBBO),避免BBO算法局部最优和“早熟”问题。

针对核极限学习机(Kernel Extreme Learning Machine,KELM)的网络入侵检测结果易受正则化系数和核参数的影响,提出一种云模型BBO算法优化KELM的网络入侵检测算法。实验结果表明,CBBO-KELM的网络入侵检测算法能够有效提高网络入侵检测的准确率,实现网络入侵的高精度检测,为网络安全控制和防范提供决策依据。

1 云模型

若为一定量论域,为定量论域上的定性概念,若Î且是定性概念的一次随机实现,那么,可以用()表示对的确定度,其表示稳定倾向的随机数并且()Î[0,1]。如果:®[0,1]"ή(),则在定量论域上的分布叫做云,其中组成的每一个元素叫云滴[2]。云模型可以用期望E、熵E和超熵H3个数字特征来表征[3],可以表示为(E,E,H)。若满足:Î(E2),其中´Î(E,2),并且对的确定度()满足公式(1):

则在上的分布被称为正态云。云模型采用不同的参数生成的云滴图如图1所示。

2 云模型BBO算法

2.1 BBO算法

BBO算法主要涉及迁移操作和变异操作,通过迁移操作和变异操作模拟生物种群寻找最佳栖息地,也就是寻找最优解的过程。

图1 云滴图

图 2 余弦模型

2.2 迁移操作

迁移操作包括迁入操作和迁出操作,前者主要是物种迁入栖息地,而后者主要是物种迁出栖息地。若某个栖息地的适宜度指数(Habitat Suitability Index,HIS)较高,则该栖息地的物种种类和数量较多,种群之间竞争激烈,那么该栖息地的物种迁出多而迁出少;反之,迁出少而迁入多。大量研究表明,采用余弦模型的BBO算法的寻优能力和稳定性最好[5],因此本文迁移操作选择余弦模型。图2中0表示相等交点,和分别表示物种迁入率和迁出率,max表示该栖息地能够承受的最大的种群数量。迁入率和迁出率如公式(2)和公式(3)所示[6]。

2.3 突变操作

若某个栖息地最多能够承受和容纳个不同种群,则承受和容纳个种群的概率为P,其中,种群数量概率P与栖息地突变的概率M成反比,它们的数学关系如公式(4)和公式(5)所示[7]:

其中,P表示BBO算法中种群数量概率P的最大值,max表示BBO算法的最大突变概率。

2.4 云模型BBO算法

设BBO算法的种群规模为,每个个体的适应度、平均适应度和最优个体的适应度分别为f、mean和min。对于适应度高于mean的个体和小于mean的个体,分别计算它们的平均适应度mean和mean。为避免BBO算法陷入局部最优和“早熟”问题,提高算法的搜索能力和稳定性,将BBO算法中的种群划分成3个不同子群体,其分别为优良子群、普通子群以及较差子群,则调整因子CR的调整策略如下:

(1)优良子群:f优于mean

该子群中个体最优解接近全局最优解,故采用调整因子的数值较小,主要作用为了进行精细化搜索,文中令=0.2。

(2)普通子群:f次于mean但优于mean

与优良子群和较差子群相比,该子群中个体适应度较为一般,并且数量最多,则该类群体的调整因子根据公式(6)-公式(10)的云模型的正态云生成器产生:

(3)较差子群:f次于mean

该群体中的个体适应度较差,偏离最优解最远,因此使用较大的调整因子,提高收敛速度和搜索范围,文中取=0.9,云模型改进迁入率和迁出率如公式(11)和公式(12)所示:

其中,Î[0,1]。

3 核极限学习机

若极限学习机(Extreme Learning Machine,ELM)隐含层神经元数量为个,训练样本个,其矩阵形式为(x,tR×R,其中x=[x1,x2,…,x]t=[t1,t2,…,t]分别表示ELM的输入矩阵和输出矩阵,则ELM的输出为[9]:

其中:

则公式(14)的矩阵形式为:=(15)

其中,表示极限学习机ELM的隐含层神经元的输出矩阵,x:(x)表示输入x的特征映射,其中(x)=[(x,1,1),…,(x,,)]。当训练样本数量>时,ELM的训练误差接近于0。此时,求解ELM近似等价于求解的线性方程组的最小二乘解:

为了避免初始权值和偏置对ELM预测效果的影响,将核函数引入ELM形成新的ELM即基于核的ELM算法。在KELM中,其核矩阵Q=HH,核矩阵的元素可表示为:

其中,核函数(x,x)本文选择RBF核函数。将公式(19)带入公式(18),KELM的输出可表示为:

4 基于云模型BBO优化KELM的网络入侵检测

4.1 目标函数

通过云模型BBO算法优化KELM的正则化系数和核参数改善极限学习机网络的稳定性和泛化能力,提高网络入侵检测的准确率,将网络入侵检测的准确率作为云模型BBO算法优化KELM的目标函数:

其中,和分别表示网络入侵类型检测正确的数量和网络入侵检测类型的总数量。

4.2 优化流程

云模型BBO算法优化KELM的网络入侵检测算法步骤如下:

Step 1:归一化网络入侵样本数据,建出训练样本和测试样本;

Step 2:初始化种群,设定云模型BBO算法的参数:初始种群数0、最大种群规模max、所求问题的维度、最大迭代次数max、搜索空间的区间[max,min]。

Step 3:将训练样本输入ELM,计算栖息地适宜度指数HIS并进行排序,将精英个体保留下来,分别计算种群个体的mean、min、mean和mean,对适宜度指数HIS进行排序,根据公式(2)和公式(3)计算确定云模型BBO算法的迁入率和迁出率

Step 4:进行栖息地迁移操作和变异操作,变异概率为M,计算出适宜度指数HIS并重新排序;

Step 5:若>max,保存最优解;反之,重复Step 2~Step 4;

Step 6:将云模型BBO算法优化KELM获取的最优参数和应用于网络入侵检测。

5 实证分析

5.1 数据来源

为了验证CBBO_KELM算法进行网络入侵检测的效果,以Windows10为操作系统,仿真软件平台选择MATLAB2015(a),PC机的处理器为Intel core I5 2.4 GHZ、内存8 GB。选择KDD CUP 99数据集作为研究对象,每组数据包含41个特征属性[11]。

5.2 结果分析

将准确率作为网络入侵检测效果的评价指标,准确率定义:若被正确检测出来的网络入侵类型的数量为,而实际网络入侵类型数量为,因此网络入侵检测的准确率可表示为:

为了说明云模型BBO算法的有效性,将CBBO_KELM、BBO_KELM和KELM进行对比,对比结果如表1所示。由表1可知,CBBO_KELM的4种网络攻击类型的检测率分别为100%、99.45%、98.02%和99.46%,高于BBO_KELM算法的98.54%、96.75%、90.23%、96.64%和KELM的97.67%、92.22%、88.42%、91.33%。检测结果如图3~5所示。通过对比发现,本文算法具有更高的检测率和更低的误判率,效果较好。

表1 准确率对比结果

Table 1 Comparison of accuracy

图 3 CBBO_KLEM检测结果

图 4 BBO_KELM检测结果

图 5 KELM检测结果

图 6 CBBO收敛曲线

6 结论

针对核极限学习机的网络入侵检测结果易受正则化系数和核参数的影响,提出一种云模型BBO算法优化KELM的网络入侵检测算法。结果表明,CBBO-KELM的网络入侵检测算法能够有效提高网络入侵检测的准确率,实现网络入侵的高精度检测,为网络安全控制和防范提供决策依据。

[1] 蔡之华,龚文引.基于进化规划的新型生物地理学优化算法研究[J].系统工程理论与实践,2010,30(6):1106-1112

[2] 张光卫,何锐,刘禹,等.基于云模型的进化算法[J].计算机学报,2008,31(7):1082-1091

[3] 刘常昱,李德毅,潘莉莉.基于云模型的不确定性知识表示[J].计算机工程与应用,2004,40(2):32-35

[4] 张仕斌,许春香.基于云模型的信任评估方法研究[J].计算机学报,2013,36(2):422-431

[5] 杨锡运,关文渊,刘玉奇,等.基于粒子群优化的核极限学习机模型的风电功率区间预测方法[J].中国电机工程学报,2015,35(S1):146-153

[6] 张英堂,马超,李志宁,等.基于快速留一交叉验证的核极限学习机在线建模[J].上海交通大学学报,2014,48(5):641-646

[7] 张德全,魏忠军,汤健,等.基于进化算法优化的混合核极限学习机建模[J].控制工程,2013,20(6):1127-1130

[8] 付华,李海霞,卢万杰,等.一种改进的极限学习机煤与瓦斯突出预测模型[J].传感技术学报,2016,29(1):69-74

[9] 王利琴,董永峰,顾军华,等.基于改进极限学习机的心律失常分类[J].计算机仿真,2014,31(6):352-356

[10] 孙朝江,汤健,魏忠军,等.基于选择性更新的在线核极限学习机建模[J].控制工程,2013,20(4):659-662

[11] 亓孝武,李可军,于小晏,等.基于核极限学习机和Bootstrap方法的变压器顶层油温区间预测[J].中国电机工程学 报,2017,37(19):5821-5828

Network Intrusion Detection Based on Cloud BBO Algorithm Optimizing KELM

YE Lian-lian

361012,

In consideration of network intrusion detection result from Kernel Extreme Learning Machine subject to the influence of regular coefficientand kernel parameterthis paper selected the accuracy of network intrusion detection as adaptability to optimize the regularized coefficient and kernel parameter by cloud BBO algorithm to realize the adaptive detection of network intrusion, and thus the network intrusion detection algorithm based on CBBO optimizing KELM was established. The result showed the algorithm could effectively implement the high precision detection on network intrusion.

Biogeography-Based Optimization, BBO; Kernel Extreme Learning Machine, KELM; network intrusion detection

TP391.1

A

1000-2324(2018)05-0862-05

10.3969/j.issn.1000-2324.2018.05.028

2018-01-11

2018-03-15

福建省教育厅基金项目(JA14403)

叶炼炼(1975-),男,硕士,讲师,研究方向为数据挖掘、云计算、计算机网络. E-mail:joyll@163.com

猜你喜欢

学习机子群栖息地
超聚焦子群是16阶初等交换群的块
子群的核平凡或正规闭包极大的有限p群
BEAN SCENES
抵达栖息地
基于极限学习机参数迁移的域适应算法
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
πSCAP-子群和有限群的结构
一种基于AdaBoost的极限学习机分类方法
16阶非交换2群的子群结构