基于CS算法优化的模糊C均值聚类入侵检测
2015-04-29卢权
卢权
摘 要: 针对模糊C均值聚类算法受初始聚类中心影响过大以及易于陷入局部极值的问题,采用具有Levy flight模式且具有很强全局搜索能力的布谷鸟搜索算法,对模糊C均值聚类算法初始聚类中心进行优化,并把优化后的模糊C均值聚类算法应用于网络入侵检测。实验结果显示,经过优化后的模糊C均值聚类算法具有较好的运行速度和聚类效果,对入侵行为的检测效果良好。
关键词: 布谷鸟算法; 模糊C均值聚类; 全局寻优; 入侵检测
中图分类号:TP309.5 文献标志码:A 文章编号:1006-8228(2015)03-07-02
Abstract: The Fuzzy C-means clustering algorithm is influenced by the initial cluster center and is easy to fall into local extremum. The cuckoo search algorithm (CS), which has a levy flight mode and a strong global search capability, can optimize the initial cluster centers of the fuzzy C-means clustering algorithm. And then the optimized algorithm is applied to network intrusion detection. Experimental results show that the optimized algorithm has better operating speeds and clustering effect and has good effect to intrusion detection.
Key words: cuckoo search algorithm; fuzzy C-means algorithm; global optimization; intrusion detection
0 引言
随着计算机网络的进一步普及,网络安全成为人们越来越关注问题之一。入侵检测是保证网络安全的一个重要举措,很多学者把数据挖掘中的相关技术用于网络的入侵检测中。聚类分析是数据挖掘技术中的一种,它是一种无监督的挖掘方法,具有良好的泛化能力,因而得到了广泛的应用[1]。在众多的聚类分析方法中,模糊C均值聚类[2](fuzzy C-means,FCM)方法应用最为广泛。但采用梯度下降作为解决问题指导思想的FCM算法还存在着对聚类中心初始值敏感、受样本噪声影响大且易于陷入局部极值的问题[3],因而,总体上来说对网络入侵的检测准确率偏低,检测效果不理想。
布谷鸟(cuckoo search,CS)算法[4]是一种仿生类算法,它通过模仿布谷鸟的繁殖策略来实现寻找问题解的过程。CS算法采用随机性很强的Levy flight模式,因而该算法具有很强的全局搜索能力。CS算法还具有结构简单,输入的参数少,易于实现等特点。本文把CS算法引入到FCM算法的优化中,提出了一种基于CS算法优化的FCM混合算法(CS-FCM),并把该算法用于网络的入侵行为检测中,以期获得更好的效果。
2.1 实验数据的选取
我们采用KDD CUP1999数据集对算法进行验证。KDD CUP1999数据集包含了大量不同网络环境下的网络入侵数据,大约有500万个不同的数据记录,这些记录囊括了22种不同的攻击类型。按不同的攻击手段对这些入侵数据进行划分,可以简单分为:DoS、R2L、U2R以及Probing等四种不同类型[5]。
为了能反映真实的网络环境,我们从KDD CUP1999数据集中,根据4种不同的攻击类型,分别随机抽取5000条共2万笔记录用于实验。在抽取的2万条记录中,包含了1.6万条正常连接的记录,4000条异常连接的记录。每一笔记录都包含有41个属性,这些属性的数据类型主要有两类:文本型和数值型。在所有数值型属性中,它们之间的值差异过大,为了能在同一单位下进行衡量,必须对它们进行归一化处理。
这两种算法所耗费的时间都差不多。当记录数达到一定数量的时候,CS优化的效果就显现出来了,大概在2000笔数据附近,CS-FCM算法所耗费的时间就开始明显比没有经过优化的FCM算法要少,检测的记录数越多,CS-FCM算法的效率就越好。
3 总结
本文将布谷鸟算法和FCM算法相结合,通过布谷鸟算法对FCM的聚类中心进行优化,提高了FCM算法的运算速度和收敛速度。仿真实验表明,经过布谷鸟算法优化的FCM算法应用于入侵检测中,能有效解决聚类中心的初始值对FCM算法影响过大的问题,聚类效果良好。
参考文献:
[1] 贾志伟,关忠仁,赵建芳.一种基于半监督学习的入侵检测算法[J].成
都信息工程学院学报,2012.27(6):560-563
[2] 罗军生,李永忠,杜晓.基于模糊C-均值聚类算法的入侵检测[J].计算
机技术与发展,2008.18(1):178-180
[3] 姚明海,金喜子,赵连朋等.基于模糊聚类的侦察数据分析方法[J].计
算机工程与设计,2009.30(2):404-407
[4] 郑巧燕,莫愿斌,刘付永等.一种小规模多种群布谷鸟算法[J].计算机
应用与软件,2014.31(10):278-280
[5] 李丽娟,唐文纪.基于人工免疫网络和模糊C-均值聚类的入侵检测
方法[J].计算机应用与软件,2011.28(3):282-284
[6] 杨德刚.基于模糊C均值聚类的网络入侵检测算法[J].计算机科学,
2005.32(1):86-87