基于k—means改进算法的入侵检测系统研究

2014-12-05高波黄敏

电脑知识与技术 2014年31期

高波　黄敏

摘要：入侵检测技术作为一种主动的网络安全防护技术越来越引起研究者的关注，该文以 k-means 算法为基础，对基于k-means算法的入侵检测系统进行了研究和分析，指出了传统 k-means 算法的不足，提出了相应的改进策略，在此基础上完成基于k-means改进算法的入侵检测系统的研究。

关键词：入侵检测；数据挖掘；k-means算法

中图分类号：TP311 文献标志码：A 文章编号：1009-3044（2014）31-7425-03

Abstract： Intrusion detection technology as a proactive network security technology has drawn increasing attention from researchers. This paper based on k-means algorithm， intrusion detection system based on k-means algorithm were studied and analyzed， pointed out the shortcomings of traditional k-means algorithm， put forward the corresponding improvement strategies. On the basis completed the study An intrusion detection system based on k-means algorithm improved.

Key words： intrusion detection； data mining； k-means algorithm

1 概述

入侵检测技术作为一种积极主动的安全防护技术，提供了对内部攻击、外部攻击和误操作的实时保护，在网络系统受到危害之前拦截和响应入侵[1]。它被认为是防火墙之后的第二道安全闸门，在不影响网络性能的情况下能对网络进行监测。随着网络环境的日益复杂和网络数据的日益庞大，入侵检测系统往往需要处理海量的数据，来发现其中可能存在的入侵行为，这是对入侵检测系统的一个很大挑战。

数据挖掘指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘技术最先是在1999年由哥伦比亚大学Wenke lee[2]等人应用到入侵检测中。将数据挖掘引入到入侵检测系统中，可以帮助系统从大量的数据中挖掘有效的特征数据，对网络数据进行分析，实现有效的实时入侵检测，不但能够对已知的入侵进行检测，也能够对未知的攻击进行检测，极大地提高了入侵检测系统的实时性与有效性，同时数据挖掘算法可以帮助系统学习新的攻击模式，对特征进行动态的检测。

本文主要介绍了一种经典算法k-means算法，它是一种简单高效非监督学习方法，但是传统k-means 算法还有一定的缺陷，因此本文在研究和分析了k-means算法的优缺点的基础上，提出了对基于k-means改进算法的入侵检测系统的研究，改进的k-means算法会在一定程度上弥补传统k-means带来的缺陷。

4 结论

本文通过研究和分析传统k-means算法，在一定程度上了解传统k-means算法的优点和缺点。由于传统k-means算法在实际应用中受初始k值选择，初始中心点选择以及孤立点的影响极大。因此，该文提出了数据对象的密度和聚类半径的概念，确定了第一个聚类中心值的选择方法，从而解决了孤立点，k值得选择以及初始中心选择的影响，避免了出现提前收敛于局部最优解现象。经过多次仿真实验的结果得以证明，改进后的算法能够有效的提高入侵检测系统的检测率，降低误测率。

参考文献：

[1] 朱广彬.基于数据挖掘的入侵检测技术研究[D].北京：北京交通大学，2010：4-6.

[2] Wenke Lee.A Framework for Constructing Feature and Modle for Intrusion DetectionSystem[J].ACM Transacations on Information and System Security，2002，3（4）：227-216.

[3] Wang W，Yang J，Muntz R.STRIN：A Statistical Information Grid Approach to Spatial Data Mining[C]//Proc.of 1997 Intl. Conf.on Very Large Data-bases， Athens，Greece. 1997-08：186-195.

[4] 倪钰.基于数据挖掘的入侵检测算法研究[D].南京：南京信息工程大学，2011：49-50.

[5] 刘凤芹.k-means聚类算法改进研究[D].济南：山东师范大学.2013：21-22.

[6] Hettich S，Bay S D.KDD cup 1999 data [EB/OL]. http：//kdd.ics.uci.edu/databases/kddcup99/kddcup99.html，1999.

[7] 肖卓磊.基于k-means优化算法的入侵检测系统[J].阜阳师范学院学报：自然科学版，2013，30（4）：82-83.

[8] 赵辉，张鹏.网络异常的主动检测与特征分析[J].计算机技术与发展，2009，19（8）：159-161，165.