基于支持向量机的无线网络入侵特征提取算法
2021-07-07陈金鑫
陈金鑫
(皖西学院,安徽 六安 237012)
0 引言
虽然网络技术可以使用户充分感受大数据带来的便利,但是随着数据量的增多,网络安全问题也逐渐显现,因此有必要对网络安全检测技术进行研究。而无线网络入侵特征提取是网络安全检测的关键技术之一,是近年来相关领域的重点问题。
很多研究人员提出了入侵特征检测方法,其中杨文虎[1]提出了基于云计算的船舶通信网络入侵特征提取方法,该方法通过对入侵问题进行描述,对特征数据进行信号处理,从而确定入侵特征数据,构建了特征检测框架,实现对特征的提取;夏景明[2]等提出基于改进随机森林分类器的网络入侵检测方法,该方法利用高斯混合模型将特征数据划分成不同簇,通过随机森林分类器对不同簇进行训练,并在训练好的簇中提取入侵特征。上述研究方法虽然能够在大数据环境中对网络入侵特征进行有效提取,但是特征提取过程中会遗漏部分特征数据,存在一定的漏检率。
针对现有方法存在的问题,提出基于支持向量机的无线网络入侵特征提取算法,通过建立入侵特征提取原则,提升算法实现的理论性,能够在先验知识不足的条件下保证特征提取的全面性,并能够挖掘无线网络中固有的冗余入侵数据,解决传统方法由于训练结果误差导致的特征缺失问题。
1 无线网络入侵特征提取算法
1.1 入侵特征提取原则
在开始入侵特征提取之前,要建立面向海量入侵数据的提取原则,在该原则指导下,保证特征提取的科学性,具体原则如下:
全面性原则:由于无线网络中包含各种数据类型,不同数据类型之间组成了一个又一个整体结构,因此,特征提取要对无线网络结构中的数据类型进行检测,入侵特征提取指标要具有全面性[3]。
层次性原则:为保证特征提取结果的全面性,需要选取大量指标,但是不同入侵数据的重要程度是不一样的,如果忽略了部分指标会违反全面性原则,因此,可以根据层次性原则,有效避免特征提取过程中造成特征遗漏问题。
独立性原则:由于部分特征数据会存在重叠现象,如果不考虑该因素会造成指标冗余,增加工作量,还会对提取结果产生影响,造成结果误差偏大的问题。因此,指标选取时,尽可能选择概括性较强、具有代表性的指标。
1.2 基于SVM的入侵特征提取算法
依据入侵特征提取原则,采用支持向量机对无线网络入侵特征进行提取研究。支持向量机(Support Vector Machine,SVM)具有在先验知识不足的条件下对不同类型数据进行精准分类的功能[4],因此,采用支持向量机对无线网络中的入侵数据进行分类,在分类结果的基础上,筛选入侵特征指标,最终构建一个矩阵,实现对入侵特征的提取。
筛选无线网络入侵特征指标时,参考入侵特征提取原则,假设无线网络中存在n个数据样本S={s1,s2,sn},引入一个映射函数η,将整体特征数据映射至高维可用空间中,得到可用映射值特征数据集η(s1),η(s2),…,η(sn),映射值需要满足下列条件:
(1)
其中,j表示入侵特征维度。在满足公式(1)的基础上,筛选不同维度的入侵特征主成分,得出:
η(sk)=T×[θ(si)-θ(sj)]
(2)
其中,T表示特征提取周期,θ表示全部特征向量,si表示入侵数据之间的特征关系,sj表示冗余特征。
根据入侵特征主成分,构建一个入侵特征筛选矩阵:
(3)
其中,b表示入侵特征分量。根据公式(3)给出的矩阵,筛选最优特征向量,筛选结果可以表示为:
(4)
其中,αik表示最优特征向量。
通过上述计算过程,剔除了无线网络入侵特征中的冗余特征,实现对无线网络入侵特征的准确提取,能够为网络环境安全与威胁检测提供技术支撑。
2 实验验证
为验证基于支持向量机的无线网络入侵特征提取算法能否实现对网络入侵特征的有效提取,选择基于云计算的船舶通信网络入侵特征提取方法和基于改进随机森林分类器的网络入侵检测方法作为对比方法,以特征提取中特征数据的漏检率为指标,进行仿真实验验证。
以KDD CUP-99数据集为基础数据集,其中包含各种用户类型数据、网络运行数据及网络安全风险历史数据,并由不同网络攻击手段生成了大量的真实数据集。在该数据集中选取700 M攻击数据作为样本,对其进行特征提取,对比不同方法提取过程中的入侵特征漏检率,结果如图1所示。
图1 不同方法的入侵特征漏检率Fig.1 Intrusion omission ratio of different methods
通过图1可以看出,对无线网络入侵特征提取的过程中,随着数据量的增加,不同方法均呈现出整体上升趋势,但是与文献[1]方法和文献[2]方法相比,所提算法的入侵特征漏检率明显更低,其漏检率最高值仅为46%,而文献[1]方法和文献[2]方法的漏检率最高值分别为86%和83%。通过数据对比可知,随着入侵数据量的增加,所提算法仍然能够保持较高水平,充分验证了该算法的优势性。该算法利用支持向量机精准分类的优势,对入侵特征进行筛选,并提取其中的冗余特征,减少了工作量,降低了漏检率。
3 结论
网络入侵是一种常见的网络安全威胁,对不同类型的入侵特征进行提取能够对入侵风险进行防范,因此提出了一种基于支持向量机的无线网络入侵特征提取算法。通过实验结果可知,该算法在特征提取过程中造成的漏检率明显低于传统方法,说明该算法得出的提取结果更加全面,能够涵盖更多的入侵特征,为网络安全保护提供可靠的理论支撑。