基于网络流量分类的入侵检测研究
2020-12-23王芳
王芳
摘 要 近年来入侵检测模型在多分类任务中存在着分类准确性低的问题,并且受到数据集中攻击类型有限等因素的影响,本文借助深度学习方法,设计一种卷积神经网络(简称CNN)和长短时记忆循环神经网络(简称LSTM)结合的用于网络流量分类的入侵检测模型。
关键词 入侵检测;深度学习;流量分类
引言
随着物联网和5G的兴起,一些新的网络攻击层出不穷,全球网络安全态势依旧严峻,网络空间安全防护工作仍然任重而道远。通过对网络流量进行研究和分类,及时发现网络中的异常流量,提高入侵检测的效率成为网络安全研究的重中之重。
本文使用深度学习技术开展网络流量分类研究,解决传统的基于统计和行为的网络流量分类方法的特征设计问题,提高实际应用中网络流量异常检测的性能。
1基于网络流量分类的研究
1.1 基于CNN网络流量分类模型的研究
(1) 数据集
澳大利亚网络安全中心实验室创建的UNSW-15数据集[1]
(2) 模型设计和环境
用CNN对网络流量数据的空间特征进行处理,其网络流量分类模型设计流程:
①对网络流量数据进行处理。②输入训练集数据,通过卷积层、池化层、全连接层的处理,将数据输入到分类器Softmax中,对网络流量进行分类。
本文采用MXnet深度学习框架,实验环境为Windows 7(64bit),数据集经过处理转化为16*16的二维矩阵,卷积核大小为3*3,池化层窗口为2*2,步长为2,激活函数采用Relu函数。
(3)实验分析
根据卷积核的数量可能会影响分类的准确率的问题,进行四组模型对比实验。第一组A:卷积核1个(4*4),第二组B:卷积核2个(4*4),第三组C:卷积核3个(4*4),第四组D:卷积核4个(4*4),batch_ size为32,迭代周期为20,Leaning Rate=0.01,使用随机梯度下降。实验中采用分类正确率(Accuracy)衡量模型的质量[2],计算式如(1):
(TP、FN分别为正确、错误分类的攻击行为的样本数;TN、FP分别为正确、错误分类的正常行为的样本数)。对实验结果进行了定量分析,四组实验结果的准确率分别为(%):82.50、83.10、84.70、83.30。
实验对比结果表明:模型C的卷积核个数为3时,流量分类的准确率最高。
1.2 基于LSTM网络流量分类模型的研究
用LSTM技术对网络流量数据的时序特征进行处理,需要选择合适的优化算法,使得损失函数降到最低,让模型性能达到最优。
(1)模型结构
网络流量分类的过程为:
①对网络流量数据进行处理。②前向传播,从输入端开始,将处理好的流量序列输入到模型中,对每一个样本实例的输出进行计算,然后预测其所属类别标签。③随时间反向传播。通过计算预测值和实际标签值之间的差距,微调整个模型的共享参数,通过迭代训练最终获得较优的分类模型。④检测分类。输入测试集中的数据到模型中,对每一条数据进行分类,并预测流量类型。
(2)实验分析
根据隐藏层单元数影响分类的准确率问题,进行三组模型对比实验。第一组E:隐藏单元数5;第二组F:隐藏单元数10;第三组G:隐藏单元数20;第四组H:隐藏单元数30,batch_ size为64,迭代周期为30,Leaning Rate=0.01,激活函数:sigmoid,使用梯度下降算法。对实验结果进行了定量分析,四组实验结果的准确率分别为(%):81.50、83.40、84.20、85.30。
通过对比实验发现,当隐藏层单元数为30时,流量分类的准确率最高。
2基于CNN和LSTM网络流量分类的入侵检测模型
仅仅从网络流量数据的单一方面进行考虑,会造成特征提取不充分,进而影响模型分类正确性。结合网络流量的空间特征和时序特征,设计基于CNN和LSTM网络流量分类的模型,用于入侵检测并提高入侵检测的性能。
2.1 模型结构
入侵模型大致分为三个部分:数据处理、模型训练、入侵检测。
2.2 实验分析
该模型实验参数均使用模型C和模型H的参数。实验结果的准确率(%):CNN和LSTM(86.20)。
通过实验表明:基于CNN和LSTM网络流量分类的模型正确率高于单个CNN模型和LSTM模型。
3结束语
本文对网络流量具有空间特征和时序特征的特点,设计了基于CNN和LSTM網络流量分类的入侵检测模型,该模型提高了网络流量分类的准确率。当然限于实验条件和自己知识水平的限制,召回率等其他方面的试验还在测试中,今后还需要进一步努力和完善。
参考文献
[1] Moustafa N,Slay J.Unsw-nb15:A comprehwnsive data set for network intrusion detection systems(unsw-nb15 network data set)[C].Military Communications and information Systems conference(MilCIS).2015:1-6.
[2] 吴翰韬.基于深度学习的轨迹数据恢复研究[D].成都:电子科技大学,2018:43.