基于大数据分析的网络安全态势评估
2019-07-08张舒婷
张舒婷
摘 要: 网络安全态势受到多种因素影响,再加上网络的开放性,具有复杂变化的特点,评估误差高,可信度低。为了提高网络安全态势评估精度,将大数据分析方法引入到网络安全态势评估的建模中。对当前网络安全态势的研究现状进行分析,通过重构得到多维网络安全态势学习样本,采用大数据处理技术——最小二乘支持向量机对网络安全态势样本进行训练,建立网络安全态势的评估模型,并进行具体网络安全态势仿真测试。结果表明,所提模型可以准确描述网络安全态势变化特点,获得高精度的网络安全态势评估结果,评估误差要远远低于对照模型,为网络安全管理提供了一种有效的研究方法。
关键词: 大数据分析; 学习样本; 仿真测试; 样本重构; 最小二乘支持向量机; 网络安全
中图分类号: TN915.08?34; TP391 文献标识码: A 文章编号: 1004?373X(2019)13?0106?04
Network security situation assessment based on big data analysis
ZHANG Shuting
(Taiyuan University, Taiyuan 030032, China)
Abstract: Network security situation is affected by many factors, coupled with the openness of the network, and has the characteristics of complex changes, big evaluation error and low credibility. In order to improve the accuracy of network security situation assessment, the big data analysis method is introduced into the modeling of network security situation assessment. The current research situation of network security situation is analyzed, and the multi?dimensional network security situation learning sample is obtained by reconstruction. The network security situation sample is trained by big data processing technology (least square support vector machine), and the evaluation model of network security situation is established. The simulation test is performed for the specific network security situation. The results show that the model can accurately describe the change characteristics of network security situation, and can obtain the high?precision network security situation evaluation results. The evaluation error of the model is far lower than that of contrast model. It provides an effective research method for network security management.
Keywords: big data analysis; learning sample; simulation test; sample reconstruction; least square support vector machine; network security
0 引 言
隨着网络的高速发展,网民数量急剧增加,网络作为一种传输信息的重要载体,其传输信息的速度要快于其他载体[1]。由于网络的不设防性和网民安全意识淡薄,一些非法分子通过各种途径入侵到网络,从而出现了网络安全问题。而网络安全态势可以描述网络系统的变化,其具有重要的研究意义[2?3]。
为了把握网络安全未来的发展趋势,学者们对网络安全态势进行了全面、深入的研究,当前网络安全态势评估模型分为两种类型:定量分析的评估模型和定性分析的评估模型。其中,定性分析包括专家系统、免疫理论、危险理论等网络安全态势评估模型,它们主要从整体上描述网络安全态势的变化趋势,无法获得理想网络安全态势评估[4];定量分析的网络安全态势评估模型又包括线性评估模型和非线性评估模型。其中,线性评估模型主要包括聚类分析等[5?7],线性评估模型假设网络安全态势呈一种线性变化态势,但网络安全态势受到许多因素的影响,呈现非线性,且具有一定的混沌特性,这样线性评估模型的网络安全态势评估误差大,评估结果的可信度低。非线性评估模型主要包括各种类型的神经网络和支持向量机,它们均有较好的非线性拟合能力,可以对网络安全态势变化进行较好的跟踪和刻画,获得了比线性评估模型更优的网络安全态势评估结果[8?10]。在实际应用中,神经网络的网络安全态势评估训练过程极不稳定,易得到局部最优的网络安全态势评估结果,影响网络安全态势的评估精度;支持向量机不存在局部最优的网络安全态势评估结果缺陷,但训练过程十分耗时,对于大规模网络安全态势数据的评估实时性差,无法实现在线的网络安全态势评估与分析[11?12]。最小二乘支持向量机克服了支持向量机训练过程耗时长的缺陷,且不存在神经网络的局部最优解不足,为网络安全态势的建模和评估提供了一种新的分析工具[13]。
针对网络安全态势的非线性和混沌性,本文提出大数据分析的网络安全态势评估模型,并进行了网络安全态势评估模型的性能测试,測试结果验证了本文模型的优异性能。
1 最小二乘支持向量机
支持向量机具有较强的泛化能力,但训练过程十分复杂,影响建模过程的实时性。为了克服支持向量机耗时长的缺陷,有学者对其进行改进,用二次损失函数表示支持向量机的不敏感损失函数,将支持向量机的二次寻优变为一次寻优,改善了问题求解的效率,实际应用范围更广。
设多维网络安全态势评估的训练数据为[{xi,yi}li=1],[xi∈Rn]为第[i]个网络安全态势数据的输入,[yi∈Rn]为第[i]个网络安全态势的输出数据,那么可以得到:
2 混沌理论
设网络安全态势评估样本集合为[{x(i),i=1,2,…,n}],根据延迟时间([τ])和嵌入维数([m])可以得到一个与原始数据具有同胚结构的多维数据:[X(t)=x(t),x(i+τ),…,x(i+(m-1)τ)],这样更加有利于网络安全态势变化特点的分析。设两个网络安全态势样本点为[X(i)]和[X(j)],它们的距离[rij(m)]计算公式为:
3 大数据背景下的网络安全态势评估模型
大数据背景下的网络安全态势评估模型步骤如下:
1) 收集某一个网络安全态势变化的历史数据。
2) 采用均值和加权补齐缺失的网络安全态势变化的历史数据以及比较离奇的数据。
3) 确定[m]和[τ],得到网络安全态势变化的学习样本数据。
4) 利用最小二支持向量机对训练样本数据进行学习,并输出评估结果。
4 网络安全态势评估模型的性能测试
4.1 研究对象
为了分析大数据背景的网络安全态势评估模型性能,选择HoneyNet数据集[14]作为研究对象,共收集500个数据,变化曲线如图1所示,最后100个数据作为验证数据,其他作为训练数据。
图1 网络安全态势评估的样本数据
为了使本文模型的实验说服力更强,选择文献[11?12]的网络安全态势评估模型进行对比实验。图1中的网络安全态势评估样本数据的[τ]和[m]变化如图2所示。图2中,网络安全态势评估的样本数据最佳[τ=5],[m=5],根据该值产生网络安全态势评估学习样本数据集。
图2 网络安全态势评估样本[τ]和[m]估计
4.2 网络安全态势评估结果分析
3种模型的网络安全态势评估结果如表1所示,对表1网络安全态势评估结果进行分析可知:
1) 文献[11?12]的网络安全态势效果差,不能跟踪网络系统的安全趋势,评估精度难以得到有效保证。
2) 本文模型的网络安全态势评估精度高,评估误差要小于对比模型,这是因为本文首先引入混沌理论对网络安全态势进行处理,可以更好地挖掘出网络安全态势变化趋势,然后引入最小二乘支持向量机对网络安全变化态势进行拟合和建模,建立了性能更优的网络安全态势评估模型。
表1 网络安全态势的评估精度
4.3 通用性分析
选择4种常用的网络,对它们的安全态势进行测试,评估精度如表2所示。
从表2可以看出,本文模型的网络安全态势评估精度平均值超过了95%,远远高于网络安全态势评估的实际应用要求。结果表明,本文模型是一种通用性强、精度高的网络安全态势评估模型。
表2 网络安全态势评估模型的通用性测试
5 结 语
为了获得理想的网络安全态势评估结果,为网络安全管理部门提供有价值的信息,本文提出一种大数据分析的网络安全态势评估模型。与其他网络安全态势评估模型的对比测试结果表明,本文模型可以反映网络安全态势的复杂变化态势,评估效果优于对照模型,有效减少了网络安全态势评估误差,解决了当前网络安全态势评估模型存在的难题,具有广泛的应用前景。
参考文献
[1] LEAU Y B, MANICKAM S, CHONG Y W. Network security situation assessment: a review and discussion [J]. Lecture notes in electrical engineering, 2015, 339: 407?414.
[2] 吴果,陈雷,司志刚,等.网络安全态势评估指标体系优化模型研究[J].计算机工程与科学,2017,39(5):861?869.
WU Guo, CHEN Lei, SI Zhigang, et al. An index optimization model for network security situation evaluation [J]. Compu?ter engineering & science, 2017, 39(5): 861?869.
[3] 陈妍伶,汤光明,孙怡峰.基于免疫危险理论的网络安全态势评估[J].计算机科学,2015,42(6):167?170.
CHEN Yanling, TANG Guangming, SUN Yifeng. Assessment of network security situation based on immune danger theory [J]. Computer science, 2015, 42(6): 167?170.
[4] 杨豪璞,邱辉,王坤.面向多步攻击的网络安全态势评估方法[J].通信学报,2017,38(1):187?198.
YANG Haopu, QIU Hui, WANG Kun. Network security situation evaluation method for multi?step attack [J]. Journal on communications, 2017, 38(1): 187?198.
[5] 王坤,邱辉,杨豪璞.基于攻击模式识别的网络安全态势评估方法[J].计算机应用,2016,36(1):194?198.
WANG Kun, QIU Hui, YANG Haopu. Network security situation evaluation method based on attack pattern recognition [J]. Journal of computer applications, 2016, 36(1): 194?198.
[6] 许晓燕.基于改进博弈模型的网络安全态势评估平台设计[J].现代电子技术,2016,39(12):87?90.
XU Xiaoyan. Design of network security situation assessment platform based on the improved game model [J]. Modern electronics technique, 2016, 39(12): 87?90.
[7] 文志诚,陈志刚,唐军.基于聚类分析的网络安全态势评估方法[J].上海交通大学学报,2016,50(9):1407?1414.
WEN Zhicheng, CHEN Zhigang, TANG Jun. Network security assessment method based on cluster analysis [J]. Journal of Shanghai Jiao Tong University, 2016, 50(9): 1407?1414.
[8] 汤永利,李伟杰,于金霞,等.基于改进D?S证据理论的网络安全态势评估方法[J].南京理工大学学报,2015,39(4):405?411.
TANG Yongli, LI Weijie, YU Jinxia, et al. Network security situational assessment method based on improved D?S evidence theory [J]. Journal of Nanjing University of Science and Technology, 2015, 39(4): 405?411.
[9] 文志诚,曹春丽,周浩.基于朴素贝叶斯分类器的网络安全态势评估方法[J].计算机应用,2015,35(8):2164?2168.
WEN Zhicheng, CAO Chunli, ZHOU Hao. Network security situation assessment method based on naive Bayes classifier [J]. Journal of computer applications, 2015, 35(8): 2164?2168.
[10] 方研,殷肖川,孙益博.基于隐马尔可夫模型的网络安全态势评估[J].计算机应用与软件,2013,30(12):64?68.
FANG Yan, YIN Xiaochuan, SUN Yibo. Network security si?tuation assessment based on hidden Markov model [J]. Computer applications and software, 2013, 30(12): 64?68.
[11] 潘恒,李景峰,郑秋生.基于HMM和信息熵的网络安全态势评估方法[J].小型微型计算机系统,2015,36(8):1784?1788.
PAN Heng, LI Jingfeng, ZHENG Qiusheng. Network security situation assessment method based on HMM and information entropy [J]. Mini?micro systems, 2015, 36(8): 1784?1788.
[12] 谢丽霞,王志华.基于布谷鸟搜索优化BP神经网络的网络安全态势评估方法[J].计算机应用,2017,37(7):1926?1930.
XIE Lixia, WANG Zhihua. Network security situation assessment method based on cuckoo search optimized back propagation neural network [J]. Journal of computer applications, 2017, 37(7): 1926?1930.
[13] 黄东,李长彬.基于粒子群算法优化最小二乘支持向量机的网络安全态势评估[J].信阳师范学院学报(自然科学版),2016,29(1):113?115.
HUANG Dong, LI Changbin. Network security situation assessment based on particle swarm algorithm optimizing least square support vector machine [J]. Journal of Xinyang Teachers College (Natural science edition), 2016, 29(1): 113?115.
[14] 汪材印.灰色关联分析和支持向量机相融合的网络安全态势评估[J].计算机应用研究,2013,30(6):1859?1862.
WANG Caiyin. Assessment of network security situation based on grey relational analysis and support vector machine [J]. Application research of computers, 2013, 30(6): 1859?1862.