改进支持向量机的网络流量预测①
2017-10-13王雪松
王雪松
改进支持向量机的网络流量预测①
王雪松
(佛山职业技术学院电子信息系, 佛山 528137)
支持向量机具有良好的非线性建模能力, 其参数对网络流量预测结果有直接影响, 为了解决支持向量机的参数确定的难问题, 根据杂草算法的优势, 提出了改进支持向量机的网络流量预测模型. 首先收集大量网络数量原始数据, 将支持向量机参数作为杂草种子, 然后模拟杂草的生存、繁殖过程搜索最优参数寻优, 建立网络流量预测模型, 最后采用具体网络流量数据测试模型的可行性. 结果表明, 该模型不仅得到了高精度的网络流量预测结果, 而且可以应用网络流量管理中.
网络流量; 杂草算法; 混沌理论; 支持向量机
随着Internet的数据不断增加, 网络管理面临巨大的挑战, 为了防止出现网络拥堵现象, 网络流量预测引起了人们的高度关注. 流量预测从历史数据中发现将来网络状态的变化趋势, 为企业和管理人员提供有意义的参考信息, 已经成为网络管理领域中的研究重点[1,2].
当前网络流量预测模型分为两类: 传统模型和现代, 传统模型主要有: 多元线性回归算法、时间序列分析法等[3,4], 根据历史数据确定网络流量预测模型的参数, 建模速度快、硬件要求低, 然而它们均基于网络流量是一种固定变化趋势, 如周期性、单调递增等, 不能描述网络流量随机变化特点, 预测精度低[5]. 现代模型采用现代统计学对网络流量进行建模与分析, 主要有: 神经网络、支持向量机(support vector machine, SVM)等, 可以反映网络流量变化的随机性、时变性, 网络流量预测结果更加靠, 获得了较高的预测精度[6-8]. SVM具体要求历史样本少, 泛化能力优等优势, 成为网络流量当前主要的建模工具, 然而网络流量预测精度与核函数及相关参数密切相关, 因此SVM参数确定是网络流量建模和预测首先要解决的问题[9]. 为了解决SVM参数确定问题, 业内学者们采用进化算法、粒子群算法等实现[10], 它们得到了较好的SVM参数, 但它们同样存在不足, 如进化算法的收敛速度慢, 遗传算法参数确定没有理论指导, 凭经验随机确定, 通用性差, 难以找到最优的SVM参数, 影响网络流量的预测结果.
为了获得更优的网络流量预测结果, 针对SVM参数优化难题, 提出了改进支持向量机的网络流量预测模型(IWO-SVM), 采用杂草优化算法(invasive weed optimization algorithm, IWO)搜索最优的SVM参数, 采用网络流量预测实验测试可行性和可靠性.
1 支持向量机和杂草优化算法
1.1 支持向量机(SVM)
设训练样本集为: {(x,y)},=1,2,…,, 根据函数将其映射到高维特征空间实现回归, 即:
式中,为权值向量;为偏置向量[11].
将式(1)转换为最小化问题, SVM回归的目标函数为:
式中,为惩罚参数;e为回归误差.
采用拉格朗日算子(i)进行变换, 得到相应对偶问题为:
式中,为核宽度.
对SVM的工件原理进行分析可知, 预测结果与参数和相关, 为了克服当前算法存在的不足, 利用杂草算法搜索能力强、速度快的优点, 解决参数和选择问题, 建立更加科学的网络流量预测模型.
1.2 杂草优化算法(IWO)
受到杂草生长和繁殖过程启发, 有学者提出了杂草优化算法[12], 具体过程如下:
1) 每一个杂草(i)在领域内繁殖一些种子, 种子数量i计算公式为
式中,(x)为杂草i的适应度值;min和max分别为杂草最小和大种子数;min和max为种群的最小和最大的适应度值.
2) 种子服从(0,)分布, 其中标准偏差的计算公式为:
式中,initial和final为的初值和终值;max和为最大进化代数和当前进化代数;为调和参数.
3) 当种群的种子数超过最大数量, 对杂草和种子进行排序, 选择前个适应度值最大的个体产生新的种群, 丢弃其它个体.
2 IWO-SVM的网络流量预测
由于参数和的优化目标是提高流量预测的精度最高, 因此和优化数学模型可以描述为:
基于IWO-SVM的网络流量预测步骤为:
1) 收集某一段时间的网络流量历史数据, 为了防止数据值间的差异过大进行预处理, 具体为:
2) 网络流量受到人为因素、上网时间等影响, 具有一定的混沌性能, 因此需要对原始网络流量时间序列进行相空间重构[13], 产生支持向量机的训练和验证样本.
3) 初始化杂草种群, 并初始化其它参数的值, 个体与一组(,)相对应.
4) 支持向量机根据每一组(,)对训练样本集进行建模, 计算网络流量的预测精度, 得到相应的适应度值.
5) 判断是否达到结束条件, 若达到就输出最优个体, 否则执行步骤(6).
6) 产生新的种子, 并与其它种子和杂草组合, 选择max个优秀个体组成新的种群, 返回步骤(4).
7) 最优个体对应的和为支持向量机的最优参数, 根据对训练样本进行学习建立网络流量预测模型.
3 网络流量预测模型性能的测试
3.1 源数据
选择一台网络服务器出口的每小时网络流量进行仿真实验, 得到1000个样本, 具体如图1所示. 选择前800个数据点作为训练样本集构建网络流量预测模型, 其它数据点作为验证集分析模型的性能, 在VC++ 6.0平台实现仿真实验.
图1 网络流量数据
3.2 训练样本和验证样本的重构
通常情况下, 网络流量有弱混沌特性, 设延迟时间=1, 采用假近邻算法估计最优嵌入维数(), 结果如图2所示, 从图2可以清楚看出最优=5, 根据=1,=5对原始网络流量数据进行相空间重构, 得到重构后的训练样本和验证样本, 将其变为有规律的数据, 便于支持向量机进行建模.
图2 估计最优m
3.3 IWO估计最优(,)SVM参数
采用IWO算法搜索支持向量机的参数和的最优值, 1步和3步预测的最优和如表1所示.
表1 C和σ的最佳值
3.4 结果与讨论
3.4.1本文模型的预测结果
IWO-SVM的网络流量单步预测结果如图3所示, 单步预测值与实际值变化趋势相似, 二者间的误差小, 可以反映网络流量数据的时变性, 预测结果可信.
(a) 预测结果
(b) 预测偏差
图3 IWO-SVM的网络流量1步预测结果
1步预测只能提前一个时刻对网络流量变化趋势进行描述, 不能满足网络管理的要求, 因此实现了提前3步的网络流量预测实验, 结果如图4所示, 3步预测精度明显要小于1步预测精度, 预测偏差也增大, 然而IWO-SVM还是能够描述网络流量整体变化趋势, 预测结果可以为网络管理者提供有用的信息.
(a) 预测结果
(b) 预测偏差
图4 IWO-SVM的网络流量3步预测结果
3.4.2与经典模型的性能对比
选择当前经典网络流量预测模型进行对照实验, 它们为: ARIMA、BP神经网络, 采用均方根误差()和相对平均误差()作为性能评价指标, 结果见表2. IWO-SVM的和均要小于经典模型的和, 网络流量预测精度更高, 说明IWO-SVM是一种精度高、结果可靠的网络流量预测模型.
表2 网络流是的MPAE和RMSE对比
4 结语
针对网络流量的SVM参数优化问题, 提出了基于IWO-SVM的网络流量预测模型, 采用杂草算法搜索SVM参数, 解决当前参数选择的盲目性, 实验结果表明, IWO-SVM的网络流量预测精度高, 预测结果好于经典模型, 具有广泛的应用前景.
1 史振华,刘外喜,杨家烨.SDN 架构下基于 ICMP 流量的网络异常检测方法.计算机系统应用,2016,25(4):135–142.
2 邬平,吴斌.采用回归方法优化网络流量管理模型处理性能. 计算机工程与应用,2012,48(4):104–106.
3 姜明,吴春明,张曼,胡大民.网络流量预测中的时间序列模型比较研究.电子学报,2009,37(11):2353–2358.
4 陈晓大,刘静娴.改进的基于小波变换和FARIMA模型的网络流量预测算法.通信学报,2011,32(4):153–157.
5 麻书钦,范海峰.基于小波变换和时间序列的网络流量预测模型.河南理工大学学报:自然科学版,2013,32(2):188–192.
6 曲桦,马文涛,赵季红,等.基于最大相关熵准则的网络流量预测.高新技术通讯,2013,23(1):134–145.
7 王雪松,梁昔明.基于BPSO–RBF神经网络的网络流量预测. 计算机应用与软件,2014,31(9):102–105.
8 肖汉杰,桑秀丽.相关向量机超参数优化的小时间尺度网络流量非线性预测方法.计算机应用研究,2016,33(6): 1882–1885.
9 于明,艾月乔.基于人工蜂群算法的支持向量机参数优化及应用.光电子激光,2012,23(2):374–398.
10 邵信光,杨慧中,陈刚.基于粒子群优化算法的支持向量机参数选择及其应用.控制理论与应用,2006,23(5):740–748.
11 刘忠宝.新型支持向量机在风速预测模型中的应用研究. 电子科技大学学报,2014,43(5):754–758.
12 Mallahzadeh AR, Oraizi H, Davoodi RZ. Application of the invasive weed optimization technique for antenna configurations. Progress in Electromagnetic Research, 2008, 20(79): 137–150.
13 黄发明,殷坤龙,张桂荣,等.基于相空间重构和小波分析-粒子群向量机的滑坡地下水位预测.地球科学-中国地质大学学报,2015,40(7):1254–1265.
Network Traffic Predicting Model Based on Improved Support Vector Machine
WANG Xue-Song
(Department of Electronic Information, Foshan Polytechnic College, Foshan 528137, China)
Aiming at parameters optimization problem of support vector machine in network traffic predicting, a network traffic predicting model is proposed based on improved support vector machine. Parameters of support vector machine are considered as a weed, the optimal parameters are found by invasive weed optimization algorithm, and network traffic data is used to test the performance. The experimental results show that the proposed model obtains high predicting accuracy and fastens the model speed, and it can meet the requirements of network traffic predicting.
network traffic; invasive weed optimization algorithm; chaotic theory; support vector machine
广东省教育厅项目(2010TJK446)
2016-06-09;
2016-08-08
[10.15888/j.cnki.csa.005668]