遗传算法优化支持向量机的网络流量混沌预测
2018-09-12熊凡
熊凡
摘 要: 基于支持向量机的网络流量混沌预测方法通常基于人工经验设置参数,参数的性能较差,大大降低网络流量预测精度。因此,提出遗传算法优化支持向量机的网络流量混沌预测方法,通过相空间重构获取新的网络流量时间序列,获取具有最佳非线性预测结果的支持向量机函数,采用遗传算法优化支持向量机参数。基于优化的支持向量机参数,设计基于遗传算法优化支持向量机的交通流量预测模型,实现网络流量混沌预测。实验结果表明,所提方法在网络流量预测方面整体性能优、具有较高的精度。
关键词: 遗传算法优化; 支持向量机; 网络流量; 混沌预测; 相空间重构; 预测模型
中图分类号: TN711?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)18?0166?04
Network traffic chaotic prediction based on genetic algorithm optimization
and support vector machine
XIONG Fan
(School of Computer Science and Engineering, Wuhan Institute of Technology, Wuhan 430205, China)
Abstract: The network traffic chaotic prediction method based on the support vector machine usually has parameters set based on the artificial experience and has poor parameter performance, greatly reducing the prediction accuracy of network traffic. Therefore, a network traffic chaotic prediction method based on genetic algorithm optimization and support vector machine (SVM) is proposed. The new network traffic time series and the SVM function with optimal nonlinear prediction results are obtained by means of phase space reconstruction. The genetic algorithm is used to optimize the support vector machine parameters. On the basis of the optimized support vector machine parameters, the traffic flow prediction model is designed based on genetic algorithm optimization and SVM, so as to realize chaotic prediction of network traffic. The experimental results show that the proposed method has good overall performance and high precision in network traffic prediction.
Keywords: genetic algorithm optimization; support vector machine; network traffic; chaotic prediction; phase space reconstruction; prediction model
0 引 言
网络环境的优化依赖于管理方式与管理效果,因此,网络流量预测作为网络环境优化的技术支持成为时下热议的课题[1]。准确地获取网络流量预测结果有助于掌握网络流量的发展状况与走向,使网络宽带得到有效分配,促进网络通信速度的飞速提升。由此可见,对于网络环境的预测具有实际应用价值[2]。
传统基于支持向量机的网络流量混沌預测方法,通常基于人工经验设置参数,参数的性能较差,大大降低网络流量预测精度。为了解决该问题,提出遗传算法优化支持向量机的网络流量混沌预测方法[3],其可提高网络流量预测精度,对于网络环境优化以及网络通信能力的提高具有重要意义。
1 网络流量混沌预测
1.1 相空间重构和支持向量机
本文用[xi,i=1,2,…,n]表示网络流量时间序列,获取新的网络流量时间序列为[Xi=xi-m-1τ,…,xi-τ,xi],新的时间序列用[Xi]描述。用[Xi,yi,i=m-1τ,…,n-1]表示训练集,输入空间维数用[m]表示,获取支持向量机(SVM)回归函数为[fx=w·φX+b],其中,权向量用[w]描述,偏置向量用[b]描述。并采用机构风险最小化原则计算出SVM回归函数的优化形式为:
[ min J=12w2+Ci=1nξ?i+ξis.t. yi-w·φx-b≤ε+ξiw·φx+b-yi≤ε+ξ?iξi,ξ?i≥0, i=1,2,…,n] (1)
式中:与函数[fx]存在有关复杂度的参数是[w];不敏感损失系数用[ε]表示;松弛因子用[ξi,ξ?i]描述;惩罚因子用[C]描述。
把式(1)变换成对偶形式,获取更高的求解效率,得到关于线性回归的SVM函数:
[fx=i=1nαi-α?iφxi,φx+b]
采用的SVM函数就是径向基核函数[Kxi,xj=exp-xi-xj22σ2],径向基核函数的参数宽度用[σ]表示。
1.2 遗传算法优化支持向量机参数
对于遗传算法优化支持向量机参数的设置如下:[m]表示嵌入维数;[C]表示惩罚因子;[ε]表示损失函数参数。这些参数与选择的核函数、核函数参数、支持向量机时间序列预测结果的精度一定程度上保持某种联系[4]。采用高效率的优化算法对先验区间进行搜索能够获取向量机最佳参数内容[5?6]。遗传算法在信息搜索方面实际应用率极高,在模拟生物进化模式的基础上实现其全局最优的搜索功能[7]。本文支持向量机参数的优化完善是在遗传算法的基础上完成的。接着对其参数优化的过程进行描述,以高斯函数为参考:
1) 对参数[m,C,ε,σ]的真实取值进行采集,其中[σ]表示高斯核函数参数。
2) 设置[i=1Kyi-yi2×i=1Ky2i-1]为适应度函数,也是时间预测值[y]和实测值[y]的相对均方误差函数。
3) 获取以上参数的二进制编码结果,得出任意初始群体。
4) 采用解码的方式获取群体中染色体的适应度函数。
5) 分析群体性能是否符合最大遗传代数的标准,在符合该标准的情况下可输出最佳参数结果[8];在不符合该标准的情况下,对群体实施遗传策略的选择、交叉、变异算子操作获取新的群体,进行新的遗传运算,得到最优的支持向量机参数。
1.3 遗传算法优化支持向量机的网络流量预测模型
1.3.1 网络流量预测中的参数优化问题
支持向量机的最佳参数结果是建立和预测网络流量模型的首要操作,对于网络流量预测精度具有增强作用[9],支持向量机参数优化的表达式为:
[min fC,σ=i=1nyi-yi2s.t. C∈Cmin,Cmaxσ∈σmin,σmax] (2)
式中,网络流量的观测值与估计值用[yi],[yi]描述。
1.3.2 遗传算法优化支持向量机的网络流量预测步骤
1) 采用先进技术基于[y′i=yi-yminymax-ymin]对特定时间段内的网络流量实施采集。最大网络流量值用[ymax]描述;最小网络流量值用[ymin]描述;最初的网络流量值用[yi]表示。
2) 网络流量的延迟时间用[τ]表示,嵌入维数用[m]表示,这两个参数可以采用自相关法与假近邻法进行估算[10]。基于混沌理论重新构建完成分析后的网络流量数据,获取网络流量模型构建的时间序列。
3) 通过遗传算法优化支持向量机参数[m,C,ε,σ],发挥支持向量机的网络流量样本训练功能,反复训练获取最佳参数结果。
2 实验分析
2.1 实验一
2.1.1 实验设置
采用BP神经网络方法、RBF神经网络方法以及本文方法对数据A与B进行网络流量预测实验。BP神经网络采取反复试验的方式进行网络流量预测,其包含35个隐含层神经元数目。将线性函数作为输出层传递函数,将[Levenbeger Marquadt]法作为本次的学习函数,实施2 000次学习训练,误差需控制在0.01及以下,计算机随机展开网络还原。
RBF神经网络的输入与输出层结构为10×1,自适应调节方式是RBF神经网络进行网络流量预测的主要方式,误差需控制在0.01及以下。本文方法根据遗传算法对支持向量机的自适应优化结果进行各项试验参数的设置,0.8与0.08分别代表遗传算法的交叉概率、变异概率,20,100分别代表遗传算法的初始群体、进化代数。本文方法采用高斯函数,[m=10]是数据A的嵌入维数,[σ=1]为核函数参数,[C=1]为惩罚因子,[ε=0.001]为损失函数参数;同样,[m=11],[σ=1],[C=1],[ε=0.01]是数据B的参数设置。
2.1.2 实验结果分析
表1为采用三种实验方法在数据A,B中获取的网络流量数据预测结果,分别给出相对均方误差、相关系数两种参数数据。
首先分析数据A中相对均方误差,采用本文方法进行网络流量预测获取的相对均方误差值是0.126,采用BP神经网络方法进行网络流量预测获取的相对均方误差值是1.171 4,采用RBF神经网络方法进行网络流量预测获取的相对均方误差值是1.050 7,本文方法相对均方误差远低于其他两种方法,数据B中也是如此,说明本文方法的预测效果精度高;同理,在数据A,B中,采用本文方法获取的网络流量预测相关系数大于其他两种方法,说明本文方法的预测效果更好。实验结果表明,本文方法在网络流量预测方面的精度更高,效果更好。
2.2 实验二
2.2.1 数据来源
图1描述了网络流量数据情况。
为了获取较优的网络流量预测模型采用归一化方式处理图1中获取的网络流量数据信息,详细公式是[x′i=xi-Exσx],初始网络流量用[xi]描述,归一化网络流量用[x′i]描述,初始网络流量的标准差与均值用[σx],[Ex]描述。
2.2.2 对比模型及评价指标
实验采用标准粒子群方法(PSO)、遗传方法(GA)与本文方法展开对比实验。MAPE表示平均相对误差,RMSE表示均方根相对误差,实验采用这两个参数衡量所采用方法的性能,实际值、预测值分别用[xi],[xi]描述,n为预测点数,则MAPE及RMSE参數的表达式为:[MAPE=1ni=1nxi-xixi×100]%
[RMSE=1ni=1nLi-Li2]
2.2.3 网络流量预测拟合与预测误差分析
表2描述了不同方法的整体性对比,均方根相对误差、平均相对误差。这两个参数分别代表的预测拟合状况与预测误差状况,这两个参数值越小所对应方法的预测拟合度越高,预测误差越小。
分析表2可得,在训练集中,采用GA?LSSVM方法获取的预测均方根相对误差是9.102,采用PSO?LSSVM方法获取的预测均方根相对误差是6.63,而采用本文方法获取的预测均方根相对误差是3.71,远低于前两者。实验结果表明,本文方法在网络流量预测方面整体预测性能优,预测结果真实可靠。
2.2.4 网络流量预测时间对比分析
网络流量的预测速度是衡量网络整体性能的重要因素之一,预测速度越快说明其整体性能越强。针对不同预测步长,采用实验不同预测方法展开实验,图2描述了3种方法获取的训练时间对比结果。
分析图2能够看出,相同步长的情况下,本文方法耗费的时间最短,GA?LSSVM方法进行网络流量预测耗费的时间最长,PSO?LSSVM方法进行网络流量预测耗费的时间居中,并且随着步长的上涨,这种耗时差距越来越明显,本文方法耗费时间曲线上涨趋势缓慢,优势更加清晰。实验结果表明,本文方法在網络流量预测方面耗费的时间短、预测效率高。
3 结 论
本文所提遗传算法优化支持向量机的网络流量混沌预测方法能够高效获取网络流量预测结果,促进了网络通信速度、网络运行效率的快速提升,为相关网络事业的发展提供了可靠的网络流量预测手段。
参考文献
[1] 吴微微,苏金蓉,魏娅玲,等.四川地区介质衰减、场地响应与震级测定的讨论[J].地震地质,2016,38(4):1005?1018.
WU Weiwei, SU Jinrong, WEI Yaling, et al. Discussion on attenuation characteristics, site response and magnitude determination in Sichuan [J]. Seismology and geology, 2016, 38(4): 1005?1018.
[2] 黄国权,尤新华.改进粒子群算法优化最小二乘支持向量机的网络流量混沌预测[J].激光杂志,2015,36(3):96?99.
HUANG Guoquan, YOU Xinhua. Network traffic chaotic predicting based on least squares support vector machine optimized by improved particle swarm optimization algorithm [J]. Laser journal, 2015, 36(3): 96?99.
[3] 田中大,高宪文,李树江,等.遗传算法优化回声状态网络的网络流量预测[J].计算机研究与发展,2015,52(5):1137?1145.
TIAN Zhongda, GAO Xianwen, LI Shujiang, et al. Prediction method for network traffic based on genetic algorithm optimized echo state network [J]. Journal of computer research and development, 2015, 52(5): 1137?1145.
[4] 吴俊,黎云汉.相空间重构和支持向量机相融合的网络流量预测[J].计算机工程与应用,2014,50(16):67?71.
WU Jun, LI Yunhan. Network traffic prediction model based on phase space reconstruction and support vector regression [J]. Computer engineering and applications, 2014, 50(16): 67?71.
[5] 陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015,42(4):68?71.
LU Xinghua, CHEN Pinghua. Traffic prediction algorithm in buffer based on recurrence quantification union entropy feature reconstruction [J]. Computer science, 2015, 42(4): 68?71.
[6] 王男帅,薛静锋,胡昌振,等.基于遗传优化支持向量机的软件缺陷预测模型[J].中国科技论文,2015,10(2):159?163.
WANG Nanshuai, XUE Jingfeng, HU Changzhen, et al. Software defect prediction model based on support vector machine optimized by genetic algorithm [J]. China sciencepaper, 2015, 10(2): 159?163.
[7] 马起杨,朱新运.浙江珊溪水库地震震源参数特征研究[J].地震学报,2016,24(6):379?387.
MA Qiyang, ZHU Xinyun. Hypocentral parameters research of the Shanxi reservoir area in Zhejiang [J]. Acta Seismologica Sinica, 2016, 24(6): 379?387.
[8] PAN A, ZHOU J, ZHANG P, et al. Predicting of power quality steady state index based on chaotic theory using least squares support vector machine [J]. Energy & power engineering, 2017, 9(4): 713?724.
[9] 季斌,周涛发,袁峰.遗传算法优化支持向量机矿产预测方法[J].测绘科学,2015,40(10):106?109.
JI Bin, ZHOU Taofa, YUAN Feng. Mineral prediction method based on support vector machine optimized with genetic algorithm [J]. Science of surveying and mapping, 2015, 40(10): 106?109.
[10] TIAN Z, GAO X, LI S, et al. Prediction method for network traffic based on genetic algorithm optimized echo state network [J]. Journal of computer research & development, 2015, 52(5): 1137?1145.