APP下载

参数优化的SVR移动网络流量预测

2022-10-10郑晓亮陈华亮来文豪

计算机应用与软件 2022年9期
关键词:网络流量线性流量

郑晓亮 陈华亮 来文豪

1(安徽理工大学电气与信息工程学院 安徽 淮南 232001) 2(安徽理工大学采动响应与灾害防控国家重点实验室 安徽 淮南 232001)

0 引 言

随着4G技术和网络的大范围普及,移动网络流量的增长愈发迅速,人们对于网络流量的需求也持续增长,网上购物、手机支付、移动短视频等新行业随着网络的发展不断出现,未来在5G技术、物联网的普及下,数据流量将持续增长,将给移动网络带来新的挑战。

人流多变地区的潮汐效应[1-3]一直是运营商在规划网络时需要考虑的问题之一,但由于网络资源配置通常是静态配置的[4],面对潮汐效应的坡峰、谷底时期,网络资源配置过多将会造成带宽资源浪费,过少将导致网络拥塞,影响用户体验。对于网络流量的预测将是解决这类问题的关键点。

网络流量具有复杂性、不确定性、高度非线性关系。为了准确地预测网络流量,国内外许多研究者进行了大量关于网络流量预测方法的研究。Feng等[5]分别利用ARIMA、FARIMA、ANN和基于小波的预测器来预测网络流量,并比较了它们的计算复杂性和预测准确性。Adeleke[6]使用回声状态网络(ESN)预测网络流量,利用这种储存学习算法较好地预测了网络流量。Alarcon-Aquino等[7]提出了一种基于最大重叠离散小波变换(MODWT)的基于神经网络的多分辨率有限冲激响应(FIR)学习算法,并将它应用在预测上面。在预测方法方面分为线性与非线性两种。线性模型有自回归滑动平均模型(ARMA)、自回归(AR)[8-10]等。非线性模型有小波神经网络[1-12]、极限学习机(ELM)[13-16]、人工神经网络(ANN)[17-18]、支持向量回归(SVR)等。SVR由于结构风险最小化原理具有较好的泛化能力,使得它在预测问题中发挥着重要的作用。文献[19]将SVR用于期权价格的预测,明显提高了预测的精度。文献[20]将SVR用于城市供水管网余氯预测,并与人工神经网络作比较,结果表明,SVR相较于人工神经网络具有较好的预测性能。文献[21]利用对GDP增长速率的预测中,对比SVR与自回归模型,研究结果表明,SVR更适合用于GDP增长速率的预测。此外,SVR还被用于电力负荷预测[22]、短期客流量预测[23]、煤层瓦斯含量预测[24-28]、毒性预测[29]等方面,证明了SVR优秀的预测性能。此外,已有文章将SVR用于网络流量预测,例如文献[30]就利用基于主成分分析的SVR进行了网络流量的预测,并取得了不错的效果,文献[31]将全局人工鱼群算法(GAFSA)优化SVR,提高SVR预测的精度。

本文将SVR用于移动网络流量预测,并对原有的手动参数寻优作出改进,将PSO、DE-GWO、CS用于SVR的参数寻优,找出一种最佳的优化方案,改变传统SVR手动寻优耗时费力的情况。

1 研究方法

1.1 预测方法——支持向量机

支持向量回归(Support Vector Regression,SVR)是支持向量机(Support Vector Machines,SVM)的一个重要的分支。SVM是由Vapnik首先提出的,主要思想是建立一个分类超平面作为决策曲面,使得正例和反例之间的间隔边缘被最大化,可以用于模式分类和非线性回归。

SVM一般用于解决分类问题,基本思想是找到具有最大间隔的超平面,将训练样本的不同类别分开。其数学问题表示为:

(1)

s.t.yi(wTxi+b)≥1 ∀i=1,2,…,m

式中:w为决定超平面方向的法向量;b为超平面到原点的位移量;m为样本总量;b为训练样本;xi为输入;yi为输出。

SVR则是用于回归问题,基本思想是找到一个回归平面,让所有的D到该平面的距离最近,其数学问题表示为:

(2)

式中:C为正则化常数;lε为损失函数;f(x)为回归平面方程:f(x)=wTx+b;x为输入。

为了降低噪声的影响,引入松弛变量ξ,则式(2)可改写成:

(3)

式中:C为常数;ε为损失变量。对于这种有约束条件的优化问题,可以用拉格朗日乘子法来得到其“对偶问题”。对于式(3)的每条约束添加拉格朗日乘子 ,得到其对偶问题为式(4)。

(4)

式中:α是拉格朗日算子。

以上是基于线性可分情况考虑,但实际中的数据大都不是线性可分的,对这种问题,可以通过引入核函数将原来的样本映射到一个更高维的特征空间,引入核函数如下:

k(xi,x)=Φ(xi)TΦ(xj)

(5)

式中:Φ(·)为从低维空间到高维空间的映射函数,也被称为核函数。则SVR的对偶问题表示为:

(6)

式中:参数v用来控制支持向量的数目以及训练误差。

常见的核函数主要有:

线性核函数:k(x,y)=xTy+c

Sigmoid:k(x,y)=tanh(γxTy+r)

这里的c、δ、γ、r均为核函数参数。

1.2 参数优化

对于SVR预测模型来说,选择合适的参数c(惩罚因子)和g(核函数参数)很重要,图1是同一样本数据下,不同的c和g参数的预测效果。

(a) c=0.01,g=0.01原始数据和回归预测数据对比

(b) c=0.01,g=0.01原始数据和回归预测数据对比

(c) c=0.01,g=0.01原始数据和回归预测数据对比

(d) c=0.01,g=0.01原始数据和回归预测数据对比图1 不同c和g参数预测效果

可以看出,c和g参数选择对于SVR的预测性能的影响还是较大的,一般的SVR的c和g参数的选择方法是人工择优方法,烦琐耗时,且可信性不强。由于一种优化算法不可能适用于所有优化问题,所以本文使用三个优化程序PSO、CS、DE-GWO来优化SVR的参数选择过程。PSO具有搜索速度快、结构简单等优势,但需要参数多;CS具有参数少、操作简单、易实现、随机搜索路径优和寻优能力强等特点,但PSO与CS都易陷入局部最优;利用DE算法的变异过程来增加狼群的多样性,减少GWO陷入局部最优的概率,DE-GWO具有收敛性强、易实现、不易陷入局部最优的特点。我们选择三种不同特点的算法来优化SVR,找出最适合的一种。

PSO是Kennedy等提出的一种全局搜索算法,源于模拟鸟群觅食过程中的迁徙和群聚行为,基本思想是:通过群体中个体之间的协作和信息共享来寻找最优解,算法的基本流程如图2所示。

图2 PSO流程

CS是2009年由Yang等提出的启发式算法,源于布谷鸟的Levy飞行和卵寄生行为,基本思想是布谷鸟通过随机飞行找到最优的鸟巢来孵化鸟蛋。其算法流程如图3所示。

图3 CS流程

GWO是2014年由Mirjalili等提出的智能优化算法,源于自然界狼群的群体狩猎捕食行为,主要思想是通过模仿狼群跟踪、包围、追捕、攻击猎物的过程来完成寻优过程。DE是由Storm等提出的全局搜索算法,源于生物的进化机制,主要思想是通过变异、交叉、选择来得到最优解;其算法流程如图4所示。

图4 DE-GWO流程

优化算法的主要方法为:将SVR的MSE(均方误差)作为三个优化算法的适应度函数,通过优化算法找到SVR的最佳参数c和g,代入SVR预测模型中,可以得到较好的预测结果,基本流程如图5所示。

图5 优化算法流程

本文中的评价机制为SVR算法的均方误差MSE和平方相关系数r2,公式为:

(7)

(8)

2 流量数据预测实验

2.1 数据获取与预处理

实验用原始数据采集于淮南市吾悦广场,由安徽省移动淮南分公司提供,采集时间为2019年1月1日至5月15日,数据采集粒度为15分钟,如图6所示。

图6 15分钟粒度流量走势

将15分钟粒度数据转化为如图7所示的日粒度数据,可见流量峰值出现在5月1日,为299.86 GB。因为5月1日为劳动节,人流量最大,这样突发的高负荷流量将给基站带来极大的压力,对人流突变场景的流量预测可以帮助运营商做好资源调度和安全保障,保证用户有良好的使用体验。

图7 日粒度流量走势

2.2 实验参数设置

对于相同算法优化参数的SVR,核函数不同,它们的预测效果也会不同,所以我们将实验数据用基本的SVR做实验,选出最适合当前实验数据的核函数类型。

由表1可知,线性核函数与RBF核函数的预测时间(t)、均方误差(MSE)和平均绝对百分误差(MAPE)效果都比较好,而多项式函数与Sigmoid核函数的MSE与MAPE比较大,多项式函数的预测时间t更是比其他核函数大得多。所以初步选择线性核函数与RBF核函数,接下来再进行两者的进一步比较。

表1 不同核函数参数预测效果表线性核函数

由表2可知线性核函数与RBF核函数的MSE相差不大,但是随着c和g的增大,RBF核函数的预测时间远远小于线性核函数的预测时间,对于优化的SVR预测模型,本身的优化程序耗时就应考虑在内,所以应该选择RBF核函数,尽量减少SVR预测的时间,提高预测效率。

表2 线性和RBF核函数预测对比表

本文选择了PSO、DE-GWO、CS三种优化算法来优化SVR的参数,参数设置如表3所示,其中:Ub为参数上限;Lb为参数下限。

表3 参数设置表

2.3 实验分析

本文实验的硬件条件是:CPU为Intel Core i5- 8300H,主频为2.3 GHz,内存为8 GB;实验系统为Windows 10,实验平台是MATLAB2018b。

为了验证优化SVR模型的优势,将基本的SVR算法与优化的SVR作比较。

基本的SVR算法的核函数与参数上下界的设置与优化SVR算法的相同,c和g的取值为0.01、0.1、1、10、50、100中的随机组合,一共36种组合,每个组合独立重复10次实验,取平均结果,结果如表4(见附录)所示。得到最优c=50,g=0.01,与PSO、CS、DE-GWO优化的SVR做实验对比,结果如表5所示。

表4 基本SVR不同参数预测效果表

表5 算法预测结果对比表

可以看出,手动寻优的SVR模型烦琐耗时,三种优化的SVR预测模型的性能均比未优化的SVR模型好,且三种优化的SVR中,DEGWO-SVR的预测性能最好,最优的c和g参数为50.702 2和0.01,MSE约是未优化的SVR的1/28,r2提高了0.050 5;DEGWO-SVR的测试集预测效果如图8所示。

图8 DE-GWO优化SVR预测效果

3 结 语

人流多变场景的移动网络流量预测对节假日及大型活动的网络应急保障具有重大意义。本文针对流量预测问题,提出基于参数优化SVR的流量预测模型,以淮南吾悦广场为实验对象,选择RBF核函数作为主要核函数,通过PSO、CS、DE-GWO对SVR算法进行参数寻优,并与未优化的SVR做实验对比。实验结果表明,参数优化的SVR模型相对于未优化的SVR拥有更好的预测效果,其中DE-GWO优化的SVR预测模型得到的最优参数为54.702 2和0.01,拥有最好的预测效果。对于移动网络流量的准确预测,既可以帮助运营商在规划和设计网络时做出合理的资源分配,又可以提前预知网络流量高峰期时段,做好网络运营,提高用户体验水平。本文所进行的网络流量预测只针对手机用户流量,未对无线及电脑端流量有所研究,后期研究将往这两方面进行。

猜你喜欢

网络流量线性流量
直播助农冲流量 勿忘质量
大数据驱动和分析的舰船通信网络流量智能估计
关于非齐次线性微分方程的一个证明
过去的一年开启了“流量”明星的凛冬时代?
非齐次线性微分方程的常数变易法
线性耳饰
一种用于敏感图像快速加密的图像注入技术仿真
基于小波神经网络的网络流量预测研究
常数变易法的理论依据
三大运营商联手阿里巴巴酝酿推出“流量钱包”