基于Elman神经网络改进ARIMA模型的网络负荷预测研究
2017-11-29丁春莉韩杏花陕西交通职业技术学院西安7008西北农林科技大学杨凌700
丁春莉, 韩杏花(. 陕西交通职业技术学院, 西安 7008; . 西北农林科技大学, 杨凌 700)
基于Elman神经网络改进ARIMA模型的网络负荷预测研究
丁春莉1, 韩杏花2
(1. 陕西交通职业技术学院, 西安 710018; 2. 西北农林科技大学, 杨凌 712100)
针对ARIMA模型预测结果具有误差大和滞后性的缺点,利用Elman神经网络的优越的非线性逼近能力修正ARIMA模型,提出一种基于ARIMA-Elman组合模型的网络负荷预测模型。选择RMSE、MAE和MAPE作为评价指标,研究结果表明,提出的ARIMA-Elman组合模型进行网络负荷数据预测的精度优于ARIMA、SVM和Elman,从而验证了算法的优越性和可靠性。
神经网络; 时间序列; ARIMA模型; 网络负荷
0 引言
随着互联网规模的日益壮大和计算机技术的发展,网络规模和复杂程度成指数级增加,使得网络管理和规划工作任务急剧增加,网络故障时常发生。因此对网络负荷进行高精度预测,对网络资源的管理和调度具有重要实际意义和理论价值。目前网络负荷预测的方法主要有时间序列方法[1]、神经网络[2]和支持向量机[3]等。时间序列方法主要有AR模型、MA模型和ARMA模型,具有操作简单和易于实现的优点,但存在滞后性和预测误差大的缺点。神经网络主要有RBF神经网络、BP神经网络和Elman神经网络等。神经网络具有较强的预测能力,但存在局部最优和收敛速度慢的缺点。
针对ARIMA网络负荷预测模型存在预测精度低和误差大的缺点,在ARIMA模型的基础上,利用Elman神经网络的优越的逼近性能对ARIMA模型进行修正,提出一种基于ARIMA-Elman组合模型的网络负荷预测模型。
1 Elman神经网络
Elman神经网络[4]由Jeffrey L.Elman于1990年提出,其是一种反馈神经网络,具有很强的计算能力和容错能力。若输入向量u为r维向量,输出向量y为m维,隐含层输出向量x为n维,承接层输出向量xc为n维,w1、w2、w3分别为隐含层到输出层、输入层到隐含层、承接层到隐含层的连接权值。g(·)为输出神经元的激活函数。f(·)为隐含层神经元的激活函数,h(·)为承接层的海派函数,net()表示某层的净输入,t表示迭代次序。Elman神经网络结构图,如图1所示。
图1 Elman神经网络结构图
Elman神经网络较BP神经网络具有更高的运行效率,其网络稳定性和训练速度有了进一步的提高,通过调节Elman的网络层数和神经元个数,可以任意精度逼近任何非线性动态过程。
2 ARIMA时间序列模型
2.1 自回归模型
若一个随机过程可由式(1)表示[5]。
Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+μt
(1)
其中,φi(i=1,2,…,p)为自回归参数,μt为白噪声过程,则Xt为p阶自回归过程,可表示为AR(p)。
2.2 移动平均模型
若一个线性随机过程,可由式(2)表示[6]。
Xt=μt+θ1μ+θ2μ+…+θqμ=
(1+θ1L+θ2L+…+θqL)μt=Θ(L)μt
(2)
其中,θ1,θ2,…,θ为回归参数,μt为白噪声过程,则公式(12)表示q阶移动平均过程,可表示为MA(q)。
2.3 自回归滑动平均模型
AR(p)和MA(q)的组合模型可表示为ARIMA(p,d,q),其表达式可由式(3)表示[7]。
Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+μt+θ1μ+θ2μ+…+θqμ(3)
ARIMA模型的优点在于不仅考察预测变量的历史值,而且将模型的历史数据预测结果的误差考虑进ARIMA模型,能够较好地刻画数据序列的发展趋势。
3 ARIMA-Elman组合模型
由于网络负荷数据的非线性特点,ARIMA进行网络负荷数据预测时会存在较大的滞后性,差分处理之后的网络负荷数据可以较好地反映原始网络负荷数据的变化趋势,具有一定预知特性。针对ARIMA预测精度低和误差大的缺点,利用Elman神经网络修正ARIMA模型,将ARIMA预测误差和历史网络负荷数据1阶差分序列作为Elman神经网络的输入,修正ARIMA模型的误差,最后将Elman神经网络的误差预测结果和ARIMA模型的预测结果相叠加,获取组合模型的网络负荷预测值,ARIMA-Elman组合模型的流程框图,如图2所示。
图2 ARIMA-Elman组合模型
ARIMA-Elman组合模型进行网络负荷预测的流程如下:
(1) 读取网络负荷数据;
(2) 检验网络负荷数据的平稳性,若为非平稳序列,则进行差分处理;反之,则进行ARIMA模型定阶和识别;
(3) ARIMA模型预测,并计算ARIMA模型的预测误差;
(4) 将网络负荷数据的1阶差分序列和ARIMA模型的预测误差作为Elman模型的输入,ARIMA模型的预测误差作为输出,构建Elman神经网络预测模型;
(5) 进行Elman预测;
(6) 叠加ARIMA预测结果和Elman预测结果,获取ARIMA-Elman组合模型的网络负荷预测值。
4 实证分析
4.1 数据来源
为证明本文提出算法的有效性,数据来源[8-9]于http://newsfeed.ntcu.net/~news/2017/ ,选择2017年6月7日-2017年6月21日的15天网络负荷数据为研究对象,其采样间隔为1时,获取360组网络负荷时间序列数据,网络负荷数据,如图3所示。
图3 网络负荷数据
4.2 评价指标
为了说明网络负荷预测的效果,选择平均绝对百分比误差(mean absolute percentage error ,MAPE) 、平均绝对误差(mean absolute error ,MAE) 和均方根误差( root mean square error ,RMSE) 作为评价指标,如式(3)、(4)、(5)。
(4)
(5)
(6)
4.3 预测结果
将网络负荷数据分成训练样本和测试样本,训练样本303组用于建立训练模型,而测试样本57组则用于验证所建立模型的正确性,其训练和预测结果,如图4—图7所示。
(a) 训练结果
(b) 测试结果
图4 ARIMA-Elman组合模型
(a) 训练结果
图5 ARIMA模型
(a) 训练结果
图6 Elman模型
(a) 训练结果
图7 SVM模型
为了进一步验证组合模型的优越性,将本文算法与ARIMA 、Elman[10]和SVM[11]进行对比,对比结果,如表1所示:
表1 不同方法预测结果评价指标对比
由图4-图7和表1对比结果可知,在RMSE、MAE和MAPE三个评价指标上,提出的ARIMA-Elman组合模型进行网络负荷数据预测的精度优于ARIMA、SVM和Elman,从而验证了本文算法的优越性和可靠性,如图8所示。
图8 训练集和测试集不同比例
由图8可知,随着训练集和测试集比例的增加,所有方法的精度呈现增加的趋势,通过本文算法与GRNN、BP、MA、AR、SVM和RBF的比较发现,本文算法的精度最高,效果最好。
5 总结
针对ARIMA网络负荷预测模型存在预测精度低和误差大的缺点,在ARIMA模型的基础上,利用Elman神经网络的优越的逼近性能对ARIMA模型进行修正,提出一种基于ARIMA-Elman组合模型的网络负荷预测模型。通过与ARIMA、SVM和Elman模型对比发现,提出的ARIMA-Elman组合模型具有预测精度高和误差点的优点,效果较好。
[1] 申红磊. 基于时间序列预测的异构无线网络负载均衡技术研究[D]. 上海师范大学, 2015.
[2] 孟安波, 胡函武, 刘向东,等. 基于纵横交叉算法优化神经网络的负荷预测模型[J]. 电力系统保护与控制, 2016, 44(7):102-106.
[3] 魏立兵, 赵峰, 王思华,等. 基于人群搜索算法优化参数的支持向量机短期电力负荷预测[J]. 电测与仪表, 2016, 53(8):45-49.
[4] Li P, Li Y, Xiong Q, et al. Application of a hybrid quantized Elman neural network in short-term load forecasting[J]. International Journal of Electrical Power amp; Energy Systems, 2014, 55(2):749-759.
[5] 郑晓天, 李宝明, 张云杰,等. 基于ZTS-SVR支持向量机算法的HTS网络负载预测[C]// 卫星通信学术年会. 2016.
[6] 曾会锋, 刘一田. 几种准实时IT系统负荷预测方法比较研究——基于R语言[J]. 计算机工程与应用, 2017, 53(9):90-96.
[7] Madhiarasan M, Deepa S N. ELMAN Neural Network with Modified Grey Wolf Optimizer for Enhanced Wind Speed Forecasting[J]. Circuits amp; Systems, 2016, 7(10):2975-2995.
[8] Lin C M, Boldbaatar E A. Autolanding Control Using Recurrent Wavelet Elman Neural Network[J]. IEEE Transactions on Systems Man amp; Cybernetics Systems, 2015, 45(9):1281-1291.
[9] 李孟刚, 周长生, 连莲,等. 基于ARIMA神经网络的工业生产指数仿真研究[J]. 计算机科学, 2016, 43(s2):554-556.
[10] 万红新, 彭云. 基于主题模型和ARIMA算法的网络舆情热点发现研究[J]. 科技广场, 2016(8):17-20.
[11] 黄玲莉, 刘小龙. 基于ARIMA与BP神经网络的收视率组合预测模型[J]. 电视技术, 2015, 39(9):117-121.
StudyOnNetworkLoadForecastingBasedOnElmanNeuralNetworkToImproveARIMAmodel
Ding Chunli1, Han Xinghua2
(1. Shaanxi Vocational and Technical College of Transportation, Xi'an 710018, China;2. Northwest A amp; F University, Yangling, Shaanxi 712100, China)
For the prediction results of ARIMA model has large error and the disadvantage of lag, using the nonlinear approximation capability of the Elman neural network is superior modified ARIMA model, put forward a kind of network load forecasting model based on ARIMA - Elman’s combination model.RMSE, MAE and MAPE is chosen as the evaluation index, the results show that the proposed Elman combination of ARIMA model for network load data to predict the accuracy is better than ARIMA, SVM and Elman, which verified the superiority and reliability of the algorithm in this paper.
neural network; Time series; ARIMA model; Network load
陕西交通职业技术学院院级科研项目(YJ17009)。
丁春莉(1963-),女,临潼人,副教授,研究方向:计算机校园信息化。
韩杏花(1964-),女,蒲城人,理学学士,副教授,研究方向:网络工程等。
1007-757X(2017)11-0065-04
TP311
A
2017.09.01)