基于季节指数调整与HGWO-SVR算法的农产品价格预测模型
2018-10-30王灿强李维德
郑 薇,王灿强,李维德
(兰州大学 数学与统计学院,兰州 730000)
0 引言
近年来,已有不少学者针对农产品价格预测展开了探索性研究和实例验证。由于农产品价格波动具有明显的时间序列特征,因此对农产品价格预测主要分为线性时序预测和非线性时序预测两类。针对线性时序预测方法的研究有:苗开超(2009)[1]基于指数平滑模型的农产品价格预测,姚霞(2007)[2]、韩雯(2011)[3]等构建的ARIMA模型用于预测农产品价格。然而现实中,许多时序数据呈现出很强的非线性特征,为此,大量的非线性预测模型被广泛应用于农产品价格时序预测中:如BP神经网络[4]、SVM模型[5]、KNN模型[6]等。虽然上述预测方法各有特点,但单项预测方法只能从某个角度提供相应的有效信息,无法反应信息源的广泛性[7]。因此,越来越多的组合模型被用于时序预测中以提高预测精度。如农产品价格预测的BFGS-NARX[8]、SVM-ARIMA[5]、FIG-SVM[9]等组合模型,结果表明这些组合模型的预测精度高于单项时序预测模型。
由于农产品价格呈现季节性波动趋势,具有季节性变化规律[2]。鉴于此,本文引入季节指数调整的HGWO-SVR混合模型来对我国农产品价格进行预测。选取2005年1月到2016年12月的农产品批发价格指数月度数据作为研究对象,将本文模型与SARIMA等模型的预测效果进行对比,验证了所用方法的可行性及精确性。
1 模型及方法
1.1 季节指数调整(SIA)
农产品价格的时间序列数据呈现线性、非线性及季节性波动的特征,而季节性波动往往会给经济时间序列的分析造成困扰和麻烦,因此在时序分析中,往往需要进行季节指数调整。所以本文中首先需要将原始时序数据分解成趋势分量和季节分量,常用的季节指数分解模型有加法模型及乘法模型[10,11]。
1.2 混合灰狼优化算法(HGWO)
1.2.1 灰狼优化算法(GWO)
灰狼优化算法是Mirjalili(2014)等[12]提出的一种新型群体智能优化算法,它源于模拟自然界中灰狼种群的等级层次机制和捕食行为,通过狼群跟踪、包围、追捕、攻击猎物等过程实现优化搜索的目的。
(1)社会等级。灰狼种群被分为四个社会等级:α、β、δ和ω,其中α为头狼,担任领导角色;β狼是下属狼,协助α狼做决策;δ狼为普通狼,听命于α狼和β狼;ω狼为底层狼,服从于α、β和δ狼。
(2)包围猎物。通常,灰狼的狩猎行为都开始于包围猎物,Mirjalili等[12]提出了下列数学公式用以描述这种行为:
r1,r2是[0,1]中的随机向量,另外算法假设 的值在迭代过程中从2到0线性下降。
Maxiter表示最大的迭代次数,在每次迭代过程中,t取0到Maxiter之间的整数。
(3)狩猎。在头狼α的带领下,灰狼有能力识别猎物的位置并包围它们。然而,在抽象的搜索空间中,我们并不知道狩猎的最佳位置。为了以数学模型模拟狩猎行为,因此本文假设α狼、β狼和δ狼知道关于潜在猎物位置的更多信息。在此基础上,保存目前为止获得的前三个最优解(即α,β,δ狼目前的位置),并迫使其他灰狼(包括ω狼)根据这些狼的位置来更新他们的位置。这个过程可以有下面的数学公式模拟:
(4)攻击猎物(开发)。狼群会通过攻击停止移动的猎物来完成狩猎活动,这个过程可以通过数学公式中的将的值从2减少到0来实现,相应的的值也会减少。当的值处于区间[-1,1]时,灰狼的下一个位置可以是它现在的位置和猎物的位置之间的任何位置。而当群狼开始攻击猎物。这种攻击行为使得灰狼优化算法在开发阶段或者局部搜索中具有出色的性能。
(5)搜索猎物(勘探)。灰狼通常是分散的去寻找猎物,然后基于α、β和δ狼的位置来一起攻击猎物。用模拟灰狼与猎物的分开状态,这样可以加强算法的勘探能力,使GWO算法实现全局搜索。GWO算法的另一个搜索系数是。从公式(4)可知,是在区间[0,2]上的随机值,此系数提供了猎物的随机权值,以便随机增加猎物在定义的距离方程中的影响。这可以帮助GWO在优化中显示更随机的行为,避免陷入局部最优。
1.2.2 差分进化算法(DE)
差分进化算法由Storn(1997)等[13]于1995年首次提出,算法通过对物种种群的变异、交叉、选择等操作,使得种群个体一代代得以优化,逐渐逼近最优解,从而产生新的种群。DE算法是一种简单高效的用于全局优化的算法。
1.2.3 混合灰狼算法(HGWO)
混合灰狼算法[14]是DE算法与GWO算法的组合算法。需要有三个相同规模的种群,即父代种群、突变种群和子代种群。
第一步,采用公式(11)在一个合适的可行域内随机产生三个种群,用POP代表种群,有下列定义:
psize代表种群规模,k表示种群中第k个个体,k=1,2,…,psize,每个个体表示如下:其中 p=1,2,…,d,k=1,2,…,psize 。
第二步,对父代种群目标函数值进行非降序排列,确定父代种群中的α狼、β狼和δ狼。
在整个迭代过程中,采用公式(8)来不断更新父代灰狼每个个体的位置。分别用DE算法中的变异操作和交叉操作来得到变异(中间体)种群和子代种群,用选择操作来更新父代种群,用公式(3)至公式(5)来更新系数 、 以及 的值。因此,对父代种群目标函数值进行非降序排列,更新父代种群中的α、β和δ。一旦迭代过程结束,返回父代α狼的目标函数值确定父代α狼。
一旦父代种群灰狼个体更新位置超越边界值,则用下列公式进行修正:
其中 p=1,2,…,d,i=1,2,…,psize 。
1.3 支持向量回归(SVR)
支持向量回归(SVR)于1995年由Vapnik等[15]首先提出,是一种有监督的学习算法,其理论基础是结构风险最小原理(SRM)和统计学VC维理论[16]。SVM可用于模型分类和非线性回归,它的主要思想是:通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个高维空间中寻找输入变量和输出变量之间的一种非线性关系[17]。SVR是SVM在解决回归问题时的算法,它已广泛应用于各种领域,SVR算法的关键是要找到适当的函数f(x)=w×φ(x)+b来拟合训练集。
1.4 基于季节指数调整的HGWO-SVR混合模型
上文详细介绍了基于季节指数调整的HGWO-SVR混合模型,该模型的基本流程为:首先,对农产品价格指数采用季节指数调整方法将其分解为季节分量和趋势分量;其次对剔除季节分量的趋势分量采用试错法,选择最小误差,确定最优的输入结构,用HGWO-SVR模型对趋势项进行训练与预测;最后,将季节分量还原到预测的趋势分量中,得到最终的预测值。
2 实证
2.1 数据描述
本文选取2005年1月至2016年12月我国农产品批发价格指数月度数据作为研究对象,数据来源于全国农产品批发市场价格信息网(http://pfscnew.agri.gov.cn),共144个样本数据。此批发价格指数月度数据是以2000年作为基准年的定基指数。
将样本数据分为训练集和测试集两部分。用前132个样本数据做训练,后12个样本数据做测试,为防止出现过拟合现象,随机选取训练样本的20%作为测试集,进行逐月预测。
2.2 评价标准
本文同时采用RMSE(均方根误差)、MAPE(平均绝对百分比误差)、MAE(平均绝对误差)三个指标来评价模型预测的精度,这三个指标的定义如下:
2.3 实证分析
2.3.1 原始数据的季节调整
本文基于季节指数调整的HGWO-SVR混合模型对农产品价格进行预测。第一步,需要将用来研究的样本数据进行季节分解,分解为季节分量和趋势分量。常用的季节指数调整模型有加法模型及乘法模型,本文采用基于季节指数加法分解模型的HGWO-SVR混合模型(AHGWO-SVR)。表1为通过加法模型分解计算得到的一个周期内的季节指数值IS(S=1,2,…,12)。
表1 AHGWO-SVR模型中的季节指数调整值
2.3.2 SVR预测
第二步,对分解出来的趋势分量做训练与测试。这里模型的输入形式、核函数、模型参数的选择以及预测范围会对模型预测效果有着重要的影响。
在模型的输入形式上,本文采用试错法来确定最佳输入结构。由于文中使用的是月度数据,本文用1个月的数据作为输入变量,预测下一个月的数据,用1至2个月的数据作为输入变量,预测第三个月的数据,…,用1至5个月的数据预测第六个月的数据等形式,通过实验选择具有最小误差的输入形式。核函数的选择上,用RBF函数作为SVR的核函数;将分解出来的趋势分量分为训练集和测试集,用前132个样本数据做训练,后12个样本做测试,其中随机选取训练集样本数据的20%做验证,利用HGWO算法来搜索SVR模型的最优参数c和g;用最优参数的SVR模型进行回归预测。表2为本文的混合模型在不同输入形式下采用试错法得到的RMSE、MAPE、MAE的值,以及参数c和g的值。其中用斜体表示的RMSE、MAPE、MAE以及c和g的值对应的输入形式将是本文模型采用的输入结构。
表2 AHGWO-SVR模型不同输入形式下的参数值及误差值
2.3.3 叠加季节指数
将调整后的季节指数还原到第二步的预测结果中去,得到最终预测的农产品批发价格指数。
2.3.4 模型比较
为验证该模型在预测上的优越性,将该模型与MHGWO-SVR(季节指数乘法分解模型下的HGWO-SVR混合模型)以及APSO-SVR(季节指数加法分解模型下的PSO-SVR混合模型),ADE-SVR(季节指数加法分解模型下的DE-SVR混合模型)和SARIMA模型进行比较,用RMSE、MAPE、MAE这三个评判标准来评价模型的预测效果。图2为基于以上模型预测的我国2016年12个月的农产品批发价格指数趋势,从图中可以看出,本文提出的模型预测结果更接近真实值。图3中的五条曲线分别为上述五种模型预测下的2016年12个月的农产品价格指数与实际农产品价格指数的误差曲线,从图3中的误差曲线走势可以发现本文提出的模型具有最小的误差。表3为不同混合模型下的预测结果的对比。
图2 不同模型的预测趋势
图3 不同模型的误差对比
表3(见下页)为上述五种模型预测下的2016年我国农产品批发价格指数与实际农产品批发价格指数的误差值,斜体的值分别表示最小的RMSE、MAPE、MAE的值。显然,本文提出的AHGWO-SVR混合模型在这三个评判指标下均达到了最高的预测精度。因此,本文提出的混合模型在农产品价格预测上优于其他模型。
首先,将AHGWO-SVR和MHGWO-SVR混合模型预测效果同APSO-SVR及ADE-SVR模型进行比较,观察发现基于HGWO算法的模型预测效果要优于PSO及DE算法建立的模型,这可能是因为HGWO算法在开发和勘探过程中能够更好地保持平衡,比PSO和DE算法能够确定更优的SVR参数c和g。
表3 不同模型下的误差值
其次,将基于AHGWO-SVR的混合模型与MHGWO-SVR的混合模型进行对比,发现AHGWO-SVR混合模型预测效果优于MHGWO-SVR混合模型。由于本文研究对象是我国农产品批发价格指数,而农产品交易品种繁多,不同种类的农产品季节波动趋势不尽相同,加法模型分解下的季节指数混合模型可能更适合本文的研究。
第三,将以上四种混合模型同SARIMA预测模型进行对比,发现基于智能算法的混合模型预测结果要优于传统的SARIMA模型,主要是因为新型智能算法在模型预测方面较传统模型有着显著优势。
总之,经过对比分析,本文得出以下结论:(1)HGWO优化算法在参数寻优上要优于PSO及DE算法,是因为在开发和勘探过程中HGWO算法能够更好地保持平衡;(2)基于季节指数加法分解模型的混合模型优于乘法分解模型的混合模型,表明基于季节调整的加法分解模型的混合模型更适合本文的研究;(3)基于智能优化算法的混合模型要优于传统的SARIMA模型,是因为智能算法在模型预测方面较传统模型有着显著优势。
3 结论和展望
本文通过建立季节指数调整的HGWO-SVR混合模型对我国农产品价格进行预测,主要分为三个步骤:(1)将原始数据分解为季节分量和趋势分量;(2)对趋势分量进行HGWO-SVR训练及预测;(3)将季节指数还原到预测的趋势项中,得到最终预测结果。为验证本文提出的混合模型在农产品价格预测上的优势,本文将该模型与MHGWO-SVR、APSO-SVR、ADE-SVR以及SARIMA模型进行比较,结果表明,AHGWO-SVR混合模型在预测精度上优于其他模型。本文有以下几点结论:
(1)农产品价格的时序数据通常都带有季节性波动的特征,而季节性波动会给经济时间序列的分析造成困扰和麻烦。因此在进行回归预测前,将原始数据进行分解,对趋势项进行预测,之后再将季节指数还原到预测的趋势项中,得到最终预测结果。这种季节调整模型往往能够缓解季节性波动的冲击,从而有效提高预测精度。
(2)本文应用的基于DE算法的GWO算法,该算法原理简单、易于实现,需调整的参数少且全局搜索能力强,在求解精度和稳定性上要明显优于PSO算法、DE算法,表明HGWO算法具有更强的鲁棒性和稳定性。
(3)农产品价格波动呈现非线性及季节性的特征,用传统的预测方法对其预测具有一定的局限性。而本文提出的混合模型,能够充分利用新型智能算法的优势,有效模拟非线性、自适应学习,被证明在农产品价格预测上是一种有效的预测方法。