APP下载

基于ARIMA-SVR模型的中国生猪价格预测分析

2022-05-17魏书禾

科技创新与应用 2022年13期
关键词:差分残差线性

魏书禾

(东北财经大学 国际商学院,辽宁 大连 116021)

近年来,我国生猪价格始终以一种令人难以预料的方式频繁波动着,严重影响着国民生产生活的秩序。因此,对生猪价格进行有效的预测是十分必要的。

目前,国内外许多学者从不同的层面,多维度、多视角对生猪价格趋势和变化程度进行了刻画——对生猪价格波动的机理进行剖析,从而提出稳定生猪价格的相应机制,得出结论:生猪价格的波动是多因素叠加的产物。随着科技的发展,生猪价格预测的模型和方法有了很大程度的发展和提高,应用生猪价格预测模型的有多元回归分析模型、灰色模型、神经网络模型、支持向量机模型、ARIMA、VAR等单一的模型[1-11]。这些模型均为基于线性时间序列的估计模型,而生猪价格还是一种多种因素影响的非线性动力学过程,线性估计模型对其运行规律预测的精准度较低。ARIMA模型属于时间序列预测法,具有建模简单的优点,能够很好地刻画生猪价格序列中的线性变化特征,但其对非线性变化特征的描述会产生一定的误差;支持向量机回归(support vector machine regression,SVR)模型具有出色的非线性拟合性能,可以准确地拟合生猪价格序列中的非线性变化特征[12]。同时存在线性和非线性数据模式,就可采用ARIMA和SVR的组合,即ARIMA-SVR混合模型[13]。

调研近年文献发现,ARIMA-SVM模型已应用于飞机发动机的使用寿命预测[14]、短期风力预测[15]、干旱预测[16]、黄金价格预测[17]和电力负荷预测[18]等方面,但在生猪价格中的应用尚未发现。本文根据2020年1月19日-2021年1月31日生猪价格日数据,采用ARIMA及SVR模型分别研究生猪价格变化趋势的线性、非线性部分。接着将线性建模结果与非线性预测得到的残差相结合,得出结果即采用ARIMA-SVR模型预测的生猪价格。最后在与对比模型的比对下,通过判断模型预测评价指标的大小,得出ARIMA-SVR能够更为精确地预测生猪价格的变化趋势。

1 ARIMA和SVR模型理论分析

1.1 ARIMA模型

在ARIMA模型用于时间序列时,要求序列必须是平稳的。如果序列不平稳,则必须多次差分将其平稳化。多阶整体也就是通过多次差分变换的非平稳时间序列。ARIMA(p,d,q)中,p、q被称为自回归项的滞后阶数和移动平均项的滞后阶数,差分时间序列使其平稳化所造成的次数用d表示,ARIMA(p,d,q)被称为差分自回归移动平均模型[8],模型一般的表示方法为:

若线性函数含随机扰动项,可用ARIMA模型的表示法来表示ARIMA模型,由以下等式可以确定式中Ψ1,Ψ2,…,的值:

时间序列一般分为4种类型,在识别的基础上,构建对应的时间序列模型,对相应的特征模型进行平滑化,进而建立对应的特征模型,其模型为:

1.2 SVR模型

支持向量机的原理是确定特定的核函数(Kernel)使得特征空间能够得到扩展,这样做的目的是为了做线性可分情况的分析。但是对于线性不可分割的情况,要使用线性算法处理样本的非线性特征,最终使得样本在高维特征空间中能实现线性可分[9],其表达式为:

其中,f(X)为预测值,ω为权值向量,b为偏置向量,且ω,b都是可变的。如上所述,支持向量机做预测方法的目的是尽量减少经验风险。

对公式(8)展开说明,可表示为:

其中,给出了解具有不等式约束的二次最优化问题后的方程式的参数向量W,其表达式为:

其中,将核函数表示为K(Xi,Xj),特征空间φ(Xi)中的向量Xi与φ(Xi)中的Xj二者的内积被称为核的值,公式表示为:

2 ARIMA-SVR模型原理

本文将采用如下步骤构建组合模型来进行生猪价格的预测:

由于ARIMA和SVR的单一模型各有不同的优点和缺点,但在解决线性模型和非线性模型的问题时,两者具有不同的优点。这两种模型是相辅相成的。因此,为了预测生猪价格我们可以将两者结合起来得到精度更高的结果。假设线性自相关部分Lt与非线性残差Nt两个部分被看作时间序列Yt的组合,用公式表示就是Yt=Lt+Nt。利用组合后的ARIMA-SVR组合模型来期望得到预测精度更优的结果。组合预测原理如图1所示。

图1 ARIMA-SVR组合预测模型原理

3 ARIMA-SVR模型的生猪价格预测

3.1 数据来源

本文研究的生猪价格数据来源于中国养猪网(https://zhujia.zhuwang.cc/),2020年1月19日-2021年1月31日每日生猪(外三元)价格累计379条数据,数据真实可靠。选取2020年1月19日-2021年1月7日累计355条数据作为第一期数据进行ARIMA建模,2021年1月8日-2021年1月19日累计12条数据作为获取残差序列的第二期数据,2021年1月20日-2021年1月31日累计12条数据作为最终比较模型精度的第三期数据。将生猪日价格绘制成时序图,如图2所示。明显看出数据呈现出季节性与非平稳性特征,进行建模前需要消除数据的季节性与不平稳性。

图2 生猪价格日时序图

3.2 生猪价格ARIMA模型构建

由于生猪价格序列易受到各种因素的影响,使用单一模型来预测生猪价格的变化趋势可能是困难的,并且在预测精度方面,也难以达到预期的效果。因此,在单一模型预测精度不高的情况下,我们采用ARIMA-SVR组合模型对生猪如价格进行预测。

我们能够清晰地从图2的时间序列图中看出,生猪日价格受到长期趋势效应、季节效应和随机波动之间交互影响,因此我们利用季节乘积模型对生猪价格序列进行建模。通过对数据进行一阶12步差分消除季节性与不平稳性,如图3所示。可以发现差分后的生猪价格序列已基本平稳,自相关系数结尾,偏自相关系数拖尾,如图4、图5所示。一阶差分后生猪日时序呈现出长期的稳定性,基本上在0附近波动上下均匀波动,且周期性仍然明显。

图3 生猪价格一阶差分时序图

图4 差分序列自相关图

图5 差分序列偏自相关图

为了更准确地描述数据平稳性,可以使用ADF单位根检验来进行检验是否平稳。若序列是平稳的,则可以直接用ARIMA模型来拟合,反之则要经过差分转换。ADF单位根检验结果见表1。

表1 一阶差分后生猪价格ADF检验

建立ARIMA(2,1,3)(0,1,1)×12季节乘积模型,参数检验结果显示,模型在参数估计中通过检验,且AIC值为-40.47较小,模型拟合的较好。模型的显著性检验,LB(Ljung-Box)检验统计量p值为0.435 7,显著大于0.05,表明ARIMA(2,1,3)(0,1,1)×12模型拟合效果显著,对建立的模型进行12步预测分析,结果见表2。

表2 ARIMA模型预测生猪价格

3.3 SVR模型对生猪价格的残差修正

为了选择一个最优个数能够使得循环残差数据的误差最小,我们采用选择N个残差数据,保留误差为它的第N+1个残差数据作为模型,作为输出的方法。通过向后逐步择优,最后确定最优个数N为4使得模型循环残差的误差最小。

利用R软件实现SVR建模,选取高斯核函数,参数gamma范围在0.01-1 000范围,惩罚系数C范围在0.1-200,采用十折交叉验证,最后通过择优选择惩罚系数C=1.02以及gamma=26,作为最优参数组合对生猪价格残差进行预测。对比修正模型与原模型的预测精度,预测结果见表3,可以发现使用SVR模型进行残差修正后,预测误差明显减小。

表3 ARIMA-SVR模型残差修正结果表

从预测结果来看,由于ARIMA模型本身不能全面表现生猪价格时间序列的变化规律。而与传统预测模型相比,ARIMA-SVR组合模型具有更加精准的预测精度,能够更好地运用生猪价格的历史数据,从中获取未展现的信息,优化了单一模型预测的不足之处。

3.4 ARIMA-SVR模型预测结果

基于同样的样本数据集,使用单一的利用ARIMA季节乘积模型和SVR模型对生猪价格进行12期预测,将预测结果与ARIMA-SVR模型的预测结果进行比较,选用平均绝对误差(MAE)和平均百分比误差(MPE),这2个指标评价模型的预测性能。

单个ARIMA模型、SVR模型和ARIMA-SVR组合预测模型的预测性能比较结果见表4,MAE与MPE的数值越小,预测精度越高。可以发现ARIMA-SVR模型的MAE与MPE值分别为0.950 4与0.027 6,显著小于ARIMA(2,1,3)(0,1,1)×12模型与SVR模型的对应值,说明ARIMA-SVR模型的预测精度高于ARIMA(2,1,3)(0,1,1)×12模型与SVR模型,使用建立的SVR模型修正ARIMA季节模型的预测残差序列在长期预测中可以有效减少预测误差,ARIMA-SVR组合模型能够有效地提升生猪价格预测精度。

表4 生猪价格预测性能比较

通过对比3个模型的预测性能,我们可以清晰地看出,单个ARIMA和SVR模型的拟合效果比ARIMASVR组合预测模型误差。结合ARIMA模型在求解线性问题以及SVR模型在解决非线性小样本问题上的优势,得到的预测精度有效提高,预测误差大幅度减小。

4 结论

生猪价格受市场、季节、政策等多种因素的影响,生猪价格数据序列也因此具有较为显著的季节性与非平稳性的特征,通过差分能够解决序列不平稳的问题,进而进行建模分析。实验表明,使用单一模型进行预测效果不佳,采用ARIMA季节乘积模型进行线性拟合预测,SVR模型修正ARIMA季节乘积模型的预测残差,通过2个模型的组合,发挥出各个模型的优势可以有效提升预测的准确性,最终平均预测精度可达97.24%。

生猪市场的稳定性影响着我们的日常生活,在疫情疫病的影响下,生猪价格变化趋势难以直接在经验上进行研究分析,通过建立的猪价预测模型能较为直观地观察到猪价未来走势,帮助养殖户科学合理地制定生猪养殖方案。除此之外,有关政府也需要时刻关注好生猪价格波动趋势,及时施加有效的政策手段,维护市场秩序,减少生猪价格市场的异常波动现象。生猪市场的健康发展需要养殖户合理制定养殖方案,在猪价趋势异常时也需要政府稳住舆论媒体的压力,积极进行市场调控,安抚好生猪养殖户情绪,防止波动效应扩大,只有这样我国生猪养殖业才能做大做强,健康稳定地持续发展。

猜你喜欢

差分残差线性
一类分数阶q-差分方程正解的存在性与不存在性(英文)
基于残差-注意力和LSTM的心律失常心拍分类方法研究
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
融合上下文的残差门卷积实体抽取
一个求非线性差分方程所有多项式解的算法(英)
基于深度残差网络图像分类算法研究综述①
关于非齐次线性微分方程的一个证明
非齐次线性微分方程的常数变易法
一类caputo分数阶差分方程依赖于参数的正解存在和不存在性
线性耳饰