APP下载

基于小波分解的SVM-ARIMA农产品价格预测模型

2015-02-18何玉成

统计与决策 2015年13期
关键词:大白菜小波建模

曹 霜,何玉成

(华中农业大学 经济管理学院,武汉 430070)

0 引言

农产品价格下降会增加农产品生产者的风险,而价格上涨会提高消费者的消费水平,价格稳定与否关系到国民经济与人们生活的各个方面,稳定农产品价格已经成为宏观经济调控的重要目标。由于农产品市场受到气候、突发事件以及调控政策等多种因素错综复杂地影响,其价格呈现波动大、非线性、非平稳等特征。因此,对农产品价格进行分析与预测,对农产品未来波动进行监测与预警,将为农产品价格的调整提供系统指导,对抑制农产品价格波动与控制物价水平具有重要的实践意义。

本文将采用小波分析对农产品价格时间序列进行分解,并分别采用SVM与ARIMA建立预测模型,重构农产品价格组合预测模型。

1 研究方法

1.1 小波及多分辨分析

这时,我们称φ(t)为一个基本小波或母小波,对其进行伸缩和平移操作后就可以得到一个小波序列。

1.2 支持向量机(SVM)模型

支持向量机(SVM)是由Vapnik首先提出来,是建立在VC维理论与结构风险最小原理的基础之上,将低维空间的非线性问题通过非线性映射为高维空间的线性问题。由于支持向量机具有理论完善、通用性强、鲁棒性高、计算复杂度低等优势,因此广泛地应用到农产品价格预测的研究中。

设训练数据集为{(xi,yi),i∈l},则回归模型的如公式(2)所示。

其中ϖ为权重向量,b为偏差,而φ(x)为非线性核函数。上式的目的是将非线性的输入数据以非线性的函数转换到高维特征空间中的线性形式。其对应的优化问题如公式(3)所示:

其中ξi为误差ς约束下训练绝对误差的上限,而c为惩罚参数,其目的是用来对超出误差范围的样本进行惩罚。

增高cAMP水平药物主要包括腺苷酸环化酶抑制剂和选择性血小板磷酸二酯酶抑制剂两种。腺苷酸环化酶抑制剂常见药物如贝前列腺素、伊洛前列腺素等,但因其半衰期短,稳定性差等原因,不适合应用于ACS长期治疗,因此临床上应用较少。选择性血小板磷酸二酯酶抑制剂中常见药物包括西洛他唑、双嘧达莫等。两种药物作用机制相似,均以抑制磷酸二酯酶活性,提高血小板内cAMP浓度,使血小板聚集受到抑制。其中西洛他唑可通过抑制血管内膜基质中金属蛋白酶的表达,进而抑制血管内膜的过度增生。西洛他唑常用无法耐受阿司匹林同时需进行ACS双抗治疗的患者中,替代阿司匹林抗血小板治疗[2]。

在构建SVM预测模型时,需要选取惩罚参数c和核函数g,并且这两个参数选取将直接影响模型的预测准确率。所以,本文将采用交叉验证来优化参数的选取,提高模型的预测准确率。

1.3 差分自回归移动平均(ARIMA)模型

ARMA模型是目前最常用的拟合平稳序列的模型,ARMA(p,q)其数学公式如(4)与(5)所示:

由于ARMA建模的首要条件是序列具有平稳性,因此在采用ARMA建模之前需要对序列进行平稳性检验。通常可以根据时序图与自相关图检验序列的平稳性:从时序图观察序列是否在一个常数值周围随机波动,而波动的范围有界、无明显趋势及周期性;在自相关图观察随着延迟阶数的增加,系列的自相关图是否很快地向零衰减。若序列通过了平稳性检验,则需要进行模型识别与参数评估来完成ARMA建模。若序列没有通过平稳性检验,则需要选用ARIMA来建模,即对序列进行差分操作消除其趋势性与周期性特征,得到平稳序列,然后再进行分析与建模。由于采用ARIMA建模的过程中对序列进行了差分操作,提出了其趋势性与周期性特征,会降低模型的预测精度。因此,通常是将ARIMA模型与其他模型结合使用,构成组合预测模型。

1.4 组合预测方法原理

本文建立组合预测模型的基本思路是:首先,采用小波对农产品价格序列进行分解;然后,分别采用ARIMA模型与SVM模型对小波分解序列进行建模与预测;最后,将上述小波分解序列的预测模型进行整合,形成对农产品价格的组合预测模型。具体流程图如图1所示:

图1 组合预测流程图

2 模型构建与结果分析

本文将选取大白菜作为研究对象,数据来源于国泰安数据库中的《农产品价格调查年鉴》。由于目前《农产品价格调查年鉴2013》中只有2002~2012年的数据,所以本文对大白菜2002~2011年的价格进行分析与建模,选择对其2012年的价格进行预测,以对组合预测模型的有效性进行验证。其中,2002~2011年的价格时间序列如图2所示。从图2中我们可以发现,大白菜价格不仅有上涨的趋势,还有周期性波动和随机波动的特征。

图2 2002~2011年大白菜价格曲线

2.1 小波多分辨分析

考虑到大白菜价格序列的波动性较大,故选用db3小波基函数,而分解阶数选为3,其具体流程如图3所示。

图3 小波多分辨分析流程图

本文将采用Matlab 2012a编程实现小波分解过程,其分解序列如图4所示。

图4 大白菜价格分解序列图

从图4可以看出,随着不断地往下分解,小波分解序列的细节部分越平滑,规律性越凸显,其中ca3揭示了大白菜价格的上升趋势,cd3揭示了其季节性趋势,cd2揭示了循环波动趋势,而cd1则揭示了其随机波动性。

2.2 SVM模型

考虑到分解序列ca3具有非常明显的非线性上升趋势,因此本文将采用擅长非线性分析的SVM来对其进行建模与预测。

在建模SVM模型时,采用高斯径向基(RBF)核函数,设定惩罚参数c和核函数g的取值范围都为[2-4,24],并采用K-CV(K组交叉验证法)进行参数寻优。该方法的参数寻优原理如下:将惩罚参数c和核函数g在既定范围内取值,用K-CV法计算不同c与g组合下训练集的均方根误差(MSE),并选取使得MSE最小的c与g作为最优参数。此外,本文考虑样本数据量偏小,故选取K为3。

本文基于Matlab 2012a与LIBSVM 3.12进行参数寻优与建模,其结果如图5所示。

即最优参数为c=5.67,g=0.125,而MES=0.0021593。

2.3 ARIMA模型

考虑cd3与cd2表现出周期波动,而cd1则是随机波动,故选用ARIMA模型对这三个分解序列进行建模与预测。

观察cd3分解序列图与自相关-偏相关分析图,发现cd3具有明显的季节性趋势,故选用ARIMA(p,d,q)x(P,D,Q)S模型。而观察cd1与cd2的自相关-偏相关分析图,发现具有平稳性,故选用ARMA(p,q)建模。

依据姜启源介绍的模型识别方法,我们对cd1、cd2、cd3构建的预测模型如表1所示。

图5 SVM参数寻优结果

表1 cd1、cd2、cd3的预测模型

2.4 组合预测与结果分析

前面分别对cd1、cd2、cd3以及ca3分别建立了预测模型,则对于大白菜价格的预测公式为:

为了分析和比较组合预测模型的预测效果,本文将采用平均百分误差(MAPE)与均方根误差(RMSE)来度量预测结果的精度。

其中,各个分解序列的预测结果如表2所示。

表2 大白菜价格组合预测结果

为了进一步验证组合预测模型的有效性,本文将分别采用ARIMA模型与SVM模型对大白菜价格进行预测,将其与组合预测结果进行对比分析。其具体结果如表3与表4所示。

从表4的对比结果,可以发现ARIMA模型与SVM模型的预测精度相当,并且均劣于组合预测模型。深入分析其原因,不难发现ARIMA模型与SVM模型均难以提取价格序列的全部变化趋势,而基于小波分解的SVM-ARIMA模型能够对价格序列的四个变化特征进行细致地分析,并针对性地建立预测模型,所以组合预测模型的准确性更高。

表3 三种模型预测结果

表4 三种模型预测精度

3 结论

农产品由于其产品特性,从生产、储存到出售有其特殊性,其价格也受到多方面因素错综复杂地影响,致使其价格波动呈现多种趋势的混合交错,对其预测难度较大。而传统预测方法难以充分地分析农产品价格所有变化趋势,大多数情况下都是抓住某方面的变化趋势而忽视了其他方面,导致预测结果不理想。针对这种情况,本文提出了基于小波分解的SVM-ARIMA预测模型,充分利用SVM模型与ARIMA模型对农产品价格的四种变化趋势进行分析与建模,并重构为农产品价格的组合预测模型。实例分析表明,这种建立在小波分解基础上的组合预测比传统预测模型具有更高的精度,可以作为农产品价格预测的有效工具。

[1]陈灿煌.我国农产品价格指数短期预测——基于时间序列分解的分析[J].价格理论与实践,2011,(7).

[2]陈兆荣,雷勋平,王亮.基于ARIMA—SVM组合模型的我国农产品价格预测研究[J].财经理论研究,2013,(2).

[3]平平,刘大有,杨博.组合预测模型在猪肉价格预测中的应用研究[J].计算机工程与科学,2010,32(5).

[4]李干琼,许世卫,李哲敏.农产品市场价格短期预测方法与模型研究——基于时间序列模型的预测[J].中国农业大学学报,2011,16(2).

[5]姜启源.数学实验与数学建模[J].数学的实践与认识,2001,31(5).

猜你喜欢

大白菜小波建模
基于多小波变换和奇异值分解的声发射信号降噪方法
大白菜要高产这样管理
构造Daubechies小波的一些注记
农谷三安模式 蔬菜基地大白菜喜获丰收
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
基于MATLAB的小波降噪研究
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
中晚熟大白菜新品种天白80的选育