APP下载

基于Lasso和支持向量机的粮食价格预测

2016-03-05喻胜华龚尚花

湖南大学学报(社会科学版) 2016年1期
关键词:支持向量机影响因素

喻胜华 龚尚花

摘 要 :首先利用Lasso方法在影响粮食价格波动的众多因素中选出了粮食储备、粮食生产成本、粮食产量、粮食政策、生产需求、贸易需求、心理预期等7个主要影响因素;然后在Lasso变量选择的基础上利用支持向量机进行粮食价格的回归与预测,同时,把Lasso、支持向量机、Lasso-支持向量机及ARIMA方法的拟合预测效果进行比较,实证结果表明,Lasso-支持向量机组合方法的拟合预测效果要优于另外三种方法。

关键词:粮食价格预测;影响因素;Lasso;支持向量机

中图分类号:F069

一、引言及文献综述

粮食作为一种基础产品,其价格的波动会对我国粮食生产、粮食相关产品的进出口以及国家宏观经济调控产生深远影响,关系到消费者和生产者的切身利益。深刻了解和剖析影响粮食价格波动的各种因素,在此基础上建立相关的预测模型分析和预测粮食价格的变化趋势,有助于有关职能部门调控粮食价格并制定相应的措施,从而正确引导粮食市场的健康运行、保障粮食产品的供求平衡。

目前,国内外关于粮食价格预测研究的方法主要有定性和定量两大类,在定性分析方面,朱险峰 [1]所做的系列价格预测研究比较有代表性,他通过分析库存、产量、国际市场上粮食价格的变动等一些影响因素,研究我国粮食价格的波动趋势,进而预测粮食的现货价格和期货价格。在定量分析方面,主要采用的是普通时间序列分析方法,其中最具代表性的是ARIMA方法,姚霞等[2]利用ARIMA模型并以青椒价格为例预测了时鲜农产品价格的动态变化;桂文林等[3]采用X-12-ARIMA模型分解我国粮食消费价格月度定基指数,得到了趋势循环、季节和不规则因素,进而分析了粮食价格的季节特征及其深层成因;陈兆荣等[4]利用ARIMA-SVM组合模型并结合1999-2011年我国农产品价格指数月度数据对我国农产品价格进行了预测。其他时间序列方法也有所应用,如苗开超[5]运用指数平滑模型对农产品价格进行了预测;刘家富等[6]利用向量自回归模型分析了国内大豆以及豆油市场的价格传导机制。除此之外,神经网络和支持向量机等方法也得到了不同程度的应用,如彭琳[7]利用NARX神经网络方法对云南省的农产品价格进行了预测;孙超等[8]分析了我国粮食价格波动的主要影响因素,并利用支持向量机(SVM)方法建立了我国粮食价格的预测模型。支持向量机是基于结构风险最小化原则提出来的一种统计学习方法,该方法一改传统方法的经验风险最小化原则,从而使其有更好的泛化能力,尤其是较好地解决了小样本、非线性、过拟合和局部极小等几类常见的问题。我们知道,粮食价格数据是典型的小样本数据,而且,影响粮食价格的众多因素之间也存在着不确定性和非线性的关系,所以可以采用支持向量机方法进行预测,但是影响粮食价格的因素很多,各个影响因素之间可能会存在严重的多重共线性,如果不加选择地引入众多影响因素来进行粮食价格的预测,往往不能取得良好的预测效果。一个理想的模型应该是既不遗漏重要的自变量,也不包含没有影响或影响很小的自变量,过多地引入变量不仅会大大增加计算量,也会降低估计和预测精度。

虽然支持向量机方法比较适合处理具有非线性关系的小样本数据,但是不能进行变量选择,而Lasso方法可以同时进行参数估计和变量选择,Lasso方法本质上还是线性回归方法,它不适合处理非线性问题,所以,本文提出了基于Lasso与支持向量机的粮食价格组合预测方法。首先利用Lasso方法对粮食价格波动的影响因素进行选择,剔除与粮食价格不相关或相关性很小的变量数据,以达到降低数据维数的目的;然后利用支持向量机的非线性运算能力,逼近历史数据所隐含的函数关系,完成对粮食价格的拟合和预测,同时,把Lasso、SVM、Lasso-SVM及ARIMA方法的拟合预测效果进行比较。

二、Lasso及支持向量机方法

1. Lasso方法

Lasso方法(最小绝对值压缩与选择方法)是Tibshirani.R[9]在1996年提出来的一种的有偏估计方法,其本质是通过添加约束条件对模型系数进行压缩,将没有影响或影响较小的自变量的回归系数自动压缩到零,这不仅在一定程度上能消除多重共线性的影响,而且在对参数进行估计的同时也实现了对变量的选择。

三、建模与实证分析

1. 数据来源及变量选择

根据经济学理论及已有的研究结论,我们从粮食储备、粮食生产成本、粮食产量、粮食政策、生活需求、生产需求、贸易需求、心理预期以及外部冲击等9个方面共选取了21个变量[13-16]。具体如下:用粮食类零售价格指数代表粮食价格;用粮食库存量x1、期末库存消费比x2反映粮食储备;用粮食生产价格指数x3反映粮食生产成本;用总产量x4、 粮食作物播种面积x5、成灾面积x6反映粮食产量;用农业支出x7、农业支出占财政支出的比重x8反映粮食政策;用城镇居民人均可支配收入x9、农村居民家庭人均纯收入x10、城镇居民人均粮食消费x11、农村居民人均粮食消费x12反映生活需求;用农业生产资料价格指数x13、国内生产总值指数x14、世界能源价格指数x15反映生产需求;用粮食净进口x16、人民币对美元汇率x17反映贸易需求;用上一期真实粮价增长率x18、货币和准货币(M2)供应量x19反映心理预期;用同期通货膨胀率x20、世界谷物价格指数x21反映外部冲击。

本文选取的数据区间是1978-2013年,粮食库存量、期末库存消费比数据根据美国农业部信息网数据计算得出;粮食生产成本数据来自《全国农产品成本收益汇编》;世界谷物价格指数、世界能源价格指数数据来自世界银行数据库;农业支出、农业支出占财政支出的比重、城镇居民人均粮食消费、农村居民人均粮食消费数据来自中国农村统计年鉴;其他数据均来自《中国统计年鉴》。

2. 基于Lasso回归的变量选择

首先把数据进行中心标准化处理,以消除不同指标量纲的影响,接下来运用lasso方法对选取的21个指标进行参数估计与变量选择,只需要29步,就可以得到全部的lasso解。从图1可以看出,当参数s很小时,变量均未被选入模型中,随着s的不断增大,变量依次进入模型,当s=1时,变量全部进入模型。

猜你喜欢

支持向量机影响因素
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
突发事件下应急物资保障能力影响因素研究
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究
基于支持向量机的金融数据分析研究
基于系统论的煤层瓦斯压力测定影响因素分析