基于SMOreg的早稻最低收购价预测模型
2018-01-11何红霞谢申汝杨玉洁王康宁钱彬彬杨宝华
何红霞,谢申汝,杨玉洁,王康宁,钱彬彬,杨宝华
(1.安徽农业大学 信息与计算机学院,安徽 合肥 230036;2.农业部农业物联网技术集成与应用重点实验室,安徽 合肥 230036;3.安徽农业大学 经济管理学院,安徽 合肥 230036)
基于SMOreg的早稻最低收购价预测模型
何红霞1,2,谢申汝1,2,杨玉洁3,王康宁1,2,钱彬彬1,2,杨宝华1,2
(1.安徽农业大学 信息与计算机学院,安徽 合肥 230036;2.农业部农业物联网技术集成与应用重点实验室,安徽 合肥 230036;3.安徽农业大学 经济管理学院,安徽 合肥 230036)
构建基于SMOreg的早稻最低收购价预测模型,对全国2006年~2016年的早稻最低收购价格进行预测。结果表明:SMOreg模型对早稻最低收购价格的预测结果稳定,预测精度高,其平均绝对误差达到6.676 1。所以,SMOreg模型能够很好地对早稻最低收购价进行预测,且预测精度和可信性高。
最低收购价;早稻;SMOreg;预测模型
粮食的价格对于农民的粮食生产起着非常重要的作用,对我国的粮食安全和国家的和谐发展有着重要意义。因此有必要对粮食最低收购价的波动情况进行研究。我国粮食最低收购价主要受粮食需求量、人口总数等影响因素的影响,具有一定的非线性。支持向量机序列最小优化算法(Sequential Minimal Optimization,SMO)一直以来是刻画和描述非线性现象的有效工具[1],而SMOreg(Sequential Minimal Optimization with regOptimzer)作为一种改进的SMO算法可用于预测模型的建立。目前许多学者对粮食保护政策体制进行了分析研究,认为粮食最低收购价制度对粮食发展具有积极促进作用[2-4];近几年许多学者针对国内粮食最低收购价的波动情况进行了研究,指出了影响粮食最低收购价波动的因素[5-8]。从研究方法上来看,对粮食最低收购价格预测的研究主要采用的是在经验数据基础上的定性分析,没有确切地计算粮食最低收购价格与各个影响因子间的定量分析,所以本文以早稻最低收购价为例,建立早稻最低收购价格预测模型,进行定量分析,研究各个影响因数对粮食最低收购价格影响效果,为政府有关部门制定决策粮食收购价格的相关工作提供一定参考依据。
1 材料和方法
1.1 数据源及处理
本文从《中国统计年鉴2015》和世界粮农组织数据库收集了总人口数、人口增长率等影响粮食价格的因素在2005-2015年的相关数据,从中华人民共和国国家统计局的数据库中收集整理了2005-2015年的粮食产量、粮食需求量等影响最低收购价格的相关因子数据和2006-2016年的最低收购价格数据。根据所收集到的相关数据,经过整理组合得到了2005-2015年粮食收购价格各影响因子的指标值。并对数据集进行简单的统计分析,结果如表1所示。
表1 各属性的平均值、标准差统计
续表
属 性平均值标准差政府收购贸易粮数量52.29743.892政府销售贸易粮数量62.45949.347财政支出94523.82145593.511早稻播种面积5805.57693.327人口总数134.1022.206农村居民家庭纯收入6474.8092590.243农村居民家庭恩格尔系数40.8552.781早稻最低收购价105.18226.739
1.2 SMOreg原理
SMOreg算法[9]是基于顺序最小优化算法为解决回归问题而提出的,其原理是通过设置回归的优化程序对不同的SMO改进算法进行选择,实现支持向量机解决回归问题。SMOreg通过在与对偶问题相关的优化准则中获得线索,使用两个阂值参数,从而解决了普通SMO算法因包含一个单一阂值所引起的混乱与低效率的问题。
SMOreg算法的基本思路[10]为:
(1)当数据集{xi,yi}不能实现线性回归时,回归函数f(x)表达式为:
f(x)=w*φ(x)+b。
(1)
式中:w为权向量,b为阀值,φ(x)是样本x到高维特征空间的一个非线性映射。
(2)为了提高其回归效率,引入了松弛变量,通过将ε不敏感损失函数加入到式(1)的约束优化问题中,可得到
。
(2)
(3)
再将对偶问题转化为二次规划的问题,从而建立拉格朗日方程式:
(4)
(3)用两个阀值参数b_up和b_low来代替原问题中的阀值b。
。
(5)
那么,KKT优化条件可以被等价地表示为
b_low≤b_up。
(6)
(7)
式中:K(xi,x)为SMOreg算法的核函数,本文选择的是径向基核函数(PolyKernel)
k(xi,xj)=(αxiTxj+c)p。
(8)
1.3 预测模型的建立
预测模型输入数据为预测因子数据集,即前文所述的10个早稻最低收购价影响因数,输出数据为早稻最低收购价。本研究应用SMOreg模型预测早稻最低收购价,SMOreg预测模型建立的步骤如下:
步骤1:归一化数据。采用min-max的标准化方法(离差标准化方法)对实验的所有数据集进行相应的归一化处理,将所有数据映射到[0,1]之间。转换函数如下:
(9)
式中:max为属性数据中的最大值,min为属性数据中的最小值。
步骤2:确定其核函数,核函数选择的是径向基函数。径向基函数:
图1 SMOreg模型构建流程图
(10)
步骤3:用Gridsearch寻找最优参数c和p。
网格搜索法其基本原理是让c和p在一定的范围内划分成网格,并网格内的所有点进行遍历取值,对于取得的c和p组合,利用交叉验证法得到在此(c,p)组合下训练集交叉验证预测准确率,最终取使得交叉验证准确率最高的那组(c,p)作为最佳的模型参数。
步骤4:用最优模型参数(c,p)对训练集进行训练建模。
步骤5:用测试集对所建模型进行评估。
SMOreg算法预测模型构建的具体流程图如图1所示。
2 预测结果与分析
2.1 各影响因素的相关性分析
使用SPSS软件对表1中的实验数据进行相关性分析,结果如表2所示。
表2 各影响因素的相关系数
续表
粮食产量粮食需求量政府收购贸易粮数量政府销售贸易粮数量财政支出早稻播种面积人口总数农村居民家庭人均纯收入农村居民家庭恩格尔系数早稻最低收购价政府销售贸易粮数量-0.2510.2420.971**1.000-0.2090.464-0.275-0.2200.235-0.144财政支出0.559-0.992-0.360-0.2091.000-0.5110.9950.993-0.9690.981早稻播种面积-0.0310.5840.5830.464-0.5111.000-0.571-0.5080.487-0.521人口总数0.522-0.992-0.423-0.2750.995-0.5711.0000.989-0.9710.968农村居民家庭人均纯收入0.558-0.992-0.356-0.2200.993-0.5080.9891.000-0.9600.957农村居民家庭恩格尔系数-0.5790.9490.3680.235-0.9690.487-0.971-0.9601.000-0.935早稻最低收购价0.551-0.972-0.317-0.1440.981-0.5210.9680.957-0.9351.000
从表2的分析结果可以看出,早稻的最低收购价格与粮食需求量、政府的财政支出、人口总数、农村居民家庭的人均纯收入、农村居民家庭的恩格尔系均具有很强的相关性;与粮食产量、政府收购的贸易粮数量、政府销售的贸易粮数量、早稻的种植面积的相关性相对很低,但仍具有较强的相关性;因为我国一般通过政府收购或销售贸易粮的方法来改变国家粮食的库存量,从而对粮食的价格进行调控,所以本研究依然保留了这些因素变量。
图2 预测值和实测值的对比曲线
2.2预测模型结果
根据所构建的SMOreg预测模型,得到最低收购价预测结果,并与相应的实测值进行对比分析。SMOreg模型所得预测值与实测值的对比曲线如图2所示。由图2可以看出,SMOreg预测模型对实测值的拟合度较好,能可靠、准确地对最低收购价格进行预测。
为了进一步说明该预测模型在研究早稻最低收购价浓预测中的精度,本研究分别计算了该模型的预测值与实测值的相关系数(CC,[0,1])、平均绝对误差(MAE)、均方根误差(RMSE)共3个指标,其具体结果如表3所示。
表3 模型预测效果
由表3实验结果可知,根据模型评价指标的相关系数(CC)值来看,SMOreg模型的预测值和实测值间的CC值达到0.9以上,这说明了使用该模型对最低收购价进行预测是合理有效的;根据模型评价指标的平均绝对误差(MAE)值来看,SMOreg模型的MAE的值很小,为6.676 1,且其均方根误差(RMSE)的值为10.495 2。所以综合考虑模型的各个评价指标值,可知SMOreg模型预测精度高,预测效果好,该模型具有良好的可靠性,能够较为准确地对未来一段时间的早稻最低收购价进行预测,为早稻最低收购价的制定提供依据。
2.3 最低收购价定价合理性分析
根据所建的两个模型可算出2015年早稻的最低收购价为135.93元/kg。实际上,2015年中国政府所公布的早稻的最低收购价格为135元/kg,按照本文所提出的模型预测方法计算得到的早稻最低收购价格与政府规定的价格标准相当。从现在的国内早稻市场来看,2014年政府在早稻主产区所实施的最低收购价政策极大地调动了当地农民种植早稻作物的积极性,当年的供需形势已由产量不足以供应市场需求转为产量供需有余,全国的早稻单位面积产量已由2014年的5 871.2 kg/hm2增至2015年的5 894.8 kg/hm2,增产数量巨大,导致年末稻谷库存水平大幅提高。因此,2015年政府并未再次提高早稻的最低收购价格,而继续保持在2014年的价格水平是正确得当的,同时也说明了使用本研究所提出的模型预测方法计算出来的早稻最低收购价也是相对较为合理的。
3 结 语
(1)本研究利用从《中国统计年鉴2015》、世界粮农组织的数据库和国家统计局收集到的2005-2015年的总人口数、人口增长率等影响粮食价格的相关因子数据,构建了基于SMOreg的早稻最低收购价格预测模型,实验得出该模型能够很好地对最低收购价与其影响因子间的非线性关系进行描述,并依据该模型可以得到较高的预测精度。因此,将SMOreg预测模型应用于早稻最低收购价的预测是简单可行并且有效的。
(2)本文研究构建的基于SMOreg预测模型能够对早稻最低收购价进行很好地预测,是否可将该模型运用于小麦、玉米等其他粮食作物最低收购价建模,可做进一步研究分析。
(3)本研究主要分析粮食产量、粮食需求量等因素对最低收购价的影响,在模型中尚未考虑到粮食市场收购价等以外的其他因素对早稻最低收购价的影响。希望在以后的研究工作中加入其他影响因素来进一步构建预测模型,提高模型预测的精度。
[1] 朱齐丹,张智,邢卓异.支持向量机改进序列最小优化学习算法[J].哈尔滨工程大学学报,2007(02):183-188.
[2] 许丹.刍议粮食保护价收购政策[J].企业经济,2002(04):52-54.
[3] 童珂.改革和完善粮食保护价政策的探讨[J].粮食问题研究,2002(03):16-19.
[4] 许斌.中国粮食保护价政策内容核心及其评价[J].财经理论与实践,2003(02):101-107.
[5] 王淑艳.我国粮食价格波动因素分析与预测研究[D].哈尔滨:东北农业大学,2013:40-45.
[6] 韩永奇.浅析影响粮食价格的七大因素[J].市场经济与价格,2011(07):10-14.
[7] 龚芳.全球化背景下中国粮食价格的波动机理和预警机制研究[D].上海:复旦大学,2012:56-58.
[8] 孙超,孟军.中国粮食价格的影响因素分析与预测比较——基于支持向量机的实证研究[J].农业经济,2011(01):29-31.
[9] 谭励,王璐,于重重.地源热泵系统中非线性时序预测的应用研究[J].计算机工程与设计,2012(05):2042-2047+2101.
[10] 吴佳,蔡之华,高哲超.改进的KNN-SMOreg算法及在铀矿床典型蚀变矿物赤铁矿含量预测中的应用[J].应用基础与工程科学学报,2011(05):842-851.
Prediction Model of Early Rice Minimum Purchase Prices Based on SMOreg
HE Hongxia1,2, XIE Shenru1,2, WANG Kangning1,2, YANG Yujie3, QIAN Binbin1,2, YANG Baohua1,2
(1.Anhui University of Agriculture, Hefei 230000, China; 2.Ministry of Agriculture, Hefei 230000, China; 3.Anhui University of Agriculture, Hefei 230000, China)
In this paper, the prediction model of the early rice minimum purchase prices through SMOreg was created, and also the early rice purchase Prices in 2006-2016 are predicted. Results of the analysis showed that the prediction on early rice minimum purchase price based on SMOreg model is stable and accurate; the average absolute error is 6.6761. Therefore, SMOreg model can perfectly forecast early rice minimum purchase price, and the prediction has a high level of accuracy and credibility.
the minimum purchase price; early rice; SMOreg; prediction model
10.3969/j.issn.1674-5403.2017.04.013
TP39;X823
A
1674-5403(2017)04-0055-05
2017-06-30
何红霞(1992-),女,四川巴中人,在读硕士研究生,主要从事数字农业方面的研究.
国家重点研发计划项目(2016YFD0300608).