基于支持向量机的辽宁省粮食产量预测
2019-04-17张文政孙德山王玥张蕾
张文政 孙德山 王玥 张蕾
摘 要 随着中国经济的不断发展,城市化进程不断推进,总人口逐年增加;农村人口逐年减少,粮食的需求量逐年增加,某些贫困地区已经出现粮食短缺的状况.本文选取了1986年-2016年辽宁省年粮食总产量、有效灌溉面积、农业化肥施用量、农业机械总动力、播种面积以及受灾面积等相关数据.利用支持向量机回归、线性回归,随机森林三种方法,对辽宁省粮食产量进行了预测,并比较了三种方法预测的精准度.
关键词 支持向量机;线性回归;随机森林;核函数
中图分类号 O212.4 文献标识码 A
Abstract With the continuous development of China's economy, the process of urbanization is advancing, and the total population is increasing year by year, but the population of rural areas is decreasing year after year. As time goes on ,the demand for grain has increased , and some poor areas have already appeared in the condition of grain shortage. In this paper, the total annual grain output, the effective irrigation area, the amount of agricultural fertilizer application, the total power of agricultural machinery, the sown area and the affected area of Liaoning province from 1986 to 2016 were selected. By using three methods of support vector machine regression, linear regression and random forest, the grain yield of Liaoning province was predicted, and the accuracy of the three methods was compared.
Key words support vector machine; linear regression; random forest; kernel function
1 引 言
粮食问题一直以来都是世界关注的焦点,粮食不仅关乎国计民生的问题,也关乎着社会安定以及经济能否持续发展.我国从古至今都非常重视粮食问题,一直将粮食的生产放在国民经济的首位[1].随着城市化进程不断推进,总人口不断增加,农村人口不断减少的背景下,对粮食的需求将进一步扩大.如果粮食的产量得不到提高,粮食的供给与需求的缺口便会越来越大.那么如何提高粮食产量,就必须分析影响粮食产量的因素以及粮食产量的变化趋势.
影响粮食产量的因素千丝万缕,这些因素对粮食产量作用机制又很难用数学语言来表示,这就使数学预测模型难以建立.传统的预测方法有:线性回归法、时间序列法、灰色理论法等,后来也发展出许多其他预测的方法,如神经网络法、混沌理论法等.国内外专家学者对粮食产量的研究众多,在国内的研究中,由于我国地域辽阔,气候多样,粮食品种繁多,因此我国专家学者的研究主要分为全国粮食的研究和区域粮食研究两大类[2].在全国粮食的研究中,刘杰[3]构建了一种加权的马尔科夫预测模型,与传统的马尔科夫链相比,加权的马尔科夫链方法的误差更小精度更高.陈锡康等人[4]探讨了农业复杂巨系统的特点,提出了预测全国粮食产量的系统综合因素预测法.在区域粮食研究中:周永生等人[5]利用多元线性回归方法对影响粮食产量的各种因素进行分析,构建广西粮食产量预测模型.龚波等人[6]运用灰色相对关联分析,以粮食产量作为系统特征序列数据,构建粮食产量的灰色GM(1,N)模型,对湖南省2015年粮食产量进行拟合和预测.ZHOU等人[7]以单期植被指数(VIS)和多光谱遥感(MS)和数字图像为基础,对水稻产量进行了预测,并确定了水稻产量预测的最佳时期和最优VIS.国外对于粮食产量的研究主要依据气候,然后基于气候的影响对粮食产量作出短期预测[2].然而结合辽宁省气候多变这一情况,只是基于气候很难作出精准预测,而且短期预测也很难对政府提出有效建议. 本文运用了支持向量机的方法对辽宁粮食产量进行分析,建立了辽宁粮食产量预测模型,该模型的优势在于综合考虑了辽宁省粮食产量的主要影响因素.支持向量机的拟合和泛化能力是最好的,这是因为粮食数据属于小样本数据,支持向量机基于结构风险最小,较好地解决了小样本、非线性、过拟合,维数灾难等问题.
辽宁省欲打造振兴东北重要增长极,粮食问题在全省经济社会发展中始终处于重要位置.因此提前预测辽宁省粮食产量,对有关部门及时进行粮食的调入调出和安排库存具有重要参考价值.
由表4可知,利用支持向量模型预测辽宁省玉米、稻谷、大豆的产量依然精准,故利用支持向量机分析辽宁省粮食产量问题具有一定的可行性.
4 结 论
本文在运用了支持向量机的方法对辽宁粮食产量进行分析的基础上,综合运用了线性回归,随机森林等方法,建立了辽宁粮食产量预测模型,该模型的优势在于综合考虑了辽宁省粮食产量的主要影响因素. 由表2可知,支持向量回归的相对误差均小于10%,而线性回归模型的预测精度不高,主要是不能捕捉到粮食数据的非线性特征.而相比于随机森林,支持向量机的拟合和泛化能力是最好的,这是因为粮食数据属于小样本数据,支持向量机基于结构风险最小,较好地解决了小样本、非线性、过拟合和维数灾难等问题.表明SVR在粮食产量的预测中具有一定的可行性.
参考文献
[1] 田秀芹. 基于多元线性回归的粮食产量预测[J].科技创新与应用,2017(16):3-4.
[2] 邹璀,刘秀丽.山东省粮食产量预测研究[J].系统科学与数学, 2013,33 (1) :97-109.
[3] 刘杰.基于加权马氏链的全国粮食产量预测研究[J].廊坊师范学院学报:自然科学版,2015,15 (1) :56-59.
[4] 陈锡康,杨翠红.农业复杂巨系统的特点与全国粮食产量预测研究[J].系统工程理论与实践 ,2002,22 (6) :108-112.
[5] 周永生,肖玉歡,黄润生.基于多元线性回归的广西粮食产量预测[J].南方农业学报,2011,42(9) :1165-1167.
[6] 龚波,肖国安,张四梅. 基于灰色系统理论的湖南粮食产量预测研究[J].湖南科技大学学报:社会科学版, 2012 , 15 (5) :62-65.
[7] ZHOU X, ZHENG H B, XU X Q, et al.Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery[J],ISPRS Journal of Photogrammetry& Remote Sensing, 2017 , 130 :246-255.
[8] 郑建安. 主成分和BP神经网络在粮食产量预测中的组合应用[J].计算机系统与应用, 2016,25 (11) :274-278.
[9]CORTESC,VAPNIKV.Support-vector networks[J].Machine Learning.1995.20(3): 273-297.
[10]向昌盛,周子英,武力娜.粮食产量预测的支持向量机模型研究[J].湖南农业大学学报:社会科学版, 2010 , 11 (1) :6-10.