基于主成分分析法的湖北省粮食自给率预测分析
2018-01-09江天河
江天河
摘要:借助Matlab 2017a软件,分析1995-2015年湖北省粮食安全相关数据,使用主成分分析法得出该省粮食自给率的主要影响变量,运用灰色预测模型,对粮食自给率及其主要影响变量分别进行预测,再通过人工神经网络模型进行验证,最终拟合两种模型的曲线进行对比。根据未来15年粮食自给率的稳步上升趋势,为湖北省粮食安全工作提出相应的建议。
关键词:粮食自给率;主成分分析;灰色预测模型;人工神经网络模型;湖北省
中图分类号:F762.1 文献标识码:A 文章编号:0439-8114(2017)23-4676-05
DOI:10.14088/j.cnki.issn0439-8114.2017.23.063
Abstract: Food safety related data of Hubei Province 1995-2015, was analyzed to provide suggestions. Crediting to Matlab 2017a,principal component analysiswas used to confirm significant factors with huge impact on self-sufficiency rate. Then Grey model was used to forecast on both significant factors and self-sufficiency rate. Verifying results with Artificial neural network (ANN) model was the last step. To compare the curves of two models, conclusion showed in 15 years food self-sufficiency rate in Hubei Province was in steady growth status and references were offered to support food safety in Hubei Province.
Key words: food self-sufficiency; principal component analysis; grey prediction model; artificial neural network; Hubei province
中国是世界粮食消费大国,粮食的供给不仅影响到各行各业的生产活动,也与国家规划发展及战略物资储备紧密相关。在国际市场粮食供给偏紧形势下,国内粮食自给问题得到多方关注。随着中国工业化、城镇化脚步加快,经济、社会飞速发展,国内粮食需求刚性增长,而耕地资源少,土地、淡水遭受污染加剧,粗放的粮食经营方式仍未改变,农业基础设施落后、农资价格上涨、粮食生产的低收益导致种粮积极性下降,对中国粮食安全造成了威胁,全国粮食自给率已从1995年的98%降低为2015年的85%。湖北省是中国粮食生产大省,省内设有全国性商品粮基地。湖北省的粮食除了省内供给外,还承担着向周边粮食产量不足的省份,如福建、广东省输送粮食的责任,其粮食自给率必须得到保障。
本研究选取湖北省1995-2015年统计年鉴中的数据,分析最近年来湖北省粮食自给率,并对未来15年粮食自给率进行预测,为解决湖北省粮食安全问题的工作提供帮助和参考。
1 研究方法与模型选择
1.1 研究方法
本研究结合湖北省实际并参考以往的权威机构建议和有关学术成果,设定该省人均粮食需求量,通过历史数据计算得到1995-2015年湖北省自给率情况。然后以人口、耕地面积、粮食单产、粮食播种面积等作为相关变量,进行主成分分析,得到主要影响变量,并代入灰色系统GM(1,1)模型,对未来15年的糧食自给率进行预测。同时,将主要影响变量输入神经网络模型,训练后输出得到此模型下的预测结果。通过两种预测模型得到的自给率进行检验印证,确定预测准确度,最后据此提出建议。
1.2 模型与原理
1.2.1 主成分分析法(PCA) 主成分分析法(PCA)是一种数学变换,将已给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大方差,称为第一主成分,第二变量的方差次之,并且和第一变量不相关,称为第二主成分。以此类推,每个变量都有1个主成分。将收集到的标准化数据求相关系数矩阵,进行正交变换后,使非对角线上的数置0,加到主对角上;得到特征根xi(即相应那个主成分引起变异的方差),并按照从大到小的顺序讲特征根排列;求各个特征根对应的特征向量;用Vi=xi/(x1+x2+……)公式计算每个特征根的贡献率Vi;根据特征根及其特征向量解释主成分的意义。本研究采用主成分分析实际上是多个相关变量的降维,以寻求主要影响变量。
1.2.2 灰色系统GM(1,1)模型 灰色系统预测模型(Grey models)简称GM模型,是以微分方程为表达形式,将少量且不完全的随机数依次累加,得到随机性削弱的生成数,以此作出模糊性的长期规律描述。其中GM(1,1)模型括号中的1∶1表示该微分方程模型为一阶单变量。GM(1,1)的表达式如下:
x(0)(k)+ay(1)(k)=b (1)
其基本原理:
1)设x(0)是非负序列x(0)=(x(0)(1),x(0)(2),…x(0)(n)),式中x(0)>=0,k=1,2,…n
x(1)(k)=■x(0)(i),k=1,2,…n (2)
2)x(1)为x(0)的一次累加生成AGO序列,GM(1,1)是x(1)的紧邻均值生成序列:y(0)=(y(1)(2),y(1)(3),…y(1)(n)),式中y(1)(k)=0.5x(1)(k-1),k=2,3,…n。以这两个生成序列的数据作为时间灰色模型的基础。endprint
假设a=(a,b)t是参数,并且
B=-y(1)(2) 1-y(1)(3) 1… …-y(1)(n) 1Y=-x(0)(2) -x(0)(3)… -x(0)(n) 。
微分方程x(0)(k)+ay(1)(k)=b的最小二乘估计参数则一定满足a=(B1B-1)BTY。
3)故GM(1,1)微分方程x(0)(k)+ay(1)(k)=b的时间相应序列:
x(k+1)=[x(0)(1-b/a)]esp(-ak)+(b/a);k=1,2,...n(3)
x(1)(0)=x(0)(1)
还原值:x(0)(k+1)=x(1)(k+1)-x(1)(k);k=1,2,...n(4)
1.2.3 人工神经网络模型 人工神经网络是通过模仿动物神经网络,进行分布式并行信息处理的数学模型,被广泛运用于函数逼近、数据聚类、优化计算、模式识别及预测等工作中。
人工神经网络模型由三大基本要素构成,分别是处理单元、网络拓扑结构及训练规则。①处理单元。主要用来模拟人脑神经元的功能,每个处理单元具备多个输入和输出路径。输入端起信息传递的作用;输出端将处理后的信息从一个处理单元传给下一个。②网络拓扑结构。这一结构决定了各处理单元、各层之间信息的传递方式与途径。③训练。即在反复训练中不断做出调整,直到符合一定的精确度。这主要是利用转换函数对处理数据进行加权与求和,并训练网络系统进行模式识别,处理所得的加权和,再通过转移函数得到输出值。最后,分类结果是将获取最大权重的类别指定为输入数据的归属类别。与动物神经内在机理相似之处在于,神经网络完成任务的过程也可以分为两个阶段:先是学习期,神经网络自我完善,按一定的学习规则修改突触的权系数,以使测度函数达到最小,这一时期各计算单元状态保持不变, 各连线上的权值可以通过学习训练来修改;到了执行期,神经网络可以对输入信息进行处理并产生对应的输出过程,此时各连接权固定, 计算单元状态发生变化,已达到训练后的稳定状态,可以实现预测功能。
2 定量研究过程
2.1 初步分析
粮食自给率指某一区域内一年粮食总生产量占总需求量的百分比。本研究国家食物与营养咨询委员会提出的基本小康社会(2010年)、全面小康社会(2020年)食物安全标准分别为410 kg/人/年,2020年为430 kg/人/年。湖北省GDP总量在全国排名第九,且其GDP增速在前十名省份中最快。本研究将1995-2005年的人均粮食需求量设定为410 kg/人/年,2005-2015年为430 kg/人/年。由此计算得到粮食总需求量,从而计算粮食自给率。1995-1999年湖北省粮食自给率均大于1,粮食供给充足;2003年自给率达到最低值,这与该年全国粮食总产量位于最低谷相符;2004-2006年,是农村土地政策及种粮优惠政策的颁布与施行的头三年,粮食自给率出现了一段时间的波动,2007年后粮食自给率稳步回升(表1)。
2.2 主成分分析
选择表1中除年份、粮食自给率外的其他7个变量,外加设定的人均粮食需求量及计算出的粮食总需求量共9个变量,进行PCA转换后得到9个特征向量。从表2可知,前4位的特征向量可以解释全部数据信息的99%,满足降维所需达到的精准率要求,故将全部9个变量在这4个特征向量上投影,形成九维到四维的转化,得到4个成分Y1、Y2、Y3、Y4,结果见表3。
从表3可以看出,城镇人口、乡村人口、总播种面积、粮食播种面积以及粮食总产量5个变量部分四维空间投影系数绝对值>0.5,表示对粮食自给率影响程度较高。这5个变量中,城镇人口和乡村人口在特征向量①上系数系数较大,且呈负相关。这是由于城镇人口对于粮食起到消费作用,而乡村人口起生产作用,以往同类别研究中大多直接计算城乡总人口缺乏严谨性,应对两者做单独分析。湖北省总播种面积、粮食播种面积最终体现为该省粮食产量的多少,可以将其归为粮食总产量这一变量。因此,通过降维可以得到城镇人口、乡村人口和粮食总产量这3个主要影响变量,用来预测湖北省未来粮食自给率的情况。
2.3 灰色模型预测
灰色模型对3个主要影响变量预测结果如表4所示。由预测结果(表4)可知,湖北省未来乡村人口总数总体呈下降趋势,而城镇人口呈上升趋势。未来15年间,乡村人口将减少约692.4万人,下降约28.2%,城镇人口增加约1 748.3万人,增长约51.2%。城市化率将从目前的58.1%上升至74.5%。未来15年全省总人口增长约1 055.9万人,人口年增长率r为1.10%(Nt=N0ert公式计算),15年间人口预计增长约18.0%,平均每年实际人口增长1.01%。粮食总产量增长约37.1%,产量平均每年增长约1.02%。粮食产量增长率快于人口增长率,粮食供给问题呈改善趋势。运用Matlab将GM(1,1)模型预测值与过去20年历史数据拟合城乡人口变化,结果如图1、图2、图3所示。
从1995-2030年,乡村人口下降开始较快,之后速率减缓。在农业现代化水平不断提高的情况下,有足够的农业人口维持粮食生产活动。而城市化速率从1995年以来不断加快,這也与国家政策力度以及城市化自有的加速度效应有关。粮食产量自2003年达到低谷后也呈逐年上升趋势,故拟合曲线选取2003年以后的数据,结果显示粮食总产量上升速率变化较平缓,总体属于稳步上升。
2.4 人工神经网络模型检验
人工神经网络模型的计算过程是首先将上述的3个主要影响变量输入模型,经过第一层Hidden内具有25个神经元转化,传输进入第二层Output内1个神经元,最后输出得到预测结果。如图4所示,神经网络流程由Matlab自动生成。
本研究利用人工神经网络模型主要是进行复测和检验。如图5所示,4组训练过程成果良好迭代过程错误率在2~3个阶段(Epoch)后下降明显,并在之后10个阶段保持稳定且较低值。错误直方图(图6)显示,25个数据点上的误差,其中0误差的数据点最多,且大多数分布在0误差线附近,证明本数据代入模型检验较为准确。综上所述,神经模型检验结果具有较高可信度。endprint
综上可知,神经网络可以用来和GM(1,1)模型做出的预测值进行对比验证。2种模型得到预测结果,再对数据进行拟合,两种模型的拟合曲线(图8)重合度较好,因此可以判定对于2016-2030年湖北省粮食自给率的预测结果可信度较高。
3 结论与建议
由模型预测结果可知,除了因人均粮食需求量设定环节存在一次骤增,对数据的平稳性尤其是2005年前后的数值带来影响外,其余预测值均较稳定、可信。随着湖北省“两圈两带一群”发展规划的进行,未来15年湖北人民生活水平将不断提高,营养需求持续增大,故实际人均粮食需求量很可能高于2010年之前国家提出的标准,为防止数據在预测阶段再次发生波动,本研究设定的粮食需求量初始值较高。虽然预测显示2016-2030年湖北省粮食自给率呈稳步上升态势,但随着全面二孩政策的放开,以及湖北省临近的粮食短缺省份进一步工业化、城镇化发展,粮食大省的生产和供给责任依然不会减轻,提出以下几点建议:
1)城乡人口协调发展。从数据分析中不难看出,人口数量与粮食自给率密切相关,首先应当稳定全面二孩政策后的人口增长规模。此外,人口转型即乡村人口转为城市人口,推动了城市化速率,但也存在农业劳动力缺失的隐患。需做好城乡统筹工作,重视乡村经济的发展,保证农业从业人员数量,将农村土地的政策法规宣传到村,用惠农政策和实际利益来提高农民的种粮积极性,从而保障湖北省的粮食自给。
2)保证粮食耕种面积。根据《基本农田保护条例》,在湖北省未来发展中,要做到基本农田面积不减少,用途不改变,质量不下降,并根据湖北省的实际情况,建设完善粮食生产的支持机制,耕地面积不减少的同时提高粮食单产。
3)合理调控进出口规模。从两种模型的分析结果可以看出,2023年之前,应合理规划粮食进出口以保证本省和临省粮食的供给。在新的时代背景下,除与传统粮食进出口国家保持合作外,还要加快与“一带一路”沿线国家粮食贸易合作的步伐。到2023年后,湖北省粮食自给率预计将高于1.2,届时可以适当扩大出口规模。
参考文献:
[1] 鲍文杰,刘易科,朱展望,等.湖北省粮食生产现状分析与发展对策[J].湖北农业科学,2012(24):5549-5552.
[2] 张利娅.中国粮食自给率研究[D].杭州:浙江大学,2006.
[3] 任雅婷,曹生国,刘 栋.灰色预测模型在山东省粮食自给率预测上的应用[J].江西农业学报,2017(2):119-123.
[4] 刘正伟.基于耕地压力指数的湖北省粮食安全研究[D].武汉:华中师范大学,2009.
[5] 郑建安.主成分和BP神经网络在粮食产量预测中的组合应用[J].计算机系统应用,2016,25(11):274-278.
[6] 旷 岭.RBF神经网络的粮食产量预测[J].计算机仿真,2011(11):189-191,200.
[7] 邓聚龙.灰色系统理论[M].武汉:华中科技大学出版社,2005.
[8] 苏 博,刘 鲁,杨方廷.GM(1,N)灰色系统与BP神经网络方法的粮食产量预测比较研究[J].中国农业大学学报,2006(4):99-104.
[9] 林 芳.灰色神经网络在粮食产量预测中的应用[J].计算机仿真,2012(4):225-228,267.endprint