基于新疆粮食产量的灰色关联分析及其BP模型预测
2022-05-30刘昭雪杨莉莉支金虎
刘昭雪 杨莉莉 支金虎
摘要:为明确影响新疆粮食产量的主要因素及预测未来变化,采用灰色关联法和BP神经网络预测模型,对2000—2019年影响新疆粮食产量的9个关联指标进行分析。结果表明,粮食作物播种面积、劳动力数量和有效灌溉面积是影响新疆粮食产量的主要因素,其关联度均高于0.91。从新疆的实际情况和关联度分析出发,确定影响粮食产量的6个重要因素是粮食作物播种面积、就业人数、有效灌溉面积、农业机械总动力、化肥施用量和新疆人口数量。利用matlab2015b软件构建BP神经网络模型,预测2020年新疆粮食产量为1 542.7万t,预测值与当年的实际粮食产量相差不大,说明BP神经网络模型对粮食产量的预测具有很好的匹配性。
关键词:粮食产量;关联度;BP神经网络模型;影响因素;新疆
中图分类号:S11 文獻标志码:A 文章编号:1001-1463(2022)09-0080-06
doi:10.3969/j.issn.1001-1463.2022.09.019
Study on the Grain Yield in Xinjiang Using Grey Correlation Analysis and BP Model Prediction
LIU Zhaoxue 1, 2, 3, YANG Lili 1, 2, 3, ZHI Jinhu 1, 2, 3
(1. College of Agonomy, Tarim University, Alar Xinjiang 843300, China; 2. Collaborative Innovation Centre of Eco-agriculture Around Tarim Basin, Alar Xinjiang 843300, China; 3. The Research Centre of Oasis Agriculurces and Environment in Sourthern Xinjiang, Tarim University, Alar Xinjiang 843300, China)
Abstract: To determine factors affecting the grain yiled in Xinjiang and to predict its potential changes in future, the BP neural network prediction model and grey correlation method were used in this study to analyze nine ralated indices from 2000 to 2019 on grain yield in Xinjiang. The results showed that sown area of grain crops, agricultural labor quantity and the effective irrigated area were the main factors affecting the grain yield in Xinjiang, their correlation factors were all higher than 0.91. Based on the actual situation and correlation degree analysis of Xinjiang grain production, six important factors affecting grain yield were determined i.e., sown area of grain crops, agricultural labor quantity, effective irrigated area, total power of agricultural machinery, fertilizer application and population of Xinjiang. Matlab 2015b software was used to build BP neural network model which predicted that the grain output in 2020 for Xinjiang was 15.427 million tons, the predicted value was not much different from the actual grain output of that year, which showed that the BP neural network model had a very good prediction over grain output.
Key words: Grain yield; Correlation degree; BP neural network model; Affecting factor; Xinjiang
粮食是国家的立根之本,尤其对于发展中国家来说,保证粮食产量充足是社会发展的物质基础[1 ]。虽然我国的粮食总产量在不断增加,但仍然存在区域性短缺和局部粮食不安全问题[2 ]。从我国粮食产量的未来发展趋势出发,粮食安全问题不容乐观,农业在国民经济生产总值中仍处于落后地位。粮食产量的波动和粮食安全问题密切联系,对粮食产量波动现状、周期、影响因素和原因等进行研究,有利于稳定粮食生产,保证我国粮食安全[3 ]。粮食生产作为经济和自然再生产的复杂统一体,其生产过程受很多因素的影响并且关系错综复杂。安晓宁[4 ]认为影响粮食产量的关键要素是劳动力,制约粮食生产的重要因素是土地面积,另外农机电、农田水利设施的建设和化肥的使用直接关系到粮食产量的提高;郭淑敏等[5 ]通过关联系数的计算指出,影响粮食产量的主要因素有科技水平、农业现代化水平、耕地状况、有效灌溉面积;王双进等[6 ]从物质投入、资源环境和政策因素3个角度研究,选择了8个指标作为影响粮食产量的因素;张素文等[7 ]采用传统的多元回归模型和灰色关联分析两种方法,分析了湖南近50年来粮食播种面积、粮食产量的总体变化趋势,预测了湖南省2010年的粮食总产量。郭庆春等[8 ]通过BP神经网络模型对我国粮食产量进行预测,并建立了粮食产量的神经网络预测模型;伍丹华等[9 ]从影响粮食产量的因素出发,利用BP模型预测江苏省东台市2009 — 2018年的粮食产量,其模型取得了较好的预测结果。
已有文献通常采用面板数据或长时间的序列数据,采用一元线性回归[10 ]、多元回归[11 ]、地理加权回归[12 ]、C-D函数[12 - 13 ]、灰色关联分析[14 ]、主成分分析[15 ]、BP神经网络[16 ]等建立模型,将特定区域作为整体进行主导因子研究。每种方法有各自的适用条件,从而在不同方面解释粮食产量变化和影响因素之间的关系。其中BP神经网络模型是应用最广泛的预测模型,它拟合了复杂的非线性系统问题,弥补了传统预测和估算方法的缺陷,具有较好的预测特性。新疆作为我国面积最大的地区,潜在农业耕地资源丰富,粮食安全和产量保障尤为重要。我们基于已有研究成果,运用灰色关联法对新疆粮食产量的影响因素进行研究,并通过BP神经网络模型对新疆2020年粮食产量进行预测,以期为我国粮食安全预警提供参考。
1 材料与方法
1.1 研究区概況
新疆地处亚欧大陆腹地,具有连接东西的优越地理位置,是我国古代丝绸之路的重要通道[17 ],现为第二座“欧亚大陆桥”的重要走廊[18 ],新丝绸之路经济带核心区[19 ]。地处东经73° 40′~96° 18′,北纬34° 25′~48° 10′,居东半球和北半球中纬度地区,地理位置构成了“三山夹两盆”的独特地貌[20 ],总面积约166万km2,占中国国土面积的1/6[21 ]。新疆受气候、地理位置的影响,降水稀少,其降水量远低于蒸发量[22 ],是中亚地区典型的干旱半干旱区,淡水资源严重匮乏[17 ]。其南北跨度大,农业地域差异明显,土地资源丰富,是我国重要的粮食产区之一。
1.2 数据及其来源
研究对象为新疆2000 — 2019年的粮食产量及其影响粮食产量的3个方面(自然因素、经济因素和科技因素)的9个因子,数据来自《中国统计年鉴》(2000 — 2019年)[23 ]、 《新疆统计年鉴》(2000 — 2019年)[24 ],见表1。
1.3 指标体系的修正
为了使影响因素更加可靠,首先利用 SPSS 软件对新疆粮食产量及其影响因子进行Pearson回 归[25 ],然后根据显著性强弱剔除相关性弱的因子,最后选取影响粮食产量的关键变量。关于粮食产量的相关分析结果见表2。由表2的相关性分析结果可知,9个因子均与粮食产量呈现显著的相关性。
1.4 灰色关联法[1 ]
1.4.1 确定分析数列 选取新疆的粮食产量作为参考序列,9个影响因子作为比较序列。则构造参考序列:y0={y0(t),t=1,2,…,n}={y0(1),y0(2),…,y0(n)},式中,t表示不同时刻,构造比较序列{xt(t),t=1,2,…,n}={xi(1),xi(2),…,xi(n)}t=1,2,…,k。
1.4.2 变量的无量纲化 原始数据的单位不统一,无法直接进行比较,必须对其进行无量纲化,提高模型的精度,标准化公式如下。
X′i(k)=,Xi(1)≠0
1.4.3 关联系数的计算 关联系数是指解释变量和被解释变量之间的相关度系数[1 ],新疆粮食产量和各影响因素之间的关联系数计算公式如下。
ξi (k)=式中,y(k)-xi(k)与y(k)-xi(k)分别表示最大和最小二级差,ρ代表分辨系数,一般取 ρ=0.5。
1.4.4 关联度的计算 关联度是在关联系数的基础上,求其各个年份的平均值得到的数值,其计算公式如下。
Si =∑ξi (k), k=1,2,…,n
计算过程由SPSSAU软件完成。
1.5 BP神经网络预测模型
神经网络是由多个神经元组成的广泛互连的神经网络,能够模拟生物神经系统真实世界及物体之间所做出的交互反应。BP神经网络作为根据误差逆传播算法训练的多次前馈网络,通过对人类神经元的功能进行模拟,可以储存及学习大量的输入数据和输出数据,且不需对变量的映射关系进行描述,利用输入和输出数据建模,其对非线性系统具有很强的模拟能力[26 - 27 ]。BP神经网络预测输入值,是根据隐含层输入值,连接权限和阈值来计算,最后预测误差根据网络预测输出值和期望输入值计算得出[9 ]。
该模型选取粮食作物播种面积、就业人数、有效灌溉面积、农业机械总动力、农用化肥施用量和新疆人口数量6个指标作为输入值,输出变量为粮食产量,以此构建神经网络,可以确定输入层节点数为6,输出层节点数为1。为了充分体现数据的规律性,在数据集训中采取随机划分(7∶3)的方法对数据进行训练,保证得到的预测值更加可靠。我们利用matlab2015b软件中的BP神经网络代码,对2000 — 2019年影响粮食产量的6个因素进行训练和检验,其网络层次的设计参数中最佳隐含层是4,输出元素1个,学习速率0.01,训练目标最小误差0.001,步长Epochs为1000。在此设计的基础上,编写BP预测网络设计与练习,经过多次验证,从而实现粮食产量的最优预测。
2 结果与分析
2.1 新疆粮食产量影响因素的关联度分析
利用SPSSAU软件对2000 — 2019年新疆粮食产量和9个影响因子的数据进行分析,得到新疆粮食产量影响因素的关联度排行(表3)。以粮食产量作为参考指标,研究9个影响因子、三大类因素与其的关联度。结果表明,2000 — 2019 年影响新疆粮食产量的三大类因素排序为科技因素 > 自然因素 > 经济因素。9个因子的关联度排序为粮食作物播种面积 > 就业人数 > 有效灌溉面积 > 农用化肥施用量 > 农业机械总动力 > 农村用电量 > 居民人均收入 > 新疆农业生产总值 > 受灾面积。
在新疆粮食产量的影响因素中,科技因素排在首位,其关联度为0.863,说明科技因素在新疆的农业生产上起决定性的作用。从单个影响因子的角度比较,有效灌溉面积、农用化肥施用量、农业机械总动力、农村用电量与粮食产量的相关度均在0.8以上,其中有效灌溉面积高达0.914。说明新疆粮食产量的高低与科技因素密不可分,其中灌溉面积对粮食产量的影响最大。
自然因素作为影响粮食产量的第二大因素,其关联度为0.819,说明自然因素在粮食产量上起到极为重要的作用。从单个影响因子的角度比较,粮食作物播种面积排第1,受灾面积排第9,这说明在控制自然灾害和保证灌溉面积的前提下,播种面积的多少很大程度上决定了新疆粮食产量的多寡。由于自然因素是一种人为不可控制的因素,在农业生产上要尽可能预防自然灾害的发生。
经济因素是影响粮食产量的第三大因素,其关联度为0.801,说明经济因素也影响着新疆的粮食产量。从单个影响因子的角度比较,就业人数排第2,居民人均收入、新疆农业生产总值分别排第7、8,其中就业人数与其关联度为0.929。说明在农业生产中,劳动力数量在很大程度上影响着粮食产量,而农业生产总值和居民人均收入对粮食产量的影响很小。
从新疆的农业发展状况和实际情况出发,农用化肥施用量在2000 — 2019年是不断增加的。从表3可知,农用化肥量与粮食产量密切相关,化肥施用量也是影响粮食产量的重要因素,但化肥施用过多会对土地及生态环境造成不利的影响,此结论与许甜甜等[29 ]的研究相同。新疆特殊的地理位置,导致土壤中残留过多的盐分,造成土地盐渍化,加上近年来不合理的施用化肥,加剧了土壤盐渍化的形成进程,给农业生产造成了难以估量的损失。农业的灌溉难也是新疆农业生产中最紧迫解决的问题,在保证播种面积的前提下,增加灌溉面积、合理施用化肥的种类和数量,确保耕地的质量和减轻土壤盐渍化,才能达到作物高产的目的。
2.2 基于BP神经网络模型的粮食产量预测
从新疆实际情况和相关度分析出发,选取与粮食产量密切相关的6个影响因素作为输入层,输出层为对应当年的粮食产量。利用matlab2015b软件对数据进行分析。为了充分体现数据的规律性,在数据集训中采取随机划分(7∶3)的方法将数据分为训练样本和检验样本,以保证得到的预测值更加可靠,由此得出2000 — 2019年的粮食产量预测值(表4)。通过对20个样本的随机分布检验,2000 — 2019年的训练样本与测试样本的拟合结果分别达到99%以上,其预测值与真实值的误差小于4%,具有高度的精确性,说明预测结果较好。
根据此模型可以对未来年份的新疆粮食产量进行预测。输入2000 — 2019年的数据作为样本输入,根据模型预测2020年的粮食产量,预测值为1 542.7万t,国家统计局公布的2020年的新疆粮食产量为1 583.4万t,二者误差基本可以忽略,表明BP模型对新疆粮食产量的预测是可行的。新疆的土地面积占我国国土面积的1/6,其潜在的农业耕地资源极为丰富。利用BP神经网络模型准确地预测新疆粮食产量对加强我国粮食宏观调控、促进政策调整和保障粮食安全具有极其重要的意义。
3 讨论与结论
粮食安全是国家安全的重要基础。本文运用灰色关联法对新疆粮食产量影响因素进行分析,并根据BP神经网络预测模型对2000 — 2020年的粮食产量进行预测。从关联度分析可知,在新疆农业生产上科技因素居于主导地位,其次是自然因素,最后是经济因素。科技因素中灌溉面积起主要因素,其次是农用化肥施用量、农业机械总动力、农村用电量;自然因素中播种面积居于优先地位;在经济因素中,劳动力数量占主要地位,农业生产总值和居民人均收入对粮食产量的影响较小。粮食作物播种面积、劳动力数量和有效灌溉面积是影响新疆粮食产量的主要因素,其关联度均高于0.91。从新疆的实际情况和关联度分析出发,确定影响粮食产量的6个重要因素是粮食作物播种面积、就业人数、有效灌溉面积、农业机械总动力、化肥施用量和新疆人口数量。运用BP神经网络模型,摒弃了传统的以时间序列为基础划分的训练样本和测试样本,采用随机分布的原则体现数据的规律性,其模型构建在新疆2000 — 2020年粮食产量上得到了较好的预测结果,预测2020年新疆粮食产量为1 542.7万t,预测值与当年的实际粮食产量相关不大,说明BP神经网络模型对粮食产量的预测具有很好的匹配性,可为政府部门的粮食预测提供较为准确的指导。
基于新疆的粮食产量生产现状和自治区的粮食生产政策,从科技因素的角度考虑,第一,要增加有效灌溉面积。合理利用水资源,全区域建设农业节水设施,保证农业生产中的供水难问题。第二,要合理施用化肥。新疆的土壤含盐量较高,大部分的耕地表土出现盐渍化现象,导致种植的作物受盐害死亡;不合理的施肥加快了土壤盐渍化的形成,导致作物减产,环境恶化。因此要坚持平衡施肥、适量施肥的原则。第三,增加农业机械的投入以及提高农机效率。新疆农业种植面积大,单靠劳动力很难维持农业的正常运转,所以加大农业机械的投入和提高农业机械效率是很有必要的。从自然因素出发,第一,要合理增加粮食作物播种面積,保证农业生态系统平衡发展。合理增加播种面积,能减少荒地的浪费,同时响应自治区提出的“稳粮”和“宜粮则粮”策略。第二,加强对自然灾害的监测和建立健全应急机制。自然灾害是人力不可抗拒的因素,在出现自然灾害时,政府和农民应该积极采取灾害应急措施尽量减轻灾害所带来的农业损失。从经济方面考虑,应增加农业劳动人口。政府应着力提高农民收入水平,增加农业财政补贴和惠农政策,适当提高粮食的收购价格,吸引劳动力来疆发展。
参考文献:
[1] 朱家明,刘 威. 基于灰色关联法对安徽粮食产量影响因素的实证研究[J]. 山西大同大学学报(自然科学版),2020,36(3):19-24.
[2] 汤瑛芳,李红霞,刘锦晖,等. 甘肃省粮食生产形势及新时期粮食安全对策研究[J]. 甘肃农业科技,2021,
8(52):63-71.
[3] 钱 镇,臧云鹏. 中美贸易战中谈粮食问题[J]. 中国投资,2018(17):117-119.
[4] 安晓宁. 粮食产业化战略:中国粮食安全保障的重要选择[J]. 农业科研经济管理,1998(3):33-34;49.
[5] 郭淑敏,马 帅,陈印军. 我国粮食主产区粮食生产影响因素研究[J]. 农业现代化研究,2007(1):83-87.
[6] 王双进,金京玉. 我国粮食增产制约因素及发展途径[J]. 学术交流,2013(5):121-125.
[7] 张素文,李晓青. 湖南省粮食生产变化趋势及影响因子研究[J]. 国土与自然资源研究,2005(1):30-31.
[8] 郭庆春,何振芳,李 力. 基于BP神经网络的粮食产量预测模型[J]. 湖南农业科学,2011(17):136-138.
[9] 伍丹华,周礼梅. 基于BP神经网络的粮食产量预测[J]. 农业工程信息,2020,40(27):51-53.
[10] 周 力,张光耀,高大伟,等. 1978—2009年天水市耕地及粮食播种面积变化趋势分析[J]. 甘肃农业科技,2013(9):34-35.
[11] 金京淑,刘 妍. 吉林省粮食单产影响因素分析[J]. 吉林农业科学,2010,35(3):57-59;64.
[12] 杨丽霞. 基于C-D函数和岭回归的粮食生产影响因素分析——以浙江省为例[J]. 地域研究与开发,2013,
32(1):147-151.
[13] 田 甜,李隆玲,黄 东,等. 未来中国粮食增产将主要依靠什么?——基于粮食生产“十连增”的分析[J]. 中国农村经济,2015(6):13-22.
[14] 徐国鑫,金晓斌,宋佳楠,等. 耕地集约利用对粮食产量变化影响的定量分析——以江苏省为例[J]. 地理研究,2012,31(9):1621-1630.
[15] 梁子谦,李小军. 影响中国粮食生产的因子分析[J]. 农业经济问题,2006(11):19-22;79.
[16] 朱学明. 基于神经网络的短时交通流预测方法的研究与应用[D]. 兰州:兰州理工大学,2013.
[17] 张庆杰,陶 辉,苏布达,等. 基于CMIP6气候模式的新疆积雪深度时空格局研究[J]. 冰川冻土,2021,
43(5):1435-1445.
[18] 宋 雪. 新疆核心区建设与高速发展[J]. 北方经贸,2019(10):30-32.
[19] 马淑琴,邹志文,邵宇佳. 丝绸之路经济带与地区出口产品质量——基于新疆核心区的合成控制分析[J]. 经济问题,2018(9):97-100;112.
[20] 不详. 新疆概况[M]. 呼和浩特:新疆人民出版社,2013.
[21]《新疆维吾尔自治区概况》编写组. 新疆维吾尔自治区概况[M]. 呼和浩特:新疆人民出版社,2021.
[22] 劉盛林. 盐渍化农田调控根层磷生物有效性提高棉花产量和养分效率的研究[D]. 北京:中国农业大学,2015.
[23] 国家统计局. 中国统计年鉴[M]. 北京:中国统计出版社,2000 — 2019.
[24] 新疆维吾尔自治区统计局.新疆统计年鉴[M]. 北京:中国统计出版社,2000 — 2019.
[25] 朱家明. 基于灰色关联法对山西旅游经济发展影响因素的计量分析[J]. 山西大同大学学报(自然科学版),2019,35(3):32-36.
[26] 刘曙光,郑崇勋. 前馈神经网络中的反向传播算法及其改进:进展与展望[J]. 计算机科学,1996(1):76-79.
[27] 王彤彤,张 剑,涂 川,等. IPSO-BP神经网络在渭河天水段水质评价中的应用[J]. 环境科学与技术,2013,36(8):175-181.
[28] 王 青,戴思兰,何 晶,等. 灰色关联法和层次分析法在盆栽多头小菊株系选择中的应用[J]. 中国农业科学,2012, 45(17):3653-3660.
[29] 许甜甜,陈 英. 甘肃省粮食产量影响因素的灰色关联动态分析[J]. 生产力研究,2020(2):45-47;87.