APP下载

广西蔬菜产量灰色预测模型GM(1,1)的建立及其相关性分析

2018-09-05余永松庞正武周叶宁钟文峰何龙飞王爱勤

广东农业科学 2018年7期
关键词:灰色广西精度

余永松,庞正武,周叶宁,钟文峰,何龙飞,王爱勤

(1.广西大学农学院,广西 南宁 530004;2.广西大学计算机与电子信息学院,广西 南宁 530004;3.华中科技大学管理学院,湖北 武汉 430074)

广西地处我国华南地区,为亚热带、热带季风气候,热量充足,降水丰富,年均气温在16.5~23.1℃之间,降水量1 070 mm以上,年均无霜期284~365 d,非常适合蔬菜种植,且蔬菜品种资源非常丰富,其中秋冬季蔬菜大量远销国内东部及北方地区和东盟市场[1]。

全国蔬菜产业发展规划(2011~2020年)中,将广西26个县(区)列为全国蔬菜产业重点县,以确保元旦、春节期间全国蔬菜的供应[2],被誉为北方地区“冬季菜篮子”。同时,近年来,由于珠三角地区城市化快速发展,农用地逐渐减少,蔬菜种植成本高昂,以及土地污染严重等问题,广西也成为了珠三角全年蔬菜供应的重要基地[3],“广西蔬菜之乡”贺州市更是被誉为珠三角的“后菜园”[4],广西蔬菜产业可持续发展具有重要的战略意义。加强对广西蔬菜产量的科学预测,对指导广西蔬菜产业生产、储存与加工十分必要[5]。

1981年,华中理工大学邓聚龙教授在上海中-美控制系统学术会议上首次提出“灰色系统”和灰色模型(Grey Model,GM)。由于灰色系统模型的建立不需要大量的样本数据及样本有规律的分布,同时计算工作量较小,可用于近期、短期以及中长期的系统预测,且预测精度比较高,逐渐被广泛应用[6]。汇总利用灰色系统对2014—2017年全国粮食产量进行的预测研究,结合国家统计局公布的各省以及全国历年的粮食实际产量,发现其准确率高达95%以上,是一种比较可靠的粮食产量预测模型。

目前,国内外利用灰色预测模型进行的产量预测多集中在粮食产量领域,关于蔬菜产量预测的较少。鲁珊珊等[7]利用灰色预测模型对上海市2013—2017年的蔬菜产量进行了预测研究。王洁等[8]利用最小二乘法GM(1,1)模型对2017—2019年我国蔬菜产量进行了预测研究。张赛丽[9]利用灰色模型、Quadratic模型和BP神经网络模型对海南1980—2020年间的瓜类产量进行了预测研究,结果显示3个模型之间的预测数据偏差较大。

基于灰色预测模型对广西蔬菜产量进行预测的研究尚未见报道。本研究根据广西壮族自治区统计局公布的2008—2014年广西蔬菜产量数据,采用灰色系统理论的方法构建数学预测模型,并进行相对误差、关联度、后验差精度检验以及模型实际检验,在此基础上对2017—2019年广西蔬菜产量进行预测。

1 材料与方法

1.1 建模数据来源

2008—2016年广西蔬菜(包含菌类)产量数据来源于《广西统计年鉴》。

1.2 蔬菜灰色模型的建立

灰色模型是基于一阶常微分方程建立的,故称为一阶一元灰色模型,记为GM(1,1)[12]。根据灰色系统理论,建立蔬菜灰色模型的数据选取2008—2014年广西蔬菜产量作为输出因子,首先通过数据序列级比和可容覆盖计算,确定原始数据序列X(0){X(0)=X(0)(1),X(0)(2),…X(0)(n)}是否能直接用于建模,其次运用累加生成和累减生成方法对数据进行预处理,得到新序列,建立起广西蔬菜产量数据时间模型,得到关于蔬菜产量的原始数据序列,建立灰色预测模型[12]。

1.3 模型有效性评估

模型检验是建模工作必不可少的一部分,为准确对实际情况进行预测,在进行数学建模时必须要对模型的有效性进行评估,参照文献[10]-[11]中4种检验方法对1.2构建的模型进行准确度检验。

1.3.1 残差检验 残差的计算公式为:

相对误差计算公式为:

则平均相对误差计算公式为:

1.3.2 关联度检验 先计算出预测序列与预测因素之间的关联系数r,关联系数再计算关联度:

式中,ρ为分辨率,0<ρ<1,一般取ρ=0.5,其中k=2,3,…n。

1.3.3 后验差检验 根据下列公式计算后验差比值C和小误差概率P,再根据预测精度等级标准(表1),判断该模型预测精度等级。

表1 预测精度等级标准

1.3.4 模型实际检测 对符合残差、关联度以及后验差检验的模型进行实际产量预测,求出2015—2016年广西蔬菜产量,并与当年实际值对比,检验准确率如何。根据已知拟合模型为:x(0)(i)-0.046864Zt(i)=1902.815305,且模型的白化响应式为求出2015—2016年广西蔬菜产量的预测数据。

1.4 2017—2019年广西蔬菜产量预测

基于2008—2014年广西蔬菜产量历史数据,建立起的灰色预测GM(1,1)模型,通过了残差检验、关联度检验、后验差精度检验以及实际检测,检验结果证明该模型可以使用。在此基础上,基于建模中利用的原始数据越多,利用的数据在时间上越贴近,建立的预测模型越准确,所以我们基于2008—2016年共9年的广西蔬菜产量历史数据,以及灰色预测系统原理建立新的GM(1,1)模型,对广西未来3年的蔬菜产量进行预测。

1.5 影响广西蔬菜产量因素的相关性分析

为保证蔬菜产量出现预期的结果,我们对影响蔬菜产量的相关性因素进行分析。根据Elisabeth Simclton等学者对蔬菜产量的相关性进行研究,结合实际情况,将影响广西蔬菜产量的因素选择为蔬菜种植面积、蔬菜消费量以及农业财政支出(包括农业基础设施建设、农业技术、农业补贴等支出)。根据《广西统计年鉴》、国家统计局、农业局公布的2008—2016年广西蔬菜种植面积、广西财政支农支出及全国蔬菜消费量数据(表2),以广西蔬菜产量为因变量,其他3个变量均为自变量,并利用SPSS对这4个因素进行复相关关系分析。相关系数计算公式如下:

相关系数r的一般标准为:|r|<0.3时,两个现象之间没有关系;0.3≤|r|<0.5时,低度相关;0.5≤|r|<0.8时,显著相关或称中度相关; |r|≥0.8时, 高度相关。

表2 2008—2016年广西蔬菜种植面积、广西财政支农支出及全国蔬菜消费量

2 结果与分析

2.1 建模数据分析

从表3可以看出,自2008年以来,广西蔬菜产量逐年上升。2007年广西蔬菜产量2 352.1万t,由于受到春季寒潮以及雪灾的影响,2008年蔬菜产量仅有2 015.20万t,2009—2016年连续8年保持着平均4.80%的增长速度,蔬菜播种面积也总体增加。

表3 2008—2016年广西蔬菜种植面积及产量

2.2 蔬菜灰色模型的建立

其一阶常微分方程为:X(0)={X(0)(1),X(0)(2), …X(0)(7)}={2015.20,2063.07,2129.44,2246.40,2356.72,2435.62,2610.08}。

由于不确定该数据序列是否可以用于建模,所以需要计算该数据序列的级比,并做级比判断:

其中,可容覆盖区间为:

显然,所有的λk均在可容覆盖区间内,因此不需要对原始数列X(0)进行弱化缓冲算子处理,故可以用原始数据序列X(0)进行GM(1,1)建模,对数据序列进行进一步的预处理:

原始数据序列:X(0)={2015.20,2063.07,2129.44,2246.40,2356.72,2435.62,2610.08}

由原始序列X(0)经一次累加得新序列为:

X(1)={2015.20,4078.27,6201.71,8454.11,10810.83,13246.45,15856.53}

接着建立GM(1,1)预测模型,设X(1)满足一阶常微分方程:

式中,a、u为常数,a为发展灰数;u为内生控制灰数,是对系统的常定输入。

灰色建模的途径是一次累加序列通过最小二乘法来估计常数a与u。因X(1)(1)留作初值用,故将X(1)(2),X(1)(3),…X(1)(n) (n=7)分别代入方程用差分代替微分,又因等间隔取样Δt=(t+1)-t=1,得:

则类似有:

得表达式(a):

生成紧邻均值为:Z(t)=(3046.735,5139.99, 7327.91, 9632.47, 12028.64, 14551.49)

所以,可以将上式表达式(a)写为矩阵表达式(b)为:

于是得到:

用GM(1,1)建模:

解得时间响应序列为:

据此模型求得数据还原值,即根据此模型预测计算得出的2008—2014年广西蔬菜产量为:2245.71,2353.46,2466.37,2584.71}。

2.3 模型有效性评估

2.3.1 残差检验结果 原始数列的残差、相对误差见表4。

表4 GM(1,1)模型检验结果统计

根据灰色模型预测精度检验等级标准(表5),判断该模型预测精度达到一级,可以使用[13]。

表5 灰色预测精度检验等级标准

2.3.2 关联度检验结果 根据关联度的计算公式,η(k)=(0.47734,0.55694,1.00000,0.86209,0.34807,0.39428) 。

则关联度r=0.60645>0.6,根据经验判断,该模型可以使用[13]。

2.3.3 后验差检验结果 根据均值和方差计算公式分别得:

显然,所有的 ∂(k)<134.53577,则P=1>0.95。

根据预测精度等级对照(表5),该模型预测精度等级为一级,可以使用[14]。

2.3.4 模型实际检测结果 利用该模型对2015、2016年广西蔬菜产量的预测结果分别为2 708.739万、2 838.704万t(表6)。与广西蔬菜产量实际数据误差绝对值分别为2.79%、3.08%,正确率均在96%以上,且平均误差绝对值为2.935%,说明该模型预测精度比较高,可以用于预测2017—2019年广西蔬菜产量。

表6 2015—2016年广西蔬菜产量灰色预测实际对照(万t)

2.4 广西未来3年蔬菜产量预测

基于2008—2016年9年的广西蔬菜产量历史数据,以及灰色预测系统原理建立新的GM(1,1)模型:

得到新的原始数列的残差、相对误差(表7)。根据表7中新建GM(1,1)模型中2015、2016年的模拟值和相对误差(0.891>2.79,0.705<3.08)表明,利用更多和最新的数据建立的模型比之前建立的灰色预测模型更有效。

表7 误差检验

利用新模型预测2017—2019年的广西蔬菜产量以及发展趋势,结果表明,2017、2018、2019年广西蔬菜预测产值分别为3 062.58万、3 225.20万、3 396.45万t。未来3年,广西蔬菜产量将持续稳定增长,平均年增长155.88万t,年均增长率在5%左右(表8)。

表8 2017—2019年广西蔬菜产量预测值(万t)

2.5 相关性分析

在置信水平为0.01的情况下,采用t检验的方法进行双侧检验,种植面积、消费量、财政支农支出与蔬菜产量的相关系数分别为0.974、0.990、0.974。由此可知,广西蔬菜的种植面积、我国蔬菜消费量以及广西财政支农支出与蔬菜产量存在高度依存的关系[15]。

3 结论与讨论

3.1 关于灰色预测模型

目前应用于农业领域的产量预测模型主要有神经网络预测法、遥感预测模型、多元回归模型以及灰色预测模型。神经网络预测法产生于机器智能的背景下,具有自学习、分布式处理、大规模并行以及自组织的优点。利用神经网络预测法对马铃薯、广西粮食产量进行预测,预报精度和拟合精度平均相对误差达到4.48%,部分误差值达到5%以上[16-17]。神经网络预测法比传统的回归模型更有优势,但是神经网络预测法需要反复测试,对于样本依赖性比较强,在早期数据缺失以及统计失当的情况下,预测精度误差较大[16]。

遥感技术于20世纪70年代引入我国,经过40年的发展,已在社会各个行业大量应用[15-16]。但利用遥感技术对产量预测精确度仍有待提高,与其他预测方法相比,遥感预测法成本比较大,专业性也比较强[18-19]。

利用回归模型进行产量预测的研究已经比较成熟,如王春辉等[20]利用回归模型对江苏省粮食产量进行了预测,易淳等[21]利用线性回归和灰色预测模型对四川省凉山州冕宁县烟叶产量进行了预测;但利用回归模型需要与其他模型相组合,才能提高预测的精度以及可信度,而且需要样本数据较多,一般不少于20个。同时,预测对象与影响因素之间必须存在因果联系。

与线性回归模型、神经网络预测法、遥感预测模型等预测模型相比,灰色预测模型在理论、方法以及预测上都有需要的数据少、数据不需要有一定的规律、定量分析结果与定性分析结果比较一致、计算工作量小、预测精度高的特点。本研究利用灰色理论和2008—2014年区统计局官方公布的广西蔬菜产量7年数据,构建的模型预测2015—2016年广西蔬菜产量,结果与区统计局官方公布结果精度达到96%,平均误差仅为2.9%,进一步说明灰色理论预测模型更适合于农业产量类预测。

3.2 关于灰色模型预测的差异问题

作为一种数学模型,与多元回归预测模型、神经网络预测模型、遥感预测模型一样,也有自己的应用背景与前提,也会存在着不足之处。以本文研究为例,利用灰色模型对广西未来3年的蔬菜产量预测是基于广西2008—2016年的蔬菜种植环境,这种环境因素包括蔬菜种植面积、财政支农支出、重大气候变化及气象灾害、市场需求等因素,而大部分因素是不可控的,导致实际值会与预测值有较大差距。因此,也需要加强灰色模型影响因素的研究,提高模型的精确度。

3.3 关于制约广西蔬菜产量的因素分析

根据相关性分析结果,广西蔬菜产量的提高与种植面积、消费量、财政支农支出等密切相关,说明广西蔬菜产量稳定增长,与政府的支持力度、消费者需求拉动和蔬菜种植面积增加密切相关,在政府支持和种植面积有限的条件下,如何拉动消费者需求是确保广西蔬菜产业健康稳步增长的关键。政府增加蔬菜行业新品种选育研究与推广、提升抗击意外灾害能力的基础设施建设和加强对蔬菜市场的监测等方面增加投入,根据市场需求来布局和指导蔬菜种植,更有利于拉动消费者需求,确保广西蔬菜产业的可持续、稳步增长。蔬菜产量极其容易受到天气变化影响,2008年初由于不可控的寒潮以及雪灾的影响,广西蔬菜产量从2007年的2 352.1万t跌至 2008年的2 015.2万t,直到2012年才恢复到2007年的产量水平,对于广西的农业发展以及农民收入来说是巨大损失。从这个角度来说,维护蔬菜产量的稳定增长具有重要的意义。除此之外,蔬菜也是一种对市场价格波动敏感的作物,中央和地方政策也会影响蔬菜种植面积。保持广西蔬菜产量持续稳定增长,需要国家、地方政府以及种植户共同努力,减少外部因素的影响,避免蔬菜产量出现大幅度“跳水”情况。

猜你喜欢

灰色广西精度
广西贵港
热连轧机组粗轧机精度控制
浅灰色的小猪
超高精度计时器——原子钟
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
灰色时代
她、它的灰色时髦观
感觉
广西出土的商代铜卣