APP下载

基于SCGM(1,1)c-Markov模型的茶叶产量预测研究

2022-12-20胡林燕徐士元

安徽农业科学 2022年22期
关键词:预测值残差灰色

胡林燕,徐士元

(浙江海洋大学经济与管理学院,浙江舟山 316000)

茶叶产业作为我国重要的农业支柱产业,是中国农业不可或缺的一部分,在现代注重健康、回归自然的文化潮流中,已经成为世纪兴旺发达的“绿色产业”[1]。茶叶产量预测,可为我国茶叶生产企业控制生产数量、提高茶叶生产品质提供切实可行的实践对策参考;也可以为我国茶叶管理部门制定发展规划提供实证支持,对茶叶相关企业的成长壮大、农民增收与就业以及实现茶叶生产的可持续发展,都有重要的实践意义。

近些年国内外学者对茶叶产量及农产品产量预测进行了大量的研究,如唐海军等[2]运用灰色系统理论对万源市的茶叶年产量进行了建模研究,结果表明灰色预测模型的预测精度较高。胡克满等[3]利用灰色预测适合部分原始信息数据的预测特点,结合神经网络系统理论构建了基于灰色神经网络的茶叶产量预测模型,结果表明,该模型精度较高能较好实现茶叶产量的预测;吕海涛等[4]以2010—2018年信阳毛尖茶叶产量、品牌收益、品牌价值为样本数据,构建了信阳茶叶产量、价值、收益的灰色预测模型,预测结果可为信阳毛尖的茶农增收、改善茶叶生产结构、提升品牌价值转化率等提供决策依据;吕海侠等[5]在ARMA预测的基础上利用灰色系统理论原理对ARMA预测值的残差序列构建GM(1,1)预测模型,即构建了ARMA-GM(1,1)的茶叶产量组合预测模型,通过实例计算,结果表明组合预测模型的预测精度有了大幅度提高。在农产品产量的预测问题中,马创等[6]结合灰色预测模型和马尔可夫链理论的优点,针对粮食产量预测提出了一种灰色马尔可夫预测模型,预测结果表明,该模型的预测精度较单一的灰色预测模型有大幅度提高,可以对粮食产量进行周期性预测。尹邦华等[7]针对湖南省粮食产量预测建立了GM(1,1)预测模型、优化的AGM(1,1)模型和利用新陈代谢理论改进的无偏GM-Markov预测模型,通过实例计算表明,经新陈代谢理论改进的无偏GM-Markov预测模型更适合于粮食产量的中短期预测。曹维阳[8]在统计学、预测学等理论的基础上,利用灰色系统预测理论建立了灰色预测模型,对我国乌桕的总产量及我国主要乌桕产区的乌桕籽产量进行了预测,并根据预测结果和经验对如何提高我国乌桕籽产量有针对性地提出了科学有效的建议。

通过对以上各灰色预测模型及相关组合模型的研究可以看出,灰色预测计算过程中依然存在预测过程不甚科学、计算过程复杂等特点,预测精度有待进一步提高;而且,GM(1,1)模型是有偏差的预测模型,不能充分利用灰色系统的信息[9]。单因子系统云灰色[SCGM(1,1)c]预测是在GM(1,1)预测的基础上发展而来的,具有建模过程更加严谨、计算过程更为简单、精度更高等特点,该模型被广泛运用于茶叶、蔬菜、粮食产量等农业领域以及相关领域预测研究中[10-11],取得了良好的预测效果。为了更为准确地完成预测研究,该研究采用在农产品产量预测中运用比较广泛的SCGM(1,1)c预测模型,并通过马尔可夫预测理论对其进行优化并建立SCGM(1,1)c-Markov预测模型,以实现对浙江省茶叶产量的高精度预测。

1 SCGM(1,1)c预测模型的建立

SCGM(1,1)c预测模型是在灰色GM(1,1)预测模型的基础上发展而来的,其对原始数列的处理采用了更为科学的积分计算方法,即计算过程中由采用梯形面积替代了GM(1,1)预测计算中的矩形面积,使得预测精度得到提高[10]。同时,与GM(1,1)预测模型相比SCGM(1,1)c预测模型在计算模型参数时不需要进行矩阵运算,而且求取预测值时也不需要累减计算,使得SCGM(1,1)c预测模型的预测计算量得到大幅度简化。

SCGM(1,1)c茶叶产量预测模型的建模过程如下。

设茶叶产量样本数据序列为X(0):

X(0)={X(0)(1),X(0)(2),…,X(0)(n)}

(1)

对样本X(0)序列进行积分生成变换,得X(0)′={X(0)′(1),X(0)′(2),…,X(0)′(n)},其中,

(2)

X(1)(m)=0.5×[X(0)(m)+X(0)(m+1)]

(3)

设茶叶产量积分样本序列X(0)′与函数fr(k)=bea(k-1)-c满意趋势关联,用X(0)′的数据贴切拟合于fr(k),可计算得到云灰色系数:

(4)

(5)

(6)

(7)

对X(0)′(k)还原处理,即可得茶叶产量的SCGM(1,1)c预测模型:

(8)

2 改进SCGM(1,1)c预测模型

单因子系统云灰色SCGM(1,1)c预测的基本原理是灰色预测,尽管其预测精度和运算简易程度上较灰色GM(1,1)预测上有了一定提高,但是,对于因不确定性因素造成的茶叶产量的波动,该预测模型依然不能达到理想的预测精度。为了提高模型的预测精度,对SCGM(1,1)c模型预测值进行了修正。

马尔可夫预测理论最显著的特点是无后效性,对于具有较强波动性原始数据量的预测问题具有良好的预测效果。茶叶产量原始值与SCGM(1,1)c预测模型预测值的差称作残差,残差的分布状态可以作为马尔可夫状态[12]。马尔可夫预测是通过计算各状态的转移概率来实现的,转移概率反映了各状态的内在规律。因此,该研究将SCGM(1,1)c模型与马尔可夫预测结合起来,利用马尔可夫理论修正茶叶产量预测值。

首先,计算茶叶产量SCGM(1,1)c模型预测值的残差及相对误差:

(9)

(10)

其次,根据相对误差Q的大小分布,均分Q为i个数值区间,设一个数值区间为一个预测状态:

Ei=(Li,Ui),i=1,2,…,n

(11)

再次,构造转移概率矩阵,记由状态Ei转移到状态Ej发生了nij次,而状态Ei在相对误差系列中出现了ni次,则由Ei转移到状态Ej的状态转移概率为pij=nij/ni,可得1步状态转移概率矩阵:

(12)

P(n)=(P(1))n为n步状态转移概率矩阵。

最后,通过计算状态转移概率并比较各个状态概率的大小,概率最大者为预测年份的状态。设预测年份状态为Ei=(Li,Ui),取状态Ei的中间值Ii为修正参数,即

Ii=|0.5×(Li+Hi)|

(13)

则可得修正的马尔可夫SCGM(1,1)c预测模型:

(14)

预测值大于样本值时取“+”,预测值小于样本值时取“-”。

3 模型检验

预测模型的预测结果是否合理可信,要通过一定检验。SCGM(1,1)c预测基本原理为灰色预测,而残差和后验差校验是灰色预测常用的检验方法[13-14]。该研究采用灰色预测模型常用的检验方法验证所建模型的精度。

3.1 残差检验及指标

(1)最大绝对百分比误差(APE),体现模型预测值与样本数据的最大偏差:

(15)

(2)平均相对误差(MAPE),体现不同模型对相同样本数据拟合程度的好坏:

(16)

表1 预测模型等级划分

4 实例分析

为了验证所建模型的可行性,以浙江省统计局网站公布的2006—2017年全省茶叶年产量数据为样本,根据上述建模过程建立预测模型,并对2018、2019、2020年的数据进行预测(表2)。

表2 2006—2020年浙江省茶叶产量

茶叶生产是浙江省传统的优势农业产业,为浙江省农业发展、农民增收作出了巨大贡献[15]。由表2及图1可以看出,2006—2017年浙江省茶叶总产量整体呈上升趋势,但考虑到劳动力、气候、政策等影响因素的影响,浙江省茶叶总产量增长趋势并非线性增长而是呈现一定程度的波动。鉴于此,对浙江省茶叶年产量建立系统云灰色预测模型和经过马尔可夫理论修正的SCGM(1,1)c-Markov预测模型,并对比分析2种模型的预测精度和预测值曲线拟合度,以期进一步提高预测精度,更好地服务浙江省茶叶产业发展。

4.1 浙江省茶叶产量SCGM(1,1)c预测模型由表2得2006—2017年浙江省茶叶产量样本值序列:

X(0)={15.24,16.02,16.23,16.74,16.27,16.97,17.48,16.86,16.54,17.25,17.22,17.83}

根据上文SCGM(1,1)c建模过程,可得预测模型:

(17)

为了验证所建模型的预测精度,用所建模型分别预测2006—2017年浙江省茶叶产量预测值,结果见表3。由表3及图1可以看出,SCGM(1,1)c预测模型预测值基本能反映近年来浙江省茶叶产量的整体增长趋势,但部分年份(2006、2009、2012、2014、2016)预测误差较大,预测值曲线与样本值曲线有明显的背离,即SCGM(1,1)c预测模型总体预测效果不佳,模型的预测精度有待进一步提高。

表3 浙江省茶叶产量预测

图1 SCGM(1,1)c预测模型拟合曲线

4.2 浙江省茶叶产量SCGM(1,1)c-Markov预测模型为了进一步提高浙江省茶叶产量的预测精度,对已建立的SCGM(1,1)c预测模型利用Markov预测理论进行改进。具体步骤如下:

(1)计算浙江省茶叶产量SCGM(1,1)c预测模型的残差和相对误差。由2006—2017年浙江省茶叶产量的SCGM(1,1)c模型预测值及式(9)、(10),可得相应残差和相对误差,见表3。

(2)根据SCGM(1,1)c预测值相对的大小误差分布情况,划分出4个状态,见表4。

(3)构造状态转移概率矩阵,根据表4的预测值状态划分,计算各状态转移概率,得1步状态转移概率矩阵:

表4 浙江省产业产量SCGM(1,1)c模型预测值状态划分

n步状态转移概率矩阵P(n)=(P(1))n

(4)建立浙江省茶叶产量的SCGM(1,1)c-Markov模型。由改进SCGM(1,1)c预测模型的建模过程,得经过Markov理论修正后的预测模型:

(18)

式中,Ii为预测年份状态的中间值。

由式(18)及表4所列2006—2017年的预测状态,可计算得出2006—2017年的SCGM(1,1)c-Markov模型预测值,见表3。关于2017年以后各年份预测值的计算,以距离最近的2015、2016、2017年作为预测状态的基础年份,通过计算状态转移概率并比较各个状态概率的大小,概率最大者为预测年份的状态。然后,再根据式(18)计算得到预测值。

4.3 模型检验为了验证所建SCGM(1,1)c-Markov模型的预测精度,分别计算SCGM(1,1)c模型和SCGM(1,1)c-Markov模型2种预测模型的残差校验和后验差检验指标,见表5。同时,为了更直观比较2种预测模型的预测值曲线拟合情况,作出2种预测模型的拟合曲线,见图2。

表5 SCGM(1,1)c模型和修正模型的预测精度比较

由表5数据可以看出,SCGM(1,1)c模型及改进模型的均方差指标C≈0.03‰(远小于0.35),小概率误差P均为1,由表1可知,2种模型的预测等级均为“优”,说明云灰色预测模型适用于浙江省茶叶产量的预测。但是通过比较残差校验指标,可以看出SCGM(1,1,)c-Markov预测模型的残差检验指标均较SCGM(1,1)c预测模型有大幅度的降低。从反映模型预测精度的平均相对误差指标MAEP,可以看出SCGM(1,1,)c-Markov预测模型较单一SCGM(1,1)c预测模型的精度提高了76.47%。同时,由图2,SCGM(1,1,)c-Markov预测模型的拟合曲线更能反映样本值的变化规律,拟合效果较SCGM(1,1)c预测模型更好。

图2 2种预测模型的拟合曲线

为了验证所建SCGM(1,1)c-Markov预测模型的可行性,以2006—2017年浙江省茶叶产量为样本值序列,按照SCGM(1,1)c-Markov预测模型的建模计算过程,对浙江省2018、2019、2020年的茶叶产量进行预测,预测结果见表6。

表6 SCGM(1,1)c-Markov模型的可行性验证

由表6可以看出,2018、2019、2020年预测值和实际值的预测误差率分别为5.52、1.53%、1.05%,在误差允许的范围内能较好地反映浙江省茶叶产量的发展变化趋势,具有较高的可行性。

4.4 浙江省茶叶产量预测利用该研究建立的浙江省茶叶产量SCGM(1,1)c-Markov模型预测了2021、2022、2023年的浙江省茶叶产量,分别为18.38、19.32、19.53万t。

由预测结果可知,2021年浙江省茶叶产量较2020年有一定程度下滑,但2022年开始茶叶产量又出现稳定增长趋势。类比2016年浙江省茶叶生产情况,因2016年浙江省受到春霜夏旱严重灾情的影响,浙江省茶叶产量产值出现了明显的“两头低,中间高”态势[16],考虑到2020年全球新冠肺炎疫情对茶叶生产的不利影响,2018—2020年的数据基本符合此规律。2021年是我国“十四五”的开局之年,2021年2月,《中国茶产业“十四五”发展规划建议》正式向社会发布,作为中国特色优势农业产业的茶产业得到了国家的高度重视,相继出台了关于茶叶生产的“提质增效”“科技创新”“产业协同”“国际拓展”等一系列举措,这必将积极促进浙江省茶叶产量的稳步提升[17]。由此得出,该研究建立的预测模型对浙江省茶叶产量的预测数据基本符合浙江省茶叶生产的趋势,具有一定的参考价值。

5 结论

我国为农业生产大国,茶叶生产是我国经济性农产品生产问题的重中之重,做好茶叶产量的预测,对保障我国茶叶的有序生产具有重要意义。单因子系统云灰色预测SCGM(1,1)c模型在农业生产领域的产量预测中应用比较广泛,但鲜有在茶叶产量预测中使用。该研究把改进的SCGM(1,1)c模型运用到茶叶产量预测中,通过对2006—2020年浙江省茶叶产量预测的实例分析,可得出以下结论:

(1)所建模型对茶叶产量的预测数据有较高的可信度,预测数据基本上能反映茶叶产量的实际情况。

(2)SCGM(1,1)c模型能反映茶叶产量变化的总体趋势,用它来预测茶叶产量是合适的,但是通过建模和实例分析发现,SCGM(1,1)c预测模型对波动较大的数据系统,预测精度不高。

(3)经过Markov预测理论改进的SCGM(1,1)c-Markov预测模型,不仅能反映茶叶产量的总体变化趋势,而且可以解决灰色系统数据波动较大的问题,改进后的模型大幅度提高了茶叶产量的预测精度,为茶叶产量的预测研究提供了新的方法和思路。

猜你喜欢

预测值残差灰色
基于双向GRU与残差拟合的车辆跟驰建模
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
基于残差学习的自适应无人机目标跟踪算法
浅灰色的小猪
法电再次修订2020年核发电量预测值
基于递归残差网络的图像超分辨率重建
灰色时代
她、它的灰色时髦观
平稳自相关过程的残差累积和控制图