ARIMA和灰色模型对中国主要水果消费量的预测研究
2024-12-21杨琼
摘要:文章收集了我国近年水果产量数据,综合考虑产量比重和营养成分确定出四种水果为研究对象,依据损耗率方法由产量估算出消费量,因其具有时间规律,分别选用时间序列法和灰色模型对消费量进行预测。结果表明:我国主要水果消费量在一段时间内呈指数型增长,对其消费量预测采用GM(1,1)模型的精度更高,相比ARIMA(p,d,q)模型有更好的预测效果;对我国水果消费的精准预测可指导水果产业中长期的产业规划,对实现水果产业高质量发展具有战略意义。
关键词:产量比重;营养成分;时间序列;灰色预测
中图分类号:F326.13文献标识码:A文章编号:1005-6432(2024)36-0101-04
DOI:10.13939/j.cnki.zgsc.2024.36.026
1引言
近年来,中国水果产业迅速增长[1],但其生产仍有一定无序性,高价热门水果时常出现一拥而上种植导致供过于求和价格暴跌的局面,忽视了从居民营养均衡的角度[2]来调整种植规模。因此,精准预测我国水果消费与生产趋势,对实现水果产业中长期生产模式的科学规划和产业高质量发展[3]具有战略意义。既有研究多采用较简单的多元回归分析[4]等方法进行预测,其预测精度有待提高,文章分别基于ARIMA和灰色模型预测了中国主要水果消费量,并比较两者的预测精度,所得结果可为水果产业规划提供参考。
2数据收集及处理
2.1水果品种的选取
以中华人民共和国农业部种植业管理司数据库为数据来源,从数据库中获取近20年的各水果品种的产量数据,并采用三次样条插值补充缺失数据。综合考虑产量和营养成分,按式(1)筛选水果品种开展研究,式中Qi为所筛选出的第i种水果的产量,I为所筛选出的水果品种数,Q为全国水果的总产量,k为产量比重且k≥70%。
∑Ii=1Qi≥k·Q(1)
依据产量规则筛选出六种水果,其产量变化如图1所示。因数据量仍偏大,故依据营养成分含量进行二次筛选。营养成分的指标主要包括:维生素B2、维生素C、维生素E、铁、钾、镁、膳食纤维。将六种水果的各项指标按式(2)进行最大最小归一化处理,式中Nij为第i种水果的第j项营养成分,Xij为对应的归一化值。
归一化结果见表1,根据至少有1项营养成分相对最高(Xij=1)的原则,筛选出苹果、梨、柑橘、香蕉四个品种,分别对应i=1、2、3、4,四种水果历年合计产量的k值均在60%以上,满足研究需求。
2.2消费量的计算
文章采用“产量-损耗率”[5]的方法确定消费量,计算公式如下。式中Yi为第i种水果的消费量,R1、R2、R3分别为田间地头到大市场损耗率、大市场到零售市场损耗率、零售市场到餐桌损耗率。此外,考虑到香蕉的进口量达到6%[6],计算其消费量时也计入了此因素。
Yi=Qi(1-R1)(1-R2)(1-R3)(3)
从图1可看出,水果的产量具有较明显的随时间变化规律,故文章采用时间序列法[7]和灰色系统理论[8]进行预测研究,并对比其效果。
3基于ARIMA(p,d,q)模型的消费量预测
根据前文内容计算的消费量数据,分析其变化规律可知,消费量时间序列具有明显的上升趋势、是非平稳时间序列,而建立非参数自回归模型的前提是时间序列必须具有平稳性。因此,为消除原始数据序列的异方差,使数据更为平稳,采用SPSS软件通过一阶差分将其转化为平稳序列,如图2所示。此时,图形已经没有明显的上升或下降趋势,故取ARIMA(p,d,q)模型的参数d=1。
对ARIMA模型各参数进行调整和优选,最终确定的模型参数如表2所示,参数估计输出结果如表3所示,表中Sig.值表明各参数的选取是合理的。
假设yit为第i种水果从第0~20年消费量的时间序列值,dyit为其一阶差分序列。以柑橘为例,其方程可表示为式(4)。观察图3的残差序列可知,模型残差序列的自相关(ACF)图形和偏自相关(PACF)图形均没有显著的趋势特征(拖尾或截尾),即残差序列相互独立即为白噪声的概率很大,故不能拒绝序列相互独立的原假设[9],检验通过,可初步判断该模型是比较恰当的。
dy3t=y3t-y3(t-1)dy3(t-1)=0.081dy3(t-1)-0.784dy3(t-2)+ε3t+ε3(t-1)(4)
因此,将相应模型对四种水果的消费量进行预测,其拟合图形如图4所示。模型的平均相对误差计算结果如表4所示,可知ARIMA模型对水果消费量的拟合结果仍有一定误差,平均拟合精度为94.0%。
4基于GM(1,1)模型的消费量预测
根据消费量历史数据,利用Matlab编程求解得到各水果的GM(1,1)模型参数,求解灰色模型微分方程进而得出四种水果消费量的预测表达式如式(5)所示,检验结果如表5所示。
y1=2.781×108×e(0.0629723×t)-2.587×108y2=1.227×108×e(0.0603846×t)-1.154×108y3=8.531×107×e(0.100166×t)-7.817×107y4=4.571×107×e(0.0678399×t)-4.258×107(5)
由此可见,该模型的拟合精度较高(平均可达98.2%),可进行预报和预测,且相比ARIMA(p,d,q)模型具有更高的预测精度。由于灰色模型对近期数据比较敏感,故根据近10年的产量数据,预测四种水果未来10年的消费量,如图5所示。
5结论
笔者收集了我国近年水果产量数据,综合考虑产量比重和营养成分确定出四种水果为研究对象,依据损耗率方法由产量估算出消费量,因其具有时间规律,分别选用时间序列法和灰色模型对消费量进行预测,主要结论如下:第一,分析我国水果消费量增长趋势可知,其增长速度越来越快,在一段时间内呈现出指数型增长,可见随着居民整体消费水平的提高,对水果的需求也在增大;第二,对于水果消费量的预测,采用GM(1,1)的精度更高,相比ARIMA(p,d,q)模型具有更好的预测效果;第三,文章从人体营养健康角度出发,采用多种数学方法针对我国水果消费量进行分析,所建立的模型拟合程度好、预测精度高,所得结果可为水果产业规划提供参考。
参考文献:
[1]廖紫如,李梅芳.我国水果生产现状及其产业集聚度分析[J].中国果树,2023(3):129-134.
[2]马恋,陆智明,宋乃庆.中国居民果蔬消费与营养发展的趋势预测及战略思考[J].西南师范大学学报(自然科学版),2017(4):68-75.
[3]方晓萍,廖晓玲,邓又军.我国省际高质量发展水平测度[J].统计与决策,2022(5):111-115.
[4]张家林.基于营养健康角度的中国果蔬发展战略研究[J].中国市场,2015(15):160,184.
[5]FANGX,WANGF,LIX,etal.Impactofinventoryinaccuraciesonproductswithinventory-dependent demand[J].Internationaljournalofproductioneconomics,2016(177):118-130.
[6]张强强,闫贝贝,施凡基,等.1978—2016年中国水果增产格局及贡献因素研究[J].干旱区资源与环境,2019(10):65-71.
[7]汪志红,王斌会,陈思玲.ARIMA(p,d,q)与GM(1,1)模型在洪涝灾害预测中之比较研究[J].数学的实践与认识,2011(24):69-76.
[8]郑东权.灰色系统理论在中国外贸出口额趋势预测中的应用[J].中国市场,2023(10):9-13.
[9]ZHENGY,LEIG,YUP.Eco-compensationschemesforcontrollingagriculturalnonpointsourcepollutioninMaoliLakeWatershed[J].Water,2021(11):1536.
[作者简介]杨琼(1993—),女,湖南邵阳人,硕士研究生,研究方向:应用统计。