农场电商生鲜农产品需求预测体系及应用
2022-08-01马佳玉孙宗军MAJiayuSUNZongjun
马佳玉,孙宗军MA Jiayu, SUN Zongjun
(1. 西安汽车职业大学,陕西 临潼 710038;2. 山东科技大学,山东 青岛 266590)
0 引 言
随着信息化的不断发展,电子商务已经成为驱动中国经济发展的重要动力,“互联网+”的新兴物流体系也有效激发了物流行业的创造力。就农产品电商销售而言,相较于传统的线下销售,其产品丰富、交易快捷、流程简单等优势突出,线上销售在农产品的供销体系中发挥着重要作用。
为有效把握电商销售下的生鲜农产品需求量的发展方向与变化趋势,选择合理的需求预测模型并进行有效的需求预测至关重要,而建立合理的需求预测体系是可靠预测的前提。黄凯等选择社会零售品消费总额、人均GDP 等15 个指标构建了生鲜农产品需求预测体系,并采用GM、BP 神经网络和RBF 神经网络预测模型预测了2018~2022 年中国生鲜农产品冷链物流需求量;张继良等提出了包括经济发展程度、产业结构等因素在内预测体系,并采用多变量灰色预测模型预测了2020~2024 年的山东省生鲜农产品需求量;杨航等选择蔬菜产量、水果产量等因素作为预测体系的自变量,并预测了陕西省五年内的冷链需求量。
然而,目前农产品的需求量预测研究主体多为省市地区的预测,主体为电商环境下农场经营单位的农产品需求预测研究相对缺乏。基于上述问题,本文选择青岛市西海岸某农场为研究对象,对其生鲜农产品需求量进行了预测。文中给出了农场电商生鲜农产品需求量预测体系的建立原则与过程,同时对某农场生鲜农产品需求预测的应用实例也证明了需求预测体系与预测模型的有效性与适用性。
1 农场电商生鲜农产品需求量预测指标体系构建
物流需求是派生性需求,影响及制约物流需求量的因素众多。进行可靠物流需求预测的基础是构建合理的需求预测体系,在选择预测指标时应遵循可得性、相关性以及独立性原则。
1.1 指标选取
本文参考文献[8]的研究成果,结合农场电商生鲜产品的特点,分别从电商生鲜农产品供给影响因素(X)、社会经济环境(X)、人文因素(X)、载运情况(X)以及线上影响因素(X)5 个维度选取了影响因素。
(1) 生鲜农产品供给影响因素主要包括生鲜农产品总产值。这一部分的指标选取来源于自农场开始运用线上销售模式开始统计的各年度各季度的订单情况,包括生鲜农产品的需求量、总产值。该指标直接影响到农场的定价、种植计划等多个方面,需要对其影响进行研究分析。
(2) 社会经济环境主要包括城镇居民食品消费价格指数、地区生产总值、第一产业增加值、第三产业增加值、进出口总额。居民食品消费价格指数可以表征日常消费产品价格对居民生活成本的贡献度,生鲜农产品是居民生活的日常基础需求之一,在居民生活成本中占有重要地位,居民食品消费价格指数可以反映地区居民对生鲜农产品的需求状况;地区生产总值与地区居民的购买力整体上表现为正相关关系,电商农产品生产上表现为第一产业、销售渠道上表现为第三产业,电商生鲜农产品与第一产业、第三产业相互促进、共同发展;进出口总额与地区生鲜农产品的进出口状况联系密切,山东省作为农业大省、“一带一路”主要港口城市,其产出的农产品主要满足本地区居民的日常需求及对外出口需求。
(3) 人文因素主要包括城镇居民人均消费支出、本地区人口数量、第三产业从业人数。人口数量与生鲜农产品的消费力紧密相关,生鲜农产品支出是城镇居民人均消费支出的重要组成部分,第三产业从业人数可以反映地区居民的收入消费水平。
(4) 载运情况主要包括货运量、载货汽车量。生鲜农产品配送是物流产业的重要组成部分,货运量以及载货汽车量可以直接反映地区的物流市场以及载运能力。
(5) 线上影响因素主要包括电子商务营业额、移动电话用户数、移动互联网用户使用数。我国的B2B、C2B、B2B2C、C2C、O2O 等网络销售模式,一方面极大地拓展了生鲜农产品的销售渠道,另一方面也提高了居民的农产品消费需求。电子商务营业额、移动电话用户数、移动互联网用户使用数能够很好地反映电商环境对生鲜农产品需求量产生的影响。
1.2 相关性分析与数据集构建
以山东省2015~2019 年指标数据资料为基础,采用一次指数平滑法补充山东省西海岸新区生鲜农产品需求量及相关数据,构建完整的数据集,同时运用SPSS 数据分析软件分析各因素公因子方差,各指标累计贡献率如表1 所示,生鲜农产品需求量指标体系如表2 所示。X~X均与Y 有密切相关性,本次选取的各个指标对需求量累计贡献率全部高于85%,其中X人口数量(万人)、X第三产业从业人数(万人)、X载货汽车量(辆)、X电子商务营业额(万亿) 在数据集中对需求量(Y )的影响最大。
表1 各指标累计贡献率 单位:%
表2 生鲜农产品需求量指标体系
2 基于ARIMA 的生鲜农产品需求量模型构建与分析
2.1 ARIMA 模型建立
将所建立的数据集选择16 组数据作为训练集、3 组数据作为测试集,其中训练集用于MATLAB 软件的ARIMA 建模,测试集用来检验ARIMA 模型的可靠性。基于ARIMA (p,d,q )生鲜农产品需求量模型的建模过程如下:
(1) 数据集的平稳性检验。ARIMA 模型预测时使用的时间序列必须是平稳的非白噪声序列,若构建的数据集不平稳,需要进行d 阶差分处理,将数据集转化为平稳序列,差数阶数d 通常小于3。
(2) ARIMA (p,d,q )建立。运用自回归模型AR(p )、滑动平均模型MA(q )对处理后的平稳且非白噪声序列进行拟合、分析、预测,求和自回归移动平均模型可表示为ARIMA (p,d,q ),如式(1) 所示。
式中:Δd= (1- B)为d 阶差分,Θ(B )=1-θB-…-θB为ARMA (p,q )模型中的移动平滑系数多项式,Φ(B )=1-φB-…-φB为ARMA (p,q )模型中的自回归系数多项式。
2.2 生鲜农产品需求量预测分析
依据前文构建的数据集,构建了如图1 所示的2015~2019 年前三季度农场生鲜农产品需求量原始时序图,运用MATLAB对数据进行平稳性检验处理,ARIMA 模型自相关系数如图2 所示。试均值常数E (X)=μ=0.02632,且生鲜农产品需求量并未围绕某一特定值上下波动,因此构建的数据集为非平稳时间序列。同时,单位根检验H=adftest (DX )=1,表明自变量(X~X)与因变量(Y )存在欺骗关系。
图1 生鲜农产品需求量原始时序图
图2 ARIMA 模型自相关系数垂线图
为保障数据的真实性与可靠性,采用低阶差分方式处理数据集,可以有效避免过度差分造成的系列信息丢失、数据精度欠佳的现象,本文采用一阶差分方式处理数据集,结果如图3 所示。差分自相关系数在(-0.5~)1 波动,且多数差分自相关系数在0 附近,经一阶差分处理后的数据集满足平稳时间序列。为建立拟合精度与参数配置的综合最优预测模型,避免过度拟合现象,采用AIC 最小值的模型确定为最优模型,选取了16 组训练,3 组测试;19 组训练,16 组测试的组合模式,求得最小的AIC=5.7374。因此,差分处理后的数据集可以用于ARIMA 模型进行需求预测分析。
图3 ARIMA 模型差分序列自相关系数垂线图
将数据集划分为16 组训练数据,3 组测试数据,运用MATLAB 软件进行ARIMA 建模,得到关于生鲜农产品需求量的预测结果,模型拟合结果如表3 所示。预测结果显示R平均值为0.992,且RMSE、MAPE 误差较小,表明模型可靠、预测精度较高。
表3 ARMIA 模型预测误差
ARIMA 模型预测结果如表4 所示,2019 年第一季度、第二季度、第三季度的预测值分别为236.44、242.96、249.69 吨,其误差分别为0.09%、0.01%、0.05%,表明ARIMA 预测模型可以用于农场电商生鲜农产品的需求预测。
表4 ARMIA 模型预测结果
3 结 论
本文基于可得性、相关性以及独立性原则,选取影响电商农场生鲜农产品需求量的影响指标,同时就预测指标的合理性进行相关性分析,构建了包括生鲜农产品供给影响、社会经济环境、人文因素、载运情况以及线上影响因素的农场电商生鲜农产品需求预测体系,并以青岛市某农场进行了ARIMA 模型预测的实例验证。结果表明,该农场2019 年第一季度、第二季度、第三季度的农产品需求预测误差分别为0.09%、0.01%、0.05%,农场电商生鲜农产品需求量预测指标体系与ARIMA 预测模型的应用状况良好,可以为该农场的区域物流系统规划与设计提供科学指导。