APP下载

基于融合影响因素PSO-Prophet模型的农产品价格预测

2024-02-26刘合兵王一飞王垒席磊尚俊平

湖北农业科学 2024年1期
关键词:农产品

刘合兵 王一飞 王垒 席磊 尚俊平

摘要:为了提高价格预测的准确度,在Prophet模型中融入了消费者物价指数(CPI)和经济政策不确定性指数(EPU)等影响因素,并使用粒子群算法优化参数。利用国际大蒜贸易网中的日价格数据,将该方法应用于山东省大蒜的价格预测。结果表明,融合影响因素的PSO-Prophet模型大蒜价格预测结果的平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)比Prophet模型分别降低了82.88%、82.86%和77.49%。融合影响因素的PSO-Prophet模型可以有效提高预测精度。

关键词:价格预测;融合影响因素;Prophet模型;PSO-Prophet模型;农产品

中图分类号:F323.7;TP311.1         文献标识码:A

文章编号:0439-8114(2024)01-0185-05

DOI:10.14088/j.cnki.issn0439-8114.2024.01.033 开放科学(资源服务)标识码(OSID):

Agricultural product price prediction based on the PSO-Prophet model with integrated influencing factors

LIU He-bing, WANG Yi-fei, WANG Lei, XI Lei, SHANG Jun-ping

(College of Information and Management Science, Henan Agricultural University, Zhengzhou  450046,China)

Abstract: In order to improve the accuracy of price prediction, factors such as the consumer price index (CPI) and economic policy uncertainty index (EPU) were incorporated into the Prophet model, and the particle swarm optimization algorithm was used to optimize the parameters. Using the daily price data from the International Garlic Trade Network, this method was applied to predict the price of garlic in Shandong Province. The results showed that the mean absolute error (MAE), mean absolute percentage error (MAPE), and root mean square error (RMSE) of the garlic price prediction results on the PSO-Prophet model with integrated influencing factors were reduced by 82.88%, 82.86%, and 77.49%, respectively, compared to the Prophet model. The PSO-Prophet model with integrated influencing factors could effectively improve prediction accuracy.

Key words: price forecasting; integrated influencing factors; Prophet model; PSO-Prophet model; agricultural products

收稿日期:2022-08-10

基金项目:河南省科技攻关项目(212102110204;222102110234);河南省现代农业产业技术体系项目(S2010-01-G04)

作者简介:刘合兵(1972-),男,河南台前人,副教授,主要从事数据挖掘研究工作,(电话)13838091929(电子信箱)liuhebing@henau.edu.cn;通信作者,尚俊平(1973-),女,河南新乡人,副教授,主要从事数据挖掘研究工作,(电话)13526729029(电子信箱)shangjunping@163.com。

价格是影响市场发展的基本要素,是市场经济运行的调节机制。近年来,中国农产品价格受到多种因素的影响,多次出现异常波动,严重影响人民群众的正常生活[1]。这些农产品包括大蒜、猪肉、小麦、绿豆等,其中大蒜的波动较突出[2]。大蒜价格的正常波动是市场运行的规律,大蒜的供求比会因价格的波动而变化,以达到调控市场商品供求平衡的目的。但是不正常的价格波动不仅会对大蒜市场带来巨大的冲击,而且严重损害生产者和消费者的利益[3]。因此,通过研究大蒜的价格,判断大蒜价格波动的整体趋势,有利于发挥市场调节作用,制定科学的引导,保持经济的持续增长和价格总水平的基本稳定,为蒜农提供更多信息,有助于蒜农做出科学的生产决策,保护蒜农的生产积极性,稳定大蒜的生产,以推进大蒜产业的可持续发展[4]。

从研究对象上看,针对不同农产品价格的研究已有很多,如苹果[5-7]、马铃薯[8-10]、棉花[11-13]、猪肉[14-16]及蔬菜[17-19]等。从研究方法上看,学者对农产品价格预测的方法大致分为两类:基于时间序列的预测方法和基于智能方式的预测方法。基于时间序列的预测方法包括差分整合移动平均自回归模型(ARIMA)、Holt-Winters、指数平滑、向量自回归(VAR)等。基于智能方式的预测方法又分为简单模型和复杂的神经网络模型两类,简单模型包括决策树、支持向量机(SVM)、小波分析等,复杂的神经网络模型包括反向传播神经网络(BPNN)、深度神经网络(DNN)等。每种模型都有各自的特点,在不同的应用场景下有着不同的预测效果。?ahinli[20]使用Holt-Winters模型和ARIMA模型对土耳其马铃薯价格进行了预测研究,结果表明ARIMA模型预测效果优于Holt-Winters模型。Mao等[21]考虑了新冠病毒感染对蔬菜价格的影响,使用ARIMA模型对中国的白菜、胡萝卜和茄子价格进行短期预测,结果表明ARIMA模型预测效果较好,蔬菜价格波动主要受疫情和季节因素影响。Dou等[22]使用BP神经网络模型和ARIMA模型对中国4种普洱茶的价格进行了预测研究,并且建立BP模型验证了不同影响因素组合的效果,结果表明ARIMA模型更适合短期的预测。Yin等[23]对白菜、萝卜、洋葱、辣椒和大蒜价格进行预测,发现引入注意力机制的长短期记忆网络模型(LSTM)预测精度明显优于其他基准模型。Ye等[24]引入了專业社区的讨论作为影响因素,利用异构图长短期记忆网络(HGLTSM)进行中国生猪价格的预测,研究表明引入社区讨论数据能够提高模型的预测精度。Xu等[25]选取美国近500个市场的玉米价格为研究对象,构建了单变量神经网络模型,结果表明神经网络模型预测精度较高且预测框架容易部署。Zelingher等[26]基于决策树和线性模型使用6种模型对玉米价格进行预测研究,结果表明决策树模型相较于线性模型有更高的预测精度。王晓蕾等[27]将LSTM和GARCH模型结合构建LSTM-GTEP预测模型对中国苹果价格进行预测,结果表明该组合模型的预测精度普遍高于单一模型。贾宁等[28]构建了一种LSTM-DA神经网络模型并且引入了温度和湿度等数据作为影响因素,预测未来一周蔬菜的价格指数。

农产品价格具有明显的周期性特征,并且有大量的重复值、离群值及由节假日影响的变动值。不同于传统的时间序列预测模型,Prophet模型先对时间序列进行周期性分解,再对序列进行预测,实质上是对时间序列数据的曲线拟合。Prophet模型对数据中的节日效应和趋势变化具有出色的适应能力,尤其对缺失值、趋势变化和异常值具有很强的鲁棒性[29]。有研究表明消费者物价指数、经济政策不确定性指数与农产品价格波动存在一定的相关性[30-32]。基于以上思考,本研究使用Prophet模型构建大蒜价格预测模型,并在原模型基础上将消费者物价指数和经济政策不确定性指数作为影响因素引入预测模型,然后使用粒子群算法优化超参数,提高模型预测的准确度。

1 数据获取与预处理

1.1 数据来源

大蒜价格数据为从国际大蒜贸易网(www.51garlic.com)中获取的山东省大蒜日价格数据,数据范围为2017年5月至2021年6月,数据样本数为1 426条,结果如图1所示。

影响因素中消费者物价指数(CPI)来源于国家统计局官网,经济政策不确定性指数(EPU)来源于Economic policy uncertainty官网(www.policyuncertainty.com)。2个指数的数据范围均为2016年1月至2021年8月的月度数据,数据样本数为68条。

1.2 数据预处理

由于原始大蒜的价格数据中部分日期的价格数据缺失。为了保证数据的完整性,使其在时间尺度上连续,需要先对原始序列进行缺失值填充。首先将缺失的日期补充完整并将当天对应的价格设置为空,然后根据缺失值前后距离最近的4个有效数据进行缺失值的填充,计算公式如下:

式中,xt为第t天的价格。

2 融合影响因素的PSO-Prophet模型构建

2.1 Prophet模型

Prophet模型是Facebook开源的一个可分解的时间序列预测模型。Prophet模型的计算公式如下:

式中,[yt为待分解的时间序列;g(t)]为时间序列的非周期趋势函数;[s(t)]表示周期项函数;[?(t)]表示节假日项函数。误差项[?t]表示符合正态分布的无法预测的波动。

2.1.1 趋势项 Prophet模型包含了饱和增长模型和分段线性模型2种趋势模型。

饱和增长与人口增长情况相似,通过非线性增长达到一个饱和值。饱和增长通常使用逻辑增长模型来建模,计算公式如下:

式中,[C]为承载力;[k]为增长率;[m]为偏移量。通常情况下,承载量、增长率和偏移量会随着时间而变化,因此这3个参数应为函数。计算公式如下:

式中,[C(t)]为承载量函数;[k(t)]为增长率函数;[m(t)]为偏移量函数,三者均为随时刻[t]变化的函数。

对于不会出现饱和值的预测问题,使用分段的线性模型,计算公式如下:

式中,δ为增长率的变化量;[αt]为在t时刻之前突变点发生变化的次数;[γ=-s×δ],[s]与突变点的选取有关;T为转置。

2.1.2 周期项 时间序列随着周、月、年等的变化会呈现季节性变化,也称为周期性变化。Prophet模型使用傅里叶级数来模拟时间序列的周期性,假设[P]表示时间序列的周期,[P=365.25]表示以年为周期,[P=7]表示以周为周期。周期项的傅里叶级数计算公式如下:

式中,[st]为周期项函数;a、b为幅度;n为傅里叶级数中的特定项数。

对于以年为周期的序列[(P=365.25)],总的傅里叶级数项数[N=10]。以周为周期的序列[(P=7)],[N=3]。幅度形成列向量[β],公式如下:

式中,[β]为所有周期性的幅度;T为转置。

当[N=10]时,

当[N=3]时,

式中,[Xt]为季节性指示函数。

时间序列的季节项为[st=X(t)β],而[β]服从[β~Normal(0,σ2)]分布。[σ]越大,表示季节效应越明显;[σ]越小,表示季节效应越不明显。

2.1.3 节假日项 不同节日的假期持续时间不同,并且許多节日都是按照阴历来的。一个特定节日对时间序列的影响每年都是相似的,因此有必要将其纳入预测模型。Prophet模型提供了一个灵活的拟合节假日的模型,允许使用者根据情况自定义节假日。假设有[L]个节假日,那么节假日项函数[?t]的计算公式如下:

式中,Z(t)为特征矩阵,[Zt=(1t∈D1,…,] [1t∈DL);k=k1,…,kLT];Di表示第[i]个节假日的前后一段时间;ki表示节假日的影响范围;[k~Normal] [(0,v2)],该正态分布受参数[v]的影响。参数[v]用来控制节假日的灵活度,v越大,表示节假日对模型的影响越大;v越小,表示节假日对模型的影响越小。

2.2 PSO算法

粒子群算法是一种求解问题的方法,其解可以表示为n维空间中的一个点。许多粒子在n维空间中随机运动。在每次迭代中,粒子观察自己与其他粒子的适应性,并向当前位置更好的粒子靠拢。第[k]次迭代时粒子[i]的位置和速度的计算公式如下:

式中,[Xik]为位置函数;[Vik]为速度函数;k为迭代次数;n为维度数。

粒子[i]在解空间中记录自身截至目前所获得最佳解的坐标,这个值被称为本地最佳[Lbesti]。粒子群算法记录的另一个最佳值是该粒子附近的所有粒子迄今为止获得的最佳值,这个值被称为全局最佳[Gbest]。粒子群算法的基本概念在于使每个粒子加速到其局部最佳和全局最佳位置。粒子[i]在第[k+1]次迭代时的位置和速度可以根据以下公式计算。

式中,[ω]为惯性权重;[c1]和[c2]为学习因子;[ω、c1]和[c2]决定了局部最佳位置[Lbestik]和全局最佳位置[Gbestk];[r1]、[r2]为[0,1]内的随机数。

2.3 融合影响因素优化预测模型

为准确预测大蒜的价格,考虑消费者物价指数与经济政策不确定性指数的影响,将消费者物价指数与经济政策不确定性指数的数据按照与大蒜相同的时间序列长度填充。将填充后的消费者物价指数与经济政策不确定性指数时间序列数据作为额外的回归变量添加到Prophet模型中。添加到模型中的影响因素数据会和周期项、节假日项一样以加法的形式作用于模型最终的预测结果。模型参数能够调整影响因素对预测结果的影响程度,不同的影响因素能够分别调整强度,从而提高模型预测的准确度。

2.4 评价指标

选取平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)3个指标来评估Prophet预测模型的预测效果,计算公式如下:

式中,[n]为价格样本数量,[i]为样本集中第[i]个样本,[y]为真实值,[y]为预测值。MAE、MAPE、RMSE越小,则表示模型预测的准确性越好。

3 结果与分析

3.1 大蒜价格预测结果

将大蒜价格、消费者物价指数与经济政策不确定性指数数据按照Prophet时序模型的输入格式进行整理。从后向前截取长度为31 d的数据为测试集,余下数据为训练集。

根据大蒜价格数据的时间跨度,设定2017年1月至2021年10月中国主要节假日,如表1所示。

使用Prophet模型对2021年5月12日至2021年6月11日的大蒜价格进行预测,预测结果如图2所示。最后一段横坐标31 d长度的深蓝色曲线表示使用该模型所得到的预测值。

使用Prophet模型预测时间序列时需要调节较多超参数,其中一部分超参数的取值为连续值,使用网格搜索法将耗费大量的资源和时间,并且不能确定得到的超参数值是否为最优解。因此本研究使用粒子群算法来优化Prophet模型的超参数,提高Prophet模型的预测效果。将消费者物价指数与经济政策不确定性指数数据作为额外回归量引入PSO-Prophet模型,预测结果如图3所示。

Prophet、融合影响因素的Prophet(Prophet+influence)和融合影响因素的PSO-Prophet (PSO-Prophet+influence)3个模型在测试集上大蒜价格的预测值与大蒜价格真实值对比结果见图4。融合影响因素的Prophet模型比Prophet模型更接近真实值,融合影响因素的PSO-Prophet模型预测效果最好。

3.2 大蒜价格预测评价

通过平均绝对误差、平均绝对百分比误差与均方根误差3个指标对3个预测模型进行评估。由表2可知,虽然预测值与真实价格存在差异,但整体上Prophet模型预测结果的精确度较高。在融合了影响因素的数据后,Prophet模型预测结果的平均绝对误差、平均绝对百分比误差和均方根误差比Prophet模型分别降低了21.51%、21.66%和20.31%;加入粒子群算法后,PSO-Prophet模型预测结果的平均绝对误差、平均绝对百分比误差和均方根误差比Prophet模型分别降低了82.88%、82.86%和77.49%。融合影响因素的Prophet模型能提高大蒜价格预测的准确度,而加入粒子群算法后进一步提高了预测效果,融合影响因素的PSO-Prophet模型预测效果最优。

4 小结与讨论

在Prophet模型基础上,在考虑节假日等因素影响下,融合消费者物价指数与经济政策不确定性指数数据来预测山东省大蒜价格,同时利用粒子群算法解决Prophet模型超参数难以确定的问题。结果表明融合影响因素的PSO-Prophet模型预测效果最优。

融合不同影响因素的价格预测模型可以及时反映市场价格变化的信息,为生产者提供决策依据,减少因价格波动造成的损失,协助农产品加工企业完成相关决策以实现企业效益最大化,也可为农产品市场的经营和管理提供一定的理论依据。

参考文献:

[1] 张 璇. 基于LSTM的河南省花生價格预测研究[D].郑州:华北水利水电大学,2021.

[2] 马小菁. 基于时间序列分析的山东大葱价格预测研究[D].山东烟台:烟台大学,2021.

[3] 冯玉亮. 基于改进EEMD-GRU组合模型的大蒜价格预测研究[D].山东泰安:山东农业大学,2021.

[4] 苑甜甜. 我国大蒜价格波动特征及影响因素分析[D].河北保定:河北农业大学,2018.

[5] 王晓蕾,张 艳,柳平增,等.基于堆叠式LSTM与熵值法的苹果价格组合预测模型研究[J].中国农机化学报,2021,42(10):157-164.

[6] 张顺利,王小东,李艳翠.基于LSTM神经网络的苹果价格预测模型[J].河南科技学院学报(自然科学版),2020,48(5):73-78.

[7] 刘 斌,何进荣,李远成,等.基于分布式神经网络的苹果价格预测方法[J].计算机应用,2020,40(2):369-374.

[8] 伦闰琪,罗其友,高明杰,等.基于组合模型的我国马铃薯价格预测分析[J].中国农业资源与区划,2021,42(11):97-108.

[9] 刘合兵,韩晶晶,马新明,等.基于EMD-ELM模型的农产品价格预测研究[J].农业大数据学报,2020,2(3):68-74.

[10] 白 伟,李凤英.基于BP神经网络的马铃薯价格预测[J].价值工程,2020,39(15):201-203.

[11] 江知航,王艳霞,颜家均,等.基于BILSTM的棉花价格预测建模与分析[J].中国农机化学报,2021,42(8):151-160.

[12] 曹建飞.基于多尺度组合模型的我国棉花价格预测[J].统计与决策,2021,37(2):176-180.

[13] 孙 磊,袁欣晨.基于马尔科夫链的棉花价格波动预测[J].全国流通经济,2020(12):129-131.

[14] 葉 勇,许 潘,辜丽川,等.基于Prophet-BP模型的猪肉价格预测研究[J].黄山学院学报,2021,23(5):75-80.

[15] 凌立文,陈诗欣,张大斌,等.基于多时间尺度组合策略的我国猪肉价格预测研究[J].系统科学与数学,2021,41(10):2829-2842.

[16] 李 阳,王晓光.基于PCA-GM-BP神经网络的猪肉价格预测分析[J].数学的实践与认识,2021,51(5):56-63.

[17] 曹新悦,贺春林,崔梦天.基于X12-ARIMA和LSTM组合模型的城市蔬菜价格波动规律及预测[J].西南民族大学学报(自然科学版),2021,47(4):418-425.

[18] 陈林生,孙利君,马 佳.蔬菜价格短期预测模型比较研究——以上海市青菜价格为例[J].价格理论与实践,2020(9):68-71,178.

[19] 喻沩舸,吴华瑞,彭 程.基于Lasso回归和BP神经网络的蔬菜短期价格预测组合模型研究[J].智慧农业(中英文),2020,2(3):108-117.

[20] SAHINLI M A. Potato price forecasting with holt-winters and ARIMA methods: A case study[J]. American journal of potato pesearch, 2020, 97(4): 336-346.

[21] MAO L, HUANG Y, ZHANG X, et al. ARIMA model forecasting analysis of the prices of multiple vegetables under the impact of the COVID-19[J]. PLoS one, 2022, 17(7): e0271594.

[22] DOU Z, JI M, WANG M, et al. Price prediction of Puer tea based on ARIMA and BP models[J]. Neural computing and applications, 2022, 34(5): 3495-3511.

[23] YIN H, JIN D, GU Y H, et al. STL-ATTLSTM: Vegetable price forecasting using STL and attention mechanism-based LSTM[J]. Agriculture, 2020, 10(12): 612-628.

[24] YE K, PIAO Y, ZHAO K, et al. A heterogeneous graph enhanced LSTM network for hog price prediction using online discussion[J]. Agriculture, 2021, 11(4): 359-372.

[25] XU X, ZHANG Y. Corn cash price forecasting with neural networks[J]. Computers and electronics in agriculture, 2021, 184: 106120.

[26] ZELINGHER R, MAKOWSKI D. Forecasting global maize prices from regional productions[J]. Frontiers in sustainable food systems, 2022, 6: 69-78.

[27] 王晓蕾,张 艳,柳平增,等.基于LSTM与GARCH族组合模型的苹果价格预测分析[J].山东农业大学学报(自然科学版),2021,52(6):1055-1062.

[28] 贾 宁,郑纯军. 基于 LSTM-DA 神经网络的农产品价格指数短期预测模型[J]. 计算机科学, 2019, 46(S2): 62-65,71.

[29] 滕金玲,柳平增,张 艳,等.基于Prophet的生姜价格预测研究[J].中国农机化学报,2020,41(8):211-216.

[30] 白 阳. 经济政策不确定性对农产品期货价格的影响研究[D].成都:西南财经大学,2020.

[31] 郭 丹,谭 莹.农产品价格波动及其随机性因素影响研究[J].价格理论与实践,2020(3):67-70,177.

[32] 赵新伟,夏欣瑶,邹玉婷,等.经济政策不确定性对大宗商品价格的影响研究[J].江苏理工学院学报,2022,28(1):55-64.

猜你喜欢

农产品
农产品网店遭“打假”敲诈 价值19.9元农产品竟被敲诈千元
上半年我国农产品出口3031亿元,同比增长21.7%
这些模式解决农产品滞销
打通农产品出村“最先一公里”
“甘味”农产品
山西省打开农产品供深通道
墨对美农产品贸易顺差再创新高
各地农产品滞销卖难信息(二)
农产品包装设计的funny
大茶网助推农产品上行