APP下载

基于多元回归的BP神经网络生猪价格预测模型

2019-09-23任青山方逵朱幸辉

江苏农业科学 2019年14期
关键词:多元回归分析影响因子BP神经网络

任青山 方逵 朱幸辉

摘要:生猪价格波动是由多种因素共同影响决定的,准确预测生猪价格对稳定农产品市场具有重要意义。首先分析影响生猪价格波动的影响因子及生猪价格变化规律和趋势,然后通过灰色关联度分析和Stepwise回归分析影响生猪价格波动的主要影响因子,再利用多元回归分析和反向传播(BP)神经网络构建BP-多元回归预测模型,对生猪价格进行预测,并对预测结果进行分析。结果表明,BP-多元回归预测模型较单一的多元回归和BP神经网络预测模型预测精度提高了10百分点以上,预测精度高达93.3%,大大提高了生猪价格预测的准确性和可靠性。

关键词:生猪价格;影响因子;BP神经网络;关联度;多元回归分析

中图分类号:S126   文献标志码: A  文章编号:1002-1302(2019)14-0277-05

猪肉在我国肉类产品消费中的占比超过66%,在食品中的占比超过20%,因而猪肉是关乎国计民生的重要食品,生猪生产自然而然也就成为了重中之重,受到了社会的广泛关注。生猪是我国农产品市场中最基本、最重要的组成部分,生猪价格是农产品市场的核心要素[1]。然而,近年来生猪价格波动异常,经常陷入“猪贵伤民,猪贱伤农”的恶性循环,并表现出明显的波动性及周期性。生豬市场价格的频繁波动给生产经营者带来了很大困扰,在一定程度上打击了农户的生产积极性。如果能够对生猪市场价格的波动作出较准确的分析和预测则能够帮助生产经营者制定决策,并为以后的产销计划提供一定的参考依据,能够在很大程度上减缓生猪价格波动带来的不良影响,减少生产经营者的经济损失[2]。但生猪价格具有一定的特殊性,其波动频繁,且受其他市场因素影响,因而无法用常规的传统算法对其进行预测。随着科学技术的进步与发展,价格预测的模型和方法已经有了显著的改进,但是仍无一个模型能把生猪价格变化拟得非常紧密,关于生猪价格预测的方法仍然存在诸多的讨论。现阶段发展较成熟的价格预测模型有灰色系统模型、时间序列模型、神经网络模型等。在现有研究中,国外学者对生猪价格波动分析与预测的研究起步较早,且理论系统也相对较成熟,他们主要从生猪的供给、需求及国内外生猪市场环境等方面论述生猪价格波动的成因,而国内学者对生猪价格的波动周期、影响因素及其价格预测模型等方面进行广泛深入的研究[3]。付莲莲等利用灰色关联和最小二乘支持向量机算法(LS-SVM)模型分析生猪价格波动的成因,并建立了生猪价格与其影响因子之间的关系模型,对生猪价格波动进行预警分析[4]。郝妙等利用灰色系统理论建立一种基于弱化缓冲算子的GM(1,1)预测模型,通过生猪价格的历史数据对其未来价格进行预测,对未来生产决策具有一定的指导意义[5]。本研究分析生猪价格的波动规律、波动周期及影响生猪价格波动的因素,通过灰色关联度和逐步回归分析得出生猪价格波动的主要影响因子,并结合多元回归分析和反向传播(BP)神经网络算法构建交叉预测模型,以提高预测的准确性和可靠性,进而对未来生猪价格进行预测并提出相应的生猪价格风险调控策略。

1 生猪价格分析研究

1.1 数据来源

在研究生猪价格波动规律时,选取2012年1月第1周至2017年9月第4周全国待宰活猪的周度价格作为研究对象,共300组数据,数据来源于中国农业信息网及中国畜牧业信息网。

1.2 生猪价格规律及周期

由图1可知,近年来生猪价格波动较大,特别是2014年4月第4周全国生猪平均价格跌至了历史最低,仅 10.97元/kg,给生猪生产者造成了重大经济损失。每年2月份开始生猪价格开始下跌,到4、5月份跌到最低点,主要是因为4月份开始天气逐渐变暖,国民对猪肉的需求量减少;而到了每年的9月份生猪价格又会上涨至较高点,随后会有小幅度的回落,到了12月份后又会迎来一个新的上升周期,主要是因为9月和1月我国传统节日较多,如中秋节、春节等,我国居民对猪肉的需求量较大,拉动了生猪价格上涨。通过总结文献及实证研究分析可知,虽然生猪价格波动剧烈,但也存在一定的周期性,每3年左右生猪价格有一个较大的周期性变化,2014年4月至2017年4月我国生猪价格就经历了1次周期性变化。

1.3 生猪价格波动影响因子

生猪市场是一个开放性的系统,影响生猪价格波动的因素错综复杂,通过分析生猪价格的形成发现,影响生猪价格波动的因素大致可分为供给、需求、市场外因素等3个方面[6]。供给因素主要包括仔猪费用、育肥猪饲料成本、医疗成本、人工成本、生猪存栏量及出栏量等。生猪生产需要一定的周期,

一般从仔猪到成猪需要5~6个月时间,期间生猪生长需要大量的饲料供给,在生猪饲料中玉米是主要成分,占60%以上,余下饲料成分以豆粕和麦麸为主[7]。需求因素主要包括鸡蛋、牛肉、羊肉等可替代产品的价格,这些产品的价格变化会影响居民对猪肉消费的需求,进而影响生猪价格;居民收入变化也会在一定程度上影响他们对猪肉的需求。市场外因素主要包括季节因素、疫情、自然灾害、国家相关政策等。每逢节假日,居民对猪肉的消费需求就会增加;出现重大疫情或自然灾害时,猪肉价格自然也就随之下跌或上涨,进而影响生猪价格[8]。

大量文献资料表明,仔猪价格、猪肉价格、玉米价格、猪肉可替代品价格对生猪价格波动影响显著[9]。因此,选取仔猪、猪肉、鸡蛋、牛肉、羊肉、玉米、豆粕、育肥猪饲料等8种影响因子的价格进行研究,试验数据来源于中国农业信息网及中国畜牧业信息网。

2 研究方法

2.1 BP神经网络算法

BP神经网络是一种按误差逆传播算法训练的多层前馈神经网络,别称误差反向传播神经网络,是当前应用最为广泛的神经网络模型之一。BP神经网络对信息处理具有自组织、自学习、知识推理等特点,对非确定规律性系统具有自适应特征,可以利用对样本的训练实现从输入到输出的任意非线性函数关系映射,并从这些映射关系中揭示其内在规律、特征。

BP神经网络是一种多层前馈神经网络,其主要特点是信号前向传播,误差反向传播。在前向传播过程中,输入信号从输入层经隐含层逐层处理,直至输出层,产生输出信号,每一层的神经元状态只影响下一层的神经元状态;若输出信号不能满足期望输出要求,则转入误差反向传播过程,根据预测误差从输出层开始到输入层,不断修正网络的权值和阀值,从而使BP神经网络的预测输出不断逼近期望输出[9]。

由图2可知,BP神经网络由输入层、隐含层、输出层3部分组成,其中隐含层可以有多层。X1,X2,…,Xn表示BP神经网络的输入值;W1,W2,…,Wp表示BP神经网络的隐含层节点;Y1,Y2,…,Ym表示BP神经网络的输出值;Wij和Wjk表示BP神经网络权值。

BP神经网络在进行预测前须要先进行网络模型训练,通过网络训练使网络具备联想记忆和预测能力。在网络训练过程中隐含层神经元个数通常难以确定,如果神经元个数较少,则网络对样本的识别力较低,难以完成网络训练;如果神经元个数较多,则会增加网络迭代次数,从而延长网络的训练时间,同时会降低网络的泛化能力,导致网络的预测能力下降[10]。然而,目前还没有较准确的方法来确定隐含层神经元个数,只能通过经验公式,并结合多次的试验比对来确定隐含层神经元数目。

3 生猪价格预测模型

3.1 关联度分析

3.1.1 灰色关联度分析模型 关联度是对事物或因素间关联性大小的度量。如果事物或因素变化的态势基本一致,则表明它们之间关联度较大,反之,则关联度较小。虽然使用传统的回归、相关等统计分析方法也能对事物或因素之间的关联性进行分析,但是往往需要较大的数据量,且要求数据的分布特征较明显。相对来说,灰色关联度分析所需的数据量较少,不需要典型的数据分布规律,计算量较小,原理简单易于理解和掌握,且其分析结果与定性分析结果较吻合[12]。

灰色关联度分析是一种多因素统计分析法,主要根据各因素变化曲线几何形状的相似度来判断因素之间的关联度大小,在进行分析时须比较研究对象与待识别对象之间的曲线贴近程度,并分别量化,计算出研究对象与待识别对象之间的关联度,进而通过比较各关联度的大小来判断待识别对象对研究对象的影响程度[13]。简单来说,当对某个系统进行灰色关联度分析时,先要确定使用的关联度模型,选好参考序列、比较序列,然后计算关联度,最后按关联度的大小进行排序和分析并得出结论[14]。

为进一步剖析生猪价格波动的成因,探究生猪价格与其影响因素之间的相关性,本研究选取生猪价格为参考序列,仔猪价格、猪肉价格、鸡蛋价格、牛肉价格、羊肉价格、玉米价格、豆粕价格及育肥猪饲料价格为比较序列(表1),并利用灰色关联度分析法计算各比较序列与参考序列之间的关联度(表2)。

通过灰色关联度分析可知,生猪价格与仔猪价格、猪肉价格、鸡蛋价格、玉米价格、豆粕价格的相关性较高,关联度均在0.7以上,说明这些因素对生猪市场价格的波动具有一定程度的影响,其中生猪价格与猪肉价格之间的关联度高达0.932,说明二者之间有着直接的相互影响。

由图3可知,生猪价格与仔猪价格、猪肉价格、鸡蛋价格之间的曲线变化态势较相似,说明它们之间具有一定的相关性。另外,生猪价格曲线与猪肉价格曲线的变化态势基本一致,说明它们之间具有较高的相关性,该结论与灰色关联度分析的结果基本相同。

3.1.2 Stepwise回歸模型 Stepwise回归分析通过使用最少的预测变量数来最大化预测能力,剔除变量中相关性较低的变量和存在多重共线的变量,使得剩余变量最优,是处理高维数据集的主要方法之一。其基本思想是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除,以确保每次引入新的变量之前回归方程中只包含显著性变量,这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止,以保证最后所得到的解释变量集是最优的[15]。

由表2可知生猪价格与其影响因子之间的关联度排序,为进一步确定生猪价格的显著影响因子,本研究建立Stepwise回归模型对表2中的影响因子进一步筛选。

用预测验证集对生猪价格BP-多元回归预测模型进行检验,结果见表5。由表5可知,通过模型预测的生猪价格走势跟实际价格走势基本保持一致,且预测值和期望值很接近;通过计算可知,模型预测后的生猪价格平均绝对误差仅为0.156,相对误差绝对值低于2%的占93.33%。而多元回归预测模型和BP神经网络预测模型在进行单独预测时,生猪价格相对误差绝对值低于2%的仅分别占80%、83%,对比分析可知,BP-多元回归预测模型在预测时具有更好的拟合效果,大大提高了预测的准确率,在生猪价格预测方面具有更好的预测效果。

4 结论

本研究通过分析生猪价格得出生猪价格的基本波动规律及其波动周期,并通过灰色关联度和Stepwise回归分析发现,影响生猪价格波动的主要影响因素为仔猪价格、猪肉价格、玉米价格及豆粕价格,最后通过多元回归分析和BP神经网络的交叉应用建立一种组合预测模型,该模型综合考虑了生猪价格影响因素以及往期生猪价格数据对生猪价格预测的影响。结果表明,该预测模型具有较好的预测效果,对比单一的多元回归预测模型和BP神经网络预测模型,该模型的预测精度有较大提升,高达93.33%。利用该预测模型对生猪价格进行预测,可以在一定程度上帮助生产经营者制定相关的生产决策,具有指导意义,能有效预防生猪价格波动带来的风险,减免损失。

参考文献:

[1]潘方卉,刘丽丽,庞金波. 中国生猪价格周期波动的特征与成因分析[J]. 农业现代化研究,2016,37(1):79-86.

猜你喜欢

多元回归分析影响因子BP神经网络
“影响因子”是用来赚大钱的