基于GM(1,1)回归模型的烟台市物流需求预测
2019-12-31卜令营樊东鑫
卜令营,侯 宏,樊东鑫
(烟台大学 经济管理学院,山东 烟台 264005)
1 引言
物流业作为社会经济发展的新生产业,逐渐受到政府和社会的广泛关注。一般来说,一个地区的物流水平在某种程度上体现了该地区的经济发展水平和社会管理水平。物流是城市经济发展的基础,是连通生产和消费之间的桥梁,更是衡量一个国家综合国力和现代化水平的主要标志之一。根据供需平衡理论,当物流服务的供给小于其需求时,会在一定程度上抑制物流需求,造成需求不足;同理,如果供给大于需求,则会产生资源闲置,造成资源浪费,进而降低物流效率,所以准确而合理的物流需求预测显得尤为重要。
物流需求预测就是根据过去的资料和数据,运用一定的手段和方法,对未来的物流需求进行准确的分析和估计,其目的在于指导和管理物流活动,调整产业结构,优化资源利用,从而制定物流发展政策和规划。
烟台地理位置优越,面向日韩及东北亚经济发达地区,背靠京津鲁豫广阔的经济腹地,拥有铁路、公路、水路和管道“四位一体”的集疏运网络;同时具备较好的产业基础和政策环境支持,现已初步建立起化工、电子、建材、煤炭等门类齐全的产业生产体系,是山东省重要的工业生产基地;烟台作为山东新旧动能转换、中韩(烟台)产业园、“一带一路”海上重要节点城市以及山东自贸区烟台片区四个国家战略于一身,政策叠加效应凸显。本文正是在这一背景和前提下,对烟台市物流发展现状及发展目标进行分析,构建准确的预测模型,对物流需求进行合理分析,从而制定城市物流发展规划,进一步将烟台市打造成东北亚物流交通枢纽。
2 文献综述
随着经济的快速发展,有关物流需求预测方面的研究也越来越多。目前,学者们对物流需求的预测方法可大体归纳为三大类:一为定性预测方法,如德尔菲法、情景分析法、集体意见法等,该方法在数据缺乏时比较适用,方法较简单,主观因素较大,预测精度不高,很少有学者使用。其二为定量预测方法,即根据一定的历史数据,运用相关方法,构建合理的数学模型,对预测对象的未来状态和性质进行估计推断,如灰色预测模型、线性回归法(包括一元和多元)、时间序列预测法等,该方法适用于数据较多且要求较高的精确度,例如周晓娟,景志英[1]建立多元线性回归模型,对河北省的物流需求进行预测,并提出了加快河北省物流发展的建议;张丽萍等[2]利用灰色模型GM(1,1)对临沂市物流进行预测;邱慧等[3]利用灰色预测模型GM(1,2)模型,对山西省未来三年的物流需求进行了较高精度的预测;李凯,张涛[4]基于改进的GM(1,1)模型对上海市2017—2020 年的GDP 进行了预测;黄毅,夏国恩[5]基于SVR 模型对广西省的物流需求进行了预测。其三为组合预测方法,即利用多种预测方法进行组合后预测。如徐兴华[4]基于经济学的视角分析物流需求影响,采用组合预测方法进行了物流需求预测研究;杨树果,王新利[5]将偏最小二乘回归与灰色模型耦合对物流需求进行预测,充分利用了两者的优点,使预测精度进一步提高,预测结果更加合理;刘文慧,王少然[6]建立了基于GM(1,1)回归的预测模型,并预测了未来十年天津市农产品产量预测值,表明多元线性回归结合GM(1,1)模型可以用来做预测。
以往学者大都采用单一的灰色系统模型对物流需求进行预测,精确度不高,较少采用组合预测方法,尤其是较少采用基于GM(1,1)回归的预测模型对物流需求进行预测。物流需求量受到多个经济因素的共同影响,多元线性回归模型可以综合考虑影响货运量的因素,而且根据回归分析,消除了变量间的多重共线性和自相关性。以解释变量的GM(1,1)预测值为基础对多元线性回归模型中的被解释变量进行预测,所得预测结果将具有说服力;将被解释变量的灰色预测结果与基于GM(1,1)回归模型的结果相互对比,进一步证实了组合预测方法的精确度与合理性。
本文根据烟台市的实际发展情况,选取统计年鉴中1998-2017 年影响货运量的相关因素作为预测模型的解释变量,采用组合预测方法进行预测,建立基于GM(1,1)回归的需求预测模型对烟台市未来五年的货运量进行了预测,并与多元线性回归的结果进行比较,结果表明,基于GM(1,1)的多元线性回归模型具有较高的预测精度,为烟台市物流资源的合理配置、产业结构优化升级以及为政府制定现代物流业的发展规划提供了参考。
3 数据选取及描述性统计
影响物流需求的因素很多,有经济因素,也有非经济因素,而且各因素之间具有较强的相关性,在借鉴以往学者研究的基础上,结合烟台市物流发展现状以及充分考虑所选指标的易获取性、科学性、全面性等原则,本文主要选取了烟台市货运量Y(万t)作为被解释变量,第一产业产值X1(亿元),第二产业产值X2(亿元),第三产业产值X3(亿元),固定资产投资X4(亿元),社会消费品零售额X5(亿元),外贸进出口总额X6(亿美元),公路通车里程X7(km),沿海货物吞吐量X8(万t)八个指标作为解释变量(见表1)。选择第一二三产业产值取代地区生产总值作为解释变量,是因为一方面它可以解释产业结构对物流需求的影响,另一方面也可以解释地区生产总值对物流的影响。
表1 烟台市1998-2018年相关影响因素指标数据
4 实证分析
4.1 建立多元线性回归模型
多元线性回归模型的一般形式为Y=β0+β1X1+β2X2+...+βpXp+ε,其中β0,β1,β2,…,βp是有待回归确定的系数,y是被解释变量,X1,X2,…,Xp是解释变量,ε是随机误差。根据表1相关影响指标可建立烟台市物流需求模型:
4.2 相关性分析
通常认为,当两变量相关系数之间的绝对值大于0.8时,具有较强的线性关系,而相关系数的绝对值小于0.3时,则表明两变量之间的线性关系较弱。
由表2可以看出,解释变量之间的相关系数非常高,均大于0.8,而且均在0.05 水平显著,怀疑存在严重的多重共线性。一般来说,解释变量之间的相关性是普遍存在的,在一定程度上也是允许的。
4.3 参数估计
将表1中相关影响因素指标数据导入Stata15 软件,运用普通最小二乘法估计,得到回归结果见表3。
表2 解释变量的相关系数矩阵
表3 最小二乘法参数估计结果
4.4 模型检验
4.4.1 多重共线性检验及修正。从回归结果可以看出:y对8个自变量的线性回归方程为:y=10 444.167-68.795X1+15.555X2+3.885X3+1.505X44-14.468X5-34.760X6+0.026X7+0.810X8,可决系数R2=0.967表明回归方程的拟合程度很高,F=39.949,P=0.000<0.05可知回归方程拒绝零假设,通过了F检验,说明变量X1,X2,X3,X4,X5,X6,X7,X8整体上对y有高度显著的线性影响。
但是自变量回归系数只有X2,X6显著,其它系数均不显著,进一步确定存在严重的多重共线性。多重共线性普遍存在,其所表现的是一个程度大小的问题。对于多重共线性的修正方法,一般有逐步回归法、主成分分析法、岭回归等,本文选择用逐步回归法来降低多重共线性的严重程度。
表4 逐步回归法结果显示
经逐步回归得到新的线性回归模型为y=13 687.670-105.356X1+20.426X2-28.167X6,R^2=0.955 0 ,Pr ob >F=0.000 0,方程通过了F检验,而且各变量的系数显著,多重共线性程度被削弱。
4.4.2 自相关检验。结果显示d=2.185 972,对于n=20,k=4,在 5%的显著水平查表得 d1=0.894 ,d2=1.828 ,du≤d ≤4-dl,无法判断是否存在自相关,DW检验失效,改用BG检验。
表5 BG检验
由 BG 检验可知,p 值为 0.670 大于 0.05,故接受原假设H0,即不存在自相关。
4.4.3 异方差性检验。本文采用怀特检验来检验是否存在异方差,结果见表6。
表6 怀特检验
由表6中数据可知,p值均大于0.05,没有通过显著性检验,从而接受原假设,不存在异方差性。
4.4.4 残差正态性检验
图1 标准化残差直方图
图2 正态概率图
从标准化残差的直方图(如图1所示)可以看出,标准化残差服从N(0,1)的正态分布;而且在正态概率图(如图2所示)中,散点大都围绕在对角线上分布,故判断残差满足正态性检验。
4.5 预测结果分析
运用建立的模型对一个实例进行预测,结果见表7与图3。
从表7和图3可以看出,最小误差率为0.57%,最大误差率为14.57%,平均误差率为7.18%<10%。综上所述可知该模型精确性较好,可以用来预测烟台市的物流需求。
表7 预测结果分析
图3 真实值与预测值拟合程度图
5 建立烟台市物流需求预测的GM(1,1)模型
5.1 GM(1,1)模型
对数列X(1)建立微分方程:
其中-a为发展系数,b为灰色作用量。记为有待估计确定的向量,则:
将式(2)求得的a带入式(1)求解微分方程GM(1,1)模型:
5.2 GM(1,1)回归模型预测精度验证
通过多元线性回归可知,货运量y与第一产业产值x1、第二产业产值x2、外贸进出口总额x6有较强的关联性,所以可对这三个变量进行灰色GM(1,1)预测。建立GM(1,1)模型至少要有四个数据,本文以2013年-2016年X1,X2,X6数据来预测2017年的X1,X2,X6。将预测后的值代入线性回归方程Y=13 687.670-105.356X1+20.426X2-28.167X6,验证2017年货运量拟合程度,并与2013-2016年货运量y通过GM(1.1)模型直接预测2017年货运量拟合程度做对比,分析结果如下:
(1)第一产业产值x1、第二产业产值x2、外贸进出口总额x6的数据分别为:
表8 2013-2016年灰色GM(1,1)作用量
由表8可知,-a<0.3 且平均相对误差较小,可以用来预测2017 年 X1,X2,X6值,并将预测值带入方程y=13 687.670-105.356X1+20.426X2-28.167X6,求得2017货运量,所得结果见表9。
表9 GM(1,1)与多元线性回归方程结合预测2017年货运量
同理,根据烟台市2013-2016年货运量可得到原始数列X(0)=(20 121.90,19 771.70,19 930.28,22 360.90),对其作1-AGO 累加,生成新数列X(1)=(20 121.90,39 893.6,59 823.88,82 184.78) ,计算级比数列和光滑比数列分别为δ(t)=(1.983,1.500,1.374) ,p(t)=(0.983,0.500,0.374),当t>2 时,δ(t)∈[1,1.5)满足灰指数律,此时,p(t)<0.55 符合准光滑条件,所以可以对X(1)建立GM(1,1)模型。
设X(1)的紧邻均值生成序列为 Z(1),,其中K=1,2,3,...n,经计算得Z(1)=(30 007.750 0,49 858.750 0,71 004.350 0)),运用最小二乘法求得发展系数-a=0.064,b=17 483.198,-a<0.3 且平均相对误差为2.396%,适合中长期预测,最终可得2017年货运量预测值为23 457.633,见表10。
表10 GM(1,1)模型预测2017年货运量
由表8和表9可知,GM(1,1)预测模型与多元线性回归方程的有机结合,一方面保留了多元线性回归中变量的相关关系,另一方面又充分利用了灰色GM(1,1)模型少数据建模及适用于中长期预测的优势,使预测结果更加准确。
5.3 基于GM(1,1)回归模型的预测分析
本文以2013-2017 年 5 年间的 X1,X2,X6数据预测2018-2022 年的 X1,X2,X6,计算过程不再赘述,平均模拟误差率较小且-a <0.3,所以该模型适合中长期预测具体见表11-表13。将灰色GM(1,1)模型的输出结果作为多元线性回归预测方程的输入,从而在比较全面考虑各影响因素的基础上,实现GM(1,1)预测模型与多元线性回归方程的优化结合,最终取得较高精度的预测结果。
表11 2013-2017年灰色GM(1,1)作用量
表12 2018-2022年主要需求指标预测结果
表13 2018-2022年货运量预测
6 基本结论与对策建议
通过多元线性回归分析,求得回归方程y=13 687.670-105.356X1+20.426X2-28.167X6,可得出以下结论:在引入的8个变量中,第一产业产值X1、第二产业产值X2、外贸进出口总额X6对货运量有显著的影响。第一产业产值对物流需求表现为负影响,第二产业产值对物流需求表现为正影响,表明烟台市已经脱离以第一产业拉动为主的物流发展阶段,主要依靠第二产业;目前烟台市正处于新旧动能转换关键时期,这对传统的物流提出了新的挑战,要求物流在产业结构与功能上进行相应的调整,烟台市想要扩大物流需求,有必要降低第一产业比例、提高第二产业的比例,加强产业结构调整优化。外贸进出口总额对物流需求表现为负影响,进出口业务对物流相关服务水平要求较高,烟台市相应的物流基础设施服务不是很完善,对物流需求的影响还没有起到理想化的正向作用,需要进一步提高,尤其是要提高物流的信息化水平,加快改革创新,促进智慧型港口建设。
建立基于GM(1,1)回归的烟台市物流预测模型,将预测值与实际值进行比较,结果显示误差在可接受的范围内,说明采用该模型对物流需求预测是可行的。从未来5年的预测数据可以看出,烟台市的物流需求将会持续增长,不仅给烟台物流的发展提供了重大的机遇,同时也对烟台物流服务水平提出了更高的挑战。我们要集合人力、物力、财力共同努力,推动烟台市物流的快速发展,力争在“十三五”期间把烟台市打造成东北亚物流交通枢纽。