APP下载

基于多元线性回归的物流需求预测分析
——以安徽省为例

2022-04-19

四川文理学院学报 2022年2期
关键词:货运量第三产业回归方程

刘 炯

(宣城职业技术学院 旅游商贸系, 安徽 宣城 242000)

自商品交换产生伊始,物流活动便迈进人类社会.伴随着改革开放以来经济的持续增长,我国的物流业已经从基本的仓储、包装、运输等传统物流发育到供应链管理、电商物流、物流规划等现代物流,物流业生机盎然.社会经济活动中,生产、流通、消费等各个环节经常需要在空间和时间上转移与配置各种实体资源,引致物流需求,经济发展是物流需求的决定性因素.近年来,安徽省物流业发展迅速,物流需求整体上稳定持续地增长,物流活动已经融合到生产生活的各个领域.基于此,本文以安徽省为研究对象,运用EVIEWS9.0软件构建多元线性回归模型,实证分析与预测安徽省物流需求,对于有效评估安徽省物流需求进而规划发展安徽省物流业,具有一定的理论意义与实践价值.

1 多元线性回归原理

一般地,某一经济现象往往会受到许多因素影响,既有经济因素又有非经济因素,既有可量化因素又有不可量化因素.为了更好地解释经济现象,通常需要实施多元统计分析,寻求一个包含多个自变量的一元方程式的多元线性回归应用的最为广泛.如果有n个自变量X1、X2...Xn,它们与因变量Y具有相关关系,则线性回归模型可以表示为:

Y=β0+β1X1+β2X2+...+βnXn+ε

(1)

其中,β0是常数项,β1,β2...βn为偏回归系数,随机干扰项ε涵盖难于认识与考量、难以量化与衡量的一些因素,方程(1)通过R、F、t等三种检验后即可认定参数估计可靠,把自变量的数值代入回归方程便能计算出因变量相应的预测值.[1]

由于经济变量之间存在的内在联系与时间上的共同趋势、解释变量中带有滞后项、变量多而样本又较小等一些原因,多元线性回归模型多多少少地都含有一定程度的多重共线性.通常情况下,选取多元线性回归模型的依据为:一是系数的符号要与经济学理论或实际预期相符,二是t检验必须是显著的,三是调整后的可决系数较大.[2]

2 指标选取、数据处理与模型设定

本文首先简要介绍多元线性回归基本原理,紧接着借鉴现有文献的研究成果,选取衡量安徽省物流需求的代理变量及其影响因素,在相关性分析的基础上建立多元线性回归模型,然后针对该模型进行多重共线性检验、经济意义检验、异方差检验与自相关检验,确定本研究最佳的物流需求预测模型,最后,对安徽省物流需求进行预测分析并提出相应的建议.

目前,尚缺少规范一致的统计指标来度量物流需求,有使用货物运输周转量指标的,有使用运输业产值指标的,普遍地是使用货物运输量指标,尽管货运量不能反映物流需求的全貌,考虑到运输为物流服务之核心,且货运量可以综合地体现物流需求的大致水平与变化趋势,本文亦选用货物运输量来量度物流需求,记为Y(亿吨).

影响安徽省物流需求的因素复杂多样,涵盖经济、科技、政治、文化等诸多方面,参考相关研究,[3-5]结合数据统计口径的一致性、权威性与可获得性,解释变量选取以下一些可以量化的指标:(1)第一产业产值X1(亿元),第二产业产值X2(亿元),第三产业产值X3(亿元).三次产业产值之和构成GDP,是经济发展水平的表征,最直接的表现就是生产的扩大、收入的提升、消费的增长,必然导致对物流需求的增加.三次产业的发展产生物流需求,各自对物流的需求和作用也是有所不同,产业结构自身的差异性与不平衡发展更加影响区域物流需求的规模、结构与层次,甚至是此长彼消.(2)固定资产投资总额X4(亿元).波兰裔美国经济学家多马认为,固定资产投资促进资本存量的增加,扩大社会生产能力,引起收入增加与消费需求增长.另外,对运输工具、仓库、港口码头、公路等物流设施设备的投资,更是满足区域物流需求增加的必要前提.(3)社会消费品零售总额与进出口总额X5(亿元).区域贸易分为对内贸易与对外贸易,无论外贸还是内贸,均需借助物流方能实现,采用社会消费品零售总额代表对内贸易,对外贸易则用进出口贸易总额来度量,为避免多重共线性,取二者之和(忽略批发贸易)表示贸易水平.(4)其他因素ε.包括但不限于物流服务水平、技术进步、消费观念、风俗习惯、经济政策与突发性因素,它们不但难于认识难以量化,而且对物流需求的影响不易评判,现有的理论模型也鲜有触及,故本文笼统地将其概括为其他因素.

样本区间为2000—2019年,所有数据均来自于相关年度的《安徽统计年鉴》,如表1所示,其中的进出口总额已由美元换算成人民币,并将其与社会消费品零售总额加总求和作为自变量X5的原始数据.

为了分析各个因素对安徽省货运量的影响,首先进行相关性分析,防止产生虚假线性回归.表2是原始数据的相关性分析结果(相关系数矩阵),其中,因变量Y与五个自变量X1、X2、X3、X4、X5的相关系数依次是0.9623、0.9590、0.8576、0.9158、0.8573,最低的都超过了0.85,得以设定如下多元线性回归模型:

Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+ε

(2)

3 模型构建

3.1 模型估计

采用EVIEWS9.0软件,对样本区间的原始数据使用普通最小二乘法估计,得到回归方程如下:

(3)

3.2 计量经济学检验

3.2.1多重共线性检验

回归方程(3)解释,可决系数(R2)与可调整的可决系数(Adjusted-R2)分别为很高的0.9806与0.9737,模型拟合的很好,五个自变量X1、X2、X3、X4、X5的t-Statistics顺序为-1.0919、3.2423、-1.8691、1.6440、-0.4934,其对应的概率值顺次是0.2933、0.0060、0.0827、0.1224、0.6294,在10%显著性水平下,X1、X4、X5皆不能拒绝原假设,不能通过显著性检验,该回归方程(3)属于典型的R2很大t却较小,结合表2的各个自变量之间的相关系数(最小的都是0.9480),是以自信地断定回归方程(3)存在严重的多重共线性.

表1 安徽省货运量及其影响因素

表2 原始数据相关系数

首先,从回归方程(3)中依次删除X5、X4、X3、X2、X1,表3为回归结果.

表3显示,五个回归方程的Adjusted-R2都很大,拟合程度都很高.但是,在每一个线性方程中都有至少一个自变量不能通过显著性检验,因而没有适合的回归结果,于是再做三元线性回归.

表3 四元线性回归结果

表4的三元回归共有10个线性方程,任意一个方程的可调整的可决系数都很大,最小的都在0.93以上,与四元回归结果一样,每一个三元回归模型中都有至少一个自变量不能通过t检验,为了寻找理想的回归方程,继续做二元回归模型.

表4 三元线性回归结果

表5 二元回归结果

二元回归结果表明,Y对X2、X3的回归模型的可调整的可决系数为十个线性回归方程中最大的0.9726,其数值本身也是非常的高,模型拟合的很好,两个自变量X2、X3变化能够解释安徽省物流需求变动的97.26%,模型通过拟合优度检验.

Y对X2、X3的回归模型中,F=338.42,其伴随概率Prob(F-statistic)=0.000,拒绝原假设,方程整体线性回归不显著的概率几乎为零,模型通过F检验.

两个自变量X2、X3的t检验值依次是12.9031与-6.2218,各自对应的概率值都是零,在5%显著水平下,X2、X3对被解释变量安徽省物流需求都有独立的显著的影响,Y对X2、X3的回归模型通过t检验.

当X3保持不变,X2增加一个单位,Y增长0.0056个单位,即安徽省工业产值每增长1亿元,安徽省物流需求增加56万吨,从某种意义上看,工业生产其实就是一个物流过程,采购、加工、搬运、仓储、运输等等,既是物料的转换与增殖,也是物流,工业生产孕育物流需求,工业生产的持续扩张必将引起物流需求的不断增长.当X2保持不变,X3增加1个单位,安徽省货运量减少0.0024个单位,即安徽省第三产业每增加一亿元,安徽省货运量减少24万吨.第三产业很多是无形的服务,生产即消费,不需要物流直接参与,尚有众多的第三产业项目比如金融业、教育业、计算机软件、通信业、文化、技术服务与信息咨询业的增长,由于外在经济、规模经济、科技进步、科学管理等方面的作用,反而能在总体上降低物流需求.所以,自变量的系数合乎经济理论与实际情况,Y对X2、X3的回归模型通过经济意义检验.

综上,本文将最佳的安徽省物流需求模型确定为:

(4)

3.2.2异方差检验

在回归方程(4)的界面下,实施不需要事先进行排序且适用于任何形式异方差的怀特检验,带交叉项的检验方式下的卡方统计量为8.513838,对应的Prob值是0.1301,因而在10%的显著水平下,不能拒绝原假设,所以回归方程(4)不存在异方差性.

3.2.3自相关检验

由回归结果可得,DW=1.7471.回归方程(4)中,包括常数项在内总共有三个变量,样本数为20.查DW检验临界值表获得:5%显著水平、k=3、n=20对应的dl=1.10、du=1.54,经计算,du(1.54)

选定模型滞后期数为10,偏相关系数检验结果由图1输出,第二至第十期的偏相关系数都没有超过虚线之外,显然,回归方程(4)不存在自相关.[6]

图1 偏相关系数检验

4 安徽省物流需求预测分析

为了验证使用非标准化数据构建的非标准化回归方程(4)是否有效,不作任何处理地将表1中的变量X2、X3的原始数据直接代入回归方程(4),对2000-2019年间各年度的安徽省货运量进行预测,表6给出预测值对实际值的比照分析结果.

表6 安徽省物流需求预测值与实际值对比

一般认为,误差率如果低于10%,表明回归模型预测精度较高.[7]表5中的误差率是预测值减去实际值之差再对实际值的比率,取样本区间各年度误差率的绝对值,2000—2019年20年间的误差率平均为9.96%,处于可以接受的范围之内.进一步分析,表6揭示,从整体上来看,回归方程(4)的预测精度逐步提升,2010年以后,模型的拟合精度较高,2010-2019年的10年间误差率平均每年为6.37%,回归方程(4)契合预测分析的要求,因此可以运用该模型对安徽省物流需求进行预测,只要预先获悉预测年份的安徽省第二产业与第三产业的总值,即可计算预测该年度的安徽省物流需求.

结 论

样本区间选定为2000年-2019年,以货运量表示的安徽省物流需求整体上呈现上升趋势,从2000年的4.4518亿吨增长到2019年的36.8078亿吨,增加了7.26倍,平均每年增长11.76%,需要注意的是,2019年的货运量比2018年下降了3.855亿吨,降幅达到10.47%,本文的回归模型试图阐明这一现象是由于第三产业迅速发展引起的.应当以城市为区域中心、专业商品交换市场为基础集中发展第三产业以便获取更大的外在经济与规模经济,依靠电子计算机网络信息系统减少流通环节,寻找与培养第三产业优势项目,进一步降低第三产业物流需求从而减少其物流成本、减轻物流产业的压力.采用多元回归分析法发现,在引入的五个影响因素中,安徽省第二产业和第三产业的发展是影响安徽省物流需求的主要因素,具有很强的线性关系,前者正相关,后者负相关,前者的影响明显地大于后者,因此,应加强物流基础设施建设,建立现代物流管理信息系统,提升物流技术水平与服务质量,大力发展第三方物流,[8]在保障第二产业物流需求的同时亦能使安徽省物流业适应区域社会经济发展对物流服务的多样化需求.

利用EVIEWS软件构建的多元回归模型的预测精度较好,尤其是最近10年来的平均误差率只有6.37%,具有较强的可操作性与较高的实用性,可以很好的分析、估算、推断安徽省未来的物流需求,为指导和调节物流活动提供数据支持,进而助推安徽省物流业持续健康有序地发展.由于物流市场是一个高度开放的复杂系统,影响物流需求的因素众多且错综复杂,因此本文构建的多元线性回归模型无可避免地带有一定的局限性.国内外众多学者应用其他领域成熟的预测方法,业已开发多种物流需求预测方法与模型,[9]今后将密切关注安徽省物流业的发展动态,收集更多的数据,学习更多的预测方法,以期逐步完善安徽省物流需求预测分析.

猜你喜欢

货运量第三产业回归方程
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
走进回归分析,让回归方程不再是你高考的绊脚石
第三产业完成投资增长2.9%
2017年上半年拉脱维亚港口货运量同比增长7%
江苏省县域第三产业增加值的空间统计分析
一季度第三产业增速明显下滑
我国第三产业的影响因素分析