基于BP神经网络组合模型的广东省区域物流需求能力预测
2021-01-11赵文德黄丽娟胡子瑜
赵文德,黄丽娟,胡子瑜
(1.广州番禺职业技术学院 管理学院,广东 广州 511483;2.广州大学 工商管理学院,广东 广州 510006)
1 引言
物流业作为支撑国民经济发展的基础性、战略性、先导性行业,在促进区域间经济发展、物资流通、产业结构升级、人民生活提升等方面发挥重要作用。目前,我国物流需求规模呈现出稳步上升的发展趋势,2018年全社会物流需求总规模达到283.1万亿,同比增长6.4%;根据数据,2013-2018年我国社会物流需求规模年平均增长率达到7.06%。与此同时,物流业的发展所带来的经济增长也是显著的,2018年物流行业所带来的总收入达到10.1 万亿元,同比增长14.5%;2014-2018年,我国物流行业产出的总收入年平均增长率达到8.56%。物流行业已经成为推动经济发展和技术创新的重要驱动力量,但是物流行业的发展仍然受到物流体系不健全、设施配套不完善、物流成本较高、物流机制不成熟等瓶颈的制约,为了更有效地保障物流行业高质量有序发展,实现区域物流资源供需平衡,促进区域经济健康发展,对物流需求能力的精准预测成为关键。
2 文献回顾
目前关于区域物流发展的研究主要集中在区域物流发展影响因素[1-2]、区域物流竞争力[3-5]、区域物流业与经济发展的协调度评价[6-9]等方面。
针对特定区域的物流需求能力预测研究相对较少,对现有的文献进行梳理,主要包括以下两个方面:(1)关于区域物流需求能力预测的指标体系构建方面,李瑞,等[10]从经济、社会、技术等维度构建了与物流业能源需求相关的11 个因素指标体系。李捷,等[11]根据物流需求的影响因素分析,从经济、社会、贸易、生活等维度构建了预测指标体系。王晓平,等[12]根据农产品冷链物流的需求特性,从农产品供给、社会经济、冷链发展、人文、物流需求规模等维度构建了预测指标体系。Hongmei He,等[13]在城市物流的关联度研究中发现信息水平、网络设施、物流节点等影响因素是关键。Nuzzolo A,等[14]通过对历年罗马城市物流政策的实施效果进行研究,发现物流政策对城市网络、城市配送等方面具有显著作用。(2)关于区域物流需求能力预测的方法选取方面,韩慧健,等[15]根据经济、贸易等要素与物流之间的关联度,提出了模糊认知图的预测模型。曹志强,等[16]构建GA-SVR组合模型对广西货运量进行预测。鲁渤,等[17]构建引力模型对内蒙古鄂尔多斯区域物流能力进行了预测。Chiri H,等[18]基于数据挖掘技术、统计模式建模和概率拉格朗日模拟的组合,提出了溢油轨迹的中长期(1-6个月)概率预测方法。Lopez,等[19]提出基于时间序列定量和定性信息的分解模型QMMP+,将其应用于巴塞罗那供水网络的需求预测中。
区域物流需求能力的影响因素繁多且相互关联和渗透[12],加上该预测系统是一个非线性的关系[10],这些都增加了物流需求能力预测的不可控性,因此目前关于区域物流需求能力预测的文献相对较少,现有文献存在的不足主要有:(1)现有的物流需求能力预测文献对指标体系的构建缺乏层次性和严谨性,特别是对于指标之间的共线性问题,少有文章进行讨论;(2)现有的物流需求能力预测文献在方法的选取方面存在一定的局限性,鲜有文章对多种预测方法进行比较研究。本文结合现有文献的成果,采用因子分析法对预测指标体系进行共线性消除,根据区域物流需求的特征构建基于多因素耦合下的需求能力预测组合模型,通过对不同预测模型的比较研究,找到更具适应性的预测模型,以期为各级别政府制定科学的区域物流协调发展政策提供建议和支撑。
3 区域物流需求能力的影响因素
区域物流的发展能够促进区域经济的发展,与此同时,区域经济的增长也能够反哺推动物流的进步[20]。区域物流的发展除了受到经济因素的影响外,还会受到区域消费水平、基础水平、信息水平等综合因素的影响,因此,区域物流需求系统是一个复杂的、动态的系统。其影响因素体系的构建应当尽量全面、客观地反映区域物流的发展能力水平,同时也应当综合考虑因素数据的权威性和获取便利性[21]。本文系统梳理了文献[22]-[29]等国内外代表性文献中涉及物流需求能力影响因素的高频指标,并对初始指标体系进行关联度分析,剔除关联度小于0.7的指标,最终构建了以区域物流发展能力、物流消费能力、物流基础能力、物流信息能力为一级指标,以物流发展现状、消费基础等10个指标为二级指标,以物流需求能力、人均可支配收入等10 个指标为三级变量的综合指标体系。
区域物流发展能力指标体系包含了物流需求能力,也是衡量区域一定时间内物流需求能力的核心指标,具体见表1。
表1 区域物流发展能力指标体系
区域物流消费能力指标体系包含了人均可支配收入、地区生产总值、社会消费品零售总额3个指标,主要用来衡量区域的物流消费能力,具体见表2。
表2 区域物流消费能力指标体系
区域物流基础能力指标体系包含了物流运输里程、物流营运车辆、物流从业人数3个指标,主要用来衡量区域的物流基础能力,具体见表3。
表3 区域物流基础能力指标体系
区域物流基础能力指标体系包含了物流信息传输与服务、物流运输与邮政业投资、信息基础产业投资3 个指标,主要用来衡量区域的物流信息能力,具体见表4。
表4 区域物流信息能力指标体系
物流需求能力用来反映区域物流发展总体情况,根据指标的可获得性和权威性,本文所构建的综合指标体系的数据均能够在《广东省统计年鉴(2010-2019)》中获取。由于指标体系中各影响因素的量纲及其指标数据在数量上均存在差异,为得到更为准确的预测结果,需要对各影响因素的原始数据进行无量纲化处理,即将所有指标数据转化到[0,1]之间,公式为由此得到各影响因素及物流需求能力观察值,见表5。
表5 2010-2019年区域物流需求能力影响因素观察值
将上述数据导入SPSS进行因子分析,得到KMO均值大于0.6,Bartlett 球度检验的显著性为0.000,表明适合因子分析;通过降维得出物流消费能力、物流基础能力、物流信息能力(分别用变量F1、F2、F3表示)所提取的因子累计贡献率平均超过90%,能够比较全面的反映所有的信息。
根据式(1)和式(2)可以计算出F1、F2、F3的因子得分情况,公式如下所示:
通过曲线拟合对物流需求规模与F1、F2、F3的耦合关系进行分析,可以发现物流需求规模与这三个主成分呈现显著的非线性正相关关系,曲线拟合的R2都通过了显著性检验,且都大于0.90,效果较好,曲线的走势也更加稳定,其曲线拟合的公式如下:
其中物流消费能力、物流基础能力、物流信息能力的拟合变量分别为y1、y2、y3,对应的拟合优度R2分别为0.995 4、0.995 3和0.933 8。
根据上述的分析可以发现:(1)区域物流需求能力系统是一个非线性的复杂系统,需综合考虑与其相关的消费、基础、信息等多种能力因素的影响;(2)区域物流需求能力与消费、基础、信息等能力因素之间呈现非线性的强正向相关关系。物流需求能力与因素体系耦合关联度大小见表6,可以发现物流需求能力与消费能力、基础能力、信息能力之间具有极强的关联度。
表6 物流需求能力与因素体系耦合关联度
4 数据预测与结果
4.1 多项式回归预测
根据多项式回归曲线拟合的方程进行物流需求能力预测,首先构建预测的系统特征序列数据矩阵:
然后构建预测的相关因素序列矩阵:
通过多项式回归模型得到2010——2019年广东省物流需求能力预测情况见表7,得到的预测模型为:
式中,Sn为多项式回归方程的系数矩阵,Ei为相关因素序列矩阵。
将物流需求能力实际值与多项式回归模型预测值进行图像绘制,可以看到预测值与实际值的误差相对较大,预测值与实际值的偏离程度较大,具体如图1所示。
表7 多项式回归模型预测结果
图1 多项式回归模型预测结果对比
4.2 ARIMA模型预测
时间序列预测(ARIMA)模型是根据因素自身的历史数据进行预测的方法,具有操作简单、稳定性好的特点[31]。将2010-2019 年度数据导入SPSS 进行时间序列分析,得到具体的预测值、残差以及误差率见表8。
将物流需求能力实际值与多项式回归模型预测值进行图像绘制,可以看到预测值与实际值的误差相对降低,但仍然存在有些年份的误差突增,预测值与实际值的偏离仍然存在,具体如图2所示。
4.3 BP神经网络预测
本文基于3 层BP 神经网络进行建模和预测,确定BP 网络的输入为3 个,即上文计算选取的3 主成分得分,以广东省物流需求能力作为网络的输出,根据kolmogorov定理可以知道,隐含层神经元数量与输入层和输出层神经元数量有如下的函数关系[32]:
表8 ARIMA模型预测结果
图2 ARIMA模型预测结果对比
式中,n、m 分别为输入和输出神经元数量,a 为常量,在1-10 之间取值。本文根据经验公式和反复的训练检验,最终确定当隐含层神经元数量为9 时,预测效果最佳。先构建输入层矩阵B 和输出层矩阵P,将矩阵数据进行神经网络训练可以得到训练结果。
用Matlab 工具进行BP 神经网络训练之后,可以发现网络训练的均方误差在第13次时开始收敛达到最优,训练状态平稳,无异常值出现,BP 神经网络的回归拟合优度较高,表明此次BP神经网络训练效果较好,具体如图3、图4所示。
图3 均方误差训练结果
图4 BP神经网络预测训练状态
利用训练好的网络对各组数据进行预测,实际值、预测值、残差及误差率见表9。
将物流需求能力实际值与BP 神经网络模型预测值进行图像绘制,可以看到预测值与实际值的误差较小,有很好的预测精度,如图5所示。
为了进一步验证BP 神经网络预测方法的可行性和有效性,采用平均绝对误差(MAE)、误差均方根(RMSE)和平均绝对百分误差(MAPE)三项误差测算方法对两种预测方法的预测精度进行评价,它们的表达式为:
表9 BP神经网络模型预测结果
图5 BP神经网络预测结果对比
表10 多项式回归、ARIMA模型和BP神经网络模型预测误差对比
在三种预测方法中,BP 神经网络方法的平均绝对误差、误差均方根以及平均绝对百分误差值都是最小的,预测误差大都小于0.02%,平均绝对百分误差为0.006%,说明所建立的BP神经网络模型比多项式回归、ARIMA模型预测方法预测精度高,具有更强的推广能力价值。
多项式回归、ARIMA模型和BP神经网络模型预测的绝对误差对比情况如图6 所示。从预测的绝对误差大小来看,不同年份的误差会有所区别,例如2016 年,ARIMA 模型预测的绝对误差比其他两个模型预测的大很多。其中BP 神经网络模型预测的绝对误差是三个模型中最小的。从预测的绝对误差波动来看,多项式回归、ARIMA 模型的预测波动都较大,只有BP神经网络模型预测的绝对误差波动是三个模型中最小的,表明了BP神经网络模型的预测更接近真实值,预测精度更高。
图6 2010-2019年不同预测方法的绝对误差对比
4.4 结果分析
应用已建立的BP 神经网络预测模型,对广东省2020 年物流需求能力进行预测,其预测结果为467 553.931万t;2010-2020年间,广东省物流需求规模从205 034万t增长到467 553.931万t,年均增长率为8.71%,随着未来国际市场和农村物流市场的进一步开发,区域物流需求能力也会随之增长,反过来将进一步推动广东省综合经济能力的增强。
物流业作为支撑经济发展的重要基础性行业,明确各变量的重要性程度有利于找到区域物流发展的关键因素,从而为区域物流政策的制定提供借鉴。将旋转后的主成分矩阵进行整理,剔除小于0.70的数据,得到主成分变量的重要性程度,见表11。
表11 主成分变量的重要性程度
在得到的三个主成分物流消费能力、物流基础能力、物流信息能力(分别用F1、F2、F3表示)中,对区域物流能力发展的重要性排序为F2>F1>F3。其中物流消费能力因素中,地区生产总值、人均可支配收入、社会消费品零售总额成为影响物流需求能力最重要的影响因素;在物流基础能力因素中,物流从业人数、物流运输里程、物流营运车辆三者的重要程度相差不大;在物流信息能力因素中,物流运输与邮政业投资、信息基础产业投资成为影响物流需求能力最重要的因素。
5 结论分析
本文以区域物流需求能力发展为研究对象,构建了以物流消费能力、物流基础能力、物流信息能力为一级指标的综合指标体系,以多项式回归、因子分析、ARIMA模型和BP神经网络为研究方法对广东省2010-2020 年物流需求能力进行预测比较以及影响因素的重要程度研究。基于以上,提出如下理论和实践启示。
5.1 理论启示
(1)本文构建了基于广东区域物流需求能力历史数据的预测指标体系。结合广东区域物流需求能力的历史发展情况,借鉴国内外权威文献,构建了基于物流消费能力、物流基础能力、物流信息能力的综合指标体系,将该体系中的影响因素进行关联度分析,剔除精度水平较低的影响因素,最后选出9 个高关联度的影响因素,其中,物流从业人数、社会消费品零售总额、物流运输里程与物流需求能力的关联度最强,分别为0.982、0.981、0.978。
(2)本文构建了基于多因素耦合下的区域物流需求能力预测组合模型。根据所建立的物流需求能力预测指标体系,选取广东区域2010-2019年度的数据集,分别运用多项式回归模型、ARIMA 模型和BP神经网络模型进行预测,研究结果表明BP神经网络模型预测精度最好,其次是多项式回归模型,最后是ARIMA模型。因此,BP神经网络模型能够很好地实现区域物流能力的预测,为各级别政府制定合理有效的区域物流发展政策提供借鉴。在此基础上,运用BP 神经网络模型预测出2020 年区域物流需求能力为467 553.931万t,年均增长率达到8.71%,物流业作为推动国民经济发展的重要支撑,越来越凸显其重要性。
(3)本文进一步丰富了区域物流需求规模能力的文献。在中国知网官网,以“区域物流预测”为关键词进行文献统计,目前关于该主题的文献只有99篇,且近几年相对较少。本文在吸收国内外核心文献的基础上,结合广东区域物流发展的实际情况,确定了符合区域特色的综合因素体系,构建了具有较高匹配度和预测精度的预测模型,历史回测数据结果也得到了验证。因此本文的研究结果,包括综合因素指标的筛选与确定、组合模型的测试与比较,进一步丰富了“区域物流预测”这一主题的文献。
5.2 实践启示
根据模型预测结果与指标体系的重要性分析,结合广东省区域物流发展现状,本文整理出以下建议:
(1)加强物流基础能力建设和发展,特别是物流基础设施的结构优化。物流基础能力是区域物流发展的基础性因素,是区域物流发展的根基。需要进一步优化物流固定资产投资建设情况,加大对物流通车线路、物流服务基站、物流运输车辆的投资结构优化,特别要重视物流新基建的规划与建设。
(2)支持物流技术创新,推动物流发展方式变革。科技创新水平成为区域物流持续高速发展的关键因素,也越来越成为一个行业形成竞争优势的法宝[33]。当前诸多的新兴技术,如5G 技术、区块链技术、VR、AR、人工智能技术等,在物流各个环节中都得到应用,众包物流等新兴发展方式也初见雏形,应大力支持物流技术的创新发展和应用落地,完善新兴物流发展方式。
(3)平衡区域经济差异,出台符合区域发展目标的物流政策。广东省出台的《广东省现代物流业发展规划(2016-2020 年)》提出物流降本增效、提质增效的工作重点,完善区域物流节点布局,推动区域经济协调发展。广东区域的经济发展水平存在差异,粤西、粤北相对落后,其物流发展水平存在一定的不足,需要加强发达区域与欠发达区域的协同,实现区域之间物流资源共享和流通。