基于ARIMA-LSTM的货运量组合预测方法研究
2022-07-29杨艳黄晴龙思潘自翔欧阳瑞祥
杨艳,黄晴,龙思,潘自翔,欧阳瑞祥
(长沙理工大学 交通运输工程学院,湖南 长沙 410114)
近年来,中国货运总量虽稳步上涨,但货运量增速总体呈缓慢下降趋势,这是由于货运量预测不准确、不合理而导致资源浪费。因此,需挖掘交通路网的运输潜能,加强智能化、精细化管理[1]。货运量预测是交通规划、物流规划等工作的基础,为相关运输工作的开展提供了数据支持[2]。货运量的预测方法有传统统计预测、神经网络预测和组合预测模型3种方法。
GODFREY 等人[3]提出了指数平滑模型,解决了货运量日常需求预测的复杂性问题,但精度比ARIMA模型的差。NARENDRA等人[4]运 用ARIMA 模型,提出了基于趋势的ARIMA 模型,并进行了验证,研究结果表明:该模型优于一般的ARIMA 模型和基于小波变换的ARIMA 模型。张丽莉等人[5]考虑为较复杂的非线性公路货运量预测问题,提出了采用BP 神经网络根据其产生的误差曲线对模型进行迭代优化的方法,该模型具有较好的预测精度。周程等人[6]针对传统预测方法无法捕捉货运量的非线性关系问题,提出了先利用线性方法预测线性部分,再用BP 神经网络预测非线性部分的方法,其预测精度得到大幅度提高。
单一的预测模型由于自身的特点和局限性,处理复杂问题效果差,因此,许多学者对组合模型进行了研究。GUO 等人[7]提出先运用ARIMA 模型提取拟合风速数据的线性成分,再运用最小二乘法和支持向量机提取拟合非线性成分的组合预测方法,该组合模型提高了风速预测精度。马涛[8]指出单一模型在预测过程中存在缺陷,构建了4种不同的组合预测模型,对预测结果分别进行检验。石庆研等人[9]将LSTM 和ARIMA 预测的高度值运用于Critic 客观赋权方法,处理非线性、非平稳时间序列,提高了航迹预测的精度。王越敬[10]通过试验,分别验证了ARIMA、LSTM 模型及组合模型对标普500 指数的预测效果,研究结果表明:LSTM 模型优于ARIMA 模型预测性能,而ARIMA-LSTM 组合模型的预测性能优于单一模型的。卢生巧等人[11]提出了卷积神经网络和门控循环单元神经网络相结合的深度神经网络预测模型,研究结果表明:该模型具有更好的预测性能,可为交通管理与控制提供有效依据。这些组合模型能实现对单一模型的优势整合,对于线性与非线性问题,组合模型既能较好地拟合线性关系,又能恰当地处理非线性关系。本研究以某货运公司18 个月货运量的数据为例,基于货运数据时空特征及线性与非线性复合特点,构建ARIMA 线性预测模型、LSTM 非线性预测模型和多种组合模型,对比各模型的预测精度,选择最佳预测模型。
1 相关模型理论
1.1 ARIMA预测模型
ARIMA 模型线性预测功能强,其认为当前时间的序列值与过去的时间序列值和外界干扰量呈线性相关[12]。ARIMA(p,d,q)模型公式为:
式中:St为时间序列S的当期值;p,d和q是模型阶数,均为1;φi(i=1,2,…,p)和θj(j=1,2,…,q)为模型参数;随机干扰μt是均值为0、方差为σ2的白噪声序列;St是前p阶St-1,St-2,…,St-p和前q阶μt-1,μt-2,…,μt-q的多元线性函数。
该模型预测分为平稳性检测、模型定阶、白噪声检测及预测评估4 个部分。平稳性是ARIMA模型构建的前提,数据平稳后才可用于预测未来的发展趋势[13]。运用Python 语言中Statsmodels 库,构建货运量时间序列ARIMA 模型。ARIMA 模型的建模具体流程如图1所示。
图1 ARIMA建模流程Fig.1 ARIMA modeling process
1.2 LSTM预测模型
1997 年,HOCHREITER 和SCHMIDHUBER提出长短记忆网络(long short term memory network,简称为LSTM)预测模型[14]。2005 年,ALEX 对其进行改进并投入应用[15],LSTM 在RNN循环神经网络的基础上发展而来,可解决RNN 无法处理长距离序列的问题。
RNN 神经网络的基础构架分为输入层、输出层和隐藏层,通过对隐藏层间存在的神经元进行联系,保留数据之间的序列信息[16-17],如图2所示。
图2 RNN神经网络基础构架Fig.2 RNN neural network infrastructure diagram
LSTM 提高了较长序列的学习能力,改良了RNN 神经网络的内部结构,其优势是具有不同的隐藏层。在原始RNN 神经网络中,隐藏层含有唯一的计算模块,而LSTM神经网络在原隐藏层中新增一个可反映隐藏层变化程度细胞状态模块,将计算模块与细胞状态模块合成在一起,构成LSTM记忆模块。“门”是神经网络用于选择通过、去除或新增信息的控制单元。在LSTM神经网络中,门控制单元主要包含遗忘门、输入门和输出门,用来避免产生梯度消失或梯度爆炸的问题。“门”结构依赖于Sigmoid 激活函数,输出区间为[0,1],0表示丢弃信息,1 表示全部保留信息,其他情况表示保留部分信息。LSTM 隐藏层的工作流程如图3所示[17]。
图3 LSTM运算流程Fig.3 LSTM operation flow chart
输入门it、忘记门ft、输出门ot、记忆细胞更新状态Ct和隐藏层ht计算公式为:
式中:σ为Sigmoid 激活函数;bi、bf、bo、bc分别表示不同门对应的偏置;Wi、Wf、Wo、Wc分别表示不同门对应的权值;xt表示当前节点的输入;ht表示当前节点的输出;表示计算过程中的候选值向量;Ct-1为上一节点记忆更新状态。
1.3 组合模型
不同组合模型有不同优点,可提升单一预测性能,现有的组合模型可分为两类:①基于误差修正的串联式组合;②基于权重分配的并联式组合[18]。串联、并联的组合模型流程如图4~5所示。
图4 串联组合模型流程Fig.4 Flow chart of series combination model
图5 并联组合模型流程Fig.5 Flow chart of parallel combination model
2 实例分析
2.1 实验数据
以某货运公司货运物流运营平台(简称公司)2018 年1 月1 日-2019 年3 月11 日训练集数据为例,如图6所示。利用Python语言处理原始数据中的异常信息,处理后的数据为原始数据的93%,为后续准确预测提供优质数据支撑。
图6 货运量数据波动走势Fig.6 Fluctuation trend of freight volume data
2.2 组合模型应用
2.2.1 模型粒度
为评估模型预测的准确性,本研究采用均方根误差(root mean square error,简称为RMSE)、平均绝对误差(mean square error,简称为MSE)和平均绝对百分比误差(mean absolute percent error,简称为MAPE)作为误差评价指标。
式中:Yi为i时刻的真实值;为i时刻的预测值;n为样本数。
2.2.2 串联组合模型应用
采用串联组合构建预测方法,假设预测对象的时间序列yt由线性自相关主体Lt与非线性残差Nt两部分组成。因此,考虑线性与非线性拟合能力,将ARIMA 模型预测结果的非线性残差数据作为LSTM预测模型的输入变量。
试验步骤为:
1)建立ARIMA 模型。根据时间序列的理论,建立ARIMA 模型。采 用2018 年1 月1 日—2019 年3 月12 日的货运量数据和Python 语言建立ARIMA(1,1,1)模型,残差数据见表1。建立的ARIMA(1,1,1)模型的残差序列短期存在一定自相关性,不是白噪声序列。表明:ARIMA 模型对时间序列数据的提取不够充分,需进行第二步对数据的非线性相关部分进行提取。
表1 ARIMA模型残差序列(节选)Table 1 Residual sequence of the ARIMA model(excerpt) t
2)构建LSTM 神经网络模型,识别ARIMA模型的残差序列。提取残差序列数据,生成训练集,输入矩阵。训练模型完成后,将模型的输出作为货运量时间序列的非线性部分预测。
3)将其两部分预测值相加,得到串联组合模型的货运量预测值,结果见表2。
表2 串联组合模型结果(节选)Table 2 Results of series combination model(excerpt)t
4)串联组合的结果用3 种误差评价指标进行预测精度评价分析,得到RMSE 值为114.340 0、MSE值为88.560 0、MAPE值为0.178 3,均优于单一模型的误差指标,从理论上验证了组合模型预测精度更优。
2.2.3 并联组合模型应用
1)等权平均法:
2)误差倒数法:
3)Critic客观权重赋值法:
其中,rpj为指标P与指标j之间的相关系数,每个指标的信息含量由对比强度和冲突程度共同决定,则指标j的信息量Cj为:
其中,σj为第j个指标的标准差,即指标的对比度,rpj是评价指标p和j之间的相关系数。Cj越大,所包含的信息量越大,第j个指标的客观权重Wj的计算式为:
并联组合模型构建的核心在于确定模型权重,本试验选择结合这3 种常用模型的权重确定方法,其公式为:
式中:yt为并联组合模型的预测结果;wi为ARIMA 模型权重;Lt为ARIMA 预测的结果;wj为LSTM模型的权重;Mt为LSTM模型的预测结果。
并联组合模型与串联相比,更简单快捷,只需将ARIMA 和LSTM 预测结果乘以并联组合中对应的权重系数,即可得到试验结果,不同方式并联组合模型的权重见表3。各模型预测精度对比见表4。
表3 不同方式并联组合模型权重确定Table 3 Weight determination of different parallel combination models
由表4可知,无论是串联,还是并联,组合模型的预测精度均高于单一模型的。在3种并联组合中,采用误差倒数法确定权重系数的组合模型误差最小。表明:该模型的精确度在4种组合方式中最佳,可考虑将此组合方式确定为最佳预测模型。
表4 三种并联组合及串联组合误差对比Table 4 Error comparison of three parallel combinations and series combinations
3 模型结果对比分析
在ARIMA 线性模型、LSTM 非线性模型和组合模型试验中,选择预测效果最好的ARIMALSTM 组合模型将货运量预测值与真实值进行拟合,如图7 所示。从图7 中可以看出,组合模型的预测值与真实值的拟合程度最好,预测效果最佳,LSTM 非线性模型的拟合效果优于ARIMA 线性模型的。
图7 多种预测结果与真实值对比Fig.7 Comparison of various predicted results and real values
为直观对比单一模型与组合模型的预测精度,比较各模型的真实值与预测值的相对误差大小,用货运量的实际值减去各方法得到的预测值,如图8 所示。从图8 可以看出,单一模型误差相对组合模型误差曲线的变化幅度大且不稳定。表明:与单一模型的预测结果相比,组合模型的预测结果更精准、更稳定,即组合模型的预测效果更佳。为准确地评价这3 种模型实现的货运量预测效果,各模型的误差效果对比情况见表5。
图8 多种预测方法的误差曲线Fig.8 Error curves of various prediction methods
表5 单一模型与最优组合模型(误差倒数法)效果对比Table 5 Comparison of the effects of the single model and the combined model
由表5 可知,在这3 种误差指标中,LSTM 的各种误差均比ARIMA 模型的值降低25%以上。表明:①LSTM 神经网络模型优于ARIMA 模型;②由表4可知,无论何种方式的组合均比任意单一模型的预测效果佳。其中,表5中以误差倒数确定权重系数的组合模型相较于ARIMA 的RMSE、MSE和MAPE,分别降低了40.66%、29.67%、51.45%;相较于LSTM 误差分别降低了13.67%、10.75%、36.32%。表明:任何一种组合方式在理论和实践中,都较单一模型提高了精度。
4 结论
以某货运公司提供的2018年1月-2019年6月货运数据为研究背景,基于货运数据时空特征和线性与非线性相复合特点,构建串联式和并联式组合预测模型。串联组合为ARIMA 线性模型加上LSTM 非线性模型,对其残值进行预测。并联组合分别以等权平均、误差倒数和Critic 客观赋权的3种方式确定权重系数,对线性模型与非线性模型组合进行预测,同样使用3种误差评价指标进行分析与验证,得到结论为:
1)任意一种ARIMA-LSTM 组合的货运量预测模型精度均优于单一模型的。
2)不同权重组合形式下模型的预测精度不同,试验表明:用误差倒数确定权重系数的并联组合效果优于其他3种组合模型的。
3)从时间与空间2个角度对货运量进行分析。货运量的时间特征主要从时间和空间2个角度进行分析,证实了货运量具有时空分布规律,时空特征分析出的货运数据具有季节性与趋势性特征。采用ARIMA 和LSTM 循环神经网络两种预测模型,提出了基于ARIMA-LSTM 的4 种组合预测模型。综合考虑货运量数据线性与非线性特征,实现对其预测,克服了单一预测模型的局限性。结果表明:任意一种ARIMA-LSTM 组合的货运量预测精度均优于单一模型的,且误差倒数确定权重系数的并联组合模型最优。本研究得到的预测组合模型可为未来货运量预测提供理论依据及实践指导意义。