APP下载

SARIMA-LSTM组合模型在铁路疫情短时客流的预测研究

2023-04-11魏姝瑶

关键词:客流量春运客流

魏姝瑶,张 瑾

(昆明理工大学 交通工程学院, 昆明 650504)

2019年12月武汉市发现新型冠状病毒后,为了抑制病毒的快速蔓延,国家采取了一系列全国范围内的交通管制措施,这些政策性措施对铁路客运组织造成了巨大冲击[1]。目前铁路运营管理仍旧是依靠调度员的经验来判断客流变化,这就造成部分铁路部门应对像新冠肺炎这样的重大公共卫生突发事件的能力和准备不足,难以适应客流的波动特征[2]。因此,有必要研究铁路突发性事件的短时客流预测问题,为运营管理提供理论依据。

铁路客流短时预测的方法大致可分为线性模型、非线性模型和组合模型3种[3]。时间序列模型作为最传统的线性客流预测方法,如Zhu[4]通过n日移动平均客流量指标,建立ARlMA模型预测上海地铁客流的变化情况;Rusyana等[5]运用SARIMA季节模型将数据建模为依赖于前一个季节的值而不是之前的原始序列值,应用这种方法更加精确地预测了吉隆坡国际机场入境游客数量。这类模型的缺陷在于只关注数据在时间维度上的变化特征,通过测量其相关性和变化趋势来建立模型并用于预测,但显然还有许多其他因素和信息尚未参考,如难以捕捉的空间维度信息等。因此,经典时间序列模型对于复杂的多变量非线性关系的建模并不理想。随着数据采集手段的进步和历史数据量的增加,以神经网络为代表的非线性模型发展迅速,在模式识别、样本分类、预测等领域得到广泛应用,如Sha等[6]提出了一种基于RNN的地铁客流预测方法,但是随着相关理论知识的不断完善,发现RNN不能很好地处理远距离依赖的问题;Liu等[7]将LSTM模型应用于短时客流预测,解决了RNN在训练期间梯度消失的问题。Chen等[8]则针对长短期记忆(LSTM)模型在城市交通流预测中准确率低的问题,提出了一种基于注意机制的LSTM模型。该模型计算每个过去值和当前值之间的相关性,为这些过去值分配不同的权重,并衡量它们对当前值的重要性。为了更加充分地发挥二者在线性方面和非线性方面的互补优势,近年来,出现了将以上2种方法混合建模的发展趋势,如ARIMA和BP神经网络[9]、ARIMA模型和小波神经网络[10]等组合模型。因为随着经济的快速发展,轨道交通给人们带来快速便捷出行方式的同时,不可否认线路的日益复杂和客流的迅速增加也给铁路运营的调试和管理带来了巨大的压力,而运用组合模型预测短时客流对缓解轨道交通压力具有重要意义。

上述组合模型的研究虽有助于短期客流预测,但是都缺少对短期异常客流预测的关注。本文将因新冠疫情对春运期间日客流量造成的异常波动称之为异常客流。在面对新冠肺炎疫情这样的突发事件时,客流的变化具有很大不确定性,所以降低了历史数据的参考价值。因此,对于罕见的相似样本(例如在春运期间本该持续上升的客流量却因疫情防控的管制而持续大幅下降的现象所产生的数据样本)和不确定的发展趋势,短期异常客流预测是困难的。在研究疫情期间客流的估计问题时,根据相关研究和实例分析,SARIMA模型在基于相似历史样本的线性回归中具有优势,能够很好地进行客流预测。然而,对于罕见的相似样本,就需要结合非线性分析来减弱SARIMA季节模型局限性带来的误差。因此,提出SARIMA-LSTM滚动优化模型,在SARIMA线性回归基础上,增加LSTM神经网络模型,运用滚动优化的方法进行训练。同时,受自然语言处理中注意力机制的巨大成功的启发,基于交通流数据也是时间序列数据的事实,尝试将注意力机制加入LSTM模型中,并将该模型应用于短时交通流预测领域,以反映罕见的大随机波动。

1 基于SARIMA-LSTM运用滚动算法建立短期客流预测模型

1.1 SARIMA季节模型

春运期间铁路日客流量有明显的季节性和周期性波动现象,为了处理这类时间序列问题,采用季节性时间序列模型(SARIMA),即SARIMA(p,d,q)(P,D,Q)S。其中p和P分别表示自回归和季节自回归的顺序;d和D分别代表着根据不同差异和不同季节差异进行的排列组合;q和Q分别表示移动平均线和季节移动平均线的顺序[11]。公式如下:

(1)

其中,

φ(BS)=1-φ1BS-…-φpBS

ϑ(BS)=1+ϑ1BS+…+ϑqBS

1.2 LSTM神经网络模型

由于疫情期间很少有相似的历史数据,SARIMA模型也无法反映异常的客流波动。因此,设计了滚动优化方法来训练长短期记忆(LSTM)神经网络,充分利用实时数据,及时反映异常波动。LSTM神经网络的核心是增加存储器神经元和栅极控制单元,存储神经元通过存储当前信息和提取数据将信件填充到时间序列链中[12]。因此,以较早的时间为单位的信息可以以较晚的时间为单位传输,从而减缓信息丢失的速度,提高信息存储容量。LSTM网络的神经元结构如图1所示。Xt、ht和Ct分别表示时间t的输入向量、隐藏状态和单元状态。相应的LSTM正向传播方程[13]如下:

it=σ(Wiixt+Whiht-1+bi)

(2)

ft=σ(Wifxt+Whfht-1+bf)

(3)

gt=tanh(Wigxt+Whght-1+bg)

(4)

Ot=σ(Wioxt+Whoht-1+bo)

(5)

Ct=ft*Ct-1+it*gt

(6)

ht=Ot*tanh(Ci)

(7)

其中:it、ft、gt分别是输入门、遗忘门和输出门;Wii、Whi、bi分别是输入权重矩阵、回归权重矩阵和输入门的偏差项;Wif、Whf、bf分别是输入权重矩阵、回归权重矩阵和遗忘门的偏差项;Wig、Whg、bg分别是输入权重矩阵、回归权重矩阵和输入层到隐藏层的偏差项;Wio、Who、bo分别是输入权重矩阵、回归权重矩阵和输出门的偏差项;σ代表sigmoid函数。

图1 LSTM网络的神经元结构示意图

1.3 LSTM滚动优化预测算法

由于时间相关性有一定的社会原因,任何一天的乘客需求都会受到其他时间的影响,特别是受到相邻时间段的影响。为了表示这种相关性,运用滚动优化预测算法,这种算法在模型预估时,每个采样时刻都要根据当前的预估误差重新计算控制作用的变化量,不断滚动计算。就算是遇到类似新冠疫情的重大公共卫生突发事件,也能通过这种累计方法使预测值始终处于一种动态平衡状态。

1.4 SARIMA-LSTM组合模型

本文中建立的组合预测模型结合了2种性能互补算法,有效克服了单一算法在预测方面的局限性,提高了预测精度。因为SARIMA模型可以很好地拟合序列中的线性关系,LSTM神经网络可以挖掘序列中的非线性关系。通过2种模型的结合,可以发挥两者的优势,对复杂时间序列进行有效预测。而铁路短时客流因受新冠疫情影响,形成了2条不同特征的客流曲线,这就是一种复杂的时间序列。

因此,采用Attention Mechanism的方法,可以帮助模型对输入的X每个部分赋予不同的权重,抽取出更加关键及重要的信息,使模型做出更加准确的判断,同时不会对模型的计算和存储带来更大的消耗[15]。把SARIMA模型的异常值代入LSTM神经网络后,训练集数据波动较大,随着网络深度的不断加深,会造成网络退化问题。而AttentionMechanism机制的引入有效缓解了网络模型训练过程中反向传播梯度消失的问题,还解决了深度网络的训练难度和性能下降的问题[16]。注意力层的实现是由LSTM编码器保留输入序列的中间输出结果,计算前一层的中间输出结果与当前输出的相似度,得到权重因子,最后得到注意力系数,如图2所示。

图2 在LSTM模型中增加注意力机制的过程示意图

H=[h1,h2…hn]

(8)

(9)

(10)

(11)

(12)

式中,首先使用向量H和H′进行计算获得权重的相似度,其次使用softmax功能对权值进行归一化,然后使用归一化权值ai和hj加权求和,最后得出的结果就是注意力权重值Ci。

2 实例分析

2.1 数据分析

本文以南昌火车站春运期间的原始客流数据为依据作出客流时序图。从图3(a)中可以发现,2015—2019年春运期间铁路局的日客流量呈周期性上升状态,而2020年本应上升的趋势却因新冠疫情的影响,导致了春运期间总客流量同比2019年下降53.6%。2021年在疫情常态化背景下,“就地过年”成为越来越多人的选择,客运量较往年降幅依然明显,虽然比2020年同比增长11.2%,但也仅为疫情前正常年份的51.6%。

图3 2015—2021年春运期间日客流量曲线

通过分析图3(b)可以发现,2020年春运前14 d符合春运周期性变化趋势,然而从1月24日(除夕)开始铁路日客流量呈现断崖式下降。所以,首先利用2015—2019年南昌站春运期间前14 d的客流数据建立SARIMA季节模型,预测2020年前14 d的日客流量,从第15 d开始因受疫情影响,将其导入LSTM滚动优化模型进行计算,得到后26 d非线性预测模型的计算结果。最后为精度评定,除了将预测值与2020春运实测值进行比较外,还使用了SARIMA季节模型和门控循环单元网络(GUR)来预测样本,比对预测数据,验证预测模型。

2.2 预测步骤

结合SARIMA季节模型与LSTM滚动优化神经网络,构建组合预测模型,算法流程如图4所示,对疫情期间铁路春运日客流进行预测,该模型输入数据为南昌站2015—2019年春运40 d的原始客运量,输出数据为用组合模型预测出的2020年春运日客流量。

图4 算法流程框图

对在疫情期间铁路春运客流量的原始数据进行去均值化处理。通过一阶差分后,对数据的平稳性进行检验,使用的是单位根检验(即ADF),表1显示的t统计值为-4.306,明显比各显著水平的临界值小,故差分后的序列可以通过平稳性检验。

表1 ADF检验

通过绘制自相关图(ACF)和偏自相关图(PACF)对模型进行定阶。如果有一个进入蓝色置信区域(一般取95%)的点,并且在其之后的点大部分都在此区域内浮动,该点就可以暂定为q和p的值,如图5和图6所示。

图5 自相关图(ACF)

图6 偏自相关图(PACF)

通过赤池信息准则(AIC)对上述函数所产生的所有参数项进行评估,筛选后得出在SARIMA(1,1,1)*(0,1,1,12)时,AIC最小。由此,可以利用SARIMA模型通过2015—2019年春运前14 d预测2020年春运前14 d的客流量。

通过时间序列对数据的处理,发现春运第15 d开始因受疫情影响,日客流量大幅度下降,这与上阶段数据分析中的结果相吻合。因此,从第15 d开始的客流量定义为异常值,将其权重置零,即让SARIMA特征检测器暂时停止工作,导入LSTM神经网络进行计算。首先通过输入层将预处理后的输入数据传输到下一层,并在神经网络中嵌入了注意机制模块,在Attention LSTM模型的构建中确定网络的结构。将输入层的大小设置为输入系列长度,隐藏层编号设置为2,把历史数据和最新数据共同作为训练集数据,对新的训练集数据持续学习,不断调整模型参数,滚动更新数据变化,找出最新规律,以提高预测的准确率。运算过程中产生了残差学习单元,把它们组成残差模块,该单元主要由2个分支组成,第一个是残差学习分支,另一个是输入的身份映射分支。用X表示输入,F(x)表示残差映射,那么残差学习单元的输出就是H(x)=F(x)+x,如果残差结果趋近于白噪声序列,那么累加层只用于恒等式映射。因此,接下来的训练目标是将残差结果趋近于白噪声序列,这样随着网络的深入,精度就不会再下降。其次进入输出层,对神经网络计算的分量进行归一化处理,得到LSTM滚动优化模型的预测结果;最后将前14 d的SARIMA线性模型预测数据与后26 d的LSTM神经网络模型预测数据代入权重组合法,计算前一层的中间输出结果与当前输出的相似度,得到权重因子,同时得到注意力系数,再利用梯度下降法对2种互补算法的训练结果进行权重优化,计算出组合模型的预测误差,得到2020年春运40 d客流预测数据。

2.3 预测结果及精度评定

首先,将被归一化的样本数据输入到SARIMA-LSTM组合模型中。使用梯度下降的公式进行反向传播计算,不断更新模型的权重。每迭代1次,都要计算模型的当前误差精度,结果如图7所示。可以看出,经过200次迭代训练,训练误差的精度线损失从0.727 8下降到0.042 5并保持稳定,效果良好。

图7 迭代误差变化曲线

其次,使用SARIMA季节模型和SARIMA-GUR组合模型来预测样本数据,将结果与本文选取的SARIMA-LSTM组合模型进行比较。由图8可知,仅使用SARIMA季节模型预测的春运日客流量真实值与预测值差距很大,严重失真。而在加入了神经网络模型对非线性部分进行拟合后,实验精度得到了极大提高,这是因为线性模型对随机性、突发性强的交通流数据的预测效果不佳,组合模型具有更好地预测控制性。

图8 2020年春运实际日客流量与 3种模型预测值曲线

最后,为了验证长短期记忆网络(LSTM)和门控循环单元网络(GRU)在短时客流中的预测精度,比较这2种神经网络在组合模型中的性能差异。使用平均百分比误差(MAPE)和均方根误差(RMSE)作为检验模型的评价指标,公式如下:

(13)

(14)

表2显示了不同模型的预测结果误差。结果表明,在整个预测期内,SARIMA-LSTM组合模型的预测精度总体上优于SARIMA-GRU组合模型。从模型原理分析原因,门控循环单元网络(GUR)只有一个门控来遗忘和选择内存,且参数较少,而长短期记忆人工神经网络(LSTM)可以使用更多的门控和更多的参数来完成相同的任务,所以在客流异常且波动很大的情况下,与LSTM相比,GRU的性能损失更为严重。

表2 预测结果误差

3 结论

1) 提出了一种基于SARIMA-LSTM的组合模型对疫情期间南昌火车站的春运日客流数据进行了预测。该方法中,稳态序列由SARIMA季节模型计算,将稳态序列和时间序列作为周期特征输入。同时设计了一种LSTM滚动优化模型,该模型利用实时样本和历史样本进行滚动预测,可以更及时、更近似地反映异常流量的波动情况。最后,将2种模型的预测结果加权求和得到最终的预测数据。

2) 利用SARIMA模型和LSTM滚动优化模型的互补优势,在模型的预测中,大大降低了组合模型的平均百分比误差(MAPE)和均方根误差(RMSE),提高了在突发事件中异常客流的预测精度,其精确度达到了72.7%。当面临突发性重大卫生公共事件时,可以解决铁路短时客流预测问题,缓解因客流大幅减少而造成的铁路客运部门直接性经济损失。

3) 实验中还存在一些不足,比如实验数据只使用实时样本和历史样本,没有考虑其他外部因素。因此,在后期的研究工作中,还需考虑影响客流的其他环境因素,如天气、临时组织措施与地铁等其他交通方式的连接状态等,从而得到更准确的预测模型。

猜你喜欢

客流量春运客流
客流增多
“春运”来临,古人也闹心
基于嵌入式系统的商场客流量统计算法
2018将迎来怎样的春运
让春运报道更加实用
十年春运路
基于自学习补偿的室内定位及在客流分析中的应用
基于AFC数据的城轨站间客流量分布预测
人工免疫算法在电梯客流时段划分的应用
城市轨道交通运营客流数据分析缺陷及应对