基于多层卷积长短期记忆神经网络的城轨路网短时客流预测研究

2023-09-21张思韬张凌云

现代城市轨道交通 2023年9期

王忻，李晔，张思韬，张凌云

（铁科院（北京）工程咨询有限公司，北京 100081）

1 背景

我国城市化正进入高速发展时期，越来越多的城市建立了城市轨道交通系统，并且城市轨道交通在公共交通中的作用越来越显著，“智慧化”成为城市轨道交通未来的发展趋势[1]。而精准的客流预测是建设智慧化城市轨道交通的重要前提，能实现高峰客流的提前感知，可为运营期间进行动态运力调整提供数据基础，进而为城市轨道交通的安全高效运营提供保障[2]。

目前，短时客流预测主要基于2类模型：传统统计模型和机器学习模型。传统统计模型从机理上对线性系统进行刻画，具有原理简单、方便计算等优点。蔡昌俊等构建差分整合移动平均自回归模型（ARIMA）实现进出站客流的精准预测[3]。邵必林等在ARIMA模型的基础上应用季节移动平均自回归模型（SARIMA）实现客流数据线性建模[4]。帅春燕等基于支持向量回归模型实现站点短时进出站客流预测[5]。但传统数理统计模型存在对实际问题进行简化和假设的问题，对于地铁时序客流重的非线性特征难以刻画，导致预测精度不高[6]。因此，随着计算机技术的发展，基于机器学习模型的预测算法成为目前较为流行的客流预测算法，对于交通客流复杂时空特征具有较好的捕获效果[7]。魏姝瑶等将长短期记忆神经网络（LSMT）与传统统计模型结合提出SARIMA-LSTM模型[8]，但是该模型缺少对空间特征的刻画。Cao等利用卷积神经网络（CNN）提取空间特征提升了预测效果[9]，但对时间特征刻画不足。唐继强等利用图卷积结合LSTM进行预测网络搭建，同时考虑了客流的时空特征[10]，但仅为图卷积模块和LSTM模块的拼接，并没实现模型的深度融合。

由于城市轨道交通进出站客流是一个复杂的非线性系统，在时间维度上存在短期波动性以及长期的周期性，同时在空间上由于站点之间的相关性导致站点客流与站点客流之间具有复杂的空间相关性。目前研究忽略了客流之间的相互影响，缺少对站点短时客流之间的时空关系深入挖掘，无法实现时空特征的深度融合，导致目前短期客流预测存在精度不高的问题。

综上所述，本文提出一种基于多层卷积长短期记忆神经网络（ConvLSTM）的城市轨道交通短时客流预测模型，充分考虑时序客流的时间特征和站点与站点间的空间特征，实现了时间特征和空间特征的刻画和融合，相比于现有模型具有更好预测效果。

2 模型描述

2.1 卷积长短期记忆神经网络

LSTM是循环神经网络（RNN）的变体，是处理时间序列预测问题的常用机器学习方法，解决了RNN因为梯度爆炸和梯度消失导致的无法保存长期序列特征的问题[11]，如图1所示。ConvLSTM将LSTM拓展至二维，将LSTM中的一部分全连接过程替换为卷积运算，强化了LSTM无法刻画的空间特征，可处理多维数据的时序预测问题[12]，如图2所示。

图1 长短期记忆神经网络结构

图2 卷积长短期记忆神经网络结构

ConvLSMT的计算原理类似于LSTM，具有3种类型的门结构：遗忘门、输入门和输出门。遗忘门决定应丢弃或保留哪些信息，控制前一个隐藏状态的信息和当前输入信息传递的保留程度，如式（1）所示：

式（1）中，ft为遗忘门，控制过去输入信息累积；σ为sigmoid激活函数；Xt为时间t的输入矩阵序列；Wx为输入序列的卷积权重；Ht-1为前一时刻隐藏状态单元；Wh为隐藏单元的卷积权重；Ct-1为前一时刻神经元状态单元；Wf为遗忘门卷积权重；bf为遗忘门偏置；*为卷积运算；为哈达玛积运算。

输入门用于决定输入神经元状态的信息，控制前一层隐藏状态的信息和当前输入的信息传递后的信息更新程度，如式（2）所示：

式（2）中，it为输入门，控制当前输入信息保留多少；Wi为输入门卷积权重；bi为输入门偏置。

输出门用来确定下一个隐藏状态的值，隐藏状态包含了先前输入的信息，如式（3）所示：

式（3）中，ot为输出门，控制当前状态有多少信息对外可见；Wo为输出门卷积权重；bo为输出门偏置。

最后隐藏状态和神经元状态计算如式（4）～式（6）所示：

式（4）～式（6）中，Ct为神经元状态；为临时单元；bc为残差；Ht-1和Ht分别为前一时刻隐藏状态和当前时刻隐藏状态单元。

2.2 基于多层 ConvLSTM 的短时预测模型

本文提出基于多层ConvLSTM的短时预测模型（M-ConvLSTM），通过ConvLSTM中的卷积操作获取站点间客流的空间特征以及LSTM机制捕获时序客流的时间特征，实现对下一时间间隔内的路网客流预测。该方法主要分为2个部分：第1部分通过多层ConvLSTM捕获路网客流的时空特征；第2部分引入二维卷积对空间特征进一步强化，如图3所示。

图3 多层ConvLSTM短时预测模型

其中，ConvLSTM 3×1×10代表该层采用10个大小为3×1的卷积核的卷积长短期记忆层，Conv2D 3×10代表该层采用3×10的卷积核的卷积层，BN+ReLU为激活层及线性整流。模型输入为前序的路网进出站量序列Pt，输出为预测的路网进出站量pt：

式（7）中，Conv2D为二维卷积；M - ConvLSTM为多层ConvLSTM。

3 案例分析

3.1 数据来源

某城市地铁路网共设23座车站，运营时间为早6 : 00 — 22 : 00。选用城市2021年6月至12月共7个月的进出站数据，在进行配对分析之后，得到了相应的断面流量数据，将工作日与周末、法定节假日等分别统计，得到4个图像，分别对应工作日上行、工作日下行、节假日上行、节假日下行。每张图片中横轴代表时间，纵轴代表区间断面，如图4所示。该线路客流在工作日呈现明显的早晚双高峰，分别在7 : 30和18 : 00前后；同时，上下行呈现明显的对称分布，早晨上行与晚上下行在区间和客流密度上都呈现出很大的相似性，与工作日一般客流特点一致。节假日客流整体上大于工作日客流，也呈现了一定的早晚高峰现象，但是其分布更加分散，在全天均有相对高的客流，并且对称性不如工作日明显。

图4 不同时间上下行客流热度图

本文采用其2021年8月至9月去除周末及节假日共44天的30 min粒度自动售票系统（AFC）数据进行案例分析，其中前26天为训练集，之后9天为验证集，最后9天为测试集。

3.2 实验结果

本文选用平均绝对误差（MAE）、均方根误差（RMSE）和平均绝对百分比误差（WMAPE）作为评价指标对预测精度进行评价，如式（8）～式（10）所示：

为评价本文M-ConvLSTM模型预测效果，选用多个模型进行对照分析，包括：支持向量回归（SVR）[13]、LSTM和ConvLSTM，对下一时段路网进站量预测结果如表1所示。

表1 各模型预测结果对比

由表可知，本文模型在各项评估指标均优于基准模型，对比SVR、LSTM和ConvLSTM本文模型在MAE上提升了72.2%、54.1%和18.7%。通过WMAPE指标可看出本文模型相比基准模型分别提升了39.99%、26.65%和5.68%的预测准确率。说明本文提出的M-ConvLSTM模型在预测过程中充分捕获了客流数据间的时空特征，具有良好的预测精度。

为直观观察算法预测效果，以路网中某站为例绘制进站量时序图，如图5所示。可观察到本文模型预测结果与实际值高度吻合，预测值在时序上呈双峰特征，与现实物理世界规律一致，且不仅在峰值时段具有较好的拟合效果，在非高峰时段的低谷时段对波动客流量的预测效果也同样良好，说明本文模型在时间上具有较强的时间特征捕获能力。

图5 M-ConvLSTM预测结果与真实值对比

同时，进一步观察各个站点的预测WMAPE，如图6所示。可观察到本文模型在大部分站点的WMAPE值较低，且在各站点的预测准确率均高于基准模型，对于所有类型的站点均有较好的预测精度，说明本文模型通过卷积操作，挖掘到不同站点间的空间关系，在空间上具有较强的空间特征捕获能力。

图6 各站点预测误差分布

4 结论

本文针对城市轨道交通路网短时客流预测问题，构建了基于多层ConvLSTM的短时预测模型，通过ConvLSTM中的卷积操作获取站点间客流的空间特征以及LSTM机制捕获时序客流的时间特征。在某城市地铁数据集上进行案例验证以及分析，结果表明本文模型在预测精度上具有较好效果，能够充分捕获路网客流的时空特征。

精准的客流预测能够及时有效地预测未来路网信息，帮助运营部门提前感知高峰客流，为运力的动态调整提供数据基础，具有较高的研究价值和应用价值。未来研究可引入外部因素如天气、突发事件等信息，进一步提升模型的泛用性和预测精度。