基于深度长短期记忆网络的地铁进站客流预测*
2019-10-16崔洪涛陈晓旭段红勇
崔洪涛 陈晓旭 杨 超,3 项 煜 段红勇
(1.河南省高速公路联网监控收费通信服务有限公司,450018,郑州;2.同济大学道路与交通工程教育部重点实验室,201804,上海;3.同济大学城市交通研究院,200092,上海;4.河南省交通一卡通有限责任公司,450018,郑州//第一作者,高级工程师)
客流预测对于地铁线路设计规划、运营管理以及预警都有着重要意义。当前地铁客流预测方法主要包括基于线性理论预测、基于非线性理论预测和基于组合模型预测的3种方法。线性预测模型主要包括时间序列法[1-3]和卡尔曼滤波模型[4]等。线性预测模型理论简单,但是当预测时间变短(小于15 min,甚至更短)时,随着客流量的非线性与不确定性增强,基于线性理论的预测模型预测性能就会变差。
地铁客流具有非线性、随机性、周期性的特点,短时客流波动性与随机性尤其较大,因此短时客流预测应采用非线性模型进行分析。常用的基于非线性理论的预测模型主要有非参数回归模型[5]、马尔可夫链[6]、神经网络[7]、支持向量机[8]等。基于非线性理论的预测方法更加符合地铁客流的非线性特点,该方法只需根据历史数据训练,从数据本身寻找演变规律,因此该方法需要大量的数据做支持,相应的运算量也会增大。
单一的线性或非线性预测模型往往存在一定的不足与缺陷。多种模型结合预测方法利用两种或者两种以上的预测方法进行预测,既避免了每种方法的缺陷,同时又很好地继承了各种方法的优点,预测精度也较单一预测模型有所提高。文献[9]利用径向基(RBF)神经网络模型进行城市轨道交通线路流量的预测,构建了基于混合核函数的支持向量机模型进行进站客流量预测,最后融合两种预测方法构建了基于灰色关联度最大化的组合预测模型来预测重大节假日线路客流量。文献[10]提出的城市轨道交通短时客流预测模型(EMD-BPN),包含经验模态分解和反向传播神经网络预测模型的组合。文献[11]提出了基于聚类搜索的改进遗传算法和小波神经网络(IGA-WNN)客流预测模型。
近年来深度学习有了充分的发展,当前使用比较多的是深度神经网络。文献[12]设计了深度长短期记忆网络(DLSTM)模型,并利用DLSTM模型对石油产量进行预测。本文首先对多源数据(地铁IC卡数据、气候数据和节假日数据)进行特征构造,然后利用DLSTM模型进行地铁客流预测。本次研究选取深圳市2014年1—3月的地铁刷卡数据进行研究。选取前两个月的数据为训练集,后一个月的数据为测试集。采用不同的DLSTM来预测地铁客流,并与差分自回归移动平均(ARIMA)模型、BP神经网络(BPNN)模型、循环神经网络(RNN)模型和支持向量机(SVR)模型进行比较。试验结果表明,DLSTM模型在准确性方面优于其他模型。
1 数据预处理
本次研究使用的数据来自深圳地铁,包括2014年1—3月的地铁IC卡数据、节假日数据和气象数据。截至2014年底,深圳地铁网由5条线路和118个站点组成,运营里程为178 km,年度客流量为8.6亿人次。地铁IC卡数据格式如表1所示。
表1 2014年深圳市地铁IC卡数据格式
首先对地铁数据中的异常数据进行处理。异常数据包括完全相同的记录、刷卡时间字段有缺失的记录。完成数据清理后,选取深圳北站地铁站刷卡时间在6:00—23:00的地铁IC卡数据记录。此次研究对象为深圳北站地铁站,因为深圳北站是重要的交通枢纽,客流量较大。前两个月的数据用于训练模型,后一个月的数据用于测试验证。深圳北站地铁站一周的进出站客流量如图1所示。
图1 深圳北站地铁站一周进出站客流量
从图1中可以看出:进出站客流量都呈现出了一定的周期性,并且进站客流量和出站客流量存在明显的潮汐现象;早高峰的进站客流量远远高于出站客流量,晚高峰的进站客流量则远远低于出站客流量;工作日的客流量存在明显的早晚高峰,周末的客流量变化相对平缓,不同的工作日之间又有一定的差异。
乘客选择地铁出行与天气状况以及是否是节假日有密切关系。文献[13]对站点进站客流量与天气情况进行了相关性分析,结果显示相关性显著。而客流量还与当天是否是节假日也有很强的相关性。因此气候数据集与节假日数据集也被用于构造输入特征。气候数据集如表2所示,节假日数据集如表3所示。
表2 深圳市气候数据格式
表3 节假日数据格式
在本次研究中,对地铁IC卡数据、节假日数据和气象数据进行融合。选取客流量所在星期、小时、5 min间隔编号、是否节假日、平均气温、最高气温、最低气温、降雨量、大气压、风速、云量、预测时刻的前6个时间间隔的客流量(例如预测9:00—9:05的客流量,用8:30—8:35、8:35—8:40、8:40—8:45、8:45—8:50、8:50—8:55、8:55—9:00的客流量来构造特征)。因此,特征变量可以构造训练数据集。
2 DLSTM模型构建
2.1 LSTM模型
LSTM模型最初由文献[14]作者提出,LSTM模型的主要目标是解决RNN梯度消失且很难处理长序列数据的问题。LSTM模型由输入层、循环隐藏层和输出层组成。与传统的神经网络不同,LSTM模型隐藏层的基本单元是记忆模块。记忆模块包含细胞状态单元(CEC)和3个称为门的特殊运算单元。CEC在整个链中直接向下运行而没有任何激活功能,因此当运用反向传播算法训练LSTM模型时梯度不会消失。记忆模块包含输入门、遗忘门和输出门3个门结构,它们可以控制记忆模块内的信息流。LSTM模型记忆模块的原理如图2所示。遗忘门确定单元状态抛出哪些信息,输入门决定哪些新信息存储在单元状态中,输出门决定单元状态的哪些信息作为输出。
图2 LSTM记忆模块原理图
模型输入为:X=(X1,X2,…,XT),隐藏层状态可以通过以下循环训练得到:
ft=σ(XtUf+St-1Wf+bf)
(1)
it=σ(XtUi+St-1Wi+bi)
(2)
Ct=Ct-1⊗ft⊕it⊗tanh(XtUc+St-1Wc+bc)
(3)
ot=σ(XtUo+St-1Wo+bo)
(4)
St=ot⊗tanh(Ct)
(5)
式中:
Wf、Wi、Wo、Wc——分别为遗忘门、输入门、输出门和CEC的输入权重矩阵;
Uf、Ui、Uo、Uc——分别为遗忘门、输入门、输出门和CEC的循环权重矩阵;
bf、bi、bo、bc——分别为忘记门、输入门、输出门和CEC的偏差向量;
Xt——第一层LSTM模型记忆模块的输入;
ft、it、ot、Ct、St———分别为t时刻忘记门、输入门、输出门、CEC和单元的输出;
St-1——t-1时刻单元的输出;
Ct-1——t-1时刻CEC的输出;
⊕和⊗——分别代表向量求和与向量点积运算;
σ(·)——标准sigmoid函数;
tanh(·)——双曲正切激活函数。
2.2 DLSTM模型
在DLSTM模型中,将多个LSTM模型块进行连接,如图3所示。DLSTM模型可以结合每个LSTM模型层的优点。在分层体系结构中,堆叠多个LSTM模型可以在较低层构建特征。这些特征可以将输入数据中的变化因素,利用非线性转化在较高层映射输出。文献[15]认为在大型或复杂数据情况下,深层次的架构将比浅层架构更能反映出数据的内在联系。
图3 DLSTM 模型结构
St-1,1为上一个状态的第一层的输出,St为现在状态的第一层输出且是下一个LSTM模型记忆模块的输入。对于第二个LSTM模型记忆模块,由上一个状态的St-1,2和现在状态上一层的输出St,1就可以计算得到该记忆模块的输出St,2。后面各层的计算原理都是相同。
2.3 评价指标
为了全面地评价模型的预测效果,本文选取平均绝对误差(EMA)、均方根误差(ERMS)、平均绝对百分比误差(EMAP)作为模型评价指标。这3个指标可以反映预测值与实际值之间的误差大小,其定义分别为:
(6)
(7)
(8)
式中:
h(i)——预测值;
f(i)——真实值。
3 试验结果
利用DLSTM模型分别对深圳北站地铁站的进站客流量和出站客流量进行预测。并且与其它模型预测结果进行比较,比较模型分别为差分自回归移动平均模型(ARIMA)、BP神经网络(BPNN)、循环神经网络(RNN)、支持向量机(SVR)。
设计了3种不同层数的DLSTM模型,分别对进站客流量进行预测。不同结构的DLSTM模型参数以及预测评价指标结果如表4所示,不同DLSTM模型结构的客流量预测结果如图4所示。
表4 不同DLSTM模型的进站客流量预测评价指标
由表4可知,随着DLSTM模型的深度增加,预测精度变高。DLSTM3模型的精度为:EMA=32.33,ERMS=45.74,EMAP=13.90%。
图4 不同DLSTM模型的进站客流量预测结果
从图4中可以看出,DLSTM模型具有较好的预测效果,并且DLSTM3模型的预测值曲线和真实值曲线差异最小。
不同预测模型的进站客流量预测评价指标如表5所示,不同预测模型的进站客流预测结果如图5所示。
表5 不同预测模型的进站客流量预测评价指标
由表5可知,DLSTM3模型的预测精度最高。在所有的比较模型中,RNN模型预测效果最好,而SVR模型的预测效果最差。DLSTM3模型与SVR模型相比较,EMA降低了30.14,ERMS降低了25.62,ERMS降低了20.88%。DLSTM3模型与RNN模型相比较,EMA降低了10.05,ERMS降低了12.84,ERMS降低了2.29%。
图5 不同预测模型的进站客流量预测结果
由图5可见,DLSTM3模型的预测值曲线和真实值曲线差异性最小,而SVR模型的预测值曲线和真实值曲线差异最大。
4 结论
本文提出利用深度长短期记忆网络(DLSTM)方法预测地铁进站客流量。首先,对地铁刷卡数据、气候数据和节假日数据进行预处理并完成特征构造。对深圳北站地铁站进站客流量进行试验验证,设计了不同的DLSTM模型,对各模型的预测结果进行对比分析。结果表明,DLSTM模型预测准确度随着DLSTM模型深度的增加而提高。然后,将DLSTM模型预测结果与其它4种模型(ARIMA、BPNN、RNN、SVR)的预测结果进行比较,结果表明,DLSTM 的预测精度更高。充分验证了深度长短期记忆网络方法在地铁客流预测中的适用性和准确性。在下一步的研究中,将考虑DLSTM模型与其他模型结合起来建立组合模型。