基于深度学习算法的城市轨道交通客流短时预测
2022-11-10尹嘉男吴金国钟玉刚
陈 丹 尹嘉男 刘 钊 贾 萌 吴金国 钟玉刚
(南京工程学院汽车与轨道交通学院1) 南京 211167) (南京航空航天大学民航学院2) 南京 211106)
0 引 言
随着城市人口规模的不断扩大,出行人口数量和交通需求急剧上升,引发的交通拥堵导致了乘客行程时间延长、乘客满意度降低,以及燃油消耗增加、环境污染程度增大等一系列现实问题.城市轨道交通具有运量大、准点率高、安全舒适、节能环保等特点,近年来得到了大力发展,但城市轨道交通站点客流的快速聚集反过来也加剧了交通拥堵带来的一系列问题.因此,准确预测城市轨道交通短时客流,对于城市轨道交通调度动态优化、提前缓解交通拥堵,以及提升城市轨道交通服务水平具有重要的研究意义和应用价值.
交通客流短时预测问题可以将短时客流预测模型划分为三大类,即仿真模型、参数模型和非参数模型[1].其中,仿真模型是指借助交通仿真工具来预测短时客流,Zhang[2]通过仿真车辆运行环境和天气环境来预测公路交通短时流量,并实现了交通运行过程的三维显示.参数模型是指采用时间序列分析方法来预测短时客流,包括卡尔曼滤波、自回归移动平均及其衍生模型等.Jiao等[3]考虑了历史客流数据的偏差、误差修正系数等因素,提出了基于卡尔曼滤波方法的修正模型用于预测.杨静等[4]提出了一种基于变点模型、小波变换和自回归滑动平均模型(ARMA)的组合预测方法,对北京市某地铁站的进站客流量进行了短时预测.参数模型是一种较为成熟的预测方法,具有输入数据量少、计算简单的特点,但该模型需要输入数据具有稳定性,对于非平稳数据则需经过预处理使其平稳化后再进行预测,而预处理过程则可能降低预测精度[5].非参数模型没有严格的数学解析形式,主要包括人工神经网络模型、k近邻算法模型等.Clark[6]考虑了速度、占用率、流量等因素,采用k近邻算法模型对机动车道交通流量进行预测.李科君等[7]针对城市轨道交通短时进站客流序列的非线性特征,采用非线性自回归神经网络模型对地铁进站客流进行预测,预测精度优于线性模型.
由于非参数模型不需要输入数据具有平稳性假设,适用于处理非线性和波动性显著的城市轨道交通短时客流时序数据,特别是在当今大数据背景下,深度学习作为一种新兴的非参数模型在处理海量复杂数据时体现出了明显优势,但由于深度学习算法需要学习大量输入数据的特征规律,运算速度较慢,鉴于短时预测对运算时间的特别要求,需要考虑预测模型的运算效率.因此,将深度学习算法用于短时预测,需要同时关注预测准确性、稳定性以及算法效率等问题.文中分析城市轨道交通短时客流的时序数据特征,构建基于LM算法的反向传播神经网络(LM-BP)模型和基于长短期记忆神经网络(LSTM)模型,并通过实际客流数据对所提方法进行验证.
1 短时客流特征分析
选取苏州地铁某站点作为研究对象,根据地铁自动售检票(automatic fare collection, AFC)数据统计得到每5 min的短时客流量,其中,2015年7月1—7日的短时客流分布见图1.
图1 1周客流量的时间分布
由图1可知:工作日(7月1—3、6—7日)08:00—10:00及18:00—20:00左右出现了两个明显的进站客流高峰期,属于双峰型客流;而休息日(7月4—5日)客流量整体表现为单峰特征.1周客流时序数据呈现出工作日和休息日两种交通分布模式,并且表现出明显的非线性、非平稳性和突变性等特征.接下来分析同种交通分布模式下的客流分布特征,见图2.
图2 同种交通模式下的客流分布
由图2a)可知:虽然2 d客流量整体呈现双峰型特征,且同属一种交通模式,但在客流量均值、局部波动性等方面仍存在较大差异.为进一步量化分析同种交通模式下的客流分布特征,对全年48组周一客流量的分布特征进行了统计分析.由图2b)可知:18:00—20:00晚高峰时段的统计结果,其中,第14时段的客流量在[40,129]之间波动,均值为62.6,标准偏差为17.7,整个晚高峰时段客流量的标准偏差位于区间(6,18),可以看出,同种交通模式下的客流分布仍具有显著的非周期性波动特征.
2 预测模型
2.1 基于LM-BP神经网络的客流预测模型
BP传播网络是一种应用较为广泛的人工神经网络模型,通过信息正向传播与误差反向传播来不断调整各个神经元权重,反复训练直至网络输出误差降低到可接受范围内.BP网络模型可以模拟任意非线性输入-输出关系,可借助该模型进行城市轨道交通短时客流预测,但该模型也存在学习效率低、收敛速度慢以及可能出现局部极值点等缺点,因此,引入LM算法对其进行优化.
令wk、wk+1表示第k次和第k+1次训练的网络权值向量,则权值调整量Δwk为
Δw=wk+1-wk
(1)
根据高斯-牛顿法可知:
Δwk=-[JT(wk)J(wk)]-1J(wk)e(wk)
(2)
式中:e(wk)为权值误差向量;J(wk)为误差对权值微分的雅可比矩阵.LM算法在此基础上引入了调节性参数u,则权值调整规则为
Δwk=-[JT(wk)J(wk)+uI]-1J(wk)e(wk)
(3)
在训练过程中,如果更新权值后能使输出误差减小,则需降低u,反之,则增加u.当u较大时,JT(wk)J(wk)项可忽略不计,此时权值调整规则近似于梯度下降法;当u减小趋近于0时,权值调整规则近似于高斯牛顿法.通过参数u可以实现权值向量的自适应调节,使其既有高斯-牛顿法的局部收敛性,又有梯度下降法的全局性,因此,收敛速度和学习效率得到了很好的提升.
2.2 基于LSTM的客流预测模型
循环神经网络(RNN)考虑了时间序列特征,隐含层各神经元之间通过链式结构相互连接,适用于处理在时序上存在关系的数据.普通的RNN网络在处理大量时序数据时存在记忆快速衰退的长期依赖问题,进而引发梯度消失影响训练效果.为解决长期依赖问题,LSTM模型在RNN结构的基础上,引入了LSTM细胞单元,通过遗忘门、输入门和输出门等结构来选择性的遗忘、保留和更新记忆,使其传递的记忆信息可控,从而使得LSTM具备长期记忆功能.LSTM的结构示意图见图3.
图3 LSTM网络结构示意图
xt-t时刻的输入,即实际测量的城市轨道交通客流量;yt-t时刻的输出,即LSTM神经网络模型估计的客流量;ht-LSTM细胞单元t时刻的输出;Ct-LSTM细胞单元状态,用于控制并传递记忆信息,捕获输入数据的时序特征
图4为LSTM细胞单元结构.
图4 LSTM细胞单元结构图
由图4可知:LSTM细胞单元通过遗忘门、输入门和输出门等门限结构实现记忆的更新与传递.根据当前时刻输入和上一时刻LSTM细胞单元输入,通过遗忘门忘记没用的信息,确定上一时刻的单元状态有多少需要被保留到当前时刻:
ft=σ(Wf·[ht-1,xt]+bf)
(4)
式中:Wf为遗忘门对应的权值向量;bf为偏置量;σ为sigmoid函数,输出0至1之间的数字,0为完全遗忘,1为全部保留.然后,通过输入门和候选门来更新细胞状态:
it=σ(Wi·[ht-1,xt]+bi)
(5)
(6)
(7)
ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=ot×tanh(Ct)
(9)
式中:Wo、bo为输出门权值向量和偏置量,细胞单元的输出量ht由当前时刻的细胞状态和输入共同决定.LSTM模型通过各门限结构之间的交互协作,解决了RNN网络的长期依赖问题,细胞间的链式结构使得该模型具有较长时间的记忆能力,之前的信息在长时间后的训练中也能得到保留,并结合模型输入对当前细胞状态进行调整.
3 实例分析
3.1 预测结果
根据苏州地铁中央花园站2015年7月1日06:00—8日00:00的5 min时段客流量时序数据,基于LM-BP神经网络的客流预测模型进行数据训练,并预测7月8日每5 min时段客流量变化趋势,预测结果见图5.
图5 基于LM-BP神经网络的客流预测结果
由图5可知:基于LM-BP神经网络模型的客流预测结果与实际观测数据接近,能较好的反应短时客流量的变化趋势.为直观反映预测结果的准确性,图6为误差分布及误差频数统计.
图6 基于LM-BP的预测结果误差和误差频数统计
由图6可知:基于LM-BP神经网络客流预测模型的预测结果在0附近波动,并且80%时段的预测误差在区间(-10,10)以内.接下来,利用2.2建立的基于LSTM神经网络的客流预测模型进行数据训练,预测结果见图7.
图7 基于LSTM神经网络的客流预测结果
由图7可知:LSTM神经网络模型能较好的预测城市轨道交通短时客流量变化趋势,预测结果贴近观测值,为更直观反映预测准确性,图8为误差分布及误差频数统计.
图8 基于LSTM的预测结果误差和误差频数统计
由图8可知:基于LSTM神经网络客流预测模型的预测结果在0附近波动,并且85%时段的预测误差在区间(-10,10)以内.
3.2 预测性能分析
对比分析参数模型与本文所构建的基于深度学习的非参数模型预测结果,给出了常用的三次指数平滑模型的预测结果,见表1.
表1 城市轨道交通短时客流预测性能对比分析
由表1可知:本文所构建的基于深度学习的LM-BP和LSTM模型预测结果的MAE相较于参数模型中常用的三次指数平滑模型而言,分别下降了49%和47%;MAPE则分别下降了54%和59%;STD则分别下降了49%和46%.这说明本文所提预测方法相较于参数模型而言,预测准确性和稳定性方面均得到了较大程度的提升.而深度学习模型需要训练网络,因此,计算时间相较于非参数模型而言显然会有所增加.
对比本文所构建的两种模型预测结果可以看出,LSTM模型的预测准确性要优于LM-BP模型,预测结果的MAPE下降了13%,这是因为LSTM模型具有长期记忆功能,能有效捕获短时客流数据的时序特征;在预测稳定性方面,两种模型相差不大;而LM-BP模型的计算时间要明显优于LSTM模型,这是由于LM-BP模型采用了梯度优化算法,迭代次数在60次左右就趋于收敛,大大提升了收敛速度和计算效率.
4 结 束 语
城市轨道交通系统易受天气、运行设备、管制保障、人为因素等多方因素影响,其短时客流具有显著的非线性、非平稳性和非周期性波动等特征.本文采用深度学习算法,分别构建了基于LM-BP和LSTM神经网络的短时客流预测模型,该模型不需要时序数据具有平稳性,特别适用于处理非线性、非周期性波动的短时客流时序数据.实例分析表明,本文所建模型相较于现有的参数模型而言,预测结果的准确性和稳定性均得到了大幅提升.LSTM模型相较于LM-BP模型而言预测准确性更高,但需要更多的计算时间.在后续研究中,将进一步探讨如何提升预测精度和计算效率.