APP下载

基于LSTM的轨道交通进站客流短时预测研究

2021-10-13杜希旺赵星李亮

关键词:时间序列轨道交通

杜希旺 赵星 李亮

摘 要:对轨道交通进站客流进行准确的预测有助于城市交通系统更好的管理,及时做出应对措施。使用K-means聚类方法对南京地铁113个站点进行聚类,得到5个不同类别的轨道站点,分析不同类型站点进站客流的时序特征以及天气与工作日因素对客流的影响,发现是否为工作日对进站客流影响最为明显。用长短时记忆网络将前35天的数据作为训练集预测后4天的客流量,将预测结果与循环神经网络和支持向量机做比较。结果表明:类别1和类别3站点的进站客流预测精度要优于其他类别,长短时记忆网络模型对居住型轨道站点进站客流的短时预测具有很好的适用性。

关键词:LSTM;K-means;短时交通流预测;时间序列;轨道交通

中图分类号:U231

文献标志码:A

城市轨道交通的发展作为城市公共交通现代化的重要组成部分,对于提高大中型城市客流运输量和运输效率、发展绿色交通以及缓解大城市道路交通拥堵具有重要意义。截至2020年年底,全国(不含港澳台)境内共有44个主要城市建设并开通投入运营的城市轨道交通线路233条,运营里程7 545.5 km,车站4 660座,实际运行列车2 528万列次,完成客运量175.9亿人次,进站量109.1亿人次。然而,随着我国城市化进程的不断加快,城镇化水平已突破60%,大量的人口涌入城市,给城市轨道交通带来巨大的压力和考验,尤其是在早高峰和晚高峰时,城市圈内的通勤需求给轨道交通带来更加沉重的负担。为加快建设交通强国的步伐,完善综合交通枢纽和物流网络,提高城市群和都市圈内部城市之间轨道交通通达性,提高运输效率,准确的掌握乘客的出行规律,对城市轨道交通各站点的客流量进行准确预测十分有必要。

目前,国内外针对轨道交通客流短时预测已经进行了较深入的研究。张智勇[1]等在站台短时客流特性的基础上,提出一种改进卡尔曼滤波短时客流预测模型。马超群[2]等考虑到了时间粒度对客流预测的影响,选取不同时间粒度下的时间序列,使用差分自回归移动平均模型(autoregressive integrated moving average model,ARIMA)进行预测。因为客流具有周期性,王莹[3]等在ARIMA的基础上使用季节性自回归移动平均模型对北京地铁进站客流进行预测,可以准确的判断出客流量的变化趋势。杨军[4]等基于灰色马尔科夫预测模型提出了一种可以预测大型活动期间的轨道交通大客流的模型。潘杰[5]等在灰色马尔科夫预测模型基础上,对原始数据进行滑动平均处理,再与无偏灰色模型方法结合,提出了一种滑动无偏灰色马尔科夫预测模型。传统的理论模型在轨道交通客流短时预测上,虽然操作简单,但是难以满足当前地铁进站客流波动变化的限制。

基于机器学习的计算机预测模型依靠算法,通过大量的训练数据进行特征学习,从而提高分类或预测的准确性,覆盖范围广,适应性好,受到了学者广泛关注。近年来,大量研究表明循环神经网络(recurrent neural network, RNN)在对时间序列预测时要比其他模型更准确,HEWAMALAGE[6]等通过RNN与统计模型的比较,认为其是一种有竞争力的预测方法。MADAN [7]等利用离散小波变换(discrete wavelet transformation,DWT)对时间序列数据进行分解,分别使用ARIMA和RNN进行预测,也充分说明RNN在时间序列方面的优势。但是,RNN无法解决长序列训练过程中梯度消失和梯度爆炸的问题。针对这一问题,MA[8]等提出了一种长短时记忆网络(long short term memory network, LSTM),通过对北京市车速数据的测试,发现其预测精度和稳定性都能达到很好的效果。罗向龙[9]等根据交通流的时空相关性,提出一种基于K-最近邻与LSTM相结合的短时交通流预测模型。根据轨道交通客流的规律性和随机性,LIANG[10]等引入变分模态分解(variational mode decomposition,VMD)将客流进行分解,结合LSTM实现客流的预测。MA[11]等提出了一种由卷积神经网络和双向长短时记忆网络组成的并行结构模型,分别提取时间和空间特征,在模型中考虑了整个地铁网络的时空相关性。LSTM依靠自身优异的性能,经常被用来处理时间序列预测问题。

在轨道交通站点聚类上,K-means聚类方法因其简单高效、收敛快等优点被广泛使用。徐威[12]等选择路网密度、商业比例、居住比例、客流等作为特征指标,使用K-means聚类方法将苏州市轨道交通站点分为5类。邓评心[13]等采用定性、定量分析相结合,通过K-means聚类方法将苏州轨道交通系统的58个站点分为了4类。GAN [14]等使用K-means聚类方法将南京地铁站点分为7类,分别研究各类站點乘客出行特征与站点周围土地利用类型以及覆盖范围之间的联系。

大部分学者在进行客流短时预测研究时都注重在模型方法上的创新以提高预测的精度,但是较少从不同类型站点进站客流的差异性规律角度研究预测模型的适用性,往往在试验部分只选择一个站点进行验证,这样会存在偶然性。对此本文以南京轨道交通刷卡数据为研究对象,在各个站点客流的时序统计特征基础上,使用K-means聚类算法对南京轨道交通系统113个站点进行聚类,然后对各个类别站点的进站客流数据建立LSTM短时客流预测模型进行预测,比较各类别站点的预测结果,进而判断并分析各类别站点在使用LSTM短时客流预测模型的情况下预测精度上的差异。

1 模型构建

1.1 K-means聚类

K-means聚类是一种无监督学习的聚类方法,通过迭代算法不断更新各个聚类中心,从而寻找k个簇,使得聚类结果所产生的损失函数可以达到最小。算法步骤如下。

步骤1:选取聚类特征指标,在数据集中任意选取k个样本作为最开始的聚类中心;

步骤2:计算每个样本到聚类中心的欧式距离,并根据最小距离重新对相应样本进行划分聚类;

步骤3:计算每一类中各个样本的平均值从而得到一个新的聚类中心;

步骤4:重复步骤2和步骤3,直到满足最大迭代次数或者停止条件。

2 基础数据分析

截至2017年底,南京地铁已开通6条线路、共建成139座车站,线路总长为258 km,地铁线路总长度在中国大陆排名第5位(仅次于上海、北京、广州、深圳)、居世界第12位。本文选用南京市轨道交通2017年9月23日—2017年10月31日共计39 d,每日5:30—23:50进站的客流量为研究数据,由于部分数据缺失,只选择了其中113个站点为研究对象,并每隔10 min统计一次进站客流的人数,每个站点共有4 329条数据。

2.1 特征指标选取

时间序列种类多样,具有众多特征,每一个特征都对时间序列从某一角度上进行了一定的理解和认知。为提高每个类别中站点预测精度的相似性,特征指标的选取至关重用。时间序列的特征包括形态特征、模型特征以及结构特征三种类型,其中形态特征是指对时间序列在物理和形状上发生改变的一种表现形式;模型特征是指时间序列在变化过程中隐藏的规律;结构特征是指对时间序列的结构和内在变化的说明。

根据不同轨道站点的进站客流特征,本文选取偏度S、峰度K、工作日早高峰、晚高峰进站系数,非工作日早高峰、晚高峰进站系数,工作日客流标准差、非工作日标准差以及工作日客流系数作为聚类依据。

本文统计了南京轨道交通系统各个站点的进站客流,早高峰进站客流为选取时间7:00—9:00的进站客流,晚高峰进站客流为选取时间17:30—19:30的进站客流,工作日客流标准差为工作日全天10 min进站客流数的标准差,非工作日标准差为非工作日全天10 min进站客流数的标准差,偏度一般用来衡量数据分布偏斜方向和程度的大小,峰度是用来研究数据分布陡峭或者平滑的一种统计学测定。公式表达为:

早、晚高峰进站系数=该时间段内进站客流全天进站客流(8)

工作日客流系数=一周中工作日进站客流总数一周进站客流总数(9)

根据K-means聚类结果,类别1中只有新街口站,作为亚洲最大的地铁站为中华第一商圈服务,客流量要远远大于其他的几类车站;类别2和4中,站点为混合型,即站点周围多为居住型用地、高校、旅游景点或者商业用地;类别3中站点周围分布大量的居住型用地,以通勤客流为主;类别5中地铁站多为交通枢纽和商业中心。

2.3 进站客流时序特征分析

在5个类别站点中选取新街口站、夫子庙站、软件大道站、油坊桥站、奥体中心站、梦都大街站、南京南站以及鼓楼站共8个站点的进站客流作为各个类别的代表站点进行特征分析。各站点39 d客流量变化如图2所示,不同类型的站点客流量在不同的时间段上表现不同的特征。新街口站单日的客流量明显大于其他7个站点,在周末,新街口站、夫子庙站、南京南站以及奥体中心站客流量上升,梦都大街站、鼓楼站、软件大道站和油坊桥站客流量下降。在周五,除奥体中心站客流每周不一样外,其他站点客流均上升。国庆假期过后的三个星期里,进站客流量具有明显的周期性。

影响进站客流量的因素众多,本文主要探究天气、温度、是否工作日以及站点周围用地属性对各个地铁站进站客流的影响。在39 d的数据中选取2017年10月16日—2017年10月22日完整一周的客流量单独研究。如图3所示,工作日和非工作日客流量呈现两种不同的特征,在客流量上,新街口站、夫子庙站非工作日的客流量要大于工作日的客流量,鼓楼站、软件大道站、油坊桥、奥体中心站以及梦都大街站工作日的客流量大于非工作日客流量,而南京南站的客流量无明显变化;就站点周围土地利用而言,新街口和夫子庙作为旅游商业用地,客流多以消费游玩为目的,进站客流非工作日的高峰时间比工作日时间提前并且持续时間更长。奥体中心作为文化体育设施用地,客流总量较小,在工作日有明显的早、晚客流高峰,非工作日客流高峰则与奥体中心举办的一些大型活动密切相关,大型活动的举办会导致附近站点客流急剧增长,活动结束后站点的进站客流增多,从而形成进站客流高峰[15]。油坊桥站附近多为居住用地,进站客流多为通勤客流,因此只有一个早高峰。南京南站作为对外枢纽,客流分布均匀,进站客流量与周围交通枢纽密切相关[16]。鼓楼站、软件大道站以及梦都大街站周围有办公商业用地,非工作日客流高峰比工作日开始时间延迟且客流量小,有早、晚高峰。

为了分析天气和温度对进站客流的影响,选取8个车站同为星期三的10月11日(雨)、10月18日(阴)和10月25日(晴)的进站客流,以确保具有其他相同的特征,如图3所示。可以发现,在不同的天气条件下各个站点的客流并未出现明显的变化。

进一步探究各个因素对客流的影响,使用Spearman进行相关性分析,工作日与非工作日对客流相关性显著,天气与气温对客流的影响并不显著,如表2所示。因此,针对轨道交通客流短时预测,本文以是否为工作日作为预测模型的特征变量。

3 模型预测结果

3.1 模型参数配置

建立LSTM网络预测模型对进站客流进行准确的预测,需要对模型的一些参数进行调试,例如,神经元数量、输入层的维度、时间步长、隐藏层的层数与维度和输出层的维度。

经过反复试验,将预测模型设置为两层的LSTM网络,中间为dropout=0.2的随机失活层,以防止过拟合,最后一层则为全连接层。输入层的维度为2维,用过去15个时间步长来预测未来,第一层网络中的神经元数量为100个,第二层网络中的神经元数量为50个。选定Adam优化器作为本文LSTM网络模型的优化算法,Adam优化器具有收敛速度快、实现简单、计算高效等优点,普遍被应用于神经网络模型中。损失函数是模型对数据拟合程度的反映,即模型预测出来的值与实际值之间的差值,模型拟合效果越好,损失函数越小,本文选择均方误差(mean square error,MSE)作为模型的损失函数。

将工作日的标签设置为1,非工作日的標签设置为0,look_back=15,batch_size=64。需要特别说明的是,因为数据中只有国庆一个节假日,且并无对节假日轨道交通客流短时预测,因此将国庆期间的工作日标签也设置为0。

将各个站点前35 d的数据(共3 885条数据)作为训练集,最后4 d的数据(共444条数据)作为测试集。使用基于TensorFlow后端的Keras框架进行测试,并使用训练集对该神经网络模型进行训练,训练次数设定为200次。

3.2 评价指标

为了评价模型的性能,使用均方根误差和决定系数两个指标对试验预测的结果进行量化评估。误差函数的计算公式如下所示:

1)均方根误差(root mean square error,RMSE)

RMSE=1n∑nt=1yt^-yt2(12)

2)决定系数(R-square,R2)

R2=1-∑nt=1(yt-yt^)2∑nt=1(yt-yt)2(13)

式中,yt^为地铁进站客流预测值,yt为地铁进站客流真实值,yt为地铁进站客流真实值的均值,n为样本数量。

均方根误差反映了预测值与真实值之间的偏差,代表预测的总体可靠性,其值越小,说明预测偏差越小,即说明预测总体越可靠。决定系数取值范围为[0,1],数值越大表示模型拟合效果越好。

3.3 预测结果

通过LSTM对8个车站进站客流进行预测,不同类型站点的预测结果有所不同。如图4所示,模型在训练的过程中,在前30次的训练损失函数下降速度快,在训练的后期,损失函数均趋于收敛,训练效果较为理想,其中奥体中心站和梦都大街站前期损失函数下降较慢,损失值比其余站点大。

将处理好的测试集输入训练好的LSTM模型中,可以得到的预测结果如图5所示,包含两个工作日和两个非工作日,说明面对不同类型车站的进站客流,模型具有良好的准确性、可行性以及适用性。但是,由于不同类型站点客流的进站特征规律存在差异,模型预测的准确度也会有所不同,总体而言,客流波动性较小的站点预测精度要更加准确。南京南站进站客流受到高铁列车到站时间的影响,客流波动性大且无规律,奥体中心站受举办活动的影响,客流会在短时间内突然增加,给模型的训练提高了难度。相反,客流进站规律且上下波动相对较小的油坊桥站以及新街口站的客流预测结果决定系数可以达到0.99。

将考虑是否工作日影响的LSTM模型(LSTM-workday)与支持向量机模型(support vector machine, SVM)、RNN模型以及LSTM模型的预测结果进行比较,如表3所示。可以发现,考虑是否工作日的LSTM模型可以很好地对进站客流进行预测,预测结果要优于不考虑是否工作日的LSTM、RNN和SVM,其中,新街口站和油坊桥站客流预测的决定系数可达到0.99,奥体中心和梦都大街站客流预测的决定系数小于0.90。

进一步对各个类别站点的进站客流使用LSTM-workday进行预测,类别1和类别3的预测精度明显优于其他3个类别,类别4中的站点预测效果最不理想,预测决定系数大于0.95的站点只有18%,所有站点使用LSTM-workday预测决定系数均大于0.70,如表4所示。

4 结论

本文使用K-means聚类方法对南京地铁113个站点进行聚类,得到5个类别的轨道站点,对各个类别的站点的进站客流使用LSTM进行预测。

1)发现类别1和类别3的站点的预测效果最好,其次是类别2和类别5,最后是类别4。LSTM在预测周围用地属性是居住型的站点的进站客流最为准确,可以为用LSTM进行客流预测时站点的选择提供依据。

2)在预测方法上,使用LSTM预测模型,与SVM和RNN模型进行比较,添加是否工作日因素明显会提高模型预测的精度。

3)天气作为影响进站客流的重要因素之一,在工作日的影响要小于非工作日的影响,其对节假日客流量的影响较为显著。由于数据不足,考虑天气因素对模型的预测精度并不会有显著的提高。

4)不同类型站点的进站客流表现出不同的时空特征,为进一步提高模型的准确度,需要增加试验的数据,可以考虑更多的影响因素,宜对客流采用组合模型进行预测。

参考文献:

[1]张智勇, 张丹丹, 贾建林, 等. 基于改进卡尔曼滤波的轨道交通站台短时客流预测[J]. 武汉理工大学学报(交通科学与工程版), 2017, 41(6): 974-977.

[2]马超群, 李培坤, 朱才华, 等. 基于不同时间粒度的城市轨道交通短时客流预测[J]. 长安大学学报(自然科学版), 2020, 40(3): 75-83.

[3]王莹, 韩宝明, 张琦, 等. 基于SARIMA模型的北京地铁进站客流量预测[J]. 交通运输系统工程与信息, 2015, 15(6): 205-211.

[4]杨军, 侯忠生. 一种基于灰色马尔科夫的大客流实时预测模型[J]. 北京交通大学学报, 2013, 37(2): 119-123,128.

[5]潘杰, 马超群. 基于改进灰色马尔科夫模型的地铁客流预测[J]. 交通科技与经济, 2018, 20(6): 52-56,69.

[6]HEWAMALAGE H, BERGMEIR C, BANDARA K, et al. Recurrent neural networks for time series forecasting: current status and future directions[J]. International Journal of Forecasting, 2021,37(1):388-427.

[7]MADAN R, SARATHIMANGIPUDI P. Predicting computer network traffic: a time series forecasting approach using DWT, ARIMA and RNN[C]//2018 Eleventh International Conference on Contemporary Computing (IC3), 2018:1-5.

[8]MA X L, TAO Z M, WANG Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54:187-197.

[9]罗向龙, 李丹阳, 杨彧,等. 基于KNN-LSTM的短时交通流预测[J].北京工业大学学报, 2018, 44(12):55-61.

[10]LIANG D, XU J, LI S, et al. Short-term passenger flow prediction of rail transit based on VMD-LSTM neural network combination model[C]//2020 Chinese Control and Decision Conference(CCDC). Hefei, China: Institute of Electrical and Electronics Zngineers Zne, United States, 2020: 5131-5136.

[11]MA X, ZHANG J, DU B , et al. Parallel architecture of convolutional bi-directional lstm neural networks for network-wide metro ridership prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2018(99):1-11.

[12]徐威,鄭长江,马庚华,等.基于k-means聚类的城市轨道交通站点分类研究[J].贵州大学学报(自然科学版),2018,35(6):106-111.

[13]邓评心,郑长江,马庚华,等.基于AFC数据挖掘的轨道交通站点分类研究[J].华东交通大学学报,2019,36(2):77-82.

[14]GAN Z, YANG M,FENG T, et al. Understanding urban mobility patterns from a spatiotemporal perspective: daily ridership profiles of metro stations[J]. Transportation, 2018,47(1) :315-336.

[15]王兴川,姚恩建,刘莎莎.基于AFC数据的大型活动期间城市轨道交通客流预测[J].北京交通大学学报,2018,42(1):87-93.

[16]LIU Y, LIU Z Y, JIA R. DeepPF: a deep learning based architecture for metro passenger flow prediction[J]. Transportation Research Part C: Emerging Technologies, 2019, 101:18-34.

(责任编辑:于慧梅)

Abstract:

The accurate forecast of the passenger flow of rail transit is helpful for the better management of urban transportation system and the timely response measures. The K-means clustering method is used to cluster 113 stations of Nanjing Metro, and five different types of rail stations are obtained. The time sequence characteristics of inbound passenger flow of different types of stations and the influence of weather and working day factors on passenger flow are analyzed, and whether working day has the most obvious influence on passenger flow is analyzed. The LSTM is used to predict the passenger flow of the next four days using the data of the first 35 days as the training set, and the prediction results are compared with the recurrent neural network and support vector machine. The prediction accuracy of inbound passenger flow of category 1 and category 3 stations is better than that of other categories.

Key words:

LSTM; K-means; short term traffic flow forecasting; time series; rail transit

猜你喜欢

时间序列轨道交通
轨道交通TOD模式创新引领宁波城市发展
城市轨道交通供电系统及电力技术探析
城市轨道交通节假日期间大客流行车组织思考与实践
轨道交通快慢车越行问题研究
轨道交通快慢车越行问题研究
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测