APP下载

雨雪天气下轨道交通客流预测模型

2022-09-17冯树民李来成

哈尔滨工业大学学报 2022年9期
关键词:雨雪客流偏差

冯树民, 刘 浩, 李来成

(哈尔滨工业大学 交通科学与工程学院, 哈尔滨 150090)

轨道交通客流预测作为轨道交通运营管理的重要组成部分,对提高轨道交通客运分担率,增加轨道交通运营的经济效益具有重要意义。国内外许多学者对常态下的城市轨道交通客流预测进行了大量的研究,但是实际运营过程中轨道交通客流会受到工休假日、大型活动、雨雪不良天气等因素的影响,而不良天气作为最常见的非常态客流影响因素,极大地影响着客流预测模型的预测效果。因此有必要结合不良天气对轨道交通客流的影响来完善客流预测方法,提高轨道交通客流预测精度。

轨道交通客流预测的方法主要分为3种,分别为参数预测模型、非参数预测模型和混合预测模型。在参数预测模型研究方面,文献[1]利用社交媒体信息,并使用凸优化算法结合 SARIMA模型来预测纽约地铁的短期客流量。文献[2]应用 SARIMA模型预测北京地铁客流量,并讨论客流的变化趋势。文献[3]应用ARIMA模型预测了常态城市轨道客流,并介绍了非常态下(如大型活动、特殊天气等)城市轨道客流的预测方法。

非参数模型由于其能够从历史数据中获取比参数模型更多的特征和规律,在短期客流预测中也得到了更广泛的应用,非参数模型主要包括支持向量回归(SVR[4])、神经网络、贝叶斯网络等方法。文献[5]将贪婪搜索算法与K近邻模型相结合,并基于互信息来预测加利福尼亚州高速公路的短时交通流量。文献[6]基于混沌时间序列理论,构建了以RBF神经网络为基础的交通量预测模型。除此之外,深度学习和集成学习方法,包括深度神经网络[7]、深度卷积神经网络、深度递归神经网络[8]、深度信念网络[9]和一些集成结构[10]等也随着人工智能技术的发展,被用于客流预测问题当中。

近年来LSTM长短期记忆神经网络由于其优秀的性能,越来越多的学者选择应用此模型进行交通预测。文献[11]为解决城市轨道客流的异常波动问题,建立了基于支持向量回归(SVR)和LSTM的组合预测模型,模型可以准确预测客流波动且预测准确度比单个预测模型更高。文献[12]提出了深度客流量(DeepPF)的概念,结合环境因素以及时空因素建立了 LSTM 神经网络预测模型。文献[13]利用K-聚类算法提取客流特征,并应用LSTM神经网络预测北京地铁客流。文献[14]应用LSTM神经网络对公交上下车客流量进行了预测,结果表明多个公交站点的客流量数据间存在相关性。文献[15]通过结合Conv-LSTM记忆网络和自适应K-聚类算法实现轨道交通客流短期预测。文献[16]考虑轨道交通客流季节特性,提出基于季节时间序列分类模型的轨道交通客流预测方法,实现客流短期预测。

现有轨道交通客流量预测的研究基础主要依赖于GPS定位、AFC系统和手机智能卡信息等数据。很少有研究涉及到天气条件对客流量的具体影响,然而,天气条件往往是影响客流变化的关键因素,因此还需结合天气条件对城市轨道客流的具体影响来进行客流预测,以提高预测准确度。本文以哈尔滨市地铁1号线进出站客流数据为基础,分析雨雪天气下轨道交通客流的波动规律,建立考虑雨雪天气下轨道交通客流预测模型并对轨道交通客流进行预测,通过MAE、MRE、RMSE等指标检验预测结果,并与SARIMA 、SVM、未考虑雨雪天气的LSTM预测模型进行对比分析,验证预测模型的可靠性。该研究对寒冷地区轨道交通客运分担和运营管理具有重大的意义。

1 LSTM模型

近年来为了提高预测精度,人们提出了许多分析模型,在这些模型中,LSTM神经网络被公认为最合适处理交通预测的模型。LSTM神经网络由基础记忆单元组成,单个记忆单元包含输入门、遗忘门和输出门。这些门可以判断先前记忆单元的信息是否会影响到当前记忆单元,使得先前记忆单元中的重要信息可以得到保留,门也可以动态调整记忆单元的状态,使LSTM神经网络能够在较长时间跨度内捕捉特征,提供更高精度的预测结果。

LSTM神经网络[12]的单个记忆单元如图1所示,其中xt为t时刻的输入,ht-1和ht分别为t-1时刻和t时刻的隐藏层输出,ct-1和ct分别为t-1时刻和t时刻的记忆单元候选信息。以t时刻为例,单个记忆单元中输入门、遗忘门和输出门的计算公式如式(1)~(6)所示。

图1 LSTM记忆单元结构图

输入门:

it=σ(Wi[ht-1,xt]+bi)

(1)

遗忘门:

ft=σ(Wf[ht-1,xt]+bf)

(2)

输出门:

Ot=σ(Wo[ht-1,xt]+bo)

(3)

记忆单元初始状态:

(4)

记忆单元输出状态:

(5)

隐藏层输出:

ht=Ot⊗tanhCt

(6)

式中:Wf,Wi,Wo,Wc为权重矩阵;bf,bi,bo,bc为偏置项;σ表示Sigmoid函数;tanh表示双曲正切函数;⊗为Hadamard积。

2 雨雪天气影响因素研究

2.1 客流数据处理

选用哈尔滨市地铁1号线的全线进出站客流数据(时间为2017年12月1日至2019年1月31日,共360 000条客流数据),客流数据包括运营日、线路名称、车站、进出站客流量、票务类型等。由于法定公休节假日一般以小长假形式进行,在节假日前后均会对轨道交通客流造成较大的干扰,节假日客流数据占比较少,其中降雨降雪情况更少,因此剔除法定假日前后1 d的客流数据和春节长假前后3 d的客流数据,除节假日外,还剔除城市大型活动及突发事件当天的客流数据。剔除后为了不影响客流的周期性,使用九期移动平均值法[17]补充剔除的客流数据。

1)客流基准值。为了准确描述轨道交通客流波动情况,使用九期移动平均法计算正常天气条件下的客流基准值。九期移动平均法指当前客流的前后四周同一天的客流的均值,计算过程中如遇到非常态(降雨、雪等)客流数据,则舍弃当周客流数据并提取前(后)一周的常态客流数据,直到满足九期数据为止。客流基准值计算公式为

(7)

2)客流偏差率。为了准确地量化轨道交通客流波动情况,减小土地利用、城市扩展等条件对不同车站客流偏差产生的影响,引入“客流偏差率”[17]来量化客流波动情况,客流偏差率指当日客流量与客流基准值差值与客流基准值的百分比。客流偏差率的计算公式为

(8)

2.2 天气数据处理

天气数据源于国家气象科学数据中心和哈尔滨气象站(时间段:2017年12月1日至2019年1月31日,共28 000条天气数据),为研究雨雪天气的客流波动规律需要对数据进行清洗,剔除无效数据,剔除规则:1)被剔除轨道交通客流数据所对应的天气数据应被剔除;2)原始数据中降水量标记为无数据、缺数据、降水量小于0.1 mm的天气数据应被剔除;3)恶劣天气(如6级以上大风、冰雹天气等)的天气数据应被剔除。除剔除天气数据外,剩余数据均为有效天气数据。

2.3 雨雪天气客流波动规律

以哈尔滨地铁1号线博物馆站客流数据为例,依据客流偏差率式(8),计算工作日雨天、休息日雨天和雪天等不同天气条件下的客流偏差率,得到博物馆车站的降水量与客流偏差率散点图,如图2所示(降水包括降雨、降雪、冰雹等多种情况,本文提及降水只包含降雨和降雪两种情况)。

(a)工作日雨天

(b)休息日雨天

(c)雪天

在图2(a)中,当降雨量小于10 mm时(小雨),降雨量与客流偏差率无明显关系,当降雨量大于10 mm后,随着降雨量的增加,客流偏差率呈下降趋势;如图2(b)休息日雨天,随着降雨量的增加客流偏差率也呈现下降趋势,并且降雨对客流的影响相比工作日雨天更强;在图2(c)中,随着降雪量的增加,客流偏差率呈现上升趋势。

分析降水量与客流偏差率的相关性,结果见表1。

表1 降水量与客流偏差率相关性

工作日雨天,降雨量小于10 mm时,降雨量与客流偏差率的相关系数为0.006,表明二者无相关性,降雨量大于10 mm后,相关系数为-0.856,呈现显著的负相关关系;休息日雨天的降雨量与客流偏差率的相关系数为-0.907,即存在显著的负相关关系;雪天的降雪量与客流偏差率的相关系数为0.774,呈现显著的正相关关系。

根据降水量与客流偏差率的相关关系,对不同天气条件下降水量与客流偏差率进行回归模型拟合,同时对不同降水量与客流波动持续时长关系进行拟合,修正后推导出不同天气条件下的总客流波动区间和客流波动持续时长见表2。

表2 不同天气条件下客流波动区间及客流波动持续时长

3 预测模型构建与实例验证

雨雪天气下轨道交通客流预测模型的流程如图3所示。首先确定影响客流变化的雨雪天气特征维度(降水量、客流波动区间、客流波动影响时长等),对雨雪天气数据和客流数据进行处理,建立预测模型后对LSTM网络进行训练,训练成功后对特征日期进行客流预测,并对预测结果进行评价,满意后输出预测结果。

图3 雨雪天气下轨道交通客流预测模型流程

3.1 LSTM神经网络训练

1)训练集与测试集划分。原始数据处理后共分为两个子集,前80%的数据作为预测训练数据集,后20%的数据作为预测测试数据集。

2)数据归一化。为避免不同量级数据整合问题,神经网络的数据归一化处理后统一量纲,其计算公式为

(9)

3)WI-LSTM参数构建。采用Python编程语言中的Tensorflow编写WI-LSTM的训练模型和预测模型,整个实验在Python Keras库中完成,记忆单元中的默认激活函数为Tanh和Sigmoid函数。采用Phcharm IDE进行编程。经过反复实验,确定WI-LSTM输入层、隐藏层和输出层各为1层,隐藏层记忆单元为10。基本特征维度包括:日期、降水量、降水持续时长以及量化后的雨雪条件下总客流波动区间和客流波动持续时长,通过实验获得预测模型各项参数见表3。

表3 WI-LSTM预测模型参数

4)WI-LSTM模型训练。完成预测模型参数构建后需要对预测模型进行训练,为防止欠拟合和过拟合的情况,需调整相应参数。一般情况下,均方根误差值小于5%则停止训练。随着迭代次数的增加,训练集和测试集的均方根误差值会逐渐减小,在WI-LSTM实际训练中存在部分过拟合状态,当迭代次数达到30次时Train loss为0.005 1,Test loss为0.008 1,两者差值为0.003,说明训练模型表现较好,不存在过拟合和欠拟合状态,通过多次试验使均方根误差稳定小于0.05,迭代次数为35。

3.2 预测模型评价指标

选择MAE,RMSE和MRE等评价指标来检验预测结果。MAE为平均绝对误差,用来反映预测值误差的实际情况,用来衡量模型的精度。RMSE为均方根误差,表示偏差的平均值,用来衡量模型的稳定性。MRE为平均相对误差,用来评价模型相对精度。3种评价指标分别表示为

(10)

(11)

(12)

3.3 不同模型结果对比分析

为验证WI-LSTM预测模型的准确性,需与其他模型进行对比分析。选取轨道交通客流预测中最常用的SARIMA预测模型、SVR回归预测模型以及不考虑雨雪天气的LSTM预测模型进行对比分析。同样以哈尔滨地铁1号线的数据为基础,建立了SARIMA预测模型和SVR回归预测模型,预测的目标是1 h间隔的进站客流,这3个模型使用相同的训练数据,每一个模型的具体参数如下:

1)SARIMA预测模型。差分整合移动平均自回归模型的季节系数“S”设置为17,预测时间为上午6:00至下午22:00。最终确定的SARIMA参数为(2,1,0)。

2)SVR回归预测模型。模型选取RBF核函数(RBF-SVR),参数组合见文献[5]。

3)LSTM预测模型。模型隐藏层神经元设置为10,时间步为17,其他参数如表3中WI-LSTM参数构建所设置。

应用以上3种模型与考虑天气因素的WI-LSTM预测模型作对比,预测哈尔滨市地铁1号线博物馆站2018年7月25日(小雨)及其后4 d和2018年12月21日(中雪)及其后4 d的地铁进站客流,预测结果见表4、5。

表4 降雨日各预测模型性能指标对比

表5 降雪日各预测模型性能指标对比

从预测结果来看,考虑雨雪天气的WI-LSTM预测模型在多数情况下都有较好的预测结果。首先,在MAE、RMSE以及MRE方面,SARIMA模型、SVR模型以及普通LSTM模型在多数情况下数值均高于WI-LSTM模型,仅在降雨日前两天出现数值小于WI-LSTM模型的情况,说明WI-LSTM模型能够有效学习客流在雨雪天气下的长期特征,相比其他3种模型具有更高的准确性与稳定性。

从预测模型角度来看,WI-LSTM模型在雨雪天气的下的预测效果远好于其他3种模型,且雨雪对客流的影响越大,则预测效果越好。而普通LSTM客流预测模型在不考虑雨雪影响的情况下,预测结果也优于核函数为RBF的SVR 模型以及SARIMA模型,SVR作为一种古老的机器学习算法,与LSTM这种深度学习方法相比,具有一定的局限性,而经典的数据分析模型SARIMA也有明显的预测误差,这说明了经典参数化方法在处理大量轨道客流数据时的不足。

从预测时间角度来分析,发现除WI-LSTM模型外的其他3种模型在降雨降雪后的短期时间内均有较大的预测偏差,随着预测时间的增加,在第3天后3种模型的预测效果均有较大的改善,这也进一步说明了WI-LSTM模型考虑降雨降雪后客流波动规律对模型预测效能的提升。

4 结 论

1)以LSTM神经网络为基础,结合雨雪天气下轨道交通客流波动规律,构建了雨雪天气下轨道交通客流预测模型WI-LSTM。选取SARIMA预测模型、SVR支持向量机回归预测模型以及不考虑雨雪天气的LSTM预测模型对比分析,结果表明,考虑雨雪天气影响预测模型WI-LSTM的预测精度和稳定性优于其他经典客流预测模型。该研究对寒冷地区轨道交通客流预测和运营管理具有重要的参考价值。

2)在雨雪天气下轨道交通客流预测的问题上,站点客流规模、站点属性、平高峰等因素均会影响到轨道交通客流的预测效果,未来可以在这些方向进行深入研究,进一步提高WI-LSTM模型的预测效能。

猜你喜欢

雨雪客流偏差
客流增多
50种认知性偏差
悲伤的事就不说了
城市轨道交通节假日期间大客流行车组织思考与实践
基于系统动力学的城市轨道交通车站客流控制仿真与优化
如何走出文章立意偏差的误区
无题(新韵)
新闺怨
The relationship between functional fabrics and fashion trends
真相