APP下载

多因素轨道交通客流量预测模型研究

2021-07-27黄海超陈景雅王方伟

华东交通大学学报 2021年3期
关键词:工作日客流量关联度

黄海超,陈景雅,王 爽,王方伟

(河海大学土木与交通学院,江苏 南京 210098)

轨道交通客流量预测是城市智能交通系统的重要组成部分,客流量不仅受历史客流量、日期属性等时间因素影响,也受空间因素如:温度、风速、气压等影响。 时间因素与空间因素对客流量的影响存在复杂非线性关系,是多种因素共同作用的结果[1]。

李洁等[2]在传统预测模型的基础上引入出行日期特征及节假日因素, 建立季节性差分自回归滑动平均模型(SARIMA),有效提高预测精度。 Sui等[3]建立了周末客流量与天气因素之间关系的多元回归模型,分析两者的内在联系。 Xue 等[4]着重研究降雨因素对客流的影响。许熳灵等[5]进一步引入不同的天气因素, 并验证其对地铁客流量时空分布的影响。Ni 等[6]考虑地铁附近的媒体事件与客流变化规律,提高客流量的预测精度。 Tselentis 等[7]证明了单一模型具有局限性,加之如今庞大的数据规模,基于深度学习的混合预测模型[8]逐步替代了传统机器学习。滕靖等[9]在考虑日期属性和天气因素的同时,采用粒子群算法(PSO)优化长短期记忆神经网络(LSTM)并证明混合模型优于传统的LSTM。谢宇等[10]引入突发事件因素建立混合模型,提高模型对突发事件的预测精度。 此外,不引入外部因素,考虑邻近站点的空间关联的预测模型,如时空长短期记忆 (ST-LSTM)[11], 多模式深度融合(MPDF)[12]等也一定程度上提高预测精度。 但是引入越多因素必然导致模型的复杂度提高, 需要在保证模型精度的同时提高模型效率。 李泽文等[13]提出主成分分析 (PCA) 对引入的多因素进行降维,减少预测时间。 徐先峰等[14]通过K 近邻算法提取特征,结合双向长短期记忆(BiLSTM)兼顾预测精度与速度。 李梅等[15]提出Pearson 相关分析法提取显著影响因子,确定引入因素的维数,具有良好的适用性。

由于空间、时间因素与客流量之间存在复杂的非线性关系,目前针对多因素与客流量关系的研究较少。 本文提出一种多因素建模方式,首先采用显著性检验确定采集的天气因素是否与客流量序列相互独立。 再通过GRA 提取天气因素与客流量潜在的非线性关系并量化, 根据GRA 值逐步筛选关联度低的天气因素,降低模型复杂度。 最后采用深度学习的BiLSTM 进行预测,构建GRA-BiLSTM 混合模型。 同时与传统预测模型进行对比,验证模型可靠性。

1 数据预处理

1.1 数据预处理及相关性分析

轨道交通客流量数据来自明尼苏达州明尼阿波利斯至圣保罗2017-01-01~2018-09-30 每小时轨道交通客流量,明尼阿波利斯与圣保罗分别是明尼苏达州第一、二大城市,旅客往来频繁,客流规模大; 天气数据来自美国国家海洋和大气管理局,天气数据共7 类,包括:大气压、温度、露点、风速、云量、可见度、天气状况。 对完全相同的、明显异常及缺失的数据进行清洗,获得8 种数据,每种数据15 246 条。 考虑到工作日与非工作日,人群出行规律,受天气因素影响不同,从而使得客流量数据在工作日与非工作日呈现不同的特征,将数据划分为工作日(约8.7 万条)与非工作日(约3.4 万条),分别训练。

采用Person 相关系数检验天气变量与客流量的相关程度, 利用t 双边检验确定天气因素是否与客流量服从不同分布。 结果如表1 所示,Person 系数均不超过0.4, 表明天气因素与客流量并非简单的线性关系,所有天气因素在0.05 水平上存在显著差异,可作为独立影响因素。

表1 天气因素相关性分析Tab.1 Correlation analysis of weather factors

1.2 灰色关联度分析

GRA 是灰色系统理论中的一种多因素统计分析方法,对一个系统发展变化态势进行定量描述和比较,适用于探究非线性相关性。 其基本思想是通过确定参考序列和若干个比较序列的几何形状相似程度来衡量因素间关系的强弱。 天气因素对客流量的影响不是简单的线性关系,采用GRA对其潜在的非线性关系进行进一步分析,步骤如下:

1) 确定系统中的参考序列(客流量)和比较序列(天气因素)。

2) 对客流量序列与天气因素序列进行无量纲化处理,消除不同量纲的影响,考虑到之后要将其作为神经网络的输入变量,将其归一到[-1,1]。

3) 计算客流量序列与天气序列的关联系数

式中:ξi(k)为客流量序列与第i 个天气序列的关联系数,k 为序列元素的索引;x0(k)为归一化的客流量序列;xi(k)为归一化的天气因素序列;ρ 为分辨系数,ρ 越小,关联系数间差异越大,区分能力越强,通常取0.5。

4) 计算灰色关联度

式中:m 为天气因素的数目。

灰色关联度如表2 所示,天气因素与客流量相关性强弱为: 大气压>温度>露点>风速>云量>天气状况>可见度。

表2 天气因素灰色关联度Tab.2 Grey relational degree of weather factors

2 BiLSTM 神经网络

LSTM 是深度循环神经网络的代表, 通过门控单元实现时空记忆功能,同时有效缓解循环神经网络的梯度消失和爆炸问题。 通过引入输入门、遗忘门和输出门等门控单元系统,LSTM 可以控制何时忘记历史信息或使用新信息更新单元状态,在解决非线性时间序列问题时效果极佳,其过程可表达为

式中:it,ft,ot,ct分别为输入门i,遗忘门f,输出门o, 细胞状态c 在t 时刻的输出;Wxti,Wxtf,Wxto,Wxtc分别为输入Xt与输入门i,遗忘门f,输出门o,细胞 状 态c 的 权 重;Whti,Whtf,Whto,Whtc为 隐 藏 层 输 出Ht与相应门的权重;Wcti,Wctf,Wcto为细胞状态输出Ct与相应门的权重;bi,bf,bo,bc为偏置向量;σ 为激活函数。

BiLSTM 基本原理与普通LTSM 相同, 结合正向、反向LSTM 同时对输入时间序列Xt进行前向和后向两次训练,获得预测交通流序列Yt。 BiLSTM 考虑数据间的关联性, 进一步提高LSTM 特征提取的全局性和完整性。 BiLSTM 结构如图1 所示。

图1 BiLSTM 神经网络结构Fig.1 BiLSTM neural network structure

3 应用实例

3.1 模型构建与天气因素分析

将天气数据与客流量数据归一化处理,并以前70 周数据作为训练集, 最后21 周作为测试集验证模型性能。 将前3 h 天气因素、客流量(24 维)及当前天气因素(7 维)共31 维数据作为输入,当前客流量作为输出。 迭代次数取200, 初始学习率设为0.005,同时为防止学习率过大,模型来回震荡,采用衰减法动态调整学习率, 每迭代50 次学习率衰减50% 。 损 失 函 数 采 用 均 方 根 误 差, 通 过AdamOptimizer 优化器对模型进行优化。 为优化隐含层神经元个数,随机抽取20%作为样本进行试验,结果如图2 所示。 当隐含层神经元超过64 个后训练时间大幅上升, 训练误差减小效果不明显,确定隐含层神经元个数为64。

图2 隐含层神经元数目寻优Fig.2 Optimization of neurons number in the hidden layer

根据以上参数,建立BiLSTM 神经网络,将包含所有天气因素的神经网络命名为GRA-0, 根据GRA 值,逐步筛选关联度低的天气因素,如GRA-1为剔除“可见度”因素,输入变量为27 维的模型,GRA-2 为剔除“可见度”、“天气状况”后输入变量为23 维的模型,最终GRA-7 即为剔除7 种天气因素,输入变量仅为历史客流量的模型,也就是传统的神经网络模型。

平均绝对百分误差(MAPE)体现了真实值与预测值的相对偏差, 可直接衡量预测结果的好坏,常被用于评价预测模型的优劣。 均方根误差(RMSE)可直接体现真实值与预测值的绝对差值,且特大或特小误差对指标影响明显,可有效弥补MAPE 的不足。 采用这两种指标评价模型性能。 考虑到日期属性对客流量的影响, 工作日与非工作日分别训练,每种模型训练3 次取平均值,结果如图3 所示。

图3 GRA-BiLSTM 工作日与非工作日预测结果Fig.3 GRA-BiLSTM prediction results on weekdays and weekend

从图3 可以看出,无论是否处于工作日,不考虑天气因素的神经网络(GRA-7),其预测误差均小于考虑所有因素的神经网络 (GRA-0)。这说明将所有天气因素作为输入并不能提高预测精度, 反而因为关联度低的天气因素含有大量与客流量无关的信息, 相当于训练过程拟合了样本噪声,预测精度反而降低。通过GRA 逐步筛选关联度低的天气因素,预测误差有所降低,这是因为通过剔除低关联度的因素相当于样本降噪。

天气因素对工作日与非工作日客流量的影响存在明显差异。 在工作日期间,仅考虑“大气压”的神经网络(GRA-6)误差最小,这说明工作日客流量受天气因素影响较小,大部分天气因素相当于冗余的噪声, 降低模型的学习效率; 在非工作日期间,同时考虑“大气压”、“温度”、“露点”、“风速”的神经网络(GRA-3)误差最小,这说明非工作日的客流量受天气影响比较明显,这些天气因素都能给神经网络带来正向影响。由表2 可知,最佳神经网络模型考虑的天气因素,其GRA 值均大于0.6。 当天气因素与客流量的GRA 值高于0.6 时,才可认为该因素与客流量存在潜在关联,能提高神经网络的预测精度。

模型的收敛速度能反映所需的训练时间,收敛越快,训练时间相应越短。 为验证根据GRA 筛选天气因素对神经网络收敛速度的影响。 分别取工作日与非工作日中预测效果最佳的神经网络与GRA-0,GRA-7 训练过程的LOSS 曲线进行对比。 结果如图4 所示。

图4 工作日与非工作日收敛速度对比Fig.4 Comparison of convergence rates on weekdays and weekend

可以看出,输入维数最高的GRA-0,早期波动较大,且收敛速度最慢,需要最长的训练时间。 采用GRA 降维后,神经网络收敛速度显著提高,训练效果更加稳定, 且最终的训练效果优于传统模型GRA-7。

3.2 模型对比

为验证模型可靠性,同时比较常用预测模型对多种天气因素的应答。分别采用LSTM 神经网络、随机森林(RF)、最小二乘支持向量机(LSSVM)作为基准模型。 LSTM 采用与原模型相同的参数设置,RF预测模型根据经验公式确定子树数目,LSSVM 预测模型采用网格搜索确定最佳超参数c,g,预测结果如图5 所示。 各模型经GRA 处理后的预测误差RMSE汇总于表3,最优模型的预测结果加横线表示。

图5 工作日与非工作日预测模型对比Fig.5 Comparison of prediction model on weekdays and weekend

表3 不同预测模型对天气因素的应答Tab.3 Responses of different prediction models to weather factors

可以看出,无论是工作日还是非工作日,最优GRA-BiLSTM 预测误差显著低于各最优基准模型。由于关联度低的天气因素包含大量噪声,绝大部分GRA-0 模型的预测误差高于GRA-7,且相差较大。BiLSTM 在工作日与非工作日的误差波动均低于其他模型,体现良好的抗噪声干扰能力。

4 结论

本文同时考虑时间因素(历史客流、日期属性)及空间因素(天气),提出GRA-BiLSTM 预测模型,有效降低预测误差,同时提高收敛速度及抗噪声干扰能力。

1) 根据GRA 逐步剔除低关联度变量, 发现工作日与非工作日客流量对天气的应答不同,但GRA 值0.6 可作为天气因素对客流量是否具有正向影响的分界。

2) 关联度低的天气因素可能与客流量相关的信息较少,并非完全无关。 简单剔除仍会损失部分有效信息,天气因素对客流量如何影响还需进一步研究。

猜你喜欢

工作日客流量关联度
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于熵权TOPSIS法和灰色关联度分析的藤茶药材等级研究
基于数据挖掘的景区客流量预测模型研究
地铁开,玩起来
中国制造业产业关联度分析
中国制造业产业关联度分析
基于灰色预测理论在交通枢纽客流量的实际应用
基于灰色预测理论在交通枢纽客流量的实际应用
对于马克思关于工作日的思考
关于休闲的量的问题的考察