APP下载

神经网络客流的预测方法研究

2021-06-20杨迎卯

运输经理世界 2021年26期
关键词:短时记忆时序客流

杨迎卯

(温州市铁路与轨道交通投资集团有限公司运营分公司,浙江 温州 325000)

1 背景

客流预测对城市轨道交通系统短期、中长期的经营管理有着极大的帮助,是指导日常运输组织、优化列车开行方案、优化车站设施布局、制定客流引导策略及提高经济效益的重要前提。按照预测时间跨度,客流预测可分为长期、短期、短时客流预测。长期预测依据地域发展规划及经济趋势进行,短期预测主要依据季节性特征,短时预测则根据早晚高峰、节假日、大客流活动、气候骤变等客流时间进行,本文主要研究短时客流预测。

基于线性理论,客流预测问题分为基于线性的统计预测、基于非线性的模型预测及统计学-非线性模型组合预测三类。基于线性近似的非线性预测模型,主要有时间序列法和卡尔曼滤波模型[1,2]。有研究表明,基于统计学数学方法已经能够解决大部分客流预测问题,而随着预测周期变短、预测干扰增强等非线性特征的增强,预测模型预测的稳定性也会变差。常见的非线性模型有马尔科夫链、神经网络模型等,这类方法具备多源数据特性,令预测模型更合理[3,4]。但人工客流疏导、班次修改、临时关站等事件,会使模型的精度失控。基于组合非线性模型并结合统计学数学方法分类的预测成为当前研究的主流方向。

基于机器学习方法,客流预测可分为基于统计学理论的模型驱动、基于神经网络模型的数据驱动和基于多模型的组合方法。模型驱动的客流预测方法使用统计学模型,通过分析客流数据,构建数据特征,形成有经验的数据模型,其代表方法有时间序列、非参数回归、聚类分析、贝叶斯估计等。其中,季节时间序列模型(SARIMA)的贝叶斯估计方法表现极佳。数据驱动的客流预测主要基于神经网络理论,神经网络由大量神经元(神经细胞)互相进行权重连接,形成了多层网络结构,使用有效历史数据对模型中的神经元连接权重进行梯度下降训练方法获得最终模型参数。其中,循环神经网络(RNN),结合模糊控制、多时间单元及长短时记忆网络(LSTM)均适配,此类方法具备机器学习能力,同时避免了模型的过拟合。

近年来,机器学习方法在社会各领域都得到了充分的发展,神经网络模型算法也成为客流预测的主流方向。针对时序性较强的预测问题,循环神经网络模型具有优良的匹配性,在进一步开发的长短时记忆神经网络模型方面表现更优秀。本文主要内容有:对多源数据的融合问题进行特征构造介绍,介绍采用聚类算法分析、处理历史数据的方法,介绍长短时记忆网络的预测模型及结合多源输入的组合模型系统框架。

本文基于神经网络模型的客流预测算法架构如图1所示,其结合了多源数据特征予以归纳,聚类分析预处理,按分类结果建立多组长短时记忆网络模型,并根据进站、出站、区域及站内客流的不同预测目标分别进行了特征构造。

2 数据预处理

2.1 多源数据特征

车站客流数据受到气候、节假日、大型活动、列车编组班次、地域商区等各种因素的影响,利用丰富的信息源可以提高预测精度。通过AFC票卡(ACC清分)或智能视频分析、获取客流量,根据时间颗粒度大小对客流数据进行转储,例如:

其一,客流量,时间戳,站名,出入口/区域编号。

其二,天气晴/雨指标,节假日指标,大客流指标。

其三,班次编号,编组车节数,到站时间,上/下行标志。

短时客流预测按预测对象可分为进站、出站、站内、断面以及OD客流预测。对于不同预测对象使用同一套算法训练,同时并行训练多组模型的权重、偏置等模型参数。

2.2 聚类分析

地铁客流具有明显的时空特性,不同站点在不同的时间,会表现出极大的差别,同时也具有一定的分布规律。在一周时间内,客流在工作日和双休日具有非常显著的差别;在同一天,内客流则具有明显的“潮汐现象”,即早/晚高峰和进/出站客流的关联性。针对客流预测显著的时序特征,使用K-Means聚类对历史数据进行分析,对客流预测的数据进行预处理,可以极大地提高模型的精度。

对一周内各天的数据进行相关性分析,计算一周内各天的欧氏距离,结果表明,双休日和工作日之间的相关性较差,所以可以将日期划分为周一、周二、周三、周四、周五和周六、周日这两类。对每天细分时段的数据进行相关分析,计算一天内各时段的欧氏距离,可将一天内的数据分为早/晚高峰和平常时段。

按照聚类分析,可将LSTM模型分为多组,分别用于聚类分类结果所划分的各个时间段,降低模型非线性阶次并避免过拟合,提升模型的训练效率和稳定性。

3 人工神经网络模型

3.1 神经网络(NeuralNetworks)

人工神经网络模型,是一种模仿人脑神经系统对各类信息进行处理的行为特征,并形成可以分布式计算的信息处理模型。

依据神经元触发放电的原理,人工神经网络设置了激活函数,使得具备处理强非线性问题的能力,神经元结构如图2所示,其网络结构便是由多个神经元交叉连接构成的。选用合适的激活函数及网络层数理论,可使其适用于所有模型。

3.2 循环神经网络(RecurrentNeuralNet‐works)

循环神经网络(RNN)是具有时序特性的神经网络模型。RNN在隐藏层建立了一个互相连接的权重矩阵,隐藏层中的信息将在时序过程中持续传递,可以将多个时序下输入迭代更新的层间权重记录下来。因此,RNN在客流预测中具有天然优势。RNN细胞结构如图3所示,x(t-1),x(t),x(t+1)分别表示前一时刻、当前时刻、下一时刻的模型输入,表示模型结构的循环特性。其中W为层间,U为输入,V为输出权重矩阵。

图中对于隐藏层的计算方式如式(1):

式(1)中:s(t)表示当前输出;s(t-1)表示前一时刻的输出。

输出层的计算方式如式(2):

RNN在实际应用中,存在不同的计算形式,图4为较常见的两种情况。其中,“多对一”指利用多个时刻的数据预测模型预测下一时刻的数据,而“多对多”则是指预测未来一段时间内的整体数据。

3.3 长短时记忆网络(LongShort-Term Memory)

当输入数量过大时,RNN模型训练易导致算法的梯度爆炸。添加门控制并减少输入数量,可以优化处理此类问题。长短时记忆网络(LSTM)即具有门控RNN网络,通过门控保留往期输入的特征,从而降低模型的输入长度,LSTM细胞结构如图5所示。

LSTM的算法流程与RNN相同,只在隐藏层增加三个门控单元:遗忘门f(t)、输入门i(t)、输出门o(t)。门控的计算公式为下式(3)、(4)、(5):

式(3)~(5)中:Uf、Ui、Uo为输入信息权重;Wf、Wi、Wo为历史信息权重;bf、bi、bo为偏置;δ为激活函数sigmoid()函数。

候选记忆如式(6):

细胞产生的新记忆s(t)、细胞的输出h(t)以及网络的输出Z(t),计算方法分别为下式(7)、(8)、(9):

4 结语

本文介绍了城市轨道交通客流预测的理论方法,通过对多输入源的数据进行融合处理,搭建LSTM模型的系统框架,实现多目标的短时客流预测。使用神经网络将多源和时序的历史数据结合建模,调整神经网络超参数,对模型进行训练并实现预测功能。首先,对多源输入数据进行了特征构造,建立进站、出站及在站客流的关联度;其次,根据聚类搭建多组神经网络模型;最后,建立具有时序特征的神经网络模型,构建、处理多客流的预测系统。

猜你喜欢

短时记忆时序客流
基于时序Sentinel-2数据的马铃薯遥感识别研究
客流增多
基于长短时记忆神经网络的动力电池剩余容量预测方法
基于Sentinel-2时序NDVI的麦冬识别研究
短时记忆、长时记忆对英语听力的影响
一种毫米波放大器时序直流电源的设计
短时记忆理论的影响
基于自学习补偿的室内定位及在客流分析中的应用
人工免疫算法在电梯客流时段划分的应用
基于驾驶员短时记忆的可变信息标志布设密度研究