APP下载

基于LSTM神经网络的地铁车站温度预测

2020-10-11赵明珠

北京交通大学学报 2020年4期
关键词:时序预测值车站

赵明珠, 王 丹, 方 杰, 李 岩, 毛 军

(1.北京市地铁运营有限公司,北京 100044;2.北京交通大学 土木建筑工程学院,北京 100044)

地铁车站是相对封闭且乘客长时间停留的空间,其内部空气环境直接影响乘客的舒适性.而温度既是评价空气环境状态的关键指标和分析乘客舒适性的主要物理量,也是环境调控、能耗评估以及确定列车行车间隔的重要依据.因此,掌握车站温度的变化规律至关重要.相比于典型地面建筑,地铁车站尤其是站台具有一定的特殊性,其室内环境尽管由通风空调系统调节,却易受到人员流动、列车诱导风、乘客频繁上下车、自然风等因素的影响而产生复杂的气流扰动以及站台温度的明显波动,出现站台区域在客流高峰期温度高、平峰期温度低的现象,进而直接影响乘客舒适度和系统能耗水平.因此,若能提前预测车站特别是站台区域环境温度的变化趋势,无疑非常有利于通风空调系统的精细化控制和节能运行,对地铁列车行车组织亦具有重要的参考作用.

目前,关于地铁车站环境温度的研究主要有CFD场模拟[1-3]和时间序列预测两种方法,前者适用于分析车站短时间内的温度分布和时变规律,主要用于进行通风空调系统的设计分析;后者则是通过现场时间序列的历史数据快速预测未来温度变化的趋势,适用于通风空调系统的调控.因此,这里主要讨论车站温度的时间序列预测方法.

常用的时间序列预测方法主要有:①传统时序建模方法.常用自回归移动平均(Autoregressive Moving Average,ARMA)模型,通过数据本身随时间变化的特性趋势,量化当前数据与历史数据的关系来预测未来多期数据,被应用于环境温度、客流量等的时序预测[4-6];②基于机器学习算法的时序预测方法,包括小波算法 (Wavelet)[7]、支持向量机(Support Vector Machine,SVM)[8]等.基于时序数据的相关特征,通过对影响数据变化的特征进行分析,得到未来一段时间内的预测值,人工神经网络也在时序数据预测中演化了较多的预测方法,如李彬等[9]基于人工神经网络分析历史风力发电数据,输入多种特征因素进行建模,得到风力发电功率的预测值.赵萍等[10]基于BP 神经网络对黑体炉温度时间序列进行短时预测,取得了良好的预测效果.神经网络由于出色的非线性数据拟合能力,被应用在许多针对温度、风速等非线性数据进行短时预测的方法中,并在影响因素、模型结构等方面进行优化[11].同时,引入深度学习算法并发现,与一般的支持向量机模型(SVM)和BP神经网络模型相比,具有记忆功能的人工递归或循环神经网络(Recurrent Neural Network,RNN),如长短时记忆(Long Short-Term Memory, LSTM)神经网络在分析大规模数据时具有较大的优势[12-13],且对大气和海洋温度、交通流量等时序数据的预测精度较高[14-15].PAK等[16]在LSTM模型优良的性能基础上考虑历史空气质量和气象数据影响因素,通过分析时序数据的长期历史过程实现了对PM2.5的快速准确预测.LSTM模型还结合小波分析对非线性时序数据的优良除噪性能,进一步提高了预测精度[17-19].而双向长短时记忆(Bi-directional Long Short-Term Memory,BiLSTM)神经网络模型通过遍历从左到右和从右到左的两次输入训练数据可以实现双向的特征识别[20].

考虑到地铁车站温度的动态变化特性,这里尝试应用BiLSTM模型,根据某地铁车站的站台温度连续监测数据对其进行预测,并与ARIMA、LSTM等时间序列预测模型进行性能比较,建立多因素影响下的神经网络时序预测模型,拓展时序预测模型应用领域,以便在地铁环境控制及通风空调系统运维管理中取得良好的效果.

1 地铁站台温度预测模型

1.1 ARIMA预测模型

地铁站台温度移动自回归平均ARMA(p,q)模型表示的形式如下

Tt=c+α1Tt-1+α2Tt-2+…+αpTt-p+εt-

β1εt-1-β2εt-2-…-βqεt-q

(1)

式中:Tt为当前温度,Tt-1、Tt-2,…,Tt-P为历史温度;c为常数系数;αi(i=0,1,…,p)为自回归系数;βi(i=0,1,…,q)为移动平均系数;p为自回归滞后阶数;q为移动平均滞后阶数;{εt}为随机项.

地铁站台温度差分自回归移动平均模型ARIMA(p,d,q)将ARMA(p,q)模型和差分模型组合,提升了ARMA模型的时序预测能力.ARIMA 算法主要分为 3 部分:①通过适当差分次数d使数据平稳,确定d值;②将平稳后的数据使用ARMA(p,q)模型进行建模,确定p与q的值;③根据确定的p、d、q值建立ARIMA(p,d,q)预测模型进行预测.

1.2 LSTM神经网络预测模型

长短时记忆(LSTM)神经网络在普通RNN的基础上,在隐藏层各神经单元中增加记忆单元使RNN网络具备了长期记忆功能.RNN在人工神经网络基础上,增加隐含层各单元间的横向联系,将神经网络上一个时间步的值传递至当前的时间步,使神经网络具备记忆功能,应用于处理有上下文联系的自然语言识别(NLP)和时间序列的机器学习问题.RNN展开的结构见图1.

RNN中隐含层主要用于时间序列的信息捕获,进行最主要的迭代计算工作.原始RNN的隐藏层只有一个状态s,对于短期输入非常敏感.LSTM在RNN基础上增加一个单元状态(cell state),以保存长期的状态.LSTM神经网络结构见图2.

LSTM通过3个可控门调整历史信息和当前信息的权重,优化并得到最优模型,LSTM控制门示意见图3.在RNN的基础上,LSTM根据上一次的温度输出值和本次温度输入值计算当前的单元状态.

ct′=tanh[Wc·(st-1,Tt)+bc]

(2)

式中:ct′为当前时刻的记忆单元状态;(st-1,Tt)表示将两个向量连接;Wc、bc为遗忘门的权重和偏置参数;st-1为上一时刻的神经元输出值.

通过遗忘门的控制,新的单元状态ct可以保存很久之前的信息,通过输入门的控制,又可避免当前时间步的非重要特征进入记忆单元.LSTM最终的温度输出值由输出门和单元状态共同确定,即

ot=σ[Wo·(st-1,Tt)+bo]

(3)

式中:ot为LSTM最终的温度输出值;Wo、bo为输出门的权重、偏置参数.

1.3 BiLSTM神经网络预测模型

双向长短时记忆(BiLSTM)网络是由前向LSTM与后向LSTM组合而成.BiLSTM的基本思想是提出的每一个训练序列向前和向后都是两个长短时记忆(LSTM)网络,而且这两个都连接着一个输出层.这个结构能够提供给输出层输入序列中每一个点以完整的过去和未来的上下文信息.目前BiLSTM预测模型常用于自然语言识别,通过捕捉双向的语义信息提升模型优度.将地铁站台温度数据输入BiLSTM模型,通过前向LSTM与后向LSTM单元建模,同时学习温度数据的双向时序特征,对比研究其预测精度.

将以上3种模型应用于地铁站台温度预测.首先使用小波分析对温度实测数据进行处理并训练模型,确定模型参数,进而建立地铁站台温度预测模型来得到未来多期温度数据.

2 温度实测样本数据预处理

2.1 温度数据描述

以北京某地铁车站站台温度实时采集的数据为例进行分析.初始的温度数据采集间隔为5 s,采集了从2019年6月3日至2019年7月4日的52万条数据,该时间段的地铁环境控制系统处于空调季运行模式,该一个月的连续数据能很好地反映地铁车站温度的变化规律.

由于采样时间间隔为5 s时站台温度变化不明显,导致模型训练过程无法学习到足够的有效特征且计算量过大,故在保留原始数据变化趋势的前提下,将该数据集处理为时间间隔为30 min的新数据集以减少数据量,处理后的数据集共有1 536个样本.2019年6月8日和2019年6月9日期间处理前后的温度数据曲线见图4.选取2019年6月3日至2019年7月2日期间的1 440个样本数据作为训练集进行建模,2019年7月3日至2019年7月4日的96个样本数据作为验证集对预测结果进行检验.

2.2 温度数据预处理

由于仪器故障、数据库存储和外部干扰等不可控因素会导致采集到的数据集存在缺失值、噪声数据、离群点等异常情况.需要在建模前对数据进行预处理,以达到更好的数据使用效果.因此,对时间间隔为30 min的数据集进行了缺失值填充、小波去噪、数据归一化等预处理.特别是由于列车的频繁进出站、活塞风等因素影响,监测得到的温度采样数据存在明显噪声.通过db4小波将原始序列分解至第4层,消噪后进行重构得到小波除噪后的数据集.从而在一定程度上提高数据的有效性和模型预测的泛化能力和准确性[17-19].图5为原始数据与小波去噪后数据,小波分解见图6.

使用2019年6月3日至2019年7月2日采集的1 440个数据样本,将其直接输入ARIMA模型并寻找最优参数,得到预测结果.LSTM和BiLSTM模型则采用图7所示的数据窗口化建模方法,将数据切分为单独窗口,通过每一段不同的特征A来预测特征B,并不断迭代,格式为[A,B].1 440个数据窗口化可得到358个窗口样本数据集,格式为[960,96].

3 预测模型的预测结果分析

3.1 预测模型评价指标选取

评价预测模型常用的误差评价指标有平均绝对误差、均方根误差和平均绝对百分误差.前两个指标受预测值与真实值的误差绝对值的影响,评估预测值与真实值的偏离程度.平均绝对百分误差受相对误差的影响,值越小精度越高.计算式分别为

(4)

(5)

(6)

考虑机器学习的复杂性,在上述评价指标的基础上增加解释方差、均方误差和决定系数共6个评价指标来判断模型的预测效果.解释方差是指解释回归模型的方差得分,其取值范围为0~1,越接近于1说明自变量越能解释因变量的方差变化,解释方差计算式为

(7)

式中:EVS为解释方差;Var为方差.

均方误差表示真实值与预测值差平方的期望,值越大表明预测效果越差,其计算式为

(8)

式中:MSE为均方误差.

R2为决定系数,又称为拟合优度等,其变化范围为0~1,反映预测值与实际值的符合程度,其计算式为

(9)

3.2 预测结果评价

3.2.1 样本数据的预测结果

建立基于小波分析后的地铁站台温度实测数据的ARIMA预测模型,分析历史数据得到预测值.建立了关联室外环境温度、客流量、列车运行时段等因素的站台环境温度的LSTM和BiLSTM预测模型,其中,室外温度为仪器实际监测值,列车运营时段为状态值,客流量为状态值.列车运营时段在6:00—24:00变量赋值为1,其余时间段为0.客流量状态值根据CO2波动区间设置,工作日7:00—9:00和17:00—20:00赋值为1,其余时间段为0;节假日9:00—11:00和17:00—20:00赋值为1,其余为0;节假日客流高峰时间段相比工作日推迟,2019年6月20日的温度训练数据曲线见图8.

神经网络结构的重要参数:神经元数量为256,隐含层3层;Activation即激活函数,设置为tanh函数;Dropout在深度学习网络中控制神经元舍弃概率以防止过拟合,设置为 0.2;Batch_size是一次训练的样本数目,设置为30;Epochs是迭代次数,经过损失函数调优设置为300;设置Adam优化器控制计算更新步长.最后,使用预测值与实际采集的温度数据进行对比,通过6个指标进行评价.

3种预测模型得到的回归预测值与实测值进行对比见图9.由图9可见,3种模型得到的预测值与实际值吻合度较好,能够学习到训练集样本的特征.

3种回归预测模型的评价指标见表1.由表1可见,3种模型的预测结果与实测数据的吻合度即决定系数R2分别为0.979 7、0.955 8、0.958 3,接近于1;MAE、MSE、MAPE、RMSE值均小于1;模型回归预测结果与实测数据的解释方差EVS都在95.5%以上.说明对于地铁站台温度预测,3个模型的回归预测精度较高.

表1 3种回归预测模型的评价指标

3.2.2 样本外数据的预测结果

建立ARIMA模型进行样本外预测,并建立基于深度学习算法的多特征神经网络模型,考虑室外环境温度、客流量、列车运行时段等影响因素,使用2019年6月3日—2019年7月2日的数据进行建模,预测2019年7月3日—2019年7月4日温度值,并对3种预测模型的预测结果进行对比分析.

2019年6月3日—2019年7月2日期间部分历史数据与3种模型的预测结果见图10,针对波动幅度、频率较大的地铁站台温度数据,3种模型均能一定程度上预测出数据的未来变化趋势.

2019年7月3日与2019年7月4日3种模型预测的预测值与实际监测值的对比见图11.

由图11可见,LSTM模型和BiLSTM模型预测值曲线相比ARIMA模型更贴近实测值曲线.进一步对3种模型进行评价,BiLSTM模型预测结果与实测数据的吻合度R2为0.805 8,较常规LSTM模型的0.767 2和ARIMA模型的0.664 8更接近于1;BiLSTM模型的MAPE、MAE、MSE、RMSE值分别为1.893 4、0.575 1、0.515 4、0.717 9,均小于ARIMA模型和LSTM模型对应的误差评价指标,说明BiLSTM模型预测精度更高即预测值更接近实测值.

3种样本外预测模型的评价指标见表2.

表2 3种样本外预测模型的评价指标

4 结论

地铁车站温度受列车进出站、客流量及外部环境等因素影响,呈现较高频率、较大幅度的波动特点.采用ARIMA、LSTM和BiLSTM 3种时序数据挖掘模型预测了车站站台温度的变化趋势并进行了预测性能对比,得到如下结论:

1)ARIMA模型、LSTM模型和BiLSTM模型应用于地铁站台温度预测时具有较好的回归预测性能,适用于宏观把控温度的变化趋势.

2)基于机器学习算法的LSTM和BiLSTM模型的预测效果优于ARIMA模型,能够分析更多影响因素,学习效率更高,适用于变化幅度大、影响因素多的数据.

3)BiLSTM模型能够实现温度时序数据的双向训练、学习地铁站台温度变化双向的关联性,该算法用于时序数据预测,精度高于LSTM模型,更适合于地铁车站温度的预测.

猜你喜欢

时序预测值车站
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
车站一角
AI讲座:ML的分类方法
你不能把整个春天都搬到冬天来
自体荧光内镜对消化道肿瘤诊断临床应用分析
在北京,一个车站的治理有多难
地铁车站