基于自回归LSTM神经网络的地铁车站环境参数概率预测
2021-01-12曲洪权庞丽萍梁思远
曲洪权 李 博 庞丽萍 梁思远
基于自回归LSTM神经网络的地铁车站环境参数概率预测
曲洪权1李 博1庞丽萍2梁思远1
(1.北方工业大学信息学院北京 100144;2.北京航空航天大学航空科学与工程学院北京 100191)
在地铁车站这种人员密集的场景中,预测未来一段时间内的环境参数变化对于列车正常运行和乘客安全有重要意义。和传统的点预测方法相比,提出了一种基于自回归循环LSTM网络的概率预测方法。不同于点预测,概率预测给出预测变量在下一时刻的概率密度函数,考虑了地铁车站环境参数预测的不确定性,对于站内提前、可靠对紧急情况做出反应有重要的意义。提出的预测模型,将预测变量的历史数据和车站外部环境参数作为输入变量来预测的环境参数的下一时刻的概率密度函数,进而得到下一时刻该环境参数的变化范围和分位数等信息。为了验证所提方法的准确性,收集了3个地铁站的环境参数数据,并使用概率预测方法进行了预测。结果显示,提出的方法不仅可以预测最可能的环境参数预测结果,而且可以预测极端情况的发生概率,对于预防紧急事故和决策有重要意义。
地铁车站;环境参数;概率预测;LSTM网络
0 引言
在城市地区,地铁是解决交通拥堵问题的最有效的公共交通方式之一,同时,乘客数量随着地铁的发展不断增加[1-3]。由于地铁车站大部分处于地下空间,通风条件差,污染物容易在站内沉淀,对旅客健康造成不良影响,例如NH3,VOCS,NO2等。因此,有必要分析地铁站的环境趋势,并建立一个相对准确的模型来预测地铁站的环境参数[4]。
近年来,神经网络因其强大的非线性拟合能力的优势被广泛应用在环境参数预测研究中,这种方法不需要大多数关于过程机制的基本知识,通过实验数据即可建模[5-8]。许多研究者们使用神经网络建模预测环境参数,并取得了很好的效果[9-12]。Kamal等人证明人工神经网络(ANN)可以简化和加快环境空气质量的计算[13]。Bodri等人使用ANN模型预测一天的地面气温(SAT),模型预测结果与实测数据非常接近[14]。Kim等人的研究结果表明,在室内空气质量预测中,与其他数据驱动的预测模型相比,递归神经网络(RNN)模型可以提供更好的建模性能和更高的可解释性,并证明了关键变量选择的重要作用[15]。Lim等人提出了一种新的关键变量选择方法,并进一步揭示了关键变量对预测的重要性[16]。Qu等人开发了一种基于滑动时间窗的随机矢量功能链接神经网络(RVFLNN)的建模方法,并解决了大数据计算速度慢的问题[17]。
上述方法的预测目标是在每个时间步骤中预测一个准确的值。但是,实践中的结果可能会受到许多因素的影响,预测环境参数的概率分布可能更合理[18-20]。Aznarte等人研究了利用分位数回归法预测NO2极端浓度,并改进了概率预测方法[21]。对于地铁站内环境而言,环境参数的概率预测也具有重要作用。通常,预测地铁环境参数的目的是判断未来一段时间内的污染浓度是否超过最大允许浓度,更加关注于污染物超标的发生概率。因此,本文提出了一种基于自回归LSTM网络的概率预测方法,输入外部参数和预测参数的历史数据,预测地铁站内环境参数的概率分布,为地铁车站的环境控制提供重要支持。
1 地铁车站现场数据采集与处理
1.1 设备简介
地铁车站现场数据采集使用的实验设备为CPR-KA空气质量监测仪,如图1所示。该设备采用泵吸式采样方式,采样方式为300ml/min,数据记录间隔为2分钟/次,共监测6种参数,测量范围和分辨率如表1所示。
图1 一体化综合监测设备
表1 设备参数
1.2 地铁测试车站类型及测试时间
(1)实验选定3个车站作为测试站点,如表2所示,分别为Station1、Station2、Station3,并且为了保证测试结果的多样性,我们选定的车站包含普通站和换乘站,全高屏蔽门和半高屏蔽门,每个车站的类型均不相同。测试期间,每个车站测试时间为1天,一体化综合监测设备均放置在站台中间,距离地面高度为1.2m,如图2所示。
表2 测试站点
(2)为了分析车站环境参数的变化以及其影响因素,我们收集了测试当天的车站客流量和列车发车频率(由地铁运营公司提供)以及大气气象数据(室外大气温度,室外大气相对湿度,来自中国气象数据网http://data.cma.cn/)。大气环境数据(室外PM10,室外CO,室外NO2,室外SO2,来自空气质量历史数据http://beijingair.sinaapp.com/),总计8种外部变量。
图2 设备放置地点
图2中,左图红色点标记了设备的摆放位置,右图为车站现场照片。经过以上所有测试,我们获得1260组观测值,时间间隔2分钟,包括9种站内环境参数,8种外部影响参数,并对所有数据进行预处理操作,包括补充缺失值,异常值处理,归一化以及去噪,保证数据的可靠性。
2 概率预测模型
2.1 网络模型
将站内环境参数未来时刻的预测视作构建一个条件分布,本文提出的模型可以用如下公式(1)表示:
针对于每一个时间点的预测而言,模型可以写成如下公式(2)的形式:
均值的计算:
标准差的计算:
对于训练和预测过程,它们的网络结构是相同的。对于训练过程,的值是已知的,但在预测过程中是未知的。为了继续预测,需要从最后一个时间步长的分布中得到一个采样值,作为下一步预测的输入数据。关于训练和预测的详细内容将在2.2节和2.3节中分别进行描述和讨论。
2.2 训练
2.3 预测
3 预测结果分析
Station1站内环境参数的预测结果如图3所示,图中红色实线代表环境参数真实值,灰色虚线条代表概率预测的均值;阴影部分代表预测不同的概率区间。
表3 真实值在不同预测区间的分布
如表3所示,我们计算了Station1车站9个环境参数的真实值在2个区间内的分布比例,并计算出所有参数分布在不同区间的平均值,在最后一行列出。结果表明,2个区间的真实值分布比例平均为85.51%、96.85%,同时,如图3所示,环境参数的真实值大部分在概率预测模型的概率区间内。预测结果都包含在概率预测模型预测的正态分布范围内,这意味着我们的模型所预测的正态分布能够有效地覆盖预测变量的变化范围,并给出不同的概率区间。
4 结论
基于自回归LSTM网络,本文提出了一种地铁车站环境参数概率预测方法,利用外部变量和地铁站中预测变量的历史数据来预测站内环境参数未来时刻的概率分布,并使用地铁车站现场采集的观测数据对模型进行了验证。最终,得到以下结论:
(1)本文提出的模型可以在过去数据和未来数据之间建立条件分布,其预测结果是一系列包含均值和标准差的高斯分布。与传统的点预测方法相比,概率预测方法还可以提供其他信息,例如,预测变量数值分布得上边界和下边界以及对应的概率。
(2)本文实验通过计算落在2个概率区间内的实际值的频率以证明模型的可靠性,结果表明,在2个概率区间内,平均分布有85.51%,96.85%的实际值,预测的高斯分布能够表示未来时刻的环境参数值的变化范围。
[1] Martins V, Moreno T, Minguillón, María Cruz, et al. Exposure to airborne particulate matter in the subway system[J]. Science of The Total Environment, 2015,511: 711-722.
[2] Kim M J, Sankararao B, Kang O Y, et al. Monitoring and prediction of indoor air quality (IAQ) in subway or metro systems using season dependent models[J]. Energy and Buildings, 2012,46(none):48-55.
[3] Liu H, Lee S C, Kim M J, et al. Multi-objective optimization of indoor air quality control and energy consumption minimization in a subway ventilation system[J]. Energy and Buildings, 2013,66:553-561.
[4] Kim M J, Braatz R D, Kim J T, et al. Indoor air quality control for improving passenger health in subway platforms using an outdoor air quality dependent ventilation system[J]. Building and Environment, 2015,92(oct.):407-417.
[5] 苏华,徐来福,田胜元.用神经网络拟合逐时气象参数[J].制冷与空调,2005(z1):37-40.
[6] 段淇倡,刘顺波,周光伟.补偿模糊神经网络的改进及其在通风空调故障诊断中的应用[J].制冷与空调,2013(2):121-125.
[7] 王石,易佳婷.人工神经网络-研究制冷系统的新方法[J].制冷与空调,2005,5(2):47-51.
[8] Bo Y, Yao C, Lin Z, et al. Beam Structure Damage Identification Based on BP Neural Network and Support Vector Machine[J]. Mathematical Problems in Engineering, 2014:1-8.
[9] Xiao-Ping B, Hong L I, Qi-Ming Z, et al. Progress of Research on Artificial Neural Network in Air Pollution Prediction[J]. Science & Technology Review, 2006, 24(12):77-81.
[10] Chen Q C Q, Shao Y S Y. The Application of Improved BP Neural Network Algorithm in Urban Air Quality Prediction: Evidence from China[C]. Workshop on Computational Intelligence & Industrial Application, IEEE Computer Society, 2008.
[11] Wang F, Cheng S Y, Li M J, et al. Optimizing BP networks by means of genetic algorithms in air pollution prediction[J]. Beijing Gongye Daxue Xuebao / Journal of Beijing University of Technology, 2009,35(9):1230- 1234.
[12] Lu T, Viljanen M. Prediction of indoor temperature and relative humidity using neural network models: model comparison[J]. Neural Computing & Applications, 2009,18(4):345-357.
[13] Kamal M M, Jailani R, Shauri R L A. Prediction of Ambient Air Quality Based on Neural Network Technique[C]. Research and Development, 2006. SCOReD 2006. 4th Student Conference on. IEEE, 2006.
[14] Bodri L, V. Čermák. Prediction of Surface Air Temperatures by Neural Network, Example Based on Three-Year Temperature Monitoring at Spořilov Station[J]. Studia Geophysica et Geodaetica, 2003,47(1): 173-184.
[15] Kim M H, Kim Y S, Lim J J, et al. Data-driven prediction model of indoor air quality in an underground space[J]. Korean Journal of Chemical Engineering, 2010,27(6): 1675-1680.
[16] Lim J J, Kim Y S, Oh T S, et al. Analysis and prediction of indoor air pollutants in a subway station using a new key variable selection method[J]. Korean Journal of Chemical Engineering, 2012,29(8):994-1003.
[17] Hongquan Q, Shuo F, Liping P, et al. Rapid Temperature Prediction Method for Electronic Equipment Cabin[J]. Applied Thermal Engineering, 2018,138.
[18] Valentin Flunkert, David Salinas, Jan Gasthaus. Deepar: Probabilistic forecasting with autoregressive recurrent networks[J]. arXiv preprint arXiv:1704.04110, 2017.
[19] Buizza R. The value of probabilistic prediction[J]. Atmospheric Science Letters, 2008,9.
[20] Gneiting, Tilmann, Katzfuss, Matthias. Probabilistic Forecasting[J]. Social Science Electronic Publishing, 2014,(1):125-151.
[21] Aznarte, José L. Probabilistic forecasting for extreme NO2, pollution episodes[J]. Environmental Pollution, 2017, 229:321-328.
[22] Pukelsheim Friedrich. The Three Sigma Rule[J]. American Statistician, 1994,48(2):88-91.
Probabilistic Forecasting of Metro Station Environmental Parameters Based on Autoregressive LSTM Network
Qu Hongquan1Li Bo1Pang Liping2Liang Siyuan2
( 1. School of Information Science and Technology, North China University of Technology, Beijing, 100144;2. School of Aeronautic Science and Engineering, Beijing, 100191 )
In the metro station which is crowded with people, it is very important to predict the changes of environmental parameters in the future for the normal operation of trains and the safety of passengers. Compared with the traditional point prediction method, this paper proposes a probabilistic forecasting method based on autoregressive LSTM network. Different from the point prediction, the probabilistic forecasting model gives the probability density function of the prediction variable at the next moment, and calculates the uncertainty of the environmental parameter’s prediction, which is of great significance for the station to respond to the emergency in advance. The proposed model in this paper uses the historical data of the prediction variables and the external environmental parameters as the input variables to predict the probability density function of the environmental parameters at the next time, so as to obtain the information of the changing range and quantiles. In order to verify the accuracy of the method, we collected the environmental parameter data of 3 subway stations, and used the probabilistic forecasting method to predict. The results show that the method can not only predict the most likely environmental parameters prediction results, but also predict the probability of extreme cases, which is of great significance for the prevention of emergency accidents and decision-making.
metro station; environmental parameters; probabilistic forecasting; LSTM network
1671-6612(2020)06-676-06
X820
A
国家重点研发计划(2017YFB1201100)资助项目;辽宁省“兴辽英才计划”项目资助(XLYC1802092)
曲洪权(1973-),男,博士,教授,研究方向为数据科学,E-mail:qhqphd@ncut.edu.cn
庞丽萍(1973-),女,博士,教授,研究方向为人机与环境工程,E-mail:pangliping@buaa.edu.cn
2020-03-19