NARX神经网络模型在昆明市环境空气质量预测中的应用
2019-06-21赵琦琳
赵琦琳,邱 飞,杨 健
1.云南省环境监测中心站, 云南 昆明 650034 2.昆明市环境监测中心, 云南 昆明 650000
大气污染问题是经济社会粗放无序发展的必然产物,同时也是经济社会发展的制约因素之一[1-2]。2012以来,全国接连发生大范围、长时间、高浓度空气污染,严重影响了人们的身体健康以及生产生活,大气污染问题逐步成为舆论热点[3-5]。为保护和改善环境空气质量,保障人民群众身体健康,国家出台了《关于推进大气污染联防联控工作改善区域空气质量指导意见的通知》和《关于印发大气污染防治行动计划的通知》,修订《环境空气质量标准》,一系列建立在宏观战略上为改善空气质量的顶层设计,彰显了党中央在环境保护工作方面的力度和决心。为应对环境空气质量重污染天气管控的迫切需求,环境空气质量预报预警作为一项新的环保业务工作应运而生,在为丰富环境空气质量监测数据的应用,为公众提供空气质量变化趋势及出行参考信息,为管理部门科学制定大气污染联防联控措施等方面表现出了强大的生命力[6-7]。
我国疆域辽阔,不同地区地形、气象条件差异明显,在复杂地形影响下,污染物在大气中的迁移、扩散和转化机制不尽相同,平原地区不同地点的研究结果具有较好的可比性,但复杂地形和气象条件有明显的个例差异[8-11]。当前已有一些数值模式应用在复杂地形下污染物浓度的预测,但数值模式是人类对客观规律的部分反映,并未将全部的自然规律囊括并运用公式表达在模式计算的过程中,且数值模式受到计算能力的影响,使其应用受到较多限制,而神经网络模型是利用数学算法对数据间规律进行表征,已有的观测或监测数据已经是经历过各种外界影响下的最终反映,故神经网络模型计算可略去物理、化学及转化机制的影响,避免机制的重复计算。
人工神经网络是一门新兴的边缘学科,可以弥补传统统计方法的不足,解决一些用传统统计方法难以解决的问题[12]。NARX(Nonlinear Auto-Regressive with Exogenous Inputs,有外部输入的非线性自回归模型)神经网络具有良好的非线性映射能力,较传统的静态神经网络具有更好的预测精度和自适应能力[13],可以看作有时延输入的BP(Back Propagation,反向传播)神经网络加上输出到输入的延时反馈连接[14]。由于NARX神经网络包含了多步输入输出延时,因而它可以反映系统的历史状态信息,是一种有记忆功能的神经网络[15]。与BP神经网络等简单的静态神经网络相比,NARX神经网络能够更好地描述动态时变系统特性,从而更有效地实现复杂动态系统建模。
本文利用NARX神经网络模型对典型高原山地城市昆明的6个国控环境空气质量自动监测站环境空气质量进行模拟,并与LSTM(Long Short-Term Memorg,长短时记忆)模型、CMAQ(Community Multiscale Air Quality Modeling System,社区多尺度空气质量模型系统)、NAQPMS(Nested Air Quality Prediction Modeling System,嵌套网格空气质量预报系统)等数值模型模拟结果进行对比,以期验证神经网络模型在复杂地形下环境空气质量预测中的能力,为复杂地形、气象条件下环境空气质量预测预报积累更多基础资料。
1 研究对象与方法
1.1 昆明市及监测数据概况
昆明市位于云贵高原中部,是珠江、金沙江、红河3大水系流域分水岭。东西跨越152 km,南北纵深237.5 km,辖区面积2.11万 km2,其中丘陵和山地占88%,平地仅占10%,湖泊占2%。昆明市区主城三面环山,南临滇池,处于群山环绕的盆地中,昆明市平均海拔1 891 m,最大海拔高差达3 501.7 m。昆明属于北亚热带低纬高原山地季风气候,市区年平均气温在15 ℃左右,年平均风速4 m/s,常年主导风向为西南风。城区气压仅有0.8 kPa,具有典型的高原特征。
为对比NARX神经网络模型与用于常规空气质量预报的CMAQ、NAQPMS数值模型以及LSTM神经网络模型的性能,采用2015年1月1日—2017年2月8日的城市日均气象和空气质量数据作为NARX网络训练数据集,模拟预测2017年2月9日—2017年3月11日共30 d的城市日均环境空气质量6项数据。研究选取的数据为昆明市主城区6个国控环境空气自动监测站常规空气质量监测及气象观测数据,具体包括SO2、PM10、NO2、PM2.5、CO、O3等6项空气质量监测数据,气温、湿度、风速、风向、气压等气象5参数。监测数据频次为连续小时监测值。对数据进行归一化、元胞化处理。CMAQ和NAQPMS 2个数值模式采用统一的WRF(the Weather Reasarch and Forecasting Model,天气研究预报模型)气象场的输入数据,采用统一的云南省2015年基准污染源清单作为污染源浓度初始场。
1.2 NARX神经网络原理
NARX神经网络可以定义为
y(t)=f[y(t-1),y(t-2),…,y(t-ny),
x(t-1),x(t-2),…,x(t-nx)]
(1)
式中:f(·)表示用神经网络实现非线性的过程函数。沿着数据在时间轴方向的拓展。此式表示了神经网络的时间序列实现函数模拟功能的数据关联性建模思想。
NARX模型结构详见图1。
图1 NARX神经网络模型结构图Fig.1 Architecture diagram of NARX neural network model
1.3 基于NARX神经网络预测模型的建立及评估
根据已有的数据资源,使用NARX神经网络建立模型,模拟预测城市区域的环境空气质量6项指标的日均值。将历史气象因子、历史环境空气质量因子作为输入,将未来1天的环境空气质量因子作为输出,建立输入-输出之间的响应模型,模型在一定误差允许的范围之内能够模拟仿真上述3类不同要素之间的响应关系。
通过专家经验和试凑法对隐层节点数和输入输出延迟阶数不同的网络进行训练。然后通过误差和网络性能对比,选定最终的网络结构,NARX网络的输入均为非反馈输入,而环境空气质量6项指标,可以认为是大量物理、化学、气象因素综合作用后的结果,因此,对灰箱系统而言,气象参数5项设为非反馈输入,空气质量6项设为反馈输出;而对于灰箱系统内部而言,历史气象因子、历史环境空气质量因子作为非反馈输入,未来一天环境空气质量因子作为反馈输出。
模式使用的历史气象5参数以及历史空气6参数并非同步实时作用于预测结果中的空气6参数,而是在结果一定扩散传输、迁移转化等动力学机制之后的综合反馈,最终反映在环境空气自动站监测数据上的,因此输入-输出之间存在一定时间的延迟。
设置隐层结构为1~3层,每层3~10个神经元节点,经过大步幅的粗调和小步幅的微调,反复调试求取最优的隐层结构,训练函数取trainlm;隐层传递函数为tansig,输出层传递函数为purelin。分30次,使用开环网络一步预测法,使用训练好的模型仿真求解。
2 结果与分析
2.1 模拟结果验证
如图2所示,对预测结果进行分析,其中NARX、NAQPMS、LSTM预测结果为2017年2月10日—3月11日,CMAQ预测结果为3月3—11日(由于云南省省级预报预警平台CMAQ模式部署时间为3月3日,故CMAQ仅对比了3—11日的模拟结果)。模拟结果显示,NARX神经网络模型对6项污染物的模拟均具有较好一致性,对模拟结果趋势存在一定的滞后,总体模拟结果较好,相比其他2个数值模型和LSTM模型而言,NARX神经网络模型更加稳健,4个模式均存在一定程度的低估。其中对SO2的模拟性能来说,NARX具有较好的一致性,LSTM存在较大程度的高估,NAQPMS和CMAQ存在不同程度的低估;对于NO2来说,NARX具有较好的一致性,数值模式同样存在不同程度的低估,对于CO来说;NARX一致性较好,LSTM趋势不尽一致,但数值水平相当,数值模式依然存在低估;对于O3来说,各模式模拟数值水平相当,NARX和NAQPMS的模拟结果与观测值一致性较好,LSTM表现一般;对于颗粒物(PM10、PM0.5)来说,数值模式依然表现出趋势上的一致,而数值水平相差较大,NARX具有较好的一致性,且数值水平相当。
2.2 NARX神经网络预测拟合优度
根据已有数据,使用NARX神经网络建立模型,模拟预测昆明市环境空气质量6参数结果,取预测值与监测结果的最大、最小相对误差和相对误差绝对值的均值等来表征模型模拟效果的好坏,结果见表1、表2。
图2 模式模拟结果与观测值的比较Fig.2 Comparison of the model simulation results with the observed values
空气质量6参数最小、最大相对误差/%net=narxnet(1:7,1:7,[10]) ;气象取5个参数*net=narxnet(1:7,1:7,[4]);气象取5个参数*net=narxnet(1:7,1:7,[7]) ;气象取5个参数*SO2-58.512 375.796 8-16.597 679.012 6-26.814 772.747 1PM10-67.740 068.667 8-54.953 354.177 1-42.911 747.999 8NO2-50.616 218.105 5-31.707 933.148 0-31.379 832.094 3PM2.5-64.073 834.449 1-63.882 329.432 8-36.715 057.988 5CO-40.037740.348 8-13.456 951.182 1-18.294 728.115 2O3-46.118 2278.385 2-55.797 1238.113 6-47.827 2260.062 3空气质量6参数最小、最大相对误差/%net=narxnet(1:7,1:7,[7]);气象取前3个参数*net=narxnet(1:7,1:7,[10]);气象取前3个参数*net=narxnet(1:7,1:7,[5]);气象取前3个参数*SO2-28.484 932.843 3-29.306 5117.922 6-31.622 274.004 9PM10-45.463 366.936 9-33.418 446.189 4-35.782 549.817 7NO2-24.643 456.777 6-27.367 126.187 6-22.486 540.507 2PM2.5-40.935 951.258 0-33.673 430.646 5-30.728 135.845 8CO-22.844 640.441 8-24.470 642.297 5-23.371 739.434 8O3-60.595 8255.022 3-48.425 2201.522 7-47.217 5255.276 4
注:“*”指按顺序排列的气象5参数:气温、湿度、风速、风向、气压。
表2 NARX不同网络参数、超级参数预测结果相对误差绝对值均值Table 2 The mean absolute value of relative error of the prediction results of NARX with different network parameters and super parameters
注:“*”按顺序排列的气象5参数:气温、湿度、风速、风向、气压。
可以看出,使用不同的网络结构以及超级参数,模拟性能不尽相同,相对误差范围为-67.74%~278.39%,其中Google LSTM神经网络模型、CMAQ、NAQPMS的预测结果相对误差分别为-65.9%~1080%、-97.12%~42.86%、-94.29%~179.31%,各模式对6项污染物的预测结果性能不尽相同,神经网络模型模拟结果分布较为均一,而数值模式预测结果普遍都存在低估现象,这可能与数值模式的运算机理有关,目前数值模式所需要的气象场、大气排放源清单等基础资料的时空分辨率均不能真实反映实际状况,是造成模式误差的主要原因。使用不同网络参数和超级参数进行多次预测,经有限次数调试,隐层确定为1,神经元节点个数确定为4~10条件下性能最佳,而延迟在(1:5~1:7)区间较佳,最终确定(1:7,1:7)[5]的参数和输入仅使用气温1项的超级参数的方案上,网络性能最好,误差最小,这也说明了污染源的生成与每周的工作周期具有一定的相关性。NARX模型模拟结果虽然具有较好的一致性,但是在模型训练以及模型参数选定过程需要十分复杂的数学计算,对计算机算力资源有一定要求。
2.3 NARX与LSTM神经网络的优缺点比较
NARX网络能够很好地克服预测误差累积现象,其在隐含层中具备反馈连接到输入层的承接层,同时在承接层上增加了自反馈连接,这样能提高网络存储和记忆历史信息的能力。而LSTM网络在经典时间递归网络的基础上增加一个遗忘门,功能是将低于一定权值的输入因子忽略遗忘,网络结构较NARX稍复杂。
在本文采用的特定研究数据对象条件下,更加复杂结构的LSTM网络在训练过程中过拟合,降低了网络的泛化能力,因此对于特定的样本数据,复杂网络并不一定总能占优势,结构适中的网络类型反而具有较强的泛化推广能力;2015年1月1日—2017年2月8日的城市日均气象及空气质量样本数据(共770组)并不大,对这样的小规模的特定样本数据,NARX比LSTM具有更好的泛化能力。NARX不同的网络参数、超级参数预测结果与其他模型预测误差的比较,见表3、表4。
表3 NARX不同参数预测结果与其他模式预测结果的最小、最大相对误差Table 3 The minimum and maximum relative errors between the prediction results of different parameters of NARX and those of other models
注:“*”指按顺序排列的气象5参数:气温、湿度、风速、风向、气压。
表4 NARX不同参数预测结果与其他模式预测结果的相对误差绝对值均值Table 4 The mean absolute value of relative error of NARX prediction results with different parameters and other model prediction results
注:“*”指按顺序排列的气象5参数:气温、湿度、风速、风向、气压。
3 结论
根据对NARX神经网络的建模和训练,针对高原山地城市昆明的环境空气污染物浓度进行预测,对模型结果进行检验,并与其他神经网络模型以及数值模型预测记过进行比较,得到如下结论:
1)受计算资源限制,案例选取了少量的网络结构、超级参数筛选,在比选方案中选用的超级参数运行多次,能够得到稳定输出,预测性能较理想,前5项污染物(NO2、CO、PM10、PM2.5、SO2)浓度能取得16%以内的相对误差。
2)NARX网络建立的模型能够比较准确地模拟预测高原山地城市昆明的空气质量及变化趋势,预测结果与一致性较高,模拟结果数值水平与监测结果较为一致。除CO外,NARX对其他污染物存在一定程度的低估,数值模式以及LSTM对污染物浓度预测均存在不同程度的低估。
3)在“net=narxnet(1:7,1:7,[5]);气象取第1个参数(气温)”网络结构和超级参数条件下,按模拟预测性能排序为NO2、CO、PM10、PM2.5、SO2、O3,与实际监测值的相对误差绝对值均值分别为11.2%、12.2%、14.6%、15.6%、16.0%、36.3%。
4)使用相同方法计算不同模式预测结果的相对误差绝对值均值,经过优化参数后的NARX神经网络的所有6项污染物预测性能显著优于LSTM、NAQPMS 2个模型,除O3外其他各项污染物预测性能均好于CMAQ。