2019年江苏省PM2.5和O3多模式集合预报算法效果评估
2022-09-02杨文夷皮冬勤晏平仲余进海肖林鸿
杨文夷,皮冬勤,汪 琦,晏平仲,余进海,肖林鸿
1.中国科学院大气物理研究所,北京 100029 2.江苏省环境监测中心,江苏 南京 210019
空气污染对公众健康和社会经济活动均有着深远的影响[1-2]。当前,以细颗粒物(PM2.5)和臭氧(O3)为主的大范围复合污染已经成为我国空气污染治理领域面临的关键问题。研究显示,2010年全球有104万~123万成年人的呼吸系统疾病可归因于O3污染[3]。完善的空气质量预报预警系统能够为及时有效制定区域重污染应急措施提供科学支持,从而有利于缓解空气污染对公众健康、交通出行等的不利影响[4]。
统计模型和数值模式是用于预测短期空气质量的两种主要方法。其中,统计模型需要找到影响环境质量的关键因子,并通过机器学习和深度学习等算法在影响因子和污染变量之间建立映射关系。只要有足够的观测数据用于训练统计模型,统计方法就很容易实现[5-6]。然而,统计模型难以给出较为准确的大范围、长时间尺度空气污染预报结果[7-8]。化学传输数值模式是基于污染物的物理化学过程建模,能够通过时间积分得到较长时间尺度的多种污染物的时空分布特征[9-10],从而满足业务管理的需求。多个国家已基于化学传输模式建立了空气质量预报系统,以提供实时空气质量预报[11-13]。但由于排放清单、气象要素预测结果的不确定性,以及数值模式本身所含物理化学过程的不完善性,当前空气质量数值模式对O3和PM2.5浓度的预报结果仍存在一定的偏差[14-15]。
基于统计方法的模式预报后处理技术简单、高效,因此,常被用于改善数值模式的预报效果。偏差校正是一种简单的后处理技术,会利用数值模式的历史误差来校正当前的预报结果,从而有效提高预报效果。其中,滑动平均法是最为简单的校正技术,直接利用最近一段时间的平均偏差来校正当前的预报结果[16]。此外,多模式集合平均也常被用于改善模式预报的效果。王茜等[17]基于多个数值模式对上海市空气质量进行了集合预报,发现集合预报能够较好地模拟出主要污染物的日变化趋势;王自发等[18]和陈焕盛等[19]分别对空气质量多模式集成预报系统在北京和广州的实际应用进行了探索。此外,还有一种更先进的后处理技术,是将偏差校正和多模式集合相结合,先对单个模式的模拟结果进行校正,然后基于近期的模式预报效果对校正后的结果进行权重集成[20-21],从而实现集合预报。
江苏省常住人口8 000多万人,是华东经济强省之一。随着现代化进程的推进,在人类活动和气候变化的共同影响下,该区域大气污染问题面临严峻的挑战[22]。本研究基于江苏省重污染天气监测预报预警系统(以下简称预报系统)2019年业务化预报结果,通过优化权重计算方法,发展了一种集合预报算法,并针对PM2.5和O3等级预报的准确率开展评估,对比分析预报系统中的不同模式及改进后的集合预报模式的预报效果。本研究有助于提升江苏省空气质量业务预报的准确率,为打造宜居环境提供科技支撑,从而推进区域整体高质量发展。
1 数值模式及方法介绍
1.1 数值模式
江苏省环境监测中心预报系统所使用的数值模式包括美国国家环境保护局CMAQ模式[23]、美国ENVIRON公司CAMx模式[24]、美国大气海洋局(NOAA)预报系统实验室(FSL)WRF-Chem模式[25]和中国科学院大气物理研究所NAQPMS模式[26]。上述数值模式均采用3层嵌套模拟,从最外层到最内层的分辨率分别为27、9、3 km,最外层区域包含整个东亚地区,最内层区域覆盖整个江苏省。为了尽可能地减少气象场和排放清单不确定性对模式预报效果的影响,各模式均由中尺度天气预报模式WRF提供统一的气象预报场,并采用统一的污染源排放清单。本研究的评估时段为2019年1月1日—2019年12月31日,选取预报系统最内层区域(3 km水平分辨率)江苏省13个主要城市每天未来48 h时效的预报结果开展效果评估。需要指出的是,本研究中的未来48 h时效预报结果是指预报系统中提前2 d的预报结果,即2019年1月1日预报2019年1月3日的空气质量。提高48 h时效预报效果的准确率,能更有效地支撑提前应对重污染过程的相关工作。
1.2 集合算法
本文采用了一种集合预报算法来改进预报系统对PM2.5和O3的预报效果,该算法对最优化集成方法[27]进行了改进。漆梁波等[20]采用最优化集成方法对上海区域的温度和相对湿度等气象要素进行了集合预报,发现最优化集成方法的预报效果优于卡尔曼滤波集合方法;吴剑斌等[21]首次将最优化集成方法引入污染预报领域,发现该算法能够较好地提升对O3的预报效果。本文采用相似的技术对PM2.5和O3进行集合预报。该方法主要分为3步:首先,计算模式在近期的平均偏差,并借此校正近期的模式预报结果,求得校正后的平均绝对误差;然后,根据平均绝对误差确定各模式在对应预报时次的权重系数;最后,校正模式预报值的系统偏差,并对校正结果进行权重集合。为了避免集合预报的结果过度依赖某个模式的预报结果,与最优集成算法不同的是,本文优化了权重计算方法,具体计算公式如下:
(1)
式中:wi为模式权重;ei为模式的平均绝对误差;γ为调整参数,γ越大,各模式的权重越接近。
1.3 观测数据
用于评估各方法预报效果的江苏省PM2.5和O3观测数据来源于全国城市空气质量实时发布平台发布的站点小时浓度数据,本研究共涉及95个监测站点。本研究所关注的是模式对城市空气污染日变化特征的预报能力,在进行观测资料预处理时,采用地级市所有站点的平均值作为城市污染浓度值。当有效监测点位的数量低于城市站点总数量的75%时,记为缺测。同时,在计算日均值时,如某日参与计算的有效小时污染数据少于20 h,则当日浓度平均值记为缺测。参与本次评估的各城市PM2.5和O3有效监测天数的范围分别为339~365 d和340~365 d。
1.4 评估方法
本研究中参与评估的城市包括江苏省13个地级市(分布如图1所示),评估对象包括4个国内外主流空气质量数值模式(CMAQ、CAMx、WRF-Chem和NAQPMS)及集合预报模式(ENS),评估变量包括PM2.5和O3。
注:底图下载自自然资源部标准地图服务网站(http://bzdt.ch.mnr.gov.cn/),审图号为GS(2019)3266号,下载日期为2021-05-10。下同。图1 参与空气质量预报效果评估的江苏省13个城市的分布Fig.1 Distribution of 13 cities in JiangsuProvince participating in the evaluationof air quality prediction effect
首先,对各模式在江苏省实际应用中的偏差特征进行分析。为了避免极端值对模式系统偏差的计算产生影响,计算偏差时采用一个鲁棒性较强的统计量来表征所评估城市的平均偏差,其公式为
(2)
然后,根据王晓彦等[28]给出的方法,对集合算法和4个数值模式所预报的城市单日PM2.5、O3空气质量分指数(IAQI)等级的准确率进行评估。如果实况IAQI级别在预报结果范围内,则记为准确。各城市不同污染物IAQI等级预报准确率CG的算法为
(3)
式中:n表示IAQI等级预报准确的天数,d;N表示参与评估的总天数,d。
2 结果与讨论
2.1 数值预报模式的偏差特征
大量研究[7-8,10,14-15,29]发现,天气系统预报结果、边界层高度模拟结果、平流层O3输送模拟结果、前体物排放清单的不确定性,以及化学机制的不完善性等,都会导致空气质量数值模式预报的污染物浓度与实际观测浓度相比出现偏差。图2为CMAQ、CAMx、WRF-Chem和NAQPMS 4个数值模式对2019年江苏省各城市PM2.5和O3浓度的预报偏差箱线图。从图2可以看出,不同模式对江苏省不同城市PM2.5和O3浓度的预报结果均存在一定程度的系统性偏差。对于PM2.5而言,CAMx、WRF-Chem和NAQPMS模式的预报结果表现为明显的正偏差,其中,WRF-Chem模式对不同城市的预报偏差的离散程度更高,而CAMx和NAQPMS模式对各城市的预报结果的偏差差异更小,全年平均普遍高估5 μg/m3以内;CMAQ模式对不同城市PM2.5浓度的预报结果呈现出低估现象,全年平均低估10 μg/m3以内。对于O3而言,4个模式的预报结果均表现为正偏差,NAQPMS模式的预报偏差最小,WRF-Chem模式的高估现象最明显且预报偏差最离散。
注:方框的框线上下限分别代表预报偏差数值的上下四分位数,框内实线代表预报偏差数值的中位数,空心圆表示异常值。图2 不同模式对2019年江苏省13个城市PM2.5和O3(未来48 h时效预报结果)的预报偏差箱线图Fig.2 Boxplot of prediction bias (48-hour forecast) of PM2.5 andO3 by different models for 13 cities in Jiangsu Province in 2019
从图3可以看出,不同模式对江苏省各城市PM2.5和O3浓度的预报偏差均存在明显的月变化特征。对于PM2.5而言,与其他模式相比,WRF-Chem模式对各个城市的预报偏差相对较大,特别是在夏季,WRF-Chem模式的预报结果在多数城市存在明显的高估现象。NAQPMS模式对江苏省不同城市冬季PM2.5浓度存在一定的高估,各城市的预报偏差在3.4~31.2 μg/m3之间;对春季和秋季PM2.5浓度的预报偏差较小,平均偏差分别为-1.8 μg/m3和0.4 μg/m3。朱莉莉等[4]评估了NAQPMS模式对江苏省2013年夏季PM2.5浓度的预报效果,评估结果显示:对于江苏省南部的南京市、无锡市、常州市和苏州市,该模式预报的PM2.5浓度会高估15 μg/m3左右;而对于江苏省北部的徐州市、连云港市、淮安市和宿迁市,其预报的PM2.5浓度会低估28~47 μg/m3。可能是因为近年来江苏省PM2.5污染有所改善,相对而言,在本研究中,NAQPMS模式对江苏省PM2.5浓度的预报效果有一定的提高。2019年夏季,对于江苏省南部城市,NAQPMS模式预报的PM2.5浓度的偏差范围为-8.7~4.3 μg/m3;而对于江苏省北部城市,其预报的PM2.5浓度的偏差范围为3.7~10.3 μg/m3。
图3 不同模式对2019年江苏省PM2.5和O3(未来48 h时效预报结果)的预报偏差的月变化特征Fig.3 Monthly variation characteristics ofprediction bias of PM2.5 and O3 inJiangsu Province in 2019 forecasted bydifferent models (48-hour forecast)
对于O3而言,各模式的预报偏差呈现出不同的月变化特征,在冬季的一致性更强,而在夏季差异较大。CMAQ和CAMx模式明显高估了江苏省冬季O3浓度,平均偏差在30 μg/m3左右,而对夏季O3浓度平均低估25 μg/m3左右;WRF-Chem模式对江苏省O3浓度的预报结果在2019年全年都呈现出高估的特点;NAQPMS模式对江苏省冬季O3浓度的预报偏差较小,而对夏季O3浓度存在高估,平均预报偏差在25 μg/m3左右。
总体来说,对于江苏省不同城市,CAMx模式的PM2.5浓度预报偏差最小,而NAQPMS模式预报的O3浓度则在量级上与观测值更为接近。
2.2 集合预报的改进效果
上述评估结果表明,各模式对江苏省不同城市PM2.5和O3浓度的预报结果均存在一定程度的系统性偏差,因此,在对本文采用的集合算法进行权重集成前,对各个模式的预报系统偏差进行了校正。图4展示了分别采用CAMx、CMAQ、WRF-Chem、NAQPMS模式及集合预报模式得到的2019年江苏省PM2.5IAQI等级准确率的空间分布。与O3IAQI等级的预报准确率相比(图5),4个数值模式对PM2.5IAQI等级的预报准确率相对较低,特别是在江苏省南部地区。其中,WRF-Chem对长江以南各城市的预报准确率低于60%。然而,集合预报模式在很大程度上改善了这种情况,其对江苏省北部城市PM2.5IAQI等级的预报准确率均超过了80%,对部分城市的预报准确率甚至超过了85%。就江苏省整体而言,集合预报模式的预报效果相比单一模式更优,可将江苏省不同城市PM2.5IAQI等级的预报准确率提升将近6个百分点。
图4 不同模式对2019年江苏省PM2.5 IAQI等级(未来48 h时效预报结果)预报准确率的空间分布Fig.4 Spatial distribution of prediction accuracy of PM2.5 IAQI class inJiangsu Province in 2019 from different models (48-hour forecast)
图5展示了分别采用CAMx、CMAQ、WRF-Chem、NAQPMS模式及集合预报模式得到的2019年江苏省O3IAQI等级准确率的空间分布。可以看出,4个数值模式对江苏省不同城市O3IAQI等级的预报准确率差异不大,WRF-Chem模式表现稍好,其对多数城市的O3IAQI等级的预报准确率为65%~80%。相比而言,集合预报模式对江苏省不同城市O3IAQI等级的预报准确率最高,特别是在江苏省北部地区,集合预报极大地改善了O3IAQI等级的预报准确率。其中,集合预报模式对徐州、连云港、淮安、盐城等城市O3IAQI等级的预报准确率超过了85%。
图5 不同模式对2019年江苏省O3 IAQI等级(未来48 h时效预报结果)预报准确率的空间分布Fig.5 Spatial distribution of prediction accuracy of O3 IAQI class inJiangsu Province in 2019 from different models (48-hour forecast)
2.3 集合预报的局限性
图6为2019年江苏省各城市PM2.5和O3监测结果在不同浓度水平出现的天数。从图6可知,江苏省O3污染相较于PM2.5污染更为严重。2019年江苏省O3浓度基本在50~250 μg/m3,表现为Gamma分布形态;而PM2.5浓度呈典型的指数分布形态,主要分布在0~150 μg/m3,且浓度小于50 μg/m3的天数占全年总天数的2/3左右。
图6 2019年江苏省各城市PM2.5和O3监测浓度在不同浓度水平出现的天数Fig.6 Number of days that PM2.5 and O3occur at different pollution concentrationlevels in each cites observed inJiangsu Province in 2019
图7给出了不同污染浓度水平下的4个数值模式和集合预报模式对2019年江苏省各城市PM2.5和O3浓度的预报偏差。可以看出,随着污染浓度的增加,数值模式和集合预报模式的预报偏差在各城市之间变得更加离散,且各模式得到的PM2.5浓度预报偏差随PM2.5浓度的增加而变大;集合预报较好地改善了4个数值模式的PM2.5浓度预报偏差,特别是在PM2.5浓度为150~250 μg/m3时。
图7 各模式在不同污染浓度水平下对2019年江苏省各城市PM2.5和O3浓度的预报偏差Fig.7 Prediction bias of PM2.5 and O3 atdifferent pollution concentration levelsforecasted by each model and ensemblealgorithm in Jiangsu Province in 2019
对于O3而言,CAMx和CMAQ模式的系统性偏差与O3浓度大致呈现线性关系。在O3浓度较低时,4个数值模式均表现为高估;而在O3浓度较高时,4个数值模式均表现为低估。CAMx和CMAQ模式对O3浓度的低估最为明显,而WRF-Chem模式在O3浓度为150~300 μg/m3时表现最优。整体而言,集合预报很好地改善了各数值模式在O3低值区呈现的高估现象。然而,集合算法在计算模式权重时并没有区分不同的污染浓度水平,而CAMx和CMAQ模式在O3高值区出现的预报低估现象最为严重,从而导致集合预报模式在面临高浓度O3污染时仍存在明显的低估现象。
整体而言,集合算法能够在一定程度上提升整个业务预报系统的预报准确率。但目前的集合算法在对各成员进行校正时,并未区分考虑污染物的不同浓度水平。因此,从集合预报算法呈现的O3浓度预报偏差特征来看,该算法仍存在一定的提升空间。
3 结论
1)本研究分析了江苏省重污染天气监测预报预警系统中的不同数值模式对江苏省各城市PM2.5和O3浓度的预报偏差,结果显示,各模式均存在一定的系统性偏差。其中,CAMx模式对江苏省PM2.5浓度的预报偏差相对最小,而NAQPMS模式预报的O3浓度则在量级上与观测值更为接近。
2)本研究基于预报系统预报结果,发展了一种可以校正系统偏差的集合预报技术,以改善PM2.5和O3预报效果。就江苏省整体而言,相比最优的单一数值模式,集合预报模式可提升PM2.5IAQI等级预报准确率近6个百分点,使全省平均PM2.548 h预报准确率超过80%。
3)相较于单一、确定的数值模式,集合预报模式极大地改善了O3预报的准确率,特别是在江苏省北部地区,其对徐州、连云港、淮安、盐城等城市O3IAQI等级的预报准确率超过了85%,可使全省平均O348 h预报准确率超过80%。
4)不同污染水平下的预报偏差分析结果表明,受限于目前的校正策略,集合预报算法对高浓度O3发生天的预报效果的提升相对有限,仍有一定的改善空间。在下一步研究工作中,为了实现对集合预报算法的优化,可以根据污染物的浓度水平进行分类,对不同浓度范围内的各个模式的预报结果分别进行偏差校正,从而进一步提升集合预报算法的预报效果。