ECMWF集合预报产品在重庆暴雨预报中的检验与应用

2022-10-18庞玥刘祥韩潇胡春梅王欢

气象科学 2022年4期

庞玥刘祥韩潇胡春梅王欢

(1 重庆市气象台，重庆 401147；2 重庆市气象服务中心，重庆 401147)

引言

重庆地区地形复杂，灾害性天气频发，暴雨就是其中之一。近年来，随着数值天气预报的发展，越来越多的模式产品对暴雨预报起到了较好的指示作用。但由于单一的数值模式对暴雨预报存在很大的不确定性[1-2]。集合数值预报就是估计数值模式中不确定性的一种方法，往往比单一的确定性预报获得更多的信息[3-5]。

目前，集合数值预报已在全球多个国家中广泛应用于日常预报业务中，已成为国内外众多学者研究暴雨等灾害性天气事件的重要方法之一[6-9]。然后由于集合数值预报的系统误差、初始条件、同化方案、成员样本数等原因，常表现出系统性偏差，不能完整描述大气的不确定性[10-11]，因此还需要进行统计学后处理技术来改善其可靠性和预报技巧。苏翔等[12]、代刊等[13]指出非参数化后处理方法具有灵活多样的形式，反映了历史训练样本中预报和观测数据的统计关系，但它无法推演训练样本中未发生过的事件，且需要大量的样本来订正统计模型。目前，非参数化后处理方法在国内外已得到广泛应用。如美国国家环境预报中心在业务中使用频率匹配法显著减小了全球降水模式预报的系统性偏差[14]；陈圣劼等[15]指出概率预报、最优百分位、杜—周排序法和降水偏差订正频率匹配法在江苏暴雨预报中有一定指示意义；FANG，et al[16]将概率匹配方法应用于提高台风和地形增强引发的暴雨预报准确率。这些后处理方法在所研究的的区域或个例中均较大程度地减少了集合数值预报的系统误差，提高了降水预报技巧，因此统计学后处理已成为集合预报系统的重要组成部分。

随着集合数值预报在全国气象部门的推广，各地的气象工作者开始着眼于研究集合预报在本地的检验和应用[17-19]。近年来，重庆市气象局一直在大力发展集合预报系统的研究和应用，但在实际工作中，预报员对集合预报产品的使用意识较为薄弱、使用率较低，存在着概念模糊和应用方法欠缺等问题。鉴于当前现状，本文将基于数据较全、业务使用率较高的ECMWF集合预报系统，研究ECMWF集合预报统计量产品及其后处理技术在重庆暴雨预报中的应用，分析ECMWF集合预报系统对暴雨的可预报性问题，其结果有助于预报员深入认识集合预报系统，进而做出更好的决策，也为暴雨预报业务工作提供科学参考。

1 资料与方法

1.1 资料

本文所用实况资料为2014—2020年5—9月重庆地区34个国家气象站20时—次日20时(北京时，下同)的24 h降水资料(图1)。数值预报资料为同时段ECMWF集合预报降水资料和国家气象中心基于ECMWF集合预报系统开发的12类常用的降水统计量产品，其预报区域选取重庆范围(28°～33°N、105°～111°E)(图1)，分辨率为0.5°×0.5°。采用最优插值方法，将集合预报格点降水数据插值到站点。考虑到ECMWF集合预报资料会有8～12 h的接收延迟，因此对模式每日08时起报的12～36 h的24 h降水产品进行检验分析。其中，集合预报降水统计量产品包括：概率匹配平均、平均数、中位数、最大值、最小值、Mode、控制预报、10%分位数、25%分位数、75%分位数、90%分位数和融合产品，其计算方法分别为：

图1 预报检验区域及重庆地区34个国家气象站(黑色圆点)分布

(1)概率匹配平均：将区域内n个成员所有预报从大到小排列，保留每n/2个间隔的预报值；然后将集合平均场按从大到小排列；将第一步保留下来的序列与集合平均序列匹配，即得到概率匹配平均产品。

(2)平均数(集合平均)：所有集合成员的算术平均。

(3)中位数：将数据从大到小排列，取中间值。

(4)最大/小值：将数据从大到小排列，取最大/小值。

(5)Mode：指样本中最常出现的值，公式为Mode=3×中位数-2×平均数。

(6)控制预报：不加扰动的预报结果。

(7)百分位值(10%、25%、75%、90%分位数)：将数据从大到小排列，取百分比值。

(8)融合产品：如果集合最大值≥100 mm，则融合值为集合最大值；如果集合90%分位值≥50 mm，则融合值为90%分位值；如果集合75%分位值≥25 mm，则融合值为75%分位值；如果集合中位值≥10 mm，则融合值为集合中位值；在上述条件都不满足的情况下，融合值为集合10%分位值。

1.2 检验方法

本文采用日常业务中常用的TS评分、ETS评分、预报偏差(BIAS)、漏报率(PO)、空报率(FAR)等多个参数进行检验分析。其表达式分别为：

TS评分：

TS=NA/(NA+NB+NC)，

(1)

ETS评分：

ETS=(NA-r)/(NA+NB+NC-r)，r=(NA+NB)(NA+NC)/(NA+NB+NC+ND)，

(2)

预报偏差：

BIAS=(NA+NB)/(NA+NC)，

(3)

漏报率：

PO=NC/(NA+NC)，

(4)

空报率：

FAR=NB/(NA+NB)。

(5)

其中：NA为暴雨预报正确的站数；NB、NC分别为暴雨空报和漏报站数；ND为未预报暴雨且实况无暴雨发生的站数。

1.3 暴雨日的定义

本文定义暴雨日为重庆地区34个站中至少有1个站24 h累计降水量为暴雨及以上级别降水(简称“暴雨”)，即至少1站24 h降水量大于等于50 mm。剔除集合预报系统未接收到的降水资料时次，本文选取2014—2016年5—9月81个暴雨日进行以下集合预报统计量产品和后处理技术产品的暴雨预报检验分析。由于后处理方法中的最优百分位和频率匹配方法的计算需要历史实况信息，因此需将这两种方法的研究时段分为训练期和检验期，其中2014—2016年的81个样本作为训练数据，再选取2017—2020年的78个样本作为检验数据进行评估。

2 集合预报统计量产品在暴雨预报中的检验

ECMWF集合预报系统由1个控制预报成员和50个预报成员组成，国家气象中心集合预报团队针对ECMWF集合预报系统开发了12类常用的降水统计量产品，然后针对暴雨这类灾害性天气，预报员可以参考哪些统计量产品呢？如何利用统计量产品为暴雨预报提供客观依据呢？因此本节将对这12类统计量产品在重庆暴雨中的预报性能进行分析。由于控制预报为不加扰动的预报成员，与日常业务中所用的ECMWF确定性预报相比，只是分辨率有所不同，因此控制预报可以理解为是日常业务中所用的确定性预报的简化版，本文将其代替单一的确定性预报与其他统计量产品进行对比分析。

图2给出了集合预报统计量产品对重庆地区暴雨预报的检验结果。从暴雨TS评分来看(图2a)，各统计量产品的TS评分均值只有0.108，这与这些产品的计算方法有关。比如集合平均的平滑作用会过滤掉小概率事件，保留大概率事件，但暴雨就是小概率事件，所以它的暴雨TS评分只有0.057，对暴雨预报较差。其中TS评分最高的产品为最大值(0.257)，此外，90%分位数、融合产品、概率匹配平均、75%分位数的TS评分均高于控制预报(0.113)，说明这些产品对暴雨强度预报较控制预报更有参考性。而最小值和10%分位数的暴雨TS评分为0，25%分位数的TS评分接近0，说明这些产品对暴雨降水基本没有预报能力。从ETS评分来看(图2a)，评分最高的产品为90%分位数(0.197)，也高于控制预报的ETS评分(0.086)。

图2 集合预报统计量产品对暴雨预报的TS评分、ETS评分(a)以及预报偏差BIAS(b)

为了综合评估暴雨空漏报及落区的情况，图2b为集合预报统计量产品的暴雨预报偏差检验，结果表明：除最大值以外，其他产品的预报偏差都小于1，这说明即使暴雨TS评分超过0.2的融合产品和90%分位数也有部分的暴雨还是没有预报出来，只有最大值对暴雨预报范围偏大，而其他大部分产品都对暴雨预报范围偏小。其中，预报偏差最接近1的产品有融合产品和90%分位数，值分别为0.858、0.85。此外，75%分位数、概率匹配平均对暴雨预报的偏差程度也小于控制预报，说明这些产品对暴雨范围预报较控制预报更有优势。值得注意的是，最大值的TS评分最高，但其ETS评分反而比融合产品和90%分位数低，结合最大值的预报偏差明显大于1，说明最大值是通过大量空报暴雨造成TS评分偏高。

综上，最大值、90%分位数、融合产品、概率匹配平均、75%分位数对暴雨预报有一定参考性，其中90%分位数和融合产品对暴雨落区预报较好，最大值对暴雨强度预报有一定指示意义，但表现为明显的湿偏差。

3 集合预报后处理方法在暴雨预报中的应用

虽然集合预报系统提供了丰富的预报信息，但在实际应用中，集合模式结果仍表现出不同程度的系统性偏差以及欠离散或过离散情况，为此需要发展统计后处理技术来适当订正集合预报结果出现的偏差。以下利用应用较为广泛的几种非参数化后处理技术，并对集合预报系统进行计算得到新产品，进一步分析其在重庆暴雨降水中的预报效果。

3.1 最优百分位法

上一节分析可知集合分位数产品在重庆暴雨预报中具有较好的预报效果，国家气象中心通过长时间检验发现不同的集合预报百分位值对不同等级的降水具有预报优势，基于此开发了最优百分位法，即用动态百分位值代替集合统计量产品中的固定百分位值，则转变为更加灵活的最优百分位法[20]

本文将百分位值从0%～100%划分为100个预报等级，计算其对重庆暴雨降水的预报能力(图3)。从图3a可以看出，随着百分位数的增加，TS评分总体呈非线性增加，TS评分最高的为94%分位数(0.292)，而99%分位数、100%分位数(即最大值)的TS评分值又低于98%分位数。其中小于68%分位数产品的TS评分值低于控制预报的TS评分值(0.113)，小于53%分位数产品的TS评分值已经低于平均数的TS评分值(0.057)。ETS评分的增长趋势与TS评分类似，评分最高产品仍然为94%分位数(0.223)。从图3b可见，随着百分位数的增加，大于25%分位数产品的空报率上升，大于20%分位数产品的漏报率下降，其漏报率的变化幅度大于空报率，尤其当大于80%分位数时，其漏报率显著减低。由于漏报率减低可以提高TS评分，但空报率上升却减低TS评分，当两者达到平衡时，使得TS评分最高。由此寻找到对于2014—2016年主汛期暴雨预报的最优百分位数为94%分位数，其预报偏差为1.257，表现为湿偏差，该分位数位于空报率和漏报率曲线的交点附近。

图3 集合预报动态百分位值产品对暴雨预报的TS评分、ETS评分(a)以及空报率FAR、漏报率PO(b)

综上所述，最优百分位产品的思路在于漏报率和空报率达到平衡时的百分位数值即为暴雨预报准确率最高的产品。值得注意的是，最优百分位94%是基于训练期2014—2016年的历史集合预报与实况资料计算出，故将该结果应用到检验期的集合预报系统进行暴雨降水订正，得出2017—2020年5—9月的暴雨TS评分为0.218，其值比同时期最大值产品的暴雨TS评分(0.185)还要高，对暴雨强度具有较好的预报效果。

3.2 概率匹配—融合、融合—概率匹配法

融合产品和概率匹配平均的计算方法表明，它们分别对集合平均的降水量级和降水落区进行订正，因此在重庆暴雨预报中具有较好的指示意义。基于此特点，陈博宇等[21]进一步开发融合—概率匹配产品(FUSE-PM)和概率匹配—融合产品(PM-FUSE)，其设计原理为：融合—概率匹配产品利用概率匹配平均的计算方法，将融合产品与集合平均进行匹配实现降水落区的调整；概率匹配—融合产品采用融合产品的计算原理，在概率匹配平均的基础上进行降水量级的调整。

图4为融合产品、概率匹配平均、融合—概率匹配、概率匹配—融合、控制预报的各项预报检验评分对比。由图4可见，融合—概率匹配产品的TS评分(0.282)、ETS评分(0.217)较融合产品都有所提高，甚至高于最大值的值；而概率匹配—融合产品的TS(0.153)和ETS(0.125)评分较概率匹配平均的值持平，略高于控制预报。此外，融合—概率匹配产品较融合产品的空报率和漏报率都有所减低，其漏报率在5个产品中最低(0.544)；而概率匹配—融合产品虽然空报率较低，但出现了较高的漏报率，因此其TS评分不高。从预报偏差来看，概率匹配-融合产品的预报偏差只有0.29，仍以干偏差为主；融合—概率匹配产品以湿偏差为主，值为1.074，对暴雨落区的偏差程度甚至小于融合产品和90%分位数，对暴雨降水落区具有较好的指示意义。

图4 融合产品、概率匹配平均、融合—概率匹配、概率匹配—融合、平均数、控制预报的各项预报检验评分对比

因此，对于2014—2016年主汛期重庆暴雨预报，融合—概率匹配产品改进方案更有效，它在于实现了对暴雨降水落区的位置订正，而概率匹配—融合产品改进方案仅降低了空报率。

3.3 频率匹配法

概率匹配平均产品虽然具有降水空间分布较好的集合平均场和降水量级更准确的集合成员的优点[22]，但缺少对观测数据的应用，如果使用实况观测资料对暴雨降水进行匹配就变成了频率匹配法[14，23-24]。李俊等[23]进一步研究表明，若先对降水预报进行集合平均，再应用频率匹配法进行偏差订正，可以明显订正降水范围和降水量级的偏差。本文概率匹配方法的具体实施方案[24]：假设实况观测降水频率与模式降水预报频率一致，利用2014—2016年5—9月逐日实况降水资料和集合平均降水预报数据，计算重庆地区各站点暴雨降水的Gamma分布累积概率Po；令集合平均暴雨预报对应的累积概率值Pf与实况暴雨概率值相等，即Pf=Po；反算出Pf所对应的集合平均的暴雨预报阈值R*。

图5为以沙坪坝站为例的暴雨集合预报—观测频率匹配订正，Po为根据实况观测曲线上横坐标为50 mm(暴雨阈值)对应的累积概率，令Pf=Po，找到集合预报曲线上对应的累积概率Pf，最后由Pf找到集合预报对应的横坐标上的暴雨降水阈值R*，即为沙坪坝站的暴雨订正值R*=28.42mm。由此计算出重庆地区34个站的集合平均暴雨预报阈值(表1)。经计算，集合平均经降水偏差频率匹配订正后各站点的平均TS评分为0.281，明显高于集合平均和控制预报的暴雨TS评分，甚至高于最大值的TS评分(0.257)；漏报率为0.562，较集合平均明显下降；预报偏差为1.135，较融合产品和90%分位数的暴雨偏差程度更小。

图5 沙坪坝站的暴雨集合预报—观测频率匹配法(黑色和灰色实线分别为集合平均和观测降水的累积概率分布曲线)

表1 重庆地区34个站的集合平均暴雨预报临界阈值

可见，基于降水偏差订正的频率匹配法主要通过降低漏报率，有效提高了集合平均数对暴雨降水的预报性能。将该方法在训练期中得到的重庆地区34个站的暴雨预报阈值应用到检验期的集合平均进行各站点的暴雨预报订正，计算得出2017—2020年5—9月集合平均经降水偏差频率匹配订正后的各站点平均暴雨TS评分为0.240，高于同时期最大值产品的值(0.185)，预报偏差为0.909，其偏差程度小于同时期90%分位数的值(1.037)，有效订正了集合预报系统对暴雨强度和落区的预报。

3.4 概率预报

集合概率预报产品体现了集合预报相对于传统确定性预报的优势，它可以定量描述某种天气事件发生的可能性，是最具代表性的集合预报产品。概率预报产品的检验方法参考李俊等[25]使用的平均法：定义N个预报成员在集合预报系统中占有相同的权重，当有M个成员预报发生暴雨时，则该模式发生暴雨的概率为M/N。本文将概率预报产品从0.1%～99%划分为100个预报等级，分析其在重庆暴雨降水中的预报性能。

图6a为集合概率预报产品的暴雨TS和ETS评分检验。可知，随着概率值的增大，TS评分曲线先迅速上升，当概率值为7%时，暴雨TS评分最高，值为0.299，随后TS评分曲线迅速下降，当概率值超过78%时，暴雨TS评分为0；ETS评分曲线趋势与TS一致，但当概率值为8%时，暴雨ETS评分最高(0.23)。从集合概率预报产品的暴雨预报偏差来看(图6b)，随着概率值的增大，预报偏差迅速从湿偏差变为干偏差，当概率值为10%时，暴雨偏差最接近1(1.006)。而TS和ETS评分最高的7%概率和8%概率产品的预报偏差值分别为1.319、1.189，均为湿偏差。这说明，暴雨是一种小概率事件，当概率值较小时对应的暴雨预报准确率较高，随着概率值的增大，其空报率缓慢下降，但伴随漏报率显著上升，因此使得TS和ETS评分迅速减低。因此，概率预报产品既反映了暴雨的不确定性，也可用作暴雨的确定性预报，当在用于暴雨这类小概率灾害性天气事件的确定性预报时，小的概率值就需要引起重视。

图6 集合概率预报产品对暴雨预报的TS评分、ETS评分(a)以及预报偏差BIAS(b)

4 结论

本文利用重庆地区34个国家气象站降水资料和ECMWF集合预报降水资料，系统检验和评估了集合预报统计量产品及后处理技术产品对2014—2016年主汛期5—9月重庆暴雨的预报性能。主要结果如下：

(1)对于12类常用的集合预报统计量产品，最大值、90%分位数、融合产品、概率匹配平均、75%分位数对暴雨预报有一定参考性，其中90%分位数和融合产品对暴雨落区预报较好，最大值对暴雨强度预报有一定指示意义，但表现为明显的湿偏差。

(2)对于集合预报后处理技术产品(表2)，其暴雨TS评分较控制预报和平均数有明显提高，其中概率预报、最优百分位、融合—概率匹配、频率匹配法的暴雨TS评分均超过0.2，甚至优于最大值的暴雨预报效果，对暴雨强度预报具有较高的指导意义；此外，这4种方法有效订正了集合预报系统对暴雨落区预报偏小的问题，其预报偏差均表现为湿偏差，其中融合—概率匹配、频率匹配法的偏差程度小于90%分位数和融合产品，对暴雨落区预报较好；概率匹配—融合的暴雨预报效果也优于控制预报，但预报偏差为干偏差，该方案对降低空报率有一定指示意义。值得注意的是，大部分后处理技术方法表现为湿偏差，表明其订正重点为减低漏报率，由于漏报率和空报率之间存在反相关关系，未来还需在此基础上进一步研究减低空报率的新方法。此外，这几种后处理技术方法都是基于降水量进行建模，随着人工智能技术的不断发展，未来可考虑引入大数据信息的机器学习方法以提高集合预报系统对暴雨降水的预报性能。