APP下载

基于雷暴尺度集合预报的频率匹配降水预报研究

2022-02-06陈训来朱江山林良勋王德立陈元昭孔凡铀

气象与环境科学 2022年6期
关键词:个例雷暴强降水

陈训来, 朱江山, 林良勋, 王德立, 王 蕊, 陈元昭, 孔凡铀

(1.深圳市气象局,深圳 518040; 2.深圳南方强天气研究重点实验室,深圳 518040; 3.中国科学院大气物理研究所,北京 100029; 4.广东省气象台,广州 510080; 5.美国俄克拉荷马大学风暴分析和预测中心,诺曼 732072)

引 言

大气运动本身的混沌特性、模式误差、参数化方案误差等因素,导致数值预报存在不可避免的不确定性[1]。为了估计预报的不确定性,集合预报方法被广泛使用在数值预报的研究和业务应用当中。集合预报不仅能够提供具有量化基础的概率预报,反映预报的不确定性,还能够提供一个技巧较高的确定性预报,如集合平均预报[2]。目前,已经发展出了许多基于集合预报的概率预报方法,如逻辑回归[3]、贝叶斯模式平均[4-6]、集合敷料法[7-8]、非均匀高斯回归[9]等。代刊等[10]对各种集合预报后处理方法作了较全面的综述。

与此同时,基于集合预报的确定性预报仍然被研究者和预报员广泛研究和使用,例如集合平均预报[2,11]。集合平均预报通过集合成员之间的算术平均,滤除各集合成员的差异部分,从而减小预报的不确定性,提高预报准确率,常被作为基于集合预报的最优确定性预报。但是,对于时空分布变率较大的物理量(如降水)来说,集合平均预报方法存在较为明显的不足。虽然,通过过滤各集合成员之间的不同,集合平均预报对降水位置的预报往往优于大多数集合成员,并且这一优势在长期统计中会更加明显[12],但是,当各集合成员的降水场的时空分布差异较大时,集合成员之间的算术平均常常会过度平滑降水场的强度,造成非真实的降水强度分布,常体现为扩大的降水范围和减弱的降水强度。针对这一问题,Ebert[12]使用频率匹配(Frequency Matching,FM)方法,按照等频率映射关系,将集合平均预报的累计频率分布函数(Cumulative Distribution Function,CDF)映射到所有集合成员的CDF上去,从而改善了集合平均预报的强度分布偏差。Zhu等[13]又进一步使用频率匹配方法,将全球集合预报各成员预报的CDF订正到降水观测资料的CDF上,较好地订正了各成员预报的强度偏差,同时也改善集合平均预报的效果。李俊等[14]对华中地区AREM模式确定性预报进行了频率匹配订正试验,也得到相似的结果。李俊等[15]对集合预报进行频率匹配订正试验,指出直接对集合平均进行频率匹配订正的效果优于对各集合成员分别作频率匹配订正再求算术平均。李莉等[16]使用频率匹配方法订正了T213降水预报,结果表明该方法对T213降水预报的偏差有明显改善。周迪等[17]针对四川盆地暴雨,采用Gamma函数来拟合频率分布曲线,进而使用频率匹配方法有效地订正了T213暴雨集合预报系统性误差。以上研究发现,频率匹配订正法对大范围降水过程订正效果较好,尤其是对有无降水预报和50 mm以下量级降水预报的改善较为明显。但由于频率匹配降水预报订正法在处理预报和观测降水频率时,均是针对某一关键区域进行统计分析和订正,不同区域的累积概率分布函数具有明显的差异,因此订正效果受不同区域天气气候特征影响较大[16-17]。目前针对华南地区频率匹配订正方法的研究和业务应用还比较少,有必要进一步开展针对性的研究。

由于对流尺度天气系统时空尺度小、动力与物理过程高度非线性,对流天气的精细化预报面临巨大的挑战,因此,发展高分辨率的雷暴尺度集合预报显得尤为重要。近十几年来,高性能计算机的发展,为雷暴尺度集合预报巨大计算量的问题提供了必要、可行的计算环境,相关研究和应用日益受到国内外学者和数值预报业务机构重视,在雷暴尺度集合预报模式初值扰动技术、集合同化技术等方面取得了丰硕的研究成果,为数不少的业务系统也投入运行[18-19],但频率匹配订正方法在雷暴尺度集合降水预报中的应用研究还不多。深圳市气象局自2013年开始引进和应用美国俄克拉荷马大学雷暴分析和预报中心(CAPS)技术,发展了深圳雷暴尺度(4 km分辨率)集合预报系统(Shenzhen Storm-Scale Ensemble Forecast system,SZ-SSEF)),在华南暴雨、强对流等预报业务中发挥了重要的参考价值[20-21]。江崟等[21]针对深圳雷暴尺度集合预报系统,分析了频率匹配方法的降水偏差订正技术在典型暴雨过程的应用,但缺少更多降水个例的分析。

华南地处低纬,濒临海洋,受到低纬度热带天气系统与中高纬度天气系统的交替影响,天气气候异常复杂多变,暴雨发生频率高、雨强大、致灾性强,皆居全国前列[22-23]。因此,本文选取了华南地区2018年汛期4-9月103个降水个例,对深圳市气象局雷暴尺度集合预报系统进行了批量试验,以检验频率匹配方法在雷暴尺度集合降水预报中的优点和不足。华南汛期持续时间长,针对华南地区汛期降水预报进行频率匹配订正研究,可以更全面地评估频率匹配方法在降水预报中的效果,同时对于防灾减灾救灾也具有较好的实际应用意义。

1 资料与方法

1.1 SZ-SSEF系统

SZ-SSEF采用单向两重嵌套网格,其中外层区域12 km网格距中尺度集合预报(D01)的水平格点数为211×179,内层区域4 km网格距雷暴尺度集合预报(D02)的水平格点数为423×363,垂直方向为51层(图1、表1)。外层区域采用欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)的0.125 °× 0.125 °资料和美国环境预报中心(National Centers for Environmental Prediction,NCEP)全球集合预报系统(Global Ensemble Forecast System,GEFS)1°×1°资料作为初始场和边界条件,内层成员利用美国风暴分析和预报中心开发的ARPS(The Advanced Regional Prediction System)模式的三维变分系统(Three-dimensional variational,3DVAR)和云分析模块分别同化广东省全省11部多普勒雷达的径向风和反射率资料,预报部分采用WRF (Weather Research and Forecast Model)模式V3.5.1[18]。

表1 深圳雷暴尺度集合预报系统 4 km区域模式成员的配置

图1 深圳雷暴尺度集合预报系统(SZ-SSEF)模式区域设置

Du等[24]研究认为,8个集合成员就可以获得集合平均90%的效果。高峰等[25]研究认为,集合预报效果总体上预报技巧随成员数增加而提高,但当集合成员数达到5~13 时,预报技巧呈饱和特征。考虑到计算能力及性价比,目前深圳雷暴尺度集合预报系统成员数为10个,其中M00成员采用ECMWF作为初始场和边界条件,其他集合成员采用GEFS作为初始场和边界条件,不同成员选择不同的微物理过程和边界层参数化方案,最终形成多模式初值、多微物理过程和多边界层过程的雷暴尺度集合预报系统。深圳雷暴尺度集合预报系统内层网格区域每间隔3 h启动一次,每天启动8次,预报时效为36 h。目前,该系统已经成为深圳市气象局业务预报的一个主要支撑[20-21]。

1.2 预报和检验资料

本文收集了SZ-SSEF系统在2017年和2018年汛期4-9月的266次华南地区降水历史预报个例,其中,2017年163次个例,2018年103次个例。选取了SZ-SSEF内层4 km网格,每日12 UTC起报(世界时,下同),预报时间12-36 h时段内的24 h累计降水的集合平均预报作为订正对象。因为数据传输、计算机系统故障等因素 ,两年的历史预报资料都存在数据缺失的情况。

本文使用中国国家气象中心发布的0.05°×0.05°网格化逐时实况降水融合分析数据作为检验数据[26-27]。降水格点分析数据首先被插值到SZ-SSEF的4 km内层网格上,然后与预报进行对比。

1.3 频率匹配(FM)订正方法

本文采用的频率匹配FM订正方法包括以下三个步骤进行:

(1)假设被订正预报日期为d,选取d±45天的时间窗口内,当年和往年所有可用的历史预报个例,作为训练订正模型的历史个例。为了有足够的样本数而又大致考虑到近期相似的总体天气形势,本文采取前后45天滑动平均的方法计算降水的平均频率。为模拟业务运行,满足订正开始时,观测数据已经可以获得的条件,当年d-1天之后的个例不用作训练样本。

(2)在整个SZ-SSEF 4 km区域上,分别计算被订正预报的CDF和训练集个例的降水分析资料CDF。计算训练集降水分析数据的CDF时,先将训练集中所有个例的降水分析数据集合到一起,再计算CDF。CDF的计算采用非参数方法,对0 mm到500 mm,每1 mm间隔的阈值,分别计算其对应的累计频率。

(3)设被订正预报和降水分析资料的CDF分别为CDFfcst和CDFobs。对任意格点上的原始预报fraw,计算其对应的累计频率CDFfcst(fraw),再将其带入降水分析数据CDFobs的反函数,求出降水分析数据CDFobs中相同频率对应的降水值,将其作为订正预报fcal。其具体方法如下:

(1)

频率匹配订正方法的详细解释可参考文献[13-14]。

1.4 检验方法

本文使用Gilbert Skill Score (GSS)评分和BIAS评分对订正前后的集合平均降水预报进行检验。两项评分都是针对某一特定阈值,计算预报和观测在某一方面的相似性,其计算都基于二分类预报联列表,即将预报-观测关系分为四类情况(表2)。

表2 二分类预报联列表

GSS评分(又称为Equitable Threat Score,ETS评分)针对某一特定阈值,检验预报与观测之间的重叠情况,并剔除随机命中。其具体计算方法如下:

(2)

(3)

其中,h为命中数量,hr为随机命中数量,m为漏报数量,f为错警数量,t为检验样本总数。

BIAS评分针对某一特定阈值,比较预报与观测之间的面积差异,当评分等于1时,预报面积与观测面积相等,为完美预报;大于1时,表示预报面积偏大(湿偏差);小于1时,表示预报面积偏小(干偏差)。其具体计算方法如下:

(4)

1.5 试验设计

本文选取2018年汛期4-9月华南地区汛期103次降水个例过程,对SZ-SSEF系统12时(UTC)起报,预报时间12-36 h时段的24 h累计降水量的集合平均预报进行了频率匹配订正预报试验。2017年汛期4-9月出现的163次降水个例数据只用作订正模型的训练样本。

2 结果与分析

2.1 个例试验1:2018年超强台风“山竹”

超强台风“山竹”于2018年9月16日在江门市台山海宴镇沿海地区登陆,是2018年登陆我国最强的台风,给华南大部分地区带来了暴雨到大暴雨局部特大暴雨的降水,广东省出现了历史罕见的风雨浪潮影响,全省平均雨量93.1 mm,有167个气象水文站录得超过250 mm的降水,其中阳江阳东大八镇记录到过程最大雨量481.5 mm。“山竹”造成广东省18个市1060个乡镇受灾,因灾死亡5人,直接经济损失超过75亿元。

这次台风过程是本文所有个例中降水最强的一次。本文首先选取该台风个例,对频率匹配订正的效果进行检验和分析。图2是SZ-SSEF系统2018年9月15日12 UTC起报,预报时间为12-36 h时段的24 h累计降水预报的原始集合平均预报、FM订正预报和相应的降水融合分析资料。图2(a)中可以看到,原始集合平均预报的降水落区偏大,强降水区域(50 mm和100 mm量级)的面积也明显大于降水分析资料的面积,存在较为明显的湿偏差。频率匹配订正预报(图2b)相比于原始集合平均预报,各个量级的降水面积都有较为明显的收缩,与融合分析资料降水的分布更加接近(图2c)。但是,原始预报和订正预报的降水极值区域面积(超过200 mm)差别不大,都与融合分析资料的较为接近。

图2 2018年9月15日12时(UTC)起报的12-36 h时段的24 h累计降水量预报单位:mm;(a)原始集合平均预报,(b)FM订正预报,(c)降水分析资料

图3是这次降水过程整个模式区域上计算的原始集合平均预报、频率匹配订正预报和降水分析资料的累积频率。

图3 2018年9月15日12时(UTC)起报的12-36 h时段的24 h累计降水预报和相应降水分析资料在模式区域D02上的CDF蓝色为原始集合平均预报,红色为FM订正预报,黑色为降水分析资料

预报累积频率和融合分析资料累积频率之间的比较,不考虑降水位置和形态的差异,单纯检验预报和融合分析资料之间的强度分布的相似性,可以看到,对于小于160 mm的降水,原始集合平均预报与降水分析数据存在较为明显的差异,原始集合平均预报的累积频率小于融合分析的累积频率,表明模式系统集合平均预报降水具有系统性偏大的特征,而通过频率匹配订正预报后,降水预报的累积频率与融合分析的较为接近,明显优于原始集合平均预报结果;对大于160 mm的强降水,原始集合平均预报累积频率与实况分析较为一致,频率匹配订正预报后改进效果不明显。

图4是针对0.1 mm,1 mm,10 mm,25 mm,50 mm和100 mm等不同阈值的降水,原始集合平均预报和频率匹配订正预报的GSS评分和BIAS评分。由BIAS评分可以看出,原始集合平均预报对各个阈值的降水事件有过报现象。而频率匹配订正则较好地修正了原始集合平均预报的偏差,各个阈值的BIAS评分都与1较为接近。从GSS评分来看,订正预报在0.1 mm至10 mm阈值上有优势,说明订正预报的小雨量级的降水落区更加准确,这也与图2中两组预报的情况相符。在25 mm至100 mm阈值的GSS评分中,原始预报和订正预报各有好坏,难以分出绝对的优劣。这可能是因为极端降水预报中,降水中心的位置偏差对GSS评分的影响较大。原始集合平均预报中更大的降水面积更容易与观测重合,对GSS评分有正贡献。而频率匹配订正缩小了降水的区域,更容易发生错位,引起“错警”和“漏报”的双重惩罚,对GSS评分有负影响[28-29]。

图4 2018年9月15日12时(UTC)起报的12-36 h时段的24 h累计降水预报的GSS和BIAS评分蓝色为原始集合平均预报,红色为FM订正预报

2.2 个例试验2:2018年5月9日西南季风强降水

2018年5月9-10日受西南季风和切变线共同影响,在广东西部和广西东部出现了暴雨到大暴雨的降水,强降水主要集中在粤西市县、江门、肇庆和广西玉林,其中粤西阳江最大降雨量达227.3 mm (图5c)。SZ-SSEF系统较好地预报出了此次强降水过程,从2018年5月8日12时(UTC)起报的12-36 h时段24 h累计降水预报的原始集合平均雨量分布来看(图5a),大雨以上的降水区域主要在广东西部沿海地区,以及广西东部地区,暴雨以上降水主要集中在广东阳江、江门及广西玉林地区,预报降水强度和落区与实况分析较为一致,但SZ-SSEF系统的集合平均雨量偏大,强降水落区范围较实况区域偏大,降水空报较为明显。通过频率匹配方法订正后,降水量级预报偏大的现象得到订正,强降水区域范围也明显减小(图5b),与实况分析区域更加接近,降低了降水空报的现象。另外,由于SZ-SSEF系统原始集合平均对福建和江西交界处的强降水中心预报位置偏北、降水范围偏小,频率匹配方法订正后对降水落区和强度改进效果不明显,这是由于频率匹配方法的频率统计是在一个区域内进行的,而没有考虑具体降雨位置、雨区的形状或走向误差,所以频率匹配方法无法订正雨区位置的偏差[14]。

图5 2018年5月8日12时(UTC)起报的12-36 h时段的24 h累计降水量预报单位:mm;(a)原始集合平均预报,(b)FM订正预报,(c)降水分析资料

图6为此次季风强降水过程累积频率曲线分布图。从图中可以看出,对小于60 mm的降水,频率匹配订正后,降水预报的累积频率明显优于原始集合平均预报的,尤其对小于10 mm的降水订正效果比较明显,降水预报的累积频率与实况分析基本吻合;而对大于60 mm的降水,由于原始集合平均预报累积频率与实况分析较为一致,频率匹配订正预报的改进有限。

图6 2018年5月8日12时(UTC)起报的12-36 h时段的24 h累计降水预报和相应降水分析资料在模式区域D02上的CDF蓝色为原始集合平均预报,红色为FM订正预报,黑色为降水分析资料

从频率匹配方法订正前后预报的GSS和BIAS评分来看(图7),经过频率匹配订正后,对不同阈值的降水预报GSS评分和BIAS偏差评分都得到提高,GSS评分都高于订正前的结果,其中对晴雨(0.1 mm)和大暴雨以上(100 mm)的预报评分提高较为明显。对0.1 mm至50 mm量级的降水预测,原始集合平均预报BIAS评分大于1,且随着量级的增大BIAS评分为增大的趋势,说明这次过程有明显的湿偏差,但对100 mm量级以上的降水,BIAS评分小于1,存在干偏差的情况,有漏报的现象,这从图5中也可以看出。频率匹配方法订正后,对各个阈值的降水预报面积都得到订正,BIAS评分更接近1,说明订正使原始集合平均的“有雨或无雨”的定性降水预报,以及大暴雨量级预报偏小的现象有了改善。

图7 2018年5月8日12时(UTC)起报的12-36 h时段的24 h累计降水预报的GSS和BIAS评分蓝色为原始集合平均预报,红色为FM订正预报

2.3 连续试验

本文对2018年汛期4-9月103次降水个例进行了连续试验,并针对0.1 mm,1 mm,10 mm,25 mm,50 mm和100 mm等不同降水阈值,检验了所有降水个例,以及前汛期(4-6月)和后汛期(7-9月)降水预报的原始集合平均预报和频率匹配订正预报的GSS评分和BIAS评分(图8),其中前汛期降水过程为61次,后汛期降水过程为42次。从汛期所有降水个例的BIAS评分来看(图8a),原始集合平均预报对50 mm以下阈值存在较明显的湿偏差, BIAS评分超过1.5,对10 mm阈值的最大BIAS超过1.9,但对100 mm阈值以上的BIAS较小,为0.95,表明在2018年汛期SZ-SSEF系统的原始集合平均对强降水有较好的预测能力。频率匹配方法较好地订正了原始集合平均预报50 mm以下阈值的湿偏差,BIAS评分得到明显改善,更接近于1。从所有降水过程的GSS评分(图8a)来看,频率匹配订正对0.1 mm和1 mm阈值的GSS评分有较明显的改善,这可能是因为模式对范围较大的小雨量级降水落区的位置预报较好,但湿偏差造成了较高的错警率,频率匹配订正消除了偏差,减少了大片虚报的小雨量级区域,降低了错警率,进而改善了GSS评分。频率匹配订正对于10 mm至100 mm阈值的GSS评分影响不显著。其中,对10 mm阈值的GSS评分略有改善,对25 mm和100 mm阈值的GSS评分稍有下降,这可能是因为频率匹配订正使强降水面积收缩,高分辨率雷暴尺度集合预报系统的降水预报更加难以与观测重叠,“错警”和“漏报”的双重惩罚,导致GSS评分下降。李俊等[14]也指出,在原理上频率匹配订正法不能用来订正雨区位置的偏差,在降水落区较为准确的情形下,订正效果较好;如果降水落区预报出现明显偏差时,使用该方法并不能改进预报结果。

华南季风气候特征极其显著,每年降水集中在两个时期,前汛期以锋面降水和暖区降水为主,后汛期以热带气旋、东风波等热带系统降水为主[30-32]。前汛期和后汛期环流形势、影响系统不同,造成的降水落区和数值模式的可预报性也有不同[33-34]。因此,本文在对2018年整个汛期降水过程检验的基础上,分别对前汛期和后汛期的降水预报进行检验和分析。对比图8(b)和图8(c)可以看出,对不同阈值的降水预报,SZ-SSEF系统原始集合平均对前汛期降水预报的GSS评分低于后汛期的,且前汛期BIAS评分高于后汛期的;对0.1 mm至10 mm量级的降水预报,前汛期和后汛期GSS评分都比较高,但随着降水量级的增大,前汛期的GSS评分迅速下降,尤其是对50 mm和100 mm阈值的降水预报,前汛期GSS评分分别下降到0.05和0.02,明显低于后汛期的0.17和0.21。这表明SZ-SSEF系统对后汛期热带气旋等天气系统的强降水预报效果较好,后汛期降水预报湿偏差的程度低于前汛期的偏差程度。华南前汛期以暖区暴雨为主,暖区暴雨产生的降雨量一般远大于锋面系统形成的降雨量,而目前数值模式对暖区暴雨的预报能力十分有限[35],这可能是SZ-SSEF系统对前汛期降水预报评分偏低的原因。频率匹配方法订正后,对前汛期和后汛期的0.1 mm至1 mm阈值降水预测的GSS评分都有明显的改善,对10 mm阈值降水预报的GSS评分略有提升,对50 mm暴雨以上的GSS评分改善不明显;对不同阈值降水预报的偏差也明显降低,订正后BIAS评分与1更接近。从整体评分来看,频率匹配方法订正对后汛期降水预测改进的效果更为明显,GSS评分提高幅度高于前汛期的。

图8 2018年4-9月汛期103次降水个例试验GSS和BIAS评分统计结果(a)为所有个例评分,(b)为前汛期个例评分,(c)为后汛期个例评分;蓝色为原始集合平均预报,红色为FM订正预报

上述分析结果表明,SZ-SSEF系统对小雨量级的预报能力较好,但随着降水量级增大,SZ-SSEF系统预报能力逐渐降低;对于不同时期降水,预报能力有所区别,对前汛期降水预报的GSS评分低于后汛期的,且前汛期BIAS评分高于后汛期的,降水预报湿偏差更明显。频率匹配方法订正后,减小降水预报偏差BIAS评分,提高对0.1 mm至1 mm阈值降水的GSS评分,但对达到50 mm暴雨以上的GSS评分改进不明显,未来还需通过更多的试验样本进行检验,以获得更为可靠的统计结果。

3 结论与讨论

本文采用频率匹配方法,对深圳雷暴尺度集合预报系统SZ-SSEF在2018年4-9月汛期103次降水个例的集合平均降水预报进行了订正预报试验,以检验频率匹配方法在雷暴尺度集合降水预报中的效果。总的来说,频率匹配订正法对改善雷暴尺度集合平均预报的降水强度分布有显著效果,其具体表现如下:

(1)深圳雷暴尺度集合预报系统对小雨量级的预报能力较好,但随着降水量级增大,预报能力逐渐降低,对2018年前汛期降水预报的GSS评分低于后汛期的,且前汛期BIAS评分高于后汛期的,降水预报湿偏差更明显。

(2)频率匹配订正可以较好地订正原始集合平均预报对降水量的过报情况,特别是对50 mm以下阈值降水预报的BIAS评分有明显改善,较为接近1的完美评分。

(3)对于低阈值降水预报来说,频率匹配订正可以将集合平均预报的降水区域范围明显减小,面积缩小到与融合分析资料相似的大小,减小了原始集合平均预报的错警率,进而改善了GSS评分。

(4)对于50 mm暴雨以上强降水预报来说,无论单个集合成员还是集合平均预报,都很难精确捕捉到强降水中心的位置,做到格点对格点的重合。频率匹配订正对降水的位置偏差没有订正能力,同时会缩小强降水区域的面积。这可能会导致订正预报的强降水区域更加难以与分析资料重合,出现“错警”和“漏报”,进而降低GSS评分。这也说明,GSS等点对点评分方法对强降水预报的检验存在不足,未来需要尝试其他方法,将强降水的强度、位置误差分开检验。

关于频率匹配方法对强降水预报(如100 mm阈值)的订正效果,本文所选取的2018年汛期103个降水个例中,强降水事件较为有限,其结果可能存在一定的偶然性。未来还需要进一步扩大样本容量,或者单独挑选强降水个例进行检验,获取更加全面、可靠的统计结果。

猜你喜欢

个例雷暴强降水
案例研讨教学在高原山地气象培训中的应用及思考①
2020年8月中旬成都强降水过程的天气学分析
新德里雷暴
2020年江淮地区夏季持续性强降水过程分析
2020年黑龙江省夏季延伸期强降水过程预报检验
一例膀胱镜下留置尿管困难拔除个例分析
一次东移型西南低涡引发的强降水诊断分析
阜新地区雷暴活动特点研究
广西富川县雷暴气候特征分析
一次典型大范围冷流暴雪个例的诊断分析