TIGGE降水预报在中国干旱半干旱地区的适用性评估
2022-04-15何超禄吕海深朱永华李文韬谢冰绮徐凯莉刘名文
何超禄, 吕海深, 朱永华, 李文韬, 谢冰绮, 徐凯莉, 刘名文
(1.河海大学水文水资源与水利工程科学国家重点实验室,江苏 南京 210098;2.河海大学水文水资源学院,江苏 南京 210098;3.珠江水利委员会珠江水利科学研究院,广东 广州 510630)
降水作为洪水预报的输入条件,对洪水预报精度影响较大。随着数值天气预报技术的不断进步,相关数值模式产品迅速兴起。数值模式预报产品特指气象部门计算并输出的数值天气预报格点数据产品,也是目前气象部门输出的唯一一类预测未来天气状况的数值产品。目前,预报员可以参考的数值模式产品较多,主要包括:欧洲模式、中国T639模式、美国模式、日本模式、德国模式以及省气象台或各区域中心引进开发的中尺度模式[1-7]。目前短期降水预报已经较为成熟,尤其是预见期1~7 d 的预报精度较高,因此将降水预报数据作为水文模型驱动数据,进行水文预报,从而延长预见期、提高洪水预报精度提供了可能[8-9]。国内外许多学者已经将气象预报数据与洪水预报模型耦合进行水文预报[10-11]。大多研究表明,气象水文耦合的洪水预报具有一定的预报精度且能有效延长洪水预报预见期[12-14]。
全球交互式大集合(THORPEX Interactive Garnd Global Ensemble),简称TIGGE,THORPEX 是一个世界天气研究计划,旨在加速提高1 天至2 周高影响天气预报的准确性,造福人类。作为THORPEX 项目的关键组成部分,TIGGE 能评价并代表各成员国的集合预报系统针对较高影响天气要素的预报水平,从而实现共享全球集合数值预报产品,促进全球天气预报业务以及数值预报技术的进步。其权威性及可公开获取性已为天气预报业务相关学科的科研机构提供了大量的研究数据,产生了丰硕的科研成果,已初步展现集合预报在高影响天气预报中的优良应用前景[1-6]。不同模式产生的预报产品都有着模式误差限制,随之产生的问题就是如何通过充分利用各模式的预报产品,从而提升预报准确率。已有研究表明,多模式集合技术表现出更高的预报技巧[15-16],在实际生产中,对每个预报模式赋予合理的权重系数是提高多模式集合技术精度的关键[17]。在此之前,评估各模式在研究区的预报能力,筛选出预报能力适用性更佳的单个预报模式是有必要的。
目前,针对TIGGE 预报结果的评估和应用已取得一定进展[17],对单一模式在具体流域的评估总能找到该模式的优点,但随着预报产品的日趋丰富和综合集成预报服务需要的增强,作为集成模式基础的模式预报性能的评估也成为研究热点。而TIGGE 对中国干旱半干旱地区(以下称“研究区”)的预报效用鲜见报道,研究区大部分属于温带大陆性气候,降水量稀少且集中于夏秋季,生态环境脆弱[18-19],如何利用好预报信息,评估多模式的预报效果,分析结果差异的原因,进而进行下一步的多模式集成提供研究基础,对改进研究区的中期预报有着重要意义。本文拟对TIGGE 资料中心的ECMWF、JMA、KMA 和UKMO 4 种模式在研究区的预报效果进行评价,从降水量预报、降水分级预报、降水探测能力和空间预报精度等多角度出发,综合分析了多类预报产品在研究区的适用性。
1 研究区和数据介绍
1.1 研究区域
根据中国年降水量分布图,将年降水量小于400 mm的地区划分为中国干旱半干旱地区,即降水量小于蒸发量的地区。研究区位于27.27°~49.85°N,73.43°~121.91°E,总面积约4.56×106km2(图1)。区内大部分地区属于温带大陆性气候,降水量稀少,植被覆盖低,沙漠、裸地、盐碱地等广布[18,20]。本文中研究区边界范围划定依据中国科学院资源环境与数据中心的中国生态地理分区数据(https://www.resdc.cn/data.aspx?DATAID=125)。
图1 研究区域示意图Fig.1 Schematic diagram of the study area
1.2 数据及处理
1.2.1 预报数据 本文应用的TIGGE 数据来自于ECMWF(欧洲中心)的ECMWF(欧洲)、JMA(日本)、KMA(韩国)、UKMO(英国)4 种模式的控制预报产品。由于各个机构发布的降水预报时空分辨率不完全统一,因此统一选取世界时(Universal Time Coordinated,UTC)00:00作为预报起点,对应北京时间08:00(UTC+8:00),预报时长统一为168 h(未来1~7 d),空间分辨率为0.5°×0.5°。再考虑到预报数据的缺失情况,时间序列选择了预报数据完整性较好的2015—2017 年。选取的模式基本信息见表1,预报数据可从https://apps.ecmwf.int/datasets/data/tigge/levtype%3Dsfc/type%3Dcf/免费获取。默认数据格式为GRIB2 类型,可用Python 中xarray+cfgrib 库进行查看和处理。
表1 参与评价的预测和实测资料基本信息Tab.1 Basic information of prediction and measured data involved in evaluation
1.2.2 实测数据 实测资料来自国家气象科学数据中心气象资料室建立的中国地面降水日值0.5°×0.5°格点数据集(V2.0)[21]。该数据集主要基于气象资料室存档的全国2474个国家级台站近50 a逐月、逐日降水量资料和利用GTOP030 数据(分辨率为30 m×30 m)重采样生成的中国范围0.5°×0.5°数字高程模型数据DEM,使用局部薄盘光滑样条(Partial thin platesmoothing splines)法进行空间插值而生成。质量评估结果显示,中国东南地区的插值绝对误差普遍高于其他地区,夏季误差明显大于其他季节,当出现大雨和中雨日时,弱化了降水强度,而出现小雨日时,更接近实测降水,资料对青藏高原、天山山脉和塔里木盆地等大地形附近的降水空间特征描述较准确[22-23]。因此,该数据集可以用于代表我国干旱半干旱地区实测降水数据,本文使用到的实测数据基本信息见表1。
1.2.3 数据处理 对比预报数据和实测数据,二者数据时空尺度不同,须将其统一,及对其进行预处理。具体处理方法为:(1)统一空间尺度,将原本网格中心相差0.25°的预报数据和实测数据进行双线性插值处理,再通过掩膜提取得到研究区范围数据;(2)统一时间尺度,预报数据为预报步长为6 h的累计降水量,而实测数据为逐日降水量,且预报数据存在数据缺失的情况,因此先提取出预报数据的预报步长为24 h的逐日降水数据,再根据每种模式数据缺失情况做空对应实测数据的天数,使得二者时间尺度统一。
2 研究方法
在洪水预报中引入定量预报降水是延长洪水预见期的重要手段与方法[24]。且降水1~7 d的日降水预报还可延长水库实时调度以及径流预报的预见期,提高预报要素的可利用性[17]。通过分析不同预报模式在预见期1~7 d 的降水量预报、降水分级预报、降水探测能力和空间预报精度4 个方面的结果差异,以获得在研究区具体雨量级、具体位置的模式适用情况,为后期的降水订正与集成,提升洪水预报精度和预见期提供一定的参考。
参照气象部门划分降水等级标准,将日降水划分为6 个等级(表2)。但由于研究流域大暴雨发生次数较少,所以将大暴雨其归于暴雨等级内,且本文仅仅研究有水的情况,所以无雨不在考虑范围内。对于降水量预报,首先使用网格平均法[15]提前将降水数据处理为研究区的面平均降水,从而检验所选TIGGE 模式在研究区的日降水预报的总体效果[15];然后根据实测降水数据,将其按照降水等级标准分成4类,得到数据位置索引,并以此索引提取预测数据,得到不同降水等级的预报数据,以此检验降水量分级预报能力;最后计算研究区的预报误差来揭示各预报模式的地域性差异。对于降水探测能力,根据列联表选取阈值分别为0.1 mm、10.0 mm、25.0 mm、50.0 mm 的降水数据数量来计算统计指标,以揭示不同模式不同预见期的降水探测能力差异。
表2 降雨等级划分标准Tab.2 Grade of precipitation /(mm·d-1)
2.1 统计指标
本文采用检验降水量预报常用指标来评估降水量预报效果[10]:平均绝对偏差(Bias)、均方根误差(RMSE)、预报偏小率(Sl)、预报偏小误差(Xl)、预报偏大率(Sg)及预报偏大误差(Xg)。其中,Bias 描述预报模式的偏离方向与程度;RMSE 则反映预报序列与实测序列之间的偏差,且不考虑偏差的方向,对较大误差更为敏感;Sl与Xl、Sg与Xg分别反映预报数据相对实测数据的平均偏小和偏大程度[15]。
式中:Ft和Ot分别为第t天的预报降水和实测降水;N为预报天数;Xgt为第t天降水偏大的误差;Xlt为第t天降水偏小的误差。若Ft>Ot则预报偏大,Xgt=Ft-Ot,Ng为N天降水预报中偏大的总天数;反之若Ft<Ot则预报偏小,Xlt=Ft-Ot,Nl为N天降水预报中偏小的总天数[17]。以上各指标均越接近0表示预测值与实测值一致性越好,对应的预报模式效用越好。
2.2 分类指标
在利用连续性指标对降水量及分级预报进行定量评价之余,还需注意到预报模式对降水事件的探测能力的评估也很有必要。本文使用Wilks[25]提出的分类指标方法,通过计算预报数据与实测数据的分类指标,分析4 种预报模式对实际降水事件的探测能力,使用了TS评分(临界成功指数)、POD(命中率)、FAR(误报率)3个指标。其中TS评分综合考虑成功探测和误报降水事件,能反映预报降水实际探测降水能力[26];POD表示在所有实际降水事件中,对应预报降水能探测到的降水事件所占比例;FAR表示在所有预报降水事件中,实际没有降水的比例。TS、POD以及FAR的取值范围均为0~1,其中,TS和POD的数值越大、FAR的数值越小则表明预报效果越好。对降水事件的探测可以分为4种情况(表3),3种指标计算公式如下:
表3 预报降水数据与实际降水数据列联表Tab.3 Contingency table of forecast and actual precipitation data
式中:H为实测数据与预报数据均探测到的降水事件数量;F为实测降水数据没有探测到而预报数据探测到的降水事件数量;M为实测降水数据探测到而预报降水数据没有探测到的降水事件数量。计算不同降水阈值下的分类指标,综合评估不同降水强度下各TIGGE模式对降水事件的探测能力。
3 结果与分析
3.1 日降水量预报能力评价
为了对4种TIGGE模式在整个研究区的适用情况进行整体把握,使用网格平均法[15]提前将多模式降水和实测降水处理成研究区平均降水,采用Bias、RMSE、Sl、Xl、Sg及Xg6个评估指标,结果如图2所示。
由图2 中Bias 随预见期的变化可知,Bias 均呈负偏差,说明各模式对降水量的预报普遍偏小,再结合Sl和Sg随预见期的变化可知,Sl的变化范围为0.65~0.85,Sg的变化范围为0.15~0.35,Sl明显大于Sg,尽管Sl随预见期延长呈下降趋势,而Sg呈上升趋势,说明降水量预报同时存在偏大和偏小现象,但预报值较实测值一致性偏小是引起降水量预报偏差的主要原因。
图2 1~7 d预见期日值降水预报检验结果Fig.2 The verification results of the 1-7 day lead time precipitation forecasts
由各指标随预见期变化趋势可知,各模式的预报误差主要在前3 d 中增加,之后预报误差趋于稳定,无显著变化。且第1 d 的预测效果最佳,其中UKMO 的Bias 接近0。1~3 d 预见期内Bias、RMSE、Xl、Xg的变化范围分别为-0.4~-0.15 mm,0.4~0.9 mm,-0.7~-0.3 mm、0.2~0.6 mm,表示TIGGE 数据对于日降水量的预报效果较好,且精度存在3 d 的衰减期后趋于稳定。
将模式之间进行对比,预见期1 d 时,UKMO 有略微优势,其后是ECMWF 和KMA,JMA 最次;预见期2 d时,ECMWF领先;预见期3 d以后,ECMWF有着明显优势,UKMO 次之,KMA 最差,总而言之,虽然不同指标在前3 d 预见期的对比略有变化,但无论是误差判断指标还是精度指标的判定而言,考虑整个研究区面平均雨量时,ECMWF 和UKMO 在预报日降水量时效果均要更好一些。
3.2 降水分级预报能力评价
对于降水量预报,除了需要整体把握研究区的适用情况外,将预报数据进行降水分级评估也很有必要。以实测降水数据按照表2 分级,再索引对应(同日期、经纬度)网格位置的预报数据生成数据系列,采用平均绝对偏差(Bias)、均方根误差(RMSE)、预报偏小率(Sl)、预报偏小误差(Xl)、预报偏大率(Sg)及预报偏大误差(Xg)6个评估指标,分别计算不同降水强度下预见期1~7 d的精度指标,结果如图3所示。从指标Bias 和RMSE 随1~7 d 预见期及降水量级的变化可知,小雨的Bias 的变化范围在0~-0.7 mm之间,小雨的RMSE的变化范围在3.3~4.3 mm之间,说明各预报模式对小雨的预报能力较高,但随着降水量级的增加,预报能力逐渐下降,暴雨的RMSE变化范围增加到了44~60 mm,例如发生于2016年6月8 日,位于研究区东部(109°~111°E,38°~39.5°N)的这场暴雨,当日实测单格网最大日降水量100.65 mm,对应的4 种TIGGE 模式只有ECMWF 的预见期1~3 d探测到此次暴雨,其他3种TIGGE模式均未探测到此次暴雨,且ECMWF模式出现明显的高估;同一降水量级下,随预见期增长,前2 d是各模式误差的主要增长期,后5 d 预报误差趋于稳定,第1 d 预报效果最好,且前2 d 误差衰减明显。说明在分级预报能力上,TIGGE 对预见期1 d,中小雨预报效果最佳,且存在2 d的误差衰减。
图3 1~7 d预见期降水分级预报评价结果Fig.3 The verification results of the 1-7 day lead time forecasts of different precipitation levels
从预报偏小率(Sl)、预报偏小误差(Xl)、预报偏大率(Sg)及预报偏大误差(Xg)随1~7 d 预见期及降水量级的变化可知,4种模式偏大率均高于偏小率,而偏大误差除小雨略小于偏小误差外,其他均大于偏小误差,这也反映在小雨的偏差都表现为轻微的负偏,其他降水等级都表现为较大的正偏。说明4种模式预报时偏大现象更多,除小雨外更严重。
对比模式之间,可发现只有在小雨时差异性较显著,各模式的Bias变化范围在-0.7~0 mm之间,相差很小,而RMSE显示JMA模式的预报效果最好,且随预见期增加,JMA 的预报效果在第2 d增加后,后3~7 d 呈现回落趋势,其他3 种模式则遵守2 d 衰减期的总体规律。在中、大、暴雨的表现中,4 种模式表现非常接近,由此可得出,4种模式在分级降水预报的表现由好到次为:JMA、ECMWF、UKMO、KMA。
3.3 降水探测能力评价
分类指标可以基于实测格点数据分析预报数据在降水事件上的捕捉能力,本文主要使用了TS评分(临界成功指数)、POD(命中率)、FAR(误报率)3个指标,针对1~7 d 预见期,计算了4 种TIGGE 模式在研究区2015—2017年的日累积降水量,阈值分别为0.1 mm·d-1(小雨)、10 mm·d(中雨)、25 mm·d-1(大雨)、50 mm·d-1(暴雨)下的分类指标,计算结果如图4所示。
图4 1~7 d预见期降水探测能力评价计算结果Fig.4 The scores of the 1-7 day lead time forecasts of precipitation detection capability
由图4 可知,阈值为0.1 mm·d-1的TS评分范围为0.32~0.48,POD的范围为0.5~0.8,FAR的范围为0.35~0.55,说明各预报模式对小雨的探测能力较高,但随阈值的增加,3 个指标计算结果逐渐恶化,POD的减少总是伴随FAR的增加,表明各TIGGE模式的探测能力显著降低,如阈值为50 mm·d-1时TS评分多在0.00~0.06 之间,显示几乎没有技巧;随预见期的延长,各模式对不同阈值降水量的探测能力也逐渐降低,且衰减期以前3 d 为主,第1 d 探测能力最强,前2 d衰减最显著。
将各模式之间进行对比,各模式在大雨时差异性较大,中雨时差异性较小,在暴雨时探测能力太差,不具有比较意义。对于阈值为0.1 mm·d-1时,虽然KMA的POD占优势,但同时其FAR也是最大的,已有研究表明,TIGGE 倾向于多预报小雨[15],会造成命中事件碰巧很多,这也是FAR一开始就很高的原因,无法得出KMA 有更佳的探测能力的结论;对于阈值为25 mm·d-1时,3项指标统一显示,ECMWF明显优于另外3 种模式。整体而言,以不同阈值计算的3 个分类指标中,ECMWF 发挥更稳健,尤其在以25 mm·d-1为阈值时优势明显。
3.4 空间预报精度评价
根据上文检验结果,4 种TIGGE 模式均存在2~3 d的预报能力衰减,在后几日预见期内预报能力趋于稳定。所以以RMSE为精度指标,选择前3 d预见期的TIGGE模式降水数据,与对应格网位置上的实测降水数据进行计算,为便于分析,将格网计算结果进行等值线插值,并统一分辨率层次为1 mm·d-1,且将结果大于6 mm·d-1的区域统一颜色,以颜色深浅及所占据面积和位置可分析在空间上的预报精度,再以研究区内的省级行政地图为底图,得到空间分布图(图5)。同时针对实测降水数据按照时间维求均值,绘制2015—2017年实测降水均值空间分布图(图6)。
图5 1~3 d预见期RMSE(mm·d-1)空间分布Fig.5 The spatial distribution of the 1-3 day lead time forecasts of RMSE(mm·d-1)
图6 2015—2017年实测降水均值空间分布(mm·d-1)Fig.6 The spatial distribution of the 2015-2017 observed precipitation(mm·d-1)
由图5可知,绝大部分区域的RMSE结果小于6 mm·d-1,且小于3 mm·d-1的区域占比达一半甚至更多,说明各模式在研究区的预报精度均较好;整体看来,RMSE呈现明显的空间规律,由西向东先增后减,在80°~100°E,35°~45°N范围表现最佳,在100°~120°E,35°~40°N范围则表现较差,说明各模式在研究区表现最好和最差的区域呈现出一定的一致性,结合图5、图6 可看出,RMSE 高值区域位于新疆伊犁河谷以及研究区东部,同时这2 个地区的实测降水量也较高,二者呈现相似的空间分布特征,分析可能原因是丰富的降水量使得预报精度下降,也就是说,降水越频繁的地区,预报精度越低;1 d预见期表现最好,第2 d、3 d 则逐渐下降,说明各模式仍显示出随预见期的增加,预报精度减弱的现象,且前2 d是主要衰减期。
对比各模式之间,预见期为1 d 时,ECMWF 有着明显的优势,其精度指标在1 mm·d-1和2 mm·d-1以下均占比最多,其后为UKMO,相比起JMA,UKMO 主要优势在于其2 mm·d-1以下面积占比更大,最后是KMA;2 d和3 d预见期时,ECMWF仍表现出稳定的优势,除KMA 较差,另外2 种模式差异不明显,但就表现较差的面积占比来说,UKMO更多。整体而言,4种模式中ECMWF 表现更稳健,KMA 则表现较差,在不同预见期上,JMA 和UKMO 差异不大,不过具体应用时,还是要考虑具体研究区,将经纬度分辨率增加,再作进一步评估。
4 结论
以中国干旱半干旱地区为研究对象,对TIGGE数 据 中 心 的ECMWF、JMA、KMA 和UKMO 模 式2015—2017年日降水数据进行了精度检验,采用多种指标分别从降水量预报、降水分级预报、降水探测能力和空间预报精度4个方面综合分析了各式预报产品在研究区的适用性。得出如下结论:
(1)对于1~7 d 预见期内平均日降水量和不同降水量级日降水量,TIGGE 4 个模式均有较强的预报能力,且有较好的预报时效性。对于日降水量级预报,4 种模式对小雨预报能力较好,其RMSE 均小于4.30 mm,而对暴雨及以上量级降水预报效果较差,其最佳的预见期1 d的RMSE也达到了44.00 mm以上;4种模式在小雨时表现为轻微的预报偏小,在其他降水量级误差来源主要是预报偏大;对比各个模式对降水量的预报效果,进行10 mm 以下的降水预报时,JMA 最优,而对于10 mm 以上的降水预报,四者无明显差别。对于日降水量预报,KMA模式对日降水量的预报效果最差,而ECMWF 模式则最精确,整体而言,这4 种模式预报时偏小现象更多,但偏大和偏小程度则差不多。
(2)在不同降水阈值下,各模式均表现出一定的降水捕捉能力,整体而言,ECMWF 更具优势,尤其在以25 mm·d-1为阈值时优势明显。空间预报精度检验结果显示,各模式在80°~100°E,35°~45°N范围表现最佳,主要是新疆中部以及新疆、甘肃和青海三省交界处,在100°~120°E,35°~40°N 范围则表现较差;对比各模式之间,ECMWF 仍表现更稳健,KMA则表现较差。
(3)4 种TIGGE 模式也表现出一些统一的特点:随预见期的延长,在降水量预报、降水量分级预报、降水探测能力以及空间预报精度4 个方面都有着2~3 d 的衰减期,第1~2 d 的衰减幅度最大;随降水量级的增加,精度指标和分级指标也表现出衰减现象。
(4)本文对TIGGE降水预报的检验是在中国干旱半干旱地区的首次适用,此次检验有助于进一步改进研究区中期降水预报结果。针对以上误差分析对TIGGE降水资料进行订正以及集成,可提高各预报要素的可利用性。针对小雨降水量级预报偏小,其他降水量级偏大,而日降水量偏小,可以选取1个阈值,阈值以下预报值适当增大,阈值以上预报值适当减小来同时改善降水量及和降水量的预报结果;前3 d衰减期内的预报结果相差较大,要分别考虑修正系数,3 d 后可以用第3 d 的修正系数进行数据修正;对于预报结果较好的ECMWF、JMA 等模式可以在后期分配较高权重进行多模式数据集成;空间预报精度则可以作为研究区选择预报模式的基础,在此基础进行评价、订正与集成;另外,夏季降水占据了研究区全年降水的主要成分,本文的评价结果更适用于夏季,如果对另外的季节有应用需求,可选择对应季节数据参照本文评价模式进行评价,获取更有针对性的评价结果。