ECMWF降雨预报信息不同利用形式精度评估

2020-07-24王运涛周惠成

中国农村水利水电 2020年7期

唐榕，王运涛，李敏，周惠成

(大连理工大学水利工程学院，辽宁大连 116024)

0 引言

降雨预报信息已逐渐成为水文预报或水库预报调度的重要输入，其精度影响着径流预报的准确性和水库调度的合理性[1, 2]。近年来，随着预报技术的逐步发展，越来越多的预报中心提供了预报时效较长的降雨预报产品，比如欧洲中期天气预报中心(ECMWF)发布未来15 d的降雨预报信息、中国气象局(CMA)发布未来10 d的降雨预报信息等[2]。这些预报中心虽提供预见期较长的预报信息，但预见期增长预报精度随之降低，能否用于水文预报或水库调度还有待评估[3]。因此，在选取利用降雨预报信息前，需先对其精度进行评估，以更好地加以利用[4]。

当前，降雨预报产品的精度评估主要集中在不同预报中心的预报成果的比较上或同一预报中心不同成员预报成果的对比上[5-7]。这些精度评估考虑的是不同预报机构的预报结果和预报技巧有所不同，或同一预报机构不同预报成员针对特定流域的天气状况预报能力不同[6, 8]。然而，预报信息的精度不仅与预报机构等有关，还可能与预报信息的数据提取利用形式有关。以ECMWF集合降雨预报信息为例，ECMWF提供的预见期为n日的降雨预报值是未来n日累计预报降雨量，反映的是未来n日降雨总量的预报效果[4]，而有时水文预报或调度中关注的并非只有降雨总量，还有据预见期为n日的预报值与预见期为(n-1)日预报值的差值而确定的逐日降雨量[1]。累计降雨预报值和逐日降雨预报值两者数据来源虽同，但利用形式却有所差异，精度有所不同，在水文应用中选用何种形式根据需求并结合预报精度综合选择。

为了分析累计降雨预报值和逐日降雨预报值精度的差异，本文针对尼尔基水库以上控制流域，以应用较多、模式分辨率最高的ECMWF的集合降雨预报数据为基础，统计计算未来1～10 d流域面雨量的累计降雨预报值和逐日降雨预报值，并与实测面雨量作对比，应用总体误差评估指标及分级误差指标这两类指标评估两种利用方式下的降雨预报值的精度，分析不同预见期下的可利用性，为今后预报信息的取用方式提供指导。

1 研究区域与数据

尼尔基水库位于嫩江干流中部，是干流上唯一一座具有多年调节性能的大型综合利用水利枢纽工程，其控制流域面积达6.64 万km2，占嫩江流域面积的22.9%[9]，具体见图1。该流域位于北温带大陆性季风气候区，春季历时短、干燥多风、蒸发量大，夏季炎热多雨，秋季历时短降温急骤，冬季历时长、寒冷干燥[10]。流域内多年日平均气温为-3～3 ℃，最低气温一般出现在1月份，最高气温一般出现在8月份[11]。流域多年平均降雨量为400～500 mm，受太平洋季风影响，年内降水分配极不均匀，夏季的时候太平洋季风把暖湿气团输送到北方，暖湿气团与北方冷空气交汇，形成大面积降雨。因此降水主要集中在夏季，占年降水总量的70%～80%，容易发生洪涝灾害[12]；冬天降水极少，仅占年降水量的5%以下[10]。

图1 尼尔基水库上游流域

本文实测降水数据取自于中国地面降水日值0.5°×0.5°格点数据集(V2.0)中的数据，该数据集涵盖整个中国大陆范围、数据时间系列较完整，包含1961年至今的逐日降水格点数据。该数据集经薄盘样条法对2 474 个高质量的国家级台站降水资料插值而来，所采用的台站密度高、且在研制过程中考虑了地形影响，分辨率较高，为精确描述中国区域降水变化提供数据支持。赵煜飞等人[13]、国家气象信息中心评估报告[14]等已对其适用性进行了评估，发现格点化降水数据可以较好地描述一定范围内面雨量。本文将研究区域(122.5°E ～127°E、48.5°N ～51.5°N)内控制格点(见图1中小黑点)上2007-2013年6-9月中的逐日降雨数据提取出来，通过各格点数据加权求和得到该流域相应时段逐日实测面雨量值，经计算多日面雨量均值为3.24 mm。其中各格点降雨值的权重按以下步骤确定：假设各格点控制面积均等，以格点为中心作0.5°边长的正方形，与研究流域重叠的部分作为该格点的有效贡献部分，将其相应面积占研究流域面积的比例作为各格点的权重。

至于降雨预报数据，考虑到当前降雨预报产品众多，单是交互式全球大集合系统TIGGE就归档了澳大利亚气象局(BOM)、中国气象局(CMA)、加拿大气象中心(CMC)、巴西气象中心(CPTEC)、加拿大环境及气候变化部(ECCC)、欧洲中期天气预报中心(ECMWF)、日本气象局(JMA)、韩国气象局(KMA)、法国气象局(MeteoFrance)、美国气象局(NCEP)及英国气象局(UKMO)这11个预报中心的集合降雨预报产品，其中ECMWF的降雨预报产品数据在诸多研究中表现良好[2, 5, 15, 16]，本文选其作为降雨预报数据来源。ECMWF可提供自2006年10月开始至今预报时效达15 d的降雨预报数据，本文选取预见期为1～10 d的0.5°×0.5°格点预报降雨数据进行研究。针对图1所示的研究流域，提取流域内各控制格点51个预报值数据，每个格点最终预报值采用集合降雨预报均值，并通过各格点数据加权求和得到该研究流域相应预见期的累计预报面雨量值，并通过累计预报值与前一天累计预报值的差值计算逐日降雨预报值，其中各格点权重与降雨格点一样。

2 研究方法

利用降雨预报信息的误差统计特征值来检验预报信息的可靠性是比较常用的降雨预报信息精度评估方式。首先，利用三个总体误差评估指标对其精度进行评估，具体步骤如下：①以尼尔基水库上游逐日实测面降雨值为基准，获取1～10 d累计实测面雨量值序列和第1～10 d实测面雨量值序列，并分别计算各序列均值；②获取相应的1～10 d累计面雨量预报值序列和第1～10 d面雨量预报值序列，分别计算各序列均值；③采用相关系数R、相对误差RE及均方根误差RMSE这3个指标[指标计算式见下文式(1)～式(3)]来实现按累计方式利用的1～10 d累计面雨量预报值和按逐日方式利用的第1～10 d逐日面雨量预报值的总体评估。其次，降雨预报信息的利用还需考虑降雨预报量级与实际量级分匹配程度，本文在降雨量级分级的基础上，利用两个分级误差统计值——错一级可利用率RU和安全范围内的可利用率RS，进一步评估两种利用方式下的预报数据的精度。

2.1 总体误差评估指标

相关系数R能够反映预报值与实测值间的相关性程度，表征预报值序列与实测值序列整体变化趋势的一致性程度；R越大，预报值数据序列与实测值序列变化越一致。相关系数R的计算公式为：

(1)

相对误差RE可以反映预报值与实测值间的偏差程度，是一个无量纲的量。RE为正值说明预报值预报偏大，为负说明预报值整体预报偏小；一般将-20%

(2)

均方根误差RMSE能够用来衡量预报值与实测值之间的误差量，单位为mm，体现的是预报值序列与实测值序列之间的靠近程度，反映预报产品的精度[17]。RMSE值越小说明预报值与实测值越靠近，预报值越准。均方根误差RMSE的计算公式为：

(3)

2.2 分级误差评估指标

在过去降雨预报信息精度评估中，通常认为当预报信息级别等于实际发生的降雨量级或者相差一级认为“预报可利用”[18]，为此，将各级预报下预报量级与实际发生的降雨量级相匹配或与实际量级相差一级的个数与各级预报总个数之比作为错一级可利用率RU。此外，考虑到本文降雨预报信息用于兴利水库中时，如果某一预报量级的数值过于偏大，相对而言对兴利调度可能不利，所以这里以低一级的阈值中间值为安全范围的下限值，将某量级预报下满足错一级可用条件且满足实际降雨不低于下限值的个数与当前预报级别下预报总个数之比作为安全范围内的可利用率RS[19]。

在降雨分级上，预见期为1 d的分级本应按照气象部门分多级标准进行划分，不过考虑到研究流域为东北地区，降雨相对较少，且面雨量一定程度均化了雨量，≥50 mm的暴雨及以上量级的降雨次数极少，直接将大雨以上(≥25 mm)的降雨作为一级进行评估，故预见期为1 d的预报降雨分级如表1所示。其他预见期的降雨阈值及下限值也列于表1。

表1 降雨预报量级范围及安全范围下限取值 mm

3 结果与分析

针对下载处理得到的未来1～10 d累计降雨量，运用评价指标进行评估，并在1～10 d累计降雨量的基础上得到第1～10 d逐日预报降雨量，同样进行评估(逐日降雨量分级时均按1 d预见期的分级进行评估)。表2为1～10 d预报降雨量均方根误差RMSE评估结果，由该表可知，1～10 d累计预报降雨量及1～10 d逐日预报降雨量与实测降雨量之间的RMSE均随着预见期的增长而增大，符合预报误差随着预见期增长而逐步增大的趋势。结合图2和图3中R和RE的评估结果可知：

图2 相关系数评估结果

图3 相对误差评估结果

表2 均方根误差评估结果 mm

(1)1～10 d累计预报降雨量与实测降雨量间相关系数在0.69～0.83之间，属于较高相关，预报值序列能较好地预估实测值序列的变化趋势；相对误差RE均为正值，整体呈现逐步增大的趋势，不过均在20%的允许误差范围内，说明按累计方式利用时，预见期从1～10 d时累计预报雨量整体偏大，但误差均在允许范围内；从总体评估指标看1～10 d累计预报降雨量精度满足要求。

(2)1～10 d逐日预报降雨量与相应实测降雨量之间在预见期为5 d内相关系数R大于0.6或约等于0.6，在6 d后明显低于0.6，即预见期在1～5 d时逐日预报降雨能预测降雨的变化趋势而6～10 d趋势预估较差；相对误差RE在预见期为7 d内均小于20%的允许范围，而在8～10 d的预见期时超过允许误差范围；从总体指标上看，预见期在5 d内精度满足要求，而预见期继续增长，预报值与实测值的相关性相对较差，预报误差相对较大。

此外，从错一级可利用率RU的评估结果(见图4)可以看出：①预报量级为Ⅰ级、Ⅱ级、Ⅲ级时，1～10 d累计预报降雨量和1～10 d逐日预报降雨量的RU均达到97%以上，错一级可利用率非常高；②降雨预报量级为Ⅳ级时，无论是1～10 d累计预报降雨量还是1～10 d逐日预报降雨量的可利用率RU均有降低，主要是因为存在预报Ⅳ而实际降雨为II级的情况，即存在预报过于偏大的情况。不过1～10 d累计预报降雨量在预见期6 d内均达到80%及以上，预见期继续增长，可利用率保持在60%以上；1～10 d逐日预报降雨量在预见期为5 d时错一级可利用率RU在80%左右，预见期继续增加，不存在该级预报降雨，说明按逐日方式利用预报信息时，当预见期为6～10 d时，无法预测出Ⅳ级的实测降雨，难以在兴利调度中充分发挥大雨以上量级降雨所能带来的效益。

图4 错一级可利用率RU评估结果

依据图5安全范围内的可利用率RS，可以看出：①预报量级为I级、II级时，1～10 d累计预报降雨量和1～10 d逐日预报降雨量RS均达到90%以上，安全范围内可利用率较高；②预报量级为Ⅲ级时1～10 d累计预报降雨量可利用率仍较高，而1～10 d逐日明显降低，预见期大于6 d时可利用率已低于60%；③预报降雨为Ⅳ级时，1～10 d累计预报降雨量和1～10 d逐日预报降雨量的全范围内的可利用率RS均降低，不过1～10 d累计预报降雨量在预见期6 d内基本达到70%以上，预见期继续增长，可利用率降低，低于50%；1～10 d逐日预报降雨量仅在预见期为5 d内存在Ⅳ级预报降雨，RS在40%～80%之间，预见期更长，不存在Ⅳ预报降雨。③结合RS的结果可知1～10 d累计预报降雨量的预报误差主要来源于Ⅳ级降雨预报，而1～10 d逐日预报降雨量预报误差的主要来源为Ⅲ级预报和Ⅳ级预报。

图5 安全范围内的可利用率RS评估结果

综合几个总体评估指标及两组分级评估指标可以得出：按累计方式使用预报信息，虽然Ⅳ级预报存在一定误差，但预见期1～10 d的整体预报精度均较高，可用于水文预报或水库预报调度中；按逐日方式利用预报信息时，预见期在5 d内精度基本满足要求，可以使用，预见期在5 d以上时，Ⅲ级、Ⅳ级预报误差较大，可利用率相对较低，逐日预报量精度有可能难以满足水文预报或水库预报调度的要求。在利用降雨预报信息时，需结合具体预见期、预报效果等选择合适的利用形式。

4 结语

本文以尼尔基水库上游控制流域为研究区域，评估了ECMWF集合降雨预报信息按累计和逐日两种利用形式下1～10 d不同预见期的预报降雨精度，对比分析了各自的可利用性。研究结果表明：应用ECMWF集合降雨预报产品得时，按累计方式使用的1～10 d累计降雨量，与相应实际降雨相关性程度均较高，预报值较实测值偏大，预报误差随预见期增长而增大，不过相对误差均在允许误差范围，降雨量预报Ⅰ级～Ⅲ级的可利用率均较高，Ⅳ级预报利用率稍有降低，整体精度满足要求，1～10 d预见期累计预报降雨量的均适宜用于水文预报或水库预报调度中；按逐日方式使用的未来第1～10 d逐日预报降雨量，预见期在5 d内精度基本满足要求，可以使用，而预见期在6～10 d时逐日预报降雨量与实际值相关性变差，预报偏差较大，虽I级、II级预报信息可利用率较高，但Ⅲ级、Ⅳ级可利用率相对较低，不推荐用于水文预报或水库预报调度中。