华南区域高分辨率数值模式前汛期预报初步评估

2021-12-10林晓霞冯业荣陈子通简云韬

热带气象学报 2021年4期

林晓霞，冯业荣，陈子通，简云韬

(1. 中国气象局广州热带海洋气象研究所/广东省区域数值天气预报重点实验室，广东广州510641；2. 香港城市大学能源与环境学院/佳达亚太气候研究中心，中国香港)

1 引言

GRAPES(Global and Regional Assimilation and PrEdiction System)模式是在国家科技部和中国气象局共同支持下我国自主研发的新一代全球/区域通用数值天气预报系统，近年来得益于该模式的大力发展和改进，填补了我国数值天气预报领域的多项技术空白[1-4]。对台风、暴雨、大雪等实时应用结果表明GRAPES 模式对中尺度系统有较好的预报表现[5-9]。 GRAPES_GZ_R 1 km(GRAPES Guangzhou Regional Modeling System)华南短临预报模式是中国气象局广州热带海洋气象研究所区域数值天气预报重点实验室基于现有的中尺度华南模式(GRAPES_GZ 3 km)，结合局地资料同化、模式动力过程和模式物理方案多年研究成果，逐渐形成具有区域特色的公里尺度区域模式，该模式具有三维参考大气动力框架，结合了高分辨率华南区域地形数据集以及雷达资料云分析技术等具有华南区域特色的模式技术方案，建立了稳定、合理、准确的业务模式预报系统，为广东省气象部门短时数值智能网格预报业务提供强有力的支撑。但是目前针对该模式产品性能的客观检验较少，对超高分辨率的短临模式目前仍没有合理的评估方法，模式对降水及其他要素的预报能力究竟如何，其预报产品能否为预报员提供一定的应用和指导价值仍需要分析探索。

近年来，针对国内外中尺度模式降水模拟的评估工作已有不少，潘留杰等[10]利用日本高分辨率模式产品，结合泰勒图等多种技巧评分，对不同预报时效降水预报产品进行评估，发现模式对我国东部沿海降水具有一定模拟能力。此外，潘留杰等[11]还利用邻域法(Fractions Skill Score)[12]和ETS(Equitable Threat Score)评分指数对欧洲数值天气预报中心(ECMWF)，日本以及我国T639模式降水产品在夏季不同空间尺度的预报能力进行评分，发现不同模式对应的最佳空间尺度各有不同，但ECMWF 模式在系统和整体降水模拟上最好，且各家模式在7 月的预报表现最好。曹越等[13]利用标准差和期望重新定义一个R指数并应用于ECMWF 高分辨率模式(ECMWF-Hi)和ECMWF集合预报(ECMWF-EPS)产品中，评估表明尽管ECMWF-Hi 在降水预报准确度上没有更优于ECMWF-EPS，但在预报离散度上存在优势，尤其是在极端降水的量级上。另外一些研究[14-16]同样表明高分辨率模式在暴雨预报上存在较好的模拟能力。对于GRAPES 模式的评估，也有一些研究针对不同的区域以及不同分辨率版本进行分析。结合热力和动力检验，彭新东等[17]对GRAPES 模式在2008年华南地区的两次夏季暴雨过程进行数值预报检验，评估模式对降水的总体刻画准确，但对局部降水的空间分布细节等仍存在一定不足。许晨璐等[18]基于 GRAPES-Meso4.0_10 km 和GRAPES-Meso4.0_3 km 两个模式，对比我国东南地区夏季定量降水预报，评估发现GRAPESMeso4.0_3 km模式在日平均降水量和强降水过程相比GRAPES-Meso4.0_10 km 模式有一定提高，但在空间相关系数和弱降水过程频率表现仍存在较大不确定性。

本文以GRAPES_GZ_R 1 km 模式(下文简称“1 km 模式”)预报结果为评估对象，采用传统点对点评估方法、空间检验方法以及统计分析等手段，对GRAPES_GZ_R 1 km 模式预报的降水、温度和风场等要素进行评估。研究时段为2019 年6 月5日—7 月14 日，期间广东省持续性暴雨多发，又恰逢龙舟竞渡高峰期，其中6月9—14日、22—25日、7月9—11日等广东全省多次出现大范围大雨到暴雨局部大暴雨的降水过程，能够代表模式在不同天气过程下的预报表现，同时与GRAPES_GZ 3 km模式(下文简称“3 km 模式”)的预报评估结果对比，以期通过对该模式预报结果的检验，分析不同分辨率中尺度模式的预报水平。

2 资料方法

2.1 模式设置和资料说明

本文使用的1 km模式是基于GRAPES区域模式[2]开发的版本。该模式是一个非静力经纬网格模式，时间差分格式为半隐式半拉格朗日方案，水平网格为ARAKAWA-C 网格，垂直方向采用Charney-Philips分层设计，垂直坐标为高度地形追随坐标。目前3 km模式和1 km模式使用的物理方案包括：WSM6云微物理参数化方案、RRTMG长短波辐射方案、MRF 边界层方案和SLAB 陆面方案。由于1 km 模式分辨率较高，所以关闭对流参数化方案，3 km模式则采用NSAS对流参数化方案。模式侧边界通过Davies松弛边界条件来处理[19]。

在本文的回算试验中3 km 模式使用0.125 °分辨率的ECMWF(European Centre for Medium-Range Weather Forecast)分析场和预报场提供初始场和边界条件，模式分辨率为0.03 °，起始经纬度为93.04 °E，16 °N，水平网格数为566×459，垂直层数为65 层，模式顶高度为30 km。而1 km 模式的初、边界条件由3 km 模式的预报场提供，模式分辨率为0.01 °，起始经纬度为107 °E，18 °N，水平格点数为1 201×901，垂直层数为65 层，模式顶高度为60 km。

模式资料选取 2019 年 6 月 5 日 —7 月 14 日 1 km 模式和3 km 模式的预报场，模式每天00 时、12时启动，向前积分24 h。观测资料来自中国气象局预报业务平台MICAPS 提供的华南地区逐小时观测实况。

2.2 检验方法

2.2.1 经典评分方法

传统的降水检验通常是基于观测和预报按分类后列出的频数表统计结果来计算各统计量，该表成为二分类列联表(表1)，相应公式(1)～(3)如下，式中NA 为预报命中频次，NB 为漏报频次，NC为误报频次，ND 为命中“否”频次。原始观测资料为自动站逐时降水站点资料，为了方便评估，采用邻近点插值法将模式数据插值到对应的站点上，形成模式站点预报场，对站点进行逐一评分。

表1 降水的检验分类

2.2.2 分数技巧评分方法

传统预报检验具有一定的参考意义，但是随着模式分辨率的提高，微小的位置变化和形态改变都会对评分的结果造成很大的影响。分数预报技巧FSS(Fraction Skill Score)是属于模糊检验法中的一种，通过对比预报和观测相应邻域内的特征差异，是“面对面”的检验，衡量空间场的相似性[12]。通过计算给定范围的窗区中心格点的概率值，即某一物理量超过给定阈值q的格点数占窗区总格点数的比值，将实况场和预报场转化为概率分布场，通过式(4)计算给定邻域半径和阈值的FSS评分。

式中M(i,j)为窗区内预报概率值，O(i,j)为窗区内观测概率值，Nx和Ny分别表示评分区域内x方向和y方向窗口的数量。与TS 评分不同，计算过程中将原始站点数据插值到与相应模式分辨率相匹配的网格上进行计算。FSS分值为0～1，其中0表示预报和观测完全不匹配，1 表示完美匹配。同时，类似确定性预报形势场指标(ACC)，FSS 也存在如ACC大于0.6即可表示预报效果可用的标准，本文简单定义对于不同给定降水阈值下，FSS 大于0.5的空间尺度即为具有预报技巧的最低尺度大小。预报技巧尺度是衡量预报对于所检验的对象在空间位置上的把握能力，预报技巧尺度越小，表示预报结果相对于实况位移偏差越小，在较小的窗区尺度就能体现出有用的预报信息；反之则表示预报误差越大。

3 降水评估

3.1 整体预报效果评估

图1 是 2019 年 6 月 5 日 —7 月 14 日 1 km 模式预报与观测的广东省日平均雨量序列，本文为了对比不同起报时刻的预报效果，将不同起报时间的预报结果放在一起分析。从广东省日平均降水上看，1 km 模式在该时段内预报的降水演变趋势和量级都与实况整体相符，尤其几次广东省较强降水过程，模式均有很好体现，说明1 km 模式对广东地区降水具有较好的模拟能力，预报结果稳定可信。此外，从降水的空间分布上来看(图2)，1 km 模式的两个起报时次模拟的降水分布都与实况大体相近，但00时的预报结果更优，尤其是在珠三角到粤东北一带。降水误差集中分布在珠三角北部至粤东北一带，12 时的误差范围和量级均大于00 时的预报结果，模式在12 时起报结果中可能存在较多虚假降水和模拟降水量级偏强等问题，与图1 反映的结果相对应。对比不同模式预报结果，不管是00 时还是12 时起报，1 km 模式的预报效果均优于3 km 模式。3 km 模式的预报在肇庆、云浮一带存在明显的偏差，而1 km 模式则更接近实况，在珠三角到粤东北的误差量级也明显比3 km 模式小，3 km 模式预报存在大范围明显的过度预报或漏报的情况。

图1 GRAPES_GZ_R 1 km模式预报与实况的广东全省日平均雨量序列

Taylor等[20]针对多统计量的集成问题，设计了Taylor分析，泰勒图能有效将多个统计量在同一个二维平面展示出来，更直观反映模式评估结果。图 3a、图 3b 是 1 km 模式和 3 km 模式不同起报时次的24 h 预报降水泰勒图，可看出在空间相关系数上1 km模式总体表现与3 km模式十分接近，均为0.5 左右。而通过对比观测和模式的标准差比值(预报场到原点距离)以及对应均方根误差(预报场到Ref 的距离)，发现两个模式在降水量级上仍有一定的不确定性，相比之下1 km 在量级的预报能力上有一定改进。00 时起报1 km 模式标准差比值为0.99，总体模拟与观测十分接近，而3 km的标准差比值为1.23，存在明显的过度预报。12 时情况与00 时类似，1 km 模式和3 km 模式的预报在空间形态上总体接近，但1 km 模式在量级模拟上表现略优，不过两个模式的表现都较00 时有所下降。这里结合之前分析(图2)，我们考虑1 km模式在量级预报上有优势，但降水的空间分布上没有较明显的改进，这一问题在之前研究也类似指出[21]，至于其原因是否与分辨率有关，还有待进一步研究。在这里，所给出泰勒图的计算结果均为研究时段内的平均态，文中其余泰勒图也是如此。

图2 00时实况日平均降水(a)、12时实况日平均降水(b)、00时起报(c~f)和12时起报(g~i)的GRAPES_GZ_R 1 km模式(c、d、g、h)和GRAPES_GZ 3 km模式(e、f、i、j)不同预报时效的过程累积日平均降水和偏差分布

图3 GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式00时起报(a、c)和12时起报(b、d)的24 h降水预报泰勒图(a、b)和2 m气温预报泰勒图(c、d)

3.2 点对点评分整体评估

以插值后的模式站点预报数据为基础，采用传统的二分类时间检验方法，利用同时段的站点观测资料对1 km 模式和3 km 模式的降水预报进行整体评估。从广东全省日平均雨量和两个模式的晴雨准确率(图4a～4b)可看到，研究时段内1 km模式的晴雨准确率均明显优于3 km模式，平均达0.8 以上，而3 km 模式评分结果维持在0.5 左右，同时也可看出不同日期的预报能力，对于较大降水的日期晴雨准确率更高。图4c、图4d 给出1 km 模式和3 km 模式24 h 预报的不同降水量级的TS 评分结果，对于不同起报时次和降水阈值，1 km 模式的结果都明显优于3 km 模式，其TS 评分是3 km 模式的两倍以上，随着降水阈值的增大差异更加明显，说明1 km 模式对强降水预报的表现能力优于3 km模式。

沟通和合作能力培养有待进一步加强班级授课形式注重讲授，学生之间、学生与教师之间沟通交流机会少。模式化的教学实践难以适应学生个体差异性，学生之间的团队合作意识和沟通意愿不足；难以适应创新型国家建设对劳动者团队精神、协作意识等创新能力的要求。

预报偏差评分结果(图4e～4h)上看，0.1 mm预报1 km 模式评分结果多数集中或等于1，说明模式预报与观测较相符，空、漏报较少，仅有个别时段存在过度预报的情况(BIAS>1)，相比之下3 km 模式预报明显偏弱(BIAS<1)，存在较多的漏报。对于5 mm 预报，两个模式都存在一定程度上的空、漏报，不同起报时次的评分变化趋势不一样，间接反映了模式不同起报时间的预报对降水过程的刻画是有区别的。

图4 2019年6月5日—7月14日GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式不同起报时次预报晴雨准确率时间序列及实况24 h累积降水(a～b)、24 h累积降水平均TS评分(c～d)、BIAS评分(e～h)

综上所述在传统评分方法严格遵守点对点的情况下，两个模式的TS 评分均能超过0.1，尤其是1 km模式对于25 mm以上降水评分平均大于0.2，说明该模式对于强降水过程具有较好的预报能力。对比之下，1 km 模式预报能力强于3 km 模式，这与模式对于降水的位置和强度的预报偏差有关。

对于高分辨率中尺度模式，业务上也更加关心模式的短临预报效果。图5是1 km 模式不同起报时次前6 h TS 评分结果，从逐小时的评分变化上可看到模式起报的前3 h 预报评分最高，3 h 后评分明显下降，这与模式初值场加入云分析有关，云分析能够有效缓解模式需要运行几个小时才能成云致雨的过程，缩短了模式“spin-up”时间。同时也可看出1 km 模式对5 mm 以上的降水评分明显偏低，起报3 h 后TS 评分小于0.1，预报偏差也明显大于其他降水量级。对比不同起报时次，00时起报的评分要优于12 时起报，这一结果在前文分析中也多次体现，其原因可能是夜间起报(12时)模式初值场对华南地区海陆热力性质差异刻画不到位有关。本文主要针对预报结果进行检验评估，对于结果差异的原因暂未做深入分析。

图5 GRAPES_GZ_R 1 km模式前6 h预报00时起报(a、c)和12时起报(b、d)的逐时降水TS评分(a、b)和BIAS评分(c、d)

3.3 FSS评估

传统检验手段严格遵守点对点规则，往往会漏掉预报中一些积极的对预报员有价值的空间信息特征。随着数值模式空间分辨率的提高以及探测手段的丰富，天气系统的中小尺度越来越受到关注，较之大尺度而言，中小尺度系统局地性强，分布不规则等特点。从前文分析中可看出，传统检验评分结果上看，1 km 模式普遍优于3 km 模式，但是多统计量集成图体现出来1 km 模式对研究时段内雨带的整体分布上却没有明显的优势，这可能和统计变量计算过程中遵循点对点原则有关。FSS 通过给定不同阈值，改变窗区(邻域)的大小，评估模式预报和实况在邻域内的发生概率差异来评估模式的预报能力，当模式预报结果相对于观测存在可接受的位置偏差时仍能给出有价值的评分结果。

本文采用空间邻域法对1 km 模式和3 km 模式降水预报结果进一步评估，图6 给出两个模式6 h 累计降水FSS 评分在不同的邻域空间尺度以及降水阈值下的结果。可以看出随着降水阈值的增加，两个模式6 h 预报累积降水的FSS 评分均呈现下降趋势。对同一模式而言，00 时起报的评分均高于 12 时，24 h 评分结果与 6 h 类似(图略)。相比之下，两个模式在选择相同降水阈值和邻域范围时，各起报时次1 km 模式FSS 评分结果都明显优3 km模式。

图6 GRAPES_GZ_R 1 km模式(a、c)和GRAPES_GZ 3 km模式(b、d)00时(a、b)和12时(c、d)起报的不同阈值、不同邻域半径下6 h累积降水FSS评分热力图

随着邻域空间尺度的增加，同一降水阈值上预报和观测降水发生的概率差异在逐渐减小，降水预报向着较高技巧发展。其中对于0.1 mm、1 mm 及 5 mm 以上的降水，1 km 模式均可在较小的空间尺度上(15 km)呈现较高的预报技巧(FSS≥0.5)，远小于3 km的预报技巧尺度(＞35 km)，说明1 km模式对所检验降水对象的空间位置把握能力更强，可在较小的预报技巧尺度下表现出较好的降水预报能力。随着降水阈值的增大(＞25 mm)，可用的预报技巧尺度有所增加，FSS 评分较低，未能达到具有可用预报技巧尺度的要求，需要用更大的空间尺度才能捕捉到对应量级的降水信息。

4 2 m温度和1100 m风速评估

4.1 预报整体评估

图7给出了1 km模式回算试验在模式区域2 m气温和10 m 风场预报偏差(BIAS)和均方根误差(RMSE)随时效的变化，可看到1 km 模式对2 m 气温的预报整体偏低1～2 ℃。00 时起报对2 m 气温的预报效果优于12 时，尤其在前6 h 预报，体现了模式在不同起报时间的预报对于要素预报的刻画是有区别的，环境场的差异对降水预报结果有直接影响，一定程度上解释了前文对于不同起报时效模式降水预报结果的差异。风场预报上，不同起报时效无明显差异，一致表现为风场预报过强。

图7 GRAPES_GZ_R 1 km模式2 m气温(a、c)和10 m风速(b、d)预报平均偏差(预报减去观测)(a、b)和均方根误差(c、d)

对比两个模式的预报结果(图8)，1 km 模式和3 km 模式对于研究时段内广东省从粤北到沿海日平均温度逐渐升高的总体趋势均把握良好。从预报分布上看，粤北地区温度预报普遍偏低，模式对珠三角地区的高温区没有体现出来，预报结果较观测偏低。对比两个模式的情况，1 km 模式对珠三角的温度大值区预报表现优于3 km 模式，对温度场的局部分布特征把握略优，1 km 模式预报偏差的绝对值基本维持在1 ℃左右。从温度泰勒图(图3c～3d)上也可看出，无论是00 时还是12时，两个模式都能较好地模拟出温度的空间分布，总体的空间相关系数均超过0.6，而1 km模式在量级模拟上依然存在一定优势，温度的总体偏差较3 km模式小。

图8 2019年6月5日—7月14日观测(第一列)、GRAPES_GZ_R 1 km模式预报(第二列)和GRAPES_GZ 3 km模式预报(第三列)的日平均2 m气温(第一行)和10 m风速(第二行)的分布

风场的预报上可看出1 km 模式和 3 km 模式在风场模拟上均存在较大偏差，1 km 模式和3 km模式10 m 风速的预报均表现为正偏差(图9)，但 3 km 模式对10 m 风速的预报偏差更小，基本在1 m/s附近波动，1 km模式预报偏差则大多介于1 ~2 m/s 之间，在部分时间段甚至超过了3 m/s。均方根误差(图9d)的评估结果与偏差一致，3 km 模式的10 m风预报的均方根误差更小。与2 m气温的预报结果不同，3 km 模式对风速的预测要明显优于1 km 模式，表现为较小的绝对误差以及均方根误差。

图9 GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式2 m气温(第一列)和10 m风速(第二列)预报平均偏差(预报减去观测)(第一行)和均方根误差(第二行)

结合降水可看到，1 km 模式气温和风速预报偏差随降水过程存在明显的波动，出现较强降水过程之后温度和风场预报误差明显增大，温度整体较实况偏低，风速预报偏强。6—7 月华南地区处于前汛期向后汛期转变的时期，受冷空气、切变线以及西南季风等多种系统影响，天气形势复杂。模式预报对天气形势转变的刻画可能存在一定的偏差，未能及时把握主要天气系统的演变和发展，导致预报结果出现较大的误差，在模式产品订正、释用等需要考虑天气系统的影响。

4.2 站点特征分析

选取广东省内各区域4个国家站作为代表站，分别为韶关、广州、汕头、湛江，计算1 km 模式和3 km 模式00 时和12 时起报的24 h 预报结果与观测资料的绝对误差(AE)，得到研究时段内4 站点2 m气温和10 m 风速AE 的时间序列(图10)。从2 m气温的站点时间序列对比可看到3 km 模式预报的气温站点AE 存在较大的波动，尤其是沿海测站。比较两个模式之间预报结果，3 km 模式00 时起报的4 站点在研究时段内的最小AE 为0.08，最大 AE 为 9.28，平均 AE 为 2.97，对应的 1 km 模式 4站点在研究时段内AE 的整体趋势表明1 km 模式预报与实况较接近，最小AE 为0.01，最大AE 为3.82，平均 AE 为 1.22，相比 3 km 模式有明显改善。12时起报预报结果与00时类似，1 km 模式整体预报效果优于3 km 模式。相比其他站点，沿海测站(汕头、湛江)2 m 气温预报较实况存在较大偏差，模式对降水、云量以及主要系统的预报效果会影响到气温的预报效果，在预报产品气温订正中也要考虑不同地区海拔差异、纬度高低、环流形势预报等因素的影响。

图10 GRAPES_GZ_R 1 km模式和GRAPES_GZ 3 km模式24 h预报时效站点2 m气温和10 m风速AE时间序列

从10 m风速的站点AE时间序列可看出3 km模式 00 时起报的 AE 整体小于 1 km 模式，4 站点在研究时段内的最小AE 为0.01，最大AE 为5.28，平均 AE 为 1.22，相应的 1 km 模式，最小 AE 为0.1，最大 AE 为 6.09，平均 AE 为 1.97。12 时起报 1 km模式和3 km模式预报结果AE整体趋势一致。

5 结论

基于华南地区自动站逐小时观测资料，采用传统站点评分、邻域法等评估华南区域高分辨率数值模式(包括GRAPES_GZ_R 1 km 模式和GRAPES_GZ 3 km 模式)对降水、地面温度和风场等要素的预报能力。

(1) GRAPES_GZ_R 1 km 模式的降水预报技巧优于GRAPES_GZ 3 km 模式，模式预报以正偏差为主。对于不同起报时间的预报，00 时起报的预报效果优于12 时。GRAPES_GZ_R 1 km 模式的TS 评分是GRAPES_GZ 3 km 模式的两倍以上，对不同降水阈值的评分均较高。

(2) 分数技巧评分(FSS)显示GRAPES_GZ_R 1 km 模式 6 h 累计降水预报在 0.1 mm、1 mm 及 5 mm以上的降水均可达到最低预报技巧尺度，对所检验降水对象的空间位置把握能力更好。

(3) 2 m 气温和10 m 风速检验结果表明两个模式均能较好把握广东省温度的分布特征，GRAPES_GZ_R 1 km模式对2 m气温预报结果优于GRAPES_GZ 3 km 模式，预报绝对误差更小；两个模式对风速的预报整体偏强，预报偏差在1～4 m/s之间，但相比之下GRAPES_GZ 3 km模式在风场预报上表现更好。

(4) GRAPES_GZ_R 1 km 模式的 2 m 气温和10 m 风速预报偏差随降水过程存在明显波动，出现较强降水过程之后温度和风场预报误差明显增大，温度整体较实况偏低，风速预报偏强，在模式产品订正、释用等需要考虑模式对主要天气系统的预报情况。

需要指出的是由于模式预报数据的限制，本文评估只针对 2019 年 6 月 5 日—7 月 14 日的预报结果，要想得到更加全面的模式性能评估结果还需要更多的样本，并针对不同类型的过程进行分类归纳。