S2S模式对四川汛期候尺度降水预测技巧评估和误差订正*

2023-01-28庞轶舒马振峰马晓慧

气象学报 2022年6期

关键词：距平百分率站点

庞轶舒马振峰郑然肖颖马晓慧

1. 四川省气候中心/高原与盆地暴雨旱涝灾害四川省重点实验室，成都，610072

2. 成都信息工程大学，成都，610103

3. 青岛航空股份有限公司，青岛，266000

1 引言

四川是中国气象灾害最严重的地区之一（温克刚等，2006）。汛期（5—9月）降水异常与省内暴雨、洪涝、干旱、冰雹等气象灾害直接关联，进而诱发山洪、泥石流、滑坡和城市内涝等次生灾害，严重威胁人民生命财产安全，并给地方经济造成重大损失。因此，汛期降水预测一直是政府部门关注的焦点。次季节气候预测是天气预报和季节预测之间的接口和桥梁，是政府部门从被动应对灾害转为主动减灾的一个关键预测时段，具有重要的科学意义和广泛的社会应用价值（Morss，et al，2008；White，et al，2017）。随着经济的快速发展，防灾减灾的要求不断提高，四川省地方政府对10 d以上的次季节尺度气候预测需求更加紧迫。为推进次季节气候预测业务发展，四川省先后完成了月尺度重要天气过程预测（MAPFS）等国家气候中心下发系统的气候预测技术，如低频图（孙国武等，2008；孙昭萱等，2016）、环流相似法（唐红玉等，2017）和韵律法（林纾等，2013）等的本地化应用，并在此基础上研发了基于热带大气季节内振荡（MJO）的延伸期强降水统计预报方法（甘薇薇等，2018）。近几年，也将CFS（The NCEP Climate Forecast System）、Derf2.0等模式预测产品用于业务参考。然而，目前四川省的次季节-季节尺度气候预测准确率尚不能满足地方政府和社会的需求。

次季节尺度预测是当前世界范围内气象预报的难点（Vitart，et al，2018）。为研究解决相关问题，世界天气研究计划（WWRP）和世界气候研究计划（WCRP）联合组织制定了“次季节至季节（Subseasonal to Seasonal，简称S2S）预测计划”，并收集了来自世界各地11个业务和科研机构的次季节模式预报和回报数据（Vitart，et al，2017），重点关注极端事件和模式检验（Vitart，et al，2012）。随后，气象学者们就高温热浪（Hudson，et al，2011；Osman，et al，2018；Ford，et al，2018；Xie，et al，2020）、区域降水（Liang，et al，2018；De Andrade，et al，2019）、各区域季风（Marshall，et al，2015；Jie，et al，2017；贺铮等，2018；Olaniyan，et al，2019）、Madden-Julian振荡（Vitart，et al，2017；Zhou，et al，2019）、南半球环状模（Cavalcanti，et al，2021）等遥相关特征、土壤湿度（Zhu，et al，2019）、台风（李慧等，2020）等对S2S模式产品的预测技巧展开分析，并对次季节尺度的北半球夏季风降水概率预报进行了研究（Vigaud，et al，2017）。经过评估发现，各模式对四川极端降水事件的预测技巧表现为“低命中率，高误警率，预测值远小于实际值”的特征，不能直接用于预测业务（庞轶舒等，2021a）。研究表明，S2S计划中部分模式的短时间气候趋势预测产品（如候、周气候趋势）能提前数周反映一些大范围极端事件的发生、发展和衰减（Vitart，et al，2018；Rao，et al，2019）。候尺度的降水趋势异常能在一定程度上反映极端强降水的发生，且地方政府决策部署前常常关注某一个时段内的天气、气候情况。因此，候降水趋势预测在次季节气候预测中有相当的科学实用价值。S2S计划推出之后，中国气象局在气象系统内部网络推出了11个模式包括候尺度在内的全球地面温度、降水等常规要素的次季节预测可视化产品（胡星等，2020）。这些产品为未来10—30 d月内重大天气决策服务提供了丰富素材，但由于缺乏各模式预测技巧的系统分析，在四川省尚未得到有效应用。

数值预报模式虽已取得了长足的发展，但模式中未知误差部分总是客观存在的。模式误差主要包括模式中时空离散化的截断误差、物理参数化方案的缺陷、计算方案误差、参数不准、动力方程本身缺陷等。正是由于这些误差的存在，使得模式本身存在很大的不确定性（杨杰等，2012）。丑纪范（2003a，2003b）认为，解决这一问题的关键是将动力模式与统计方法有机结合，取长补短，通过充分利用历史统计信息达到修正动力模式产生的系统性误差的目的。近年来，气象研究者们采用了多种方法，如非参数百分位映射法（Panofsky，et al，1968；Déqué，2007；章大全等，2016）、卡尔曼滤波法（马清等，2008；李莉等，2011；邱学兴等，2012）、非齐次高斯回归（NGR）法（Hagedorn，et al，2008）、多元线性回归和多时效消除偏差平均法（李佰平等，2012）、滑动平均法、双权重平均法、滑动双权重平均法（Stensrud，et al，2005；王婧等，2015）、最大相似度、最小偏差法（Zeng，et al，1994）、历史偏差订正法（尹姗等，2020）、奇异值分解法（苏海晶等，2013）、相似误差订正法（任宏利等，2005；孙丞虎等，2006；程娅蓓等，2016）等对模式预测结果进行订正，并取得了一定效果。

本研究旨在对S2S计划中的各模式就四川汛期候尺度降水气候趋势的预测技巧进行系统评估分析，并在此基础上对模式进行误差分析及订正，为各模式在四川汛期降水次季节预测业务服务中的应用提供科技支撑。

2 资料和方法

2.1 资料

文中采用1995—2015年四川省156个气象观测台站（图1）汛期（5—9月）逐日降水观测资料、中国气象局S2S数据中心的10个模式降水回报数据（俄罗斯水文气象中心（HMCR）的模式数据缺失较多（胡星等，2020），未选用），详细信息见表1。为了比较模式之间的预测技巧，选取的检验时段为各模式回报时段的交集，即1999—2010年。选取的预测时效为各模式逐日降水预报的公共预测时效1—30 d，经过滑动计算候降水量后为1—26 d。由于各模式预报频率不同，故检验评估的样本数量不同。例如，CMA模式降水每日预报1次，共计12 a×153 d/a×1个/d=1836个样本用于检验评估。

图1 四川省156个气象台站分布Fig. 1 Distribution of 156 meteorological stations in Sichuan province

表1 模式资料简介Table 1 Profiles of model data

2.2 方法

在评估检验过程中，采用双线性插值法将模式预报数据插值成站点数据，并将预报和观测的日降水量处理成候降水距平百分率。采用距平相关系数（ACC）、时间相关系数（TCC）（Jolliffe，et al，2003），符号一致率（SCR，式（1））和趋势异常综合评分（PS，式（2））（郑然等，2019；庞轶舒等，2021b）4种评估指标对各模式的预测技巧进行检验评估分析。并利用10个模式预测技巧的标准差来表示模式之间预测技巧的离散度。采用误差（式（3））和异常偏差（式（4））对各模式进行误差分析，在此基础上对各模式进行误差订正。

式中，ai和bi分别表示观测和预测序列在第i时次的值，ki为第i时次预测和观测值的距平符号一致参数，N为序列长度。

式中，N0为趋势预测正确站数；N1为一级异常预测正确站数；N2为二级异常预测正确站数；M为二级异常漏报，而实况出现极端异常（降水距平百分率（PAP）≥100%或等于-100%）的站数；N为参加考核总站数。a、b、c为权重系数，分别取a=2，b=2，c=4。在降水预测中，一级异常：50%＞PAP≥20%，-20%≥PAP＞-50%；二级异常：PAP≥50%，PAP≤-50%。

式中，Fi和Oi分别为第i（i=1，2，…，N）个站点的模式降水预测值和观测值。

在4个评估指标中，ACC表示空间相似度，-1≤ACC≤1，ACC越大，空间相似度越高，当ACC为1时，表示空间分布完全一致。PS评分是由国家气候中心制定的常规气候趋势预测业务评分标准，能够检验预测结果对异常趋势的把握。以上两种评分方法均评估的是模式对某一特定年份降水距平百分率区域空间分布和异常变化的预测技巧。TCC表示预测值与观测值时间序列的相关度，-1≤TCC≤1，TCC越大，时间相关度越高，变化趋势越一致。SCR 为符号相同的概率，0≤SCR≤100%，SCR 越大，预测值与观测值的正、负异常趋势越一致。TCC和SCR两种评分主要评估各模式针对单站点降水距平百分率年际变化预测能力的历史综合表现。为了利用这两种方法评估模式对整个区域降水距平百分率年际变化的预测能力，文中采用TCC通过α=0.1显著性t检验的站点百分比和SCR≥60%的站点百分比来进行评估分析。

3 模式候降水距平百分率预测技巧评估

如图2所示，S2S计划各模式对汛期候降水距平百分率的预测技巧均随预测时效的延长而变化。当提前1 d预测未来一候的降水距平百分率时，各模式的ACC、PS评分最大，TCC（α=0.1）和SCR≥60%的站点比例最高，但模式间的预测技巧差异最大。预测技巧最高的模式为UKMO，其ACC为0.34，PS评分为83.6，TCC（α=0.1）站点占比54.0%，SCR≥60%站点占比为66.3%。预测技巧最低的模式为KMA，其ACC、PS评分、TCC（α=0.1）站点占比和SCR≥60%站点占比分别为-0.012、71.2、11.2%和18.8%。各模式间的预测技巧ACC、PS、TCC（α=0.1）站点占比和SCR≥60%站点占比的离散度分别为0.11、3.7、13.6%和14.1%。

图2 S2S计划模式对四川省汛期候降水距平百分率的预测技巧（a. ACC，b. PS评分，c. TCC通过0.1显著性t检验的站点比例（单位：%），d. SCR≥60%的站点比例（单位：%））Fig. 2 Forecast skills of models in the S2S plan （a. ACC，b. PS score，c. percentage of stations for TCC passing the significance t-test at 0.1 level （unit：%），d. percentage of stations for SCR≥60% （unit：%） of S2S models for pentad precipitation anomaly percentage in Sichuan province during the flood season）

随着预测时效延长，各模式的预测技巧快速降低，至第10天前后进入低技巧时段，随后以较低的水平随时效的延长而上下浮动。当预测时效＞10 d时，模式间预测技巧的差异减小，ACC、PS、TCC（α=0.1）站点占比和SCR≥60%站点占比的离散度分别为0.02、1.5、1.3%和2.3%。各模式对候降水距平百分率的空间分布形态基本没有预测技巧，ACC为-0.05—0.06；对于省内各站点降水异常的时间变化特征和正、负趋势把握较差，TCC（α=0.1）的站点比例为10%—15%，SCR≥60%的站点比例均在20%—30%。相对来说，各模式对四川省汛期候降水距平百分率的趋势异常有较高的预测技巧。当前四川省已经业务化的月气候趋势预测目标PS评分为72，除CNRM外其他模式的PS平均分均在72上下，其中BoM模式始终高于75。

将各模式的预测技巧按预测时效分类比较（图3）发现，对于月尺度，TCC（α=0.1）站点比例和SCR≥60%站点比例预测技巧最高的模式是UKMO，平均分别为21.6%和33.8%。ACC评分最高的模式为ECWMF，平均为0.096。PS评分最高的模式是BoM，平均为76.4。当关注天气尺度（预测时效≤10 d）时，UKMO模式除PS评分外的各项预测技巧均最高，平均ACC、TCC（α=0.1）站点比例和SCR≥60%站点比例分别为0.2、33.7%和48.1%。该模式平均PS评分为79.1，略低于PS评分最高（79.3）的ECWMF模式。进入次季节尺度（预测时效＞10 d）后，各模式的ACC、TCC（α=0.1）站点比例和SCR≥60%站点比例相差不大。相对来说，ACC最高的模式是JMA，为0.038；TCC（α=0.1）站点比例最高的模式是UKMO，为14.1%；SCR≥60%站点比例最高的模式是BoM，为27.7%，同时BoM模式的PS评分明显高于其他模式，为76.2。

图3 S2S计划模式在不同时间尺度下对四川汛期候降水距平百分率的预测技巧（a. ACC，b. PS评分，c. TCC通过0.1显著性t检验的站点比例（单位：%），d. SCR≥60%的站点比例（单位：%））Fig. 3 Forecast skills of models in the S2S plan on different time scales （a. ACC，b. PS score，c. percentage of stations for TCC passing the significance t-test at 0.1 level （unit：%），d. percentage of stations for SCR≥60% （unit：%） of S2S models for pentad precipitation anomaly percentage in Sichuan province during the flood season）

由上述分析可以看出，S2S计划中的大多数模式对于四川汛期候降水距平百分率的空间相似度、时间变化特征和正、负趋势的预测仅在天气尺度内有可参考的价值，其中以UKMO模式的预测技巧最高。对于降水的异常趋势来说，大多数模式有相对较高的预测技巧，在天气尺度内UKMO和ECWMF模式预测效果最好，而BoM模式在进入次季节尺度后保持着较高的预测技巧，并且明显高于其他模式。从图4可以看出，各模式在次季节尺度的PS评分呈“偏态分布”，大概率分布在60—90分。与其他模式相比，BoM模式的PS评分更加集中在高分段（图4h）。其超过目标评分（72.0分）的样本占比为66.9%，而其他模式均在60%以下。从次季节尺度中各模式的逐月PS评分（图5）也可以看出，BoM模式除在5月略低于多数模式外，其余时间都明显高于其他模式，表明BoM模式对四川汛期候降水异常趋势的次季节尺度预测技巧优势明显。但BoM模式对于候降水的空间相似度、时间变化特征的预测效果并非最佳，正、负趋势的预测技巧略高于其他模式，优势并不明显。

图4 S2S计划模式（a—j）在次季节尺度内对四川汛期候降水距平百分率PS评分的概率分布Fig. 4 Probability density distribution （PDF） for PS scores of the S2S models （a—j） for pentad precipitation anomaly percentage in Sichuan province during the flood season on the sub-seasonal scale

图5 S2S计划模式不同起报时间对四川省次季节尺度候降水距平百分率的PS评分Fig. 5 PS scores of the S2S models in different forecast months for pentad precipitation anomaly percentage in Sichuan province during the flood season on the subseasonal scale

为进一步分析BoM模式在次季节尺度PS评分高于其他模式的原因，针对PS评分的计算方法（式（2）），分析各模式在各个预测时段内的N0、N1、N2和M相对于总站数N的比例（图6）。由图6a可以看出，在天气尺度内，UKMO和ECWMF两个模式对于四川汛期候降水距平百分率的N0占比超过60%，明显高于其他模式，其中BoM模式的N0占比仅为55%，排倒数第2位。各模式在次季节尺度的N0占比为52%—54%，其中BoM模式排第1位。从整个月内的预测时段来看，UKMO模式N0占比最高，其贡献主要来自于天气尺度。而无论在天气尺度或是次季节尺度中，CNRM模式的N1占比（图6b）和BoM模式的N2占比（图6c）均为各模式中最高，表明这两个模式在月内尺度中分别拥有最好的一级和二级趋势异常预测技巧。与此同时，BoM模式在各时间尺度下对降水极端异常的漏报站数M占比最小（图6d）。由上述分析可以发现，BoM模式在次季节尺度的PS评分最高有三方面原因：一是该模式对四川候降水正、负趋势的预测技巧高于其他模式，为54.0%，其他模式的N0占比均≥52%，与BoM模式差异不大，因此不是决定性因素；二是BoM模式对候降水的二级异常趋势预测技巧明显高于其他模式；三是BoM模式对极端异常降水漏报率低于其他模式。结合PS评分中各分量的定义可以发现，若出现极端异常的站点二级异常趋势预测正确，则该站点对M的贡献为0，反之则算做极端异常漏报。可见，M和N2表示的预测技巧虽有不同，但关系紧密。N2的预测技巧越高，M则越容易偏小，反之亦然。与此同时，在PS评分计算的过程中，二级异常趋势正确的权重系数是正、负趋势和一级异常趋势的2倍，而极端异常漏报的站数越多，公式的分母越大。因此，是否报对二级异常趋势对PS评分有较大影响。PS评分本身的特点是更倾向于奖励报准对社会生产生活有重大影响的异常气候趋势预测结果。结合上述分析，对二级异常趋势的预测技巧是BoM模式在次季节尺度中PS评分高于其他模式的原因。

图6 S2S计划模式在不同预测时段内对四川汛期候降水距平百分率的预测技巧（a） N0，（b） N1，（c） N2，（d） M的站点比例Fig. 6 Forecast skills on different time scales percentages of （a） N0，（b） N1，（c） N2 and （d） M to the sum of stations of the S2S models for pentad precipitation anomaly percentage in Sichuan province during the flood season

4 模式误差分析

从表1可以看出，10个模式中，BoM是唯一分辨率为2.5°×2.5°的模式。为探明BoM模式二级异常趋势预测能力偏高是否与此有关，利用反距离权重插值方法对各模式进行插值计算，然后评估检验。结果表明，更换插值方法后，模式的各项预测技巧变化不大，且BoM模式对四川汛期候降水异常趋势尤其是二级异常趋势的预测能力依旧强于其他模式（图略）。说明BoM模式较强的二级异常趋势预测技巧与模式分辨率以及所选插值方法没有太大关系。为进一步分析其中原因，文中对各模式的预报误差进行了分析。从图7a可以看出，S2S计划中的各模式对四川汛期候降水总体预报偏多，无论预测时效为几天，各模式候平均降水量的误差均大于0，且不同预测时效误差变化幅度不大。将各模式的平均误差横向对比后发现，CNRISAC模式的平均误差最大，为3—4 mm，而BoM模式的平均误差最小，为0.5—1.2 mm，其他模式的平均误差均在1—2.5 mm。由于降水距平百分率中包含气候距平分量，因此各模式预测误差的多年平均值为0（图略）。降水距平百分率的异常偏差可以反映模式预测值年际异常幅度与实际的差异。由图7b可以看出，S2S计划中除BoM模式外其他大多数模式对四川汛期候降水趋势的异常程度都存在低估，这种特征不随预测时效发生变化，预测降水距平百分率的异常偏差为-40%—-18%。上述分析说明这些模式降水预测值的年际变率远低于实际。而BoM模式预测的降水趋势异常程度与实际值相当，异常偏差在0附近波动。说明该模式中降水的年际变率与实际接近。这也是BoM模式对四川汛期候降水二级异常趋势预测能力明显强于其他模式的原因。

图7 S2S计划模式预测四川汛期候平均降水量的误差（a）和降水距平百分率的异常偏差（b）Fig. 7 Errors of pentad mean precipitation （a） and anomaly deviations of pentad precipitation anomaly percentage （b） of the S2S forecasts verified against observations in Sichuan province during the flood season

从月内各模式降水距平百分率异常偏差的空间分布来看，除了BoM模式外，其他模式对各站点候降水趋势的异常都存在不同程度低估，模式异常偏差在全省范围内皆为负。其中ECWMF、UKMO、KMA、JMA、ECCC、NCEP和CNRM模式的异常偏差最小值均出现在金沙江上、中游附近，说明这些模式对该区域降水的年际变化幅度估计最为不足。与此同时，这些模式在成都平原有一个异常偏差次低值中心，对这一区域的年际变率也估计不足。CNRM模式的异常偏差最低，全省大部均小于-35%，ECWMF和UKMO两个模式的异常偏差次低，在大部分地区为-40%—-25%（图8）。在所对比的模式中，仅BoM模式的异常偏差出现正值，总体为-25%—20%，在绝大部分地区为-10%—10%，与四川降水的实际年际变化幅度接近。该模式异常偏差自西向东呈“-、+、-、+”分布，在甘孜州、攀西地区西部、四川盆地西部和北部为负，说明模式对这些地区降水的年际变化幅度估计偏低；在其他地区为正，对这些地区降水的年际变化幅度估计偏高。该模式异常偏差的极小值与其他模式相似，分布在金沙江上、中游，大值中心有3个，分别位于凉山州东北部，四川盆地东北部和南部接近省界的地区（图8h）。按照预测时效分割成天气尺度和次季节尺度后，各模式预测值的异常偏差分布与月内平均状态没有太大差异，量级相当（图略），说明各模式降水年际变化幅度偏差与预测时效没有太大关联，属于模式固有的系统性误差。

图8 S2S计划各模式在预测时效为1—26 d时对四川汛期候降水距平百分率的异常偏差（a. ECWMF，b. UKMO，c. KMA，d.CNR-ISAC，e. CMA，f. JMA，g. ECCC，h. BoM，i. NCEP，j. CNRM）Fig. 8 Anomaly deviations of S2S models for pentad precipitation anomaly percentage in Sichuan province during the flood season in the lead-time from 1 to 26 days （a. ECWMF，b. UKMO，c. KMA，d. CNR-ISAC，e. CMA，f. JMA，g. ECCC，h. BoM，i.NCEP，j. CNRM）

5 模式误差订正和检验

S2S模式对于四川汛期候降水量及其年际变率均存在明显的系统性偏差，但由于预测对象是降水距平百分率（包含气候距平量），因此常用的基于历史误差平均值的订正方法，如历史偏差订正（尹姗等，2020）、滑动平均法、双权重平均法、滑动双权重（Stensrud，et al，2005；王婧等，2015）等无法有效订正模式预测结果。与气温相比，降水的量值分布具有离散、随机的特点，不具备非参数百分位映射法订正的条件（Maraun，et al，2013）。尽管如此，上述误差订正方法依然值得借鉴。

模式对各站点降水距平百分率正、负趋势以及其异常程度的预测能力是各模式预测技巧评分高低的关键。分析发现，模式预测对实际降水距平百分率有系统偏差，不随预测时效发生改变。不同的是，模式对各站点降水距平百分率的SCR随预报时效延长而逐渐降低，且各站点SCR不尽相同。有些模式对部分站点的SCR始终低于50%（图略），说明它们对这些站点降水的正、负趋势把握大概率是错误的。为此，提出“正、负概率异常订正”的方案对各模式候降水距平百分率预测值进行订正，具体做法如下：（1）计算预测时效为1—26 d各站点的SCRi，n（i为预测时效，i=1，2，…，26；n为站点序号，n=1，2，…，156），当平均SCRi，n＜50%时，订正预测时效为i，站点序号为n的所有降水距平百分率预测值的正、负符号；（2）在（1）的基础上，利用预测值与观测值的平均异常偏差订正各站点预测值的异常程度。

经过订正后，各模式对于四川汛期候降水距平百分率的ACC、SCR（≥60%）站点比例和PS评分均有所提高，但对TCC（α=0.1）站点比例的提高不明显。在整个月内尺度中，各模式SCR（≥60%）站点比例的订正率为0.3%—5.6%，且大多数模式在次季节尺度的订正率均高于天气尺度。经过订正后，各模式在次季节尺度的SCR（≥60%）依旧不超过30%（图略）。与SCR（≥60%）站点比例相比，各模式的ACC得到明显提高。订正之前，各模式在部分预测时效的平均ACC低于0。订正之后，各模式在各个预测时效的平均ACC均为正值，对降水空间相似度的负技巧有较好的纠正作用。从订正效果来看，在整个月内尺度中KMA模式提高最为明显，订正率超过300%；CNRM、ECCC和BoM模式次之，订正率为10%—30%；其余模式则为0.1%—6%。这些模式的订正效果主要来自于次季节尺度。在次季节尺度中，订正率最高的模式为KMA，订正率为700%，订正前，该模式的ACC不足0.005，订正后ACC为0.032。尽管订正效果明显，但由于各模式对候降水距平百分率空间相似度的次季节尺度预测技巧极低，订正后的ACC依然不足0.05（图略）。

经过误差订正后，各模式的PS评分得到有效提高。从图9a可以看出，在整个月内尺度上，各模式的PS评分均得到正向订正，订正率为2%—12.0%，以CNRM模式的订正效果最好。经过订正后，各模式在整个月内的平均PS评分均高于77.4，其中60%的模式平均PS评分高于80，以UKMO模式最高，为81.3。分时段来看，天气尺度内各模式的平均PS评分得到正向订正，订正效果最好的模式为CNRM，订正率为9.9%。订正后，各模式的平均PS评分均大于78.4，且其中70%的模式平均PS评分大于80，UKMO模式的预测技巧最高，为84.0（图9b）。进入次季节尺度后，有3个模式（CNR-ISAC、JMA和CNRM）的订正率高于10%，除BoM外其余模式订正率也高于5%。经过订正后，各模式的平均PS评分均高于76.8分，其中66.7%模式的PS评分为79.2—80.2，超过业务评分标准近8分（图9c）。

图9 误差订正前后S2S各模式在月内（a）、天气尺度（b）和次季节尺度（c）对四川省汛期候降水距平百分率的PS评分及其订正率Fig. 9 PS scores and PS correction rates of S2S models on pentad precipitation anomaly percentage during flood season in Sichuan province on monthly scale （a）， synoptic scale （b） and sub-seasonal scale （c） before and after error correction

进一步分析发现，在整个月内尺度中，各模式的N0均得到正向订正，其中在次季节尺度的订正效果优于天气尺度。经过订正后，各模式在次季节尺度中的N0均大于53.0%。各模式对N2预测技巧在订正后得到明显提高（约15%提高至25%以上），且在次季节尺度的订正率高于天气尺度。相应地，该订正方案对各模式的极端异常趋势漏报站数M有效减少。尽管该订正方案对N1存在一定程度的过度修正，但N2订正率绝对值是N1订正率绝对值的3—7倍（图略）。因此，总的来说该订正方案对提高各模式对四川候降水异常趋势的预测准确率十分有效。尤其是在次季节尺度上，能有一半以上的站点趋势预测准确，同时能较好指示极端异常情况，预测结果对于提高次季节尺度预测业务服务很有帮助。

由于该订正方案对降水异常程度的订正效果明显大于正、负订正效果，订正后TCC的分子（预测值和观测值的协方差）和分母（预测值标准差与观测值标准差的乘积）同时增大，是TCC（α=0.1）的站点比例在订正前后没有较大改变的原因。

为了进一步检验该订正方案对异常趋势预测技巧订正的有效性，利用各模式1999—2010年外的其他4 a回报数据进行了独立样本检验（图10）。由于各模式回报数据时段不同，因此独立检验时段有所不同，ECWMF和UKMO模式检验的年份为2011—2014年；NCEP回报数据仅有1999—2010年，故未参加检验；其余7个模式检验时段为1995—1998年。从图10a中可以看出，经过误差订正后，各模式在整个月内尺度对四川汛期候降水异常趋势的预测技巧均有提高。各模式的订正率为1.9%—11.9%，以CNRM模式订正效果最好。经过订正后各模式的平均PS评分为76.3—80.0。分时段来看，该订正方案对次季节尺度预测结果的订正优于天气尺度。在天气尺度内，各模式的订正率为1.7%—9.8%，订正后各模式的平均PS评分为76.2—84.0，且有一半以上的模式超过80.0（图10b）。在次季节尺度内，各模式的订正率为2.0%—12.0%，订正后各模式的平均PS评分为75.0—78.6。订正前，有一半以上的模式平均PS评分未超过72.0（图10c），由此说明该订正方案能有效提升各模式对降水异常趋势的预测技巧。

图10 独立样本检验中误差订正前后S2S各模式在月内（a）、天气尺度（b）和次季节尺度（c）对四川省汛期候降水距平百分率的PS评分及其订正率Fig. 10 PS scores and PS correction rates of S2S models on pentad precipitation anomaly percentage during flood season in Sichuan province on monthly scale （a），synoptic scale （b） and sub-seasonal scale （c） before and after error correction in the independent sample test

6 结论与讨论

文中针对四川汛期候降水距平百分率，采用4种预测技巧评分方法对S2S计划10个模式进行检验评估，并对各模式进行误差分析，在此基础上提出“正负概率异常订正”方案对各模式降水距平百分率预测结果进行订正。主要结果如下：

S2S模式对汛期候降水距平百分率的预测技巧均随预测时效的延长而变化。当预测时效为1 d时，各模式的ACC、PS最大，TCC（α=0.1）和SCR≥60%的站点比例最高，模式间的预测技巧差异最大。随着预测时效延长，各模式的预测技巧快速下降，模式间的预测技巧差异减小。至第10天前后各模式进入低技巧时段，随后以较低的水平随时效的延长而上下波动。大多数模式对于四川汛期候降水距平百分率的空间相似度、时间变化特征和正、负趋势的预测结果仅在天气尺度内有参考价值。其中以UKMO的预测技巧最高，平均ACC、TCC（α=0.1）站点比例和SCR≥ 60%站点比例分别为0.21、45.7%和48.0%。对于降水的异常趋势特征来说，大多数模式均有相对较高的预测技巧，在天气尺度内ECWMF和UKMO是预测效果最好的模式，PS均超过79。进入次季节尺度后，BoM模式的平均PS评分为76.7，超过业务目标评分（72.0）的样本占比66.9%，明显高于其他模式。BoM模式在次季节尺度内的预测优势主要源于其对候降水二级异常趋势的预测技巧明显高于其他模式。

多数模式对四川汛期候降水趋势的异常程度都存在低估，预测值的异常偏差为-33%—-18%，且不随预测时效发生变化。与其他模式相比，BoM模式预测的降水异常程度与实际相当，平均异常偏差徘徊在0附近。各模式预测值异常偏差的空间分布不均，BoM模式在全省呈正、负交叉分布，其他模式则均小于0。对降水变化幅度的低估是大多数模式二级异常趋势预测技巧低于BoM模式的原因。

经过误差订正后，各模式ACC和SCR（≥60%）的站点比例有所提高，PS评分有效提高。在整个月内尺度上，各模式PS评分的订正率为2%—12.0%，90%的模式在次季节尺度的订正率高于天气尺度。天气尺度内的平均PS评分均大于78.4。70%的模式平均PS评分高于80.0， UKMO模式最高，为84.0；次季节尺度内，所有模式的平均PS评分都高于76.8，其中66.7%模式的PS评分在79.2—80.2，超过业务评分标准（72.0）近8分。

在4 a的独立样本检验中，误差订正后各模式对整个月内尺度四川汛期候降水距平百分率的PS评分订正率为1.9%—11.9%，平均PS评分为76.3—80.0。订正效果在次季节尺度优于天气尺度。在天气尺度内，各模式的订正率为1.7%—9.8%，平均PS评分为76.2—84.0，且有一半以上的模式超过80.0。在次季节尺度内，各模式的订正率为2.0%—12.0%，平均PS评分为75.0—78.6。订正前，有一半以上的模式平均PS评分未超过业务评分标准，说明文中提出的误差订正方案对于提高各模式对四川汛期候降水异常趋势的预测技巧是有效的，订正后各模式预测结果有潜在业务应用价值。