APP下载

非高斯分布观测误差资料的变分质量控制对暴雨预报的影响

2017-05-30马旭林和杰周勃呖李琳琳计燕霞郭欢

大气科学学报 2017年2期

马旭林 和杰 周勃呖 李琳琳 计燕霞 郭欢

摘要 观测资料的质量控制直接影响数值预报资料同化的分析质量。本文针对GRAPES区域同化和预报的三维变分资料同化系统,发展了基于观测误差为“高斯分布+均匀分布”模型的变分质量控制方案,讨论了该方案的初始启动和关键参数,并检验分析了其适用性与有效性。同时,以全球预报系统(GFS)资料作为背景场,利用探空、地面、船舶、飞机、云迹风等常规观测资料和COSMIC卫星反演资料进行同化和预报,分析了华南地区特大暴雨的个例试验和2013年8月共31 d的批量试验。试验结果表明:变分质量控制能够依据观测资料的不同质量对观测权重进行合理调整,对位势高度、气压、风、比湿的分析增量场和分析场改善显著,尤其在强降水区具有更加明显的效果;对降水落区、降水强度及中心位置的预报质量具有较好的提高,特别对暴雨、大暴雨等较大降水量级的预报能力反映出更好的改善效果,充分显示了变分质量控制在中小尺度剧烈天气过程中对同化分析和预报的重要作用。

关键词 变分质量控制 观测误差 三维变分 资料同化 数值预报

观测资料的质量控制(Quality Control,QC)是资料同化系统的重要组成部分(Lorenc et al.,1988),其效果直接影响资料同化的分析质量,进而影响模式预报的准确性。所谓观测资料的质量控制即在客观分析或资料同化之前对观测资料进行检查并剔除错误观测的过程(朱江,1995)。随着数值预报精度的不断改善,对观测资料质量的要求越来越高。因此,在数值预报中观测资料的质量控制也愈加重要。

为有效克服传统质量控制方法的缺陷,前人对观测资料误差的特性有广泛的探讨。一般把观测误差归纳为随机误差、系统误差、过失误差(gross errors)三类,也可能包含“代表性误差”。其中由仪器失灵、传输、读写和计算产生的误差称为过失误差。观测误差的分布模型在变分同化系统中通常假设呈高斯分布,但理论和大量的新息向量统计表明,实际观测误差存在非高斯分布的误差。与理论假设相比,其最重要的区别在于观测误差的实际分布比高斯分布的尾部更长,这根本上是由于离群值所导致的长尾(long-tail)分布(黄幼才,1990)。显然,假设的观测误差模型与实际观测误差分布不相符,这将会使得被估计参数的效率大大降低,甚至得出完全错误的参数估计。因此,考虑非高斯分布误差并选择符合实际观测误差的分布模型,是有效、准确地求解变分同化中目标函数极小化解的关键。早在20世纪80年代学界就提出了采用非高斯分布误差方法(Lorenc,1984;Purser,1984)进行观测资料的质量控制。后来,Dharssi et al.(1992)首次将非高斯误差方法应用到激光雷达探测资料和非线性最优插值分析,也使得同化分析過程对观测资料起到质量控制的效果。Ingleby et al.(1993)假设观测误差服从“高斯分布+均匀分布(Gaussian plus flat)”模型,考虑过失误差的非高斯分布(均匀分布)特点,并据此根据贝叶斯(Bayesian)概率理论(Gelman et al.,1996)提出了变分质量控制(Variational Quafity Control,VarQC)理论。随后变分质量控制(Andersson et al.,1999)被应用到欧洲天气预报中心(ECMWF)的3D/4D-Var变分同化系统,取得了较为满意的结果。进入21世纪后,变分质量控制方法在美国国家环境预报中心(NCEP)、加拿大气象中心(CMC)等的数值预报系统中得到拓展与应用,并在业务预报中获得良好的效果(Colfins et al.,2001;Gauthier et al.,2003)。最近,郝民等(2013)结合GRAPES区域中尺度同化与预报系统开展了变分质量控制应用的初步研究。

变分质量控制是以变分同化系统为基础的观测资料质量控制方案,是解决非高斯分布观测误差问题一种有效方法。该方法作为变分同化系统的有机部分,不仅假设观测误差的高斯分布,而且考虑过失误差的非高斯分布特性,并认为与背景场不相关且无任何气象意义的离群值代表过失误差,(Tavolato et al.,2014)。该方法不仅可用于常规资料,而且对卫星、雷达等非常规资料的质量控制(唐飞等,2012)也具有适用性。

本文在变分质量控制研究的基础上,为了进一步完善我国变分同化中质量控制的有效性和准确性,针对我国自主研发的GRAPES区域同化和预报系统(陈德辉等,2008;马旭林等,2009)中三维变分同化系统,基于观测误差的“高斯分布+均匀分布”模型,发展建立了与GRAPES 3DVAR完全一体的适用于常规和非常规观测资料的变分质量控制系统。同时,增加云迹风、COSMIC反演资料的变分质量控制,且重新考虑并解决了观测资料和背景场偏差过大可能导致模式初值不协调等关键问题。最后,在暴雨天气个例同化和预报试验分析的基础上,利用批量试验充分验证了GRAPES 3DVAR变分质量控制方案的适用性和对分析与预报效果改善的能力,为进一步改善GRAPES区域同化和预报性能提供了基础。

1变分质量控制及试验方案

1.1变分质量控制原理

变分同化系统的观测目标函数建立在观测误差服从高斯分布并且过失误差概率为零的基础上。实际上,过失误差概率并不为零,统计显示其概率通常在1%~10%左右(Hampel,1974)。由于过失误差的存在,导致大量新息向量的统计分布总比高斯分布的双尾更长。在稳健估计(robust estimation;Huber,2002)理论中,为更好地拟合观测误差实际的模型分布,通常假设过失误差服从均匀分布、拉普拉斯分布等(周江文,1997)。数理统计中稳健估计又称抗差估计,稳健性是统计过程对实际模型与理论模型的小偏差的不敏感性(朱建军,1998),即抗差效果(周江文,1989)。本文根据实际观测误差分布中双尾更长的特点,假设过失误差与背景场不相关且无任何气象意义,选取均匀分布作为过失误差的分布,其不依赖观测而且计算方便(Kalnay,2003)。

变分质量控制不仅假设观测误差中随机误差服从高斯分布,而且考虑过失误差的干扰分布特征,使观测误差最终服从污染正态分布(杨元喜,1993;周江文,1997)。稳健估计理论将主体分布视为高斯分布,并根据污染率与干扰分布进行求和得到新的概率密度函数(Probability Density Function,PDF)称为污染正态分布。污染正态分布一般表示为

(2)式中β类似α为分析余差的剔除系数,从而得到观测资料的变分质量控制参数γ≈0.03;第二种方法是根据经验和试验相结合获取相对合适的参数值。由于历史数据并不能完全代表当前时刻模式同化资料的特性,导致统计获得的参数值不一定最准确,而且实际使用的阈值偏大,所以通常计算所得的参数值也会偏大。

基于以上讨论,本文将结合两种方法并参考ECMWF和NCEP的GSI(Grid-point Statistical In-terpolation)同化系统相关参数的选择,并考虑观测资料的质量差异的实际情况,选择相对较好的一组参数,即气压A=0.03,d=4.0;温度A=0.04,d=8.0;风A=0.06,d=8.0;湿度A=0.06,d=10.0。需要注意的是,无论是哪种方法获得的参数值都要定期调整,调整周期取决于观测资料质量的变化幅度。

1.4试验方案

采用GRAPES_Meso V3.0区域模式与3DVAR同化系统,重点研究变分质量控制对分析和预报暴雨天气的影响。模拟区域为70~140°E,10~60°N,背景场资料为分辨率为1°×1°的全球预报场(GFS),观测资料为探空、地面、船舶、飞机、云迹风等常规观测与COSMIC反演资料。

2013年8月14—19日,受台风“尤特”的影响,华南地区出现持续强降水,特别是广东、广西省出现暴雨到大暴雨,局部出现特大暴雨,属于典型的强降水天气过程。利用前述模式与观测资料,首先对这次降水过程进行同化预报试验,8月15日18时(世界时,下同)作为资料同化和模式预报的起始时刻,进行48 h预报,以分析变分质量控制方案对同化分析和预报的适用性和影响。在此基础上,选取2013年8月(共31 d),分别开展变分质量控制试验(VarQC试验)和控制试验(原质量控制方案)的批量试验,每天在00时和12时时进行资料同化和48h预报,以进一步检验变分质量控制对分析和预报的改善效果。个例试验和批量试验同化的资料均为常规观测和COSMIC卫星反演资料。

2变分质量控制同化效果分析

2.1分析权重的调整

根据同化试验中新息向量与分析权重的统计关系(图3),可以研究变分质量控制对观测资料分析权重的影响。从图3a中核心平滑密度(Ksdensity)估计和偏度与峰度系数可以看出,纬向风“观测的新息向量分布与理想高斯分布相比出现尖峰和正偏态,表明緯向风观测误差不完全符合高斯分布。散点值表示u在同化时获得分析权重(0QC

对控制试验、变分质量控制试验中各物理量的同化分析场(图6)进一步分析,两组试验均模拟出此次降水的主要形势场。对比图6a、b、c可知,相对于控制试验(图6a),变分质量控制试验的位势高度场减弱,低压系统增强(图6b),在减小约2 hPa后与ECMWF分析场(图6d)更接近;湿度偏差(图6c)在广东沿海出现狭长的正值区,其中4个湿度资料权重发生调整(1个可能错误资料和3个可疑资料),致使湿度场也有一定改善,更接近ECMWF的比湿场;风场在低压中心北部及东北侧加强,恰好使暖的水汽沿南风、东南风输送到降水区域,为强降水创造了有利条件。根据各物理量场的对比分析,VarQC试验的分析场可以更加准确地描述实际天气形势,这也正是变分质量控制在同化分析中发挥了重要作用的效果。

3变分质量控制对预报的影响

3.1降水预报分析

图7为2013年8月15日18时—8月16日06时本次天气过程的12 h降水预报。由图可见,两组试验都模拟出此次降水在华南地区的主要降水区域和降水中心,不过与实况降水(图7d)相比,控制试验模拟的降水强度偏弱,降水中心偏北,特别在广东省的降水强度预报较差。可能因为受台风的影响,实况降水区类似于热带气旋的结构,在广东沿海地区有一个狭长的降水带。由变分质量控制试验与控制试验的降水偏差(图7c)可以看出,变分质量控制试验的12 h降水预报在整个广东地区的降水分布和强度有着明显的提高,尤其在广东中部产生的降水偏差中心恰好是此次降水的重灾区,中部局部地区12 h的降水量达到100 mm以上,同時对广东中部及沿海区域降水分布的改善与实况狭长的降水带更加吻合,反映出变分质量控制试验对12 h降水预报能力的显著提高。

与图7类似,变分质量控制试验的24 h预报的降水偏差同样反映出对降水分布、降水中心以及强度都具有良好改善(图略)。总体来看,VarQC试验的降水预报质量相对于控制试验均有明显提高,且较好地纠正了强降水中心的位置。

3.2批量试验结果的统计与分析

为进一步验证变分质量控制方案对资料同化和预报的改善效果,统计了2013年8月1日—8月31日共31 d批量试验的24 h降水评分。ETS评分在-1/3~1范围越大效果越好,Bias评分越靠近1效果越佳。批量试验中24 h降水评分结果显示,对于ETS评分(图8a)来说,变分质量控制与传统质量控制对小雨和中雨的预报能力基本相当,但变分质量控制对大雨、暴雨、大暴雨的预报能力具有明显改善;同样地,从Bias评分(图8b)也进一步显示了变分质量控制方案对大雨、暴雨、大暴雨的预报效果的明显提高。总之,根据个例分析和批量试验结果,可以判断变分质量控制在GRAPES区域同化和预报系统中,对强降水天气过程中大雨、暴雨、大暴雨等较大量级的降水落区和降水强度预报均表现出良好的改善效果,这正突出反映了变分质量控制对强天气过程的同化分析和预报所具有的重要意义。

4结论与讨论

观测资料的质量控制是数值预报资料同化中的重要部分,将直接影响同化分析质量。本文结合GRAPES区域同化和预报系统,发展了基于“高斯分布+均匀分布”模型的变分质量控制方案,个例试验和批量试验均显示出良好的效果。变分质量控制依据观测资料的不同质量在变分同化极小化过程中,对错误观测、可能错误观测及可疑观测资料的权重进行合理降权处理,即选择性的给予不同观测以不同的重视程度,从而减小质量偏低的观测资料对分析结果的负面影响。常规观测资料的同化分析表明,变分质量控制对降水天气的较大量级的降水预报具有明显的改善作用,而对于较小量级的降水效果不明显,这也进一步反映了该方案在中小尺度强天气过程中的良好适用性。

本文的变分质量控制方案是建立在“高斯分布+均匀分布”模型的假定基础上,而且认为离群值即代表过失误差,与背景场不相关且无任何气象意义。而已有的研究显示离群值并非全无气象意义(黄幼才,1990),其可能只是不符合高斯分布而服从其他的分布模型,但可能属于正确的或正确观测信息的携带者,依然包含一定的有益信息,对此还需要进一步的研究;此外,变分质量控制初始启动迭代步数的选取也是比较关键的问题之一,何时启动能够获取最佳的初步分析场,需要大量试验验证才能相对合理的确定。另外,参数的合理取值同样影响变分质量控制的效果,这需要依据不同观测资料开展充分试验进行优化。