APP下载

基于观测路径的集合预报样本优选对热带气旋的模拟研究

2019-05-09李霁杭高郁东万齐林

热带气象学报 2019年2期
关键词:鲇鱼气旋热带

李霁杭,高郁东,万齐林

(中国气象局广州热带海洋气象研究所/广东省区域数值天气预报重点实验室,广东广州510640)

1 引 言

集合预报是对确定性预报的初始状态进行扰动并形成多个集合成员的一种预报方法[1]。它提供了一系列可能出现的未来大气状态。近年来,因其优于单一的确定性预报[2-3],且具有显著的经济效益和社会效益,因而在数值天气预报(NWP)领域得到了广泛应用[4]。

然而,研究表明,集合成员是基于离散度不充分的初始扰动组成的[5]。此外,一些研究发现,预报的不确定性主要由模式的不确定性和初始条件的不确定性构成[6]。然而,不同系统带来的不确定性通常不能很好地代表初始条件的不确定性[7]。

在有限的集合成员条件下,集合通常不能满足完美的高斯概率分布。但每个集合成员可以被视为近似高斯概率分布状态下的一个样本。这时,常常会有一些样本处于接近零概率分布范围以外的位置[7]。理想情况下,样本应反映出大气的真实的状态(这里以观测代替),但实际情况是有些样本不能反映大气的真实状态,且相去甚远。这些离群的或小概率事件的样本对统计分析是有一定意义的,但却很可能降低集合预报整体的准确性。

解决这个问题的一个方法就是调整这些样本的概率密度分布以便使它们更加接近真实(观测)的概率密度分布[1]状态,在这里将其称为集合预报的样本优选技术。因此,在这项研究中观测数据被用来限制样本的概率分布。这种方法不同于资料同化,可以被视为一种基于观测的集合技术。

一般而言,相等的权重是由一个简单的算术平均数来计算的,而不等的权重则是用更为复杂的算法来确定的。同样的原理可被用于优选集合样本的思想中,它已被成功地应用于预测暖季中尺度对流系统[8]和冷季地形强迫[9]的研究中。

路径和地表最大风速预测已被认为是热带气旋来临时定量评估风险和是否较早做沿海撤离决定[10]的重要指标。通常,热带气旋生成之处远离大陆,因此资料同化效果并不显著,且结果往往不令人满意。根据2013年的热带气旋研究数据表明,在过去的20年里,路径预报误差从1天到5天的均已减少了50%以上[11]。然而,数值预报技术的改善仍需要进一步降低热带气旋路径的预报误差。

在一些研究中,样本优选也被称为基于观测的集合子集[12-15]。Qi等[14]首先提出了一种通过挑选集合成员作为短期预测路径误差函数的方法来获得集合平均路径预报。Dong等[15]将该方法应用于单个集合,通过使用超级集合来对集合子集进行挑选和延展。中国气象局提出,对于一个给定的集合,一些样本得到的热带气旋路径预报误差较小,这样的样本被认为是“好”样本,而一些样本得到的热带气旋路径预报误差很大,明显偏离观测路径,这样的样本被认为是“坏”样本。

好、坏样本应该得到客观的评定。在本项研究中,接近期望值(观察)的样本被确定为“好”的样本,而那些属于小概率事件的,远离观测的样本则被认为是“坏”的样本,它们将被好的样本所替代,从而尽可能地反映大气的真实状态。Dong等[15]使用飓风的最优路径对发生于2012—2013年出现的飓风进行样本优选的研究。然而,实际业务中通常根本无法及时获得热带气旋的最优路径。因此,本项研究中以中央气象台实时发布的台风路径报文(http://typhoon.nmc.cn/web.html)作为限制集合成员概率分布的标准。

值得注意的是,由于观测数据被用来限制集合成员的概率分布,样本优选有可能会对集合的离散度产生影响。一般来说,在许多研究中,集合离散度被用于预测集合平均技巧的评估。Houtekamer[16]发现,当它是处于“极值”的状态下,即当它相对于平均值而言非常大或非常小时,离散度极具预测价值。Whitaker等[17]指出,离散度越偏离气候平均值,对预报技巧而言它就越有用。当离散度越接近气候平均值时,它的预测价值就越小,因为预报误差基本上是从气候分布中随机抽取的。基于集合预报系统,Grimit等[18]采用了一种完美的预测假设统计模型。在该系统中,预测误差的基本概率分布函数是已知的,单个集合成员取自随机分布,集合离散度则可预测期望误差。一般来说,一个较大(小)的集合离散度意味着更多(更少)的预报不确定性[19]。国内也已经有相关的研究成果[20-25]。

然而,在样本优选方案中,过多的坏样本被替换可能会导致集合离散度过小,这将会产生不准确的集合平均。相反,坏样本的替换数量不足则会阻碍集合平均的明显改善。因此,样本的替换数量须深入研究,仔细斟酌,方可确定,从而提高集合平均水平,但需以集合离散度不过分降低为前提。

2 试验方案设计

2.1 集合预报样本优选的具体思路

本文中,集合预报的样本优选技术主要包含两点内容:样本挑选和样本补充。

在第一点里,每个样本的质量首先应该得到评估。由于路径和强度均是热带气旋的重要指标,因此由中央气象台提供的台风观测报文被选定为样本质量评估的主要依据。以绝对误差的计算结果为前提,热带气旋的路径被用于限制样本的概率分布。以路径为例,路径误差为相同时刻热带气旋的中心预报位置与观测位置的距离。

值得一提的是,路径在本文中被认作是挑选样本的标准,而强度、回波、降水、热带气旋结构等指标同样也可以作为优选的标准,这将在未来的研究中被用到。而本文中,我们重点关注的是好、坏样本的替换是否会对集合预报产生明显的影响。接下来,每一个样本将要与观测计算出路径误差,得出结果后进行排序。误差小的得以保留,误差大的剔除,误差值居中的同样被保留。

在第二点里,由于一些坏的样本已被剔除,因而需要补充一些样本使得集合的整体成员数保持恒定,而被补充的样本就是之前提到的那些好的样本。被补充的样本并不是好样本的简单复制,而是通过集合卡尔曼滤波拥有一定的观测扰动增量。

图1为同化窗口中一个循环周期内的集合预报样本优选过程示意图。虽然集合总共包括N个样本(本文中N=60),为方便起见,示意图只显示8个样本(即此图中N=8,而M则是优选样本的个数)。以示区别,传统的集合预报称为SOno,而集合预报样本优选则称为SO后边接数字。三角形代表一个周期内热带气旋最开始的观测位置。黑色实线是观测路径,黑色实心圆表示1 h的观察位置。集合成员4和5(图中假定M=2,N=8)都是好样本。图中的SOno为没有进行样本优选的模拟路径,而SO则为进行了2个成员优选替换后的模拟路径。

本文中的研究方法与Qi等[14]和Dong等[15]提出的方法的不同之处在于,在这项研究中,被选定的集合子集成员数是可变的,而集合成员的总数却是固定不变的,但在以前的这两项研究中,只挑选出好成员且数量变化的集合子集被用于最后的预报。本质上来讲,这项研究中包含“坏”样本被“好”样本取代,以接近好样本的集合子集,而这些被补充的好样本并不是简单地复制原始的好样本,而是通过好样本的同化观测更新扰动后得到的。且协方差的计算则是剔除掉坏样本后的集合成员来进行。以图1为例进一步说明,Qi等[14]和Dong等[15]的方法中集合子集只包含选定好的样品,即M和N是变化的。而本文的方案中N值固定,只有M是可变的。M个坏样本将被M个好样品取代,有N-M个样本被保留,并用这N-M个样本计算协方差。

图1 1 h循环同化窗内集合预报的样本优选的过程示意图

2.2 模式和试验设计

本文中,共涉及两个热带气旋,分别是2016年的第4号台风“妮妲”(Nida)和2016年的第17号台风“鲇鱼”(Megi)。具体情况如下(以下均为世界时):“妮妲”从2016年8月1日00时开始模拟至2016年8月3日00时,其中8月1日19时35分,“妮妲”在广东省深圳市大鹏新区大鹏街道附近沿海登陆,20时在深圳市盐田区梅沙街道第二次登陆。3日00时,中央气象台对“妮妲”停止编号。“鲇鱼”从2016年9月26日00时开始模拟至9月29日00时,其中27日06时10分以强台风级在中国台湾花莲沿海登陆,27日20时44分在福建省泉州市惠安县沿海登陆,登陆时中心附近最大风力有12级(33 m/s),中心最低气压为975 hPa。

为了探讨集合预报样本优选对热带气旋模拟的影响,每个热带气旋共包含7个试验,为SOno、SO5、SO10、SO15、SO20、SO25、SO30。简单 解 释为:SOno为对比试验,不进行优选处理。进一步解释,SO5代表该试验中5个坏样本将会被5个好样本所取代,而SO30则代表该试验中将会有30个坏样本被30个好样本所代替。本文中如前面所言,所有的集合预报试验每一个循环结束后都将一直维持最原始的60个成员总数。

本文中使用WRF3.4.1-ARW模式,背景场采用ECM/ECMWF0.125°×0.125°的再分析资料。图2为试验的区域范围,水平分辨率为3 km,垂直分辨率为35层。其中“妮妲”的水平格点数为334×631,“鲇鱼”则为 532×412。

图2 “妮妲”(a),“鲇鱼”(b)模式区域图

下面将详细阐述试验过程。

第一步,集合预报的启动。集合扰动(由WRF-3DVar方法提供)后,先不进行同化积分6 h,主要的物理过程参数化方案与Zhu等[26]相同。基于WRF模式的EnKF同化系统由Meng等[27-28]率先开发,其中控制变量为流函数、速度势和气压的非平衡量。初始的集合成员由WRF-3DVar包自带的默认背景误差协方差选项“cv3”产生随机扰动生成[29]。类似的扰动也被用于集合的边界条件产生中。方案配置与Zhu等[26]相同,具体为:控制变量为流函数、势函数和气压的非平衡量。初始的集合成员和集合的边界场由随机扰动生成。扰动变量包括水平风分量(u、v)、位温、混合比,并且风速的标准偏差为2 m/s,温度的标准偏差为1 K,和混合比的标准偏差为0.5 g/kg。背景误差协方差的松弛系数为0.8。预报变量如扰动位温(T)、垂直速度(W)、水平风分量(U和V)、水汽混合比(QVAPOR)、云水量(QCLOUD)、雨水量(QRAIN)、位势扰动(PH)、表面气压(PSFC)和扰动气压(P)均被更新。

第二步,样本优选。集合成员生成且集合预报已启动后,采用WRF-EnKF方案进行3 h资料同化,其中资料同化1 h进行一次。该过程的方案配置仍与Zhu等[26]相同。但有一点差别需要指出的是,在3 h的循环同化窗里需要进行样本优选。过程可简单分为:样本优选、资料同化、模式积分。也就是说,坏的集合成员被好的集合成员取代这步将在EnKF[26]过程前进行。

在EnKF(EnSRF)中,α是个常量。HPbHT和R为标量,分别代表观测点上的背景误差协方差和观测误差协方差[30]。

本项目中,被补充的好样本和原始的好样本的区别在于同化时,好样本的α不为0,而被补充的样本的α为0。

第三步,模式积分。第二步样本进行3 h循环优选同化后,60个集合成员计算集合平均,该集合平均将积分到预报结束。

具体过程:“妮妲”从2016年8月1日00时开始,集合预报启动6 h后,即1日06时进入3 h循环优选同化,至1日09时止,取集合平均,积分至2016年8月3日00时,整个试验完成。“鲇鱼”从2016年9月26日00时开始,集合预报启动6 h后,即26日06时进入3 h循环优选同化,至26日09时止,取集合平均,积分至2016年9月29日00时,整个试验结束。

需要指出的是,整个试验过程中,同化的观测资料为多普勒雷达径向风,本文中共有17部华南地区的雷达进入3 h优选同化窗。

3 试验结果分析

3.1 3 h循环优选同化窗分析

首先分析一下样本优选对集合离散度的影响。图3和图4为热带气旋“妮妲”和“鲇鱼”的中心分布。图中第六排没有绿色实心圆的图为试验SO30,因为30个坏样本被好样本替换,所以不存在一般样本。

图3显示在第一个小时的循环中(06—07时)集合离散度从上到下并没有明显的下降趋势。然而在第二和第三个小时的循环中(07—09时)集合离散度下降明显,尤以SO25和SO30为甚,无论从东西还是南北方向来看,散点分布都更加集中。在最后一次循环中(08—09时),SO30试验模拟的样本明显集中于观测的西北方。而SO5离散度的演变则与SOno试验类似,SO10和SO15的离散度变化较为近似。SO20、SO25和SO30试验中随着时间的演变集合离散度有着显著下降。

图3 热带气旋“妮妲”的模拟和观测中心分布图 黑点代表观测中心,红点代表好样本,蓝点代表坏样本,绿点代表一般样本。四列代表的时间为 2016 年 8 月 1 日 06、07、08、09 时,七行从上至下表示 SOno、SO5、SO10、SO15、SO20、SO25、SO30 试验。

图 4 表明从左到右,SOno、SO5、SO10、SO15和SO20离散度没有出现明显的减小趋势,但SO25和SO30则不同,散点分布愈来愈集中。从上向下来看,从07时开始,集合离散度显著下降,特别是当优选的样本数超过15个以后,南北方向散度分布十分集中。总之,过多的(超过15个)坏样本被替换极有可能会导致集合离散度大幅下降,而少量的样本被替换则对集合离散度的影响不大。

图4 热带气旋“鲇鱼”的模拟和观测中心分布图 黑点代表观测中心,红点代表好样本,蓝点代表坏样本,绿点代表一般样本。四列代表的时间为 2016年 9月 26 日 06、07、08、09时,七行从上至下表示 SOno、SO5、SO10、SO15、SO20、SO25、SO30 试验。

图5 为循环中的路径更新情况,无论是图5a还是图5b,可以看出6条样本优选的更新折线均在SOno线之下。也就是说,通过样本优选处理,“妮妲”和“鲇鱼”的模拟路径误差皆减小。且随着坏样本被替换数目的增加,路径误差减小的幅度越大。但有一点须指明,当替换的样本数达到30个时,路径误差不减反增。

图6为第二和第三个循环中样本优选和同化进行前集合离散度和路径误差的关系。可以发现,第三个循环中的散点明显较第二个循环中的散点更为发散。图中所有情况,代表SO30和SOno的两点均在散点拟合趋势线之上,而SO5、SO10、SO15、SO20、SO25则大多数情况在拟合趋势线下方。总之,SOno试验拥有最大的离散度,SO30具有最大的路径误差,SO25拥有最小的离散度,SO20具有最小的路径误差。这进一步说明样本优选可以影响集合离散度,也同时调整着路径误差,且替换样本的数量选择非常重要。

图5 “妮妲”(a)和“鲇鱼”(b)3 h的路径误差更新

图6 路径误差和离散度的关系

3.2 模拟结果分析

表1揭示了观测和模拟结果之间的平均路径和强度误差。只有“妮妲”的SO15和SO25试验中路径误差大于SOno,其余的样本优选试验路径误差均小于SOno试验,对“妮妲”路径误差的改进从4.30%(SO20)到 13.04%(SO10)不等,而对“鲇鱼”路径误差的改进从11.34%(SO30)至27.81%(SO10)不等。强度对比中,可以看出最低气压的样本优选6个试验中有5个试验的模拟结果好于SOno试验,具体来讲,对“妮妲”的最低气压误差改进从5.73%(SO20)到 11.56%(SO30)不等,而“鲇鱼”的最低气压误差改进从1.58%(SO25)到11.62%(SO5)不等。最大风速的所有样本优选试验模拟结果误差除了“鲇鱼”的SO20,其余均小于SOno试验,其中“妮妲”最大风速的误差改进从13.19%(SO5)到37.01%(SO15)不等,而“鲇鱼”最大风速的误差改进从11.78%(SO30)到27.07%(SO10)不等。因此,可以看出本文中集合预报的样本优选方法对热带气旋的路径和强度的模拟效果整体有所改善。

表1 观测和模拟试验的路径、最低气压、最大风速误差 “妮妲”对应的时间为2016年8月1日09时—2日18时,“鲇鱼”对应的时间为2016年9月26日09时—28日21时。

图7对比了Dong等[15]的方法和本文中的方法(简称Li)的路径误差。在12个对比试验中可以发现,只有3个试验的路径误差是Li的大于Dong等[15]的。因此,本文中的集合预报样本优选的方法表现良好,特别是当更多的样本被替换时,但替换的数目最好不要多于25个。

图7 观测和模拟的平均绝对路径误差

接下来,检验一下热带气旋的垂直结构是否有所变化。图8(见下页)为热带气旋“鲇鱼”的经向风速的中心经向剖面图,可见所有试验的风速结构特征近似,热带气旋“鲇鱼”中心东侧的风速加强或减弱的趋势较明显,驱动台风向北移动。随着“鲇鱼”的强度有所减弱 (2016年9月28日00时),其发展高度也同步下降。西风带在200 hPa高度以上处于统治地位。第三列图中较为明显的差异体现在SOno试验中“鲇鱼”中心东侧的大风圈发展高度低于400 hPa,而其余优选试验中大风圈的发展高度则高于400 hPa。由此可见,样本优选已导致热带气旋结构发生了一定的变化,这将影响其路径和强度的演变。

4 结 论

本文中,我们采用中央气象台提供的观测路径报文作为限制样本概率分布的标准依据,通过一系列试验以达到尽可能使集合预报中的样本接近真实状态。紧接着,探讨样本优选对集合预报模拟结果的影响。通过结果的对比分析,最终发现,除了极少数情况外,样本优选对热带气旋路径、强度的模拟均起到较显著的影响,其中对“妮妲”路径误差的改进为4%~13%,对“鲇鱼”路径误差的改进为11%~28%,对“妮妲”的最低气压误差改进5%~12%,“鲇鱼”的最低气压误差改进1%~12%,对“妮妲”最大风速的误差改进13%~37%,而“鲇鱼”最大风速的误差改进11%~27%。

两个热带气旋的模拟结果显示本文中的样本优选结果明显好于传统的集合预报。然而,需要指出的是过多的替换集合预报成员将会导致集合离散度过分降低。少于15个样本被替换将会在一定程度上改善集合平均且又不致使集合离散度降低许多。

此外,又研究了路径的调整效果。本文中以观测路径为标准进行样本优选,结果发现路径和强度误差绝大多数情况下均有一定幅度的减小。但是,过多的或不充分的样本优选则起不到理想的效果。

继而又分析了热带气旋结构的变化,结果显示样本优选所有试验的热带气旋结构演变均符合发展规律,但是7个试验中还是存在一定的差异,以“鲇鱼”为例,样本优选试验中模拟的热带气旋结构较SOno试验偏强,这将最终导致其强度和路径发展的不同。

值得一提的是样本优选的替换数量超过5个少于25个会对热带气旋的路径、强度以及结构带来一定的正效果。

然而,本文中集合预报虽带来了较好的正效果,但仍存在一定的不足。

(1)本方案中样本优选基于热带气旋的观测路径报文,以其为限制样本概率分布的条件。然而,热带气旋的强度、降水、形状结构、回波等因素却没有考虑在内。换句话讲,确定样本是好是坏的依据可以有很多,这将在今后的研究中进行分析。

(2)样本优选影响集合离散度。过多的样本数替换导致集合离散度大幅下降,因此样本优选的数目要合理。

(3)本文中研究的对象均是热带气旋,其他的天气系统比如对流单体、飑线等还未开展研究,这也是未来探索的一个方向。

猜你喜欢

鲇鱼气旋热带
2003年3月北大西洋上两个爆发性气旋的“吞并”过程及发展机制分析❋
湾流区和黑潮区两个超强爆发性气旋发展过程中热力强迫作用的比较
氨还原剂喷枪中保护气旋流喷射作用的研究
热带风情
鲇鱼捕老鼠
智多宝智斗鲇鱼精
热带的鸟儿
T 台热带风情秀
鲇鱼钓老鼠
热带气旋集合预报技术的应用情况简介