基于动力相似方法的台风极端降水概率预报研究
2019-07-12姜丽黎余晖
姜丽黎,余晖
(1.中国气象科学研究院,北京100081;2.中国气象局上海台风研究所,上海200030)
1 引 言
近年来,随着卫星遥感和数值预报技术的发展,台风路径预报取得明显进步[1]。相对而言,台风降水预报技术仍发展缓慢,风雨预报的精细化程度远不能满足需求,特别是对极端降水的预报[2]。21世纪初,Lalaurette[3]基于欧洲中期天气预报中心(简称ECMWF)集合预报(简称EPS)发展了一种极端天气预报方法——极端天气预报指数(Extreme Forecast Index,简称 EFI)。其原理是计算模式气候与EPS累积概率分布函数的连续概率差异,检验表明该指数对极端天气事件具有较好的预报效果。江志红等[4]考察政府间气候变化专门委员会第4次评估报告的7个全球模式及5个集合预报模式对极端降水指数的模拟能力,指出极端降水指数气候场空间分布能较好地被全球模式所模拟。刘琳等[5]在该方法的基础上,建立了基于中国气象局(CMA)T213 EPS的极端降水天气预报指数(Extreme Precipitation Forecast Index,简称EPFI),试验结果表明该指数可提前3~7天发出极端强降水预警信号。
从EPS中提取极端降水概率作为先验概率,再将贝叶斯理论应用到EPS产品的释用中,是近年来颇受关注的一种方法。陈朝平等[6]利用贝叶斯原理和泊松分布,对四川暴雨进行集合概率预报释用,结果表明后验概率可以增强暴雨可能出现的信号,有效减小空报的可能性。张宇彤等[7]根据贝叶斯理论探讨了极端降水的概率预报方法,并进行了贝叶斯极端降水模拟概率预报试验和检验。试验结果表明经过贝叶斯方法修订后的极端降水预报,提高了预报的准确率,但空报也有所增加。韩焱红等[8]同样基于贝叶斯定理进行24 h降水的概率预报,结果表明修订后的后验概率逐日变化明显,与确定性预报相比,单一集合成员的贝叶斯降水概率预报在预报范围内提供了更多的预报信息。赵琳娜等[9]利用贝叶斯模式平均方法,集成和订正了对集合预报15个成员的定量降水预报,并对贝叶斯模式平均方法所做的订正结果进行检验,结果表明提高了预报能力。郯俊岭等[10]通过贝叶斯模式平均方法,预估了中国将来的气温变化趋势及其时空分布的不确定性。段小刚等[11]通过实例分析,表明BMA统计后处理,无论是精度还是校准度,相对于原始集合预报都有优势。Raftery等[12]提出了贝叶斯模型平均(Bayesian Model Averaging,BMA)方法,将单个集合成员预报结果修订为概率密度函数形式的预报,但该方法对极端事件的预报准确性较差。董全等[13]采用了ECMWF的EPS系统和确定性模式资料,通过日降水量极端天气预报指数(EFI)和改进的贝叶斯模型平均(MBMA),对比了淮河流域暴雨的预报效果。结果显示,MBMA预报效果最好,优于确定性模式。
丑纪范[14]在1986年论述了动力与统计相结合的思想,认为单纯的动力或统计方法都存在自身的缺陷,两者结合能更好地利用历史资料和近期演变资料,对未来做出更准确的估计。任宏利等[15]将统计和动力有机结合,发展了一种相似误差订正(ACE)方法,以减小模式误差,改进当前预报。曹晓岗等[16]根据车贝雪夫展开系数的物理意义,定量地描述了暴雨环境背景场,结合热力、水汽、动力条件等建立了暴雨综合预报模式。钟元等[17]提出了一个台风降水定量预报的动力相似方案,结合台风初始参数、历史过程的天气形势场和物理量场等,通过定义非线性的相似指数,综合评估历史台风与当前台风的相似程度,以找到相似样本,检验表明该方法具有一定的预报技巧。本文将采用钟元等提出的台风降水定量预报的动力相似方案,研究台风极端降水概率预报方法,为提高台风极端降水事件的预报能力提供参考。
2 资料与方法
2.1 资 料
选取从1985—2015年进入我国24 h警戒线并登陆我国的267个历史台风样本,每个台风样本的参数,包括时间、位置、中心气压及近中心最大风速,均取自台风年鉴[18];环境场资料取自美国国家环境预报中心(NCEP)和美国国家大气研究中心(NCAR)的逐6 h再分析资料,分辨率为2.5°×2.5°;环境预报场资料取自NCEP的全球预报模式系统(GFS)预报,分辨率为1°×1°;日降水资料取自台风年鉴,以前一日20时至当日20时的降水量作为当日24 h累计降水量。
2.2 极端降水阈值
政府间气候变化专门委员会(IPCC)第三次报告[19]定义,对一特定的事件和地点,极端天气事件就是发生概率极小的事件,通常发生概率只占该类天气现象的10%或者更低。王晓等[20]根据翟盘茂等[21]提出的百分位法,将1981—2013年全国各测站的日降水量按升序排列,以第95个百分位上的降水量,作为相应测站的极端日降水阈值。根据站点在33年间迁站距离小于7.8 km、站点间距离不小于15 km等标准,并剔除台风日降水样本数少于10个的站点,共选取了1 195个站点进行极端日降水阈值的计算,即下文预报试验所用到的站点。由图1可知,日极端降水阈值从沿海至内陆逐渐降低,与夏侯杰等[22]所得出的结论相近;且在山东、北京、辽宁等地区出现较大值区域,可能与台风引起的远距离降水有关[23-24]。
2.3 台风降水定量预报的动力相似方案
钟元等[17]提出的台风降水定量预报的动力相似方案,应用台风的初始参数、历史过程的天气形势场及数值预报产品(NCEP的全球预报模式系统预报,分辨率为1°×1°),构造了15个相关因子。其中包括台风初始位置、中心气压、初始速度和初始移向,这些参数代表台风的强弱;海平面气压场代表台风的强弱及影响范围;温度场代表台风暖心结构,即与其生命史攸关;高低层风场和中层引导气流代表与台风移动有关的环境场因子[25-26];中低层湿度场、流场、垂直速度场、水汽通量场及水汽通量散度则与水汽输送息息相关。
将15个相关因子结合三种相似识别方法,分别为空间平面场分布相似、空间平面场距离相似及空间点要素值相似,得到28个相似判据。由于各个相似判据的量纲和阈值不同,为统一评估所有相似判据,构造一种非线性的相似指数SIi,j。具体是将所有相似台风的同一个判据的空间平面场的相似系数的最大值与最小值相减,并除以10,得到每个相似判据的十等分值ΔDi;将每个相似台风的相似判据与其相对应的十等分值相减,其绝对值为 Dfi,j;最后以 0、(ΔDi)/4、2×(ΔDi)/4、3×(ΔDi)/4、4×(ΔDi)/4、……、14×(ΔDi)/4、20×(ΔDi)/4 为界限,根据Dfi,j所属的上述界限区间,确定SIi,j的值,范围为0~10。通过非线性变换后,使得更为相似的历史台风得到更高的相似权重,从而实现了历史台风在相似程度上的分离。同样依次对每个以欧式距离和空间点要素值所做的相似判据进行上述步骤,以获取每个相似判据的SIi,j,再根据多次试验所得的各判据的权重将所有相似判据的SIi,j相加,得到最后的相似指数SIn。最后将历史台风按相似指数降序排列,选取前N个作为相似样本,再以相似指数为权重得到相似样本降水量的集成,预报未来6~48 h的降水量。
图1 受台风影响的站点的日极端降水阈值分布
2.4 极端降水概率预报方法
依据上述动力相似方案,可得到N个历史相似台风及其对应的相似指数,再通过以下极端降水降水概率计算模型进行极端降水的概率预报。
首先定义极端降水系数C(k,t,n),若历史台风n在t时次,于某站点k产生的降水超过极端阈值,取为1,否则为0。其次,利用相似指数SIn,求出每个相似样本所占权重,将其与极端降水系数C(k,t,n)相乘。最后将该测站上所有相似样本累加,即为该测站该时次的极端降水概率EPP(k,t)。具体表达式如下:
3 极端降水概率预报试验及检验
3.1 预报试验
选取2012—2015年登陆中国的25个台风为样本进行预报试验,以前一日20时至当日20时为一天,起报时刻为台风登陆日的前一日的20时,分别进行24 h、48 h和72 h的极端降水概率预报,只要EPP非零,即认为出现极端降水。每次计算相似样本时,历史台风仅取到当前样本年份的前一年,即回算2012年样本的相似指数时,历史台风取1985—2011年;回算2013年样本时,历史台风取1985—2012年,依次类推。
图2显示,4年间登陆中国的25个台风的登陆点分布于东部至南部沿海,其中登陆广东和海南的台风有16个,登陆福建有6个,登陆浙江和江苏有3个。图3显示,台风登陆的24 h和72 h内极端降水站点数较少,中位数为6个,但72 h的分布范围更广,且有8个台风无极端降水产生,可能此时台风结构已不完整,且无足够水汽提供。48 h的极端降水站点数最多,中位数和上下四分位值均超过其他两个时次;该时段内共有15个台风的极端降水站点数超过了对应的24 h和72 h,已有学者发现,台风登陆后降水增幅除了与高层强辐散场和较长水汽通道有关外,还与西风槽、阻塞高压、纬向次级环流等密切相关[27]。其中48 h和72 h的极大值均为1415号台风“海鸥”造成,活跃的西南季风不断为其输送能量和水汽[28],致使其产生较为广泛的极端降水。对样本登陆时的强度与各时次极端降水站点数进行回归分析,24 h、48 h、72 h 的相关系数分别为 0.34、0.43 及 0.48,且48 h和72 h通过0.05的显著性检验,说明48 h和72 h的登陆时强度与极端降水站点数呈正相关关系。
图2 样本路径分布图
图3 包含台风登陆时刻起的连续三个20时—20时的日极端降水站点数箱根图 红色实线为中位数,箱形区域上下两侧分别为25%和75%分位值,上下黑色实线分别为最大值和最小值,红色加号为极大值。
3.2 预报检验
采用 Brier评分(BS)、命中率、空报率、ETS(Equitable Threat Score)等对该极端降水概率预报方法进行检验。Brier评分定义了一种均方概率误差,如式(2),综合考虑了可靠性、不确定性及分辨性,是常用的概率预报检验方法之一,已广泛应用于降水概率预报评估中[29]。式(2)中P为极端降水的预报概率;P0为实际发生极端降水的概率,若实际降水量超过阈值,则为发生极端降水,P0为1,否则为0。BS的范围是0~1,BS越小,预报效果越好。ETS相对于通常用于评价降水预报能力的指标TS(Threat Score),加入了一个随机项Nrandom,得到公平TS评分。ETS取值范围是-1/3~1,其值越大,预报效果越好;当其等于0及负数时,表示无预报技巧。
POD(Probability of Detection)是衡量准确预报了多少次实际发生的事件,可以了解该预报的命中率。POD越大,说明预报效果越好。FAR(False Alarm Ratio)是衡量预报为发生的事件,在观测中没有发生的概率,即空报率。FAR越小,说明预报效果越好。表1中,NA表示预报命中次数,NB表示空报次数,NC表示漏报次数,ND表示预报和实况均未发生,由这四项可得式(3)、(4)和(5),即命中率、空报率和ETS。
表1 双态分类列联表
图4a显示,24 h和72 h的BS中位数最小,约为0.005,下四分位值均接近0。但24 h的上四分位数为0.015,远小于72 h,说明其预报效果优于72 h。48 h的中位数为0.016,上四分位数为0.025,均为三个时次中的最高值。图4b显示24 h的ETS中位数最大,为0.035,且有两个极大值,分别为1211号台风与1323号台风;24 h和48 h的上四分位值较大,在0.05左右,预报效果较好;72 h的中位数为0,且上下四分位及中位数均接近0,基本无预报效果。
图4 各预报时次的Brier评分(a)和ETS(b)箱根图
图5a(见下页)显示三个预报时次中,24 h的FAR中位数最小,为0.95,48 h的中位数为0.97,而72 h的中位数与上四分位值均接近1,说明其空报率非常高;24 h和48 h的下四分位值在0.9左右,远小于72 h;且24 h有两个极小值在0.60~0.66间,分别为1211号台风与1323号台风,说明24 h的空报率较低。图5b显示各时次POD的分布情况,24 h的中位数及上四分位值均为最高,说明预报命中率最高;其次为48 h,其中位数为0.09左右;而72 h的中位数和下四分位值均接近0,说明该时段内大部分台风的预报命中率接近0。
由以上分析可知,24 h的预报效果最好,其次为48 h,而72 h的预报效果最差,其ETS和POD接近0,FAR接近1。因而下文只对24 h和48 h的预报展开分析讨论。
4 敏感性试验
4.1 相似成员数敏感性试验
由式(1)知,极端降水概率EPP与相似历史台风数N密切相关,因而本节将对每个预报样本的相似台风数N进行敏感性试验,分别取前5%、10%、15%、20%、25%、30%......、100%比率的相似台风个数,分级检验,以确定预报效果最好的相似成员数。
对25个样本进行相似成员数的分级试验,将所有样本各级评分相加求平均,得到20个各级评分均值。图6a表明,随着相似成员数比率的增大,两个时次的BS均逐渐降低,预报效果逐渐变好;且BS均在95%处迅速下降,在100%时达到最低值。图6b显示24 h的ETS呈现逐渐上升的趋势,最高ETS出现在100%处,此时预报效果最好;48 h的ETS整体变化不大,在100%处略微上升,达到最大值0.029。
图5 各预报时次的FAR(a)和POD(b)箱根图
图6 相似成员数比率试验Brier评分(a)和ETS(b)
图7a显示24 h的FAR呈现先升后降的趋势。FAR最高点出现在20%,达到了0.975;之后迅速下降,在100%达到较低点0.916。48 h的FAR在5%时最低,仅为0.858,此时该预报方法对多数台风并未预报有极端降水发生,即多数FAR不存在,从而导致FAR最低,之后FAR迅速上升并维持平稳。图7b显示随着相似成员数比率的增加,两个预报时效的POD均逐渐增大,且最大值均出现在100%处,24 h的最大POD为0.29,48 h为0.16。
图7 相似成员数比率试验FAR(a)与POD(b)
由以上分析可知,对24 h和48 h的预报,BS、ETS及POD均显示相似成员数比率为100%时,预报效果最好。FAR显示在5%时值最低,预报效果最好,但此时其他三个检验显示预报效果较差;之后随着相似成员数比率的增大,FAR变化不大,且100%处的FAR并非最大值,即此时的空报率为中等或偏低水平,预报效果相对较好,因而对两个预报时次,均认为相似成员数比率为100%的预报效果最好。
4.2 极端降水有效概率阈值敏感性试验
前文均直接采用公式(1)得到的极端降水概率EPP进行预报,即EPP只要是非零值,就认为会出现极端降水,并未对其设置概率阈值,这可能导致出现零散空报区域。由上文分析可知,相似成员数比率为100%时预报效果最好,因而本节将在相似成员数比率为100%的基础上,将极端降水概率预报的有效概率阈值分别设为0%、0.5%、1%、1.5%、……、9.5%、10%。概率阈值为0.5%表示当预报概率小于0.5%时,记为0,算作无极端降水发生,只有预报概率大于0.5%时才预报有极端降水发生,以此探究不同概率阈值是否会影响预报的准确率。
图8a显示两个时次的BS变化趋势相近,24 h的BS在0%~2%间基本保持不变且为最低值,说明该区间内的预报效果最好;48 h的BS在0%~1.5%间基本保持不变且为最低值。图8b显示两个时次的ETS检验情况与BS一致,24 h和48 h的ETS分别在0%~2%和0%~1.5%间最大,预报效果最好。
图8 有效概率阈值试验Brier评分(a)和ETS(b)
图9a显示24 h的最低FAR出现在8.5%处,之后略微上升,变化不大;48 h的最低FAR出现在10%处。图9b显示两个预报时次的POD变化趋势相近,24 h的POD在0%~2%间保持不变且为最高值,在0.29左右,说明该区段内的命中率最高;48 h的POD在0%~1.5%间保持不变且为最高值,之后迅速下降。
综合以上分析可知,除FAR显示在8%或10%处的空报率最低、预报效果最好外,BS、ETS及POD均显示24 h预报效果最优的有效概率阈值为0%~2%,48 h为0%~1.5%。
图9 有效概率阈值试验FAR(a)与POD(b)
5 典型个例预报试验
5.1 台风“苏迪罗”、“海鸥”概况
2015年第13号台风“苏迪罗”于7月30日20时(北京时,下同)生成后向西北方向移动,于8月7日20时发展为超强台风,随后于8日04时40分在台湾省花莲县登陆,之后路径北折向福建,并在8日22时10分登陆福建省莆田市,登陆时中心最大风速为30 m/s,最后强度逐渐减弱,于9日15时进入江西。充沛的水汽条件、地形抬升作用、冷空气入侵等条件,造成整个过程降水强度强,且在陆地上维持时间长[30]。2014年第15号台风“海鸥”于9月8日在关岛东南部海面生成,后向西北方向移动;于9月13日20时发展为台风,之后于9月16日上午09时40分在海南省文昌市翁田镇登陆,登陆时最大风速为40 m/s;后于当日12时45分在广东省湛江市徐闻县海安镇再次登陆;最后继续西行于云南省境内消亡(图10)。
图10 台风路径图 不同颜色表示不同强度等级。
5.2 台风“苏迪罗”预报试验
选取2015年8月8日20时为起报时刻,8月8日20时—9日20时为24 h的预报时段,48 h和72 h的预报时段依次类推。“苏迪罗”的强降水主要发生在登陆福建前后的9个小时内[20],即8月8日20时—9日05时,该时段为预报的24 h内;在72 h内,仅有4个站点发生极端降水,且命中率为0,因而本小节着重讨论其24 h和48 h的预报情况。图11为24 h和48 h的实况降水与极端降水预报图。图11a为24 h的实际降水情况,该台风降水范围遍布福建、浙江、江苏、安徽及江西部分地区,强降水区主要在浙闽交界处,最大日降水区出现在福建,达200 mm以上。图11b为24 h的预报情况,黑点为实际出现极端日降水的站点,共有30个,命中率为0.689 7。该图显示预报极端降水区域同样集中在浙闽交界处,最大概率达8%,且基本覆盖实际产生极端降水的站点,与图11a实际强降水区域分布型相近;在其他区域,该方法漏报了6个发生在江苏、浙江、安徽的极端降水站点,且多地预报有零散的极端降水,概率在5%以下,预报范围较广,空报数较多。
图11c为48 h的实际降水情况,该时段降水同样主要发生在东部地区,强降水发生在江苏,最大值达175 mm以上。48 h的命中率为0.032 3。图11d显示该日共有32个站点发生极端降水,主要分布在江苏、安徽、浙江和福建,预报最大概率为8%,但偏离实际发生的区域,预报效果较差。
5.3 “海鸥”预报试验
选取2014年9月15日20时为起报时刻,9月15日20时—16日20时为24 h的预报时段,48 h和72 h的预报时段依次类推。图12(见P362)为24 h、48 h和72 h的实况降水与极端降水预报图,该台风在三个时段内均有极端降水产生,其中后两个时段产生极端降水的站点数较多。图12a为24 h的实际降水情况,该台风强降水区域主要在海南,然而图12b显示此时仅在海南、广东、江苏和江西有少量极端降水预报,命中率为0.133 3,预报效果较差。图12c和12e显示,48 h和72 h的强降水区西移至广西、云南、贵州和四川等,分别有82个和92个站点发生极端降水,造成严重灾害。然而图12d和12f显示,此时的预报区域主要在海南,稍向广西偏移,命中率均在0.1以下,基本没有命中,预报效果极差。由此可见该方法对1415号台风的预报能力较弱。
图 11 台风“苏迪罗”24 h(a、b)、48 h(c、d)和 72 h(e、f)的实际降水(a、c、e)与极端降水预报(d、d、f)
6 结论与讨论
在动力相似方法的基础上,研制并提出了一种极端降水概率预报方法,并对该方法的相似成员数和有效概率阈值进行敏感性试验,以获得预报准确性更高的极端降水概率预报方法;最后运用该方法对台风“苏迪罗”和“海鸥”进行预报试验,主要得到以下结论。
(1)该相似动力台风极端降水概率预报方法具有一定的预报技巧,24 h的命中率约为0.29,48 h的命中率约为0.16;BS、ETS、POD及FAR均显示24 h的预报效果优于48 h,且72 h的预报效果极差;预报区域比实际发生区域大,有较多零散的预报区域,且FAR较大,说明该方法的空报率较高。
图 12 台风“海鸥”24 h(a、b)、48 h(c、d)和 72 h(e、f)的实际降水(a、c、e)与极端降水预报(b、d、e)
(2)对样本相似成员数进行分级敏感性试验,并通过四种检验方法进行检验,结果表明:两个预报时次均在相似成员数为100%时预报效果最好。
(3)在最佳相似成员数为100%的基础上,对极端降水概率的有效概率阈值进行敏感性试验,结果显示:24 h的最佳有效概率阈值为0%~2%,48 h的最佳有效概率阈值为0%~1.5%。
(4)对“苏迪罗”和“海鸥”台风的预报表明,该方法对不同台风表现出不同的预报技巧。其中对“苏迪罗”有一定预报技巧,24 h的命中率为0.689 7,优于48 h的预报;但存在预报区域偏大的现象,有较多零散的预报区域分布在华南。
需要指出的是,本研究只检验了2012—2015年登陆中国的25个台风,试验结果可能缺少稳定性,今后会对更长时间序列的台风样本进行检验;其次,由于资料的限制,目前只进行了日极端降水概率预报的试验,不同台风的起报时间与登陆时间的间隔差距较大,今后可进行逐6 h的极端降水概率预报试验;由于GFS预报资料和逐日6 h再分析资料的分辨率分别为1°×1°和2.5°×2.5°,分辨率较低,而极端降水和中小尺度天气系统有更直接的关系,这反映了该动力统计方法目前的局限性,下一步会考虑替换更高分辨率的资料,以解决该问题。