鹤岗强降水的危险性评估
2014-07-12杜海波王洪波侯绪丽
杜海波,王洪波,侯绪丽
(鹤岗市气象局,黑龙江 鹤岗 154100)
1 引言
随着全球变暖的进一步加剧,在很多方面将导致某些极端天气、气候事件更加频发,由此产生的灾害损失也必然会越来越严重。近年来,鹤岗地区极端天气灾害频繁发生,2009年,鹤岗地区出现了春末夏初百年一遇的大旱。而2005年7月28-29日鹤岗暴雨降水量达116.7 mm,导致鹤岗出现严重的洪涝灾害,梧桐河流域超过警戒水位,达到鹤岗建站以来极值。
本文利用GPD模式,借助L-矩估计方法对模型参数进行估计,模拟鹤岗暴雨的分布概率,并对这一概率分布进行统计检验。为进一步模拟和预测鹤岗的强降水奠定理论基础。根据该模型估计一定重现期的分位数,在该地区桥梁、防洪堤坝、水库等建设中加以考虑,从而提高防御自然灾害的能力,争取最大程度的降低损失。
本文利用鹤岗50 a(1961-2010年)的逐日降水量资料,应用基于超门限峰值(POT)抽样法的广义帕雷托分布模型,再用L-矩参数估计法,模拟鹤岗地区的强降水。模拟结果表明:(1)GPD不但计算简便,而且基本不受原始序列样本量的影响;(2)POT抽样法增加了极值的样本量,L-矩估计得到的参数稳定度高;(3)在一定门限值条件下的逐日降水量所拟合的降水极值分布符合GPD模型。GPD模型对模拟和预测鹤岗的强降水过程有一定的应用价值。
2 资料和方法
2.1 资料
选取鹤岗本站50 a(1961-2010年)的逐日降水量作为研究对象。
2.2 方法
2.2.1 POT抽样
广义帕雷托分布(GPD)最大优点在于,它的抽样不只是每年抽取一个,而是从原始资料中抽取出超某一门限值的数据,即所谓的“超门限峰值POT”抽样方法。显然,在抽取的值中,每年可能会出现不只1个超过门限值的情况。由于POT抽样方法直接由原始分布抽取极值,从而使所需样本大大节省,或者说大大增加了样本量,也更加的符合实际情况。
2.2.2 门限的选择
门限值的选择是考虑其用途及在实际工作中的意义,要根据不同情况来取门限值。既不能低,也不能太高,如果门限值选低了会使选出的数据与GPD分布拟合的不太好;如果选高了,不一定有足够的样本数据能估计出合理的分布参数。本文采用年平均交叉率接近于1的方法,也就是用1 a度量降水数据超过门限值的次数,这样比较恰当。
2.2.3 GPD模型
广义帕雷托分布 (Generalized Pareto Distribution)(简称GPD)是用来表达概率分布特征的,比如,大于某临界值(β)的降水量、风速等的概率分布特征,其分布函数为
上式中,分布参数β为门限值;α为尺度参数;k为线性参数。
2.2.4 L-矩参数估计
L-矩法是由前R个L-矩和前R个PWM的线性组合而成的,其起源于“概率权重矩”(PWM),L-矩法与经典矩法相比,有许多优点,应用也越来越广泛。它的统计方法较简单,其参数估计精度与极大似然法估计精度相当,估计值的稳定性较高。计算方法如下:首先将所有大于门限值的极值按从大到小的顺序排列,x1≥x2≥…≥xn-1≥xn,由此得到一组超门限值统计量xj,对其作PWM估计,考虑PWM的定义为:
式中,Br表示随机变量x的第r阶概率加权矩,其无偏估计通式可写为:
一般情况下,r取相当的数量就可以了,很少用更高阶矩,如,要计算概率密度曲线的峰度,只需要取4阶矩,本文中只需计算b0和b1,根据概率加权矩与L矩的关系,有
这里λi分别表示第i阶L矩,b0和b1则分别表示0阶和1阶PWM估计量,根据(4)式可推出下列关系式:
由(9)(10)两式可最终得到GPD的参数 α和k估计式:
式中,β是门限值,也就是临界值。例如,要研究降水量,可事先根据需要定出门限值或临界值是多少,也可按标准差的倍数作为各种试验的临界值。
2.2.5 重现期与对应分位数的计算
研究重现期(return period),就是要对极值进行统计,找出分布规律。对于强降水的研究,要考虑的是超过某定值x的概率,称为右侧概率,可用下式表示:
根据重现期T的含义,可以认为出现极值的概率的倒数即为重现期,对于最大值的重现期可表示为:
值得注意的是,所谓重现期,并非指经过T时间就一定会出现,它只是概率意义上的回转周期。T反应了事件发生概率的大小,重现期T越大,代表的概率就越小,越是稀有事件。
在确定重现期后,就可得到与T对应的极值分位数,极值的分位数就是对应着气候稀有事件概率的极值变量的某种可能取值。由(14)式和pareto分布模型-(1)式,可推出极值分位数的表达式,k不为0时有:
式中,λ为年交叉率,即每年极值超过门限值的次数。也就是从原始资料中找出超门限值的数,记为n,用它除以数据资料的总年数N即可,λ=n/N。
2.2.6 柯尔莫哥洛夫--斯米尔诺夫检验(K-S检验)
所谓K-S检验,是在20世纪初提出的关于顺序统计量极限分布的定理发展而来的,用于检验样本是否来自某一特定分布的方法。其检验方法是将样本数据的累积频率分布与特定理论分布比较 (即将经验分布函数与理论分布函数比较),若F0(x)表示理论分布函数,本文中为GPD模型,Fn(x)样本的累计频率函数,累计频率=累计次数/总次数,D为F0(x)与Fn(x)的最大差值,即 D=max|F0(x)-Fn(x)|。 再根据置信水平1-a或信度a判断其是否通过K-S检验。
2.2.7 相关系数检验
由经验分布函数和理论分布函数可以分别确定一个与降水量相对应的概率值,若取多个不同的降水量,则可以得到两组表示概率数据,分别记为x(i)和y(i),可由如下公式计算它们的相关系数:
3 GPD模型在鹤岗暴雨中的应用
鹤岗市位于中国东北边陲,座落在小兴安岭与三江平原交汇地带,属丘陵地形,高低起伏,鹤岗属高纬度地区,130°16′E,47°20′N, 由于西太平洋副热带高压在夏季达到最北位置,副热带西风急流和东亚季风的水汽输送也达到最北,给黑龙江东北部带来了充沛的水汽,暖湿空气与西风带中的冷空气交绥,易出现暴雨。故降水主要集中在7、8月,其他月份相对较少。加之特殊的地理条件致使鹤岗地区极易发生局地暴雨等灾害性天气,近两年鹤岗出现的暴雨量等级均超过历史极值。
对鹤岗1961-2010年(50 a)的降水资料按给定的门限值做 POT 抽样,根据(3)-(12)式,对选取的数据采用L矩估计,由GPD模型中可得出一定重现期对应的分位数,再求出此极值在实测数据中出现的概率,即比较理论分布函数和经验分布函数,做柯尔莫哥洛夫——斯米尔诺夫检验(K-S检验)和相关系数的检验。表1给出了门限值为50mm的GPD模型参数及拟合效果检验。
由表1可以看出,GPD模型参数估计的效果比较好,K-S统计量为0.06,通过检验,且其实测频率和理论频率的相关系数在0.9973,说明相关性较好。
表1 鹤岗市50 mm门限取值的GPD模型参数估计及其效果检验
表2 鹤岗GPD模型重现期表
4 结果分析
4.1 重现期的选定
重现期代表了极值出现的概率,这是研究极值分布模型最关心的问题,表2得出了鹤岗GPD模型的重现期。但重现期的取值与样本的容量有关,本文的样本容量仅为50 a,故50 a以下,甚至70 a以下的拟合效果比较好,时间较长拟合效果不一定很好。
4.2 拟合效果检验
pareto模拟曲线的拟合效果很好,与实测曲线的走势基本一致,理论频数与实测频数的吻合程度比较高。由此可见,鹤岗的逐日极端降水量基本上符合GPD模式。对于鹤岗地区极端降水量采用广义帕雷托模型(GPD)拟合是完全可行的,有很高的实用价值。
5 小结
本文利用广义帕雷托分布模型 (GPD),借助于L-矩参数估计法,对鹤岗的极端降水进行模拟,取鹤岗的降水资料为样本作POT抽样,再分别估算其参数,建立GPD模型,推算一定重现期的极端降水量分位数,并检验其拟合效果,结果表明:
(1)利用广义帕雷托分布模型能较好的拟合鹤岗的暴雨分布概率,且GPD模型计算简便,稳定性好,基本不受原始序列样本量的影响。
(2)POT抽样法增加了极值的样本量,L-矩估计得到的参数稳定度高。
(3)在实际工作中,利用GPD模型推算出五十年一遇或百年一遇的极端强降水量,可为预防强降水引发的洪涝灾害工作提供参考数据。