基于Copula函数的长春市暴雨联合分布与特征分析*
2015-05-13郭恩亮张继权王永芳
郭恩亮,周 沫,张继权,王永芳,哈 斯,张 峰
(东北师范大学环境学院,东北师范大学自然灾害研究所,吉林长春130117)
基于Copula函数的长春市暴雨联合分布与特征分析*
郭恩亮,周 沫,张继权,王永芳,哈 斯,张 峰
(东北师范大学环境学院,东北师范大学自然灾害研究所,吉林长春130117)
利用1951-2012年长春市逐日降水数据,选取历年暴雨量、暴雨量贡献率和年均暴雨强度为暴雨要素值,运用ArchimedeanCopula函数构建二维联合分布,并利用AIC和RMSE进行Copula函数参数的优度检验,确定适合暴雨要素的最优Copula函数,然后分析多要素联合后暴雨概率和重现期特征,研究表明:①广义极值分布对长春市暴雨要素的拟合效果最好,多要素联合中,FrankCopula和ClaytonCopula适合反映多要素联合下暴雨发生的概率;②暴雨联合重现期主要集中在0~12年之间;暴雨要素值较小时,同现重现期较短,大致在0~50年之间,随着暴雨要素值的增大,同现重现期相应延长;两种重现期变化趋势一致,存在同步效应;③二维Copula联合可从多方面呈现暴雨要素间的内在信息,并且Copula函数种类的多样性为确定最优暴雨要素二维联合提供了可能,为Copula函数在暴雨要素联合中的运用提供了有利条件。
Copula函数;二维联合;暴雨要素;重现期;吉林长春
根据IPCC第五次评估报告,气候变暖是现阶段全球气候变化的主要特征,其中极端天气事件频率和强度的变化趋势越来越明显,呈现出逐渐增长趋势[1]。我国平均气温也呈明显上升趋势,升温幅度约为每年0.5~0.8℃。与气候变暖相对应的是很多地区的降水也发生了变化,由于我国处于东亚季风区,降水时间集中,强度大,因此暴雨引起的灾害频发、广发,给社会经济造成了巨大的损失[2-3]。因此国内外学者对于暴雨的时空变化特征进行了大量的研究,研究成果有利于进行科学的灾害风险管理和水资源的合理利用[4-6]。但是现阶段对暴雨特征进行分析,主要集中于一次暴雨事件或者对暴雨频次、暴雨强度、暴雨周期性等单一要素特征进行研究,然而,随着气候变化影响的加剧,暴雨引起的灾害呈现出多层次、全方位的特点,单独对暴雨单一要素进行特征分析,已经很难满足对于极端降水变化特征和灾害风险管理的需求,因此急需对暴雨要素间的相互关系和联合概率分布特征进行研究。
Copula函数是由Sklar在1959年首次提出,作为多维联合分析方法之一,它可以对变量间的相依性结构进行度量并计算其联合概率分布.与其他方法相比,Copula函数具有无需统一变量边缘分布的优势,因此被广泛应用于保险和金融业中[7-9]。近年来,Copula函数被引入应用于水文频率、干旱、沙尘暴等方面的多变量研究中[10-14],但是在极端降水方面应用较少,因此本文从暴雨要素的多面性出发,利用Copula函数多维联合的灵活性,构建二维联合分布,探讨历年暴雨量、暴雨量贡献率和年均暴雨强度的内在概率分布特征以及联合重现期和同现重现期的变化情况,揭示多要素联合背景下的暴雨特征,为区域暴雨研究提供新的思路。
1 数据来源与研究方法
1.1 数据来源
选取由中国气象数据科学共享服务网提供的长春市1951-2012年的逐日降水资料。其中根据国家气象部门规定,24 h降雨量为50 mm或以上的降水称之为暴雨。选取历年暴雨量(Pa)、暴雨量贡献率(R)和年均暴雨强度(Ia)为暴雨要素值,用于反映暴雨在长时间序列上的变化特征。
1.2 研究方法
1.2.1 暴雨要素边缘分布函数
通过对目前国内概率分布函数的研究进行分析,本文分别采用正态分布(NORM)、泊松分布(POISS)、指数分布(EXP)、极值分布(EV)和广义极值分布(GEV)等方法对暴雨要素边缘分布进行拟合,其中利用极大似然函数进行边缘分布参数估计,如式(1)~(3)所示。
式中:L(θ)为似然函数;F(xi;θ)为边缘分布密度函数,θ为待估参数。进一步应用Kolmogorov-Smirnov2(简称K-S2)作各边缘分布拟合优度检验,确定适合各暴雨要素的概率分布函数。
1.2.2 暴雨要素联合分布函数
Copula函数通过不同边缘分布以及其相关结构组建成联合分布函数,常见的Copula联合函数的构造类型有3种:椭圆型、二次型和Archimedean型。不同的Copula函数有着不同的适用范围,本文选用四种二维Archimedean型Copula函数进行暴雨要素二维联合,具体的分布函数及参数范围如表1所示。
采用AIC准则和均方根误差RMSE评价二维暴雨要素的Copula函数参数拟合度优劣,判断依据是AIC、RMSE准则值最小,其表达式如下:
式中:Pei为暴雨要素二维联合经验概率;Pi为Copula函数联合分布值;i为模型中所含参数个数。
1.2.3 暴雨要素重现期
由重现期理论可知,暴雨中某要素大于或者等于某特定值的重现期为:
式中:Tx为暴雨的单变量重现期,F(x)为各要素的边缘分布;N为观测样本长度,n为观测时段内超越特定样本出现的次数。
二维暴雨变量组合重现期包括联合重现期和同现重现期,其中两变量联合重现期是指变量x或y超过某个特定值的重现期,它的计算公式为:
两变量同现重现期是指变量x和y都超过某个特定值的重现期,它的计算公式为:
2 长春市暴雨特征分析
2.1 暴雨要素拟合分布
首先运用式(1)~(3)对暴雨要素的五种概率分布函数的参数进行估计,然后利用K-S2法对各概率分布函数进行检验。主要运用P值进行显著性检验,P值越大,概率分布函数参数拟合的效果就越好,并且通过检验的可能性就越高。各暴雨要素的拟合检验值如表2所示。
由表2可知,正态分布(NORM)、泊松分布(POISS)和指数分布(EXP)对于暴雨要素的拟合检验值皆未通过0.05的显著性检验,说明上述三种概率分布函数,对于变量的拟合效果较差,并不适用于长春市暴雨要素的拟合。极值分布(EV)和广义极值分布(GEV)对于暴雨要素的拟合效果较好,特别是广义极值分布对于暴雨量贡献率和年均暴雨强度拟合度最高,为了进一步验证拟合效果的优劣,利用matlab软件进行极值分布和广义极值分布的拟合(图1),由图1可知,广义极值分布比极值分布相比,其拟合曲线更接近与经验分布曲线,因此本文选取广义极值分布进行暴雨要素边缘分布的拟合,各要素边缘分布函数及对应的参数值如表3所示。
由暴雨要素拟合曲线(图1)可知,历年暴雨量、暴雨量贡献率和年均暴雨强度随着强度的增加,其变化速率呈减小趋势,说明长春市暴雨发生频繁且年际变化幅度不大,其中暴雨降水强度主要集中在60~140 mm区间。暴雨量贡献率和年均暴雨强度拟合曲线相对来说较为一致,说明分布较均匀,不存在明显集中区域。单要素曲线拟合所提供的仅为要素本身的相关信息,但对于具有多要素的暴雨而言,在纵向分析的同时,还需侧重横向的联系,即需要加强对暴雨要素间的联合特征分析。
表1 二维ArchimedeanCopula分布函数及参数范围
表2 暴雨要素边缘分布K-S2检验P值
2.2 暴雨要素二维联合分布
年暴雨量、年均暴雨强度和暴雨量贡献率中选取二个要素构建三对Copula函数二维联合分布,利用式(1)~(3)进行Copula参数估计,采用表1中的Copula分布函数公式进行二维拟合,通过式(4)进行优度检验,相关参数及检验值见表4。
根据RMSE和AIC最小原则,选取FrankCopula函数为年暴雨量和暴雨量贡献率为二维联合的Copula分布,ClaytonCopula函数作为年暴雨量和年均暴雨强度、年均暴雨强度和暴雨量贡献率的二维联合Copula分布。通过matlabSurf工具以暴雨要素边缘累积分布值为X-Y-Z轴,得到二维联合概率分布三维图(图2)。由图2(a)可知,年暴雨量和暴雨量贡献率呈现较高的同步性,说明在历年暴雨量占全年降水量的比重较大,即长春市降水比较集中,且降水量来源主要为强降水事件。图2(b)和图2(c)显示了X-Y-Z数值的差异呈现暴雨各变量在累积分布中的非同步性,即一年中平均暴雨强度较小,但是对应的历年暴雨量和暴雨量贡献率皆较高,所以在累积概率上表现为偏向于X轴,也进一步说明了长春市暴雨发生暴雨的频率较高。通过分析可知,Copula函数将暴雨要素联合后所呈现出来的信息远远超过图1所示的单一变量提供的信息,并且从侧面凸显出暴雨要素之间具有极强的内部关联性。
2.3 暴雨重现期分析
给定暴雨要素单变量重现期(T),通过式(4)求出相应的暴雨要素值,将给定重现期下的暴雨要素值带入表1计算对应Copula联合分布值。通过式(5)计算二维联合重现期Ta。利用Kendall秩计算变量间的相关系数,得知暴雨各要素两两间的相关系数τ均可通过0.05水平的显著性检验,构建变量两两联合的Copula分布,并结合式(6)计算Copula二维联合的同现重现期To,结果见表5。
表3 暴雨要素边缘分布函数及参数
图1 暴雨要素边缘分布曲线示意图
图2 Copula二维联合累积概率分布
表4 Copula函数二维联合分布函数参数及检验值
由表5可知,三对二维联合重现期除了在重现期为2年的情境下联合重现期Ta小于2年外,其余情境下二维联合重现期均小于其所对应的单要素重现期,例如,暴雨单变量重现期为20年的情境所对应的历年暴雨量与平均暴雨强度的联合重现期为8.34年,年均暴雨强度和暴雨量贡献率的联合重现期为7.63年;同现重现期To均大于单要素重现期和联合重现期,并且随着单要素重现期的增加,同现期的增速远远大于联合重现期的增加速率。单变量的重现期较大时,表明此时的变量值属于该变量的极值,为少数事件,将暴雨的多个变量的极值联合在一起时,同现重现期显著延长,联合重现期明显缩短。例如表5所示,单变量重现期为100年时,其同现期则延长至上400~800年之间,而联合重现期却缩至28年,这种多变量联合后的重现期信息是单变量重现期无法确定出来的,说明Copula多维分布函数对于探知具有多要素的暴雨联合概率和重现期具有较强的实用性。
图3为暴雨要素二维copula重现期等值线图,其中,联合重现期主要集中在0~16年之间。由联合重现期(图3a)可知,历年暴雨量与暴雨贡献率的联合重现期为2年时,两者对应的概率为0.72,说明两者在2年联合重现期下,表现出一致性的特征,但是随着两者概率的增大,等值线分布呈现出非一致性的分布特点,其中历年暴雨量概率变化幅度较小。根据联合重现期定义,说明随着联合重现期的增长,历年暴雨量逐渐增大,但是暴雨量贡献率增大的概率则趋近于零,说明长春市暴雨的集中度较高。由联合重现期(图3b)和联合重现期(图3c)可知,说明两者在联合重现期下,表现出一致性的特征。在暴雨要素概率较高时,即暴雨要素值较小时,同现重现期较短,大致在0~50年之间,随着同现重现期的增大,不同要素同现重现期具有不同的分布特征,其中历年暴雨量与暴雨贡献率的同现重现期主要分布在0~200年之间,历年暴雨量与年均暴雨强度的同现重现期主要分布在0~350年之间,平均暴雨强度和暴雨贡献率的重现期主要分布在0~500年之间,进一步说明了随着重现期的增大,降水的集中程度越来越大,暴雨强度越来越高。联合重现期只需某一暴雨要素超越给定值,即为重现;同现期则需所选暴雨要素同时超越各自给定值,才为重现;所以同现期明显长于联合重现期,尤其在暴雨偏强年份,同现期更长。此外,两种重现期变化趋势一致,具有同步效应,恰好了反应暴雨要素的不可分割性。
表5 暴雨要素重现期
图3 暴雨要素二维copula重现期等值线图
3 结论与讨论
Copula函数作为一个强有力的理论与方法,计算简便,因此非常适用于进行长期联合分布的研究,本文利用ArchimedeanCopula函数对长春市1951-2012年暴雨量、暴雨量贡献率和年均暴雨强度的联合概率分布进行实证分析,获得如下结论。
(1)Copula理论能够为多变量的暴雨特征分析提供有效的研究途径,其中的FrankCopula函数和ClaytonCopula函数能较好的反映暴雨要素间的相互关系。
(2)联合重现期主要集中在0~16年之间。暴雨要素值较小时,同现重现期大致在0~50年之间,随着暴雨要素值的增大,三对同现重现期相应延长,具有同步效应,存在一致的变化趋势,这种趋势正好体现了暴雨要素间的不可分割性。
(3)通过单变量拟合与Copula二维联合特征对比分析发现:选择恰当的单变量分布函数,能有效反映出变量本身的信息,却无法对变量间的内在关系进行研究,在暴雨多要素分析中,只能单独地分析暴雨某一要素的特征;而Copula二维联合可以从多个方面反映暴雨的特征,提供了分析变量间相互联系的大量信息,是单变量拟合所不具备的。暴雨要素具有不可分割性,有着复杂的内在联系;Copula函数的二维联合尤其是多维联合能很好的满足对暴雨多要素的研究,具有很强的实用性。
[1] IPCC.Managingthe risksofextreme eventsand disasters toadvance climate change adaptation:Special report of the intergovernmental panelon climate change[M].Cambridge,UK,NewYork,NY,USA:Cambridge University Press,2012.
[2] 王菜林,任学慧,李颖,等.基于PPD的辽宁省暴雨灾害风险分析[J].灾害学,2015,30(1):217-221.
[3] 中国气象局编著.中国气象灾害年鉴[M].北京:气象出版社,2012.
[4] 扈海波,张艳莉.暴雨灾害人员损失风险快速预评估模型[J].灾害学,2014,29(1):30-36.
[5] 史瑞琴,刘宁,李兰,等.暴雨洪涝淹没模型在洪灾损失评估中的应用[J].暴雨灾害,2013,32(4):379-384.
[6] 袭祝香,纪玲玲,张硕.吉林省重大暴雨过程影响损失评估模型的建立[J].气象与环境学报,2014,30(5):141-145.
[7] 叶五一,韦伟,缪柏其.基于非参数时变Copula模型的美国次贷危机传染分析[J].管理科学学报,2014,17(11):151 -158.
[8] 张超锋,张莉敏,李乔.基于Pair-Copula构造的多元相依结构模型分析[J].统计与决策,2014(19):24-27.
[9] 储小俊,曹杰.基于Copula方法的天气指数保险产品设计——以南通棉花降水指数保险为例[J].生态经济,2014,30(10):34-37.
[10]LiN,Liu X,Xie W,et al.The return period analysis of natural disasterswith statisticalmodeling of bivariate joint probability distribution[J].Risk Analysis,2013,33(1):134-145.
[11]陈子燊,曹深西.基于Copula函数的波高与周期长期联合分布[J].海洋通报,2012,31(6):630-635.
[12]武传号,黄国如,吴思远.基于Copula函数的广州市短历时暴雨与潮位组合风险分析[J].水力发电学报,2014,33(2):33-40.
[13]周玉良,袁潇晨,金菊良,等.基于Copula的区域水文干旱频率分析[J].地理科学,2011,31(11):1383-1388.
[14]洪兴骏,郭生练,李天元.基于Copula函数的鄱阳湖都昌站枯水多变量频率分析[J].长江科学院院报,2014,31(12):11-16.
Analysis of Joint Distribution and Characteristics of Rainstorm in Changchun Based on Copula Function
Guo Enliang,Zhou Mo,Zhang Jiquan,Wang Yongfang,Ha Si and Zhang Feng
(College of Environmental Science,Northeast Normal University,Nature Disaster Research Institute,Northeast Normal University,Changchun 130117,China)
Based on annual of rainstorm depth,annual average rainstorm intensity and rainstorm contribution of the daily precipitation data from 1951 to 2012 in Changchun city.We use AIC and RMSE test to confirm the best fitted copulas connect function suitable for rainstorm factor by introducing the Archimedean copula function and building two-dimensional joint distribution,and analyze the probability of rainstorm and characteristics of return period with many combined factors.Research shows that:①The Generalized Extreme Value distribution is the best distribution for fitting rainstorm elements;For the jointofmany factors,Frank copulas and Clayton copulas suitable for and reflecting the occurred probability rainstorm under the background ofmultiple-factor.②Rainstorm joint return period aremainly concentrated in between 0-12a;Storm factor value is smaller,with shorter return period,approximately between 0-50a;along with the increase of rainfall factor value,concurrence return period also growth up.③the univariate reflect just one factor of information in rainstorm and doesn’t involved in the relationship between factors;Two-dimensional copulas joint can present the internal information between heavy elements from more aspects and closer to the actual;Multiple factors of rainstorm,as copulas function on the rainstorm analysis provides a broad prospects.
Copula function;two-dimensional joint;rainstorm factors;return period;Jilin Changchun
X43;P648.0+24
A
1000-811X(2015)04-0173-05
10.3969/j.issn.1000-811X.2015.04.031
郭恩亮,周沫,张继权,等.基于Copula函数的长春市暴雨联合分布与特征分析[J].灾害学,2015,30(4).173-177.[GuoEnliang,Zhou Mo,Zhang Jiquan,et al.Analysis of joint distribution and characteristics of rainstorm in Changchun Based on Copula Function[J].Journal of Catastrophology,2015,30(4):173-177.]
2015-05-07 修改日期:2015-06-23
国家级大学生创新创业训练计划项目(201410200103);国家自然科学基金(41371495)
郭恩亮(1988-),男,山东梁山人,博士研究生,主要从事自然灾害风险评价与管理研究.
E-mail:guoel675@nenu.edu.cn
张继权(1965-),男,吉林九台人,教授,博士生导师,主要从事区域灾害与生态环境风险评价、预警与应急管理研究.E-mail:zhangjq022@nenu.edu.cn