APP下载

基于Copula模型的暴雨综合指标分析
——以万州为例

2021-06-14冯介玲祝好

关键词:贡献率暴雨变量

冯介玲 祝好

(1 重庆市气象科学研究所,重庆 401147;2 重庆市农业气象与卫星遥感工程技术研究中心,重庆 401147)

0 引言

IPCC第五次评估报告提出,由气候变化引起大多数地区强降水事件的发生频率呈现增加趋势,发生影响大和范围广的暴雨灾害的可能性也会大幅度增加,严重地影响了人民的生命和财产安全以及社会的可持续发展。在全球变化的背景下,暴雨灾害的发生过程更加复杂,暴雨事件通常包含多个方面的特征属性,是多重指标综合作用的结果,各个要素之间的相关性也趋于复杂,因此,通过单一要素的分析很难全面地反映暴雨特征,暴雨多要素综合分析成为极端降水研究领域的热点。

Copula函数具有变量不受边缘分布形式限制,不基于线性假设等特点,能够灵活地应用于多维变量的联合特征分析中,在金融、保险行业应用成熟,而近年来也被广泛地运用在气象和水文等方面的研究中,但是在暴雨方面的研究相对较少。重现期是一个表征发生可能性的指标,一般是指在较长时期内超过某强度阈值的事件发生的一个相对稳定的周期,是描述灾害等事件的一个重要参数。重现期可用于描述灾害出现的严重程度和频率,气象或水文领域上常用“50年一遇”“百年一遇”等来表示。研究暴雨重现期对于城市工程的规划设计以及防汛抗洪等都具有重要的参考意义。

本文以重庆万州区暴雨事件为研究对象,利用Copula函数在构建多维联合分布中的优势,构建二维联合分布模型研究历年暴雨多变量的概率分布和联合重现期的变化,揭示多变量联合下的暴雨特征,以期利用综合指标分析提高暴雨重现期的评估精度,为减小暴雨灾害频率分析的不确定性,制定合理的防灾减灾决策以及提高风险管理水平提供科学依据。

1 资料与方法

1.1 资料选取

根据中国气象局《降水量等级》标准,24 h内,降雨量达到50 mm的降水定为暴雨。研究采用由重庆气候监测分析平台提供的万州区1967—2019年的历年降水资料,参照国内外学者研究暴雨特征的指标选取情况,统计提取出年暴雨量(

P

)、年暴雨强度(

I

)和年暴雨贡献率(

R

)作为暴雨要素,从多角度反映暴雨的特征,相应暴雨要素的选择及定义如表1所示。

表1 暴雨要素的选择及定义Table 1 Selection and definition of rainstorm factors

1.2 研究方法

1.2.1 Copula函数的基本形式

在实际应用中,单参数的Copula函数由于灵活多变,计算简单,应用最为广泛。建立Copula函数模型时,需要采极大似然法和分步估计法对Copula函数的参数估计,三种常见的Copula函数的表达式及参数范围见表2。其中

C

(

u

,

v

)为Copula函数,

u

v

分别为变量的边缘分布函数,

θ

为Copula函数的参数。

通过计算拟合优度评价指标RMSE,AIC,Bias和OLS值,可以对拟合的Copula函数模型进行优度评价。

RMSE的表达式为:

表2 三种常见Copula函数Table 2 Definition of the three Copula functions

AIC的计算式如下:

Bias的表达式为:上述公式中,

n

是样本容量,

m

为Copula函数模型中独立参数的个数,

P

P

分别为联合分布函数的经验概率和理论概率。

根据RMSE,AIC,Bias和OLS值越小,所对应的Copula函数拟合优度越高的原则,选取最优的Copula函数来进一步构建联合重现期模型。

1.2.2 基于Copula函数的重现期计算

如果

N

是暴雨事件的时间序列长度,

n

是事件的发生次数,

E

(

L

)为暴雨事件发生的平均间隔时间,则有

E

(

L

) =

N

/

n

对于暴雨事件而言,传统的基于单要素的重现期的计算公式为:

基于Copula函数的双要素联合重现期可以表示为:

基于Copula函数的双要素同现重现期可以表示为:

当同时考虑强暴雨灾害的2个要素时,联合重现期即为某一暴雨要素超过某一特定值时的重现期,而同现重现期是指2个要素都超过某个特定值的重现期。

2 万州区暴雨联合特征分析

2.1 暴雨要素特征检验

对暴雨的3种要素进行描述性统计分析,图1显示了暴雨量、暴雨强度和暴雨贡献率的频率直方图以及拟合的正态分布曲线,各要素的描述性统计数据见表3。由图1可知,暴雨要素的数据分布都具有一定的非对称性,而由表3进一步可知,与正态分布相比,3个暴雨要素总体的数据分布较为陡峭,存在右偏。根据要素的频率直方图形态及偏度、峰度值初步判断数据不服从正态分布,再利用Matlab R2014a软件分别对变量进行Jarque-Bera正态性检验,返回值都为1,则认为数据都拒绝服从正态分布的假设,表示暴雨量、暴雨强度和暴雨贡献率数据都具有非正态性,考虑用无需假定边缘分布形式的Copula函数来进行暴雨多要素的联合分布建模。

图1 暴雨量(a)、暴雨强度(b)和暴雨贡献率(c)的频率直方图Fig.1 Frequency histogram of rainstorm factors(a) quantity, (b) intensity, (c) contribution

表3 描述性统计数据表Table 3 Descriptive statistical data table

2.2 边缘分布选择估计

令暴雨量、暴雨强度和暴雨贡献率的边缘分布分别为

F

(

p

)、

F

(

i

)和

F

(

r

),利用Easyfit5.5软件对各暴雨要素进行多种边缘分布类型的拟合以及参数估计,再根据Anderson-Darling检验的结果,针对各个暴雨要素分别选取最优的边缘分布函数。由拟合结果可知,Gen Extreme Value(广义极值分布)对于各暴雨要素的拟合效果均较好,通过0.01水平下的假设检验的各要素的最优边缘分布类型以及参数结果见表4。

2.3 Copula模型构建

利用极大似然法,分别选取3种常见的Copula函数对暴雨量、暴雨强度和暴雨贡献率的两两组合进行二维Copula模型的拟合,并计算拟合优度评价指标,进行优度检验,相关的参数和拟合优度检验值见表5。比较表5中各Copula函数的RMSE,AIC,Bias以及OLS值,根据拟合优度指标越小模型拟合度越好的择优原则,选取Frank Copula为暴雨强度和暴雨贡献率的二维联合的最优Copula分布函数,选取Clayton Copula函数作为暴雨量和暴雨量贡献率、暴雨强度和暴雨量贡献率的二维联合Copula分布函数。拟合优度检验的结果也表明,Copula函数对暴雨量和暴雨强度的拟合精度更高。

表4 边缘分布估计结果Table 4 Distribution functions of rainstorm factors

Kendall秩相关系数可以用来度量变量变化总体的一致性程度,从而反映变量间的相关性,分别计算基于三种暴雨要素组合最优二维联合分布的Kendall秩相关系数,结果见表6。由表可知,暴雨强度和暴雨贡献率的同步性较大,各暴雨要素间存在一定的正相关关系。

构建3种要素组合的最优联合分布模型,如图2所示。从图2中可以看出,各拟合的Copula函数模型在上尾和下尾的频率都相对较大,符合暴雨要素有较多极端值的特征。由Frank Copula模型反映出的要素上下尾频率都较大的特点,表示在发生暴雨灾害的情况下,同时出现暴雨量小和暴雨强度低、暴雨强度低和暴雨贡献率小、暴雨量大和暴雨强度高或者暴雨强度高和暴雨贡献率大的概率更高,而由Clayton Copula模型反映出暴雨量和暴雨贡献率两个暴雨要素在上下尾部表现出一定的非对称结构,尤其在极端下尾呈现出较强的正相关关系。分析可知,各暴雨要素之间的尾部相关性能被不同类型的Copula函数清晰地定性刻画出来,为了更加深入地认识Copula函数模型在暴雨多要素综合分析中的应用,需要进一步进行基于最优Copula函数的重现期评估。

表5 Copula函数的参数估计和拟合优度检验值Table 5 Parameters and goodness-of-fit measures for the fitted Copula function

表6 基于最优Copula函数的暴雨要素组合Kendall秩相关系数值Table 6 The correlation coefficients of the combination of rainstorm factors

3 万州区暴雨联合重现期分析

3.1 暴雨重现期计算

根据重现期的计算公式(6)—(8),分别计算出基于最优Copula函数的联合重现期和同现重现期,结果如图3所示。

由图3可知,随着暴雨量、暴雨强度和暴雨贡献率的增加,基于不同最优Copula函数模型的联合重现期及同现重现期增大。不同暴雨要素组合的联合重现期模型的形态不同,总体来说联合重现期对暴雨强度的变化更敏感。暴雨量与暴雨贡献率的联合重现期和同现重现期主要分布在0~400和0~20000年,暴雨量与暴雨贡献率的联合重现期和同现重现期主要分布在0~5和0~800年,暴雨强度和暴雨贡献率的联合重现期和同现重现期主要分布在0~5和0~1500年。联合重现期和同现重现期对暴雨要素满足的取值要求不同,不同要素组合的重现期变化趋势不同,反映了在分析暴雨的重现期时,需要考虑多个要素的影响。

图2 暴雨要素的Copula函数分布图(a)暴雨量和暴雨强度;(b)暴雨量和暴雨贡献率;(c)暴雨强度和暴雨贡献率Fig. 2 The joint cumulative distribution of rainstorm factors(a) P&I, (b) P&R, (c) I&R

3.2 暴雨灾害联合重现期评估结果比较

表7 显示了在单变量重现期分别为2、5、10、20、50和100 年的情况下,根据单变量重现期公式(6)推导出暴雨量、暴雨强度和暴雨贡献率的对应取值,再根据公式(7)和(8)计算出的不同Copula函数模型对应的暴雨多要素联合重现期以及同现重现期取值。

由表7可以看出,联合重现期均比单要素重现期小,同现重现期均比单要素重现期大,且随着单要素重现期取值的增大,多要素重现期与单要素重现期的差别也逐渐增大,同现重现期的增速远超联合重现期的增速。在单变量重现期小于等于2年的情况下,联合重现期和同现重现期的差别不明显,但当单要素重现期大于2年时,基于Copula模型的两种重现期差别较大。

4 结论与讨论

图3 暴雨要素的二维Copula重现期Fig. 3 The joint return period of the combination of rainstorm factors

1)广义极值分布对暴雨量、暴雨强度和暴雨贡献率的拟合效果最好。根据边缘分布情况以及拟合优度评价结果,Clayton Copula函数适合于构建暴雨量和暴雨强度以及暴雨强度和暴雨贡献率两个的联合分布模型,Frank Copula函数适合于构建暴雨强度和暴雨贡献率的联合分布模型。

2)各暴雨要素之间具有一定的正相关,Copula函数可以直观清晰地刻画要素之间的相关关系,适用于分析暴雨多要素的联合概率。

3)Copula函数模型能够从综合指标层面反映暴雨多方面的特征,基于暴雨多要素的联合重现期以及同现重现期比基于单要素的重现期能够提供暴雨的综合信息,可以反映出暴雨灾害发生时的降水集中程度以及暴雨的强度等级。

表7 基于暴雨单要素的重现期和最优Copula函数模型的暴雨多要素重现期Table 7 The return period of rainstorm based on single element and optimal Copula function model

猜你喜欢

贡献率暴雨变量
“80年未遇暴雨”袭首尔
暴雨突袭
暴雨袭击
14.8%
猛兽的委屈
高等教育体制改革的贡献率研究:1998—2011年的数据观察
分离变量法:常见的通性通法
不可忽视变量的离散与连续
轻松把握变量之间的关系
变中抓“不变量”等7则