陕西省汛期极端降水概率分布及综合危险性评估
2023-10-08史维良车璐阳
史维良, 车璐阳, 李 涛
(西安财经大学统计学院,陕西 西安 710100)
全球变暖导致洪灾、旱灾等自然灾害频繁发生,对人类社会稳定和经济发展影响严重,防灾减灾工作刻不容缓。评估自然灾害风险是进行防灾减灾工作的重要基础,其中对于致灾因子危险性的分析是关键[1]。暴雨灾害作为中国最主要的气象灾害之一,每年因其造成的生命财产损失十分严重。2021年暴雨致灾人数达5901×104人,失踪死亡人数590 人,直接经济损失2458.9×108元,其中河南、山西、陕西等省份灾情较往年来比偏重[2]。陕西省气候变化复杂,降水分布不均且汛期容易发生暴雨洪涝灾害,目前对陕西省汛期极端降水的概率分布模型研究甚少,缺乏省域内极端降水灾害的综合评价。因此,开展陕西省汛期极端降水危险性综合评估工作,对于陕西省防灾减灾和风险管理工作来说意义重大。
对于暴雨灾害的危险性评估首先是要确定危险性指标的概率分布。传统的水文统计中常用的概率分布是皮尔逊Ⅲ型曲线。近年来,许多学者利用广义极值分布、Gamma分布[3]、Wakeby分布、广义帕累托分布[4]等概率分布函数对不同地区进行分析,由于各区域气候不同,需要根据实际数据来确定某一区域的最优概率分布。利用概率分布模型模拟极端降水指标的重现期,进一步进行危险性分析。关于极端降水的危险性分析通常是选取相关指标进行评估,如极端降水量、暴雨日数等[5]。唐瑜聪[6]通过建立评价指标体系对深圳市极端气候灾害风险进行评估,其中危险性指标选取了最长连续降水量、连续5 d最大降水量。周静静等[7]通过选择合适的危险性指标对陕西省秦巴山区的地质灾害危险性做出评价。王鹏等[8]提出计算危险性概率的方法,并绘制出汉江流域洪涝灾害危险性区划图。迟潇潇[9]对中国极端降水进行时空分析,基于不同情景选择极端降水量和极端降水频次分析中国极端降水综合危险性。
准确评估陕西省汛期极端降水危险性,是进行暴雨防灾减灾工作的重要基础。本文选取陕西省1969—2020 年汛期(5—10 月)日极端降水数据,对陕西省极端降水指标进行概率分布拟合,选取最优概率分布模型,利用概率分布模型计算极端降水指标的重现期,在此基础上对陕西省汛期极端降水综合危险性进行评估。
1 资料与方法
1.1 研究区概况
陕西省(105°29′~111°15′E,31°42′~39°35′N),位于中国内陆腹地,总面积20.56 km2,全省年平均气温9~16 ℃,年平均降水340~1240 mm。陕南、陕北和关中地区降水不平均,汛期由于极端降水造成洪涝灾害事件发生频繁,全省每年因自然灾害造成的直接经济损失可达90 多亿元[10]。近几年降水趋势明显增大,2021 年8 月30 日,陕西省安康市10 县区遭暴雨袭击造成68640 人受灾,农作物受灾面积1780 hm2,直接经济损失3.41×108元[11]。
1.2 数据来源
本文所用数据主要包括气象数据和地理信息数据等。气象数据来自国家气象中心提供的陕西省32 个基准气象站点(图1)的1969—2020 年汛期(5—10 月)逐日降水数据,日降水数据记录时间为前一天20:00—当天20:00(共24 h)。地理信息数据来源于全国1:250000数字高程模型(30 m精度),在ArcGIS 中以陕西省的基础地理矢量数据为掩膜裁剪得到陕西省高程数据。
1.3 研究方法
1.3.1 极端降水指标序列极值理论十分关注极值序列的构建,常用的选样方法有年最大值法(Annual maximum,AM)和超门限峰法(Peak over threshold,POT)[12]。POT 序列是确定某一阈值,由超过阈值的数据组成序列[13]。AM 序列是时间序列,由每年的日降水量、降水频次、降水强度最大值组成,其优点是能够较好地表征极端降水指标在时间上的变化。有研究表明AM序列更适合描述陕西省的极端降水特征[14],因此本文选取AM 法构建极端指标序列,并构建了3 个AM 序列,分别是由陕西省1969—2020年每一年汛期的最大日降水量、最多降水频次、最高降水强度相关数据组成的序列。
1.3.2 概率分布模型概率分布的数学模式是对降水统计特征最完全的描述。正确的估计和计算不同雨量对应的概率是为了完整的认识该地区极端降水的总体特征。极值理论的概率分布研究中常用的几种分布为Gen.Extreme Value(GEV)、Gen.Pareto(GP)、P-Ⅲ型、Gen.Logistic、Lognormal 等。根据已有研究结果[14-17],本文选取了6种极端降水研究常用的概率分布来拟合陕西省汛期极端降水量、极端降水频次、极端降水强度的AM序列,具体概率分布见表1。由于Wakeby 分布没有具体形式,本文参考Houghton[18]给出的公式,计算公式如下:
表1 不同概率分布模型累积分布函数表达形式Tab.1 Expression of cumulative distribution function of different probability distribution models
式中:α、γ为尺度参数;β、δ为形状参数;ξ为位置参数。
1.3.3 Kolmogorov-Smirnov优度检验Kolmogorov-Smirnov检验法可以用来检验样本数据是否服从某一个特定分布[19]。其假设为,
H0:样本所来自的总体分布服从某个特定分布;
H1:样本所来自的总体分布不服从某个特定分布。
K-S统计量的计算公式为:
式中:F0(x(i))为经验分布;Fn(x(i))为目标分布的累积分布函数;D为实际观测值,当D小于检验临界值时,则认为2 个分布拟合结果较好,此外D值越小,拟合效果越好。本文极端降水量、极端降水频数和极端降水强度样本量为52。当n=52,显著水平α=0.05,K-S检验临界值为0.1886。
1.3.4 重现期与情景模拟“重现期”带有统计平均的意义,是指概率意义上的回转周期。比如常说的百年一遇指的是以年为统计单位至少有1%的发生概率。其目的是预测陕西省各地区是否容易发生极端降水事件,为有关部门进行自然灾害风险评估、城市雨洪风险管理提供支撑。本文使用最优概率分布函数对不同重现期下研究区极端降水量进行拟合,再将现有最大极端降水值与不同重现期下的极端降水量进行比较,进一步验证结果的准确度。
重现期是指未来可能发生的暴雨强度值大于或等于现在值的平均间隔时间。重现期与频率成反比,计算公式如下:
式中:P为重现期;Pn为该重现期下对应频率;n为重现期下对应的时间。如P=2时,P2表示2 a一遇重现期下对应的频率。
重现期有统计平均的意义,不能简单将它看作多少年一定出现一次,只有在大量的过程中是正确的。选取不同重现期下的极端降水量、极端降水频数、极端降水强度对陕西省极端降水危险性进行分析。本文选取的重现期为2 a、5 a、10 a、20 a、50 a和100 a。
2 结果与分析
2.1 最优概率分布模型
2.1.1 极端降水指标最优概率分布模型初步确定最优概率分布模型的确定有助于了解研究区的概况及准确推断极端降水重现期的指标值,为进一步研究综合危险性打下坚实基础。对于概率分布的拟合可分为4个步骤:(1)极端降水指标序列的构建;(2)选择分布函数;(3)参数估计;(4)对结果进行统计检验。
选取年最大值法构建陕西省极端降水量、极端降水频次和极端降水强度3 个指标的极值序列,每个指标各有32个序列,选择Wakeby、GEV、GP、P-Ⅲ型、Gen.Logistic和Lognormal共6个分布模型对其进行参数估计,利用K-S 拟合优度法[19]对结果进行统计检验。给定显著性水平0.05,查表可得临界值D52(0.05)=0.1886,计算出的临界值小于0.1886时,则认为此函数能拟合该序列。根据各指标32 个序列的检验结果,计算每个指标各概率分布函数的通过率(表2)。可得Wakeby、GEV、GP、P-Ⅲ这4 个分布模型的通过率均为100%,都可以用来拟合3个极端降水序列。Gen.Logistic 分布模型对极端降水量序列的通过率为100%,对极端降水频次和极端降水强度的通过率都为96.87%,其中极端降水频次序列中秦都站不能用Gen.Logistic分布模型拟合,极端降水强度序列中商县站不能用Gen.Logistic 分布模型拟合。Lognormal 分布模型对极端降水量序列的通过率为100%,极端降水频次通过率为62.50%,有12个站点不能用其拟合,分别为榆林站、神木站、定边站、靖边站、长武站、横山站、绥德站、商县站、陇县站、略阳站、秦都站、商南站;极端降水强度序列通过率为87.50%,4个站点不能用Lognormal分布模型拟合,分别为华山站、秦都站、佛坪站和商县站。
表2 各分布模型拟合极端降水序列通过率统计Tab.2 Statistics on the pass rate of each distribution model fitting extreme precipitation series /%
表2得到各分布模型拟合3个极端降水指标的通过率,各指标生成的32个序列对于拟合的概率分布会有最适合本序列的分布函数,统计各站点的最优分布函数出现次数,出现次数最多的分布函数则认为是研究区最优分布函数,具体统计结果见表3。由表3 可知,3 个极端指标序列中,Wakeby 分布模型出现次数均为最多。又由表2 可知Wakeby 分布模型可以用来拟合3 个极端降水序列,因此初步认为Wakeby 分布为3 个极端指标序列的最优分布模型。
表3 极端指标序列最优函数统计结果Tab.3 Statistical results of optimal function of extreme index sequence
2.1.2误差分析通过2.1.1 初步得到Wakeby 分布为陕西省汛期极端降水指标的最优分布模型,但并不是所有序列的最优概率分布模型都是Wakeby 分布函数,因此需要进行误差分析来进一步验证模型的精度。具体做法为:选择Wakeby 分布与各站点自身最优分布拟合50 a一遇情景下的极端降水指标值,将其与实际观测数据中的最大值进行比较计算误差率,误差率=(实际值-预测值)/实际值,为方便分析,本文中使用的是绝对值,具体结果见图2。
极端降水量Wakeby 分布模型拟合的值与实际最大值之间的误差率最高为0.35,最低为0.009,且84.4%站点误差率没有超过0.2;最优分布与实际值之间的误差率最高为0.37,最低为0.007(图2a)。32个气象站点的Wakeby 分布模型误差率都比最优分布模型的误差率要低,说明Wakeby 分布模型对极端降水量序列的拟合效果较好。
极端降水频次最高的误差率为0.37(秦都站),其最优分布模型就是Wakeby 分布;此外Wakeby 分布模型与实际最大值之间误差率最低为0.014,最优分布模型误差率最低为0(图2b)。2 种分布与实际最大值之间的误差率差别不大,且Wakeby 分布模型的误差率普遍低于最优分布模型的误差率,说明Wakeby 分布模型对极端降水频次序列的拟合效果较好。
极端降水强度Wakeby 分布模型拟合的值与实际最大值之间的误差率最高为0.32,最低为0.001,且84.4%站点误差率没有超过0.2;最优分布模型与实际值之间的误差率最高为0.42,最低为0.008(图2c)。大多数气象站点的Wakeby分布模型误差率都比最优分布模型的误差率低,有少数几个比最优分布模型的误差率要高,但是总体差别不大,说明Wakeby 分布模型对极端降水强度序列的拟合效果较好。
因此,选择Wakeby 概率分布作为拟合陕西省汛期极端降水指标序列的最优分布模型。
2.2 极端降水量重现期分析
研究极端降水量重现期是为了分析研究区未来发生极端降水事件可能性,为陕西省极端降水变化提供相关依据,是评估极端降水危险性的重要基础。由于极端降水频次、极端降水强度是在极端降水量的基础上得到的指标,因此本研究仅对极端降水量重现期进行分析。使用最优分布函数——Wakeby分布函数,拟合不同重现期下陕西省汛期各气象站点的极端降水量曲线,将32 个站点按陕北、陕南、关中3个地区分组进行比较(图3)。
图3 陕西省气象站点重现期降水量曲线Fig.3 Return period precipitation curve of meteorological stations in Shaanxi Province
总体来说,同一重现期下陕西省降水极值呈现南多北少的局面,陕北地区总体降雨量少且强度低,极端降水事件较难发生;关中地区部分站点降雨多,其中陇县站较易发生极端事件;陕南地区降雨多、强度高,容易发生极端降水事件。具体来讲,陕北地区站点降水极值2 a一遇到100 a一遇均处在40~145 mm之间,属于一般暴雨范畴,表明陕北地区从概率上来讲较难发生雨量极大的极端降水事件;关中地区的华山、陇县、武功3 个气象站点20 a 一遇、50 a 一遇、100 a 一遇的重现期水平均超过了100 mm,为大暴雨水平;陕南地区除商县站之外,其余所有的气象站点20 a 一遇、50 a 一遇、100 a 一遇的重现期水平均是达到了100 mm以上,总体降水较多,其中镇巴站的降水量最多,远超过其他各站点,在20 a、50 a、100 a 尺度下的重现期降水量达到200 mm 以上,最易发生特大暴雨。
选取各站点序列现有的日极端降水最大值,与拟合得到的50 a 一遇、100 a 一遇的极值进行对比(图4)。陕西省目前已有25个气象站点过去52 a的日降水最大值超过了重现期为50 a的拟合值,其中还有7 个站现有最大降水量超过了重现期为100 a的极值水平,陇县站现有最大值远超100 a一遇的降水量。
图4 现有最大降水值与50 a、100 a重现期降水量极值水平Fig.4 Existing maximum precipitation values and the extreme value level of the 50 a and 100 a return period
因此,含有52 a 日降水极值的AM 序列现有最大值落入50 a一遇概率区间的可能性非常大,已经达到50 a 一遇标准;超过100 a 一遇的站点有7 个,但是超过250 mm特大暴雨水平的站点不多,仅陕南地区的镇巴站在100 a 一遇的情况下降水量超过250 mm。大多数气象站点极端降水发生的概率可能已经达到50 a一遇对应分位数的右侧分布,在一定程度上说明陕西省多数地区的汛期降水未来可能会朝着小概率、高危险的极端降水事件发展。
2.3 陕西省汛期极端降水综合危险性分析
陕西省汛期降水发生极端降水事件的可能性增大,因此本节在极端降水量的基础上,模拟不同情景叠加极端降水频次和极端降水强度2个指标对陕西省汛期极端降水进行危险区划及分析。利用Wakeby分布函数计算32个气象站点不同重现期下的极端降水指标值,然后极端降水指标各自的危险性制定划分标准,按国家标准划分降水量危险性等级[20];根据自然断点法对极端降水频次和极端降水强度进行等级划分,具体划分标准见表4。
表4 极端降水危险性等级划分Tab.4 Risk classification of extreme precipitation
根据上述各指标序列危险性的等级划分,利用ArcGIS软件的克里金插值法对极端降水量、极端降水频次、极端降水强度指标序列进行插值,得到2 a、5 a、10 a、20 a、50 a 及100 a 重现期下的各指标危险性空间分布;通过栅格对3 个极端降水指标的危险性空间分布进行叠加计算,得到陕西省汛期极端降水综合危险性分布图(图5)。总体来看,陕西省极端降水综合危险性分布不均,随着重现期的增加,危险区域也在不断扩大,整体表现为南高北低的趋势。
图5 不同重现期下陕西省汛期极端降水综合危险性空间分布Fig.5 Spatial distributions of comprehensive risk of extreme precipitation in flood season in Shaanxi Province under different return periods
2 a一遇情景下,陕西省极端降水综合危险性只有低和较低2种。陕北和关中地区全都处于低危险区;陕南地区的商县站和镇安站处于低危险区,其余处于较低危险区。
5 a 一遇情景下,相比2 a 一遇情景低危险区增大,并出现了中危险区。陕北地区的神木、延长、洛川站为较低危险区,其余地区仍为低危险区;关中地区的永寿、秦都、泾河、长武、耀县、蒲城站为低危险区,其余为较低危险区;陕南地区的镇巴站和宁强站为中等危险区,其余全为较低危险区。
10 a 一遇情景下,陕西省境内低危险区面积减小,较低危险区占绝大多数,中等危险区面积也在加大。陕北除定边站外全为较低危险区;关中地区全为低危险区;陕南地区的镇巴站为较高危险区,镇安、商县为较低危险区,其余为中等危险区。
20 a 一遇情景下,陕西省极端降水综合危险性为较低、中和较高3 种。陕北地区的神木站为中等危险区,其余为较低危险区;关中地区的长武站、耀县站、蒲城站、永寿站、秦都站、泾河站为较低危险区,其余为中等危险区;陕南地区较高危险区面积增大,略阳、汉中、镇巴、宁强站为较高危险区,其余为中等危险区。
50 a 一遇情景下,陕西省汛期极端降水综合危险性为较低、中等、较高和高危险4种。陕北的定边站处于较低危险区,其余为中等危险区;关中地区的陇县站为较高危险区,其余为中等危险区;陕南地区的镇巴站为高危险区,镇安站、商县站为中等危险区,其余为较高危险区。
100 a 一遇情景下,高危险区地区增多,危险性为中、较高和高3 种。陕北地区的神木站处于较高危险区,其余为中等危险区;关中地区的耀县站和蒲城站为中等危险区,其余处于较高危险区;陕南地区的商县站、镇安站处于较高危险区,其余为高危险区。
进一步对综合危险性进行评估,通过面积的变化趋势反映危险区变化情况,由图7 计算出不同重现期下各极端降水综合危险性所占面积比(表5)。2 a 一遇情景下,低危险区面积占比为84.9%,高危险区面积占比为0,随着重现期增加,危险等级也不断增大;5 a一遇情景下,出现中危险区,面积占比为6.4%;10 a 一遇情景下,出现较高危险区,面积比为1.7%;20 a 一遇情景下,陕西省内低危险区消失,出现高危险区,其面积占比为0.1%;50 a一遇情景下,高危险区面积增大,面积占比为3.7%;100 a一遇情景下,较低危险区消失,高危险区面积占比增加到22.0%。
表5 不同重现期下各极端降水综合危险性等级面积占比Tab.5 Area proportion of comprehensive risk of each extreme precipitation under different return periods /%
3 讨论
陕西省极端降水空间差异显著[21],因此关于危险性的研究十分关键[22-23],多数都是通过构建指标体系对极端降水危险性进行评估,鲜少有在概率分布模型的基础上进行危险性分析。通过研究发现陕西省未来极端降水事件发生可能性大大增加,这与全球极端降水事件变化一致[24]。目前多数研究[25-26]中常用P-Ⅲ型、GEV、GPD 分布模型计算研究区不同重现期下的极端降水量,越来越多学者[15-16]使用Wakeby 分布模型拟合极端降水序列计算极端降水量。针对陕西省极端降水指标目前还没有具体的概率分布模型研究,本文选取6 种极值分布拟合极端降水指标,得出Wakeby 分布是陕西省汛期极端降水量、降水频数、降水强度的最优概率分布模型,并用Wakeby 分布模型计算不同重现期下的极端降水量,得到未来陕西省发生极端降水事件的可能性增大;通过极端降水指标叠加分析可以看出不同情景下陕西省各地区危险性变化明显,陕南地区综合危险性>关中地区>陕北地区。
本研究存在一些不足:(1)由于数据可获取性,仅选用了32个气象站点数据,后期可以考虑增加气象站点数以提高结果精度;(2)仅从危险性研究了陕西省极端降水变化,还可以结合脆弱性、暴露性等综合分析极端降水带来的风险,进一步研究暴雨灾害风险管理,为政府防灾减灾提供科学建议。
4 结论
(1)拟合陕西省汛期极端降水量、极端降水频次和极端降水强度3 个极端降水指标序列,得到其最优分布模型是Wakeby分布函数。
(2)通过对不同重现期下陕西省各地区极端降水量的计算,同一重现期下陕西省降水极值呈南多北少分布,陕北地区发生极端降水事件的可能性较小,关中地区的大部分站点降水较多,发生极端事件可能性较大,陕南地区整体发生极端降水事件可能性较大。陕西省大多数地区汛期降水会朝着小概率、高危险性的极端降水事件发展。
(3)不同情景下陕西省汛期极端降水综合危险性整体呈南高北低分布。具体分析如下:陕北地区综合危险性较低,仅在100 a情景下神木站发展较高危险区,其余站最高综合危险区等级仅为中等;关中地区在2 a、5 a、10 a、20 a情景下危险区等级均不超过中等,50 a情景下陇县发展为较高危险区,100 a情景下除耀县和蒲城外全为较高危险区;陕南地区高危险区占比最大,其中镇巴站发生危险事件可能性最大,因其在20 a情景下已发展为高危险区,除镇安和商县外,其余地区在100 a情景下全为高危险区。