吉林省暖季短时强降水分区阈值研究
2024-01-08朱晓彤冯喜媛
朱晓彤 姚 凯 冯喜媛 任 航
(1.吉林省气象科学研究所,吉林长春 130062;2.长白山气象与气候变化吉林省重点实验室,吉林长春 130062;3.中高纬度环流系统与东亚季风研究开放实验室,吉林长春 130062;4.吉林省气象台,吉林长春 130062)
1 引言
短时强降水(flash heavy rain)是指在短时间内出现的很强的降水事件, 是我国暖季最主要的灾害性天气之一, 我国天气预报业务中一般指1 h雨量在20 mm 或3 h 雨量在50 mm 以上的降水事件[1-3], 气象行业标准《强对流天气等级》(QX/T416-2018)指出强对流天气中短时强降水的阈值为大于等于20 mm/h。 时间尺度上,短时强降水强调降水强度,即雨强;在空间尺度上,短时强降水一般由对流降水形成, 且为典型的中小尺度系统驱动,其造成的衍生灾害往往表现为局地而短促,如山体崩塌、滑坡、城市道路积水、暴洪[4-5],而暴洪是所有相关气象灾害中发生频次最高且导致伤亡人数最多的灾害[6-9]。 前人对于短时强降水的个例分析、 机理研究以及预报预测等方面的探讨较为丰富[10-12]。
目前短时强降水阈值的确定国际上使用较为广泛的方法包括百分位法和参数估计算法, 如广义帕累托分布法和广义极值分布法等[13]。 由于中国天气气候状况复杂、影响因子众多,极端降水事件呈现出明显的地域差异, 降水本身也具有很强的空间不均匀性, 短时强降水阈值的选取不应统一采用固定阈值。虽然吉林省东、西部地形差异明显,但目前吉林省气象台的监测业务中,对于短时强降水的监测仍全省使用统一的阈值, 这样会抹平地域差异,因而,细化分区讨论短时强降水的阈值是十分必要的。
本文使用K 均值聚类方法, 根据历史短时强降水事件对测站进行分类,讨论气象行业标准《强对流天气等级》中短时强降水的定义(雨强大于等于20 mm/h) 在吉林省本地化分区应用中的适用情况, 进一步使用百分位方法细化短时强降水在不同区域的阈值, 对吉林省暖季短时强降水监测起到更加准确的指导作用, 在业务应用中有较大的实际意义。
2 资料与方法
2.1 资料
与日降水量相比, 小时尺度降水资料在反映降水强度和描述降水过程方面都更准确[14]。 更精细的降水资料可以有效避免, 因降水时间长而强度较小导致的高估, 或因降水时间短却强度极大导致的低估情况, 因而更适用于短时强降水阈值的确定[13]。 本文使用资料为1980—2019 年(近40 a)暖季(5—9 月)吉林省气象信息中心提供的经过质量控制的51 个国家级地面气象观测站(国家站)的逐小时观测数据。 选取1 mm 以上的小时降水量作为统计样本。
2.2 方法
本文使用百分位法来分析和确定短时强降水阈值, 该方法是通过把每个台站的小时降水量按升序排序后, 选取某一固定百分位数的强度作为阈值,若小时降水量超过该值,则记为一次短时强降水事件。本文对各台站计算了98%、99%、99.5%和99.9%四种百分位的强度, 对比讨论了不同区域暖季短时强降水的阈值。
K 均值聚类方法是一种常用的无监督机器学习方法,可以通过“数据挖掘”的方式,将隐藏于数据当中的规则提取出来, 可以有效避免以地理区划、 行政分区或者预设的代表性区为研究区域的主观局限性。该方法的步骤为,首先随机选取K 个初始聚类中心, 而后将剩下的对象依据它们与聚类中心的相似度(距离) 分配给最接近的那一聚类, 不断重复该过程, 直到最后聚类中心不再变化,误差平方和最小为止[15-17]。
3 吉林省暖季分区短时强降水阈值
3.1 全省短时强降水统计
统计了近40 a 吉林省暖季短时强降水个例共计2 923 个。 其中,伊通站(站号54164)出现短时强降水最多,为93 次;最大雨强出现在长白站(站号54386),雨强达到93.4 mm/h,出现日期为2004 年7 月23 日15 时。 全省暖季短时强降水出现最多的月份为7 月,共1 351 个;最少为5 月,仅出现26 个短时强降水个例。暖季短时强降水事件在20 世纪80 年代、90 年代和21 世纪00 年代、10 年代的分布较为均匀,均为700 个左右。
由吉林省暖季短时强降水雨强分布区间(表1)可见, 绝大部分短时强降水雨强都集中在20—30 mm/h,共2 118 站,占全部事件的72.5%;30—40 mm/h 次之,共553 站,占全部事件的18.9%;40 mm/h 以上的极端短时强降水共占总数的不到10%。 该统计结果为后续分区阈值的确定提供了依据。
表1 吉林省短时强降水雨强分布区间
3.2 吉林省暖季分区短时强降水阈值
本文使用K 均值聚类方法, 依据吉林省暖季近40 a 的历史短时强降水事件对测站进行分类,经过肘部法则[14]和进一步合并后,最终将吉林省51 个国家站分为3 类(图1),并依此将全省测站划分为3 个区域。分别是,一区:白城、松原、四平,长春中部和北部的长春、农安、九台、榆树、德惠,吉林西北部的舒兰;二区:辽源、长春东南部的双阳,吉林中部的吉林、永吉、蛟河,延边北部的敦化、汪清、安图;三区:通化、白山,吉林南部的磐石、桦甸,延边南部的和龙、龙井、延吉、图们、珲春,以及长白山保护区。
图1 1980—2019 年暖季(5—9 月)吉林省短时强降水K 均值聚类分区(一区:红色台站;二区:蓝色台站;三区:绿色台站)
选取1 mm 以上的小时降水量作为统计样本,对每个测站的小时降水量按递增顺序排序后,分别计算小时降水量20 mm(气象行业标准《强对流天气等级》中对短时强降水的定义)在全省、一区、二区、三区的百分位。 结果显示,小时降水量20 mm 在全省的百分位为98.7%, 在一区的百分位是98.1%,二区98.9%,三区99.8%。吉林省暖季各地的小时降水量分布是不均匀的, 与全省最为接近的是二区,而一区强度最大,三区强度最小,两者之间有着较大的差异。 全省小时降水量自西北向东南逐渐减小, 可见分区研究短时强降水阈值是很有必要的。
3.3 基于百分位法的分区短时强降水阈值
吉林省各地降水强度的分布是不均匀的,因此, 各区域采用适当条件的短时强降水阈值更为合理。文献中对于短时强降水阈值的确定,百分位数常取95%、98%、99%、99.5%或99.9%[13]。本文选取并计算了各台站98%、99%、99.5%和99.9%四种百分位的强度,对比讨论不同区域暖季短时强降水的阈值。 从全省、一区、二区、三区小时降水量的第99.5%分位数分布特征可以看出, 全省、一区、 二区、 三区的小时降水量中位数分别为27.3 mm、30.2 mm、26.0 mm 和23.9 mm;最大值分别为35.9 mm、35.9 mm、31.7 mm 和26.6 mm;最小值分别为17.7 mm、28.5 mm、19.8 mm 和17.7 mm。全省和其他3 个区的小时降水量25%—75%分位数基本集中分布在20—32 mm。 吉林省暖季降水强度99.5%分位数的分布(图2) 与台站的分区分类结果(图1)有着较好的对应关系,其中一区的两个明显的小时雨强大值区中心分别在吉林中西部的公主岭站与北部的乾安站, 三区的两个低值中心分别在二道站和长白站。
图2 吉林省暖季降水强度第99.5%分位数分布
图3 给出了一区、二区、三区以及全省的小时降水量的第98%、99%、99.9%分位数的分布情况。 结果显示,第98%分位数的小时降水量中位数(图3a)无论在全省、一区、二区还是三区均达不到20 mm,显然不适合作为短时强降水的阈值;第99%分位数的小时降水量中位数(图3b)在第三区无法达到20 mm, 达不到气象行业标准中短时强降水的标准,亦不适用;第99.9%分位数的小时降水量中位数(图3c)在全省和三种分类情况下均大于30 mm,最小值均在25 mm 以上,且30—40 mm/h 的雨强占短时强降水的18.9%,这样的选取方式站点过少,阈值过大,亦不适用。 可见,第98%、99%、99.9%分位数均不适合作为吉林省暖季短时强降水的阈值。
图3 吉林省全省、一区、二区、三区站点最大小时降水量的98%分位数(a)、99%分位数(b)、99.9%分位数(c)箱线图
经过上述分析, 将每个测站小时降水量的第99.5%分位数作为短时强降水的阈值,更符合吉林省近40 a 暖季出现的短时强降水个例情况。
在日常业务中, 中位数通常可以反映数据的集中趋势, 故本文得出的各区域小时降水量第99.5%分位数的中位数,作为确定吉林省暖季分区短时强降水监测指标的基础, 由于二区和三区数值相近(26.0 mm 和23.9 mm),因而合并为一类。最终确定一区,即白城、松原、四平、长春中部和北部、 吉林西北部, 暖季短时强降水的监测指标为30 mm/h;二区和三区,即辽源、长春东南部、吉林中部、延边北部、通化、白山、吉林南部、延边南部以及长白山保护区暖季短时强降水的监测指标为25 mm/h。
4 结语
利用1980—2019 年暖季(5—9 月)吉林省国家级地面气象观测站的逐小时观测数据, 对短时强降水事件进行统计分析,使用K 均值聚类算法,根据历史短时强降水事件对全省测站进行分类分区, 讨论气象行业标准 《强对流天气等级》(QX/T416-2018) 对短时强降水的定义 (大于等于20 mm/h) 在吉林省本地化分区应用中的适用情况, 并进一步使用百分位方法细化短时强降水在不同区域的阈值,得出以下结论:
(1) 吉林省暖季短时强降水强度绝大部分发生在20—30 mm/h,占全部事件的72.5%,40 mm/h以上的极端短时强降水占总数的比例小于10%。
(2)利用K 均值聚类算法,依据吉林省暖季近40 a 的历史短时强降水事件将全省测站分为三类并定义为一区、 二区和三区, 小时降水量20 mm在一区的百分位是98.1%,二区为98.9%,三区为99.8%,各区短时强降水强度分布存在差异,全省短时强降水强度自西北向东南逐渐减小。
(3) 使用百分位法对比全部测站小时降水量的第98%、99%、99.5%和99.9%分位数后发现,每个测站小时降水量的第99.5%分位数作为短时强降水阈值更符合吉林省近40 a 暖季出现的短时强降水个例情况。
(4)日常业务中可以将30 mm/h 作为白城、松原、四平、长春中部和北部、吉林西北部的暖季短时强降水监测指标;25 mm/h 作为辽源、长春东南部、吉林中部、延边北部、通化、白山、吉林南部、延边南部以及长白山保护区的暖季短时强降水监测指标。
(5) 百分位法是当前国际上使用的比较广泛的2 类方法之一, 由于广义极值分布法和百分位法是基于完全不同的思路和算法对极端降水阈值进行估计的, 因此有必要对百分位数与重现期之间的关系进行讨论, 基于广义极值分布通过重现期的选择了解相应阈值发生的概率, 并讨论百分位数与重现期之间的关系是我们进一步的工作。另外, 目前使用的是国家气象观测站的逐小时降水资料,后续还应利用区域气象站数据,结合实际业务对阈值进行印证和适当调整。