基于时空相似与熵权修订相结合的雷电定量预警模型研究*
2022-02-05刘凤姣王道平刘艳清薛德锋
刘凤姣,王道平,刘艳清,唐 瑶,薛 明,薛德锋
(1.湖南省气象灾害防御技术中心 气象防灾减灾湖南省重点实验室,湖南 长沙 410007;2.湘乡市气象局,湖南 湘乡 411400;3.靖州县气象局,湖南 靖州 418400;4.怀化市气象局,湖南 怀化 418000)
当前雷电预警方法[1]主要有二种类型,一是利用气象资料制作雷电预警;另一种是利用雷电监测实况制作雷电预警。前者有专家[2-4]对梧州、邵阳、河北等地的雷电或雷电灾害的发生规律与天气系统的相关性进行了分析;也有专家[5-9]就卫星云图、雷达产品在雷电预警中的应用进行了研究;已有专家[10-13]就雷电的临近预警和潜势预报方法进行了研究;已有专家应用神经网络的学习能力制作雷电临近预警模型取得了一定成效[14-17];就熵权在雷电致灾、风险评估等方面也有人进行了探讨[18-21];中国气象局、中国气象服务协会等[22-24]发布了雷电的相关标准;薛德锋等[25-26]对雷电预警等级和地闪强度进行了等级划分并成为湖南地方标准。20世纪80年代雷电定位系统(LLS)在欧美国家得到应用,我国也开始了相应的研究,中科院、空间应用中心、中国科技大学、武汉高压所等单位先后成功研发雷电探测系统,并形成自身特点。探测仪器主要包含闪电定位仪和大气电场仪。闪电定位仪利用闪电辐射的电磁场特性、时间来确定闪电位置、强度和极性等指标,不具备雷电预警功能,定位数据主要用于森林防火、灾害调查、风险区划等;大气电场仪监测的是大气电场数据,依据是雷击发生之前的电场剧烈变化,能够用于闪电发生的预测。
大气是一种具有连续运动尺度谱的连续介质,而雷电是非连续的离散状态,因此能描述大气的连续方程、热力学方程、水汽方程、状态方程和运动方程等并不能直接描述雷电状态。相似法是天气预报中的常用方法,大气的时空相似可以形成相似的天气现象,这是预报人员的一种共识。熵是系统无序程度的度量,可以用于度量已知数据包含的有效信息量和确定权重,是众多赋权方法(如层次分析法、德尔菲法、因子分法、多元回归赋权法、线性回归法等)中最具科学的定律,倍受科学家推崇。中国气象局《雷电灾害风险区划技术指南:QX/T405-2017》[23]中提出了熵权的应用。为探求雷电定量预警的可能,文中参考湖南二个地方标准,利用自动气象台站日常气温资料,采用天气系统时空相似和熵权修订相结合的方法,对雷电定量预警模型进行研究,对提高雷电等级预警具有指导意义。
1 研究资料和方法
1.1 范围与资料
研究选择同类天气系统个例时间范围(本研究以东台风为例)的雷电数据(以日为统计时段)建立时空预警模型,选择预警发布前一时次的自动站气温数据建立雷电预警的熵权修订模型。
1.2 气象数据网格化
采用2000国家大地坐标参数对研究区雷电、气温数据进行网格化处理。空间分辩率20 km×20 km,用式(1)计算地表经纬坐标为A(λA,ΦA),B(λB,ΦB)二点的距离。
dAB=dx((λA-λB)2cos2ΦA+(ΦA-ΦB)2(1-f)2)1/2。
(1)
式中:dx=2πRx/360,为赤道上相距一个经度的距离;Rx为长半轴(地球赤道半径),取值6 378 137 m;f=1/298.257 222 101,为地球扁率。
1.3 检验方法
根据相关系数的适用条件,文中使用斯皮尔曼(SPEARMAN)秩相关系数对两组天气系统时空相似的东台风的闪电数据进行相关性试验,用ρ表示其值。设两个集合分别为X、Y,元素个数为n,集合的第i(1≤i≤n)个值分别用Xi、Yi表示。对X、Y排序(同时为升序或降序)后得到两个元素排行集合X、Y,其中元素Xi、Yi分别为Xi在X中的排行以及Yi在Y中的排行。计算经过排行的两组变量的Pearson相关系数,得到ρ值。
(2)
ρ>0为正相关,ρ<0为负相关,0.0~0.2为极弱相关或无相关,0.2~0.4为弱相关,0.4~0.6为中等相关,0.6~0.8为强相关,0.8~1.0为极强相关。
1.4 雷电预警等级划分
目前,我国各气象台站发布的雷电预警为红、橙、黄三种预警信号,没有具体参数的定量等级。参考湖南地方标准《地闪等级划分》[26](见表1),用20 km×20 km为网格大小,用式(3)计算网格中等以上雷电通量。
(3)
式中:i为网格,取值1~m,m代表网格个数;j为地闪等级,取2~4级,弱雷电不参与统计;I为雷电流幅值。
表1 地闪等级划分
以强雷电通量作为雷电预警等级参数划分为4个等级(表2)。其中,0级蓝色不发预警。
表2 雷电预警等级划分
1.5 综合预警等级划分
用Rij表示某一网格某一个例的雷电预警等级,计算n个历史个例的综合性雷电预警等级,先用式(4)计算各网格雷电预警等级之和Ei。
(4)
式中:i为网格,m代表网格个数;j为个例,n为个例数量。
为使雷电空间预警等级符合表2要求,文中对Ei进行归一化等级划分,用式(5)计算同类天气系统模型等级,并以0、1、2、3线绘制天气系统雷电等级分布图。
Gi=4(Ei-min(Ei:Em))/(max(E1:Em)-min(E1:Em))。
(5)
式中:Gi为同类天气系统模型等级。
1.6 时空相似法
时空分析是指分析具有时间、位置、属性三者数据之间组合关系的过程和方法。空间数据普遍存在空间相关性(全局相关和局部相关)与时间维度的随机性和复杂性,使时空数据呈现出多维、语义、时空动态关联等特征。时空分析是借助统计学和数学,通过研究观测样本,推断总体或超总体的参数和性质。
时空相似法是天气预报常用而有效的方法之一。在天气预报中,时空相似可理解为同一地域同一时期的同类天气系统的相似。时间相似有季节和时次二类。天气系统自身具有季节性,如台风多在盛夏影响我国沿海地区,切变则多在春夏影响我国华南、江南一带。天气系统的时次性也具有季节性,如春天夜雨、夏季的午后雷雨等。天气系统的空间相似比时间相似复杂得多,常由多个相似指标组成,如各层次的气温、气压、湿度、散度、涡度或其他物理量。
1.7 熵权法
通过对熵的计算确定权重,即根据各指标值的差异程度来确定指标的权重。当评价对象的某项指标值相差较大,熵值较小,说明指标提供的有效量较大,其权重也应较大;反之,若某项指标值相差较小,熵值较大,说明该指标提供的信息量较小,其权重也应较小。当各被评价对象的某项指标值完全相同时,熵值达到最大,意味着该指标无有用信息,可以从评价指标体系中去除。
2 雷电定量预警历史模型的建立
2.1 雷电天气系统的分类流程
雷电天气系统的划分是时空相似法的基础和关键,影响雷电形成的天气系统各地不尽相同。以湖南为例,雷电天气系统有低槽、切变、冷锋、急流、台风、东风波、冷涡、副高边缘等天气系统。但这些天气系统并不是在同一时间(时次)影响湖南全域。台风对湖南东部、南部常有影响,对西北部影响较弱;副高边缘午后对流形成的午后雷雨范围更小。对天气系统的认定,可参考气象台站对当日天气系统的分类或在此基础上进行细分,但个例的选择要考虑代表性、多发性和相关性。代表性是指所选个例雷电密度D要达到某一阀值(如D>0.03次/(d·km2)的个例),对于那些零星雷电过程予以删除。多发性是指同类天气系统中有较多的个例出现,如每类天气系统至少包含3个以上个例。相关性是指同类天气系统中的每一个例与整体雷电在空间分布上有一定的相关性,以ρ值确定相关指标(图1)。
图1 雷电天气系统分类流程
2.2 东台风个例的选择
对比分析发现:影响湖南的台风有南台风和东台风二类。南台风雷电是指台风在广东、广西登陆,台风外围东南风影响湖南而形成的台风雷电,主要影响湖南南部和中部。东台风雷电是指台风越过24 h警戒线在福建、浙江等东部沿海登陆,台风外围东北风影响湖南而形成的台风雷电,主要影响湖南东部。东台风雷电个例具有二个特征:一是雷电出现的时间较为一致,主要出现在12:00-20:00时;二是台风登陆地点位于江苏、浙江沿海,湖南处于台风外围的东北气流影响区。
为保证雷电探测效率的基本一致,避免省际边界网格数据的不完整,取110.8°~113.0°E,26.6°~28.6°N范围作为检验区。根据分类流程,以检验区雷电密度D>0.03次/(d·km2)为代表性条件,以ρ>0.2为相似性条件,选择2016—2020年7—8月7次台风过程(共10 d)作为东台风的历史个例(表3)。选择1812台风云雀影响湖南第1 d(2018年8月2日)作为检验示例。
2.3 雷电预警时次相似模型
气象灾害预警的指示性主要由时间、地点和强度三方面确定。其中,气象灾害出现的时间是关键因素。根据表3的东台风案例,统计所选个例发生的雷电数据,建立东台风引发雷电时次分布模型(图2)。从图2中可以看出:东台风雷电出现的时间有较为一致的趋势,主要出现在12:00-20:00时。其它时间雷电极少,基本可以不加考虑。结果表明,该相似模型可以对东台风诱发强雷电有效时次预警。
7—8月,时处盛夏,湖南主受副热带高压控制,天气炎热。东台风形成后,台风西进,副高北抬,湖南受副高底部、台风北部的偏东气流影响,偏东气流携带充足水汽,在午后热对流作用下,形成对流性雷雨天气。结合东台风的出现时间,时段主要考虑12:00-20:00时。
图2 东台风雷电时次分布预警模型
表3 东台风的历史个例
2.4 雷电预警空间相似模型
雷电灾害可能出现的地点及风险是雷电预警极为重要的因素,直接影响雷电防御工作的安排与开展。依据式(5)计算数据和表3东台风案例,绘制东台风雷电风险空间分布模型(图3)。在东台风影响下,益阳、长沙、湘乡到双峰、安化之间为大片蓝色无风险区,而在隆回、衡阳东南方向、新化东侧为红色高风险区,其它区域为橙、黄色的中、低风险区。这一特点与雷电分布规律基本一致。再结合湖南地形山区高、湖区低,即表现为东台风雷电风险山区高于平地,平地高于湖区。
图3 东台风雷电等级分布模型图
3 东台风雷电预警模型的熵权修订
3.1 修订因子选择
图3是历史东台风雷电的综合分布模型。同类天气系统影响下的雷电具有一定相似性,但也存在个性差异。发布雷电预警时,除了要对天气系统分型外,也需要结合其它气象要素实况对模型雷电的强弱、落区进行修订。修订的效果取决于修订因子的选择。雷电监测资料、雷达资料、大气电场资料、卫星云图、探空资料、数值模式产品资料等是目前推荐使用的因子资料[12],也是气象部门目前发布雷电定性预警的主要依据。在此基础上,以空间历史模型为基础,选取地面气温和热岛强度为因子对东台风雷电预警模型进行强度和落点的熵权修订。
3.2 雷电预警的熵权修正计算
文中使用熵权值对空间模型雷电的强弱与落区进行修订。
(1)原始数据矩阵归一化。设m个评价指标i、n个被评价对象j,构成原始数据矩阵(aij)m×n,对其归一化后,对大者为优的评价指标,归一化公式为:
(6)
式中:rij为j站(格)点第i个指标的归一化值;aij为j站(格)点第i个指标值。对小者为优的评价指标,归一化公式为:
(7)
式中:rij为j站(格)点第i个指标的归一化值;aij为j站(格)点第i个指标值。
(2)熵计算。在有m个评价指标i、n个被评价对象j的评估案例中,第i个评价指标的熵计算公式为:
(8)
式中:h为第i个评价指标的熵;k为与样本m有关的常数(一般为1/lnm);fij为第j项评价指标下第i个评估方案占该评价指标的比重。fij计算公式为:
(9)
式中:rij为归一化后的值。
(3)熵权计算。定义了第i个评价指标的熵之后,按照式(10)可得到第i个评价指标的熵权:
(10)
式中:wi为第i个评价指标的熵权;hi为第i个评价指标的熵;m为评价指标数量。
2018年8月2日12时,1812号台风云雀已越过24 h警戒线,中心位于28.9°N/126.6°E,以20 km/h速度向西北西移动,符合东台风预警模型。此前,雷电监测系统已探测到预警区有雷电出现,按东台风时次预警模型,可对未来6h发布雷电预警。以东台风空间模型数据,12:00时同一网格正点气温和相对于所有网格平均值的热岛强度为二个修订因子,经三要素的熵权计算,参照式(5)对式(10)中的wi进行熵权等级划分,以0、1、2、3为等值线绘制雷电等级预警(图4)。
图4 2018年8月2日12:00-18:00时东台风雷电等级预警图
3.3 雷电预警的熵权修订分析
比较图3、图4有3个变化,数据见表4。
(1) 起报区域(需要发布预警的黄色、橙色、红色区域)整体北抬至湘乡,面积扩大,由81格增加到96格,增加18.5%;免报区域(蓝色)由51格减少为36格,减少29.4%。
(2) 黄色区域缩小,由40格降为34格,减少15%;27.3°N以南黄色预警区升为橙色预警。橙色区域由33格增至48格,增加45%;红色预警区面积扩大,由历史模型的8格修订为预警的14格,增加75%,主要位于隆回、新化邵阳东侧及衡阳东南方向。
(3) 橙色和红色的累计格数由41格增加到62格,增加51.2%,预示本次雷电过程将超过东台风雷电的历史平均值,有较大范围的强雷电出现。
表4 东台风雷电等级网格分布统计
4 预警效果的检验与评价
4.1 预警效果检验
统计2018年8月2日雷电数据,绘制检验区雷电时次分布图5,经式(3)式计算和预警等级划分制作雷电等级实况分布图6。统计图4、图6等级数据见表5。
图5 2018年8月2日东台风雷电时次分布图
表5 2018年8月2日12:00-18:00时 雷电预警与实况网格数对比
图6 2018年8月2日12:00—18:00时东台风雷电等级实况图
(1)按天气预报定性评价方法,累计对96格发布雷电预警,实况12格未达预警等级,误报率12.5%;84格达到预警等级预警准确率87.5%。实况有86格达到预警等级,其中2格未发布预警,漏报率2.3%;84格成功报出,占97.7%。另有34格未发雷电预警,实况也没达到雷电预警等级,不参与评定。
(2)按天气预报定级评价方法,将预警与实况有等级差异者均视为错误。预警与实况等级完全一致的有65格,正确率49.2%;有67格存在等级差异,占总数的50.8%。预警比实况偏小1个等级的有35格,占总数的26.5%;偏小2个等级的有5格,占总数的3.8%。预警比实况偏大1个等级的有23格,占总数的17.4%;偏大2个等级的有4格,占总数的3.0%。相差1个等级的总占比为43.9%,相差2个等级的总占比为6.8%。
(3)检验预警和实况等级二组数据,其ρ值为0.72,属强相关。
4.2 预警效果评价
与当前发布的雷电预警比较,本研究的预警效果有几大优势:
(1)本方法有明确的预警等级边界,预警等级具有一定空间分辨率;而当前发布预警常为整体区域为一个等级,无空间分辨率。
(2)本方法预警等级与雷电风险等级成正比,而当前方法无相关。
(3)本方法过滤了零星雷电和弱雷电,避免了弱风险下的雷电频繁预警,指导性强;当前方法雷电预警等级与雷电多少、强弱无关,仅表示有雷电活动,指导性弱。
5 结论与讨论
文中采用天气系统时空相似与熵权修订相结合的方法,以东台风为研究对象,建立了东台风基于时空相似的雷电预警模型与熵权修订模型,通过东台风实例检验,得出如下结论:
(1)东台风雷电与天气系统具有明显的相关性和时空特征。时间上主要出现在12:00-20:00时,其它时间雷电极少,几乎可以不加考虑;空间上表现为山地雷电风险大于丘林和平地。
(2)地面气温与热岛强度对东台风雷电的发生发展有明显影响,可作为雷电预警参考因子。
(3)强雷电通量考虑了雷电密度、强度,同时减少了弱雷电对雷电预警的干扰,用其作为雷电等级因子,具有合理性和明确的物理意义。
(4)时空相似与熵权修订相结合的东台风雷电预警模型,实现了雷电的定量预警,且具有一定时空分辨率。比传统的定性预警更具实用价值,为雷电定量预警提供了参考思路。