APP下载

大数据驱动的极端气象灾害态势要素提取模型与优化

2022-12-09杨继君曾子轩

关键词:灾体局中人态势

杨继君, 曾子轩, 郑 琛

(1.广东财经大学公共管理学院,广东广州 510320;2.广西财经学院跨境电商智能信息处理重点实验室,广西南宁 530003;3.中共北京市委党校公共管理教研部,北京 100044)

0 引言

随着全球气候变暖,近些年来我国极端气象灾害事件呈现高发态势,其影响范围越来越广,造成的生命财产损失也异常严重[1],比如2012年北京“7.21”特大暴雨、2014年“威马逊”超强台风、2015年“东方之星”沉船事件(龙卷风)、2016年“霸王级”寒潮、2018年“山竹”超强台风、2019年“利奇马”超强台风等等都给政府部门的应急管理能力带来了巨大的考验。极端气象灾害的高效防范和快速应对需要建立在极端气象灾害态势要素提取、态势威胁评估和态势预测的基础之上。随着大数据灾害治理2.0时代的到来[2],如何在海量的极端气象灾害态势要素中快速地提取关键态势要素则成为关键。目前,关于态势要素提取的研究多集中在军事战场[3-7]、网络安全[8-13]等领域,而在自然灾害特别是极端气象灾害领域鲜有涉及,但也有学者做了开创性研究,比如,Moumita等[14]针对Twitter和Facebook等在线社交媒体上充斥着大量灾害信息的状况,提出了基于互动众包的灾害态势信息提取框架模型,以便对灾害损失和需求评估提供决策支持;黄伟等[15]基于态势感知的3个阶段,对电网台风预警防御系统中态势要素采集、实时态势理解和台风风险预测等关键技术进行归纳,并构建了台风预警防御系统的态势要素指标体系,但是其关键态势要素究竟如何提取没有涉及。

综上所述,极端气象灾害态势要素提取虽有一些开创性研究,但具体的可操作性的方法比较缺乏。因此,本文试图采用数据降维的方法从诸多的极端气象灾害态势要素中提取关键态势要素。首先以极端气象灾害中的台风灾害为例,设计灾害态势要素提取框架模型以及态势要素提取的基本原则,随后采用主成分分析法对极端气象灾害态势的诸多的态势要素进行数据降维处理并提取关键态势要素。鉴于主成分分析法中主成分权重确定具有明显的主观性[16,17],为此引入合作博弈的思想,将所确定的主成分影射为合作博弈中的局中人并以态势要素权重误差平方和最小作为合作博弈目标函数构建态势要素权重优化模型,并采用Shaply值法求解优化,以此确定态势要素权重的大小(客观赋权),进而为灾害态势威胁指标体系构建提供科学依据。

1 台风灾害态势要素提取描述框架

灾害态势要素是指描述灾害事件发展演化的内在因子和外部条件,而灾害态势要素提取就是从海量灾害数据中剔出冗余数据进而提取描述灾害状态的关键特征要素,为灾害态势威胁评估和态势预测奠定基础。当影响灾害态势的某些关键要素超过临界点或遇到一定的触发条件时会导致灾害事件发生,在未超过临界点或者没有被触发前不会造成破坏作用。依据宏观公共安全体系的“三角形模型”理论[18]可知:致灾体是指可能对人、物或社会系统带来灾害性破坏的事件;承灾体是指致灾体作用的对象;救灾体是指预防或减少灾害事件发生及其后果的各种措施和手段。这样致灾体、承灾体和救灾体构成了三角形的三条边,连接三条边的节点为灾害要素,构成了一个完整的闭环三角形框架。该框架描述了公共安全体系中最重要的3个方面,彼此之间相互影响和动态互动。由此可见,灾害严重程度不仅与致灾体直接相关,还与承灾体的脆弱性、救灾体的应急能力密切相关。因此,需要从致灾体、承灾体和救灾体等3个方面对极端气象灾害态势要素进行描述和提取。

1.1 灾害态势要素提取的原则

极端气象灾害态势要素提取是指在造成极端气象灾害的诸多要素中提取描述灾害态势的关键特征要素、去除冗余要素,从而形成灾害态势指标体系,为灾害态势威胁评估和态势预测奠定基础。因此,灾害态势要素提取的本质是一个特征要素筛选过程,即通过相关简约规则去除冗余要素,从而提取必要且关键的灾害态势要素。为了全面、准确地为极端气象灾害态势威胁评估和态势预测提供数据支持,灾害态势要素提取须遵循如下原则:全面性和相关性;可操作性和经济性;科学性和显著性;鲁棒性。

1.2 灾害态势要素提取框架设计

依据范维澄院士提出的公共安全三角形理论,以台风灾害为例,设计如图1所示的灾害态势要素提取框架模型。从图1可知,台风灾害态势的描述涉及致灾体、承灾体和救灾体等3个方面的诸多要素。

在图1中,所设计的框架模型列出了26个影响台风灾害态势的要素,并且各态势要素之间关系错综复杂。倘若对每一个要素都加以考虑分析,势必会对灾害态势威胁评估和应急处置的及时性造成影响,因此,有必要找到一种快速高效的态势要素提取方法,在保障灾害原始信息尽量不损失或损失很少的情况下提取造成灾害的关键态势要素,从而有利于对灾害态势进行快速威胁评估和快速应急处置。

图1 台风灾害态势要素提取框架模型

2 基于主成分分析法的灾害态势要素提取模型

2.1 主成分分析法极其改进策略

主成分分析法(又称主分量分析法或主轴分析法)是由Hotelling[19]于1933年首次提出来的,是一种兼顾数据降维与特征提取的多元统计分析方法。其基本思路是将多个具有一定相关性的指标通过线性变换转化为少数几个综合指标(主成分),其中每个主成分都能反映原始变量的大部分信息,而且所含信息相互不重复。该方法虽然具有上述优点,但也存在明显不足即各主成分的权重确定带有明显的主观性[16,17]。为了更好地发挥主成分分析法的数据降维优势并克服其不足,引入合作博弈理论构建基于合作博弈的灾害态势要素权重优化模型(通过要素权重的大小提取关键态势要素)即将确定的各主成分影射为合作博弈中的局中人,其可能的组合方式影射为策略集,以误差平方和最小为目标函数,将台风灾害态势要素提取问题转化为对态势要素权重合作博弈模型的求解问题。

合作博弈[20]所描述的情形是单个局中人为了克服自身的不足,为了最大限度提高自己的效用水平,具有与他人合作的动机和行动,在合作中他们彼此交换情报、充分协商,并制定具有约束力的协议,从而形成稳定的合作联盟。合作博弈通常采用Shapley值法[21]求取,该法的最大优点是Shapley值法的构造是以合作博弈中局中人对联盟的潜在贡献为基础,充分体现了多劳多得、同工同酬和不劳不得的公平原则,从而有力保障了合作联盟的长期稳定性[22]。

2.2 基于合作博弈的灾害态势要素权重优化策略描述

(1)局中人(主成分)

假设一项综合评价中有k个主成分(即有k个主成分权重需要确定),那么这k个主成分就构成灾害态势要素权重博弈的局中人集合,记为K={i=1,2,…,k},其中,i∈K表示第i个主成分。

(2)博弈策略

集合K的任一子集C∈2K构成的集合就形成合作博弈中的一个联盟,结成联盟的目的就是通过对不同主成分的权重相互博弈,最终实现降低总体权重误差的目的。在主成分组成的所有联盟中(联盟用C表示),任意一个或几个主成分都构成联盟的博弈策略,其集合记为Si。

(3)博弈收益

对特定的主成分来说,与其他主成分的不同组合可以形成不同的灾害态势要素权重博弈联盟,这些不同的组合联盟将会产生一定的收益,该收益采用态势要素权重误差量的倒数来表示,即误差越小,则收益越大。合作联盟的收益记为P(C)。

(4)收益函数

定义1设主成分个数集合K={i=1,2,…,k},P(C)是定义在K的一切子集C上实值函数,且满足如下条件:

则P(C)定义为该联盟的收益函数,在态势要素权重合作博弈过程中,收益函数用权重误差的倒数来表示即误差越小,其收益越大。另外,P({i})表示局中人i不结盟时的单独收益。

假设由不同主成分组合成两个不同的联盟C,D∈K并且C∩D=Φ,联盟C能获得的最大收益记为P(C),联盟D能获得的最大收益记为P(D)。即使联盟C和联盟D在不合作的情况下也能取得最大收益P(C)+P(D),为此,如果这两个联盟进行合作组成一个更大的联盟M=C∪D,若式(8)成立,则这两个联盟有合作的可能,在经济学上称为超可加性(也称协同效应),即所谓1+1>2。

若一个联盟不满足超可加性,那么其成员也就没有形成联盟的动机,即使已形成的联盟随时都面临着解散的风险。此外,P(C∪D)=P(C)+P(D)称为联盟的可加性。

(5)博弈模型

灾害态势要素权重博弈联盟的形成是为了进一步减少态势要素权重的误差,其模型可以表示为k个主成分之间的合作博弈:

其中,Vi为局中人i(即第i个主成分)在合作博弈中的效用函数即在一个特定的组合策略下局中人i期望得到的效用水平。对于k人合作博弈G={K,(Si)i∈K,(Vi)i∈K,P(C)},分配集中P(K)中不被任何分配优超的分配全体称为核心[23]。一个合作博弈的核心是由满足如下方程的全体支付向量组成:

其中,式(10)为个体理性条件即x提供给联盟C的收益分配不少于C自身所得的总收益P(C);式(11)为集体理性条件即满足式(11)的支付向量使合作成员最大限度地获得合作带来的好处。

在灾害态势要素权重博弈中,第i个主成分确定灾害的第ξ个态势要素(ξ=1,2,…,m)的权重记为ωξi,对应的博弈方法确定的权重为ωξG,其误差记为:

为满足所有指标误差平方和最小的要求,构造如下非线性规划函数:

(6)博弈目标

态势要素权重合作博弈的目标就是要满足整体权重误差平方和最小,从而实现整体效用最大化。此处,局中人i的效用函数采用误差的倒数表示即则博弈联盟C的目标函数具体如下:

3.3 合作博弈模型求解

采用Shapley值法求解上述合作博弈G应该首先满足如下3个公理[24]:

(1)有效性公理

假设对所有包含i的子联盟C⊂K都有P(C{i})=P(C),则有P(C)=0;同时,合作联盟中所有成员收益满足:为合作联盟的总收益,该公理体现了不劳不得(即没有贡献就没有收获)的原则。

(2)对称性公理

假设局中人i∈K,j∈K,对任一的子联盟C⊂K{i,j},总有P(C∪i)=P(C∪j),则有Pi=Pj。该条公理表明在合作博弈G中每一个局中人都是平等关系,体现了同工同酬的原则。

(3)累加性公理

对合作博弈G中任意两个C⊂K,D⊂K,有Pi(C+D)=Pi(C)+Pj(D)。该条公理体现了多劳多得的原则即在合作博弈G中每一成员展开了多项相互独立的合作,则所得收益为各项独立合作的收益之和。

如一个合作博弈G满足上述3条公理,则Shapley值法可以确定G的唯一解而达成合作博弈之目标即:

其中,|C|表示联盟C中局中人的个数;P(Ci)表示局中人i离开联盟C后联盟的收益值。

3 实证分析

本文选取2006~2018年间对我国造成灾害损失的13个台风案例为样本,具体数据如表1所示。台风采用编号表示,比如0608表示2006年第8号“桑美”台风。表1中的数据主要来源于《热带气旋年鉴》[25]、《中国海洋灾害公报》[26]、《中国统计年鉴》[27]、中国台风网[31]、中国气象数据网[32]、应急管理部灾害统计数据库[33]、中国统计信息网[28]。

表1 台风样本数据

3.1 要素初始权重确定

采用MATLAB[29]编程求解各主成分特征值、特征向量、权重以及累计权重如表2所示。

从表2可知,前4个主成分的累计权重为83.21%,满足大于80%的要求[30,31],因此可以选择前4个主成分进行台风灾害综合态势描述,即:

表2 各主成分特征值、特征向量及其累计权重

而每一主成分又由26个态势要素线性构成即

将式(11)代入式(10)得:

式(12)中F的系数参见表2(从右至左第2列),26个态势要素系数的大小反应了对灾害严重程度的影响,系数越大说明对灾害影响越重要。另外,系数前面的正负号分别表示对灾害的正向影响和负向影响,比如态势要素中心最低气压(x1)的系数为负,表示台风中心气压越低,造成的灾害越严重。通过对26个态势要素系数绝对值大小的比较,排名前10的关键态势要素为:①中心最低气压(x1);②登录最大风速(x2);③每万人拥有医疗机构床位数(x22);④台风持续时间(x3);⑤过程降雨量极值(x5);⑥农作物种植面积(x7);⑦房屋总间数(x8);⑧日最大降雨量(x4);⑨风暴增水极值(x6);⑩每万人医护人员数(x21)。

3.2 基于合作博弈的灾害态势要素权重优化方法

现将描述极端气象灾害态势的4个主成分(F1,F2,F3,F4)构成一个合作博弈的局中人集合,记为K={i=1,2,3,4},而4个主成分中的某一个或几个所形成的集合构成此合作博弈中的一个联盟C,则该合作博弈的联盟共有如下几种形式:

上述联盟的收益函数按照主成分中各自的权重求取,具体如下:

另外,将极端气象灾害态势要素提取的4个主成分的权重分别设为ω1,ω2,ω3,ω4,且满足ω1+ω2+ω3+ω4=1,0≤ω1、ω2、ω3、ω4≤1,故 有P({F1,F2,F3,F4})=1。

上述合作博弈满足Shapley值求解算法的3个公理,故依据方程(9)求解该合作博弈的核心如下:

同 理 可 求 得:ω2(P)=0.261 5;ω3(P)=0.127 4;ω4(P)=0.115 7

将所求的ω1(P),ω2(P),ω(P)3,ω4(P)代入下式:

则有:

式(14)中Fimproved的系数参见表2最后一列,排名前10的关键态势要素为:①中心最低气压(x1);②日最大降雨量(x4);③登录最大风速(x2);④人口密度(x11);⑤农作物种植面积(x7);⑥每万人拥有医疗机构床位数(x22);⑦房屋总间数(x8);⑧过程降雨量极值(x5);⑨每万人医护人员数(x21);⑩台风持续时间(x3)。此时,根据式(13)求得最小总体误差平方和为:

则最小总体误差为e=0.083 6。

3.3 结果对比分析

改进前后的前10个关键态势要素如表3所示。通过结果对比分析,可以得出如下结论:

表3 模型改进前后关键态势要素提取结果对比

(1)所设计的灾害态势要素提取模型是有效的。如前所述,为了完整地提取灾害关键态势要素,需要从致灾体、承灾体和救灾体等三个方面进行综合考量。本文的灾害态势要素提取模型本着这一要求进行设计,从提取结果来看,台风灾害10个关键态势要素分别分布在致灾体、承灾体和救灾体之中,并且致灾体中的态势要素占主导地位(超过一半),故模型构建满足了设计要求。另外,本模型提取结果与文献[32]的分析结论基本一致,也间接说明该模型是有效的和可行的。

(2)如表3所示,台风中心最低气压(x1)这个描述台风灾害的最为关键的态势要素在提取模型改进前后都排在了第一位的位置,这是符合科学事实的。根据台风形成原理可知,台风中心气压的高低是形成台风风速大小和降雨量多少的内在动因。一般情况下,台风中心气压越低,空气流动就越快,从而形成的风速和雨量越大,破坏力就越强。另外,从这13个台风样本的实际情况来看,也符合这一规律即中心气压越低,所形成的风速越强,雨量也越大。

(3)从式(16)可知,第一、第二、第三、第四主成分的权重为45.33%、21.94%、8.55%、7.39%,而式(19)中前四个主成分的权重(49.54%、26.15%、12.74%、11.57%)与之存在较大差异,这是因为式(19)给出的权重是基于合作博弈模型算出的,具有客观性。另外,由于权重的变化,各态势要素在表2中的排序也发生了明显的变化,尤其是日最大降雨量(x4)由原来的第8位上升到了第2位(参见表3),为此排在前三位的核心态势要素分别为:台风中心最低气压(x1)、日最大降雨量(x4)、台风登陆最大风速(x2),这也是与实际情况相符的,因为台风灾害的严重程度主要是由上述3个核心态势要素造成的。

(4)态势要素提取模型改进后也出现了一些新问题,需要进一步探索和完善。比如该灾害态势要素提取模型改进后,影响灾害态势的关键要素风暴增水极值(x6)跌出了前10的位置(如表3所示,在模型改进前x6虽然比较靠后,但仍处于第9位),这一点是违背台风灾害常识的。据相关资料统计[37,38],台风一般都会引发不同程度的风暴潮,并且目前每年因台风引发较强风暴潮的频率有增大的趋势,为此造成的灾害损失也越来越严重。出现上述情况的原因大概有两个方面:一方面可能是模型本身存在不足,比如在数据处理过程中,各指标数据是按线性处理的,而实际上有些指标数据之间可能是非线性的,这样必然导致提取结果出现偏差;另一方面可能是本文采用的样本数据太少(仅13个台风样本),不具有完整的代表性。

4 结语

极端气象灾害态势要素提取是灾害态势威胁评估和灾害态势预测的前提和基础,大数据时代背景下,在海量的灾害数据中快速高效地提取灾害关键态势要素尤为重要。本文从致灾体、承灾体和救灾体等三个方面设计了极端气象灾害态势要素提取框架模型,采用主成分分析法对影响极端气象灾害态势的关键要素进行提取。鉴于主成分分析法在态势要素权重确定过程中存在明显的主观性,引入合作博弈的思想,将各主成分映射为合作博弈中的局中人,从而设计了基于合作博弈的灾害态势要素权重优化方法。实证结果表明,改进后的态势要素提取模型更加合理和有效,也具有更强的解释力。此外,改进后的模型也存在不足之处,比如关键态势要素x6(风暴增水极值)没有被提取,这与实际情况不太相符,故该提取模型需要进一步的探索和完善,这为下一步的研究工作指明了方向。基于极端气象灾害态势要素提取模型的优化,通过推动自然灾害类突发事件监测与预警理论创新,推动应急管理由注重灾后救助向注重灾前预防转变,更好地从根本上减轻灾害风险。

猜你喜欢

灾体局中人态势
我国海洋生态灾害承灾体脆弱性评估
灾害脆弱性相关概念探讨
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
我国天然气供需呈现紧平衡态势
张一山、潘粤明联手 演绎《局中人》
2×2型博弈决策均衡的归一化解法
超对策模型中多形式结局偏好认知信息融合的0—1规划方法
基于灾害链效应的小秦岭乱石沟矿山泥石流风险评价
县乡一体化探索呈加速态势