APP下载

基于机器学习的多灾种灾害链预警模型重用框架设计

2022-08-26夏旭

现代信息科技 2022年9期
关键词:灾害预警框架

夏旭

(湖南安全技术职业学院,湖南 长沙 410151)

0 引 言

我国是世界上自然灾害发生较多的国家之一,对灾害进行提前预测和研判,并采取应对措施,能在最大程度减少灾害带来的损失。从研究现状来看,对某一灾种进行预警的技术已经较为成熟,然而,在灾害发生时,通常会发生多种相关次生灾害,并直接对灾害风险等级和危害程度产生较大影响,在此背景下,“多灾种”和“灾害链”的概念被相继提出,其中,“多灾种”概念最早在1992年的联合国环境与发展大会上被提出,认为随着人类行为活动的日益丰富,所面对的风险和脆弱性剧增,应开展全面的多灾种研究,“灾害链”概念则最早由郭增建等在1987年提出,之后众多学者对“灾害链”开展了研究并阐述了不同理解,最近是由AGHAKOUCHAK等人提出全球极端灾害的爆发与灾害链关系密切,这种关系类似于多米诺骨牌的连锁反应。由此可见,对多灾种灾害链的作用机制和预警模型开展研究,能有效提高灾害预警的全面性和正确性,从而降低灾害影响。

机器学习目前已经用于许多实际应用,包括计算机视觉、生物信息学等,可用于解决复杂系统问题的建模和推理,通过对大量数据进行训练,生成预警模型,从而对灾害以及造成的影响进行提前预测,例如,哈斯等人利用机器学习中的贝叶斯网络构建草原干旱雪灾灾害链预警模型,对干旱造成的雪灾影响程度进行预测。

但是,目前机器学习在灾害链中的应用存在两个方面问题,首先,大部分的研究是以单灾种为主体,未充分考虑多个灾害之间的关联,当改变其环境数据后,这些预警模型无法使用;其次,多个灾害发生时相互关联的数据集难以获取,无法训练数据生成可用预警模型。针对上述情况,受到周志华教授所提出学件概念的启发,本文提出利用多个灾害之间内在的领域知识和已有的单灾种预警模型,设计模型重用框架MRFA(Model Reuse Framework Algorithms),以解决现实问题。

1 方法

1.1 关于领域知识

在机器学习研究中,领域知识通常是指训练数据之外,与所在领域密切相关的较高层次知识,它可以反映事物之间的内在本质关系,通常难以作为属性特征在训练数据集中出现。但是,对领域知识的合理应用能对机器学习建模产生较好的促进作用,例如,赵鹏等人在聚类分析中通过对领域知识的运用建模,获得了较好效果。这种利用领域知识的方法,可以减少对数据集的依赖,提高预测效率,本文所设计的MRFA框架则是将灾害链中不同灾种之间的内在关系抽象为领域知识,并构建一种较为通用的形式,从而实现单灾种预警模型的复用,并适应不同的任务。

1.2 问题建模

可以将MRFA框架简单的描述为如图1所示的示意图。

图1 MRFA框架简易示意图

由此,可以展示MRFA框架下的数据与模型之间的关系,如图2所示,其中,数据用矩形表示,模型用六边形表示,按照预期,f是经过重新设计后的预警模型,由于它综合考了领域知识以及其他单灾种预警模型,因此,它应比初始预警模型f有更好的性能,具体验证将在第2节中实现。

图2 MRFA框架中数据和模型的关系

利用领域知识,将MRFA作为一种通用框架应用在灾害链的预警模型中,损失函数、正则函数均可以灵活运用,即使在训练数据较少的情况下,也可以有效避免过拟合带来的问题。

1.3 函数的选择

假设领域知识可以表示为非负有权无向图的形式,则先转化为邻接矩阵表示,然后,再使用经典的弗洛伊德算法计算其距离矩阵,再转化为计算相似度矩阵,最后利用式(2)进行函数构造。

2 验证

本节将利用MRFA框架运用到湖南省的山体滑坡、泥石流等山洪灾害,以及其带来的堰塞湖、内涝、房屋受损等灾害预警中,以验证该方法在训练数据量小、场景多、灾害多的情况下,与已有单灾种预警模型相比较的优劣情况。

2.1 数据来源

本研究的数据来源包括:中国地质调查局地质环境监测院(www.cigem.cgs.gov.cn)、湖南省自然资源厅(zrzyt.hunan.gov.cn)和EM-DAT(The International Disaster Database),采集数据的时间段为2010—2019年,共产生有效信息5 382条,可以绘制灾害信息分布图如图3所示。将全部数据样本分为两个部分,其中80%作为训练样本,其余作为实验样本,利用训练样本构建预测模型,然后用实验样本来对预测模型进行准确率评估。

图3 湖南省灾害信息分布图

2.2 领域知识结构

查找Web of Sciences、知网等数据库中,与滑坡、泥石流、山洪等单灾种预警模型和灾害之间关系为研究对象的文献,构建领域知识关系,得到如图4所示的知识领域关系图。

图4 多灾种知识领域关系图

按照贝叶斯网络预测的方法,结合专家经验,根据多种灾害之间的关系,按照灾害事件发生和不发生两种状态进行计算,可以得到如表1所示先验概率。

表1 贝叶斯网络预测多灾种发生的先验概率

2.3 验证结果

假设降雨强度为200 mm/d、降雨历时超过48小时,利用MRFA框架和领域知识结构,构造选择函数,对训练数据进行5次实验,并将均值作为最终结果,可以得到如表2所示的对比结果,可见在堰塞湖和公共交通上,有一定偏差,采用MRFA框架预测结果较实际情况严重。

表2 测值与实际值对比

当训练数据不足时,直接使用上述算法和模型将难以进行预测,此时,使用MRFA框架进行计算,并利用常用指标Hamming loss和F-measure作为评价标准,对4个数据集进行训练和计算,可以得到如表3所示的结果。

表3 实验结果

根据Hamming loss和F-measure的性质,前者的值越低越好,后者的值越高越好,从表3种可以看出,使用MRFA框架将能有效提升预警的准确性,同时,也提高了模型的通用性。

3 结 论

现有的灾害链预警模型多针对单一灾种,而且,对于环境数据变化、数据集较少的情况,适应能力不强。而在实际应用中,通常是多种灾害相继发生,不同的灾害之间具有一定的内在关系,因此,多灾种灾害链的预警模型研究十分必要。

本文提出的MRFA框架尝试通过利用领域知识实现对现有单灾种灾害链预警模型的复用,在数据集难以获取的情况下,完成预警任务,利用湖南省滑坡、洪涝等灾害数据对该框架进行测试,表面该框架能在一定程度上提升传统模型的性能,在当前任务上取得了较好效果。但是,本研究仅针对滑坡、洪涝等灾害的领域知识进行了分析,因此,针对其他领域的应用将是未来的研究方向。

猜你喜欢

灾害预警框架
河南郑州“7·20”特大暴雨灾害的警示及应对
框架
我省汛期常见气象灾害及防御
广义框架的不相交性
推动灾害防治工作实现新跨越
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
WTO框架下
机载预警雷达对IFF 的干扰分析
一种基于OpenStack的云应用开发框架