APP下载

实时追踪森林火灾受灾范围的自动估算方法的介绍与评价

2017-04-15张丽连

福建质量管理 2017年2期
关键词:报警聚类电话

张丽连

(天津财经大学理工学院 天津 300222)



实时追踪森林火灾受灾范围的自动估算方法的介绍与评价

张丽连

(天津财经大学理工学院 天津 300222)

本文介绍了一项由Xu Zhong,Matt Duckham等人(2016)提出的基于紧急电话报警服务数据的众包信息数据使用聚类算法进行实时追踪森林火灾受灾范围的自动估算方法,并对其创新性以及实际应用价值进行了评价。

火灾;聚类算法;实时追踪

一、引言

用于计算自然灾害例如森林火灾或者洪水泛滥的有关空间范围的实时信息可以协助救灾者快速有效地组织救灾活动,以及帮助群众了解灾情。然而官方信息资源往往受到阻碍,并且是滞后的,而由使用者创造信息的社会媒体信息又往往缺乏必要的结构和真实性用以进行可靠的自动处理。在紧急灾难中,众包信息数据通常比官方信息产生得更迅速,因此在实时估计中利用这些信息更具有优势。但是这些众包信息又因为最小数据结构的限制和数据噪声的影响使得与目标事件并不直接相关,因此在使用这些信息前应该先对其进行过滤、真实性验证以及质量控制。利用众包信息数据进行实时估计的好处是明显的。在确保较为满意的精度下,使用众包数据可以做到实时估计比传统估计更灵活,且成本更低。

二、方法介绍

本文介绍的实时追踪森林火灾受灾范围的自动估算模型由Xu Zhong,Matt Duckham等人(2016)提出,文章发表在自然杂志子刊科学报告上。该文章提出了一种基于紧急电话报警服务数据的公众可用的众包数据进行实时追踪森林火灾受灾范围的自动计算估计技术。作者先介绍了实时估计森林火灾的背景,再对传统官方信息以及众包信息在森林火灾范围估计中的优劣进行了比较。然后利用2009年澳大利亚维多利亚黑色周六森林火灾的数据来展示这个模型在比较令人满意的精度上自动实时辨别和追踪森林火灾边长可能线。通过结合其他官方人口统计学和环境信息,例如人口密度和风场动态变化的数据来提高该模型估计的精确度。并对部分参数进行直觉上的调整。模型建立后,再把2014年墨西哥米克勒姆森林火灾数据代入模型中进行交叉验证,验证了模型具有良好的精确性。

以下对模型进行介绍。

(1)数据:Xu Zhong等选取了2009年澳大利亚维多利亚黑色周六森林火灾报警数据进行模型的拟合和估计。该数据集主要包括三个方面:报警时间、所处位置、报告事故类型。报警数据可能受以下两个因素的影响:不同地点的呼叫电话可能是来自同一场火灾前线;而相近点的报警电话可能是不同的火灾前线,即使在重大火灾中紧急呼叫电话也可能是其他事件的。因此需要利用已存在的空间聚类和结构构建技术对呼叫电话根据主题,时间,地点进行聚类筛选。

(2)模型主要参数:检测到的火灾最小面积(At);火灾最长的移动多边形的周长范围(x);处理中的报警电话所在区域的“窗口”大小;受限于空间(Es)和时间(Et)用于ST-DBSCAN聚类算法的最小街区电话报警数(minPts)。

(3)模型构建的四个步骤:1)对事故信息进行过滤;2)使用ST-DBSCAN算法进行空间聚类;3)重塑火灾周长形状;4)基于地面信息对估计量的甄别。

(4)估计精确度的判断标准:召回率、精确率以及F1分数。

Xu Zhong等按照以上的步骤建立了实时估计模型,并利用人口密度和风场动态变化的数据,对部分参数进行调整。最后他们把模型应用在实时估计2014年米克勒姆森林火灾周长范围,模型的预测表现出了高召回率低精确率。由于在火灾范围实时估计中高召回率更具有价值,因此该模型的应用具有很大的现实意义。

三、方法评价

该方法的创新性主要体现在两个方面。

第一,相比过去的检测技术,该项技术可以做到实时检测,并且成本较低。过去计算火灾范围只能依靠实体硬件技术检测,例如地面检测仪、高空卫星检测或者空中红外线检测等,但是这些检测都无法做到实时监测和预测,且存在明显的滞后性。这大大降低了监测的价值,因为如果可以实现火宅周长实时估计就能够挽救大量的生命和财产并从而把火宅造成的损失降到最低。同时使用这些硬件设备进行监测的成本往往是高昂的,有很多地方都没能使用上这些硬件设备进行森林火宅检测,而文章中介绍的利用报警电话数据以及结合其他一些低成本并且可实时获取的辅助信息对森林火灾周长进行实时估计,充分地利用和挖掘众包信息数据的价值。

第二,文章结合过去已经研究深彻的ST-DBSCAN聚类算法以及χ-shapes形状重塑算法还有新设计的算法形成新模型对森林火宅进行实时估计。算法的设计基本上是现成的,但是在实际操作设计上,Xu Zhong等充分发挥了其对火宅周长计算的经验从而对计算的具体情况的准确把握大大提高整个计算的精确度。

四、结语

文中介绍的这种方法背后的思维方法促使人对数据挖掘产生了一种新的理解。随着信息时代的不断渗透,生活处处是数据,我们无时无刻不在产生出数据。过去有大量的数据我们并不知道如何去使用和发挥其价值,但如今我们越来越意识到应该学会如何从这些看似没有很大用途的数据中挖掘出“黄金”。就如同当年沉寂在农场站里的90多年的繁杂数据一样,经过伟大的统计学家费歇尔的重新设计和利用重现其应有的价值一般。

同时,笔者认为该方法如果能够应用到我国的火灾或者洪水泛滥的灾情预测中,将可以大大地降低人民群众的生命财产损失。但是在应用这项技术之前,应该注意到我国目前的报警电话数据的数据结构还需要进一步改善,即需要登记者在录入报警信息时按照一定的格式录入,让报警者提供与预测最相关的数据。这就有赖于相关部门对报警电话信息录入方法的改进,同时加强对灾情预测技术的进一步的研究。

[1]Xu Zhong,Matt Duckham,Derek Chong,* & Kevin Tolhurst.Real-time estimation of wildfire perimeters from curated crowdsourcing.Nature:Scientific Reports 6,Article number:24206(2016)

张丽连(1990-),女,汉族,广东茂名人,硕士,天津财经大学理工学院,统计学。

猜你喜欢

报警聚类电话
张 晖
LKD2-HS型列控中心驱采不一致报警处理
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
2015款奔驰E180车安全气囊报警
夜半电话
电话
死于密室的租住者
奔驰E260车安全气囊报警
一种层次初始的聚类个数自适应的聚类方法研究