APP下载

基于DBSCAN聚类的城市区域火灾风险计算方法*
——以深圳市盐田区为例

2021-03-12王倩倩孟繁宇曾益萍张少标吴国华杨丽丽

中国安全生产科学技术 2021年2期
关键词:盐田区火灾事故聚类

王倩倩,孟繁宇,2,曾益萍,张少标,吴国华,杨丽丽

(1.南方科技大学 统计与数据科学系,广东 深圳 518055; 2.南方科技大学 前沿与交叉科学研究院,广东 深圳 518055;3.深圳市城市公共安全技术研究院,广东 深圳 518055)

0 引言

城市火灾风险评估一直是政府和民众关心的问题,如何对火灾事故风险进行分析并量化,是目前我国相关学者正在研究的重要课题。国内外学者对城市区域火灾风险评估进行一系列的研究:张一先等[1]采用指数法对苏州古城区的火灾危险性进行分级;鲁钰雯等[2]通过ArcGIS软件对厦门市火灾风险进行评估;马砺等[3]采用主成分分析法对火灾成因进行分析和量化;李犇[4]在辨识研究区域火灾危险源的基础上,筛选出相应的火灾风险评估指标,进行火灾风险评估;贾进章等[5]采用突变理论与模糊数学相结合的评价方法求得火灾危险性评价结果;刘纪华[6]提出基于FTA,ETA的综合分析;王元鹏等[7]引用“社群”相关概念和算法,建立火灾社区之间拓扑关系的分析模型。 文献[1-7]虽然可以快速地对火灾风险进行评估,但存在过度依赖专业的判断和过去的经验的问题,基于数据运用聚类算法建立风险评估模型的研究较为少见。因此,本文在前人研究的基础上,基于数据思想运用DBSCAN聚类算法,并结合层次分析法构建火灾风险评估的验证模型,同时加入火灾原因因子通过线性变换进行量化,综合得出风险评估结果。

1 研究方法及数据来源

1.1 研究方法

1.1.1 DBSCAN聚类算法

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是1种经典的基于密度空间的聚类方法[8],其将簇定义为密度相连的点的最大集合,能够把足够密度的区域划分为簇,并可以在含有噪点的空间中发现任意形状的簇。

本文使用该算法识别深圳市盐田区火灾事故的空间聚集特征,通过多次改变参数值进行多次迭代最终得到最优聚类效果。在运用DBSCAN算法进行聚类时,需要计算2点之间的距离,使用haversine方法计算2个经纬度之间的距离,最后运用DBSCAN算法进行聚类。其中haversine计算公式如式(1)所示:

(1)

式中:haversine为半正矢函数;d为所求距离,km;R为地球半径,km;φ1,φ2为2点的纬度,(°);Δλ为2点经度的差值,(°)。

1.1.2 层次分析法

层次分析法[9,14]将决策过程中的信息采用定性与定量相结合的方式进行优化处理。

AHP具体步骤如下:

1)建立系统的层次结构模型

按照因素间的相互关系影响以及隶属关系,将因素聚集为不同层次,本文将建立3层结构模型。DBSCAN算法对火灾事故的地理位置聚类产生的结果集内的中心点作为第1层数据;火灾事故场景构成层次结构模型的第2层数据;火灾事故原因作为层次结构模型的第3层数据。

2)构造判断矩阵

层次分析结构模型确立后,问题将转化为层次中各因素和上层因素相对重要性的排序问题。本文将采用1~9及其倒数的标度方法[9]对每1层的权重进行赋值,构造判断矩阵。若A层元素中ak与下1层中B1,B2,…,Bn有联系,则判断矩阵见表1。其中aii=1,aji=1/aij(i,j=1,2,…,n)。

表1 判断矩阵Table 1 Judgment matrix

3)计算判断矩阵的最大特征根和特征向量

②计算最大特征值λmax,如式(2)所示:

(2)

式中:λmax为最大特征值;(BW)i为BW的第i个分量;BW为特征向量。

1.1.3 区域火灾综合风险值计算

1)线性变换

为减小所得数据的差异敏感度,对数据进行线性变换,此处采用底数为2的对数对其转化,计算第3层风险值。线性变换及风险值计算公式分别如式(3)~(4)所示:

(3)

(4)

式中:ri为所需要转化的数据ai通过对数转化后的数值;a和b为线性变换上下限,a=50,b=100;RL3为第3层风险值。

2)综合风险值计算

由1.1.2节计算得知分类后第1,2层的权重以及第3层的风险值,对于聚类算法产生的每个区域的火灾风险值,可通过每层的数据及其风险权重计算得到。应用线性加权方法确定火灾风险的模型计算如式(5)~(7)所示:

(5)

(6)

(7)

1.2 数据来源

本文研究的案例为深圳市盐田区2011—2019年的火灾事故数据,字段主要有火灾发生时间、地点、火灾发生原因。通过数据分析,探究在不同火灾事故场景下火灾发生起数随时间、空间以及火灾类型之间的关系,确定所需要的模型变量;删除冗杂数据,剩余火灾427起。

将火灾事故地点按照《关于城市消防管理工作的规定》[10-11]对消防安全重点单位实施分级管理和划分,并结合对数据的认识及需要将场所的管辖范围分为10类。宾馆、饭馆、旅店、招待所、咖啡馆、酒吧等娱乐场所为第1类P1;室内、室外农贸市场、商场,三合一、多合一场所为第2类P2;候车(机、船)室、公共交通工具为第3类P3;体育场(馆)、游泳场(馆)、公园、医院、博物馆、美术馆、动物园、图书馆、书店、报刊亭为第4类P4;住宅、职工宿舍、学生宿舍为第5类P5;办公场所,公司为第6类P6;工厂、拆迁工地、建筑工地、建筑施工场所、仓库为第7类P7;变压器、露天框架为第8类P8;花卉、林木(含果园)、垃圾及废弃物、苗圃、农田、养殖场为第9类P9;其他、误报为第10类P10。

2 深圳市盐田区火灾风险计算与分析

2.1 研究步骤

为筛选出合适变量进入模型,本文将深圳市盐田区火灾事故数据进行清洗与分析,分析中发现火灾事故发生场所与众多因素关联性很强,因此分别探究在不同场景下火灾发生起数随时间(年份、月份、小时、周末)、空间和火灾原因的分布特性,最终确定地理位置、火灾事故场所及事故原因3个指标来计算城市区域火灾风险值。研究步骤如图1所示。

2.2 区域火灾风险的聚类模型

DBSCAN聚类算法

本文经过数次迭代调换参数,最终确定Eps值为0.5,MmPts值为10,聚类结果为4类,分别标记为A,B,C,D类,聚类结果图如图2所示。

将每类数据汇总,计算标准偏差,观察每1类内部数据的波动性大小,具体见表2。

由图2及表2可知,对算法聚类产生的每1类的数据计算标准偏差,值接近于0,说明每1簇内部的点比较集中,波动较小,结果表明参数值选取的相对合理。

图2 DBSCAN聚类结果Fig.2 DBSCAN clustering results

表2 DBSCAN算法聚类结果汇总Table 2 Summary of DBSCAN algorithm clustering results

2.3 层次分析模型构建及验证

2.3.1 分类方法的分层划分

根据聚类结果构建层次分析法的第1层数据,由于每类的数量反映火灾的发生起数,即数值越大则在此区域发生的火灾越多,反之则越少。因此根据每类的发生起数作为指标值的参考值构造判断矩阵,见表3。

表3 第1层判断矩阵数据表示及计算Table 3 Data representation and calculation of first-level judgment matrix

第2层数据由火灾事故场景构成。根据各类场所的性质、功能类型及相关文献[12-13],得到每类场所的指标值排序:P6

基于第1层数据构造第2层数据的判断矩阵,每类包含的场所不同,因此构造判断矩阵不同,利用1.1.2节的计算方法,得到各项指标的权重、最大特征值及随机一致性比例。由于篇幅有限,本文将以A区域为例进行展示每层的判断矩阵计算值,见表4。

第3层数据是由火灾事故原因构成,根据不同类型火灾发生起数[3]作为指标的参考值,由1.1.3中方法计算得到第3层风险值,风险矩阵见表5。

表4 第2层A类区域判断矩阵数据表示及计算Table 4 Data representation and calculation of second-level judgment matrix for area A

表5 第3层A类区域风险矩阵判断矩阵数据表示及计算Table 5 Data representation and calculation of third-level judgment matrix for area A

2.3.2 区域火灾综合风险值计算

通过1.1.3方法对模型计算,得到每个区域的火灾风险值,以区域A为例,见表6。

根据区域火灾实际防控设定量化范围[50,100]及风险分为4级[14-15],见表7。

表6 区域A风险值计算Table 6 Calculation of risk value for area A

表7 火灾风险等级量化Table 7 Quantification of fire risk levels

2.4 结果分析

将各区域风险计算结果汇总,见表8。4类区域地理分布如图3所示。

表8 区域风险值汇总Table 8 Summary of regional risk values

图3 模型结果区域分布Fig.3 Regional distribution of model results

聚类区域结果讨论:

1)A类区域中住宅类最多,占比39.3%,其次为垃圾废弃物、花卉类,占比25.2%。起火原因类型中电气火灾占比最高达33.1%,间接验证了基于聚类并结合场所、原因对火灾风险计算得到的区域风险值的合理性。因此,在针对此区域的消防安全中,应加强社区安全消防的宣传,定期组织疏散灭火演习,及时发现和整改火灾隐患,降低区域火灾风险。

2)B类区域位于高速交叉处,地形复杂,为事故多发地,且周围工业园区较多,一旦发生火灾,造成的影响将会很大。在B区域中交通类型火灾占比较大,为24.04%,垃圾废弃物类占比为12.57%。由第3部分的计算得到B类区域风险最高,达96.25。建议B区域对厂房、仓库,要逐一签订防火安全责任书,严查严管,防患未然。

3)C类区域毗邻梧桐山,有部分居民区,地点较为偏僻,在2011—2019年间共发生22起火灾,其中住宅类火灾为15起,火灾原因多为电气火灾,为火灾事故低风险区,建议及时更换老旧设施,排查隐患,提高用火安全意识。

4)D类区域位于大梅沙景区,周围酒店居多,有部分小区和学校。其中住宅类和交通类火灾较多,合计达50%,火灾原因多为电气火灾,占比38.9%。建议D类区域严格按照消防安全规定合理设置消防设施,提高酒店住宿的防火等级。

3 结论

1)基于DBSCAN聚类算法计算城市区域火灾风险,聚类结果产生4类,由于各区域功能不同及地理位置不同,区域火灾风险值有明显差异。

2)通过结合层次分析法进行验证,模型计算出的4个区域结果与实际火灾情况具有一致性,结果表明B区域的消防安全状况相对于盐田区其他区域风险较高,C区域火灾风险较低,消防安全系数较高。

3)本文区域火灾风险值计算的尝试,可为开展城市区域火灾风险评估提供参考和借鉴。

猜你喜欢

盐田区火灾事故聚类
一起亡人火灾事故原因的认定
对烟头引发火灾事故的调查
基于K-means聚类的车-地无线通信场强研究
深圳盐田区智慧教育成果亮相深圳教育装备博览会
莫名的火灾事故
高层建筑火灾事故引发的思考
2017年盐田区禽流感预警监测结果与分析
深圳市盐田区开展敬老月活动
基于高斯混合聚类的阵列干涉SAR三维成像
城市GEP