城市区域火灾事件分布规律及概率密度预测
2022-05-06马砺黄霄高建勋苗建敏张鹏宇
马砺 黄霄 高建勋 苗建敏 张鹏宇
摘要:为了对城市区域火灾进行预测和有效防控,以西安市某城区为例,对近3年火灾历史数据进行核密度分析和小波分析,研究该区域火灾事件时空分布规律,采用机器学习算法建模以预测该区域内火灾事件发生概率。结果表明:在区域空间上,中心城区火灾“热度”高,向郊区延伸“热度”呈现降低态势;在时间域上,火灾频次在14 a的时间尺度上周期性最强,在9 a时间尺度上呈现明显的季节波动性和周期性,冬季和夏季火灾频次较高;老旧小区、高层小产权房及餐饮场所火灾发生概率最大,其概率密度分别为:303.15,245.89,105.3;随机森林预测模型预测值与实际值吻合度较高(ERMSE<0.068,EMAE<0.046 7,R2=0.88),与传统的BP神经网络模型相比具有更高的预测精度和泛化能力,研究结果为城市火灾精准防控提供一定的参考价值。
关键词:区域火灾;ArcGIS空间分析;Morlet小波分析;随机森林算法
中图分类号:X 913.4;TU 998.1文献标志码:A
文章编号:1672-9315(2022)02-0260-08
DOI:10.13800/j.cnki.xakjdxxb.2022.0209开放科学(资源服务)标识码(OSID):
Distribution law and probability density prediction
of urban area fire eventsMA Li HUANG Xiao GAO Jianxun MIAO Jianmin ZHANG Pengyu
(1.College of Safety Science and Engineering,Xian University of Science and Technology,Xian 710054,China;
2.Zhoushan Hazardous Chemicals Emergency Rescue Base Co.,Ltd.,Zhoushan 316000,China)Abstract:An urban area in Xian was taken as an example to study the time series and spatial distribution of fire data from 2017 to 2019,and the machine learning algorithm modeling was adopted to accurately predict the probability of fire events in the area.The results showed that the “heat” of fires in the central urban area was spacially high,and the “heat” extending to the suburbs was continuously decreasing.The fire frequency was the most periodic on the 14 a time scale,and on the 9 a time scale,it showed obvious seasonal volatility and periodicity:the frequency of fires in winter and summer was higher;the old district,high-rise house property,on-site dining fires maximum probability,with the density being:303.15,245.89,105.3.The prediction value of the random forest prediction model was in good agreement with the actual value(ERMSE<0.068,EMAE<0.046 7,R2=0.88),and it had higher prediction accuracy and stronger generalization ability than those from the traditional BP neural network model,the research provides certain reference for urban fire management.
Key words:urban area fire;ArcGIS spatial analysis;Morlet wavelet analysis;random forest algorithm
0引言
城市火災防范对于公共安全至关重要,掌握城市区域内火灾事件的分布规律对有效地防范城市火灾意义重大[1-2]。城市区域火灾发生概率受到众多因素影响,如人口密度、自然因素、交通通达性[3]等,同样,区域的功能性也会影响火灾发生概率,如商业服务较多的地区更易发生火灾。由于引起火灾的各个环境因素以及致灾条件都随着时间和空间发生变化,地理环境的不确定性也影响着火灾事件的时空分布。为了提高消防安全管理的有效性,需要分析城市区域火灾事件分布规律,为消防安全策略的制定及消防资源的有效配置提供依据[4-5]。
国内外研究人员从不同角度研究了城市区域火灾特点和防控方法[6]。1976年,美国的BERTRAND等学者研究了人口因素对城市火灾风险的影响[7];2007年,澳大利亚的CORCORAN等学者采用空间分析技术探索火灾事件的空间和时间动态,通过火灾的动态分析揭示了火灾时空集中的趋势[8];2010年,土耳其的NISANCI等学者对2005—2008年城市中心的火灾记录进行分析,发现GIS技术有助于确定消火栓的最佳分布位置,为城市消防安全管理提供支持[9]。国内对城市火灾的研究起步较晚,张晓祥等基于GIS研究了2002—2013年南京城市火灾的时空动态,从空间、时间和时空3个方面研究了占火灾总数50%左右的住宅火灾和设施火灾的变化,据此为防火规划的提前制定提供了依据[10];张玉涛等从发生时间及空间分布方面研究了2007—2016年间我国重特大火灾事故分布规律[11],发现了火灾发生频率最高的前3名场所分别为宾馆、加工厂以及商业建筑;董新明等采用火灾风险综合评价对山东省临沂市兰山区的建筑火灾风险进行了识别及评价,优化了消防力量配置[12]。通过以上分析可知,城市火灾研究有许多的理论和方法,针对城市区域规律的发展,火灾的时空分布规律还需要得到充分研究,在市域尺度上的城市火灾发生概率的建模非常少。因此,考虑到城市区域快速发展带来风险的不确定性及一旦发生火灾后果的严重性,研究城市区区域火灾分布规律及预测方法对城市火灾防控具有重要意义。
以西安市某城区为研究对象,分析2017—2019年间发生火灾空间分布规律,采用小波分析法研究火灾时间序列,利用核密度法对影响因素重要度较大的场所进行概率密度分析;基于随机森林机器学习算法对火灾易发程度进行预测。
1区域火灾事件与研究方法
1.1区域概况及火灾事件
选取西安市某城区为研究对象,该城区总面积为159.3 km2,包含5个街道办,35个社区,此外还有107个行政村。从陕西省消防力量云平台获取2017—2019年期间该城区内发生的879起火灾案件,数据属性包括火灾事件发生地址、火灾种类、接警时间及处理过程等信息。
区域火灾事件的发生受人口密度、道路通达性、等多种因素影响。本研究将研究区域的类别、人口、道路等因素相结合,同时为了预测该城区火灾发生概率,通过与文献的比较分析,选取500 m作为栅格网格的尺寸[13],并据此建立起所需的因素特征集。
人口密度分析:泰森多边形是利用调查期间所统计的居民点位置在ArcGIS 10.4中生成的,将该多边形与研究区作叠置分析[14]。运用VBA代码计算各个泰森多边形的面积后进行属性存贮,输入居民点人口总数并进行属性存储,然后除以相应多边形的面积即可得到以泰森多边形为边界的人口密度。通过叠置分析得到每个网格的人口密度信息,将人口密度矢量图转为栅格,并利用渔网点提取样本的人口密度值[13-14]。如图1所示,人口密度在空间上的分布呈渐变趋势,密度高的区域周边主要分布为较高密度区,中度密集区则分布在较高密度区周边。
交通通达性分析:路网数据包含道路长度及类型等属性,是西安市该城区道路的线要素。如图2所示,通过奥维地图(Omap)提取道路数据,以道路线密度作为交通的通达性。
其他解释变量:依据前期现场调研,采用核密度法提取该城区火灾危险性较大的场所如老旧小区、工业产业园、城中村、高层小产权房以及工业产业园的栅格值,以此表征其空间分布;采用ArcMap中“近邻分析”工具获得火点分别与小型消防站及与一级普通消防站的最短路径距离。
1.2研究方法
1.2.1Morlet小波分析法
小波分析是利用一簇小波函数系表征或者逼近某一函数或是信号,在频域和时域上都有着良好的局部化功能[15],能够揭示出时间序列中各种隐藏的变化周期[16-17]。按火灾发生月份分别提取火灾频次,对于给定的小波函数Ψa,b(t),其连续小波变换为
小波方差与时间尺度a的对应关系称为小波方差图,表示信号振荡强弱随时间尺度a的分布规律。因此,火灾事件的主要时间尺度,即主周期,可以通过利用小波方差图中的数据峰值进行分析。
1.2.2核密度分析法
核密度估计方法是分析任一地理事件发生在空间不同位置上的概率,将一维或多维的样本数据平滑处理成连续的核密度函数,其中一个关键参数是带宽,可控制生成的密度曲面的平滑度[18]。点稀疏表示区域事件发生概率低,点密集则表示区域事件发生概率高,区域内单位面积上的事件密度或强度可通过事件数目估计。本研究中采用的空间研究单元为500 m,搜索半径为1 000 m,带宽为1 000。核密度函数见式(3)
1.2.3随机森林模型
随机森林(random forest,RF)模型用于分类及回归,可处理高维数据,并通过集成多棵决策树的方式来提高预测精度。模型具有预测准确率高、计算开销小、性能强大的优势[21]。样品和特征是随机森林模型构造过程中最重要的2个参数,可以采用Bootstrap重抽样的方法从命名为L的观测数据集中可以随机选取训练样本,具体计算见式(5)
具體步骤为:对于变量Xj,首先计算每棵树t的袋外数据OOBt的袋外误差率errrOOBt;其次,保持其它变量的序列不变,重新计算改变Xj序列后的袋外误差率errOOB′t;最后,某一特征变量的重要程度即可通过袋外数据序列改变时袋外误差的增加情况来计算。变量Xj的重要性得分计算公式见式(6)
2结果分析
2.1区域火灾时空特性分析
2.1.1区域火灾的空间分布
运用核密度法对2017—2019年西安市该城区火灾空间进行分析。图3为全部火灾点生成全局核密度图。从图3可以看出,绕城高速以东及西三环以西的地段是该城区的火灾多发地,火点在位于绕城高速以东的地段呈高度聚集状态,向郊区延伸过程中“热度”不断降低,且分散着零星的高发热点[23]。此区域居民区及工业场所居多,商铺及物流仓储均较密集,火灾风险更大。
2.1.2区域火灾的时间分布格局
采用Matlab2019a中的Morlet小波分析研究该城区发生的火灾在多时间尺度上的周期性,图4显示了小波分析周期结果。
从图4(a)可以看出,1~2 a,3~4 a,11~16 a是该城区月均火灾起数的3个周期变化规律。在时间尺度(11~16 a)上,小波系数实部等值线最密集,具有全域性且高低值变化规律明显。从图4(b)可以得到4个峰值,分别为14 a、9 a、6 a和3 a,分别对应着火灾频次变化的4个主周期。从图4(c)可得到,9 a时间尺度的小波变化实部曲线在分析区段内连续性更好,平均变化周期6个月。火灾频次在冬季和夏季较高,这主要由于夏季温度高,用电量大,电力设备易因超负荷运作而发生短路着火[24]。冬季天干物燥使得可燃物更易着火,用电及气用量受天气寒冷的影响增加,导致居民房屋内火灾隐患大。14 a时间尺度的小波变换实部曲线比较稳定,火灾频次变化的平均周期为10个月。由上述分析可知,该城区火灾发生量以第1主周期为主,第2、3、4主周期为辅,在不同时间尺度下的交替变化不同。
2.2随机森林预测模型分析
随机森林预测模型以火灾密度做为因变量来表示火灾发生概率。结合调研的结果,从社会经济、人文地理等方面综合考虑选择了13个因素做为自变量进行评估[25],火灾风险评估指标见表1。因素包括火灾风险较大场所的核密度分布、人口密度、道路密度以及火点距消防站的距离等,其中火灾密度作为因变量。通过现场调研,该城区火灾危险性较大的场所及数量分别为:老旧小区53个、高层小产权房50个、城中村43个、餐饮娱乐场所649个、建筑工地56个、工业产业园61个、加油/加气/甲醇站41个、充电站33个等。文中将自变量与火灾发生概率进行建模,对城市区域火灾进行预测分析。所有的自变量和因变量均进行了标准化处理,模型选取整个样本的80%作为训练样本,20%作为验证样本。
2.2.1随机森林算法参数的确定
节点值mtry和决策树的数量ntree作为随机森林预测模型中2个最重要的模型参数,共同决定模型计算效率以及预测精度。在实验过程中发现模型的均方根误差RMSE随着节点值mtry的增大先大幅降低而后基本保持平稳,在mtry取值为8时,RMSE最小,此后数值基本稳定,故在本模型中设置mtry参数值为8,按照上述方法优选出ntree为500。
2.2.2影响因素重要度分析
区域火灾的发生受到多种因素影响,不同因素之间可能存在非线性关系,通过运用随机森林算法,可以直接显示出输入变量及输出变量间的对应关系。图5为影响因素的重要度排序,可以看出高层小产权房小区和老旧小区这2类场所的火灾密度对该城区火灾发生概率影响最大,其重要度之和为0.55,與实际情况相符。根据影响因素重要度的排序结果,优选前8个自变量参与到随机森林算法的建模。
2.2.3模型结果的检验
通过将随机森林模型在全样本上进行拟合,可以得到火灾密度的实际值与预测值之间的散点图分布情况。如图6(a)所示,当样本数量较小的时候(即散点的左下角部分),样本预测值与真实值较为分散;而随着样本数量的增加,其拟合效果越来越好。通过计算可得出随机森林预测模型的决定系数较高(R2为0.88),且平均绝对误差EMAE和均方根误差ERMSE分别为0.046 7和0.068,均保持在较低的水平,表明所的随机森林算法对于该城区火灾发生概率具有较高的预测能力。
为了进一步检验随机森林模型的预测效果,同时采用BP神经网络算法进行该城区的火灾密度进行预测,火灾密度的实际值与预测值之间的散点图情况如图6(b)所示。通过对比可看出,BP神经网络的预测表现总体上不如随机森林预测模型,样本的真实值与预测值的分布更为分散。表2列出了2个模型预测误差指标的计算结果,2个预测模型的决定系数R2超过0.75,且平均绝对误差EMAE和均方根误差ERMSE保持在较低的水平,BP神经网络模型相比随机森林模型的预测结果误差较大。
2.3区域火灾概率分布
区域火灾事件是多种影响因子共同作用的结果,其具有一定的空间分布特征。核密度法可以被用来探索区域内各个火灾事件分布的热点区域和聚集情况,通过选定每个火灾事件发生的空间位置并分别设定一个核密度函数,提取每个场所内所有火灾事件的核函数并计算求出火灾概率密度平均值,便可用来掌握区域火灾事件发生的空间分布规律[19]。
根据前面运用随机森林算法得出的火灾发生因素重要度排序,针对重要度较大的场所分别做相应的核密度分析。如图7所示,为了进一步分析城市区域火灾的空间分布特点,对各场所核密度中心值进行提取并求出平均值,以此来反映各场所火灾发生概率的高低,分析结果见表3。通过分析该城区各场所火灾核密度值及分布图可知,研究区域在2017—2019年内老旧小区、高层小产权房小区、餐饮场所这3类场所火灾发生概率最大,同时对研究区域火灾发生率影响也最大,其概率密度平均值分别为303.15,245.89,105.3,这与对该城区现场调研结果也相互印证。
3结论
1)结合ArcGIS分析可知,该城区在空间尺度呈现中心城区火灾“热度”高,向郊区延伸“热度”不断降低的空间分布规律;由Morlet小波分析周期结果可知,该城区火灾事件存在着3 a,6 a,9 a和14 a等较为明显的时间尺度。在14 a的特征尺度上,火灾频次变化的平均周期为10个月;在9 a的特征尺度上,火灾频次变化的平均周期为6个月,且在冬季和夏季较高,呈现季节性波动特征。
2)建立基于随机森林的西安市某城区火灾发生概率的预测模型,以火灾密度作为因变量、重要度排序前8的影响因素作为自变量,预测模型评价参数R2为0.88,且均方根误差ERMSE和平均绝对误差EMAE都保持在较低的水平。
3)利用ArcGIS对该城区火灾发生影响因素重要度较大的场所分别做核密度分析,概率密度值分别为:303.15,245.89,105.3,老旧小区、高层小产权房小区、餐饮场所这3类场所对区域火灾发生概率影响最大。
参考文献(References):
[1]ZHANG Y,SHEN L Y,REN Y T,et al.How fire safety management attended during the urbanization process in China?[J].Journal of Cleaner Production,2019,236:117686.
[2]WANG Q,ZHANG J,GUO B,et al.Cityguard:citywide fire risk forecasting using a machine learning approach[J].Proceedings of the ACM on Interactive Mobile Wearable and Ubiquitous Technologies,2019,3(4):1-21.
[3]JENNINGS C R.Social and economic characteristics as determinants of residential fire risk in urban neighborhoods:A review of the literature[J].Fire Safety Journal,2013,62:13-19.
[4]ESKANDARI S.A new approach for forest fire risk modeling using fuzzy AHP and GIS in hyrcanian forests of Iran[J].Arabian Journal of Geosciences,2017,10(8):1-13.
[5]AGUILAR V D,REYES R I.A Wavelet Analysis of multiday extreme ozone and its precursors in Mexico City During 2015—2016[J].Atmospheric Environment,2018,188:112-119.
[6]WILLIAMSON R A.The socioeconomic benefits of earth science and applications research:reducing the risks and costs of natural disasters in the USA[J].Space Policy,2002,18(1):57-65.
[7]BERTRAND A L.,MCKENZIE L S.The human factor in high fire risk urban residential areas:A pilot study in New Orleans,Louisiana[M].Washington,D.C.:U S Department of Commerce,National Fire Prevention and Control Administration,1976.
[8]CORCORAN J,HIGGS G,BRUNSDON C,et al.The use of spatial analytical techniques to explore patterns of fire incidence:A South Wales case Study[J].Computers Environment and Urban Systems,2007,31(6):623-647.
[9]NISANCI R.GIS-based fire analysis and production of fire-risk maps:The Trabzon experience[J].entific research and essays,2010,5(9):970-977.
[10]ZHANG X,YAO J,SILA-NOWICKA K.Exploring spatiotemporal dynamics of urban fires:A case of Nanjing,China[J].Isprs International Journal of Geo-Information,2018,7(1):1-7.
[11] 張玉涛,马婷,林姣,等.2007—2016年全国重特大火灾事故分析及时空分布规律[J].西安科技大学学报,2017,37(6):829-836.ZHANG Yutao,MA Ting,LIN Jiao,et al.Analysis of fire incidents and characteristics of spatio-temporal distributions for serious fires from 2007 to 2016 in China[J].Journal of Xian University of Science and Technology,2017,37(6):829-836.
[12]DONG X,LI Y,PAN Y,et al.Study on urban fire station planning based on fire risk assessment and Gis technology[J].Procedia Engineering,2018,211:124-130.
[13]闫庆武,卞正富,王红.利用泰森多边形和格网平滑的人口密度空间化研究——以徐州市为例[J].武汉大学学报(信息科学版),2011,36(8):987-990.YAN Qingwu,BIAN Zhengfu,WANG Hong.Census spatialization based on thiessen polygons and grids smoothing:A case study in Xuzhou[J].Geomatics and Information Science of Wuhan University,2011,36(8):987-990.
[14]闫庆武,卞正富,张萍,等.基于居民点密度的人口密度空间化[J].地理与地理信息科学,2011(5):95-98.YAN Qingwu,BIAN Zhengfu,ZHANG Ping,et al.Census spatialization based on settlements density[J].Geography and Geo-Information Science,2011(5):95-98.
[15]WEI S,QIN S,GAO W,et al.The research of method of malignant load identification based on wavelet analysis[J].Physics Procedia,2012,25:1070-1075.
[16]AGUILAR-VELZQUEZ D,REYES-RAMREZ I.A wavelet analysis of multiday extreme ozone and its precursors in Mexico City During 2015—2016[J].Atmospheric Environment,2018,188:112-119.
[17]王平,张红,秦作栋,等.基于Wavelet-SVM的PM10浓度时序数据预测[J].环境科学,2017,38(8):3153-3161.WANG Ping,ZHANG Hong,QIN Zuodong,et al.PM10 concentration forecasting model based on Wavelet-SVM[J].Environmental Science,2017,38(8):3153-3161.
[18]李亚琼,周胜军,王同勋,等.基于优选带宽核密度估计的谐波概率潮流分析方法[J].电力自动化设备,2017(8):131-136.LI Yaqiong,ZHOU Shengjun,WANG Tongxun,et al.Harmonic probabilistic power-flow analysis based on kernel density estimation with optimized bandwidth design[J].Electric Power Automation Equipment,2017(8):131-136.
[19]崔用祥.基于随机森林的城市犯罪空间分布密度建模与影响因素探析——以上海市为例[D].上海:华东师范大学,2018.CUI Yongxiang.Modeling of spatial distribution density and influential factors of urban crimes based on random forests:A case study of Shanghai,China[D].Shanghai:East China Normal University,2018.
[20]邴其春,龚勃文,林赐云,等.城市快速路交通事件自动检测算法[J].中南大学学报(自然科学版),2017,48(6):1682-1687.BING Qichun,GONG Bowen,LIN Ciyun,et al.Traffic incident automatic detection algorithm for urban expressway[J].Journal of Central South University(Science and Technology),2017,48(6):1682-1687.
[21]唐淑兰,孟勇,王国强,等.结合多尺度分割和随机森林的变质矿物提取[J].工程科学学报,2021,44(2):170-179.TANG Shulan,MENG Yong,WANG Guoqiang,et al.Extraction of metamorphic minerals by multiscale segmentation combined with random forest[J].Chinese Journal of Engineering,2021,44(2):170-179.
[22]吴立志,陈振南,张鹏.基于随机森林算法的城市火灾风险评估研究[J].灾害学,2021,4(36):1-10.WU Lizhi,CHEN Zhennan,ZHANG Peng.Research on urban fire risk evaluation based on the random forest algorithm[J].Journal of Catastrophology,2021,4(36):1-10.
[23]夏泽龙,李浩,陈跃红.城市火灾事件时空分布规律与关联规则挖掘[J].消防科学与技术,2017,36(10):1449-1453.XIA Zelong,LI Hao,CHEN Yuehong.Temporal and spatial distribution of urban fire events and mining of association rules[J].Fire Science and Technology,2017,36(10):1449-1453.
[24]万军,葛星,张晓祥.基于火灾数据及时空分析法的某市火灾时空特征研究[J].消防技术与产品信息,2017,30(4):5-8.WAN Jun,GE Xing,ZHANG Xiaoxiang.Research on spatio-temporal characteristics of fire in a city based on fire data and spatio-temporal analysis[J].Fire Technique and Products Information,2017,30(4):5-8.
[25]宋超.面向城市消防站选址规划的时空動态火灾风险建模分析[D].合肥:中国科学技术大学,2017.SONG Chao.The spatiotemporal dynamic modeling analysis of fire risk for the location planning of urban fire stations[D].Hefei:University of Science and Technology of China,2017.