APP下载

云南省森林火灾发生驱动因子分析及火险区域划分∗

2022-03-28杜秋洋杨传杰张国琛武英达

森林防火 2022年1期
关键词:火点共线性火险

杜秋洋 杨传杰 张国琛 武英达 石 宽

(1.中国消防救援学院,北京 102202;2.森林草原火灾风险防控应急管理部重点实验室,北京 102202)

森林作为一种重要的自然资源,在维护生态平衡、保持水土流失等方面具有重要意义,一旦发生森林火灾危害巨大[1]。据统计,仅2010—2020年我国发生的森林火灾就有39 040起,特别是2019—2020年连续两年发生扑火人员重大伤亡,给我国森林资源和人民生命财产安全造成严重损失,因此森林火灾的有效精准预测已成为目前亟待解决的科学问题。云南省森林资源丰富,具有自然保护区、森林公园、湿地公园等11类自然保护地362处,占云南国土面积的14.32%[2],这些区域一旦发生森林火灾,后果将不堪设想。

近年来,国内外已有许多专家学者通过Logistic回归模型研究森林火灾发生的规律,并取得了一定成果。苏漳文等[3]利用福建省9个驱动因子(日最高地表气温、平均风速、日照时长等)建立该地区Logistic回归模型,该模型的预测森林火灾发生准确率达到72.3%,具有较好的预测效果,进一步验证LR模型在预测森林火灾发生概率的可行性。宋雨[4]以黑龙江省为研究对象,利用Logistic回归模型对气象因子(风速、温度、降水量等)和非气象因子(距离公路距离、人均GDP、人口密度等)进行分析验证,研究结果表明:在黑龙江省森林火灾预测当中,气象驱动因子对该省林火发生概率影响更加显著。闫平等[5]利用Logistic回归模型综合了地形、气象、植被、人为基础设施等因子,建立大兴安岭林区的多驱动因子森林火灾发生预测模型。张翔[6]分析了影响四川省凉山州森林火灾发生的驱动因子,并建立四川凉山州森林火灾发生的预测模型。Mohammadi等[7]结合伊朗库尔德斯坦省的火点数据,利用Logistic回归模型研究得出火灾发生概率与该地土地坡度、场地高程和与农田距离呈负相关,但与年降水量呈正相关。

Logistic回归模型在森林火灾发生预测方面已被国内外专家广泛运用,其在预测森林火灾发生概率中具有较好效果。如能在我国重点林区建立适用模型,将有利于采取有效措施降低火灾风险,减少扑火成本。本文基于云南省历史火点数据,结合气象、地形、植被等驱动因子验证Logistic回归模型在该地区森林火灾监测的适用性,并建立森林火灾发生预测模型,以期为加强森林火灾预防和管理提供参考。

1 研究地区概况

云南省位于21°8′~29°15′N和97°31′~106°11′E之间,平均海拔2 000 m,年温差小、日温差大,干湿季节分明,原始林和自然保护区众多,野生动植物资源丰富。2021年全省森林覆盖率已达65%。主要树种有高山松(Pinus densata Mast.)、长苞冷杉(Abies georgei Orr)、云南油杉(Keteleeria evelyniana Mast.)、云南松(Pinus yunnanensis)等。云南省火险Ⅰ级的县102个,是我国森林火灾高发多发省份之一[8]。

2 数据来源与研究方法

2.1 数据来源

2.1.1 火点数据 云南省历史森林火点数据来源于国家林业和草原科学数据中心数据共享服务平台(http://www.forestdata.cn)提供的云南省1999—2019年的火点数据(见图1)。其中,1999—2009年共1 792起森林火灾作为训练集,随机抽取2009—2019年中200 场火灾作为验证集,用于构建预测模型和模型检验。因Logistic回归模型要求训练集数据符合二项分布,因此本研究利用ArcGIS 10.7软件随机建立1 712个随机点(非火点),并将火点赋值为1,非火点赋值为0。

图1 1999—2009年森林火灾火点分布Fig.1 Distribution of fire points of forest fires from 1999 to 2009

2.1.2 气象数据 气象数据来源于中国气象数据网(http://www.cma.gov.cn)提供的月平均相对湿度(%)、最小相对湿度(%)、日平均降水量(mm)、月平均水气压(hPa)、月平均最高气温(℃)、月平均气压(hPa)、月日照百分率(%)、最低气温(℃)、月平均最低气温(℃)、月平均气温(℃)、日照时数(h)、最大日降水量(mm)、日降水量≥0.1 mm日数(d)、极大风速(m/s)、极大风速的风向、最高气压(hPa)、最高气温(℃)、最低气压(hPa)、最大风速(m/s)、最大风速的风向共20个气象驱动因子。利用ArcGIS 10.7软件以各气象站坐标为中心点建立缓冲区,计算距离最近的火点和随机点,并提取相应的气象数据[9]。

2.1.3 地形数据 云南省的海拔、坡向和坡度数据来源于地理空间数据云(http://www.gscloud.cn)提供的30 m高分辨率数字高程模型(DEM)。利用ArcGIS 10.7软件“值提取至点”功能,从DEM中提取火点和随机点对应的数据。

2.1.4 植被数据 如图2,植被数据来源于地理空间数据云(http://www.gscloud.cn)提供的空间精度为500 m的归一化指数值(NDVI)数据,NDVI为植被在某一区域内森林植被垂直投影面积的占比。利用“值提取至点”功能,提取火点对应的NDVI值。

图2 云南省NDVI值Fig.2 NDVI value in Yunnan province

2.2 研究方法

2.2.1 模型构建 Logistic回归模型[10]属于广义线性回归模型之一,是国内外最常用的林火预测模型,国内应用主要集中在四川、福建、大小兴安岭等地区,通常将该模型与遥感技术相结合应用于森林火灾预测当中。该模型假设森林火灾发生的概率为P,P=1或P=0表示有森林火灾发生或没有森林火灾发生,则P的公式为:

式中:e为自然对数的底;Z是对于x1,x2,x3,……xn的线性函数;a0,a1,a2,a3,……an是解释变量的回归系数。对发生森林火灾的概率大小P进行Logit变换,则得:

式中:a0,a1,a2,a3,……an可用极大似然估计法。

2.2.2 驱动因子选择 1)多重共线性检验。利用ArcGIS 10.7软件中的线性回归功能,根据方差膨胀因子(VIF)的大小,判断驱动因子之间是否存在显著的共线性关系,可逐步剔除共线性关系显著的因子。通常以VIF=10为衡量标准[11],当VIF介于0和10之间时,表示驱动因子之前不存在或存在较弱的共线性关系;反之,若VIF大于10时,说明驱动因子之间存在显著的共线性关系,需要对此类因子进一步筛选。2)逐步回归。利用逐步回归功能对已剔除存在共线性关系驱动因子的样本进行逐步检验,分析驱动因子对发生森林火灾的影响显著水平,确定最终构建模型的变量。

2.2.3 模型检验 本研究模型拟合度检验采用ROC曲线模型检验方法[12]。ROC曲线将预测结果划分为若干个阈值,通过AUC的值(ROC曲线下的面积)来确定模型的拟合程度[13]。当AUC介于0.7和1之间时,才认为模型具备预测火灾发生概率的功能,AUC越接近1,模型的拟合效果越好[14-15]。利用曲线坐标中的敏感度和特异性值计算约登指数(敏感度+特异性)来确定云南省火险区域划分的最佳阈值,并用最佳划分阈值和系统默认值0.5作为火险区域划分标准,将云南省划分为低火险区、中火险区和高火险区三级。根据验证集火点落入中高火险区域的概率判断构建模型拟合效果。

3 结果与分析

3.1 驱动因子选择

根据多重共线性和逐步回归的检验结果显示,极大风速、月平均气压、月平均相对湿度、月平均最高气温、日照时数、海拔高度、NDVI共7个驱动因子的VIF值<10,不存在共线性关系,如表1所示。以7个因子为自变量,是否发生森林火灾为因变量,采用输入法,置信水平为95%,进行Logistic回归分析,各变量的p值均小于0.05,通过Wald检验,如表2所示。

表1 多重共线性检验结果Tab.1 Multicollinearity test results

表2 模型拟合参数结果Tab.2 Model fit parameter results

通过模型拟合参数结果可看出月平均气压、月平均相对湿度、月平均最高气温和日照时数对云南省森林火灾发生的影响较为显著,且极大风速、月平均气压、日照时数与森林火灾发生的概率呈正相关,月平均相对湿度、月平均最高气温、NDVI呈负相关。由于海拔高度的系数<0.001,相对于其他变量影响较小,故在构建模型时可排除此变量。

将估计系数代入LR回归模型的公式可得:

式中:x1表述为极大风速;x2表示为月平均气压;x3表示为月平均相对湿度;x4表示为月平均最高气温;x5表示为日照时数;x6表示为NDVI。通过计算得到的模型对验证集中赋值为“1”的火点预测准确率为85.0%,对赋值为“0”的随机点预测准确率为79.4%,总体预测准确率为82.3%。

3.2 预测模型检验

利用ROC曲线模型检验方法对云南省森林火灾发生预测模型的拟合优度进行检验。如图3,检验结果得到AUC值为0.894,说明模型具有良好的预测效果。根据ROC曲线的敏感度和特异性可通过计算(敏感度+特异性)得出该模型划分最佳阈值为0.645。

图3 ROC检验结果Fig.3 ROC test results

3.3 火险区域划分

陈岱[9]将0.5和模型划分的最佳阈值0.645作为云南省火险区域划分的标准。其中小于0.5 的为低火险地区;介于0.5和0.645之间的为中火险地区;大于0.645的为高火险地区,火灾风险等级划分如图4、5所示。中高火险地区主要集中在大理州、丽江市、昭通市、曲靖市、楚雄州、昆明市等云南省中部和北部地区。

图4 森林火灾发生概率Fig.4 Probability of forest fire occurrence

图5 火险等级区域划分Fig.5 Classification of fire risk grade areas

4 结论

本文利用Logistic回归方法,基于云南省历史森林火点数据,结合气象、地形和植被等数据,对影响森林火灾发生的主要驱动因子进行分析,构建森林火灾发生预测模型,并对火灾风险进行区域划分[16-19],结论如下:

1)研究结果显示:月平均气压、月平均相对湿度、月平均最高气温、日照时数、极大风速、海拔高度和NDVI等7个驱动因子,对云南省森林火灾的发生具有显著影响,与苏漳文等研究福建林火发生的主要驱动因子相似。因研究结果海拔Logistic回归分析的系数<0.001,在构建模型时予以排除,原因是海拔与温度的负相关对森林火灾的影响,和海拔与风速的正相关对森林火灾的影响相互抵消。

2)构建的预测模型预测准确率高达82.3%,AUC=0.894(p<0.000 1),模型具有良好拟合效果,在该地具有一定适用性。

3)高火险地区主要集中在大理州、丽江市、昭通市、曲靖市、楚雄州、昆明市等地,该区域海拔较低,可燃物载量大,易发生森林火灾,应进一步加强护林防火的宣传教育、建立健全野外用火管控制度、加强重点火险区基础设施建设等森林火灾预防工作。

猜你喜欢

火点共线性火险
驻马店市高森林火险天气气候特征分析
银行不良贷款额影响因素分析
亚像元火点对红外预警卫星的辐射干扰特性
人身上有5个祛火点
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
不完全多重共线性定义存在的问题及其修正建议
点烟颂
江苏省海门市如何实现连续4年秸秆焚烧“零火点”?
防火迟到
京津冀森林草原火灾遥感监测及火险预报系统建设