应用地理加权逻辑斯蒂回归模型分析浙江区域野火的相关因子1)
2021-03-09彭徐剑靳全锋詹庆斌郭福涛
彭徐剑 靳全锋 詹庆斌 郭福涛
(南京森林警察学院,南京,210023) (丽水职业技术学院) (南京森林警察学院) (福建农林大学)
野火是森林生态系统重要干扰因子,维持生物多样性和生态系统结构关键因子,也是对森林资源、大气环境和人类生命财产安全造成威胁主要因子[1-4]。近年随着全球气候变暖、人口急剧增加、人类活动和工业化进程加快,中国亚热带区域野火具有频率高、强度小、高污染等特点。中国亚热带区域每年发生约2 490次野火,火灾面积高达2.14×105hm2[5-6]。浙江区域野火具有亚热带野火特性[7],因此,探索浙江区域野火发生特征、建立野火发生预测模型已成为亚热带区域野火管理的关键,对浙江区域野火发生规律和行为的探索具有重要意义。野火发生受植被、地形、气象等因子影响较大[8-11],气象、植被和地形等因子是野火发生和蔓延关键因子,气象因子可改变可燃物温度、湿度和含水率等物理性质,地形可影响可燃物空间分布,形成不同野火环境,从而直接影响野火发生和蔓延[12-15]。
野火受气象、地形、经济、社会、交通设施和人为基础设施影响[10-11],探究野火相关因子对建立野火发生预测模型至关重要。传统回归模型[16-18]假设是因变量和自变量的关系是空间平稳性(不存在空间异质性),然而,大量研究表明模型参数空间差异显著,因此,需考虑野火与潜在因子之间空间关系,以建立有效而现实的预测模型,地理加权回归可有效解决空间异质性问题[19]。本研究以浙江区域2001—2018年野火数据为研究对象,应用地理加权逻辑斯蒂回归方法,结合气象、植被和地形等因子探索野火时间变化的特征及相关因子,主要包括野火发生时间变化特征;气象、地形和植被等因子对野火发生的潜在影响;通过野火模型建立预测模型并划分火险等级。
1 研究区概况
浙江区域位于中国东部沿海区域,其范围为北纬27°6′~31°11′,东经118°1′~123°10′,面积为1.02×105km2(见图1)。第九次森林资源清查结果显示森林面积为6.05×106hm2,森林覆盖率达59.43%,仅次于福建、江西和广西,居中国第4位。全省地貌类型复杂多样,总体呈西南向东北倾斜趋势,南部多丘陵地带。该区域地处亚热带季风气候区,夏季雨热同期、冬季寒冷干燥,年平均气温为16.5 ℃,年降水量为980~2 000 mm,日照时间1 710~2 100 h[7]。
图1 浙江区域植被分布
2 研究方法
本研究以浙江区域2001—2018年野火数据为研究对象,应用地理加权逻辑斯蒂回归方法结合气象、植被、地形等因子探索野火时间变化特征及相关因子。
2.1 数据来源
火点数据:2001—2018年浙江区域野火数据来源于空间分辨率为500 m、时间分辨率为1 d的MODIS-MCD64A1火产品(https://e4ftl01.cr.usgs.gov/),该产品在监测植被火灾方面具有良好可靠性[4,20]。以2001—2018年浙江区域卫星火数据与植被类型图(1 km空间分辨率)进行叠加(http://westdc.westgis.ac.cn/),提取野火数据,数据包含每次野火发生时间、地理坐标。
地形数据:地形数据包括高程、坡向、坡度。其中高程数据来源于地理空间数据云(http://www.gsclo-ud.cn/sources/?cdataid=265&pdataid=10),运用ArcGIS对高程数据进行3D分析,获得坡向和坡度等数据,坡向指数也是目前地形研究的主要数据,坡向指数(IA)计算公式为:IA=cos(θ×2π/360)。式中:θ为坡向程度和范围0°~360°,IA取值范围为-1~1,越接近1,潜在太阳辐射越强。
气象数据:气象数据来源于中国气象数据共享网络(http://cdc.cma.gov.cn/),浙江及周边42个国家级气象站的每日气象数据。每日气象数据主要包括日平均地表气温、日最高地表气温、日最低地表气温、日平均风速、日最大风速、日降水量、日平均气压、日照时间、日平均气温、日最高气温、日最低气温、日平均相对湿度和日最小相对湿度等13个气象因子。
植被数据:植被覆盖数据跟据地理空间数据云(http://www.gscloud.cn)Landsat影像经过拼接、校正、投影等变换合成归一化植被指数(I),根据前人研究成果,以归一化植被指数为基础采用像元二分模型计算植被覆盖度(FVC)[21],公式如下:FVC=(I-IS)/(IV-IS)。式中,IS、IV分别为纯土壤像元值、纯植被像元值,其中IS、IV在完整的遥感图像处理平台中以5%置信区间确定。
2.2 数据处理
2.2.1 多重共线性诊断
多重共线性是自变量间相关关系重要表现,如果模型存在较高共线性,会导致显著性检验失去意义及模型的预测功能失效。因此在模型建模前应对自变量进行多重共线性诊断,剔除有显著共线性的自变量。本研究运用方差膨胀因子(VIF)对因子进行多重共线性检验,以方差膨胀因子等于10为标准。当方差膨胀因子大于10时,表明自变量间存在多重共线性,将其剔除并以逐步回归法得到最优结果;当方差膨胀因子小于10时,表明自变量间不存在多重共线性[22]。
2.2.2 地理加权逻辑斯蒂回归模型
地理加权逻辑斯蒂回归模型(GWLR)是对传统的全局逻辑斯蒂回归模型扩展,纳入空间因素——地理位置信息,利用加权最小二乘法对每一个样点进行参数估计,因此每个样点都有对应的估计系数[23]。与全局逻辑斯蒂回归模型相同,假设位置i有野火发生的概率为P,无野火发生的概率为(1-P),则GWLR模型的表达式如下:
β2(ui,vi)xi2+…+βn(ui,vi)xin。
式中:(ui,vi)为样本单元(样点)i的坐标;βn(ui,vi)为样点i上的第n个回归参数。
根据基于前人研究成果将总样本数据随机的分成60%训练样本和40%测试样本[24],重复5次有放回随机抽样,分别得到5组样本,对5组样本组进行地理加权逻辑斯蒂回归运算,建立5个中间模型。得到各自空间不稳定变量大于3次为基准,确定最终变量,进行最终样本运算。
2.3 浙江区域野火精度评价
应用特征曲线(ROC)下面积值(AU,C),分析评价浙江区域基于气象、地形和植被模型预测能力[25]。AU,C值的范围为0.5~1.0,其中,AU,C>0.8时,表示模型具有良好的预测能力。基于特征曲线灵敏度系数和特异性系数计算的约登指数(灵敏度系数+特异性系数-1),可判断全局GWLR模型预测准确度的最佳阈值。如果模型的预测值高于该阈值,则认为野火发生概率大;如果小于该阈值,则野火发生概率小。
3 结果与分析
3.1 浙江区域野火时间变化
图1显示,浙江区域野火次数月变化存在差异,野火主要集中在10月到次年4月。时间上野火在10、11、12、1、2、3和4月份火灾发生比率分别为14.50%、4.43%、4.60%、6.45%、20.31%、30.48%和14.50%,其占全年总火点的95.29%以上,因此10月到次年4月将成为浙江区域野火重点防火期,5月—9月为非防火期。
表1 2001—2018年浙江野火月时间变化
3.2 GWLR模型拟合结果
由表2可知,本研究运用方差膨胀因子对模型自变量进行多重共线性诊断,逐步剔除具有显著共线性自变量。防火期逐步剔除日平均地表气温、日平均气温、日最低地表气温、前一年植被覆盖度和年平均气温等5个自变量;非防火期逐步剔除日平均地表气温、日平均气温、植被覆盖度、日最高气温和日最低气温等5个自变量。
样本平稳性检验是假定因变量和自变量具有空间平稳性特征,对防火期和非防火期10组训练样本进行模型拟合后,对因变量与自变量之间关系空间非平稳性进行检验。如果“GWL R模型变量估计系数上下四分位数范围大于全局逻辑斯蒂回归模型因变量估计系数±标准差范围”,说明因变量野火发生影响具有空间非平稳性。浙江区域防火期和非防火期各5个训练样本中选择出3次及以上非平稳性变量进入全样本拟合阶段,并作为本研究模型因子,空间变量非平稳性检验详见表3。
表2 自变量的多重共线性检验
表3 GWLR模型空间非平稳性变量检验
由表4可知,防火期和非防火期全样本数据GWLR模型参数拟合结果,防火期和非防火期野火发生影响因子存在差异。其中,日平均地表气温、日降水量、海拔和年平均降水等4个因子全年对野火影响显著;仅非防火期海拔对野火影响呈负相关关系,前一年植被覆盖度呈正相关关系,其他因子在整个浙江区域上均在正相关和负相关之间变化。
表4 全样本数据GWLR模型参数估计
为了更好展现GWLR模型各因子系数变化,本研究ArcGIS10.4软件运用普通克里金法对防火期和非防火期全样本各个因子估计系数进行空间插值,对因子估计系数空间分布特征进行分析,其中防火期和非防火期各因子系数差异显著(见图2、图3),说明野火发生不仅受到气象因素影响,还受季节影响很大。此外,在因子空间变化特征进行分析的基础上,进行因子系数t检验和空间普通克里金插值,如果估计t值大于1.96,则在研究区域上绿色显示,若小于-1.96,则在研究区域上以蓝色显示(见图4、图5)。
MA-GST为日最高地表气温;AV-WIN为日平均风速;PRE为日降水量;AV-PRS为日平均气压;MI-TEM为日最低气温;MI-RHU为日最小相对湿度;DEM为海拔;Slope为坡度;Y-PRE为年平均降水量;FVC为植被覆盖度;Constant为常数。
3.3 模型效果评价
ROC曲线下面积(AU,C)是目前国内外运用较广方法,是判别模型精度重要指标,研究显示AU,C值域范围一般在0.5~1.0。当0.5
MA-GST为日最高地表气温;PRE为日降水量;SSD为日照时间;DEM为海拔;Aspect Index为坡向指数;Y-PRE为年平均降水量;Y-TEM为年平均气温;PR-FVC为前一年植被覆盖度;Constant为常数。
表5 GWLR模型评价
3.4 浙江区域野火概率分布
研究表明GWLR对浙江区域野火发生进行全样本计算出野火随机点预测概率,并运用普通克里金插值方法对江浙野火空间概率分布进行插值分析,GWLR模型默认阈值为0.5和火灾发生预测概率的阈值(Cut-off)[26]对浙江区域进行火险等级区划,防火期概率P<0.50为低火险,0.50≤P<0.738为中火险,P≥0.738位高火险区;非防火期概率P<0.50为低火险,0.50≤P<0.726为中火险,P≥0.726位高火险区(见图6、图7)。
由图6、图7可知,防火期和非防火期高火险地区主要集中在温州中部和东部、温州与丽水市交汇区域、绍兴市与宁波市交汇区域,其他区域有少量高火险区域分布。
MA-GST为日最高地表气温;AV-WIN为日平均风速;PRE为日降水量;AV-PRS为日平均气压;MI-TEM为日最低气温;MI-RHU为日最小相对湿度;DEM为海拔;Slope为坡度;Y-PRE为年平均降水量;FVC为植被覆盖度;Constant为常数。
4 结论与讨论
研究结果表明浙江区域野火时间变化不均匀,10月至次年4月野火发生点占全年总火点的95.29%,其它月份仅占4.71%,该研究防火期比整个划定防火期(11月1日至次年4月30日)提前1个月,研究结果与靳全锋[7]等研究结果一致。防火期的延长说明,一方面是气候变暖促进野火发生早于原预定期限阀值,另一方面是由于雨季不断速断,导致森林可燃物含水率大大降低,促进野火发生;野火发生受到气象因子影响重大,其具有显著空间异质性特征,发现防火期降水量较少,最大地表气温增加,平均风速较大区域野火发生频率较高。Guo et al.[10,15]和Su et al.[8-9]等研究指出,温度和风速对野火发生具有显著积极影响,地表温度和平均风速增加将有效改变森林可燃物的含水率大小来影响野火发生概率,日最小相对湿度与野火发生存在正相关关系,与与本研究的结果不一致,可能是相对湿度对野火发生没有直接影响,通过影响森林植被的生长而影响野火,较高最小相对湿度有利于地表植被生长,进一步增加可燃物负荷量,若大量可燃物暴露在高温和少雨的情况下,地面可燃物负荷量大促进了野火的发生,导致野火发生与最小相对湿度之间存在正相关系[16,27];然而非防火期降水和最大地表气温增加有效促进生长季节植物生长,植被含水率较高,有效抑制野火在该时期的发生,日照时长与野火发生存在正相关关系,Guo et al.[10,15]研究指出,日照时长增加,有效改善森林可燃物含水率,改变野火发生频率。
MA-GST为日最高地表气温;PRE为日降水量;SSD为日照时间;DEM为海拔;Aspect Index为坡向指数;Y-PRE为年平均降水量;Y-TEM为年平均气温;PR-FVC为前一年植被覆盖度;Constant为常数。
地形和植被因子是通过改变水分分布和可燃物负荷量等间接影响野火发生,海拔低、坡度缓和植被茂密区域越有利于野火发生,研究结果也表明野火发生的概率与海拔呈负相关关系,与植被覆盖度呈正相关关系。浙江区域野火火源多为人为源,随着海波增加,人类活动逐渐减弱,野火发生频率也降低;野火在缓坡区域发生频率最高,主要由于缓坡区域能够较好保存适量水分,促进有效燃料积累,防火期大量草本死亡和森林凋落物积累,为野火发生积累大量细软可燃物,防火期水分的缺乏有利于野火发生和蔓延[28]。
本研究运用GWLR模型是全局空间回归模型仅解决空间因子非平稳性问题,仅考虑自然因子对野火影响,研究显示社会、经济、人口和基础设施等因子对野火发生影响显著[10,29-31],因此,未来研究对野火影响的影子时,必须考虑社会、经济、人口和基础设施等因子。
图6 防火期野火生概率和火险等级分布
图7 非防火期野火生概率和火险等级分布