多因子协同作用下的云南省山火风险评估
2022-04-28文刚高孟平高振宇周仿荣潘浩李志栋张涛罗继强刘星星
文刚,高孟平,高振宇,周仿荣,潘浩,李志栋,张涛,罗继强,刘星星
(1.电力遥感技术联合实验室(云南电网有限责任公司电力科学研究院),云南 昆明 650217;2.云南电网有限责任公司,云南 昆明 650200;3.北京空间飞行器总体设计部,北京 100094;4.广东工业大学,广东 广州 510006)
云南省的大部分架空输电线路处于环境复杂的崇山峻岭中,输电线路遇风很容易摆动,与树木或山体坡面频繁接触,引起短路放电造成山火[1]。一旦有山火发生,火势很容易在架空线路走廊周边蔓延,使输电线路暂停运作,同时由于山火持续时间一般较长,导致绝大部分重合闸失败,进而造成停电事故。当山火蔓延影响到电网区域中多条输电线路时,很可能会造成大范围停电事故,严重影响电网的安全稳定运行[2]。为了尽可能减少山火隐患,防止电网的安全稳定运行受到山火威胁,有必要开展山火风险评估的研究。
山火的发生受植被类型、植被状态(含水率)、气象因素、地形、人为因素等影响,山火风险预测系统是受多种诱导因子作用的复杂系统。目前,山火评估预测的方法主要分为传统方法和模拟法。
传统方法包括相关关系法、统计分析法、以火报火法。H.t.Gisborne在1936年提出了多因子预测火险等级的相关关系预测方法[3]。统计分析法是通过收集历史火灾相关气象资料资料,统计分析历史火灾的天气状况、时间、地形、次数等气象因子,确定火灾与各个气象因子的相关性,总结火灾发生的规律。但是气象因子对火灾发生的影响机制十分复杂,同时火灾发生也与人类活动有一定关系,因而统计分析法对火灾的评估预测可靠性比较低[4]。以火报火法通过建立不同森林可燃物的点火燃烧实验与气象要素之间的关系来预测火灾的危险性,具有代表性的是澳大利亚曾进行点火试验800次,建立了森林火灾预报模型,该系统由McArthur设计,不仅能预测林火的可能性,还能输出定量的火行为参数,例如林火蔓延速度、火险强度、飞火距离等[5]。该方法预测火灾的危险性较为准确,但需要进行大量的野外试验,建立模型需要花费大量的时间。
随着计算机技术的迅猛发展及其在火灾评估中的应用,模拟法利用卫星监测技术和地理信息系统(geographic information system,GIS)技术,使山火预测更为准确。其中Logistic回归是应用最为广泛的模型。文献[6]基于Logistic回归模型对浙江省2000—2016年林火发生的主要影响因素进行分析,确定驱动因子,建立林火预测模型并划分火险等级,模型总体预测准确率达到79.1%。文献[7]以江西省为研究对象,利用Logistic回归模型对高程、坡度、距道路最近距离、可燃物含水率、陆地表面温度、归一化植被指数、全局植被湿度指数进行训练,接受者操作特征(receiver operating characteristic,ROC)曲线下面积(area under ROC curve,AUC)值达到0.757。文献[8]基于卫星火点数据和气象数据,用Logistic回归模型对浙江省林火变化趋势和影响因子进行研究。文献[9]运用加权Logistic回归建立广东省输电走廊林火预警模型。另外,人工神经网络(artificial neural network,ANN)也在该领域得到应用。文献[10]收集历史气候数据,采用BP神经网络进行预测。文献[11]采用中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer,MODIS)数据,以西班牙加利西亚为研究对象,比较ANN和Logistic回归模型在森林火灾评估中的优劣,结果显示二者的评估精度接近。
ANN本质是一种拟合技术,由于山火训练数据样本只有0和1,所以模型评估结果大多落在0和1附近,而落在0.4~0.6之间的值很少[12]。Logistic回归模型在山火评估领域中的应用更加广泛,因此本文基于Logistic回归模型选取更加全面的山火评价因子对山火进行评估,并进行Person相关性分析,剔除冗余的评价因子。最后,将本文所提协同多因子山火风险评估方法与文献[7,13-14]的方法对比,以验证所提方法的优越性。
1 研究区域和数据准备
1.1 研究区域
云南省位于中国西南地区,介于北纬21°8′~29°15′、东经97°31′~106°11′之间。地形以山地、高原为主,山地面积占全省总面积的88.64%,森林覆盖率达到65.04%。云南气候基本属于亚热带和热带季风气候,这种气候年温差小、日温差大,降水在空间和时间上分布也极不均匀。云南省的森林面积分布广泛,而且气候很容易引起山火,导致省内山火频繁,给电网设备等人民财产造成了重大损失。本文以云南省为研究区域,进行山火风险评估研究。
1.2 数据准备
本文通过文献调研,选取直接或间接的山火影响因子,数据集属性见表1。
表1 数据集属性Tab.1 Data set attributes
本文从地形、气象、植被和人为因素4个方面选取山火影响因子,各个因子的详细说明如下。
a)历史火点数据来源于NASA网站MODIS传感器侦测到的火点(https://firms.modaps.eosdis.nasa.gov/map/),根据云南省每天的历史火点提取火点位置的17个山火评价因子,同时随机选择非火点,并提取非火点位置的17个山火评价因子。
b)地表温度数据来源于3级水平MODIS地表温度数据MOD11A1,此数据是具有1 km空间分辨率的正弦投影数据。地表温度高的区域土壤水分少,植被干燥,容易发生山火;反之,地表温度低的区域土壤水分相对多,不容易发生山火。
c)归一化红外指数(NDII7)来源于MODIS表面反射率数据系列,选取500 m空间分辨率、8 d时间分辨率的3级正弦投影数据。该数据具有7个波段,通过波段2和波段7计算得到NDII7遥感影像。NDII7小的区域植被含水率低,容易引起火灾;反之,NDII7大的区域植被含水率高,不容易引起火灾。文献[15]通过实验和科学研究发现,NDII7较小的干燥植被比NDII7较大的新鲜植被更容易发生燃烧。因此,本文用NDII7来表征可燃物的含水率。
d)归一化指标指数(NDVI)采用全球MODIS植被指数数据提供的时空连续的植被监测数据[16-17]。采用正弦投影和16 d合成的500 m空间分辨率的植被数据,用于检测植被状态和土地覆盖率变化情况。
e)高程数据描述一个地方的海拔高度,不同高程对山火发生的影响程度不一样。高海拔的地方温度比较低,空气湿度大,发生山火的可能性比较低;反之,低海拔的地方温度比较高,空气湿度小,发生山火的可能性大[18]。
f)坡度描述地面的倾斜程度,受重力等因素的影响,坡度大的地方植被的保水能力小,水土流失比较严重,更容易发生山火。坡向描述一个地方的朝向,不同坡向决定着对阳光照射的接受程度,接受阳光多的坡向发生山火的可能性更高。根据高程,利用ARCGIS软件的3D分析功能可得到研究区域的坡度和坡向。
g)距道路距离和距离居民的距离反映人为因素对山火的影响关系。距离道路和居民地近的地方,人类活动频繁,容易引起山火;距离水体近的区域土壤湿度高,不容易引发山火[19]。
h)不同的土地类型对山火发生的影响程度不同,森林、灌木丛和覆盖度高的草原更容易引发山火。
i)气象对于山火的发生有重要的影响,选取降水量、空气湿度、平均温度、最小温度、最大温度、最大阵风风速、最大阵风风向7个气象因子。气象要素的精度对于山火评估有重要影响,文献[20]使用基于ANUSPLIN的样条插值方法对全国667个气象站数据进行插值,利用1 667个加密站点对气象插值结果进行准确性检验,并与反向距离权重法和普通克里金插值方法进行实验对比,结果表明基于ANUSPLIN的样条插值方法误差最小。因此,本文选择该方法对研究区域的125个气象站获得的气象资料进行插值,得到整个研究区域的气象数据。
2 评估模型与评价指标
本文提出的山火评估流程如图1所示,评估模型为Logistic回归模型,系统性能指标为AUC。
图1 山火评估流程Fig.1 Wildfire assessment flow chart
2.1 评估模型
Logistic回归模型是线性回归分析模型,常用于数据分析、金融、医学等领域。通过Logistic回归分析可以得到自变量的权重,输出0~1之间概率值,模型根据结果是否大于0.5分类为0或1。本文基于山火影响因子,通过Logistic回归模型计算山火风险概率,计算公式为:
(1)
z=β0+β1x1+β2x2+…+βnxn.
(2)
式(1)、(2)中:Pz为发生山火风险概率;β0为模型中常数,表示方程的截距;n为自变量的个数,这里表示山火影响因子个数;xi(i=1,2,…,n)为山火影响因子种类,βi为模型中与xi对应的变量参数。
2.2 评价指标AUC
ROC曲线可用于揭示敏感性(真正率)与特异性(假正率)之间的相互关系。通过设置连续变量的阈值,计算出敏感性a和b,以a为纵坐标、以(1-b)为横坐标绘制而成的曲线即为ROC曲线。AUC可以评估预测模型的质量,其值介于0.5~1:当AUC为0.5时,说明模型的预测效果很差,相当于随机分类;当AUC接近1时,说明模型的预测效果很好。
3 实验与讨论
3.1 相关性分析
相关性分析是研究模型自变量之间相关程度的分析,衡量2个自变量因素的相关密切程度,目的在于发掘自变量间的相关特性,是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。
利用统计产品与服务解决方案(statistical product service solutions,SPSS)软件分析火点评价因子的Person相关性,Person系数接近1时表示有强正相关,接近-1时表示有强负相关。地表温度与平均气温的相关性系数为0.607,平均气温与最低气温、最高气温的相关性系数分别为0.931、0.943,最低气温与最高气温的相关性系数为0.822。一般认为,相关性系数绝对值达到0.6即为高度相关[12],可利用逐步回归剔除相关性系数高的其中一个因子。本文通过相关性分析,剔除平均气温、最低气温2个因子。
3.2 结果和分析
3.2.1 评价指标比较
本文提取MODIS和NPP信息中2018年和2019年所有遥感侦测到的植被大火火点的17个特征,整理得到29 442个样本火点,同时选取相同数量的非火点样本,最终数据集包含58 884个样本,其中70%的样本用于训练集,30%的样本用于测试集。
用高程、坡度、坡向、植被覆盖类型、距最近道路距离,距最近水体距离、距最近居民点距离、地表温度、可燃物含水率、归一化植被指数、降水量、最高气温、平均相对湿度、最大阵风风速、最大阵风风向15个因子来评估云南省山火,与文献[7,13-14]的山火评估方法进行实验对比,结果见表2。
表2 几种山火评估方法AUC的对比Tab.3 AUC comparisons of different wildfire assessment methods
文献[13]采用高程、坡度、坡向、植被覆盖类型、距最近道路距离、距最近水体距离、距最近居民点距离7个评价因子来评估山火。本文方法计算得到的AUC达到0.80,与文献[13]方法相比提升了0.16,说明地表温度、可燃物含水率、归一化植被指数、降水量、最高气温、平均相对湿度、最大阵风风速、最大阵风风向等因子能够显著提升评估效果。
文献[14]采用高程、坡度、坡向、植被覆盖类型、距最近道路距离,距最近水体距离、距最近居民点距离、地表温度、可燃物含水率、归一化植被指数10个评价因子来评估山火。与文献[14]方法相比,本文方法计算得到的AUC提升了0.10,说明降水量、最高气温、平均相对湿度、最大阵风风速、最大阵风风向是评估山火的有效指标。
对比文献[13]和文献[14],文献[14]方法考虑地表温度、植被含水率和归一化植被指数这3个影响因子,其AUC相比文献[13]提升了0.06,说明这3个遥感特征用于评估云南省山火并不会出现冗余特征的现象。
文献[7]在较大的时间尺度和省级空间尺度上进行森林火灾风险分区研究,基于Logistic回归建立火灾风险评估模型,实验结果显示火灾分布与火灾影响因素之间具有很好的拟合度。但是文献[7]只采用海拔、土地利用类型、土地表面温度、归一化植被指数和全局植被水分指数对火灾进行预测评估。本文虽然缺少全局植被水分指数数据,但是引入了归一化红外指数来表征植被水分状态。与文献[7]方法相比,本文方法计算得到的AUC提升了0.11,可见气象要素对于云南省山火评估有着重要作用。
测试集混淆矩阵见表3。从混淆矩阵可以得到:本文方法非火点的错误率为0.21,火点的错误率为0.19;文献[13]方法非火点的错误率为0.34,火点的错误率为0.38;文献[14]方法非火点的错误率为0.28,火点的错误率为0.33;文献[7]方法非火点的错误率为0.28,火点的错误率为0.34。从预测准确性来看,本文选取的评价因子更具有优势。
表3 测试集混淆矩阵Tab.4 Test set confusion matrix
3.2.2 风险图比较
选取不同评价因子,制作2018年1月17日的山火风险概率图,并将概率按等区间划分的原则划分为极低、低、中等、高、极高5个等级,如图2所示。0~0.2为山火发生概率极低;0.2~0.4为山火发生概率低;0.4~0.6为山火发生概率中;0.6~0.8为山火发生概率高;0.8~1为山火发生概率极高。从图2来看,虽然大部分火点落在高风险的红色区域和黄色区域,但是文献[13]、文献[14]和文献[7]的山火风险概率图中,云南省大部分区域都预测为红色和黄色的高风险区域,与实际情况不符合。根据本文选取的15个评价因子预测得到的云南省山火风险概率图中,大部分区域为低风险区域,而且大部分火点也处于山火发生概率高和极高的高风险区域,与实际情况相符。因此,可以采用本文的15个评价因子评估云南省的山火风险状况,结合相应的消防设施资源,做好扑救山火的准备。
图2 选取不同评价因子时,云南省2018年1月17日的山火风险概率图Fig.2 Wildfire risk probability in January 17, 2018 in Yunnan when selecting different evaluation factors
4 结束语
云南省的许多输电线路工程需要穿越山岭地带,输电线路容易受到山火的影响,引发电力事故,因此有必要进行山火风险评估的研究。为了有效进行山火风险评估,本文基于Logistic回归模型,从地形、人为因素、遥感和气象4个方面选取山火评价因子,选取高程、坡度、坡向、植被覆盖类型、距最近道路距离,距最近水体距离、距最近居民点距离、地表温度、可燃物含水率、归一化植被指数、降水量、平均气温、最低气温、最高气温、平均相对湿度、最大阵风风速、最大阵风风向17个山火影响因子,并通过相关性分析剔除平均气温和最低气温2个冗余因子。实验结果显示,所选15个因子能全面、准确地评估云南省的山火状况。本文选取的15个山火因子实质上是针对山火的空间规律进行评估,未来可以研究从时间序列的角度出发进行山火评估。