APP下载

IOE模型在延安市宝塔区碾庄沟流域滑坡易发性分区中的应用

2021-04-23张庭瑜孙增慧刘金宝杨亮彦

水资源与水工程学报 2021年1期
关键词:易发分区滑坡

张庭瑜, 孙增慧, 程 杰, 刘金宝,石 磊, 孔 辉, 杨亮彦, 罗 丹

(1.陕西地建土地工程技术研究院有限责任公司,陕西 西安 710075;2.陕西省土地工程建设集团有限责任公司,陕西 西安 710075;3.自然资源部退化及未利用土地整治工程重点实验室,陕西 西安 710075;4.陕西省土地整治工程技术研究中心,陕西 西安 710075; 5.陕西地建土地勘测规划设计研究院有限责任公司,陕西 西安 710075)

1 研究背景

自21世纪以来,随着人口和人类活动空间的不断增长,滑坡灾害爆发的频率也随之增高。据不完全统计,全世界每年因滑坡导致的人员伤亡约10 000人,经济损失约40×108美元[1]。滑坡防治的第一步就是预测容易发生滑坡的范围,随着GIS技术在近年来的不断发展,许多统计学理论的分类模型被引入到滑坡易发性分区当中来,如信息量模型(SI)[2]、证据权模型(WOE)[3]、确定性系数模型(CF)[4]、熵指数模型(IOE)[5]、层次分析法(AHP)[6]、逻辑回归模型(LR)[7-8]和频率密度模型(FR)[9]等。随着区域滑坡易发性分区研究的逐渐深入,一些机器学习算法也被应用在滑坡预测领域,如决策树模型(DT)[10]、随机森林算法(RF)[11]、人工神经网络模型(ANN)[12-13]以及支持向量机模型(SVM)[14]等。由于这些分类模型的引入,使得区域滑坡易发性分区的结果变得较为可信,同时也使得滑坡易发性分区的方法变得更加多元化。

水土流失现象在中国西北部的黄土丘陵沟壑区十分严重,并且滑坡灾害频发。陕西省延安市宝塔区位于黄土丘陵沟壑区的核心区域,高陡边坡分布广泛,加之人口较为集中,所以在这一地区滑坡灾害对人民的安全威胁巨大。因此,将延安市宝塔区碾庄沟流域作为本文的研究区,通过构建IOE(index of entropy)模型对研究区进行滑坡易发性分区,所得到的结果可以为当地的滑坡防治工作提供对策和意见。

2 研究区概况与数据来源

2.1 研究区概况

研究区位于延安市宝塔区东北部,地理坐标为东经109°28′30″~109°35′00″,北纬36°38′00″~36°43′30″。研究区覆盖面积96 km2,平均高程1 100 m,相对高差24.58 m。半湿润半干旱大陆性季风气候是研究区的主要气候类型,年平均气温7℃,且干旱少雨,年平均降雨量约360 mm,降雨时段多集中在8、9月之间,且暴雨是主要的降雨形式。

研究区沟壑纵横,冲沟发育密集,所以短时暴雨会引发强烈的地表径流,冲刷坡脚,时常引发滑坡灾害。研究区内发育的地层主要为中生代-新生代地层,地表主要由全新统黄土层和侏罗系砂泥岩互层覆盖,其中黄土层厚度最高可达20 m,且黄土层被雨水侵润后结构会变得松散,具有一定的湿陷性,这也是导致滑坡灾害发生的主要因素之一。

此外,地壳的间歇性抬升是新构造运动在研究区的主要表现,但稳定的沉积盆地的特征始终被保持着,所以构造作用对研究区地貌的改造没有显著的痕迹。《陕西省区域地质志》[15]显示区内无隐伏断层发育,地壳变形速率介于1~2 mm/a之间,在历史上发生过的地震震级均不超过4级[15],所以本文所使用的滑坡数据为降雨型滑坡数据,而不涉及地震型滑坡。

2.2 数据来源

数据的选择在滑坡易发性分区建模过程中是十分重要的一个环节。本文所用到的数据源有:(1)8 m×8 m分辨率的GF-1多光谱遥感影像(传感器:PMS1;轨道圈号:27978;云量:6%;采集日期:2018-07-05);(2)30 m×30 m分辨率的AsterGDEM数据;(3)基于野外调查以及遥感解译的73个滑坡点数据。

2.3 滑坡编录

要建立滑坡易发性分区模型,首先需要进行滑坡编录,通过对研究区进行滑坡编录从而生成滑坡编录图(landslide inventory map)。滑坡编录图主要包含滑坡的位置信息、滑坡的规模和平面面积以及研究区的高程数据等[16]。为了提升后续计算的效率,本文利用质心法将73个滑坡图斑转换为73个滑坡点,结合DEM制作了研究区的滑坡编录图,如图1所示。

图1 碾庄沟流域滑坡编录图

为了检测分类模型的泛化能力和结果的精确程度,在滑坡编录图幅范围内又随机生成了等量的73个非滑坡点,同时从滑坡点和非滑坡点数据中按照70%的比例,分别选取51个滑坡点和51个非滑坡点用于建立IOE模型,剩余的22个滑坡点和22个非滑坡点用于测试模型的精度和泛化能力。

2.4 滑坡影响因子

通过分析文献资料,并结合野外实际调查,本文选取了坡度、坡向、高程、归一化植被指数(normalized difference vegetation index,NDVI)、岩土体类型、土地利用类型、平面曲率和剖面曲率共8个滑坡影响因子作为滑坡易发性分区建模的解释变量,研究区各滑坡影响因子的相关数据分布见图2。其中坡度数据、坡向数据、高程数据、平面曲率和剖面曲率数据基于数字高程模型(digital elevation model, DEM)提取(图2(a)-2(e)),并利用自然间断点法(natural break method)分别将这5种解释变量分为5级;NDVI数据通过GF-1遥感影像提取(图2(f)),同样利用自然间断点法将其分为5级;基于1∶200 000地质图提取岩土体类型数据(图2(g)),并将研究区的岩土体类型分为黄土、砂岩、泥岩和砂泥岩互层;利用ENVI软件中的支持向量机分类方法,基于GF-1遥感影像将研究区的土地利用类型分为建设用地、耕地、林草地、水域和裸地,从而获得土地利用类型数据(图2(h))。

图2 研究区各滑坡影响因子的相关数据分布

3 研究方法

3.1 影响因子优选

滑坡易发性分区建立模型的前提是假设每一类解释变量均为相互独立,如果有强烈相关性存在于解释变量之间,那么过拟合的现象可能会出现在结果当中,导致精度下降。为了防止过拟合现象的发生,提高分类模型的泛化能力和精度,需要对分类模型的输入数据进行多重共线性检测[17]。一般来讲,检测多解释变量之间潜在的多重共线性的方法有相关性分析法、方差膨胀系数(variance inflation factor,VIF)检测法和条件系数检验法3种。本研究在对8种解释变量进行线性回归建模的基础上,利用方差膨胀系数检测法来检测解释变量之间可能存在的多重共线性问题。在线性回归分析时,每一个解释变量都会得到一个膨胀系数,一个对应的容差(tolerance,TOL)和一个Pearson系数,当VIF>10,TOL<0.1且Pearson系数大于0.7时,则认为该解释变量会对其他的变量造成干扰[18],因此,需要将其排除,不参与后续的建模。

3.2 IOE模型

衡量事物混乱程度的指标可以用熵来表示,其具有平均信息量的含义。对于滑坡的空间分布而言,熵可以表征滑坡在一定区域内的分布状态,熵值越大,表示滑坡的空间分布越复杂,反之,熵值越小,表示滑坡的空间分布越简单[19]。此外,每一种解释变量对滑坡的影响程度同样可以用熵来体现。因此本文以熵为基础,通过建立熵指数模型对研究区进行滑坡易发性分区,该模型的计算过程如下:

(1)

(2)

(3)

Mj max=log2Nj

(4)

(5)

Wj=Ij·FRij

(6)

式中:i和j分别为解释变量矩阵中的行和列;x和y分别为解释变量分级所占的比例和解释变量每一级中滑坡点所占的比例;FRij为研究区滑坡的频率密度;Sij为滑坡发生可能性的密度;Mj和Mj max分别为熵和熵的最大值;Nj为每一种解释变量所分的等级数;Wj为每一种解释变量的综合得分,利用公式(7)可以得到研究区的滑坡易发性指数(landslide susceptibility index,LSI),最终在ArcGIS软件中将LSI可视化得到滑坡易发性分区图(landslide susceptibility map, LSM)。

(7)

3.3 精度检测

由于影响滑坡发生的因素十分多样,且分区结果的准确性也未知,因此,有必要利用一种客观的评价方法对分区结果的准确性和模型的泛化能力进行评价。常见的评价指标有精确率(Precision)、召回率(Recall)和准确率(Accuracy)等,而在滑坡预测领域,准确率是评价分区结果准确性的最常用的指标[20]。同时,在医学领域广泛使用的接受者操作特征曲线(ROC)也经常被用于评价滑坡易发性分区结果,所得到的结果较为客观。鉴于此,本文利用准确率和ROC曲线对分区结果进行评价。

在滑坡易发性分区结果中,用TP和TN分别表示分类正确的滑坡点和非滑坡点,用FP和FN分别表示分类错误的滑坡点和非滑坡点,则准确率的计算方法如下:

(8)

准确率的取值范围为0~1,越接近于1,表明分类的准确率越高。

本文分别以灵敏度(Sensitivity)和1-特异度(Specificity)作为纵坐标和横坐标绘制ROC曲线。利用ROC曲线下的面积(AUC)来定量评价模型的分类效果,AUC的取值范围为0~1,如果AUC=0,说明模型对滑坡没有分类能力,如果AUC介于0.5~0.7之间,表明模型的分类能力较弱,如果AUC介于0.7~0.9之间,说明模型的分类能力较强,当AUC的值介于0.9~1之间时,表明模型的分类能力很强,所得出的结果有着很强的可信度[21]。AUC的计算方法如下:

(9)

式中:P为滑坡点的数量;N为非滑坡点的数量。

4 结果与分析

4.1 影响因子优选结果

本文利用VIF、TOL和Pearson系数对所选取的滑坡影响因子进行多重共线性检测,检测结果如表1所示。由表1可以看出,土地利用类型的VIF值最大(1.412),其次为坡度(1.335),岩土体类型的VIF值最小(1.052)。从Pearson系数的计算结果来看,平面曲率的Pearson系数最大(0.411),其次为坡度(0.306),高程的Pearson系数最小(-0.050)。所有影响因子的VIF值均小于10,TOL值均大于0.1,且Pearson系数均小于0.7,因此,多重共线性问题不存在于本文所选择的影响因子之间,所有的因子都可以参与后续建模。

表1 滑坡影响因子多重共线性问题检测表

4.2 滑坡易发性分区

根据各影响因子对应的分级,统计研究区滑坡的频率密度,最终建立出IOE模型,模型中的各指标参数计算结果见表2。由表2可以看出,坡向的综合得分最高(0.840 1),且滑坡点主要集中在26.553~51.093范围内,其次为平面曲率(0.274 8),然后为NDVI(0.249 1),岩土体类型的综合得分最低,为0.045 9。结果表明,影响因子分级的频率密度并不具有线性关系,与野外实际观察的结果相符合。

表2 各滑坡影响因子的指标参数计算结果

在ArcGIS平台中,按照表2的计算结果对影响因子重新分类,然后利用计算出的熵(Mj)对重新分类后的因子图层赋值,最后按照公式(7)叠加各因子图层,最终计算出研究区的LSIIOE,得到研究区滑坡易发性分区图,如图3所示。基于LSIIOE值,按照自然间断点法将滑坡易发性分区图分为5个区间,分别为极低易发区(2.272 3~4.449 5),低易发区(4.449 6~4.896 2),中易发区(4.896 3~5.305 6),高易发区(5.305 7~6.301 3)和极高易发区(6.301 4~7.017 6)。

图3 研究区滑坡易发性分区图

4.3 分区结果评价

本文分别利用训练样本集和测试样本集对滑坡易发性分区结果进行评价,见表3。从表3可以看出,基于训练样本集检测出的研究区滑坡易发性分区结果的精确度为86.27%,说明基于IOE模型得到的LSM准确率较高,分类结果的可信度较高;基于测试样本检测出的研究区滑坡易发性分区结果的精确度为90.91%,说明IOE模型在研究区进行滑坡易发性分区时的适用性较强。

表3 滑坡易发性分区结果评价

为了进一步客观地评价研究区滑坡易发性分区的结果,本文使用ROC曲线下的面积(AUC)来定量反映模型的分类效果,IOE模型的ROC曲线见图4。由图4可以看出,训练样本集的AUC值为0.828 3(图4(a)),测试样本集的AUC值为0.964 1(图4(b))。训练样本集和测试样本集的AUC值均大于0.8,说明IOE模型的分类能力较强,在测试样本集中,AUC的值介于0.9~1.0之间,也说明模型具有良好的泛化性能。

图4 IOE模型的ROC曲线图

5 讨 论

数据的分辨率对滑坡易发性分区建模十分关键,由于现阶段可获得的地质资料的图幅的比例尺最大为1∶200 000,所以为了将低分辨率数据所引起数据的稀释性最小化,本文所选取的8种影响因子最终都被重采样成30 m×30 m分辨率的栅格图像。在影响因子分级方面,例如NDVI数据自身有较强的规律性,所以利用自然间断点法分级,数据不会产生突兀的现象。

本文通过建立IOE模型对研究区进行了滑坡易发性分区,IOE模型作为常用的统计学分类模型,不需要专家经验,可以得到客观的分类结果。虽然利用IOE模型得到的研究区滑坡易发性分区的结果准确率大于80%,并且测试样本集的AUC值为0.964 1,但该模型能否在不同区域得到良好的分类效果,还需要增加更多的研究案例。

6 结 论

人类工程活动在中国西北部黄土地区不断发展且日益强烈,随之而来的是滑坡灾害的频繁发生,对黄土地区人民的生产和生活造成了极大的威胁。本文以陕西省延安市宝塔区碾庄沟流域为研究区,在已有滑坡数据的基础上,利用IOE模型进行滑坡易发性分区,最后利用准确率和ROC曲线对分类结果进行评价。最终得到的主要结论如下:

(1)利用VIF、TOL和Pearson系数对8种影响因子检测,结果表明各影响因子之间不存在多重共线性问题。坡向在IOE模型中的综合得分最高(Wj=0.840 1),是影响研究区滑坡发生的最关键因素。

(2)训练样本集和测试样本集的准确率均大于0.8,说明研究区的滑坡易发性分区结果可信度高。训练样本集和测试样本集的AUC值均大于0.8,说明IOE模型的分类能力较强,且测试样本集的AUC值为0.964 1,说明IOE模型具有良好的泛化性能。

猜你喜欢

易发分区滑坡
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
上海实施“分区封控”
夏季羊易发疾病及防治方法
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
冬季鸡肠炎易发 科学防治有方法
手诊分区法之原理探析与诊断应用
滑坡稳定性分析及处治方案
浅谈公路滑坡治理
“监管滑坡”比“渣土山”滑坡更可怕