APP下载

信息量与多模型耦合的滑坡易发性评价研究

2021-12-09仪政宋琨黄海峰李辉

人民长江 2021年10期
关键词:三峡库区

仪政 宋琨 黄海峰 李辉

摘要:滑坡易发性评价是识别滑坡灾害危险性“靶区”的基础和关键。三峡库区秭归县的侏罗系地层区是滑坡灾害易发区,选取坡度、地表切割深度、曲率、距水系与路网距离等8个影响因子,通过信息量模型(I)与人工神经网络(ANN)、随机森林(RF)、XGBboost、支持向量机(SVM)等4种模型耦合,进行了滑坡易发性评价。通过受试者工作特征(ROC)曲线对比分析发现:信息量和支持向量机耦合模型的ROC曲线AUC值最大(0.848),滑坡易发性的分区图显示高易发区主要集中在水系和路网两侧,其结果与实际滑坡分布基本一致。研究成果可为区域滑坡易发性评价和滑坡灾害的防治提供参考。

关键词:滑坡易发性评价; 滑坡易发性分区; 信息量模型; 多模型耦合; 侏罗系地层; 三峡库区

中图法分类号: P642

文獻标志码: A

DOI:10.16232/j.cnki.1001-4179.2021.10.022

0引 言

滑坡灾害的频繁发生会对山区居民的生命财产安全造成巨大威胁。为降低滑坡灾害的损失,需要在滑坡易发“靶区”识别的基础上进行合理的工程防治或监测预警。而滑坡易发“靶区”的识别主要是基于滑坡易发性的评价结果而进行的。因此,滑坡易发性的评价成为山区地质灾害防治的基础性工作。

滑坡易发性评价的方法主要有:信息量法[1]、确定性系数[2-3]、逻辑回归[2-3]、层次分析法[4]、熵值法[5]、模糊度[6]、支持向量机[7]、人工神经网络[7]、随机森林[8]、决策树[9]、XGBoost[10]等。目前国内外学者对此进行了较多研究,如Devkota[2]等运用确定性因子、熵值法、逻辑回归模型对喜马拉雅山区滑坡进行了易发性评价,并分析了各模型的准确度;乔德京等[7]将随机森林和确定系数耦合,进行滑坡易发性评价,发现耦合后的模型精度更高;张玘恺[3]等将信息量法、确定性系数、逻辑回归相耦合,对九寨沟县滑坡进行易发性评价,并指出耦合后的模型要比单独信息量模型的评价准确高。由于传统信息量法无法体现各因子的权重,因此,将传统信息量和确定性系数模型及其他模型耦合[3-8],可赋予信息量和确定系数相应的权重,使得滑坡易发性评价获得更高的准确度和可靠度。

三峡库区秭归县的侏罗系地层区(占秭归县土地面积的22%)是滑坡地质灾害的多发区。李长冬[11]等以三峡库区侏罗系软硬相间地层作为研究对象,并对三峡库区侏罗系软硬相间地层中抗滑桩布设和结构优化进行了研究。据统计,秭归县39%的滑坡灾害发生在该地层区。为评价该区域滑坡的易发性,采用信息量模型(I)与人工神经网络(ANN)、随机森林(RF)、XGBoost、支持向量机(SVM)等4种模型耦合,并对比各耦合模型的准确度寻找最优模型,以为其他区域滑坡易发性评价提供借鉴。

1研究方法

1.1信息量法

信息量法是以信息论为基础的统计方法。信息量法把影响区域稳定性因素的数值转化为能够反映出对区域稳定影响程度的信息量值,信息量越大,滑坡发生的可能性越大,反之亦然。信息量模型计算公式如下[1]:

1.3随机森林

随机森林属于一种特殊的自助抽样集成(Bagging)方法,并以决策树作为Bagging中的模型[12]。该模型对大小为N的原始样本进行有放回的随机抽样,得到m个大小为N的新训练集,之后对每个训练集进行决策树建模,然后对这些决策树进行组合,最终采用投票的方式以少数服从多数的原则来得到最终的分类和预测结果。随机森林模型不仅对数据选取随机化,且对特征的选取进行了随机化,通过平均决策树极大减少了模型的过拟合。

1.4XGBoost

XGBoost模型是改进的梯度提升树(GBDT)算法,模型使用牛顿法求解损失函数的极值,将损失函数通过泰勒形式展开到二阶,另外损失函数中加入了正则化项。训练时的目标函数由两部分组成,第一部分为梯度提升算法损失,第二部分为正则化项[13]。

1.5SVM(支持向量机)

支持向量机(SVM)是Vapnik基于统计学理论提出的一种机器学习方法,通过寻求结构化风险最小化从而提高学习机的泛化能力[14]。为了减小归纳误差,本文选取径向基核函数作为核函数来进行滑坡易发性评价。

径向基核函数为

1.6信息量与多模型耦合模型

传统的信息量模型虽能客观地获取到各个因子对滑坡灾害易发性的影响程度,但是没有确定各影响因子的权重,而ANN、RF、XGBoost、SVM模型的可以确定各影响因子的权重。因此为了更准确地预测滑坡易发性地区区划,本文将信息量模型和ANN、RF、XGBoost、SVM模型耦合,进而得到滑坡易发性区划图。

2研究区概况及评价流程

2.1研究区概况

三峡库区秭归县是滑坡灾害频发的重点区域。近几年曾发生多起大型滑坡灾害事件,如2003年7月13日的沙镇溪镇千将坪滑坡、2014年9月2日的沙镇溪镇杉树槽滑坡、2017年10月29日的归州镇盐关滑坡和2019年12月5日的泄滩乡卡门子湾滑坡等。这些新发生的滑坡灾害所处地层均为侏罗系地层。因此,将秭归县侏罗系地层区作为研究区进行滑坡灾害易发性评价。

研究区地理坐标为110°27′45″E~110°46′53″E,31°11′47″N~30°54′12″N,国土面积532 km2。地层主要为侏罗系的沙溪庙组、聂家山组和香溪组。岩性主要为紫红色泥岩夹石英砂岩、灰绿色粉砂质泥岩、粉砂岩夹长石砂岩和炭质页岩,以及中厚层砂屑灰岩和泥质白云岩等[15]。据调查数据统计可知,区域内共有滑坡灾害点183处(见图1),占秭归县全境滑坡总数(458处)的39%,多数分布在河流两侧。

2.2数据来源和滑坡易发性评价流程

本文研究所需要的数据包括遥感影像数据、滑坡数据、河流路网矢量数据等。高程数据采用分辨率为30m ASTER GDEM数据,遥感数据使用Landsat4-5 TM卫星数字产品,二者均从地理空间数据云(http:∥www.gscloud.cn)下载获得。滑坡数据通过秭归县地质灾害点排查资料获取。本文采用分辨率50 m×50 m的栅格作为滑坡易发性评价的基本单元,使用ArcGIS将整个研究区划分为213 785个栅格单元。首先利用ArcGIS软件提取各评价因子图层,然后依据研究区内滑坡影响因子的分析结果,按照每个因子的不同类别及对滑坡的影响程度进行因子分级划分,再将分级后的因子图层和滑坡灾害点图层属性连接,计算各分级因子信息量;之后为各分级图层赋予信息量数据,进而得到各因子信息量图层。使用GIS中栅格转点工具将研究区的栅格单元转换成点数据,之后使用多值提取至点工具与各因子信息量栅格图层叠加分析,提取到整个研究区信息量属性数据,建立滑坡易发性数据库。将183个灾害点和等数量的非灾害点作为总样本,从中随机选取70%的样本点作为训练样本,导入到各模型当中进行训练;剩余的30%作为测试样本,运用ROC曲线来检验模型分类的效果。滑坡易发性评价流程如图2所示。

3指标因子构建

指标因子的选取影响着滑坡易发性评价的精度。通过对研究区现场地质调查以及灾害点的时空分布规律,选取了以下8种环境指标因子:坡度、地表切割深度、曲率、地形湿度指数(TWI)、归一化植被覆盖指数(NDVI)、距水系与路网距离、土地分类。其中,坡体的坡度直接影响到坡体内部的应力分布状态,控制坡体的稳定性;地表切割深度直观地反映了地表被侵蚀切割的情况;曲率将影响着坡面物质的搬运和沉积;归一化植被覆盖指数反映了地表植被覆盖情况,植被频繁的地区水土保持越好,有利于增强坡体的稳定性。研究区位于三峡库区,水库和河流旁的坡体坡脚常年受到冲刷掏蚀,加速了坡体的失稳,因此选取距水系距离及地形湿度指数作为环境指标因子。土地分类和离公路距离可反映人类活动的区域,交通建设削坡改变了坡体的自然地貌,增大了灾害发生的概率。

通过整理收集的资料(高程数字模型DEM,水系图,路网图,遥感影像图,滑坡点分布图),利用ArcGIS空间分析功能和栅格计算器处理DEM数据得到坡度、地形湿度指数、地表切割深度、曲率因子图层。对水系和路网进行缓冲区分析,缓冲距离均设置为0~300 m,300~600 m,600~900 m,>900 m。把获得Landsat4-5 TM遥感影像数据导入到ENVI软件中,利用波段运算得到研究区归一化植被覆盖指数,之后使用监督分类工具以最大似然法进行对遥感影像进行土地分类。最终得到的各评价因子图层如图3所示。

4滑坡易发性评价

4.1基于ArcGIS信息量计算

根据灾害点和各因子图层叠加分析,依据信息量模型计算出不同因子等级下的信息量值(见表1),然后将信息量值赋予各因子分级图层中,利用ArcGIS栅格计算器将各因子信息量图层叠加,得到研究区的滑坡总信息量。

4.2基于多模型与信息量耦合的滑坡易发性评价

選取含有信息量的灾害点和等数量的非灾害点作为总样本,随机抽取70%总样本作为训练样本,30%总样本作为测试数据。将样本数据导入到SPSS Modeler以及Python进行训练,得到ANN,RF,XGBboost,SVM易发性评价模型,然后将整个研究区信息量总数据代入模型中进行计算,得到研究区的滑坡易发性指数。将获得的易发性指数导入ArcGIS当中,利用自然断点法划分5个等级,最终得到多种模型与信息量耦合的研究区滑坡易发性评价图(见图4)。

4.3精度分析

为评价各模型预测的精度,本文采用受试者工作特征曲线(ROC)对模型进行精度评价。ROC曲线越靠近左上方,表明预测结果的准确度越高,曲线与X坐标轴围成的面积AUC值通常来衡量预测结果的精确度,AUC值越大,表明预测预测精度越高。ROC曲线纵轴代表真阳性率(敏感性),在滑坡灾害易发性评价中代表研究区中各易发性等级内真实发生滑坡灾害的累加百分比;其横轴代表假阳性率(特异性),在滑坡灾害易发性评价中代表研究区内各易发性等级面积累加百分比[3]。从ROC曲线(见图5)可知,信息量模型,I-RF模型,I-XGBoost模型,I-ANN模型,I-SVM模型的AUC值分别为0.653,0.784,0.813,0.825,0.848。结果表明单独的信息量模型预测效果远不如耦合模型的准确度,且I-SVM耦合模型精度最高,耦合效果最好。

5结 论

(1) 本文以三峡库区秭归县侏罗系地层区为研究区域,选取了坡度、曲率、地形湿度指数(TWI)、归一化植被覆盖指数(NDVI)、地表切割深度、土地分类、水系距离、路网距离共8个影响因子建立滑坡灾害易发性评价指标体系,运用单一信息量模型以及信息量模型与多模型耦合模型,建立了滑坡易发性区划图。单一信息量模型预测精度不如信息量和机器学习耦合模型,各模型中水系距离和道路距离均占比较大。

(2) 根据滑坡易发性区划图可知,滑坡极高和高易发区主要分布在水系和路网的两侧,其结果与滑坡灾害点分布基本一致。

(3) 不同信息量和机器学习耦合模型结果对比发现,信息量与支持向量机耦合模型(I-SVM模型)的ROC曲线其AUC值最大,为0.848,表明信息量与支持向量机耦合模型的预测效果最佳。

参考文献:

[1]陈立华,李立丰,吴福,等.基于GIS与信息量法的北流市地质灾害易发性评价[J].地球与环境,2020,48(4):471-479.

[2]DEVKOTA K C,REGMI A D,POURGHASEMI H R,et al.Landslide susceptibility mapping using certainty factor,index of entropy and logistic regression models in GIS and their comparison at Mugling-Narayanghat road section in Nepal Himalaya[J].Natural Hazards,2013,65(1):135-165.

[3]張玘恺,凌斯祥,李晓宁,等.九寨沟县滑坡灾害易发性快速评估模型对比研究[J].岩石力学与工程学报,2020,39(8):1595-1610.

[4]许嘉慧,孙德亮.基于GIS与改进层次分析法的奉节县滑坡易发性区划[J].重庆师范大学学报(自然科学版),2020,37(2):36-44.

[5]韩玲,张庭瑜,张恒.基于IOE和SVM模型的府谷镇滑坡易发性分区[J].水土保持研究,2019,26(3):367-372.

[6]MENG Q,MIAO F,ZHEN J,et al.GIS-based landslide susceptibility mapping with logistic regression,analytical hierarchy process,and combined fuzzy and support vector machine methods:a case study from Wolong Giant Panda Natural Reserve,China[J].Bulletin of Engineering Geology and the Environment,2016,75(3):923-944.

[7]夏辉,殷坤龙,梁鑫,等.基于SVM-ANN模型的滑坡易发性评价:以三峡库区巫山县为例[J].中国地质灾害与防治学报,2018,29(5):13-19.

[8]乔德京,王念秦,郭有金,等.加权确定性系数模型的滑坡易发性评价[J].西安科技大学学报,2020,40(2):259-267.

[9]杨永刚,殷坤龙,赵海燕,等.基于C5.0决策树-快速聚类模型的万州区库岸段乡镇滑坡易发性区划[J].地质科技情报,2019,38(6):189-197.

[10]林报嘉,刘晓东,杨川,等.XGBoost机器学习模型与GIS技术结合的公路崩塌灾害易发性研究[J].公路,2020,65(7):20-26.

[11]李长冬.三峡库区侏罗系地层滑坡中抗滑桩布设和结构优化研究[M].武汉:中国地质大学出版社,2015.

[12]刘坚,李树林,陈涛,等.基于优化随机森林模型的滑坡易发性评价[J].武汉大学学报(信息科学版),2018,43(7):1085-1091.

[13]雷明.机器学习[M].北京:清华大学出版社,2019.

[14]VAPNIK V.The nature of statistical learning theory[M].Boston:Springer Science &Bussiness Media,2013.

[15]彭令,牛瑞卿,赵艳南,等.区域滑坡灾害风险评估:以长江三峡库区秭归县为例[J].吉林大学学报(地球科学版),2013,43(3):891-901.

(编辑:胡旭东)

Abstract:Landslide susceptibility evaluation is the basis and key to identify landslide hazard target area.The Jurassic stratum area in Zigui County,the Three Gorges Reservoir area,is a landslide hazard prone area.Eight influencing factors including slope,surface cutting depth,curvature,and distance from water system to road network were selected.The information model(I)was coupled with four common machine learning models,namely artificial neural network(ANN),random forest(RF),XGBboostand support vector machine(SVM)to carry out the evaluation of landslide susceptibility.Through a comparative analysis on the receiver operating characteristic curve,it was found that the AUC valuein the ROC curve of the model coupled with information valuemodel and SVMmodel was the largest(0.848).The zoning map of landslide susceptibility showed that the high-prone areas were concentrated on both sides of the water system and the road network,and the results were basically consistent with the actual landslide distribution.The research results can provide reference for regional landslide susceptibility evaluation and landslide disaster prevention.

Key words:landslide susceptibility evaluation;landslide susceptibility zoning;information valuemodel;multi-model coupling;Jurassic stratum;Three Gorges Reservoir area

猜你喜欢

三峡库区
三峡库区农业生态化发展障碍、原因及对策分析
湖北三峡库区农业面源污染负荷、评价及预警系统
生态原产地保护促进三峡库区绿色发展探讨
论金融支持三峡库区经济发展的策略
三峡库区桑园间作草菇可行性分析
三峡库区低碳经济发展的困境与对策研究
三峡库区的动植物资源概况
三峡库区雕塑遗存忧思录