基于RBF神经网络-信息量耦合模型的滑坡易发性评价
——以甘肃岷县为例
2022-01-07黄立鑫郝君明李旺平周兆叶贾佩钱
黄立鑫,郝君明,李旺平,周兆叶,贾佩钱
(1.兰州理工大学土木工程学院,甘肃 兰州 730050;2.甘肃省应急测绘工程研究中心,甘肃 兰州 730050)
0 引言
目前,基于GIS 技术的滑坡易发性评价已成为滑坡研究领域的热点,研究者们基于地形地貌、水文地质和人类工程活动等方面选取滑坡影响因子,采用评价模型对区域滑坡灾害的易发性进行评价分析。主流的评价模型主要有基于统计分析和机器学习的方法,如逻辑回归[1-2]、信息量[3-6]、支持向量机[7]和人工神经网络[7-10]模型等。诸多研究表明,与单一的评价模型相比,多模型耦合的方法可以提高评价精度和预测能力,更具有科学性和合理性[11-12]。如SAHA 等[8]采用逻辑回归(LR)、人工神经网络(ANN)、支持向量机(SVM)和随机森林(RF)模型及其耦合模型对印度Rudraprayag地区进行滑坡易发性评价,结果表明ANN-RF-LR 耦合模型的稳健性最好,评价精度和预测能力最高;陈飞等[9]采用信息量与神经网络组合模型对江西省上犹县进行了滑坡易发性评价,结果表明组合模型的评价精度优于单一信息量模型;连志鹏等[3]通过优势耦合模型对湖北省五峰县的滑坡进行了易发性评价研究,结果也表明耦合模型预测精度明显高于单一模型。
近年来,信息量模型(I)由于其模型的语义明确、易于实现等优点已被广泛应用于山区复杂地形区域的滑坡易发性评价中,并取得了较好的效果[3-6,9]。但信息量模型只能获得指标因子对应的信息量值,无法准确地表达各指标因子的权重大小和相关性,所以在一定程度上,很难准确客观地进行易发性评价。RBF 神经网络(RBFNN)模型是以径向基函数作为激活函数的一种性能良好的前馈神经网络,具有最佳逼近和克服局部极小值问题的优点[13]。可以利用RBF 神经网络数据拟合功能,建立模型并映射出历史滑坡分布和影响因子之间的非线性关系,是区域滑坡灾害易发性评价的新技术。因此,本文通过RBF 神经网络和信息量模型的耦合,优化区域滑坡灾害易发性评价结果。
甘肃省岷县位于青藏高原边缘,地形复杂,地质条件脆弱,土体结构稳定性差,滑坡灾害频发,严重制约了当地的土地开发利用、工矿建设和生态环境保护。文章以岷县为研究区,综合考虑滑坡发生的内在、外在诱发因素,筛选了高程、坡度、坡向、平面曲率、距断层距离、地层、降雨量、距水系的距离、NDVI、距道路的距离10 个指标因子,采用RBF 神经网络-信息量耦合模型(RBFNN-I)对研究区滑坡灾害进行易发性评价研究。最后,采用合理性和受试者工作特征曲线(ROC)对耦合模型和单一模型的评价结果对比分析,以期建立一种有效的滑坡灾害易发性评价模型,为岷县滑坡灾害预防治理和防灾减灾工作提供参考,有效地减少滑坡灾害给人民生命财产和生产生活带来的损失。
1 研究方法
1.1 信息量模型
信息量(I)模型的原理是通过信息熵综合分析各指标因子对区域滑坡易发性的贡献值,确定滑坡分布与环境因子之间的空间关系。根据已经发生的滑坡区域所提供的信息把区域内各指标因子的实测值转化为能反映区域稳定性的信息熵,通过统计各个影响因素对滑坡灾害贡献的信息熵来确定导致灾害发生的“最优因素组合”,将多个影响因素的信息熵叠加实现区域滑坡易发性评价[5-6]。其表达式为:
式中:I(xi,H)——指标因子对滑坡灾害发生提供的信息量值;
xi——评价单元内指标因子的等级;
Ni——研究区指标因子xi的滑坡灾害面积;
N——研究区内滑坡灾害总面积;
Si——研究区内指标因子xi的面积;
S——研究区的总面积。
可以根据单一指标因子的信息量值计算整个研究区内评价单元的信息量,计算表达式为:
式中:n——研究区选取的指标因子总数;
I——总信息量值,是评价滑坡灾害易发性的综合指标,其总信息量值I越大,说明滑坡易发性越高,反之则说明滑坡易发性较低。
1.2 RBF 神经网络模型
RBF 神经网络(RBFNN)模型是由输入层、隐含层和输出层构成(图1)。从输入层到隐含层是非线性变换,不需要权值连接,从隐含层到输出层变换是线性的,也就是整个网络的输出是隐含层输出结果的线性加权和。第一层为输入层,主要是将输入的样本传递给隐含层,起到传输信号的作用。第二层为隐含层,隐含层含有若干隐节点,每个隐节点的激活函数采用径向基函数;第三层为输出层,是将隐含层空间映射到输出层[13-14],对应的映射关系为:
图1 RBF 神经网络结构Fig.1 The structure of RBF neural network
式中:i=1,2,3,···,h——隐含层有h个节点;
j=1,2,3,···,n——输出层有n个节点;
ωij——隐含层到输出层的连接权值;
xp——n维的输入向量,
ci——第i个高斯核函数的中心值,与输入向量的维数相同;
Ri(xp−ci)——基函数。
选用高斯函数作为基函数,定义第i个隐含单元的激活函数为:
σi——第i个高斯核函数的中心点宽度。
1.3 RBFNN-I 模型及精度验证方法
RBFNN-I 模型是将影响滑坡灾害的各指标因子不同等级的信息量值作为模型的输入参数,是否发生滑坡作为目标类型,经过反复训练创建标准的RBFNN-I 模型,其建模流程见图2。
图2 基于RBFNN-I 模型滑坡灾害易发性评价流程图Fig.2 The flow chart of landslide susceptibility evaluation based on the RBFNN-I model
滑坡灾害易发性评价结果是否准确对区域滑坡风险早期识别和监测预警工作有直接的影响作用,因此对评价结果进行精度检验十分必要,文中主要从评价结果合理性检验和模型精度检验两个方面对评价结果进行检验。合理性检验是对评价模型检验的方法之一,主要通过分析各等级易发区的面积和空间分布状况,及其实际发生的滑坡点在各等级易发区内的分布数量来检验模型的合理性[15]。受试者工作特征曲线(ROC)分析是滑坡易发性评价中常用的模型精度评价方法[4-7]。首先将未发生滑坡的单元被正确预测的比例(特异性)定义为X轴,然后将已发生滑坡的单元被正确预测的比例(敏感性)定义为Y轴,绘制得到ROC 曲线。通常计算ROC 曲线线下面积(AUC)来评价模型的准确度,AUC值越大表明模型的性能越好。
2 研究区概况
2.1 研究区概况
岷县位于甘肃省定西市西南部,洮河中游,是甘南高原东缘与陇中黄土高原和西秦岭陇南山地交汇处(图3)。境内地形起伏大,呈南高北低趋势,海拔约2 040~3 754 m,以山地为主,约占县域面积的88%;气候属于温带半湿润气候,高寒阴湿,年均气温5.5℃,年均降水量598.3 mm,南部和东部区域植被覆盖率较高;水系多呈树状,支流较多,分属长江和黄河两大流域;地质环境脆弱,岩性以上古生代的海陆交互相层的灰岩、砂岩、泥炭、砾岩为主,地层从晚古生代泥盆纪中期到第四纪均有出露,走滑型的断裂带较多,地震滑坡主要分布在临潭—宕昌断裂带矩形区[16-17]。同时,岷县受到“5·12”汶川地震和“7·22”岷县地震的影响,地表岩层破碎,在强降雨和地震的作用下,山洪、泥石流和滑坡等自然灾害频发。
图3 岷县地理位置及历史滑坡点分布图Fig.3 Geographical location and distribution of historical landslide points in Min Xian
2.2 滑坡灾害数据编录
滑坡灾害数据编录是进行滑坡易发性评价分析的基础。首先根据研究区范围内的高分辨率遥感影像数据(Landsat8:2018年;GF-6:2019年;Google Earth:2020年),将研究区划分为5 行10 列,共50 个格网,以《滑坡灾害防治手册-认识滑坡:防治滑坡》为指南[18],依据遥感影像滑坡解译标志,通过目视解译的方法识别滑坡灾害点,然后结合现场核查,得到岷县滑坡灾害点共549处,单体滑坡面积最大为31 164 m2,面积最小为203 m2,面积大于10 000 m2的滑坡30 处,滑坡灾害的总面积1.98 km2,约占整个研究区的0.055%(图3)。岷县的滑坡灾害类型主要以浅层、小型滑坡为主。为解决建模过程中的滑坡点和非滑坡点的比例平衡问题,在非滑坡区域随机生成间距大于1 km 的随机点549个,共得到1 098个样本点。
3 建立评价指标体系
3.1 指标因子的选取与分级
根据指标因子选取的原则和滑坡的形成机理,参考近年来国内外学者在滑坡易发性评价研究中最常使用的指标因子以及岷县的实际情况,并考虑指标因子数据的可量化、可获取性,本研究从地形地貌、地质构造、气象水文、地表覆盖和人类活动五个方面选取了10 个指标因子,分别是高程、坡度、坡向、平面曲率、距断层距离、地层、降雨量、距水系距离、归一化植被指数(NDVI)和距道路距离。选取的指标因子的数据类型主要分为连续型和离散型数据集,依据不同的数据类型和已有的相关研究经验确定每个指标因子的分级标准[1-9]。将各指标因子制作成空间范围一致且分辨率相同的栅格专题图层(图4)。
3.1.1 地形地貌类指标因子
基于GIS 软件从岷县DEM 数据提取地形地貌类的指标因子,主要有高程、坡度、坡向和平面曲率见图4(a)-图4(d)。高程与岩土体的含水率、人类活动强度和植被覆盖度等都具有很高的相关性,是滑坡灾害发育的主要影响因素之一,岷县高程的分布范围在2 039~3 817 m,按100 m 的间隔重分类为10 个等级。坡度与坡体的应力分布、地表径流、堆积物厚度等方面有密切的关系,不同坡度范围内,滑坡的发育类型和规模存在明显差异[19],岷县坡度的分布范围在0~67°,以坡度值为5°间隔进行划分,并对坡度值分布较少的等级区间进行合并得到10 个等级。坡向对滑坡灾害的影响主要源于不同坡向的太阳辐射强度和降雨量不同,从而对地表温度、水分蒸发量、植被覆盖情况和坡面的风化程度等方面产生影响,造成滑坡灾害发育的空间分布差异性,文中将其分为平地、北向、东北、东向、东南、南向、西南、西向、西北9 个等级。平面曲率描述了地表沿水平方向的弯曲和变化情况,是对地形表面扭曲变化程度的定量化度量因子,且凹凸变化与地形曲率一致,文中将其分为10 个等级,见图4(d)。
3.1.2 地质构造类指标因子
基于GIS 软件从岷县1∶20 万地质图中提取地质构造类指标因子见图4(e)-图4(f)。断层能够改变岩体的构造形式和力学强度,且断层活动产生的挤压和拉裂作用使得地层结构面的裂隙更为发育,是影响滑坡形成和发育的重要因素[20]。岷县位于祁连加里东造山带和西秦岭复合造山带的结合部位,境内有多条活跃断层,因此以1 km 的缓冲距离创建了11 个距断层距离的分级。地层是滑坡发育的物质基础,不同地层的岩土体类型和结构特征在抗风化能力、抗剪强度和抗侵蚀性等方面有显著的差异,能够直接影响斜坡的形变和稳定性[21],岷县的地层发育较为齐全,文中按年代从新到老进行地层等级的划分,依次是第四系、侏罗系、三叠系、二叠系、石炭系和泥盆系。
图4 岷县滑坡灾害易发性评价指标因子Fig.4 Evaluation index factors of landslide susceptibility in Minxian County
3.1.3 气象水文类指标因子
选取的气象水文类指标因子主要是降雨量和距水系距离,见图4(g)-图4(h)。降雨是造成滑坡灾害的主要诱发因素,主要原因是雨水渗入岩土体内部,会增加坡体的容重,降低岩土体的抗剪强度和摩擦力,极易使坡体失稳而诱发滑坡灾害[22],对2000—2017年岷县逐月降雨数据进行整理分析,按照自然间断法划分为9 个等级。水系与滑坡灾害之间的关系密切,主要表现在当坡体距离水系越近时,所受到的冲刷、侵蚀作用就越强,特别在河道拐弯处的侧蚀作用极强,文中以200 m的缓冲距离创建了11 个距水系距离的分级。
3.1.4 地表覆盖类指标因子
选取的地表覆盖类指标因子是植被,植被能够减缓地表径流对坡体的侵蚀程度,增加土壤的渗透性和降低孔隙水压力,并且植被的根系对坡体具有一定的稳固作用,对滑坡灾害发育有至关重要的作用[23]。归一化植被指数(NDVI)是衡量植被生长发育状态和植被覆盖度的重要指标,因此本文基于ENVI 软件通过Landsat8 影像数据提取NDVI 值,并将其分为9 个等级,如图4(i)所示。
3.1.5 人类活动类指标因子
交通建设是人类活动的一种重要表现形式,距道路距离通常作为滑坡易发性分析的指标因子之一。在道路建设之前,坡体是平衡的。施工的扰动会改变地形,影响道路沿线的自然环境,直接或间接的对滑坡灾害的发生起到一定的促进作用。因此本文以200 m 的缓冲距离建立了11 个距道路距离的分级,如图4(j)所示。
3.2 指标因子的检验与筛选
在进行模型的建立和训练之前,为了保证输入模型的指标因子之间具有独立性和客观性,本文采用Pearson相关系数法[24]对选取的10 个指标因子进行检验与筛选,统计其相关性系数R,结果如表1所示。由表可知,高程与降雨量、距道路距离相关性系数R分别为0.75 和0.52,均大于0.5,其余各指标因子之间的相关性都较低,因此,经综合考虑后剔除高程指标因子,将剩余的9个指标因子用于建立岷县滑坡灾害易发性评价指标体系。在此基础上,将研究区按照基本网格单元30 m×30 m 进行划分,计算得到每个指标因子不同等级的面积以及各等级内滑坡分布的面积。通过信息量模型公式(1)得到各指标因子分类等级的信息量值,结果如表2所示。
表1 指标因子相关性检验表Table 1 Correlation of controlling index factors
表2 指标因子分类等级信息量值计算表Table 2 The classification information for index factors of landslide
续表2
4 岷县滑坡易发性评价
4.1 基于RBFNN-I 耦合模型
为了满足对RBFNN-I 耦合模型进行建模与训练,从1 098个(滑坡点549 个,非滑坡点549 个)总样本点中随机选取80%的数据(滑坡点439 个,非滑坡点439个)作为训练样本点,剩余20%的数据作为检验样本点,进行标准耦合模型的训练。在模型确定以后,将研究区的全部栅格数据作为数据源,调用已训练完成的RBFNN-I 耦合模型预测每个栅格数据的滑坡易发性指数,最后在GIS 中绘制并输出预测结果。依据中国地质调查局《地质灾害调查技术要求(1∶50 000)》(DD2019-08)[25]中关于滑坡灾害易发性评价的技术标准,对研究区滑坡易发性进行分级。采用自然间断分级法将RBFNN-I 耦合模型的评价结果划分为极高易发区、高易发区、中易发区、低易发区4 个等级分区,生成岷县滑坡灾害易发性分区图(图5)。
图5 基于RBFNN-I 模型的岷县滑坡易发性评价结果图Fig.5 Landslide susceptibility mapping for Min Xian used RBFNN-I model
4.2 评价结果检验分析
4.2.1 评价结果合理性检验
为了检验已建模型的客观性和稳定性,统计RBFNN-I 模型计算得到的极高、高、中和低4 个等级的易发区面积,以及各等级易发区内滑坡点的分布数量,统计结果如表3所示。
从表3中可知,通过RBFNN-I 模型得到低易发区的面积比例在划分的各等级分区中最大;极高易发区内滑坡点所占比例为56.10%;耦合模型的比率R值均由低易发区向极高易发区逐渐增大。综上所述,文中构建的RBFNN-I 模型计算得到的岷县滑坡易发性区划结果符合模型合理性检验标准。
表3 岷县滑坡灾害易发性分区合理性检验表Table 3 Rationality test table of landslide susceptibility zone in Min Xian
4.2.2 评价模型精度检验
滑坡灾害易发性评价结果是否准确直接关系到评价模型的可靠性,通过检验评价模型的结果,可以准确地比较出不同评价模型的预测性能,以便选择出最优的滑坡易发性评价模型。因此,文中为了检验耦合模型的性能,分别将单一I、RBFNN 模型和RBFNN-I 模型的评价结果进行ROC 曲线检验分析,得到三种评价模型的ROC 曲线,并且统计每种评价模型的ROC 曲线下面积AUC 值作为一个定量的评价指标来衡量模型预测的准确度,更加直观的表示各种模型的评价结果(图6)。
从图6中可知,RBFNN-I 模型的AUC 为0.853,表明耦合模型的预测效果较高;并且耦合模型的AUC 值优于单一RBFNN 和I 模型的0.790 和0.756,表明RBFNN-I模型比单一RBFNN 和I 模型具有更好的预测能力,更能较为客观准确地岷县滑坡灾害易发性进行评价。
图6 ROC 精度验证曲线Fig.6 ROC curves of the three used models
4.3 岷县滑坡易发性与指标因子分析
指标因子的重要性反映了不同指标因子对于区域滑坡易发性的影响程度,有的指标因子对滑坡的发育作用比较重要,而有的指标因子则对滑坡的影响比较小。因此,计算分析各指标因子的重要性,可以为滑坡灾害管理工作提供指导依据。将通过筛选后的9 个指标因子的信息量值作为模型的输入数据,通过RBFNN-I 模型分析计算得到每个指标因子的重要性(图7)。
从图7中可知,距断层距离、降雨量、距道路距离和NDVI 这4 个指标因子的重要性最高,是影响岷县滑坡灾害分布的主控因子。结合表2分析,距断层距离在0~7 km 内的频率比值均大于1,且在1 km 范围内最大,说明距离断层越近的坡体越容易发生滑坡;降雨量在554~590 mm 范围内频率比值均大于1,说明易于发生滑坡。随着降雨量的增加,频率比值并没有显著的增加,主要是由于岷县的地质条件受断层活动等影响极其脆弱,坡体在短时间的降雨作用下就会出现失稳现象,发生滑坡;距道路在0.2 km 范围内时,频率比值远大于1,说明距离道路越近滑坡灾害越容易发生,主要是因为岷县的地貌以山地为主,近年来全县的交通建设快速发展,在施工过程中普遍存在削坡扩基等现象,容易造成道路沿线的植被破坏和岩土体失稳,也加剧了地表风化和水土流失,若遭遇强降雨等极端天气极易发生滑坡;NDVI 值小于0.08 和大于0.60 时,频率比值均小于1,且随着NDVI 值增大,该值有减小的趋势,DAI等[26]研究认为裸地类型滑坡发生相对较少,当植被覆盖度越高时,植物的根固作用越强,能够降低坡体的侵蚀程度,增加稳定性。
图7 各指标因子重要性分布图Fig.7 Importance distribution chart of each index factor
5 结论
文章以甘肃省岷县为研究区,结合环境条件和历史滑坡灾害的分布特征,运用RBFNN-I 模型展开了滑坡灾害易发性评价,得到以下结论:
(1)文章采用的RBFNN-I 模型评价的结果与研究区历史滑坡的实际分布情况相吻合。评价精度相比单一的RBFNN 模型提高了6.3%,相比单一的I 模型精度提高了9.7%,表明RBFNN-I 模型具有更高的准确度,能在一定程度上解决单一模型主观性较强、可靠性低等问题,是一种有效的区域滑坡灾害易发性评价方法。
(2)岷县滑坡灾害的极高易发区和高易发区超过总面积的25%,在岷县西部的中寨镇—梅川镇—茶埠镇地区分布比较密集,主要分布在临潭—宕昌断裂带,以及洮河及其支流、闾井河和蒲麻河两侧河谷地带;中易发区主要分布在麻子川镇北部和蒲麻镇东北部地区、寺沟镇和禾驮镇的南部地区、闾井镇的中部、马坞镇和锁龙乡的北部地区分布;低易发区分布在南部和东部地区的高山地带以及中部地形平缓的地区,主要分布在秦许乡,麻子川镇、闾井镇、锁龙乡和马坞镇的南部。距断层距离、降雨量、距道路距离和NDVI 是影响岷县滑坡灾害分布的主控因子。