基于遥感影像多尺度分割与地质因子评价的滑坡易发性区划
2021-05-08李文娟
李文娟,邵 海
(中国地质环境监测院,北京 100081)
0 引言
在国内外地质灾害野外调查研究领域中,滑坡灾害这种地质现象十分常见,它表示斜坡产生的沿剪切面或整体向下滑移的过程与结果[1]。若仅依靠群测群防等人工措施对区域滑坡群逐一治理,时间效率将非常低下[2]。为了有效获取滑坡灾害发生的位置,对重点研究区域滑坡灾情的孕灾环境准确评估将十分关键,由此引发的区域滑坡易发性问题在全球范围内也一直受到广泛关注[3-4]。
在滑坡空间预测领域,许多国内外学者利用较为成熟的计算机算法和滑坡野外调查经验进行了相应的融合研究[5-6]。GUZZETTI 等[7]从意大利某典型滑坡区域空间预测方法探究的目的出发,利用多模型融合的方法,对相关算法的精确度指标进行了横向研究;EECKHAUT等[8]则以法国香槟亚丁省滑坡群为研究对象,针对线性模型和非确定性模型的各自特点,搭建了基于数理统计算法的稳定性分区流程,完成了对区域滑坡易发性的空间类别划分;NICHOL 等[9]则应用高分辨率遥感影像的纹理特征,对滑坡空间稳定或非稳定区域进行了详细的分区描述。时至今日,3S 技术的不断发展为区域滑坡易发性评价提供了更为多维与细致的技术方向,使得后来的学者可从多方位及定量的角度实现滑坡灾情的信息处理,同时也融合了计算机智能化运算属性,通过引入数据挖掘的概念,赋予滑坡空间数据分析的能力[10-12]。本文以前人的研究作为基础,构建了融合遥感图像处理技术和多维数据挖掘方法的稳定性智能空间划分过程,最后建模分析并完成了秭归——巴东区内滑坡易发性评估单元的分类预测。
1 研究区遥感多尺度分割处理
为了对滑坡遥感数据进行全面的分析,可通过面向对象的遥感多尺度方法分利用单一或者多时相空间数据进行有效提取[13-17]。方法参考图1,在分割开始前,一般需要对影像进行相应的预处理。在同质阈值预设干预下,首先确定所利用的对象因子,设置反复循环的流程,以此达到对其他对象因子的覆盖;种子同时归并最合适的邻域,形成新的对象特征。这一过程以异质性达到最小为标准,直到研究数据里的所有分割对象均参与了合并过程,并找到合适的对象域。由于其执行效率和处理成果的一致性均比较突出,这种图像多尺度分割技术理论在滑坡遥感监测及易发性应用评估领域已经取得了一定的研究成果。
图1 图像多尺度分割原理示意图Fig.1 Multi-scale image segmentation concept
本次试验区域隶属于著名的长江三峡库区的秭归——巴东沿段,从地理位置上来看,研究区东边为湖北省宜昌市,西边为重庆市巫山县。延伸总距离大致为55 km,涵盖区域面积为446 km2左右,总体地层走势为盆地地形,具体发育情况可见图2。
图2 三峡库区秭归——巴东段地形地貌影像(三维地貌叠加Landsat-8 影像)Fig.2 Topographic image of Zigui——Badong area in Three Gorges Reservior
本文研究结合eCognition 软件已有的数据处理功能,分析并获取了秭归——巴东段影像的光谱及纹理特征,经大气校正、裁剪、配准等预处理过程,同时利用研究区Landsat-8 影像中近红外、红、蓝波段为原始遥感数据,其分辨率为30 m。模型引入相关性、对比度、能量、熵这4 个纹理参数作为评估因子,对研究区的植被覆盖情况和滑坡形态特征的尽可能完整覆盖。经过多次实验,对分割结果反复优化和更新,最终确定将分割尺度、形状异质性参数、颜色异质性参数分别设置为35,0.6,0.3,再把光滑度参数与紧凑度参数均设置为0.5 时即可达到实验的精准性目的,研究区影像经该算法运算并分割后成为了新的2 279 个区域(图3)。
图3 秭归——巴东段面向对象多尺度分割结果Fig.3 Multi-scale texture segmentation results of Zigui——Badong area
2 地质评价因子提取
相关研究表明,区域滑坡空间预测方法除利用相关已有遥感数据源参与建模外,还需要考虑实际的环境地质因子,进行有针对性的综合分析。通过查阅相关背景资料,研究区滑坡所在的地层岩性组合在很大程度上生成了空间孕灾的多种物理因素,详情如表1所示[15];整理相关资料,研究区坡度分布见图4,同时本次研究也考虑到坡度这一典型滑坡承载应力的分布特征,统一作为评价因子统一进行分级处理。
表1 秭归——巴东工程岩组分类标准[18]Table 1 The classification standard of engineering rock group (Zigui-Badong)
图4 研究区坡度分布图Fig.4 Slope distribution map
本次研究的地质数据均来自于三峡库区地质灾害防治工作指挥部,利用库水位监测指标、地形图、30 m数字高程模型(DEM)和地质底图作为多结构的基础数据来源,同时在ArcGIS 软件中提取影响滑坡空间稳定性发育的主要地质环境因素,根据三峡库区已有历史滑坡灾害数据库的各项指标,融合不同类型多结构数据的分箱处理流程和操作规范,对与空间易发性相关联度较高的地质评价因子进行专家分级处理,统一作为后续易发性挖掘规则的关联规则前项因素,研究所形成的地质评价因子结果见表2。
表2 地质数据评级因子库Table 2 Geological evaluation factors
3 滑坡易发性模型构建及易发性区划
对研究区已有滑坡信息进行充分调查,可发现岩质与土质滑坡是区域内主要的两种类别。从滑坡解译的已有研究方法上来看,前者的解译标志以是否出现明显滑动面、孕灾的环境条件和库水影响指标为主;后者的解译多依赖于对易滑岩层、库水浸泡和坡体动力学特征等标志的选择。本文基于决策树原理,将融合地质因子分级指标特征,搭建秭归-巴东段滑坡空间预测智能决策树模型,并依据具体的分类结果进行区划制图,最后评价其精度。
在模型正式开始训练前,研究区域内的影像数据已经经过面向对象的多尺度分割处理,并形成了2 279 个研究单元;为了验证个体与总体的模型构建精度,从研究区覆盖均匀的角度出发,分别以180 个滑坡样本及550 个非滑坡样本单元作为训练样本集,其中用0 表示稳定区域,1 表示不稳定的滑坡区域;本文将采用决策树算法进行模型的构建。
C5.0 决策树属典型分类算法,对数值型数据的分类化操作是主要核心操作,并将分类后的结果用于知识传达。该算法以信息熵作为基本评估指标,分类结果和分类区间则以信息增益量(Information Gain)最大化达到结束状态,同时这一过程将采用先验分类的方法对原始数据进行预处理,以达到全局化最优目的[13]。
决策树其核心思想在于利用自上而下、分而治之的递归构造函数形成中间结果分类。通过根目录下子节点的多重分类和区间阈值设置,原始实验数据集合将重复地被规划为若干较小的子集合。本次研究以SPSS Clementine 软件中的决策树算法模型搭建流程为实现方式,对研究区实验数据进行有目的性分析和知识发现,然后利用Boosting 方法细化原始数据集合及其子集合的分类精确度。该模型属于近年来比较成熟的数据挖掘算法之一,本文采用的决策树原理主要利用到信息增益函数指标,可表示如下:
式中:v——分枝数目;
Si——第i个分枝下记录的数目。
利用决策树算法模型的支持,在Clementine 软件中进行实现。对这两类数据预测效果进行汇总,模型精度评判详情见表3,表4。
表3 训练集分类预测结果Table 3 Result of training set classification
表4 测试集分类预测结果Table 4 Result of testing set classification and prediction
从模型的总体评价结果中可看出:决策树模型对研究区各对象训练单元的预测精度较好,总体正确率高达93.73%;Kappa 系数取值为-1 到1 之间,是一个用于一致性检验的指标,可用于衡量模型分类的效果,能够直接反映正确分类的比例,文中则表明了C5.0 模型在滑坡稳定性分区能力上的优越性,这个数值在训练和测试样本中分别达到了0.84 和0.51;通过分析论文中的滑坡易发性评估先验分级因子,基于上述已通过测试的决策树模型理论,对研究区分割后的每个对象加以应用。同时考虑到数据的不同存储结构和应用模式,分类模型呈现出两种结果表达:针对离散数据,若结果为0,表示该单元为易发性较低的区域,1 则代表易发性程度较高的空间单元;针对数值型的连续数据,采用小于1 的小数表示各要素和影响研究区滑坡空间孕育的定量程度,认为该取值与滑坡空间易发性的概率呈正相关关系。综上,通过融合离散与连续型数据的特征和分类模型特点,实验采取自然裂点的方式将结果划分为四个等级(表5)。
表5 秭归——巴东段滑坡易发性分区总体结果Table 5 Landslide susceptibility classification prediction(Zigui——Badong)
根据上述模型生成的秭归——巴东段滑坡易发性空间预测图(图5)。从易发性分类预测结果中可以看到,秭归——巴东段滑坡空间预测情况总体呈现较为明显的分类特征,不易发区和高易发区被划分的对象单元较多,共有2 141 处单元被模型规划,占总体的93.94%。从结果和最终制图预测的效果表明,基于遥感影像多尺度分割与地质因子评价的滑坡易发性制图具有较好的分类特性(图5)。
图5 滑坡易发性预测区划图Fig.5 Landslide susceptibility prediction mapping
4 结论
从面向对象的遥感影像多尺度分割和地质因子专家分级的角度,本文构建了基于遥感影像多尺度分割与地质因子评价方法的易发性预测模型,对分割后秭归-巴东段的2 279 个对象进行了滑坡空间易发性的预测分析和精度评价。决策树模型对研究区各对象训练单元的预测精度较好,平均正确率高达91.64%;Kappa 系数在训练和测试样本中分别达到了0.84 和0.51,表明了C5.0 模型在滑坡稳定性分区能力上的优越性;最后运用该分类模型结果建立秭归——巴东段易发性规划图,预测结果表明应着重关注长江干流及支流两岸的滑坡孕育情况,且当工程岩组为侏罗系、志留系地层及巴东组、二叠系地层岩性的顺向坡内较易出现高易发性斜坡单元。综上,基于滑坡所处研究区的地质因子分级知识,利用影像多尺度分割与C5.0 决策树模型的滑坡空间易发性模型预测结果是十分可靠的。