APP下载

不同模型的滑坡易发性评价精度讨论

2022-07-26

贵州地质 2022年2期
关键词:信息量易发确定性

汪 莹

(1.贵州省地质矿产勘查开发局111地质大队,贵州 贵阳 550008;2.贵州地质工程勘察设计研究院有限公司,贵州 贵阳 550008)

1 引言

滑坡易发性评价是通过对多个影响因子的综合分析,评价发生滑坡地质灾害的可能性大小(田钦 等,2020),是区域滑坡灾害风险评估的有效手段。其评价结果可为国土资源空间规划、土地利用、工程建设和防灾减灾等提供有效的技术支撑(刘月 等,2020)。

关于滑坡易发性评价的模型,众多的研究学者先后提出了多种方法,从最初的定性评价模型发展到定量物理力学评价模型,再到目前应用较为广泛的概率统计模型(刘月 等,2020)。概率统计模型又根据具体的计算方法分为:信息量模型(彭珂 等,2018;王佳佳 等,2014;杨根云 等,2018;周超 等,2015)、确定性系数法(刘艳芳 等,2014)、逻辑回归模型(张俊 等,2016)、频率比法(李文彦 等,2020)等。虽然不同计算方法对滑坡易发性评价都能起到较好的效果,但在评价精度上也存在一定的差异。

为优选最适宜山区区域滑坡易发性评价方法,本文以贵州省桐梓县为研究区,在采用概率统计模型中应用较为广泛的信息量模型、频率比法、确定性系数法三种评价模型分别对本研究区进行滑坡灾害易发性评价的基础上,引入“ROC曲线”对这三种方法的评价结果进行评价精度的对比研究,研究结果可为类似地区滑坡易发性评价提供借鉴。

2 研究区概况

图1 研究区地理位置及区内滑坡地质灾害分布示意图Fig.1 Schematic diagram of geographical location and landslide geological hazards distribution in the study area

该区位于上扬子地块黔北隆起区,地跨毕节弧形褶皱带和凤岗南北向隔槽式褶皱变形区,区内断裂构造以SN、NE走向为主,断裂多呈压扭性。县域地貌总体为东北高西南低,区内寒武系、奥陶系、志留系、二叠系、三叠系、侏罗系地层出露完好,泥盆系与石碳系地层缺失。桐梓县境内晚近期构造运动迹象较明显,区内大面积上升为主,多为侵蚀、剥蚀、山地,第四系沉积物零星分布,除桐梓河两岸为第四系沉积物外,其余主要河谷多急剧深切,呈“V”型或箱状廓道式峡谷。

由于区域地质环境条件较为复杂,区内地质灾害发育。地质灾害隐患呈现出点多面广、群发性、密集性等特点。本研究选取区内144处滑坡地质灾害点为基础数据,开展区内不同模型滑坡易发性评价的应用与比较研究。

3 研究方法

3.1 信息量模型

信息量模型(information value model)是由Yin et al.,(1988)提出的一种统计分析模型。通过对地质灾害的各影响因素进行统计分析,计算其提供的信息量值,叠加各因素的信息量用于评估地质灾害的易发性(郑光明,2017)。

信息量模型的计算公式如下(仪政 等,2021):

式中:I为评价单元的总信息量;n为影响因子数量;I(xi,H)为单独因子xi对滑坡灾害发生事件(H)所提供的信息量;Ni为单独评价因子xi内特定级别内的滑坡数量;N为研究区滑坡总数量;Si为单独评价因子xi的面积;S为整个研究区的总面积。

3.2 频率比法

频率比法(Frequency Ratio)是滑坡易发性评价的常用方法(Yalcin et al.,2011),该方法是基于统计分析对指标因子进行区间分类。其原理为(李文彦 等,2020):

设滑坡面积为L,影响因子为F,按照一定的规则将F划分为不同的区间,进而计算不同区间内落入滑坡的面积。影响因子F的第j个区间的频率比FjR:

式中:P(LFj)表示L中Fj的频率,P(Fj)表示研究区中Fj的频率,ALFj表示L中Fj的面积,AL表示L的总面积,AFj表示Fj的总面积,A表示研究区的总面积。

对于特定的空间位置,不同的影响因子F(i),该空间位置滑坡灾害L的易发性指数LSI:

LSI=∑F(i)jR(i=1,2,3…m;j=1,2,3…n)

3.3 确定性系数法

确定性系数法(Certainty Factor)是一种概率函数的方法,该方法基于已知的地质灾害隐患点,计算各影响因子不同区间的敏感性(Shortlife et al.,1987)。最终的确定性系数CF的值越大,表示滑坡灾害发生的确定性越高。其原理公式如下(刘月 等,2020):

式中:PPa表示特征a中单元存在的地质灾害隐患点的栅格数与特征a的栅格数的比值;PPs表示为整个研究区滑坡地质灾害隐患点栅格数与研究区总栅格数的比值。

3.4 精度验证

ROC曲线(Receiver Operating Characteristic)又被称为感受性曲线,具有简单、直观、可准确地反映所用分析方法特异性与敏感性的关系的特点而广泛应用于模型精度的验证(刘月 等,2020)。本次研究引入ROC曲线法对前述3种滑坡易发性评价方法的精度进行定量的分析比较。

表1 混淆矩阵Table 1 Confusion matrix

3.5 指标体系构建

滑坡易发性主要考虑在一定区域内由孕灾地质条件控制的滑坡发生的可能性(杨强 等,2021)。滑坡地质灾害的影响因素众多,在建立评价模型时需要具体分析,找出区域内影响滑坡易发性的主要地形地貌和地质因素(郑光明,2017)。

本文基于野外实地调查及收集的资料数据,选取坡度、斜坡结构、地形起伏度、工程地质岩组、距断层距离、距水系距离6个因子。其中,斜坡结构、工程地质岩组属于离散型因子,其分类代表了具体的含义和对滑坡的影响程度,不再进行等级划分;其余4个连续型指标因子,需要对各因子进行等级划分。

不同坡度条件会对斜坡的应力分布、人类工程活动等造成差异,从而影响滑坡的发育(蒋德明 等,2016),以 15°的间距进行划分(闫举生 等,2019)。地形起伏度代表特定区域内最高海拔与最低海拔之间的差值,可反映区域内地形的起伏状况,同时也一定程度地反映了地表的破碎程度(李郎平 等,2017)。选取以单元格为中心100 m为半径的圆作为统计单元进行地形起伏度计算,计算结果以15 m为间隔进行划分(郑光明,2017)。滑坡灾害的发生与断裂构造有着密切的关系(高克昌 等,2006),断层的影响距离较远,以800 m的间距做缓冲分析(宋小川 等,2021)。河流会对斜坡的坡脚进行冲刷进而造成岸坡失稳(田述军 等,2019),以500 m的间距做缓冲分析(闫举生 等,2019)。

4 数据采集与分析

4.1 数据来源与处理

本次研究收集整理了桐梓县的区域地质、区内滑坡地质灾害数据等资料。其中区域地质资料主要来源于贵州省1∶5 W地质图。区内滑坡地质灾害数据主要来源于贵州省桐梓县地质灾害详查及风险评价的调查成果数据。主要利用GIS软件对数据进行处理:(1)从1∶5W地质图提取区内地层岩性、断裂带分布;(2)利用地形数据生成25×25 m分辨率的数字高程模型(digital elevation model,DEM),提取坡度、坡向、地形起伏度等因子。不同评价因子分级结果见图2。

图2 滑坡易发性评价各影响因子分级图(a)坡度;(b)斜坡结构;(c)地形起伏度;(d)工程地质岩组;(e)距水系距离;(f)距断层距离Fig.2 Grading diagram of each influencing factor for landslide susceptibility evaluation(a)slope;(b) slope structure;(c) topographic relief;(d) engineering geological petrofabric;(e) distance from water system;(f) distance from fault

4.2 数据分析

4.2.1 滑坡易发性评价结果

三种模型各影响因子不同分级下的信息量值,确定性系数(CF)值和频率比(FR)值见表2。

表2 各模型计算结果统计表Table 2 Statistics of calculation results of each model

续表

通过GIS空间分析工具将各个影响因子进行叠加得到易发性评价结果,采用自然断点法将研究区划分为低、中、高和极高易发区,三种模型的易发性分区结果如图3所示,已发生的滑坡地质灾害点主要分布于模型划分的极高易发区和高易发区,说明三种模型的易发性划分结果是合理的,因此进一步验证评价结果精度,以便找到更为适宜的模型。

图3 不同模型的滑坡易发性分区图(a)信息量模型;(b)确定性系数法;(c)频率比法Fig.3 Zoning map of landslide susceptibility in different models(a)information value model;(b) certainty factor method;(c) frequency ratio method

4.2.2 易发性评价结果的验证与对比分析

图4 不同模型预测结果的ROC曲线Fig.4 ROC curves of prediction results of different models

表3 不同评价方法评价结果对比统计表Table 3 Statistics of evaluation results comparison of different evaluation methods

根据表3中统计结果,实际滑坡地质灾害点都主要落在极高易发区,灾害点落在各易发等级区的百分比都随易发区等级的增高而增大。信息量模型和确定性系数法的低易发区占整个研究区面积的百分比最小,而频率比法则是极高易发区占整个研究区面积的百分比最小。

结合ROC曲线结果、滑坡易发性分区与实际灾害的数量统计结果,表明信息量模型更加适合于该区域的滑坡易发性评价。

5 结论与讨论

(2)通过对三种不同方法的ROC曲线分析:信息量模型(AUC=0.800),确定性系数法(AUC=0.784),频率比法(AUC=0.787),结合三种模型滑坡易发性分区结果与实际的吻合度分析,表明信息量模型在该区域滑坡易发性评价中评价结果与预测能力较好,更适合于该区域的滑坡易发性评价。

(3)在检验滑坡易发性评价结果的合理性时,应注意检验样本点落在极高易发区的百分比是否为最大;低易发区占整个研究区面积的百分比是否为最小;检验样本点落在各易发等级区的百分比与各等级区的面积占区域面积百分比的比值是否随易发区等级的增高而增大。

猜你喜欢

信息量易发确定性
论中国训诂学与经典阐释的确定性
含混还是明证:梅洛-庞蒂论确定性
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
夏季羊易发疾病及防治方法
冬季鸡肠炎易发 科学防治有方法
论法律的确定性、妥当性与交谈合理性*——评《法律解释学》“法律确定性问题”部分
基于确定性指标的弦支结构鲁棒性评价
走出初中思想品德课的困扰探讨