APP下载

基于信息论与逻辑回归的滑坡定量空间预测

2018-05-11程艺昊

新疆有色金属 2018年1期
关键词:易发滑坡逻辑

程艺昊

(西安科技大学地环学院 西安 710054)

1 绪论

中国地质灾害频发,且类型多,分布地域广大,灾害损失大。我国大量山地都存在滑坡隐患,其中高危地区数量众多。每年因滑坡约造成700~1000人死亡,约100亿人民币的经济损失[1]。

我国滑坡灾害空间预测起步较晚,虽然曾用经验法成功预测宝成线须家河滑坡[2],但上世纪80年代之后才逐渐发展:王思敬教授(1984)提出了边坡失稳前总变量及位移速率的综合预报方法[3],李天斌(1999)提出了Verhulst反函数模型[4],武强、陈佩佩等(2003)将GIS和人工神经网络相结合建立的地裂缝灾害活动性评价系统,石菊松等(2005)采用GIS信息量模型和易发性评价方法进行滑坡危险性区划,许冲等(2009)利用GIS技术,分析研究了高程、坡度、断层、公路、河流等影响因子与滑坡分布的相互关系,结合层次分析法进行了研究区易发性区划。

随着计算机科学的发展,各个领域的交叉应用与结合变得普遍,对滑坡的认识进一步提高。利用计算机对滑坡进行预报,学者们提出并建立了许多有效的模型来进行滑坡的研究与预测,如协同预报模型[5]、以GIS为基础的一系列应用分析[6]等。廖小平等人(1994)提出了滑坡预报功率模型[7]等。晏同珍学者曾研究过空间预测的理论问题,他认为空间分布具有集从性规律。这些成果对区域减灾以及国土规划有着重大贡献,然而在单体滑坡预报上仍旧具有明显不足。

随着技术的发展,我国滑坡研究及预报成功率不断上升,屡次成功预测大型滑坡的发生。现在我们已经初步开发了滑坡实时跟踪预报系统(SPIS)[4]、滑坡灾害预报系统(LTFS)[8]、露天矿边坡稳定性分析专家系统[9]等一系列现代地质分析系统。

2 区域背景

研究区南城县坐落于江西省东部,武夷山西翼,海拔50~1000m,最高芙蓉山为1176m。本县水系发育,地表水较为丰富,年平均径流量952.3亿m3,多年平均来水量66.22亿m3,地下水资源较贫乏,从地形地貌看,四周低山区属补给区,丘陵区属径流区,中部洼平属排滞区,县内地下水多属浅层水,径流途径甚短,地下水动态变化受大气降水制约明显,抚河和盱江、黎滩河两岸岩性结构是松散堆积层,含孔隙水,水位埋深3~6m。

南城县地势东、西高,中部成南北贯通的河谷平川,山地分布在东西两侧,大体呈南北走向,可分为山地、丘陵、河谷平原三种地貌类型。东部山地海拔高度500~600m,西部山地海拔高度500~1176m。丘陵分布在盱江、黎滩河两侧,海拔150~500m。河谷平原主要分布在盱江、黎滩河沿岸,地势较为平坦。

根据统计,南城地区共分布有112处滑坡。研究区东西多山、春夏多雨,滑坡具有明显的空间和时间分布规律:从北至南、由东西两侧至中间,滑坡数量逐渐减少。其中西侧最为集中,呈集群状分布;东侧次之,呈散点状分布;中部由于地形平坦,无滑坡分布;从4月至7月为滑坡高发期,滑坡频繁发生;8月至翌年3月为平静期,滑坡发生次数明显减少。

3 滑坡易发性评价模型与因子提取分析

3.1 滑坡影响因子分类确定方法

本文在进行信息预处理时所采用的方法为信息论,同时利用信息论结合逻辑回归模型以及证据权模型对滑坡易发性进行分析。将滑坡影响因素添加进证据权模型可以判断滑坡因素对滑坡作用是否积极,利用个逻辑回归模型可以得到滑坡敏感性地图。

利用研究区的112个滑坡点,并在研究过程中创建了相同数量的非滑坡点。将其中的约70%作为训练数据,其余作为验证数据。

3.2 影响因子选择

根据南城县滑坡情况,参考以往针对滑坡空间预测的研究成果与报告,综合分析之后选取岩性、高程、坡度、坡向、地形湿度指数、沉积物传输指数、平面曲率、剖面曲率、河流缓冲区、构造缓冲区及道路缓冲区等11个变量作为滑坡相关变量。

3.3 影响因子分类确定

最大限度地提高了香农熵指数基础上信息系数的类的数量。将每个岩性层作一个变量,其余变量分为2至6个类。分析结果见表1。

表1中NC是指不可计算。这意味着对某一特定的分类,同一类别内的变量不包含关联。将因子分类确定之后,根据证据权模型,计算的各滑坡影响因子分类权重(表2)。

表1 应用信息论分类的信息系数表

表2 基于证据权方法的滑坡相关变量权重表

续表2基于证据权方法的滑坡相关变量权重表

4 滑坡易发性评价结果与验证

4.1 证据权模型

(1)相关变量条件独立性检验

使用卡方统计检验方法对证据权模型中的数据进行条件独立性检验见表3(括号内为理论上的卡方测试值)。尽管在某些变量之间观察到了条件依赖性,但仍可以继续分析,以便于比较在相同环境下的两种模型。

通过综合加权法构造滑坡易发性图的C值,stdC和C/stdC值。通过对C值的排名,最高的C值出现在高程大于131m的地区(1.6230)。对于研究区的地层岩性,由云母石英片岩、变粒岩组成的万元组具有最高值(1.4038),而C的中值在109°和228°之间方向地区(1.0003)。

表3 卡方测试结果表

(2)评价结果

通过证据权模型计算各滑坡影响因子分类的权重值之后,采用ArcGIS的空间分析功能,将各影响因子图层进行空间叠加,得到了基于证据权模型的滑坡易发性指数。为便于使用,本文采用自然断点法对滑坡易发性图进行了分区,分别将滑坡易发性级别分成了五个等级:极低易发区、低易发区、中等易发区、高易发区和极高易发区(图1)。

图1 证据权滑坡易发性图

4.2 逻辑回归模型

(1)多重共线性检验

为了使各个变量能够正常使用,滑坡相关变量间的条件独立假设必须是成立的,且每个变量的数据群必须呈现正态分布。我们使用了非参数统计,计算独立性时采用了x2卡方方法。

下一步是实现多重共线性分析以估计预测特征之间的相关性。本文采用使用了方差膨胀因子(VIF)和容差(TOL)两个重要指标的方法来进行多重共线性分析,而当变量之间的公差小于0.1表示他们具有强烈的多重共线性。

对方差膨胀因子与容差通过多重共线性分析进行估计(表4),所有变量的方差膨胀因子均小于多重共线性类似理论的阈值(5)。

表4 多重共线性检验表

(2)计算结果

根据方程计算的常量值,进行逻辑回归:

Z=-5.0789+[0.3079*(岩性)]+[2.0167*(高程)]+[0.8983*(坡度)]+[0.0627*(坡向)]+[-2.0718*(TWI)]+[2.2334*(STI)]+[-0.084*(剖面曲率)]+[-0.2199*(平面曲率)]+[0.4515*(河流缓冲区)]+[0.2376*(构造缓冲区)]+[-0.4703*(道路缓冲区)] (1)

为了预测在每个格网中发生滑坡的可能性,运用方程(1)计算滑坡发生概率以输出滑坡易发性图(图2)。

图2 逻辑回归滑坡易发性图

从对滑坡易发性图的可视化分析来看,高及极高易感区位于东西部山区,而中部地区的特点则是低乃至极低易感度。很显然,滑坡易发性的空间分布服从研究区域中的高程及坡度分布,因为低地的特点就是极低到低滑坡易发性。同时可以观测到岩性覆盖率与滑坡易发性之间强烈的关联。

4.3 滑坡易发性结果检验

(1)滑坡易发性结果检验意义

在我们得到滑坡易发性图之后,需要对结果进行验证。未经验证的滑坡易发性图在工程及社会意义等方面不具有实用价值与参考价值。

(2)检验方法

为了对之前采用的两个模型进行评价,我们使用训练与验证数据建立了两个统计评价标准。第一是训练数据的整体精度,它是模型成功与否的标志;第二是验证数据的整体精度,它是模型预测能力的标志。这两个验证条件的计算方法均为正确的滑坡事件与非滑坡事件的和。验证过程是通过使用接收者操作特征曲线(ROC)分析实现的。

此外,滑坡体密度是作为充分性的衡量方法计算的。如果当从低敏感类移动到高敏感类等级或当高敏感类等级覆盖小范围区域时,滑坡密度增加,则说明模型具有更高的充分性与准确性。

(3)检验结果

本阶段要进行的方法是估算滑坡敏感区的相对分布以及滑坡密度(图3)。两种模型均显示,从低敏感等级移动到高敏感等级时,滑坡密度比增加。从比较结果来看,证据权模型预测准确率较高,逻辑回归模型也能得到令人满意的准确度。

B系数逻辑回归的优点是在检验滑坡是否存在时能够对每个变量的重要性提供一个估计,然而,他们不提供有关预测变量之间的相对优先级或重要性的信息。

图3 AUC检验曲线图

5 结论

逻辑回归手段是统计学上普遍采用的利用相关性因素进行二元检验的模型,并且在此前已经在滑坡易发性研究中多次取得成果,是一种可靠的方法。然而逻辑回归受变量间相关关系影响很大,并且各个因素对事件的影响并没有被考虑到。因此我们引入了香农熵信息论以确定每个因素最大化影响的分类数目,同时引入证据权模型来确定每个因素对滑坡事件发生的权重,以此弥补逻辑回归在此方面的不足之处。本次研究得到了以下成果:

(1)通过南城县滑坡目录与以往滑坡研究,确定了滑坡因子的种类和数目,并利用信息论确定了将每个滑坡影响因子信息系数最大化的分类数目;

(2)利用GIS软件结合信息论所取得的分类信息绘制了南城县滑坡相关变量分类图,对影响因子进行了空间分析,并且利用证据权理论对滑坡变量对滑坡事件的权重和影响进行了分析;

(3)利用逻辑回归理论及证据权理论绘制了南城县滑坡易发性图,建立了滑坡空间数据库,实现便捷的滑坡灾害评估;

(4)利用AUC曲线分析对证据权模型及逻辑回归模型进行了对比,检测了两种模型的应用效果。

[1]殷跃平.中国地质灾害减灾战略初步研究[J].北京:中国地质灾害与防治学报,2004.

[2]文宝萍,李媛,等.黄土地区典型滑坡预测预报及减灾对策研究[M].地质出版社,1997.

[3]黄建安,王思敬.断续结构岩体失稳破坏的分离面[J].水文地质工程地质,1984.

[4]李天斌,陈明东,等.滑坡实时跟踪预报[M].成都科技大学出版社,1999.

[5]黄润秋,许强.斜坡失稳时间的协同预测模型[J].山地研究,1997.

[6]胡德勇,李京,段云浩,张锦水.GIS支持下滑坡灾害空间预测方法研究[J].遥感学报,2007.

[7]廖小平.滑坡破坏时间预报新理论探讨[J].地质灾害与环境保护,1994.

[8]黄运飞,黄润秋.中国工程地质软件大全[M].地质出版社,1993.

[9]李彰明.露天矿边坡实用专家系统PESOPSV1.0的设计与应用[J].岩土力学,1996.

猜你喜欢

易发滑坡逻辑
刑事印证证明准确达成的逻辑反思
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
逻辑
夏季羊易发疾病及防治方法
创新的逻辑
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
冬季鸡肠炎易发 科学防治有方法
滑坡稳定性分析及处治方案
女人买买买的神逻辑