基于信息量法与加权信息量法的地质灾害易发性评价效果对比
——以蕲春县北部地区为例
2020-04-01李雪晗晏鄂川
李雪晗, 晏鄂川, 张 丹
(中国地质大学(武汉)工程学院,武汉 430074)
蕲春县北部地区地质灾害频发,包括滑坡、不稳定斜坡、崩塌和泥石流. 这些地质灾害及隐患点严重威胁区内人民的生命安全,阻碍区内经济发展,故进行蕲春县北部地区地质灾害的易发性评价显得尤为重要.GIS技术为地质灾害研究中的一个重要组成部分,与其易发性评价结合方面的研究程度不断提高. Radbruch等[1]对哥伦比亚Medellin市的泥石流、滑坡等地质灾害进行了敏感性和易损性评价,绘制了Medellin市风险性分区图. Forster[2]利用GIS平台对英国某地进行了滑坡危险性评价和危险性分区. Yilmaz等[3]利用GIS技术对Sivas盆地的喀什特地区岩溶地质灾害进行了易发性分区评价. 目前对于地质灾害进行易发性评价的方法及模型主要为人工神经网络法[4-5]、模糊综合评价法[6-7]、逻辑回归模型[8-9]、信息量法[10-12]、层次分析法[13-14]以及加权信息量法[15-16]、决策树模型法[17]等.
加权信息量法是在之前研究基础上由学者提出的改进的信息量法[18],根据不同影响因子作用程度不同给其信息量值赋不同的权重,但相关文献中都是直接采用加权信息量法进行易发性评价,并没有与其改进前的模型评价结果进行比对,其改进的效果无法体现. 因此本文基于ArcGIS平台,采用信息量法和加权信息量法对蕲春县北部地区地质灾害进行易发性评价,并将两种方法的评价结果进行对比分析,以讨论加权信息量法对该研究区地质灾害易发性评价是否有实际改进效果.
1 研究区概况
蕲春县位于湖北省东部,位于115°12′~115°55′E 和29°59′~30°41′N 之间,北倚大别山,区内地势起伏大,总体东北高,西南低. 地貌类型主要分为构造侵蚀低山、构造侵蚀丘陵和剥蚀堆积垅岗区. 研究区属亚热带大陆季风气候,区内持续性降雨、暴雨的降雨形式极为常见,且多集中在每年的6—8月,年平均降雨量为1 407.1 mm,最大降雨量为2 096.1 mm. 蕲春北部地区地质构造复杂,破碎岩发育,岩土体主要分为三大岩类:第四系松散岩类、变质岩类和岩浆岩类. 近年来,研究区内建房、修路、矿山开采、水库修建等人类工程活动不断加剧.
研究区内地形地貌、地层岩性、地质构造和水文等条件为地质灾害的发育提供了天然环境和物质基础条件,强烈的人类工程活动和极端连续的降雨加剧了地质灾害的发生. 根据区内现场调查,共查明地质灾害点176处,其中滑坡134处,占地质灾害总数的76.14%;不稳定斜坡27处,占总数的15.34%;崩塌10处,泥石流5 处,分别占地质灾害总数的5.68%、2.84%. 考虑到研究区内泥石流发育程度弱,仅占地质灾害总数的2.84%,且其形成原因与滑坡、不稳定斜坡及崩塌差异较大,因此本文仅对滑坡、不稳定斜坡、崩塌共171个地质灾害点进行进一步的研究.
2 评价模型的建立
2.1 信息量法评价模型
信息量法是通过分析已变形或发生地质灾害地区的实际情况及提供的信息,研究对其稳定性有影响的信息数量和质量,并将其影响程度通过信息量量化表示出来. 对于地质灾害的发生,其受到多个影响因子的共同作用,不同的地质背景都存在一种导致灾害发生的“最佳因子的组合”,不同影响因子组合对地质灾害的作用程度不相同.
建立信息量法评价模型的步骤如下:
1)计算单个影响因子对地质灾害事件(D)提供的信息量值I(xi,D):
其中,S 为研究区面积;Si为研究区含有影响因子xi的面积;N 为研究区发生地质灾害的总个数;Ni为研究区分布在影响因子xi内的地质灾害的个数.
2)通常,每个评价单元具有的信息量值都是由多项影响因子共同作用的结果,各种因子又以各种不同状态存在,采用下式计算评价单元内各影响因子组合条件下的总信息量Ii:
其中,n为影响因子总数. 所得的总信息量Ii即可作为研究区易发性评价指标,评价单元内发生地质灾害的概率随着其值的增大而增大,通过对求得的总信息量值的值域进行划分,可对研究区进行易发性分区评价.
2.2 加权信息量法评价模型
加权信息量法,是基于层次分析法求出的各因子权重ωi和信息量法求得的各评价因子分级的信息量值I(xi,D),给每个分级的信息量值赋予一定的权重,将各因子权重与对应的信息量相乘并求和,求得基于加权信息量法的加权总信息量值Z,计算公式如下:
通过对求得的加权总信息量值的值域进行划分,对研究区进行易发性分区评价.
3 研究区地质灾害易发性评价
3.1 评价单元选取
考虑蕲春北部地区的实际情况,选取栅格单元作为本次易发性评价的评价单元. 根据本次研究使用的地形图、地质图、构造图等基础图件比例尺,利用经验公式计算[19],本文确定基础图件栅格化采用30 m×30 m的栅格大小.
3.2 评价因子的选择及状态分级
选取易发性评价因子须根据具体研究对象有针对性地进行分析,先统计各影响因子取值区间所占百分比,再分析其取值区间与地质灾害分布的关系,最后提取影响研究区地质灾害易发性的主要因素.
3.2.1 地形地貌 地形地貌主要通过高程、坡度、坡向及坡面形态四个方面对地质灾害造成影响. 在对研究区的实际调查研究发现,人类工程活动为主要造成研究区内斜坡变形破坏的因素,这就影响了坡形作为影响因素的意义,因此本文不考虑将坡面曲率作为评价因子.
1)高程:使用蕲春北部地区地形图利用ArcGIS得到研究区的DEM图件. 提取研究区高程范围(以下类同)为-8~1236 m,将研究区按照<100 m、100~200 m(不包含200,以下类同)、200~300 m、300~400 m、400~500 m、≥500 m分为六个等级,并统计各分级地质灾害的发育情况(图1). 从图中可以看出,区内地质灾害大部分分布在高程300 m 以下,在海拔100~200 m 区间发育最多,分布密度最大.可能是因为高程较为低处,容易受人类工程活动等多种因素的影响.
2)坡度:也是引起地质灾害发生的一个重要因素,会影响地表水径流以及坡面植被情况等. 提取研究区坡度得到其范围在0°~65°之间,将其共分为
图1 高程区间与地质灾害分布关系图Fig.1 Distribution map of geological hazards in each elevation range
<5°、5°~10°、10°~15°、15°~20°、20°~25°、25°~30°、30°~35°、35°~40°、≥40°九个等级,统计各分级地质灾害发育情况(图2). 可以看出,区内地质灾害基本都发生在坡度25°以下斜坡处,坡度5°~25°的区间发育地质灾害个数及密度较大. 原因可能是坡度较小的区域容易受到人类工程活动的影响,且在降雨条件下不利于斜坡排水,雨水加重了岩土体的质量并对岩土体有软化作用,降低了其抗剪强度,容易导致地质灾害的发生. 坡度大于40°的斜坡灾害点密度也较大,考虑发生的主要为崩塌灾害,与滑坡及不稳定斜坡成因有所差异,且由于崩塌总数很少,此差异可以忽略.
3)坡向:通过ArcGIS 提取斜坡坡向得到其范围为0°~360°. 具体分级区间为平地(0°)、北(0°~22.5°,337.5°~360°),东北(22.5°~67.5°),东(67.5°~112.5°),东南(112.5°~157.5°),南(157.5°~202.5°),西南(202.5°~247.5°),西(247.5°~292.5°),西北(292.5°~337.5°). 坡向各分级地质灾害发育情况见图3. 由图可知,研究区内地质灾害主要发育在南侧(东南、南、西南向)斜坡上,地质灾害密度均大于0.1个·km-2,地质灾害在其余6个方位的地质灾害发育密度较为平均.
3.2.2 地层岩性 研究区内出露岩土体类型为第四系松散岩类、变质岩类、岩浆岩类、碎屑岩类和碳酸盐岩类. 统计不同分级的地质灾害发育情况如图4. 可以看出,研究区内地质灾害主要发生于变质岩类及岩浆岩类中,变质岩中地质灾害密度最大. 碎屑岩类和碳酸盐岩类由于在区内分布较少,无地灾发育.
图2 坡度区间与地质灾害分布关系图Fig.2 Distribution map of geological hazards in each slope angle range
图3 坡向区间与地质灾害分布关系图Fig.3 Distribution map of geological hazards in each slope aspect range
图4 岩土体类型与地质灾害分布关系图Fig.4 Distribution map of geological hazards in each rock soil mass type
3.2.3 地质构造 本文选取了蕲春北部地区主要的断裂构造,利用ArcGIS 的多环缓冲功能(以下类同),分成与断层距离<500 m、500~1000 m、1000~1500 m、1500~2000 m、2000~2500 m、2500~3000 m、3000~3500 m、3500~4000 m、≥4000 m共9个等级. 统计各分类的地质灾害发育情况(图5),可以看出,在距断层距离小于4000 m的范围内,地质灾害发育的密度大体上随着与断层的距离的增大而减小,但在大于4000 m 的范围内,地质灾害发育的密度反而最大,不符合客观规律.地质构造对于地质灾害影响最小的区域,反而是地质灾害发育密度最大的区域,原因可能是人类工程活动等为此处地质灾害发生的主要控制因素,地质构造对地质灾害发育的影响微弱,这也表明近期研究区内地质构造活动处于较为稳定状态,因此本文不考虑地质构造对于地质灾害的作用.
图5 断层缓冲距离区间与地质灾害分布关系图Fig.5 Distribution map of geological hazards in each distance range from faults
3.2.4 水文 研究区内河流、水库会对岸坡进行冲刷、侵蚀,且水对岩土体的浸泡软化作用使得岸坡岩土体物理力学性质发生改变,对其稳定性造成影响. 在此以距水系距离作为分级指标. 分成与水系距离<100 m、100~200 m、200~300 m、300~400 m、400~500 m、500~600 m、600~700 m、700~800 m、≥800 m 共9 个等级. 统计不同分级的地质灾害发育情况(图6),可以看出,区内大体上距水系距离越远,地质灾害发育个数及密度都越小,在距水系100 m 以内,地质灾害密度最大. 特别地,在距水系距离500~600 m 范围内,地质灾害发育程度较高,考虑到该范围一般为人类居民区所在地,因此难免受到人类活动的影响. 总体来说,研究区内水系对于地质灾害有一定程度的控制作用.
3.2.5 人类工程活动 研究区内人类工程活动与地质灾害的发生贯穿始终,本文将对居民区及公路作为影响因子进行分析.
1)居民区:人类活动频繁,通过与居民区距离远近来讨论其对地质灾害的影响. 分成与居民区距离<100 m、100~200 m、200~300 m、300~400 m、400~500 m、500~600 m、600~700 m、700~800 m、≥800 m共9个等级,各等级地质灾害发育情况见图7. 可知,距居民区越近,地质灾害越发育. 距离居民区小于100 m的区域发育的地质灾害点,约占总数的30%,地质灾害发育密度最大. 在离居民区大于800 m的区域,地质灾害密度最小.强烈的人类工程活动破坏了岩土体的完整性与稳定性,决定了居民区附近容易引发地质灾害.
2)公路:基于蕲春北部地区的公路分布图件,生成与公路距离分别为<100 m、100~200 m、200~300 m、300~400 m、400~500 m、500~600 m、600~700 m、700~800 m、≥800 m 的9 个分级. 各分级下地质灾害发育情况见图8. 由图可知,总体上随着与公路距离的增大,地质灾害发育个数越少,在离公路100 m的区域内发育的地质灾害几乎占了研究区所有地质灾害的一半,这说明了公路的修建对地质灾害的强烈控制作用.
图6 水系缓冲距离区间与地质灾害分布关系图Fig.6 Distribution map of geological hazards in each distance range from water system
图7 居民区缓冲距离区间与地质灾害分布关系图Fig.7 Distribution map of geological hazards in each distance range from residential area
图8 公路缓冲距离区间与地质灾害分布关系图Fig.8 Distribution map of geological hazards in each distance range from traffic roads
3.2.6 降雨 降雨对研究区的地质灾害发生起了较为重要的作用. 但降雨对于研究区地质灾害的影响主要体现在时间方面,多发生在6月—8月,而地质灾害易发性研究的主要是在空间上的易发性,且由于研究区空间降雨资料的缺乏,本次评价不将降雨作为评价因子.通过对上述影响因子的分析,确定在研究区地质灾害发育形成过程中发挥了重要作用的7个因子作为本次蕲春北部地区易发性评价的评价因子,分别为高程、坡度、坡向、岩土体类型、水系、居民区和公路.
3.3 易发性分区评价
3.3.1 单因子信息量计算 基于上文的统计,运用公式1依次对以上7个分级后的评价因子进行信息量计算. 考虑到地层岩性因子分级中,碳酸盐岩类和碎屑岩类信息量不存在,将其并入第四系松散岩类进行统计并计算信息量值,得到的评价因子各状态分级下的信息量值如表1所示.
表1 评价因子分级及信息量值Tab.1 Evaluation factors classification and information value
3.3.2 信息量法易发性分区 运用ArcGIS 重分类功能对各已分级的栅格因子图层赋予各自信息量值,再用栅格计算器按照公式2 叠加各单因子信息量,得到研究区各评价单元的总信息量值,叠加所得总信息量值的范围为-8.252~4.556 6,对叠加后的栅格图层进行重分类,采用自然间断点分级法将其分为4 个区间(图9). 按照信息量值从小到大依次分为不易发区(-8.25~-3.28)(四舍五入保留小数点后两位,下同)、低易发区(-3.28~-1.32)、中易发区(-1.32~0.44)和高易发区(0.44~4.56),分区结果及分区统计见图10、表2.
3.3.3 加权信息量法易发性分区 这里直接给出由层次分析法构造并通过一致性检验的判断矩阵计算出的各评价因子权重(表3).
按照公式3,计算得加权信息量值的范围为-1.473 9~0.701 8,将叠加后的栅格图层分为4个区间(图11),并按加权总信息量值从小到大依次分为不易发区(-1.47~-0.60)、低易发区(-0.60~-0.23)、中易发区(-0.23~0.09)和高易发区(0.09~0.70),分区分布及分区统计见图12、表4.
图9 总信息量重分类Fig.9 Reclassification of total information value
图10 基于信息量法的分区图Fig.10 Classification map based on information value method
表2 基于信息量法的易发性分区结果Tab.2 Susceptibility classification result based on information value method
表3 各评价因子权重系数Tab.3 Weight coefficient of evaluation factors
图11 加权总信息量重分类Fig.11 Reclassification of total weighted information value
图12 基于加权信息量法的分区图Fig.12 Classification map based on weighted information value method
图13 易发性评价结果ROC曲线Fig.13 ROC curve of susceptibility evaluation result
4 评价结果验证与对比
4.1 评价结果验证
在地质灾害易发性评价过程中,常常使用ROC(Receiver Operating Characteristic Curve)曲线对分区的结果进行检验,通过计算AUC(AUC,Area Under Curve)值来评价区划结果的准确性[20]. AUC值的取值范围为0.5~1,AUC值越大,说明其评价效果越好. 根据以上两种评价结果,以地质灾害易发性等级从高到低的区域面积累计百分比做横轴,以对应易发性等级区间内地质灾害个数累积百分比为纵轴,绘制ROC曲线(图13).图中,A和B分别对应基于信息量法和加权信息量法的易发性评价结果ROC曲线. 计算各曲线的AUC值分别为:A—0.78,B—0.75,均介于0.7~0.9之间,这说明本文基于两种不同模型的易发性评价均有较好的准确性,通过比较A、B两曲线的AUC值大小,显示信息量法优于加权信息量法.
4.2 评价结果对比
为了验证以上评价结果的可靠性,参考表2、表4中对各评价结果中各分区的面积占总面积百分比及地质灾害个数占灾害总数的百分比等的统计结果. 考虑到各评价结果分区面积的不同,引入地质灾害相对百分比(HAR)指标加以衡量,通过以下公式计算:
表5 分区结果的地质灾害相对百分比Tab.5 Relative percentage of geological hazards of classification result
HAR值越大,说明在相同的范围,实际发生地质灾害的数量越多,发生地质灾害的概率越大,由此判定易发性评价结果的可靠性. 按照上式计算两种方法评价结果的地质灾害相对百分比如表5.
表5 显示,在地质灾害不易发区,HAR 值均为0,随着地质灾害易发性等级的提高,HAR值也随之增大. 两种评价方法下的易发性分区结果总体趋于一致,都较好地反映了研究区地质灾害的易发程度,与上文验证结果一致. 结合两种方法的易发性评价结果(表2、表4)对比相应易发性区间的HAR值,基于信息量法的高易发区面积占总面积19.94%,包含了64.33%的地质灾害,HAR值较大;基于信息量法的低易发区面积占总面积29.68%,仅包含5.26%的地质灾害,HAR值较小. 据此说明基于信息量法的易发性分区效果优于加权信息量法的效果.
在本次易发性评价中,加权信息量模型相较于信息量模型并无改进效果. 一是由于利用层次分析法确定的权重,主要是通过专家的经验与知识,打分确定判断矩阵计算出来的,容易受主观因素影响,进而对评价结果准确性产生影响. 二是信息量法是通过客观分析已变形或发生地质灾害地区的实际情况及其提供的信息,通过条件概率计算出的各评价因子信息量值,评价结果已相对客观、准确,通过加权难以体现改进效果.
5 结论与讨论
本文以蕲春县北部地质灾害为研究对象,确定高程、坡度、坡向、岩土体类型、水系、居民区和公路为易发性评价因子. 基于ArcGIS平台,采用信息量法和加权信息量法对研究区地质灾害进行易发性评价,将研究区分为高易发区、中易发区、低易发区和不易发区.
1)高易发区面积为300.81 km2,占研究区总面积的19.94%,分区内发育地质灾害110处,占地质灾害总数的64.33%. 这些地区大部分属于构造剥蚀丘陵、低山地带,为地质灾害的发生提供了有利的地形地貌条件.同时在水流冲蚀及人类建房修路切坡、矿山开采等工程活动强烈作用下,极易引发地质灾害.
2)中易发区面积为569.08 km2,占研究区总面积的37.73%,分区内发育地质灾害52处,占地质灾害总数的30.41%. 在研究区内分布最为广泛,多位于构造剥蚀丘陵地区及剥蚀堆积垅岗区,相比高易发区离水系、公路以及居民区有一定距离,但影响仍然强烈,容易引发地质灾害.
3)低易发区面积为447.64 km2,占研究区总面积的29.68%,分区内发育地质灾害9处,占地质灾害总数的5.26%. 在研究区内分布不连续,大部分呈零星分布于中易发区周边的剥蚀积垅岗区. 海拔较低,虽地形地貌条件不利于发生地质灾害,但存在水系与人类工程活动的作用,会发生少数地质灾害.
4)不易发区面积为190.79 km2,占研究区总面积的12.65%,分区内无地质灾害点发育. 这些地区绝大部分位于距离水系、公路、居民区较远的构造侵蚀低山地区,几乎没有人类活动,山体均较为完好,植被覆盖率高,发生地质灾害的概率较低.
基于ROC曲线的验证及地质灾害相对百分比指标对比分析,两种不同模型的易发性评价结果总体趋于一致,均有较好的准确性,均适用于蕲春县北部地区的地质灾害易发性评价. 但加权信息量模型的评价效果不如信息量模型效果,说明在本次易发性评价中通过对信息量值加权达到改进效果没有体现,今后在选择加权信息量法进行易发性评价时需要对其评价效果进行对比验证. 最后采用评价效果较优的信息量法评价结果作为蕲春北部地区地质灾害易发性评价的最终结果.