APP下载

基于AHP-LR熵组合模型的子长市地质灾害危险性评价

2021-10-15薛喜成杨艳萍

科学技术与工程 2021年27期
关键词:信息量危险性权重

杨 康, 薛喜成, 段 钊, 杨艳萍

(西安科技大学地质与环境学院, 西安 710054)

近年来,受自然因素或社会因素的影响,地质环境日益恶化,原本的地质平衡状态遭到破坏,地质灾害时有发生,严重威胁着人们的生命、财产安全,制约着区域经济的发展,对地质灾害的区划评价能为防灾减灾工作指明方向,从而降低灾害带来的损失。地质灾害评价内容包括易发性评价、危险性评价、易损性评价以及风险评价,其中危险性评价作为地质灾害风险评价的基础,是防灾减灾工作部署与基础建设的重要参考[1]。

随着空间与信息理论学科的高速发展,原本较为复杂的运算过程与数据整理变得更易于操作,近年来,基于GIS(geographic information system)系统的区域地质灾害评价得到快速推广与发展,各类地质灾害评价方法也在不同区域得到运用并取得了较好的综合分析效果。目前常用的评价方法包括层次分析法[2]、主成分分析法[3]、确定性系数法[4]、信息量法[5]等,然而单一的评价方法所求得的评价结果精度相对较低,多类评价方法之间的相互耦合更能准确地对评价结果进行描述。张波等[6]运用加权信息量法对湖北鄂州地区地质灾害进行了易发性区划;樊芷吟等[7]采用信息量模型与逻辑回归模型进行耦合对四川省汶川县进行地质灾害易发性评价;杨光等[8]以GIS技术作为操作平台,采用确定性系数+层次分析、确定性系数+逻辑回归方和确定性系数+神经网络的多层感知器3种方法对四川省茂县东北部地区的滑坡灾害敏感性进行评价;覃乙根等[9]采用确定性模型与逻辑回归模型进行耦合对贵州省开阳县地质灾害易发性进行了综合评价。以上评价方法均表明耦合模型下的地质灾害评价结果比单一的评价手段更为可靠且评价结果精度值更高。

在诸多评价方法中,信息量法的运用最广,且研究表明基于信息量法以及信息量法的耦合方法对地质灾害的评价结果精度更高[10-13]。单一的赋权方法相对局限,如果基于信息量法,将主、客观权重值以科学的方法进行组合,再以组合权重值与信息量法进行耦合,将能为地质灾害危险性评价内容提供更加行之有效的理论依据与客观全面的评价方法。基于此,在前人研究的基础上,提出一种AHP-LR(analytic hierarchy process-logistic regression)熵组合模型下的地质灾害评价方法,首先建立起坡度、高程、土地利用类型、年均降雨量等9个评价因子,对各评价指标量化分级并求解出各分级的信息量值;利用层次分析法求解各评价因子的主观权重值,利用二元逻辑回归方法提取样本点中的信息量值求得客观权重值,再按最小信息熵原理将主观权重与客观权重进行组合,并将组合后的权重与信息量值相乘做叠加计算,得到危险性评价结果。为凸显此类评价方法结果的可靠性,分别制作主、客观权重下的危险性评价结果以作比较,并利用ROC曲线对三类评价结果进行探讨,以期为地质灾害危险性评价方法提供新思路并为子长县地质灾害评价工作与防灾减灾部署提供参考。

1 研究区概况

延安市子长市位于黄土高原中部,介于东经109°11′58″~110°01′22″,北纬36°59′30″~37°30′00″之间,总面积2 405 km2(图1)。研究区地处华北陆台鄂尔多斯台向斜东南翼斜坡带,为向西缓倾的单斜翘曲构造,倾角1°~3°,为陕北构造盆地的一部分,属典型的黄土高原丘陵沟壑区,暖温带半干旱大陆性季风气候[14]。境内梁峁起伏,沟壑纵横,蜿蜒连绵,河谷深切,峁梁沟谷地约占全县总面积的94.6%。西部秀延河、涧峪岔河蜿蜒盘曲,横穿县境中部及北部。区内地层出露最老为三叠系,依次为侏罗系、白垩系、古近系、新近系以及主要出露的第四系黄土层。沟坡陡坡段,多已切入古近系红土层及下伏基岩,陡壁侵蚀严重,极易发生崩塌、滑坡[15]。县境南部发育有次一级低角度缓倾、轴向北西的短轴鼻状和箕状褶曲,主要有二进沟背斜、流泪坡单斜[16],褶皱、断裂构造不发育,总体地质构造较为简单。

图1 研究区示意图Fig.1 Location of study area

境内四季分明,年平均气温9.1 ℃,极端最高气温为37.6 ℃,极端最低气温为-23.1 ℃,在黄土分布区易发生冻融,诱发地质灾害。本区季节变化明显,降水多集中于7—9月份,年均降雨量517 mm,日最大降水量108.5 mm。在诸多地质灾害影响因素中,降雨是地质灾害发生的主要诱发因素,尤其在连阴雨与暴雨气候下常常诱发崩塌、滑坡、泥石流等地质灾害。

2 评价指标体系的建立与分级

地质灾害的影响因子多种多样,在不同的区域地质灾害的评价研究中,所选取的评价因子也不尽相同,过少的评价因子选取会导致结果侧重于某一类主导因子,而选取过多的评价因子,将使得模型复杂化最终导致评价结果不够准确,只有合理地选择适合于研究区的评价因子才能有效保障地质灾害危险性评价结果的准确性。根据区域内实际情况并参照中外较为普遍采用的评价指标,从地形地貌、地质环境与生态环境3个方面分别选取了包括坡度、坡向、高程、岩土体类型、灾害点密度、道路距离、河流距离、土地利用类型以及年均降雨量9个影响较大且具有代表性的因子作为本次地质灾害危险性评价的指标(图2)。

图2 地质灾害危险性评价指标体系Fig.2 Geological hazard evaluation system

2.1 地形地貌指标

2.1.1 坡度

坡度是导致地质灾害易发程度的一个重要影响因素。通常认为,随着坡度的增大,地质灾害的危险性愈大,灾害易发性愈高。依据研究区的实际情况将坡度按10°间隔划分为0°~10°、10°~20°、20°~30°、30°~40°、>40° 5个级别。

2.1.2 坡向

山坡不同的坡向代表着不同的日照程度,不同程度地影响着地质灾害的危险性及易发性,基于ArcGIS坡向分析工具将坡向分为平地、北向、东北、东向、东南、南向、西南、西向、西北等9种类型。

2.1.3 海拔高程

不同的海拔高程坡体应力情况、植被分布情况以及人口密度情况也不尽相同,在同等条件下,高差越大则越有可能形成滑坡、崩塌等地质灾害[17]。按照自然间断法将子长市的高程值划分为916~1 100、1 100~1 200、1 200~1 300、1 300~1 400、1 400~1 557 m 5个等级。

2.2 地质环境指标

2.2.1 岩土体类型

依据岩土颗粒间的牢固联结,境内岩土体类型可划分为软硬相间互层状含煤、油页岩碎屑岩类和软弱层状黏土岩类以及第四系黄土层3类,其中岩体多出露于深切河谷及强烈剥蚀后的山岭地带,区内第四系黄土体大面积出露,土体中的垂直节理和含水层段是其主要软弱结构面,滑坡、崩塌的发生常与其相关。

2.2.2 灾点密度

已知地质灾害点的密度能够有效反映出区域危险程度的高低,灾害点密度指单位面积内灾害点的数量,其值越大,区域内的危险性也就越大[18]。综合考虑灾害点数量以及分级效果,首先将灾害点进行密度分析,再将其以直线型阈值法进行归一化处理,最后按照相等间隔将其划分为5个等级分别表示研究区内地质灾害点的分布情况。

2.2.3 道路距离

距离道路的远近表示着不同强度的人类工程活动,不同程度的诱发各类地质灾害。基于ArcGIS软件将道路作为中心,以100 m间隔向外建立5个不同级别的缓冲区,分别为0~200、200~400、400~600、600~800、>800 m。

2.2.4 河流距离

河流分布对地质灾害的影响表现在距河流的远近程度上,距离河流越近,河流两岸的掏蚀作用愈发明显,地质灾害危险性更大。与道路距离相似,在GIS平台中以河流为中心做5个等级的缓冲区分别代表着对地质灾害危险性的不同影响程度,分别为:0~100、100~300、300~600、600~1 000、>1 000 m。

2.3 生态环境指标

2.3.1 土地利用类型

土地利用类型一方面表示不同强度的人类工程活动,另一方面也表征着不同区域的植被覆盖情况,借助ArcGIS将土地利用类型划分为耕地、林地、草地、水体、建设用地和未利用土地等6类。

2.3.2 年均降雨量

降雨一方面加快了对坡面的冲刷侵蚀,另一方面增加了岩土的孔隙水压力,从而加剧了地质灾害的发生[19]。子长市历年来地质灾害多发生于强降雨之后,选取子长市境内多个气象站站点2010—2015年的年平均降雨量进行空间插值得到降雨量分布图,并将其依照自然间断法划分为4类。

上述9个地质灾害危险性评价因子及取值分布如图3所示。

图3 地质灾害易发性评价因子及取值分布Fig.3 Evaluation factors of susceptibility and value distribution

3 地质灾害危险性评价方法及过程

3.1 信息量法

信息量模型(information value model)I是通过计算各类影响因素对崩塌和滑坡地质灾害的发生所提供的信息量值,作为地质灾害易发性等级划分的定量指标[20]。该方法通过计算各类影响因子对地质灾害变形破坏所提供的信息量贡献值,作为定量分区的指标,以信息量值的大小来表示各个影响因素与地质灾害的密切程度,灾害发生的概率随着信息量值的增大而变大。其计算公式为

(1)

式(1)中:Nij表示影响因子子类中灾害点个数;N为灾害点总个数;Sij为影响因子子类栅格数;S是总栅格数。

基于研究区内各灾害点的空间分布情况,对9类评价因子分级分别按式(1)解得其对应的信息量值如表1所示。

表1 各评价因子信息量值计算结果Table 1 The result of information values

3.2 层次分析法

层次分析法(analytic hierarchy process, AHP)是一种定量计算与定性分析相结合的方法,它将与问题有关的因素划分为分析和决策问题的目标、方法和标准。该方法首先将一个复杂的问题分解为几个在问题中起关键作用的因素,建立层次结构模型[21]。然后在因子分析中加入主客观判断,逐个比较各因素,构建判断矩阵,该矩阵的最大特征根及特征向量归一化后即为各影响因素的相对权重值[22],最后再进行一致性检验完成权重分析。该方法首先需要构建层次结构模型(图2),再依据1~9标度法建立起判定矩阵,最后进行层次单排序与一致性检验。为避免各项子因子分值间的矛盾,模型的优劣程度通过一致性比率(consistency ratio,CR)来评价,其基本原则是分解、相对判断和优先综合,它是基于变量和指标之间的比较获得的[23],其计算公式为

(2)

(3)

式中:n为矩阵阶数;CI为一致性指标,RI为评价随机一致性指标。通常认为,当CR<0.1时,判定矩阵的一致性才可以被接受。

经计算,得最高层(A)与中间层(B)的最大特征值λmax=3.053 6,一致性CR=0.051 6,CI=0.026 8,权重Wi=(0.195 8,0.493 4,0.310 8)。地形地貌(B1)判断矩阵的最大特征值λmax=3.073 5,一致性CR=0.070 7,CI=0.036 8,Wi=(0.614 4,0.117 2,0.268 4)。地质环境(B2)判断矩阵的最大特征值λmax=4.164 9,一致性CR=0.061 8,CI=0.055 0,Wi=(0.107 6,0.444 8,0.258 1,0.189 6)。生态环境(B3)判断矩阵的最大特征值λmax=2.000 0,一致性CR=0.000 0,CI=0.000 0,Wi=(0.333 3,0.666 7)。比较知3个矩阵CR值均小于0.1,所以这3个判断矩阵均能满足一致性要求,所得到的权重值可靠有效。最后将各子类因子权重归一化处理,得到9项要素的AHP权重值如表2所示。

表2 评价因子权重值Table 2 Assessment factors and weights

3.3 逻辑回归法

逻辑回归模型(logistic regression model,LR)是二分类因变量常用的统计分析方法,其描述的是二元因变量与一系列自变量之间的关系[24],在对地质灾害易发性评价时,选取各评价因子作为自变量,将灾害是否发生作为因变量,因变量取值为1和0,分别代表地质灾害的发生与否。该模型的自变量不要求满足误差分布趋于正态分布的假设,也不要求符合正态分布的条件,既可以是离散的也可以是连续的[25]。用数学函数表达式可表示为

(4)

式(4)中:P为灾害发生的概率,取值[0,1];α为截距,常数项;Xi表示各评价因子;βi表示各因子回归系数。

对式(4)两边取自然对数得回归方程为

(5)

选取210个地质灾害隐患点(105个灾害点,105个非灾害点)作为样本,基于ArcGIS平台多值提取至点工具将各因子分类中的信息量值提取到样本点上,定义灾害点属性为1,非灾害点属性为0,将样本值导入SPSS软件进行二元逻辑回归分析,逻辑回归分析结果见表3,由表3知各因子显著性均小于0.05,评价结果可靠有效。取9类评价因子的逻辑回归系数B进行归一化处理,最终可得到各因子逻辑回归权重值(表2)。

表3 逻辑回归分析结果Table 3 Result of logistic regression analysis

3.4 AHP-LR熵组合模型

由AHP层次分析法所求得的各评价因子权重为主观权重,基于信息量法求得的LR逻辑回归权重值为客观权重。为科学的对两种权重值进行组合,本次研究采用最小信息熵[26]将两类权重值进行组合,该方法原理为

(6)

(7)

用拉格朗日乘子法解得

(8)

式中:W1i表示由AHP求得的权重值;W2i表示由LR求得的权重值;Wi为AHP-LR熵组合模型权重值。可求得到各评价因子的组合权重值如表2所示。

4 评价结果与检验

4.1 评价结果

首先利用ArcGIS中的重采样工具将各评价因子图层的栅格单元统一为30 m×30 m,共计有2 013行,2 473列,2 662 503个独立的属性单元。

基于ArcGIS平台,将9类评价因子的栅格图层分别乘以对应的AHP权重、LR权重及AHP-LR熵组合权重,最后叠加计算即可得到子长市三类赋权模型下的地质灾害危险程度分布图,最后按照自然间断法并结合研究区实际情况对三类评价结果进行重分类,将危险性等级划分为极高危险区、高危险区、中危险区、低危险区、极低危险区(图4)。统计三类评价模型下各分级的面积和灾害点数量可得表4。

由图4可知,三类评价模型下的危险性分区情况基本保持一致,其中,基于AHP主观权重的危险性评价结果主要受到了灾害点密度因子的影响,区划分级较为明显;而基于LR客观权重的危险性评价结果主要受到河流距离因子的影响,各危险性分级多沿河流分布;AHP-LR组合赋权模型下的评价结果融合了主、客观赋权模型下的危险性分级情况,分区结果更为合理。此外,由表4可知,三类模型下的分级面积占比均由极低危险区向极高危险区逐级递增,且灾害点占比与分级面积占比的比值由极低危险区向极高危险区逐级递增,表明三类评价模型分级皆合理有效,评价结果较为可靠。

图4 危险性分区图Fig.4 Zoning of risks

表4 危险性分区值统计Table 4 Statistics of risk zoning values

现对AHP-LR熵组合权模型下求解的危险性评价结果概述如下。

(1)极高、高危险性分区主要集中于研究区中部,在境内西南部、东北部也有零星分布。两类分区下的面积约352.49 km2,占全区总面积的14.66%,灾害点占比为64.76%。此两类分区下人口密度相对较大,环境改造较为强烈,地质灾害通常表现为规模大,强度高,影响范围较广,承灾体多且易损性极高,对人们的生命和财产安全存在极大威胁。

(2)中危险性分区主要受到河流、道路分布情况的影响,在全区皆有不同程度的散布。分区下的面积为512.54 km2,占全区面积的21.31%,区内灾点占比为26.67%。此类分区下的地质灾害主要受河流对斜坡坡脚冲刷和人类工程活动对斜坡体扰动的影响,地质灾害特点通常表现为规模大,强度低,影响范围较大但易损性较低。

(3)低、极低危险区受土地利用类型、年均降雨量等影响因子的综合影响,主要分布于研究区西部、西北部地区。两类分区下的面积约1 539.98 km2,占全区总面积的64.03%,灾害点占比为8.57%。区内灾害点的分布较少,灾害形式表现为规模较小,强度较低,影响范围较小,易损性较低等。

4.2 评价结果检验

受试者工作特征(receiver operating characteristic,ROC)曲线是目前最为常用的精度检验统计学方法[27],该曲线是根据一系列不同的二分类方式,以真阳性率(敏感度)为纵坐标,假阳性率(1-特异性)为横坐标绘制的曲线,其描绘的是诊断中敏感性和特殊性间的制约关系[28],而曲线与横轴围成的面积(area under curve,AUC)可以表示模型对灾害样本的预测精度,其值越高,预测精度越高[29]。

选取研究区105个灾害点以及105个非灾害点对地质灾害危险性评价结果进行精度检验。检验结果显示,基于层次分析法、逻辑回归法和组合赋权法的3类模型AUC值分别为0.769、0.782、0.897(图5),表明此三类模型均能够客观准确地对子长市地质灾害危险性进行分级评价,且评价模型的精度AHP-I模型

图5 评价模型ROC曲线Fig.5 ROC curves of assessment models

5 讨论与结论

5.1 讨论

随着科学技术的不断发展,各种评价方法、评价手段纷纷被运用至地质灾害的评价内容中,传统的评价方法对比于新生评价方法上显得过于单一,而相较于传统的评价方法在各区域的适用性上,新生的评价方法又显得过于格式化。从地质灾害危险性本身出发,区域危险性等级的划分并非仅由某几类评价因子决定,过多或过少的选取评价因子均会对评价结果产生一定影响,此外各评价因子叠加过程中权重值的合理设定对评价结果也有显著影响。

基于9类评价因子,将主、客观权重以最小信息熵处理为模型最终的因子权重值,最后与各因子分级信息量值进行叠加,得到子长市地质灾害危险性区划图。此方法一方面科学的设定了各评价因子的权重值,另一方面考虑到各评价因子分级地质灾害发育程度的不同。研究结果表明,子长市地质灾害极高、高危险区分布表现为树杈状,并多集中于研究区中部。评价结果精度值表明,主、客观权重耦合后的评价精度明显高于单一赋值模型。

然而正如前文所述,地质灾害危险性评价结果的准确性所受到的影响因素较多,文中所使用的方法仅表明评价结果合理且该类方法优于单一的赋权模型,同时该类评价方法也可为今后的相关研究及防灾减灾工作提供一定参考。

5.2 结论

(1)主、客观赋权以及组合赋权三类方法下求得的危险性分级图基本保持一致,基于ROC曲线检验下的AUC值显示,AHP-I模型与LR-I模型评价结果的精度相近,组合赋权模型下的评价结果AUC=0.897,评价精度较高,表明采用基于AHP-LR熵组合模型下的地质灾害危险性评价比单一赋权模型下的评价结果更为准确,且此类评价模型更适宜于同等地质环境条件下的地质灾害危险性评价。

(2)研究区内极低、低危险性分级受到高程、土地利用类型、年均降雨量等评价因子的综合影响,主要分布于研究区西部、西北部地区。两类分区下的面积约1 539.98 km2,占全区总面积的64.03%;中危险性分区主要受到河流分布情况的影响,分区下的面积为512.54 km2,占全区面积的21.31%;极高、高危险性分级主要集中于研究区中部,两类分区下的面积约352.49 km2,占全区面积的14.66%,此2类分区下人口密度较大,环境改造强烈,地质灾害通常表现为规模大,强度高,影响范围较广,易损性较高,对道路、人口等均有极大威胁,是地质灾害防灾减灾工作部署的重点研究区段。

(3)基于信息量法,将主观权重值与客观权重值相结合的熵组合赋权,从理论方法上综合考虑了各评价因子对地质灾害危险性的影响大小,在研究意义上表明多种评价方法之间的耦合关联能够有效解决单一的评价方法求解的局限性问题,且评价结果更为可靠有效。

猜你喜欢

信息量危险性权重
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
危险性感
危险性感
一起汽车火灾调查与油品泄漏危险性分析
输气站场危险性分析
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
走出初中思想品德课的困扰探讨