基于Logistic回归模型的芦山震后滑坡易发性评价
2013-01-04苟长江
冯 策,刘 瑞,苟长江
(地质灾害防治与地质环境保护国家重点实验室(成都理工大学),成都610059)
2008年5月12日,四川省汶川发生Ms 8.0级地震(简称“5·12”汶川地震),地震对地表产生强烈扰动,产生了多达2.8×109m3的松散固体物质,导致滑坡的发生频率和强度都大幅度增加,成为对地震灾区影响最严重的灾害,大约造成了2万多人的死亡[1,2]。2013年4月20日四川省雅安市芦山县发生 Ms7.0级地震(简称“4·20”芦山地震),震中位置为30.3°N、102.95°E,震源深度为13km。该地区地质环境与汶川相似,为非常脆弱的中、高山地区。地震造成大量山体松动、崩塌、滑坡等地质灾害,严重威胁广大人民群众的生命与财产安全。
结合遥感 (RS)和地理信息系统 (GIS)的数据获取、存储、分析、展示能力,使得滑坡易发性评价变得更加快速、准确。本文通过Logistic回归分析拟合滑坡灾害与致灾因子之间的关系,得出滑坡易发性系数,使用自然间断点分级法将滑坡易发性系数分为极高、高、中、低4个级别。最后的验证显示Logistic回归方法具有较高的准确率,可用于指导土地规划等灾后重建。
本文的研究区(图1)位于四川盆地西缘,处于龙门山断裂带南段,震中附近。该地区大部分位于芦山县内,西邻宝兴县,东与邛崃、雅安接壤,地理坐标为102.9°E~103.3°E、30.2°N~33.4°N,最低点海拔高度为639m,最高点为2 015m。研究区属于中纬度内陆亚热带湿润气候,年均气温15.2℃,年均降雨量为1 313.1mm,降雨从5月份开始递增,多集中在7~9月份。区内总体气候特点是冬暖夏凉,四季分明,气候温和[3]。
1 影响因子及其分类
1.1 评价因子选择
根据前人的研究,许多环境因子,比如地貌、降雨、岩层、土地利用情况,都对滑坡的产生有影响。但是,对一个地区的地质灾害起决定性影响的因素也就3~5个[4]。考虑到研究区的特点,本文选取了差异较大的5种因子:坡度、起伏度、土地利用、到断层的距离、地震动的峰值加速度(表1)。
a.坡度(图2-B)。坡度反映了研究区地形陡峭程度,陡峭的地形为滑坡的发生提供了动力条件。坡度可通过数字高程模型(DEM)计算获取。
图1 研究区位置Fig.1 Location map of the study area
b.土地类型(图2-C)。土地类型体现了人类活动对大自然的影响,不同的土地类型反映了不同的土壤结构、松散堆积物的厚度与类型、植被覆盖情况。这些条件同滑坡的发生有着密切的关系。本文通过对TM遥感影像的解译,共划分出4种土地类型,分别是建筑用地、耕地、林地、草地。
表1 评价因子汇总表Table1 List of the data used in this study
c.起伏度(图2-D)。起伏度代表了地形的起伏程度,滑坡等次生地质灾害多发生于起伏度大的区域。起伏度可通过数字高程模型(DEM)提取,选取像素点90m范围内的点作为计算区域。
d.到断层的距离(图2-E)。断裂带周围堆积了大量松散物质,为滑坡的产生提供了物质条件。离断裂带的距离越近,岩石碎屑等物质越充足,滑坡的规模也相应增大。
e.地震动的峰值加速度(图2-F)。一般而言,滑坡等次生地质灾害的分布同地震地面震动强度有正相关关系。从美国地质调查局(U.S.Geological Survey)获取的地震动峰值加速度(Peak Ground Acceleration)能够很好地表征地面震动幅度。
1.2 评价因子分级
为避免人为影响,对坡度、起伏度、地震动的峰值加速度等评价因子采用自然间断点分级法(Jenks Natural Breaks)[5]进行分级,土地类型和到断层的距离在计算过程已经分级,具体如表2所示。
2 Logistic回归
2.1 回归模型
Logistic回归模型来源与广义线性模型(Generalized Linear Model)通过连接函数将响应变量和自变量的线性组合连接
其中:g(μ)为连接函数,α为常数项,β为回归系数。当响应变量服从二项分布时,采用logit函数作为连接函数,即有Logistic回归模型
其中:p是在n个自变量作用下发生的条件概率,α为常数项,β为回归系数。
在滑坡易发性评价中,滑坡发生与否是一种二分类变量(发生记为“1”,未发生记为“0”),可以使用Logistic模型进行拟合。众多学者使用此方法获得成功案例[6-8]。本文将研究区内421个真实滑坡点数据作为滑坡样本,并在研究区域随机选取421个点作为非滑坡样本(图2-A),根据滑坡点与非滑坡点样本进行各种因子的综合评价。
图2 滑坡发生点与未发生点分布及易发性评价因子分布Fig.2 The data layer and landslide inventory used in this study(1g≈9.8m/s2)
表2 评价因子分级表Table2 The classification system of the five independent parameters
2.2 回归结果
研究区内,5种评价因子的Logistic回归模型结果以及系数的显著性检测如表3所示。
从上述结果可以看出,回归系数的检测结果是显著的,即可以定义试验区的滑坡易发性Logistic模型:
Risk=0.3127×LT+0.19635×RDL+0.46632×SLOPE+0.57651×PGA+0.59844×DF
Logistic回归模型要求各个因子不具有多重共线性,对5个评价因子进行多重共线性诊断,诊断结果如表4。
表3 模型结果及其系数的显著性检测表Table3 The regression coefficients and its significance
其中容许度(Tolerance)、方差膨胀因子(VIF)互为倒数。当VIF>5时表明该因子与其他因子存在多重共线性,当VIF>10时说明多重共线性程度很高。表4中,VIF的最大值为2.791 83,可以认为5个因子不存在明显多重共线性。即上述模型不存在多重共线性对回归系数带来的显著影响。
3 滑坡易发性分区及检测
Logistic回归模型属于二分类问题,对于二分类的模型检测通常使用混淆矩阵。表5的混淆矩阵显示了分类可能产生所有情况,其中的列[阳性(P)/阴性(N)]对应于实例实际所属的类别,行[真(T)/假(F)]表示分类的正确与否。4种可能性分别为真阳性(TP)、真阴性(TN)、假阳性(FP)、假阴性(FN)。
表5 混淆矩阵Table5 Confusion Matrix
根据混淆矩阵,可以衍生出:
灵敏度(sensitivity)
TPR= TP/P= TP/(TP+FN)
1-特异度(1-specificity)
FPR=FP/N =FP/(FP+TN)
分别以TPR和FPR为横轴、纵轴画出ROC(Receiver Operating Characteristic)曲线[9]如图3所示。
图3 ROC曲线Fig.3 ROC curve
其中AUC(Area Under Curve)为ROC曲线之下面积,可以用作衡量模型精度的标准,其值越接近于1越好[10];线上标注点为最优点。上述模型作ROC曲线,AUC值为0.772,表明评价模型获得了较高的准确率。
整个研究区使用该模型,仍然使用自然间断点分级法将滑坡危险度分为低、中、高、很高4个级别,得到图4。
图4 滑坡易发性分区图Fig.4 The landslide susceptibility map
其中易发性为很高的占总面积的15.40%,421个真实滑坡数据落在该区域的有84个,占总数的19.95%。易发性为高的占总面积的31.23%,滑坡个数为220个,占总数的52.25%。易发性为中的占总面积的38.11%,滑坡个数为108个,占总数的25.89%。易发性为低的占总面积的15.16%,滑坡个数为9个,占总数的1.90%。易发性为很高和高的2个级别区域占了滑坡总数的73.58%,说明应用Logistic回归模型进行滑坡危险度分区可以达到较好的效果。
4 结论
在过去的5年,有许多学者针对汶川地区滑坡等次生地质灾害,提出了许多易发性评估模型,获得了科学合理的评估结果[11-13]。评估结果为汶川地区的灾后重建、土地利用规划等经济民生建设活动提供了科学依据。芦山地区由于地形、降雨等因素,在震后很长一段时间内,都是泥石流、滑坡、崩塌等地质灾害易发区。借鉴汶川地区灾后重建的经验,次生地质灾害的易发性评估能够为芦山地区的灾后重建工作提供科学的选址依据。
从模型的评价结果可以看出,本文所选取的致灾因子能够很好地代表研究区的地形地貌特征、地质环境条件。通过Logistic回归方法拟合了滑坡与各种致灾因子的最佳关系,获取的评估结果与实际情况相符,其中距断层近的陡坡最容易发生滑坡灾害,能够为震后重建提供科学的依据。
[1]崔鹏,庄建琦,陈兴长,等.汶川地震区震后泥石流活动特征与防治对策[J].四川大学学报:工程科学版,2010,42(5):10-19.Cui P,Zhuang J Q,Chen X C,et al.Characteristics and Countermeasures of Debris Flow in Wenchuan Area After the Earthquake[J].Journal of Sichuan U-niversity(Engineering Science Edition),2010,42(5):10-19.(In Chinese)
[2]殷跃平,潘桂堂,刘宇平,等.汶川地震地质与滑坡灾害概论[M].北京:地质出版社,2009:60-61,104-111.Yin Y P,Pan G T,Liu Y P,et al.Great Wenchuan Earthquake:Seismogeology and Landslide Hazards[M].Beijing:Geological Publishing House,2009:60-61,104-111.(In Chinese)
[3]范继跃.芦山县旅游资源调查评价及开发模式研究[D].成都:成都理工大学档案馆,2006.Fan J Y.Lushan Tourism Resources Investigation and Assessment and Developing Model Research[D].Chengdu:The Archive of Chengdu University of Technology's,2006.(In Chinese)
[4]黄润秋,向喜琼,巨能攀,等.我国区域地质灾害评价的现状及问题[J].地质通报,2004,23(11):1078-1082.DOI:10.3969/j.issn.1671-2552.2004.11.005.Huang R Q,Xiang X Q,Ju N P,et al.Assessment of China's regional geohazards:present situation and problems[J].Geological Bulletin of China,2004,23(11):1078-1082.DOI:10.3969/j.issn.1671-2552.2004.11.005.(In Chinese)
[5]Nandi A,Shakoor A.Application of Logistic regression model for slope instability prediction in Cuyahoga River Watershed,Ohio,USA[J].Georisk,2008,2(1):16-27.
[6]Guzzetti F,Carrara A,Cardinali M,et al.Landslide hazard evaluation:a review of current techniques and their application in a multi-scale study,Central Italy[J].Geomorphology,1999,31(1):181-216.
[7]Ayalew L,Yamagishi H.The application of GIS-based Logistic regression for landslide susceptibility mapping in the Kakuda-Yahiko Mountains,Central Japan[J].Geomorphology,2005,65(1):15-31.
[8]Lee S.Application of Logistic regression model and its validation for landslide susceptibility mapping using GIS and remote sensing data[J].International Journal of Remote Sensing,2005,26(7):1477-1491.
[9]Centor R M.Signal Detectability The Use of ROC Curves and Their Analyses[J].Medical Decision Making,1991,11(2):102-106.
[10]Lee S,Dan N T.Probabilistic landslide susceptibility mapping on the Lai Chau province of Vietnam:focus on the relationship between tectonic fractures and landslides[J].Environmental Geology,2005,48:778–787.
[11]铁永波,唐川.汶川县城泥石流灾害风险评价研究[J].灾害学,2010,25(4):43-47,53.DOI:10.3969/j.issn.1000-811X.2010.04.009.Tie Y B,Tang C.Assessment of Wenchuan Debrisflow Risk[J].Journal of Catastrophology,2010,25(4):43-47,53.DOI:10.3969/j.issn.1000-811X.2010.04.009.(In Chinese)
[12]刘艺梁,殷坤龙,刘斌,等.逻辑回归和人工神经网络模型在滑坡灾害空间预测中的应用[J].水文地质工程地质,2010,37(5):92-96.DOI:10.3969/j.issn.1000-3665.2010.05.017.Liu Y L,Yin K L,Liu B,et al.Application of Logistic regression and artificial neural networks in spatial assessment of landslide hazards[J].Hydrogeology and Engineering Geology,2010,37(5):92-96.DOI:10.3969/j.issn.1000-3665.2010.05.017.(In Chinese)
[13]Cui P,Chen X Q,Zhu Y Y,et al.The Wenchuan Earthquake (May 12,2008),Sichuan Province,China,and resulting geohazards[J].Natural Hazards,2009,56(1):19-36.