基于支持向量机模型的四川省滑坡灾害易发性区划
2019-06-05王卫东刘攀龚陆
王卫东,刘攀,龚陆
基于支持向量机模型的四川省滑坡灾害易发性区划
王卫东,刘攀,龚陆
(中南大学土木工程学院,湖南 长沙 410004)
以四川省为研究区,结合野外调查情况和主成分分析法,选择与构造线距离、高程、与河流距离、地貌类型、岩性、年均降雨量和坡度等7个滑坡致灾因子,并基于频率比模型构建滑坡致灾因子评价体系,引入支持向量机模型编制研究区滑坡易发性区划图。研究结果表明:四川省被划分为低易发区、中易发区、高易发区和极高易发区4个区域,各区面积占研究区比例分别为41.77%,31.19%,17.20%和10.84%,高易发区和极高易发区主要位于四川省的南部和中东部,且发生滑坡数量占总数的79.14%。研究成果不仅为基础设施建设、防灾减灾工作提供科学依据,还为其他地区滑坡易发性评价提供参考。
滑坡;易发性区划;支持向量机;主成分分析;频率比模型
我国地域面积辽阔,地形条件、地貌类型多种多样,山区面积(包括丘陵和高原)几乎占了国土面积的70%,孕育大量地质灾害。根据中国统计年鉴,2013~2017年共发生地质灾害53 184起,其中滑坡的数量占了总数70%以上,可见滑坡是我国发生频率最高的地质灾害,给人民群众的生命财产带来严重威胁,科学准确的开展滑坡易发性评价,对灾害预警、风险管理都具有重要意义[1]。国内外关于滑坡易发性区划已经有较长的研究历史。研究方法大致可分为定性和定量方法,定性方法主要依靠专家主观经验来对滑坡进行定性描述,例如:层次分析法(Biplab等[2]),模糊数学法(Giovanni等[3])等,定量的方法主要采用统计学或者神经网络等把滑坡灾害转换成定量计算,例如:逻辑回归法(YANG 等[4−5]),BP神经网络(Aditian等[6−7]),支持向量机(HUANG[8])等。除了研究方法以外,滑坡致灾因子的选择也非常重要,与易发性区划结果直接相关。滑坡的影响因素互相依存、互相影响,目前对于滑坡致灾因子的选择和分级主要依靠文献调研和经验总结。本文以四川省为研究对象,在研究参考文献[9−10]的基础上并结合四川省实际情况,初选10个滑坡致灾因子,并基于主成分分析法(PCA)予以筛选,引入频率比模型构建四川省滑坡致灾因子体系,并利用支持向量机模型,编制四川省滑坡灾害易发性区划图。
1 研究区域概况
四川省位于我国西南部,东经97°21′~108°31′,北纬26°03′~34°19′之间,辖区面积48.6万km2,东西向长1 075 km,南北向长921 km。四川省位于青藏高原与长江中下游之间的过渡地带,全省地形地貌复杂,地层发育完全,地质构造作用强烈,山地广布,地势西高东低,高差相差悬殊,故东西部气候有着明显差异。降水量也由东南向西北逐渐减少,其中降水最多的四川盆地年均降水量达到745~1 732.4 mm,省内水资源丰富,河流众多,下切作用强烈,同时境内工程活动数量多、规模大。复杂自然条件导致四川省成为我国地质灾害发生最为严重的省份之一,本文统计了中国科学院成都山地所提供的历史滑坡灾点数据(图1)。
图1 历史滑坡灾点
2 建立滑坡致灾因子体系
2.1 致灾因子选择
影响滑坡的因素较多,按其对滑坡的影响方式可以分为内在因素和外在因素,内在因素包括地形地貌、高程、坡度、坡向等从本质上孕育滑坡的因子,外在因素包括人类工程活动、强降雨等外界诱发滑坡的条件。本文初步选取了高程、与构造线距离、与河流距离、地貌类型、岩性、年均降雨量、坡度、坡向、与铁路距离、与公路距离等10个致灾因子。
采用主成分分析法[11](PCA)对上述致灾因子进行筛选。PCA的主要思想是用较少的变量去解释原数据中大部分变量,寻找原始数据中相互独立或者不相关变量,从而得到对滑坡灾害贡献较大的致灾因子。经过主成分分析,得到研究区域的高程、与构造线距离、与河流距离、地貌类型、岩性、年均降雨量和坡度等7个主要致灾因子(表1),这7个致灾因子累计贡献率之和达到了86.397%。各致灾因子的二级因子分级如图2~8所示。
表1 致灾因子主成分分析表
2.2 致灾因子数字化
7个致灾因子中有定性指标,也有定量指标,且量纲也不一致,为了方便对致灾因子计算以及清晰的反映其二级因子对滑坡易发性的影响程度,本文以频率比模型[12]统一致灾因子量纲,得到表2。
式中:Fij是各二级因子区域内的历史滑坡集中度;Nij是第i个因子第j个二级因子区域内历史滑坡个数;N是研究区历史滑坡总个数;Sij是第i个因子第j个二级因子区域面积;S是研究区总面积。
图3 高程
图4 与河流距离
图5 地貌类型
图6 岩性
图7 年平均降雨
图8 坡度
表2 致灾因子各二级因子指标值表
地貌类型台地608 707.422.172 40.365 1 大起伏山地721248 540.570.913 00.153 4 中起伏山地42386 615.851.542 70.259 3 小起伏山地286109 018.810.818 60.137 6 平原4931 211.70.503 70.084 6 岩性易滑岩组37298 231.921.196 40.319 3 较易滑岩组217123 406.10.566 70.151 3 偶滑岩组797174 036.11.448 20.386 5 稳定岩组15391 091.710.535 20.142 9 年均降雨量/mm<400353 368.540.031 50.008 6 400~800185175 337.870.346 30.094 0 800~1 2001112127 992.472.739 10.743 6 >1 200235130 182.870.566 70.153 8 坡度/(°)<27735 954.690.661 20.179 5 2~12349132 935.760.818 60.222 2 12~24578152 418.861.196 40.324 8 >24535165 502.681.007 50.273 5
3 滑坡地质灾害易发性评价
3.1 支持向量机模型
支持向量机(SVM)是Vapnik等[13]于1995年提出的一种新的机器学习方法,其主要思想是通过一个非线性映射,把非线性可分的数据映射到高维特征空间,并在此特征空间寻找最优分类超平面,将2类数据点高效分类。
3.2 易发性区划
运用SVM模型对四川省进行易发性区划研究主要步骤如下:本文采用1 000 m×1 000 m网格将研究区分为512 623个单元,每个单元都有7个致灾因子二级因子和是否发生滑坡(1代表滑坡,0代表非滑坡)的属性,并单独作为一个样本。总样本集被分成2部分,随机选取80%的单元作为训练样本集,20%作为验证样本集。有研究表明不同核函数的类型对于SVM模型的性能影响不大[14],更重要的是核函数中的参数和惩罚因子。故本文选用径向基核函数作为该模型的核函数,并利用交叉验证[15]得到SVM模型的参数值和,=12,=0.8。用训练好的模型计算研究区内所有单元,并结合所得结果和自然裂点法将研究区易发性等级将分为低、中、高、极高4个等级,得到研究区的滑坡易发性区划图,如图9。并叠加历史滑坡灾点图,进而得到各个分区内滑坡个数和面积,见表3。
图9 易发性区划图
表3 研究区结果分析
研究结果表明,高易发区和极高易发区主要分布在四川省的南部和中东部,从各等级易发区内历史滑坡的比例来看,低易发区面积占全省面积41.77%,仅7.67%的历史滑坡灾点处于该区域;虽然高易发区和极高易发区域只占全省面积28.04%,但79.14%的历史滑坡灾点位于该区域。随着易发区等级由低到高,面积百分比减少,历史滑坡灾点数增加,完全符合地质灾害易发性区划图的特性[16]。同时,评价结果与历史滑坡灾害点的分布情况基本吻合,可以认定该区划结果准确可靠。
4 结论
1) 结合四川省的实际情况综合选取10个致灾因子,并应用主成分分析法筛选出高程、与构造线距离、与河流距离、地貌类型、岩性、年均降雨量、坡度等7个致灾因子构建四川省滑坡致灾因子评价体系。
2) 基于支持向量机模型,编制四川省滑坡灾害易发性区划图,滑坡灾害低易发区、中易发区、高易发区、极高易发区占全省总面积分别为7.67%,13.19%,29.70%和49.44%。滑坡灾害易发性较高的地区主要分布在四川省南部和中东部。
3) 滑坡灾害高易发性等级以上的区域占研究区域总面积28.04%,而该区域内历史滑坡灾点数占研究区历史滑坡总数的79.14%。表明滑坡易发性评价结果与历史滑坡分布吻合程度高,本文编制的滑坡易发性区划图有较高的准确性和可靠性。
[1] 陈香, 王瑞. 福建省滑坡灾害风险管理决策系统构建[J]. 灾害学, 2016, 31(2): 47−52. CHEN Xiang, WANG Rui. Construction of landslide disaster risk management decision system in Fujian province[J]. Disaster science, 2016, 31(2): 47−52.
[2] Mandal B, Mandal S. Analytical hierarchy process (AHP) based landslide susceptibility mapping of Lish river basin of eastern Darjeeling Himalaya[J]. Advances in Space Research, 2018, 62(11): 3114−3132.
[3] Giovanni L, Rocco P, Francis C. Landslide susceptibility mapping using a fuzzy approach[J]. Procedia Engineering, 2016, 161: 380−387.
[4] Luigi L, Martin M P. Presenting logistic regression-based landslide susceptibility results[J]. Engineering Geology, 2018, 244: 14−24.
[5] YANG Jintao, SONG Chao, YANG Yang. New method for landslide susceptibility mapping supported by spatial logistic regression and GeoDetector: A case study of Duwen Highway Basin, Sichuan Province[J]. Geomorphology, 2019, 324: 62−71.
[6] Aditian A, Kubota T, Shinohara Y. Comparison of GIS-based landslide susceptibility models using frequency ratio, logistic regression, and artificial neural network in a tertiary region of Ambon, Indonesia[J]. Geomorphology, 2018, 318: 101−111.
[7] Binh T P, Ataollah S, Dieu T B. A hybrid machine learning ensemble approach based on a Radial Basis Function neural network and Rotation Forest for landslide susceptibility modeling: A case study in the Himalayan area, India[J]. International Journal of Sediment Research, 2018, 33(2): 157−170.
[8] HUANG Yu, ZHAO Lu. Review on landslide susceptibility mapping using support vector machines[J]. Catena, 2018, 165: 520−529.
[9] 王卫东, 陈燕平, 钟晟. 应用CF和Logistic回归模型编制滑坡危险性区划图[J]. 中南大学学报(自然科学版), 2009(4): 1127−1132. WANG Weidong, CHEN Yanping, ZHONG Sheng. Landslide susceptibility mapped with CF and Logistic regression model[J]. Journal of Central South University (Science and Technology), 2009(4): 1127−1132.
[10] 黄发明, 殷坤龙, 蒋水华. 基于聚类分析和支持向量机的滑坡易发性评价[J]. 岩土力学与工程学报, 2018, 37(1): 156−167. HUANG Faming, YIN Kunlong, JIANG Shuihua. Landslide susceptibility evaluation based on cluster analysis and support vector machine[J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 37(1): 156− 167.
[11] 雷鹏, 蒋廷耀.基于PCA和SVM算法的滑坡稳定性分析研究[J]. 科技视界, 2015, 14(6): 92−97. LEI Peng, JIANG Tingyao. Analysis of landslide stability based on PCA and SVM algorithms[J]. Science & Technology, Vision, 2015, 14(6): 92−97.
[12] 齐信, 黄波林, 刘广宁, 等. 基于GIS技术和频率比模型的三峡地区秭归向斜盆地滑坡敏感性评价[J]. 地质力学学报, 2017, 23(1): 97−104. QI Xin, HUANG Bolin, LIU Guangning, et al. Sensitivity evaluation of landslides in the Zigui inclined basin in the Three gorges area based on gis technology and frequency ratio model[J]. Journal of Geomechanics, 2017, 23(1): 97−104.
[13] 陈冰梅, 樊晓平, 周志明, 等. 支持向量机原理及展望[J]. 制造业自动化, 2010, 32(12): 136−138. CHEN Bingmei, FAN Xiaoping, ZHOU Zhiming, et al. The principle and prospect of support vector machine[J]. Manufacturing Automation, 2010, 32(12): 136−138.
[14] 傅文杰. GIS支持下基于支持向量机的滑坡危险性评价[J]. 地理科学, 2008, 28(6): 838−841. FU Wenjie. Landslide susceptibility evaluation based on support vector machine with GIS support[J]. Scientia Geographica Sinica, 2008, 28(6): 838−841.
[15] Edson D, Jacques W. Empirical comparison of cross- validation and internal metrics for tuning SVM hyperparameters[J]. Pattern Recognition Letters, 2017, 88: 6−11.
[16] Eslami M, Shadfar S, Mohammadi-Torkashvand A. Assessment of density area and LNRF models in landslide hazard zonation (Case study: Alamout watershed, Qazvin Province, Iran)[J]. Acta Ecologica Sinica, 2018, 19: 1−8.
(编辑 涂鹏)
Landslide susceptibility mapping of sichuan province based on support vector machine
WANG Weidong, LIU Pan, GONG Lu
(School of Civil Engineering, Central South University, Changsha 410004, China)
Taking Sichuan Province as the research area, combining the field investigation and principal component analysis (PCA) method, distance from the construction line, elevation, distance from the river, landform types, lithology, annual average rainfall and slope are selected as landslide causal factors with the frequency ratio model, and support vector machine (SVM) is used to created landslide susceptibility zoning map of research area. The results show that the research area could be classified into four categories, i.e., low susceptibility zone, moderate susceptibility zone, high susceptibility zone, and extremely high susceptibility zone, taking an area proportion of 41.77%, 31.19%, 17.20%, 10.84%, respectively. The number of landslides in high-susceptibility areas and extremely high-susceptibility areas accounted for 79.14% of the total, mainly in the southern and central eastern parts of Sichuan Province. The research results not only provide a scientific basis for infrastructure construction, disaster prevention, and mitigation work but also provide a reference for landslide susceptibility evaluation in other regions.
landslide; susceptibility zoning; support vector machine; principal component analysis; frequency ratio model
10.19713/j.cnki.43−1423/u.2019.05.011
[P694]
A
1672 − 7029(2019)05 − 1194 − 07
2018−06−09
国家自然科学基金资助项目(51478483)
王卫东(1971−),男,江西上饶人,教授,博士,从事道路与铁道工程研究;E−mail:147745@163.com