基于MaxEnt模型的云南省玉龙县滑坡易发性评价
2023-11-01角媛梅张洪森
陶 妍,角媛梅,张洪森
(云南师范大学 地理学部,云南 昆明 650500)
0 引言
滑坡是世界上最具危害性的自然灾害之一,具有分布广、发生频率高、运动速度快等特点,其风险评价一直都是人们关心的主要问题之一[1]。中国是亚洲乃至世界上滑坡灾害最为严重的地区之一,2021年自然资源部公布的全国地质灾害数据显示,2021年全国范围内共发生地质灾害4 772起,其中滑坡2 335起,占地质灾害的48.93%(https://m.gmw.cn/baijia/2022-01/14/1302762313.html)。滑坡灾害严重威胁并阻碍了区域经济和人类的可持续发展,因此,研究滑坡的易发性可为区域地质灾害预测预报和防治规划提供科学的理论依据。
通过滑坡灾害易发性评价进行区域灾害的空间预测是领域研究的热点,但评价模型的应用效果由于区域的地质环境、气候因素的不同存在一定的差异。国内外许多学者应用不同模型对滑坡易发性进行实证研究,评价模型大致分为4类,包括启发式模型,常用的有专家打分法和层次分析法[2-3],启发式模型兴起之初,应用频率较高,但因自身模型主观性强等因素,目前应用较少;确定性系数模型,常用的有SHALSTAB、SINMAP和TRIGRS[4-6],在适用范围内使用有较好的效果,但由于较多的实验参数,在大范围区域应用受到限制;数理统计模型,主要有信息量模型[7]、逻辑回归模型和频率比模型[8-9],同样在适用范围使用取得良好的预测效果,如三峡库区万州区[10];机器学习模型,主要有人工神经网络[11]、支持向量机和MaxEnt模型(最大熵模型)[12],机器学习模型相比传统的评价模型具有较强的预测精度,成为目前滑坡易发性评价模型的热点选择,模型适应性较广[13-15]。近来,国内已有许多学者将MaxEnt模型运用到不同区域尺度(省、市、流域)的研究中,研究结果具有较好的可信度[16-18]。因此本文尝试将MaxEnt模型引入到滑坡易发性评价中,探究MaxEnt模型在县域尺度评价滑坡易发性的准确性。
云南省玉龙县位于长江上游,地质条件复杂,属地质灾害多发区。近年来随着当地旅游业的快速发展,生态环境愈发脆弱加上人类活动不断加剧,当地滑坡灾害频发,如何规避与预防,已成为当地政府关注的重要问题。基于此,以玉龙县为研究区,结合其滑坡灾害发育的环境特征和空间分布情况,选取了地形、植被、人类活动等12个诱发因子,应用MaxEnt模型进行滑坡易发性评估,积极推进云南省玉龙县的防灾减灾及水土保持工作。
1 研究区概况
玉龙县位于云南省西北部,行政区划隶属丽江市,是中国唯一的纳西族自治县,地理坐标26°34′N-27°46′N、99°23′E-100°32′E(封二图版Ⅰ图1)。地处青藏高原东南边缘横断山向云贵高原过渡的衔接地段,地势西北高、东南低,整个行政区域的形状是“V”字型,地形以山地、盆地、河谷为主;境内海拔1 380~5 427 m,地形高差大;属温带大陆性季风气候,昼夜温差较大,受山高谷深的影响,干湿季、立体气候明显,形成“一山分四季,十里不同天”的立体气候特征,年平均气温12.9℃,年平均降雨量968.3 mm。主要的土壤类型是红壤、红黄壤、紫色土等。境内河流较多,其中径流量最大的是金沙江。随着2003年老君山以“三江并流”核心区成为世界遗产,当地旅游业迅速发展,人类活动不断加剧加之自然环境脆弱,玉龙县滑坡、泥石流等地质灾害频繁发生,是云南省地质灾害严重的县份之一。
2 数据与方法
2.1 数据来源与处理
2.1.1 滑坡数据
滑坡灾害数据库以玉龙县2020年记录的127个滑坡点为数据源,其记录了发生日期、经度、纬度以及发生规模、灾害诱因等信息。按要求保存为.csv格式的文件供后续研究使用。
2.1.2 指标因子构建及处理
滑坡的产生不能脱离孕灾环境的背景条件和触发因子的影响。孕灾背景条件主要包括地形地貌、地层岩性、植被覆盖等;触发因子主要包括降雨、地震、人类活动等。根据以往研究,选取植被覆盖、土地利用、海拔、平面曲率、剖面曲率、坡度、坡向、降雨量、距河流距离、距道路距离、土壤类型、居民点密度共计12个环境变量作为玉龙县滑坡易发性建模的指标因子。变量来源:(1)海拔数据从地理空间数据云(http://www.gscloud.cn/search)的数字高程模型DEM栅格数据获取(封二图版Ⅰ图2D)。坡度、坡向、平面曲率和剖面曲率通过高程数据利用ArcGIS的栅格表面分析模块提取获得(封二图版Ⅰ图2A,2B,2C,2E)。(2)土地利用数据来源于清华大学科研团队共享数据(http://data.ess.tsinghua.edu.cn/fromglc 2015_v1.html),将土地利用分为11类,分别为:1.草地;2.林地;3.灌木地;4.水体;5.湿地;6.裸地;7.农田;8.冻土;9.云;10.雪/冰;11.建筑(封二图版Ⅰ图2F)。(3)经ArcGIS软件的核密度分析得到居民点密度(封二图版Ⅰ图2G)。(4)多年平均降水数据(2009-2015年)从中国科学院资源环境与数据中心获得(https://www.resdc.cn/data.aspx?DATAID=229)经空间分析得到(封二图版Ⅰ图2H)。(5)道路和水系数据从地理国情监测云平台获取,通过道路、河流的矢量线要素,利用ArcGIS的空间分析工具计算道路、河流的欧氏距离得到距离图层(封二图版Ⅰ图2I、图2J)。(6)植被归一化指数(NDVI)从Landsat 8卫星影像数据经过大气矫正、波段运算获得(封二图版Ⅰ图2K)。(7)土壤分为12类:1.草甸土;2.黄棕壤;3.沼泽土;4.石灰(岩)土;5.亚高山寒漠土;6.亚高山草甸土;7.棕壤;8.冲积土;9.紫色土;10.红壤;11.水稻土;12.暗棕壤(封二图版Ⅰ图2L)。通过ArcGIS的裁剪、投影和重采样等功能模块将每个大小不同的环境变量栅格转化为相同大小的单元格,将12个环境变量的投影坐标统一为Beijing_1954_GK_Zone_17坐标,空间分辨率为10m×10m,并将所有的环境变量数据通过ArcGIS将格式转换为ASC格式以便模型输入。
2.2 研究方法
2.2.1 MaxEnt模型
MaxEnt(Maximum Entropy)模型是基于最大熵原理编写的用于预测物种潜在地理分布的预测软件[19]。通过将研究区的所有像元作为物种的可能分布空间,将已知物种点作为样点,根据样点像元的环境变量如海拔、植被类型、土地利用、人类活动等得出约束条件,并认为在此约束条件下熵最大时物种出现概率分布最接近物种的实际分布[20]。但滑坡的发生受到多个环境变量的影响,基于已知的滑坡灾害分布数据以及地质环境条件,通过特定算法求出区域内滑坡灾害发生在特定位置上的可能分布,进行未知区域的滑坡分布概率预测。
具体是MaxEnt模型的特征函数f(a,b)表示a和b的某种定性关系, 当a和b符合特定条件时,特征函数赋值为1;不符合特定条件时,特征函数赋值为0[21]。给定一个约束条件,将训练数据视为随机变量(a,b)产生, 令p(f)表示特征函数f(a,b)关于经验分布p(a,b)的期望,如下式:
(1)
若符合约束条件,则p(bla)关于函数f的期望, 与经验分布关于f(a,b)的期望相等:
(2)
再求解带有约束条件的最优化问题,根据归一化指数exp(1-ω)[15], 令Zω(a)表示exp(1-ω), 得:
(3)
2.2.2 模型精确性验证
验证模型模拟的准确性是确保预测结果准确性的一个必要步骤。常见的预测模型有两类错误:“低估”和“高估”。前者将实际发生滑坡的地区预测为高敏感地区,产生错误的负面结果;后者将实际未发生滑坡的地区预测为高敏感地区,产生错误的正面结果,两者都与阈值有关。目前受试者工作特征曲线(ROC曲线)是学者们认可度较高的模型诊断试验评价指标,该方法以灵敏度(即1-遗漏率)为纵坐标,以特异度(即预测范围)为横坐标,绘制的曲线称为ROC曲线。通过ROC曲线下面积,即AUC值对预测结果的好坏进行判断。AUC取值范围为0~1,通常AUC-ROC值越大,表示指标因子与预测模型结果之间相关性越大。
2.2.3 环境重要性评价
采用刀切法(Jackknife)对输入模型的所有环境变量的预测结果重要程度进行估计。在这种方法运算过程中每一次都切去整个原始数据的一部分,有意排除每个环境变量,并使用剩余的因素按照原来的公式建立模型,然后将使用所有环境变量创建的模型与用剩余变量构建的模型的预测性能进行比较,以减少偏差并获得参数的近似置信区间。
2.2.4 MaxEnt建模
将滑坡数据文件和所有环境变量数据导入MaxEnt Version3.4.4软件中,除土地利用和土壤外,剩余的环境变量选择默认设置,选择输出各因素的响应曲线,用刀切法计算各因素的贡献率。以往研究中,关于模型最适宜训练比例的选取并未达成一致,多数研究者采用训练比例取值范围为70%~90%[22],设定解译的127个滑坡数据中75%的滑坡数据用于训练数据,剩余的25%用于验证数据,设置模型运行参数中的迭代次数为500次,取500次模拟结果的平均值作为最终的模拟结果,结果以Ascii文件类型输出。最后将预测结果利用ArcMap的格式转换工具Conversion Tools由Ascii格式转化为Raster格式。
3 结果分析
3.1 模型精度检验ROC曲线
模型生成的ROC曲线如图3。模型运行结果表明,训练样本和验证样本的ROC-AUC值分别达到0.904和0.856。按照ROC-AUC评价标准:当AUC-ROC的值为0.5~0.6预测失败,在0.6~0.7预测效果较差,0.7~0.8预测效果一般,0.8~0.9预测效果好,0.9~1.0预测效果非常好[23]。
图3 模型精度检验ROC曲线
因此,模型的模拟效果具有较高的可靠性和准确性,该模型可以模拟玉龙县滑坡灾害的空间分布,预测滑坡易感性。
3.2 环境变量对模型的贡献度
本研究采用Jackknife(刀切法)检验模型中12个环境变量对模型预测的贡献程度(表1),结果显示,所有环境变量的贡献率都大于0,贡献率大于1%的因子10个,其中海拔(36.15%)、坡度(28.7%)、距水系(12.3%)是3个影响滑坡发生最为重要的变量。其次是降雨(5.6%)、距道路距离(4.2%)和土地利用(3.3%)。在本研究中剖面曲率仅为0.21%,影响最小。
表1 环境变量的贡献率及对应环境变量的ROC-AUC值
3.3 环境变量对MaxEnt模型预测结果的影响
图4所示为12个环境变量的响应曲线,由图4可见:(1)滑坡主要集中在海拔1 200~2 200 m范围内,在2 200 m时达到最大,之后随海拔的增加而减小,主要因为2 200 m以下人类活动较为频繁,对滑坡的发生有一定的影响。(2)滑坡发生的可能性随坡度呈先增大后减小趋势,主要集中在10°~40°发育,此时斜坡内部应力随坡度变大显著增加,坡体易发生失稳;坡度小于10°,滑坡发育很少,该坡度下发生的滑坡一般以人工扰动为主,如开挖坡脚导致滑坡发生。(3)统计发现,坡向呈东、东南、南时,其对滑坡易发性的影响更为强烈,北坡影响最小。即阳坡比阴坡更易发生滑坡,原因可能是阳坡日照较充足,岩石风化较强烈、岩土体较松散,因此易发生滑坡灾害。(4)从曲率值看,滑坡发生的可能性随剖面曲率值的增加而减少,二者呈负相关关系,平面曲率则相反。(5)从土壤类别看,滑坡易发生区主要以红壤、黄棕壤为主。这类土壤土质紧密,遇水泥泞,粘性很强,但透水性差,雨水不易下渗,在降雨、人工扰动等外力作用下易形成潜在滑动面,常导致滑坡产生。(6)居民点密度显示居民点密度越大,越易发生滑坡,且人类活动较为频繁的地区滑坡呈点线状密集分布。(7)距离道路越近时滑坡易发性越高,特别是在距离1 000~2 000 m影响最大,随着距离的增加滑坡发生的概率降低;距水系0~3 000 m滑坡易发性较高,距离水系越近,河流的侵蚀作用就越强,滑坡发生的概率越高,但当距离大于5 000 m以后滑坡影响逐渐减少,随着与水系和道路距离的增加,河流侵蚀和人类活动对滑坡的影响不断降低。(8)NDVI反映了地表植被的覆盖程度,在0.1~0.7时滑坡发生概率随植被指数的增加呈上升趋势,但大于0.7时随植被指数的增加呈下降的趋势。(9)灌木地和林地对滑坡易发性影响较大,林地植被覆盖率高,具有涵养水源、保持水土和调节气候的作用,林地中的滑坡现象不排除是受局部因素如降雨、土壤等影响。(10)降水是诱发滑坡的重要因素之一,滑坡发生概率随降雨量增加而增加,在1 100 mm时出现峰值,后较为平稳,小于780 mm时影响较小,长时间降雨会导致土壤含水量增加,水压力过大,发生滑坡的风险也越高。
图4 环境变量的响应曲线
3.4 滑坡易发性评价结果与分析
MaxEnt模型模拟的滑坡易发性指数值介于0~1,模型预测结果值越大,滑坡发生的可能性越大。采用敏感度和特异性之和最大的方法来确定滑坡敏感区的分类阈值,同时参考正态分布理论与专家经验法[24]。采用自然断点法将玉龙县滑坡分布区划分为5级,分别为极低易发区(0~0.40)、低易发区(0.41~0.51)、中易发区(0.52~0.73)、高易发区(0.74~0.83)和极高易发区(0.84~0.92),空间分布见图5。
图5 玉龙县滑坡易发性分区
由图5可知,MaxEnt模型模拟的结果与实际滑坡灾害点在空间上的分布十分吻合。从整个县域范围看,玉龙县极低易发区、低易发区和中易发区面积占比为48.96%、23.11%、7.97%;高易发区和极高易发区面积占比为10.01%、9.95%。其中滑坡高易发区和极高易区主要分布在人口比较密集的北部、东北和西北部,部分沿着金沙江边缘以及玉龙县主要道路两旁发育,滑坡整体呈现条带状分布,包括奉科镇、宝山乡、龙蟠乡、塔城乡、鸣音镇、石头白族乡和九河白族乡;滑坡低易发区和极低易发区主要分布在人类活动影响较小的东南和西南部,包括拉市镇、黄山镇、太安乡以及黎明傈僳族乡大部分地区。
4 结论与讨论
4.1 结论
以云南省玉龙县为研究对象,选取地形、降雨、植被、土地利用等12个因子建立滑坡易发性评价体系。基于GIS和MaxEnt模型进行滑坡易发性评价,ROC-AUC值达到了0.904,模型模拟效果具有较高的准确性和可信度。采用Jackknife法分析所有环境变量对模型预测的贡献度,发现海拔(36.15%)、坡度(28.7%)、距水系距离(12.3%)是影响当地滑坡发生的主要因子。环境变量响应曲线显示滑坡主要集中在海拔1 200~2 200 m范围内、随坡度呈先增大后减小趋势,主要集中在10°~40°发育;坡向呈东、东南、南时,其对滑坡易发性的影响更为强烈,而北坡影响最小;易发区土壤以红壤、黄棕壤为主;距离道路和水系越近滑坡易发性越高,前者距离1 000~2 000 m影响最大,后者距离0~3 000 m滑坡易发性较高,随着距离的增加滑坡发生的概率降低;NDVI在0.1~0.7时滑坡发生概率呈上升趋势,大于0.7时呈现下降的趋势。灌木地和林地对于滑坡易发性影响较大;降雨对滑坡易发性影响在1 100 mm时出现峰值,后较为平稳,小于780 mm时影响较小。研究结果与玉龙县滑坡灾害实际发生情况一致,可为玉龙县滑坡灾害防治与预测提供参考意见。
使用自然断点法将玉龙县滑坡易发区分为5级,其中极低易发区、低易发区和中易发区的面积占比分别为48.96%、23.11%、7.97%,主要分布在在人类活动影响较小的东南和西南部。高易发区和极高易发区面积占比为10.01%、9.95%,主要分布在人口比较密集的北部、东北和西北部,部分沿着金沙江边缘以及玉龙县主要道路两旁发育,滑坡整体呈条带状分布。
4.2 讨论
滇西北地区自然环境复杂,滑坡、泥石流等山地灾害频繁发生,预测滇西北滑坡灾害易发生区,有利于强化隐患排查和危险评估,提升灾害应对能力。本研究利用127个滑坡分布点和12个环境变量,通过MaxEnt模型和ArcGIS对丽江市玉龙县的滑坡易发区进行预测,其中MaxEnt模型的AUC值大于0.9,模拟结果具有较高的可信度和精确度;同时采用Jackknife检验评估12个环境变量对预测结果的重要程度,确定了海拔、坡度、距水系距离是影响当地滑坡灾害发生的主要环境变量。
滑坡灾害的发育和发生与河流的特征有密切关系,河流通过其流水活动影响和改变地理环境。河流的流量、流速、水位等水情要素对滑坡的产生有一定的影响,且距河流不同的区域影响各不同[25]。研究中发现玉龙县的滑坡主要沿金沙江河谷两岸集中分布,形成滑坡分布密集带,结果与前人对该地区滑坡泥石流危险区划研究结论一致[18,26]。此外,距水系0~3 000 m滑坡易发性较高,距离水系越近,滑坡发生的概率越高,距离大于5 000 m后滑坡影响逐渐减少。因此,未来可将区域内主要河流缓冲区与滑坡进行叠加分析,为当地防灾减灾工作和灾害预测预报提供决策意见。
滑坡监测预警工作是近年来中国开展的一项动态研究工作。作为长江上游地区水土流失的一种特殊形式,其分布广泛,活动频繁,但由于受物力、财力和其它条件的限制,难以全部进行监测预警。而金沙江是长江上游的重要来沙河流之一,为有效遏制滑坡灾害发生带来的生命安全问题,未来玉龙县政府可在滑坡危险区划的基础上,采取在滑坡中、高、极高易发区树立标志牌措施,并重点监督滑坡易发区的生产建设活动,对重大灾害隐患进行监督预警,不仅可以积极推进当地的防灾减灾工作,也可以积极推进整个长江上游地区的水土保持工作。
在全球变暖的大背景下,全球气候变化对极端天气事件(极端降雨、气温升高、强风和洪水灾害)的影响尤为强烈,增加了地质灾害发生的风险,为预报灾害的发生带来新的挑战。通过研究,气候变化对滑坡活动有着重要影响,直接影响因素是降水和温度变化,降水变化会导致降雨频率、降雨周期、降雨强度改变,而气温持续上升,将会导致大气中水分不断增加,蒸发作用增强,降水和气温的变化也是相辅相成、互相影响的,这些改变会使地表斜坡的稳定性产生变化,从而影响地下水位变化和岩土体的稳定性[27]。因此,今后在对地质灾害进行预测预报的同时,还应关注气候变化下新的灾害发生趋势,及时发现新的灾害易发区,采取合理措施确保人民的生命和财产安全。