基于随机森林的川藏铁路沿线县域地质环境承载力评价
2022-09-29支泽民陈琼周强夏兴生刘峰贵
支泽民,陈琼,周强,夏兴生,刘峰贵,2*
(1.青海师范大学地理科学学院,西宁 810008;2.高原科学与可持续发展研究院,西宁 810008)
随着社会经济的快速发展,人类活动对于自然环境的改造作用逐渐加剧,对于地表形态的改造趋势增强,社会发展与自然环境之间的矛盾日益突出,逐渐成为区域社会发展的重要制约因素[1]。为科学合理对区域开发进行指导,对区域内资源环境承载力的合理评估就变得极为必要,而资源环境承载力包括资源承载力与环境承载力,其中环境承载力又包括水环境承载力[2-3]、土壤环境承载力[4]以及地质环境承载力[5-6]等,其中又以地质环境承载力为承载力之根本。作为人类社会经济活动的基础,地质环境的好坏直接关系到人类社会经济的发展方向与发展速度。
目前,关于地质环境承载力方面的研究较为成熟,主要包括区域地质环境承载力[7-8]、城市地质环境承载力[9-10]以及矿山地质环境承载力[11-12]等,多通过构建地质环境承载力评价指标体系,对指标进行合理量化,从而实现地质环境承载力的评价。汪宙峰等[8]选取都汶公路沿线区域,通过层次分析法确定指标权重,对公路沿线区生态地质环境承载力进行评价,揭示了区域生态地质环境承载力的影响因素与空间分布;杨盼盼等[9]选取2010年、2013年以及2017年临潼区23个街道的面板数据构建了行政区划级别的城镇化—地质环境耦合协调度概念模型,对地质环境的时空演化规律进行了分析;何芳等[12]基于不同时期的高分影像从木里矿区的地质环境背景、地质环境破坏以及地质环境恢复等多个层面对矿区地质环境承载力进行评价,揭示了矿区地形地貌以及土地资源等破坏状况,为矿区修复治理提供了可靠的基础资料。尽管目前对于地质环境承载力的研究较多,但多集中于中东部区域,针对西部高原地区的相关研究较少。且受高原地区冻土分布的影响,地区地质环境承载力评价体系有待修正,很多研究在进行地质环境承载力时未能将其考虑在内,使得高原地区地质环境承载力的评价存在缺陷。为此,在综合其他区域地质环境承载力指标的同时,加入冻土分布这一极具区域特色的评价指标对川藏铁路沿线县域这一重要区域进行评价。
川藏铁路的建成对于西藏地区社会经济的崛起具有极其重要的战略地位[13],其沿线地质地貌环境复杂,人类活动日渐加剧,而目前关于川藏铁路沿线地质环境承载力的研究较少。因此,对于川藏铁路沿线地质环境承载力的评估就变得及其重要。选取川藏铁路沿线县作为研究区,基于随机森林模型,构建包含地貌环境、地质环境、生态环境以及社会环境4个准则层12个指标的川藏铁路沿线县域地质环境承载力评价指标体系,受该区域主要位于青藏高原这一特殊地理位置的影响,加入冻土的空间分布作为评价指标,该指标的选取可很好地契合本区域实际地质环境。同时,结合地理信息系统(geographic information system,GIS)空间分析对川藏铁路沿线县域地质环境承载力进行评价,以期获得川藏铁路沿线县域的地质环境承载力空间分布状况,明析其地貌、地质以及社会等多环境质量空间分布,从而为川藏铁路沿线周围县域的社会经济发展与灾害防治提供参考依据。
1 研究区
川藏铁路自东由四川省成都起,向西经过雅安、康定、昌都、林芝、山南,至西藏拉萨结束,全长1 543 km[13],是一条由横断山高山峡谷区向青藏高原内部延伸的铁路干线,横跨扬子板块、川滇地块、羌塘地块和拉萨地块等大地构造单元[14],翻越4 000 m海拔以上高山8座,跨过7条大江大河,分布有龙门山断裂、鲜水河断裂、玉农希断裂等众多区域性活动断裂[15],地质、地貌环境复杂(图1),活动断裂密集,地层活动较为活跃,地震烈度较为强烈,沿途自然灾害频发,尤其是地质灾害[14,16-18],且随着铁路线自东向西向高原内部的延伸,冻融侵蚀风险极大,以未完工林芝—雅安段较为严重[19]。同时,随着中国西部大开发战略的推进,川藏铁路沿线的人类活动强度更是逐年增大,城镇用地扩张显著[20]。在自然环境与人类活动的共同作用下,川藏铁路沿线脆弱的地质环境极易遭到不可逆的破坏。因此,对于川藏铁路沿线县域地质环境承载力的研究就显得极为重要。选取自雅安市出发的川藏铁路经过的33个县区作为研究区,对其沿线县域的地质环境承载力进行评价。
图1 研究区概况图Fig.1 Overview of the study area
2 数据与方法
2.1 数据来源
数据主要以地质、地貌、冻土分布、降水、地质灾害数据等数据为主,以基础地理信息数据为辅,通过野外调查与网络收集等多渠道、多方式对数据进行获取。其中,地质灾害点数据来自野外调查与网上资料收集,同时,笔者参加第二次青藏高原综合科学考察项目对调查数据进行部分点的验证,主要包括八宿县、卡若区、江达县、类乌齐县等地区大型灾害点;工程岩组数据、断层数据来源于中国地质调查局1∶2 500 000中国地质图(https://www.cgs.gov.cn/),矢量数据,为使岩性数据可带入指标体系中,参考已有相关研究[21-23]对工程岩组进行赋值划分(表1);海拔高程数据分辨率为30 m,来源于地理空间数据云平台(http://www.gscloud.cn/home)的ASTER GDEM 30 m数据,坡度与地形起伏度数据基于高程数据通过ArcGIS10.7平台提取获得;年降水量数据为2017—2019年全国降水量数据所取平均值,栅格数据,分辨率为1 km,来源于国家地球系统科学数据中心(http://www.geodata.cn/);冻土及冻土类型分布数据来源于青藏高原国家科学数据中心(http://data.tpdc.ac.cn/zh-hans/),栅格数据,分辨率为1 km;人口密度数据来源世界人口数据网站world pop(https://www.worldpop.org/),栅格数据,分辨率为100 m;归一化植被指数(normalized difference vegetation index,NDVI)数据来源于中国科学院资源环境科学与数据中心(https://www.resdc.cn/),栅格数据,分辨率为1 km;各级行政区划、河流等数据以及道路密度与居民点密度数据来源于全国地理信息资源服务系统(https://www.webmap.cn/main.do?method=index),矢量数据,通过ArcGIS10.7进行密度分析获取。其中,地质地貌数据、降水数据、冻土类型分布数据以及人口、道路等数据均为构建川藏铁路沿线地质环境承载力评价指标体系的指标数据,行政区划数据用以确定研究区范围。
表1 岩性赋值表[21-23]Table 1 The assignment Table of lithology
2.2 研究方法
主要以随机森林模型(random forest,RF)对指标层数据进行权重确定,属于组合式的深度学习方法[24],作为一种较为常用的机器学习方法,是一种分类回归树的数据挖掘方法[25],该模型结合了回归树、随机选择和装袋的算法思想[26],在解决非线性问题上具有较大的优势[27]。同时,该方法对于运算数据的要求较低,对于多要素类的问题研究可定量提供解释变量对于被解释变量的贡献率与重要性程度,即可确定其权重。因此,对于构建指标体系的相关研究来说,较为合适,且对于被解释变量的影响因素的分析也具有一定的便利性,准确性相对更高更具有客观性[28]。与其他机器学习算法相比,随机森林模型对于模型运算中产生的噪声与异常值具有较高的容忍度[24,29],应用十分广泛,包括生态风险[27]、灾害易发性[28]、金融相关[30]、灾害风险[31]等研究。主要使用R 4.0.4环境下的R studio编译器调用RF软件包进行迭代运算,其原理如图2[28]所示。
CART(classification and regression tree)为分类回归树;OOB(out of bag)为袋外误差图2 随机森林模型原理图[28]Fig.2 Schematic diagram of random forest model[28]
3 指标体系构建
3.1 评价指标构建
地质环境承载力评价指标的选取对于研究结果的准确度至关重要,其目标是协调人地之间的关系,合理的指标选取可使评价结果更接近实际状况。参考文献[32-35],根据研究区实际区域环境特征,综合考虑数据的可获取性,构建川藏铁路沿线地质环境承载力评价指标体系。从川藏铁路沿线各县的地形地貌条件、地质环境条件、社会经济条件以及生态环境4个准则层分别选取海拔、坡度、地形起伏度、断层密度、工程岩组、冻土分布、历史灾害点密度、植被覆盖指数、年均降水量、人口密度、居民点密度、道路密度作为评价指标,构建川藏铁路沿线各县地质环境质量评价指标体系(图3)。
图3 地质环境承载力评价指标体系Fig.3 Geo-environmental carrying capacity evaluation system
作为制约区域社会经济发展的重要因素,地质环境承载力的大小受到多种要素的影响。文中地貌环境利用海拔、坡度以及地形起伏度表征,其与地质环境承载力的大小呈负相关关系。地质环境包括断层密度、工程岩组、冻土的分布以及历史灾害点密度,其中历史地质灾害点对于地质环境质量、地质环境承载力具有极好的表示意义,当某一地区地质灾害发生较多时,则表明该区域地质环境质量较差,地质环境承载力较低。生态环境利用归一化植被覆盖指数NDVI和年均降水量表示,川藏铁路沿线区域海拔较高,除林芝、波密等县外,其余地区均降水量均较少,因此,降水量成为区域生态环境变化的限制因素。社会环境指标包括人口密度、居民点密度和道路密度,随着区域内社会经济的快速发展,人类活动对于区域地质环境承载力的占用逐渐增大,而人口、建筑以及道路等指标可较好地的表征人类生产活动的强度(图4)。
图4 地质环境承载力评价指标空间分布Fig.4 Spatial distribution of Geo-environmental carrying capacity evaluation indicators
3.2 指标分级
不同指标对于地质环境承载力的贡献存在差异,评价指标中既存在数值量,又存在类型量,各数值指标之间存在较大差异,为去除数值量与类型量指标之间的差异,且为避免对冻土分布和工程岩组岩性等类型量指标的人为赋值所造成的实验误差,体现计算的科学性,在进行计算前对数据进行了预处理,进行等级划分。同时为体现指标分级的客观性,数值量指标采用“自然裂点法”将各个指标划分为5级,分别为 “差”“较差”“中等”“较好”以及“好”,等级“差”赋值为1,“较差”赋值为2,“中等”赋值为3,“较好”赋值为4,“好”赋值为5,以便进行下一步计算。类型量指标主要包括工程岩组硬度和冻土的分布,其中工程岩组硬度参照文献[21-23]关于工程岩组岩性硬度的划分将其划分为5级(表1),坚硬岩类、较坚硬岩类、较坚硬-较软弱岩类、较软岩类、软岩类。冻土分布数据则依据冻土类型特点将未分布冻土等级划分为“好”,多年冻土划分为“中等”,季节性冻土划分为“差”3个等级。其中,海拔、坡度、地形起伏度、断层密度、历史灾害点密度、年均降水量、人口密度、聚居民点密度、道路密度为负向指标,年均降水量与NDVI为正向指标,据此,等级划分如表2所示。
3.3 指标权重确定及评价
首先,对各个指标数据进行处理,将不同分辨率的栅格数据统一重采样为1 km分辨率,将矢量数据通过“密度分析”工具转化为1 km分辨率栅格数据,后依据评价指标分级标准(表2)对各指标数据进行重分类,并分别赋值。同时,考虑到研究区域面积较大,选取常用的正方形格网法进行地质环境承载力评价。创建分辨率为1 km的格网对研究区地质环境承载力进行评价,将其划分为177 107个评价单元,并对每个格网对应各指标的类型赋值进行提取。利用ArcGIS“加权求和”工具将各准则层包含指标进行加权求和作为随机森林模型中的目标变量,将各指标作为预测变量。随机选取70%的评价单元代入随机森林模型进行运算,30%的评价单元进行模型验证。随机森林模型的构建中,回归树的数量ntree与树节点mtry作为随机森林的重要参数,通过设置不同的ntree与mtry值,从而计算出不同随机特征数下的随机森林的袋外误差OOB[28],OOB袋外误差越小,模型预测精度越高[27],而后通过%IncMSE值进行重要性分析,基于其重要性程度确定指标层权重(表3)。经过多次重复调试,地貌环境和地质环境准则层设置ntree=800,mtry=5,生态环境与社会经济环境准则层ntree=900,mtry=5,模型整体方差解释率R2均大于0.80,误差Error均小于0.01。
表2 评价指标分级标准Table 2 Evaluation index grading criteria
表3 评价指标权重Table 3 Weights of evaluation index
确定各指标及准则层权重后,将各个指标基于ArcGIS“栅格计算器”进行叠加得到川藏铁路沿线县域各准则层,将各准则层进行叠加计算后得到川藏铁路沿线县域地质环境承载力分布,可表示为
(1)
式(1)中:Q为地质环境承载力;Ri为影响地质环境质量的准则i;wi为准则层i的权重;n为准则层个数。
4 结果分析
4.1 地质环境承载力评价
根据式(1)对各指标层数据与准则层数据进行计算,分别得到川藏线县域地貌环境、地质环境、生态环境、社会经济环境以及地质环境承载力空间分布(图5)。
图5 评价结果空间分布Fig.5 Spatial distribution of evaluation results
结果表明,川藏铁路沿线县域地貌环境总体上表现较好,以中等地貌环境及较好地貌环境分布最多范围最广,面积最大,占比达84.46%;地貌环境较差区域主要分布于研究区西部波密县、加查县区域;等级为好主要分布于研究区东部雅安市城区、芦山县、荥经等县以及研究区内大江大河流经所形成河谷地区,区内坡度较小,海拔较低,地形起伏度不大,相对较为平坦,有利于人类活动展开,从而使得该类型区域地貌环境总体表现较好[图5(a)]。
川藏铁路沿线地质环境与地貌环境空间分布不同,地质环境较好的区域主要集中于研究区西部波密县、米林县、加查县以及拉萨市区周边区域;中等及以上地质环境区域面积占比为75.76%;地质环境差、较差区域面积占比24.24%,主要分布于研究区中东部八宿县北部、卡若区、察雅县以及康定市、天全县、宝兴县等区域,该区域工程岩组岩性硬度整体偏软,活动断层分布密集,地质活动频繁,且由于该区域主要分布季节性冻土,伴随着全球气候变化的加剧,冰川及冻土消融整体呈现加剧的趋势,区域地质环境整体偏差[图5(b)]。
川藏铁路沿线县域生态环境整体偏好,中等及以上生态环境占比84.15%,生态环境分布趋势自西向东整体呈现“好-差-好”,中部区域八宿县及波密县北部区域生态环境表现较差。通过分析我们可以发现,波密县北部区域坐落于念青唐古拉东段南麓,海拔整体偏高,冰川发育完全,造成县域北部区域植被覆盖相对较差,生态环境相对较差,而八宿县属于高原温带半干旱季风性气候,日照足,蒸发量大,同时受到怒江干热河谷影响,年降水量较小,植被发育差。因此,该区域生态环境也相对较差[图5(c)]。
社会环境作为地质环境承载力评价的负向因子,即社会环境越好,表明该区域交通条件较差,人类活动强度较小,对地质环境承载力影响较小,从而表示该区域的开发潜力较大[33]。川藏线县域社会环境“差”“较差”占比仅为1.45%,且在空间分布上主要分布于雅安市周围以及拉萨市周边,该区域作为川藏铁路沿线周边发展较快的城市,人口分布较多,城市化程度较高,导致其社会环境较差,在保证地质环境质量的前提下的发展潜力较小;中等以上社会环境占比达到98.55%,较好、好的社会环境面积占比更是达到81.24%,从理论角度来讲,该区域社会环境对于地质环境质量的影响是极小的,区域发展潜力极大,但由于川藏铁路沿线自然环境条件的限制,仅有部分河谷区域适合发展[图5(d)]。
将地貌环境、地质环境、生态环境以及社会环境按照准则层权重进行叠加分析得到川藏铁路沿线地质环境承载力分布结果如图5(e)所示。总体上,东部地质环境承载力较差,西部地质环境承载力较好的特征。从面积分布来看,川藏铁路沿线地质环境承载力以中等最多,占比达到66.69%,从其空间分布看,中等质量在整个研究区域都有分布,较集中分布于曲水县、扎囊县、贡嘎县等山南市大部以及巴塘县、理塘县和雅江县等川西高原区域,其余呈现出零星分布的特征;其次,地质环境承载力较差面积占比达18.40%。在其空间分布上,较差质量主要分布于研究区中部八宿县、察雅县和卡若区以及宝兴县、堆龙德庆区、林周县区域;较好质量面积占比为14.90%,主要分布于米林县、巴宜区以及雅江县中南部[图5(e)]。
4.2 影响因素分析
根据上文提到的随机森林模型的优点之一,由模型可以得出指标因子的重要性程度,通常将重要性程度作为计算的权重,基于这一特点,本研究对川藏铁路沿线县域地质环境承载力影响因素进行分析。将各准则层与指标层重要性程度进行统一标准化处理,可以得到川藏铁路沿线县域地质环境承载力影响因子重要性程度(图6)。
图6 川藏铁路沿线地质环境承载力指标重要性程度Fig.6 Importance of geo-environmental carrying capacity indicators along the Sichuan-Tibet Railway
工程岩组作为地质环境质量重要的指标,岩土体类型不同导致岩性硬度及其应力分布就存在不同,对地质灾害的发生与可承受人类活动强度产生影响。川藏铁路沿线工程岩组主要表现为西部地区岩性硬度较硬,卡若区、八宿县至东部康定市这一区域岩性硬度较软。由图6可知,工程岩组对于地质环境承载力的影响为所有指标占比最大,为重要性程度最高的指标。由于该区域位于青藏高原东缘,地壳运动较为活跃,活动断层对于地质环境承载力的影响也相对较大,在地质环境承载力表现较差的八宿县、察雅县一带,班公错-怒江断裂、日土-丁青主断裂横横亘近东西,从而导致该区域地质环境质量较差。NDVI作为常用表征植被覆盖指数的指标,数值越大,表明该区域植被覆盖度越好,则植被对于地表松散物质的固着能力越强。同时,其涵养水分能力也较高,从而对于地质环境承载力的提高具有显著正向作用;根据图6知,NDVI作为影响川藏铁路沿线地质环境承载力的第二大影响因素,对于沿线地质环境承载力的影响较大。其次,川藏铁路沿线近年来,随着区域社会经济的发展,基础设施建设逐渐完善,在川藏铁路建设完成前,川藏公路作为内地进入西藏的主要途径,道路的修建往往会破坏区域原有的地貌形态,从而使其应力结构发生变化。又道路的修建必然加大车辆的流动,车辆扰动的影响增大,从而导致道路密度成为影响地质环境承载力的重要指标。其他影响因素重要性排序依次为海拔、人口密度、坡度、地形起伏度、年均降水量、冻土类型的分布以及居民点密度与灾地质灾害点密度。
4.3 评价结果验证
根据地质环境承载力的指标构成以及其对于人类社会发展的影响,当地质环境承载力较好时,地貌环境、地质环境、生态环境以及社会环境均相对较好。在此背景下,区域内地质灾害的发生于区域地质环境承载力的大小呈明显的负相关关系。因此,本文选取地质灾害的发生数量在地质环境承载力等级的占比对地质环境承载力评价结果进行验证。通过统计分析,川藏线沿线县域共发育地质灾害点3 863处,主要发育于地质环境承载力“较差”“中等”“较好”3个等级区域,其占比分别为17.32%、72.17%以及10.51%。基于此,认为该研究地质环境承载力评价结果合理,具有一定的科学性,符合实际。
5 结论
从川藏铁路沿线县域实际出发,从地貌环境、地质环境、生态环境和社会环境四个准则层选取12个评价指标,同时,考虑到青藏高原独特得到冻土分布状况,选取冻土分布作为地质环境承载力评价的指标因子,构建了川藏铁路沿线县域地质环境承载力评价指标体系,通过随机森林模型对各个指标进行权重赋值,利用GIS空间分析对川藏铁路沿线县域地质环境承载力进行评价,得出结论。
(1)川藏铁路沿线地质环境承载力受区域地质背景即工程岩组与活动断层的影响较大,其次,以NDVI为代表的生态环境对川藏铁路沿线的地质环境承载力影响也比较大,因此,在改善区域地质环境质量时应该着重生态修复。
(2)川藏铁路沿线县域地质环境承载力总体表现良好,中等质量以上区域面积占比超过了60%,且质量较差区域主要集中于八宿县、察雅县一带,面积占比相对较小,除已经建好的“成雅段”与“拉林段”铁路外,雅安至林芝路段铁路修建中应该尤其注意八宿县、察雅县一带。同时,在后期川藏铁路的维护过程中还应注重加强地质灾害监测与预警,提高区域防灾减灾能力,为区域社会经济发展保驾护航。