基于GEE 平台的1991—2020 年环洱海地带土地利用时空变化分析
2021-12-14李小祥黄亮李凯
李小祥,黄亮,2,李凯
( 1. 昆明理工大学 国土资源工程学院, 昆明 650093;2. 云南省高校高原山区空间信息测绘技术应用工程研究中心, 昆明 650093 )
0 引 言
洱海作为云南第二大淡水湖,是大理人民的生命源泉,也是云南省乃至全国的重要战略资源储备基地. 作为我国重点保护湖泊“新三湖”之一,其保护治理一直受到国家及地方政府的高度重视,习近平总书记在2015 年考察云南时,对洱海的保护治理提出明确要求和殷切期望. 多年来洱海一直是“全国城市近郊保护得最好的湖泊”之一,而近三十年来,伴随着我国城镇化进程快速推进,环洱海地带社会经济发展迅速,不合理的环境保护与经济发展关系逐渐突出,人类活动、自然因素等共同作用使洱海地区土地利用现状出现了不同程度的变化,林地和湿地面积减少、建筑物扩张等. 研究洱海地区土地利用/覆盖变化(LUCC)有助于科学制定土地政策,合理调整土地利用结构.
随着遥感技术更新迭代,遥感影像的空间分辨率向亚米级迈进,时间尺度也逐渐提升,中国已进入海量遥感数据时代[1]. 但由于存在影像收集、存储、处理繁琐,数据运算耗时长等问题,传统的遥感方法研究对大范围长时间序列的遥感影像使用较少. 遥感云计算平台的出现有效地避免了这样的缺陷,与传统的遥感数据处理、空间分析方法相比,谷歌地球引擎(GEE)平台云端处理海量数据,勉去了繁杂的数据下载和预处理工作,且能高效地结合辅助数据进行分析研究,近年国内外学者基于GEE 开展土地利用覆被的研究逐渐增多. 如胡云峰等[2]基于GEE 平台上Landsat影像分析了北京市LUCC 变化规律,得出了北京市耕地、人造地表面积变化的驱动机制;娄佩卿等[3]基于GEE 获取研究区1998—2018 年土地利用数据,定量分析京津冀的土地利用演变规律,并利用当量估算方法定量地估算京津冀地区的生态服务价值(ESV);PHAN T N 等[4]基于Landsat8地表反射率数据(L8sr),利用GEE 平台进行影像合成后的8 个数据集获取蒙古某区域的土地覆盖图,对多云、多雪覆盖区域的土地利用分类问题进行了分析讨论. 而针对洱海地区生态保护与经济发展之间的问题,一些学者已对洱海周边LUCC 变化及生态风险评估进行了相关研究. 如许泉立等[5]利用蚁群智能算法模拟洱海流域土地利用变化,推断出2010—2020 年流域主要的人地矛盾会集中表现为城镇用地不断扩张,以及耕地面积持续性减少;王天山等[6]基于1990—2014 年4 期遥感数据采用遥感(RS)、地理信息系统(GIS)、地理学和景观生态学的分析方法,分析洱海周边土地利用及景观格局变化,总结出区域内经济迅速发展、城镇用地扩张、景观内部生物多样性降低等是导致洱海地区人地矛盾突出的主要原因;王涛等[7]基于1995—2015 年3 期Landsat 影像解译数据,对洱海流域生态风险时空变化及其演化机制进行了分析,并得出土地利用类型演变、人类活动、城镇化推进是流域高生态风险等级区域增多和转移的重要原因;张磊等[8]构建缓冲区与土地利用动态演变模型,分析探究大理洱海东环路沿线区域1997—2015年的土地利用变化特征.
综上所述,众多研究者运用不同的研究方法对洱海地区不同范围、不同时间序列的LUCC 过程及其驱动力进行分析. 但多以洱海流域为研究区域,研究时限跨度较短,且分析洱海地区LUCC 与人类活动耦合关系的研究较少,以及对洱海地区Landsat 影像存在的云遮挡问题无法有效地处理. 鉴于此,本文以环洱海地带为研究区域,基于GEE 平台解译1991—2020 年长时间序列Landsat 影像,并结合土地利用图谱、人类活动强度指数分析洱海周边人类活动强度及LUCC 变化,旨在缓解洱海周边人地矛盾、生态与资源保护上提供科学合理的参考.
1 数据与方法
1.1 研究区概况
洱海(100°05′E~100°17′E , 25°36′N~25°58′N)位于云南省西北部,北起洱源,南至大理下关,多年湖泊平均水面面积约246 km2,是大理人民生活用水和工农业生产用水的源泉,同时具有调节区域气候、发展渔业、推动旅游等多种功能. 洱海地处山谷盆地,四面环山,地势北侧高于南侧,山地平均海拔西侧高于东侧. 据2017 年资源统计,洱海流域生产总值达450.55 亿元,近十年间GDP 平均增速超过10%,尤其是环洱海地带,一度成为云南省经济发展较快的区域. 图1 为实验选取沿洱海湖面10 km 的范围作为研究区域.
图1 研究区及局部区域位置
1.2 数据来源及处理
研究基于GEE 平台提供的7 个时段Landsat TM(1991、1995、2000、2005、和2010 年)及Landsat OLI(2015、2020 年)的地表反射率(SR)数据为基础数据,其中7 期影像拍摄时间均在同年2~4 月. SR 数据已经过了几何校正、大气校正等预处理,同时数据中包含质量评估波段质量保证(QA),该波段依据CFMask 算法[9]标注了每个像素质量. 利用ArcGIS对洱海湖面进行缓冲区分析得到研究区域矢量数据,再将矢量数据上传至云平台对7 期遥感影像进行裁剪处理.
由于研究区域西侧Landsat 影像常年存在云量覆盖,因此,影像筛选春季云量较小的影像为主影像,利用(同年、间隔1 年)春季时段的多景影像,结合QA 波段剔除主影像中质量差的像元,实现影像去云.TM、OLI 影像分别选用B7-B4-B1 及B6-B5-B2 波段组合进行地物解译,但由于地表反射率(SR)数据彩色不饱和、地物图像层次差的情况,还需要对组合波段数值量化值(DN)进行调整. 利用GEE 提供的polynomial 函数对Landsat 蓝色波段进行非线性调整,从而增强影像对比度. 图2 以2015 年数据中的局部区域,对比度增强为例.
图2 影像对比度增强
1.3 研究方法
1.3.1 分类体系
参照《土地利用现状分类》(GB/T21010—2017)及大理市2012 年、2019 年土地利用变更数据,同时考虑环洱海地区土地利用程度及特点,将研究区土地利用类型划分为六个一级类型:林地、草地、耕地、水域,建设用地和湿地等六类.
1.3.2 随机森林分类算法
随机森林(RF)是Leo Breiman 于2001 年提出的一种机器学习算法,它由若干Bagging 集成学习技术训练得到的决策树构成[10]. RF 分类算法有很高的分类精度,对异常值和噪声有较好的稳健性,同时具有实现简单、运行快速、泛化能力强等优点[11],相关文献[12-14]已证实该方法被国内外学者广泛应用于土地利用分类. 其分类原理为:1) 有放回地从原始训练样本中随机抽取样本,合成T个样本集去构建决策树;2) 在构建决策树时随机选取F个特征参数,输入决策树节点作为约束条件;3) 结合每颗决策树的预测结果,利用投票方式决定最终分类结果.
1.3.3 训练样本及特征选取
选用中国多期土地利用土地覆被遥感监测数据集(CNLUCC)[15],以及全球30 M 地表覆被数据集(GLC30-2010,GLC30-2000),用于结合影像完成前3 期影像样本点的选取,后几期样本选取主要参照Google Earth Pro 软件中高分辨率影像.
考虑到研究区域一部分背阳坡植被与水体、裸露地表与建筑区呈现近似的光谱信息,为获得较优的分类结果,本文在选取Landsat 影像的蓝色、绿色、红色、近红外、短波红外(SWIR 1 和SWIR 2) 波段等6 个光谱特征外,引入归一化建筑指数(NDBI)、归一化差异水体指数(NDWI)、增强型植被指数(EVI)、以及30 M 分辨率数字高程数据(GDEMV2 30M)等特征作为随机森林算法的训练变量. 其中CNLUCC 源于中科院资源环境科学数据中心(http://www.resdc.cn),GDEMV2 30 M 源自地理空间数据云(www.gscloud.cn). 三种指数的计算公式如下:
1.3.4 土地利用变化图谱
地学信息图谱是一种旨在实现区域可持续发展的时空复合分析方法,将多维时空的土地利用/覆被变化信息以图谱单元进行可视化,能定量表现多时空条件下“空间格局”及“时序特征”[16]. 土地利用变化图谱代数运算公式为
式中:N为研究阶段内土地利用变化模式的图谱单元编码,比如编码0-1-2 表示土地变化过程为林地→草地→耕地;A、B、C分别为1991、2005、2020 年土地利用类型的编码.
在分析研究区1991—2005、2005—2020 两个阶段土地利用变化图谱情况下,结合环洱海地区的实际地类变化情况,将研究区土地利用变化模式划分为5种图谱变化模式:1) 稳定不变型,1991—2005 年和2005—2020 年两个阶段土地利用变化类型均未发生变化,如3-3-3 表示水体→水体→水体;2) 后期变化型,仅后一个阶段(2005—2020)土地利用变化类型发生变化,如0-0-1 表示林地→林地→草地;3) 前期变化型,仅前一个阶段土地利用变化类型发生变化,如0-4-4 表示林地→建设用地→建设用地;4) 反复变化型,研究起始与结束年份土地利用类型一致,如1-0-1 表示林地→草地→林地. 5) 连续变化型,两个阶段土地利用类型都发生不同的变化,如2-1-0 表示耕地→草地→林地.
1.3.5 人类活动强度指数评估模型
从人与自然的角度看,人类活动强度是指一定面积的区域受人类活动影响而产生的扰动程度[17]. 不同区域人类活动程度差异大,而人类活动的强弱对土地利用类型演变的速度影响不同. 本文采用人类活动强度指数(HAI)来直观地分析研究区人类活动强度的时空分布,HAI 具体公式为
式中:HAI为人类活动强度指数;N为土地利用类型种类;Ai为第i种土地利用类型的面积;Pi为第i类土地所反映的人类活动强度系数;TA为土地利用总面积. 参考文献[18-19]中各地类人类活动强度系数,确定研究区各土地利用类型对应的人类活动系数,如表1 所示,将其代入人类活动强度指数评估模型进行计算.
表1 不同土地利用类型人类活动强度系数
2 结果与分析
2.1 分类结果精度评定
精度评定采集验证样本集耕地样本30 个、建设用地样本25 个、林地样本30 个、草地样本25 个、水域样本20 个、湿地样本15 个. 表2 依据验证样本对7 期遥感影像分类结果进行混淆矩阵计算,得到精度评价指标OA、Kappa. 其中OA、Kappa 系数计算公式如下:
由表2 可知,基于GEE 平台随机森林分类方法解译结果总体精度达91.5%以上,Kappa 系数均高于0.88,为后续研究提供了精度保障.
表2 1991—2020 年环洱海地带土地利用分类精度评价
2.2 土地利用时空变化分析
2.2.1 研究区土地利用数量变化分析
1991—2020 年环洱海10 km 范围内各土地利用类型时空分布如图3 所示,结合表3 可以看出,环洱海地区在1991—2020 年土地利用类型存在较大的差异. 纵观30 年间环洱海地区土地覆被类型以林地、耕地、水域为主,占研究区域总面积的80%以上,空间分布层次鲜明,从中心至边缘分别为水域、耕地、林地. 从总体来看,在1991 年,环洱海地区林地、草地、耕地、水域、建设用地、湿地分别占研究区总面积的34.42%、13.15%、32.78%、16.02%、3.26%和0.37%.截至2020 年,林地、草地、耕地面积减少至33.47%、11.86%、31.61%;水域面积变化幅度较小,减少的面积比例为0.3%;建设用地面积增幅较大,相比1991 年增长了3.47%;湿地占地面积总体基数较小,占总面积比例为0.62%.
表3 1991—2020 年环洱海地区土地利用变化量
图3 1991—2020 年环洱海地带的土地利用分类结果
此外,对1991 年、以及1995—2020 年间每隔5 年的洱海湖面面积进行统计,分别为245.866 km2、239.688 km2、240.930 km2、241.482 km2、242.626 km2、243.431 km2、242.093 km2(研究区解译数据的航拍时间均处于枯水期),其中主要转出至湿地1.331 km2和耕地1.485 km2,反映出人类在湖滨区域围湖造田的活动,但从数据上看2005 年起湖面面积得到控制,表明了1999 年起大理州政府实施的“三退三还”等长期水环境保护战略的重大意义.
从三个阶段来看,草地在三个时段均呈现减少的态势,而建设用地则成相反态势,三个时段都呈现增加的趋势. 在1991—2000 年期间,草地、耕地、水域面积分别减少了20.38 km2、18.62 km2、5.71 km2,林地、建设用地和湿地面积分别增加了13.33 km2、28.46 km2、2.92 km2;在2000—2010 年期间,林地和草地分别减少9.93 km2、7.22 km2,耕地、水域、建设用地和湿地分别为增长9.86 km2、1.66 km2、2.42 km2、3.2 km2;在1991—2000 年期间,林地、草地和湿地面积分别减少了17.89 km2、45.99 km2、2.31 km2,水域减少量相对水域总面积较小,将其忽略不计,而耕地、建设用地面积增加了43.73 km2、23.14 km2. 将三个时段进对比分析,可以看出在2010—2020 年期间草地和耕地的变化量相比1991—2000 年、2000—2010年期间变化较大,但从其总体占比而言,草地和耕地后两个时段保持稳定,比例分别稳定在11.8%、31.6%,林地在相对总量上,三个时段变化趋于稳定.三个时期呈现主要原因在于2000 年城镇化进程加快,大理市得到了较大的发展,特别是大理下关、凤仪一带,独特的地理位置优势,建设用地的大幅扩张,进而使林地、草地面积减少. 另一方面,1991—2020 年间水域面积在前期减少,后期趋于稳定,而湿地变化复杂,但占比从1991 年的0.37%逐渐上升,至2010 年达0.77%,前期缩减是由于早期人类活动围湖造田、圈湖发展渔业有关,后期的稳定得益于国家及政府的宏观调控,及“三退三还”、“两取消”、“两禁”等政策水环境保护的贯彻实施.
2.2.2 环洱海地区土地利用空间变化分析
依据1991—2020 年环洱海地区各个时序土地利用数据及转移矩阵,建立土地利用变化图谱,分析洱海周边土地利用变化主要类型图谱特征. 如表4 所示,表中主要转移类型为该图谱变化模式下转移量较大的类型,其中连续变化型模式转移方式多,但转移量较分散. 从图谱变化模式来看,在1991—2020 年期间土地利用变化模式以稳定不变型为主,转移面积1 013.97 km2;后期变化型次之,转移面积为192.47 km2;然后为前期变化型,转移面积177.63 km2;反复变化型和连续变化型转移面积分别为92.44 km2、72.26 km2.总体数据来看,1991—2020 年间近65%土地保持稳定,近35%的土地类型在不同程度上发生了转变,但其中反复变化型、连续变化型转移率较小,表明环洱海地区在1991—2005 年、2005—2020 年两个阶段中土地类型变化趋于稳定.
表4 1991-2020 年环洱海地区土地利用变化模式图谱特征
从主要转移类型来看,稳定不变型的转移类型主要为“水体→水体→水体”,转移面积为240.9 km2;后期变化型的主要转移类型为“林地→林地→草地”和“耕地→耕地→耕地”,其转移面积分别为39.25 km2、35.54 km2;前期变化型的主要转移类型为“草地→林地→林地”和“草地→耕地→耕地”,其转移面积分别为33.96 km2、30.8 km2;反复变化型的主要转移类型为“耕地→草地→耕地”,转移面积分别为27.45 km2.连续变化型的主要转移类型为“耕地→草地→林地”,其转移面积为8.48 km2.
综合1991 年各土地类型面积,如表3 所示,稳定不变型中水体占比达97%,表明30 年来环洱海地区水域未发生太大变化,保持相对稳定;后期变化型中“草地→草地→耕地”、“耕地→耕地→建设用地”,以及前期变化型中草地向耕地、林地的转换,两种模式造成草地转向耕地、耕地转向建设用地的原因,主要是2000 年以来云南城镇化进程大大提高,人类活动对土地利用类型影响占比越来越大,大理市下关镇、凤仪镇等经济发展较快的地区建设用地扩张速度加快,使得耕地转向建设用地,而耕地的减少,又引发了毁林开荒等开辟农田的人类活动,最终出现林地、草地减少的去向与建设用地的新增来源呈现吻合状态. 连续变化型模式中总体转移面积小,但转移复杂且种类多,一定程度反映了洱海地区城乡建设过程中人类活动对土地的不合理利用及资源的破坏.
2.3 人类活动强度分析
为进一步分析城镇化推进对洱海地区土地利用覆被变化的影响,本文采用500 m×500 m 格网,将研究区划分成一系列子单元,分别计算各单元的HAT,利用ArcGIS10.3 对每个网格进行赋值并绘制人类活动强度空间分布图,如图4 所示,参考已有相关研究和研究区特征,将环洱海地区HAI 划分为5 类:高影响(HAI>0.8)、较高影响(0.6 由图4 可知,环洱海地区人类活动强度空间分布特征为:以低影响区为主;高影响区、中高影响区、低影响区分布较为集中,高影响区集中在环湖南侧,中高影响区主要分布于环湖西侧,低影响区主要分布在研究区外围,中低影响区和中影响区分布较零散. 从人类活动强度随时间变化趋势上来看,由于2000 年后城镇化速度加快,高影响区、中高影响区显著增加,环湖地区人类活动强度上升,沿湖地区兴起了许多城镇和村落. 总体来看,环洱海地区人类活动强度呈逐年增长趋势,特别在环湖南侧、环湖西侧最为明显,主要原因是环湖西侧有着平坦的地势、肥沃的土地,是早期的城镇、村落、农业用地、工业用地主要聚集地,随着三十年来城镇化进程推进,社会经济发展及人类更高层次生活的追求,该区域人口密度逐年上升,建设用地大幅扩张使得耕地面积减少,草地和湿地人为转移至耕地. 而环湖西北侧(上关镇)和东南侧(凤仪镇),早期相对环湖西侧地理条件不佳,但随着国家在城镇建设中对环湖东侧交通设施的大力投入,如大丽高速、大理机场等,东侧的地理位置优势逐渐凸显,为响应城镇化进程良性发展,同时要满足区域粮食安全保障,导致部分林草地、湿地向耕地转移,弥补了耕地转移为建设用地的空缺. 图4 环洱海地区人类活动强度空间分布图 本文研究基于GEE 平台和Landsat 影像数据,融合光谱、归一化差异指数和EVI 特征,以及高程信息等,利用随机森林分类方法实现了对洱海周边1991、1995、2000、2005、2010、2015、2020 年土地利用图的高效解译,采用土地利用变化图谱、人类活动强度指数分析环洱海地区各土地利用类型的时空变化及人类活动影响强度,主要结论如下: 1) 采用GEE 云平台及随机森林分类方法,对于长时间序列的土地利用分类具有显著的优势,总体分类精度均达到91.5%以上. 将本文1991 年、2015 年解译结果与CNLUCC (1990 年、2015 年)对比分析,林地、水域、建设用地面积基本呈现一致状态,耕地和草地存在的显著分类差异. 分析其原因:对遥感影像解译存在主观性的差异;研究区域内的地类划分种类不同,CNLUCC 未划分湿地,其有可能将湿地划分为耕地;CNLUCC 作为全国大区域土地利用覆盖分类,虽各省单独进行处理,但无法顾及局部区域气候、土地类型的独特性. 2) 综合7 期土地利用数据分析,环洱海地带土地覆被类型以林地、耕地和水域为主;1991—2020年间,地类之间转化频繁且复杂,转化频率较高的为耕地、林地、草地,其中耕地作为过渡类型,在林地、草地向耕地转入的同时,耕地转出至建设用地,使得林地、草地减少的去向与建设用地的新增来源呈现吻合状态;从转出与转入总量上分析,建设用地大幅扩张,林地和草地呈减少趋势,湿地呈现出先减少后增加的变化趋势,其中2010—2020 年研究结果与许泉立等[5]利用蚁群算法对洱海流域土地利用变化模拟的变化趋势相近,但环洱海地带建设用地的扩张速度得到了有效控制;洱海湖面面积变化幅度小,变化呈现先减小后趋于稳定的趋势,减少的部分主要转向湿地和耕地. 3) 环洱海地区人类活动强度以低影响区为主,低影响区集中分布于研究区外围,中高影响区在环湖西侧成片分布,高影响区主要分布于环湖南侧. 2000 年之前人类活动强度较低,2000 年后中高和高影响区显著增长,中影响区逐渐向中高影响区转变. 总体来看,环洱海地区人类活动强度呈稳定增长的变化趋势,尤其在环湖南侧这种变化最为明显,这与洱海地区城镇化率有密切关系. 本文借助GEE 平台解决了传统遥感解译费时费力的问题,通过选取有效的特征进行随机森林模型训练,避免了信息冗余造成过拟合,得到了较高精度的土地利用覆被数据,最后定量地揭示了城镇化进程下环洱海地区土地利用时空变化规律,对环洱海地带经济发展、国土空间规划和环境治理具有一定的参考价值. 但由于早期高分辨率影像难以获取,在解译过程中选取训练样本时,个人主观性影响较大,使得最终的土地利用覆被数据存在一定的偏差,在今后的研究中将考虑引入时序神经网络解决在现有的不精准先验知识下,模型有效地学习到整个研究时序的土地利用特征.3 结 论