APP下载

基于随机森林算法的土地利用动态变化分析

2024-04-14黎明杨征义江琪

现代信息科技 2024年1期
关键词:土地利用变化随机森林山东半岛

黎明 杨征义 江琪

DOI:10.19850/j.cnki.2096-4706.2024.01.038

收稿日期:2023-07-31

摘  要:为探究山东半岛土地利用的动态变化,文章以山东半岛为研究区,利用GEE平台,以Landsat遥感影像、DEM数据、光谱指数数据为基础,基于随机森林算法对1991—2021年山东半岛7期土地利用分类数据进行提取,并对山东半岛1991—2021年土地利用动态变化进行分析。分析结果表明:每期数据的OA指数均超过87%,Kappa系数均在0.85以上,说明随机森林分类算法分类精度可靠;建设用地、水域两类用地面积增加,耕地、未利用地、草地三类用地面积减少,林地面积整体变化较小,呈现较稳定的状态。研究结果有助于优化山东半岛的土地利用格局与生态环境保护。

关键词:土地利用变化;随机森林;山东半岛

中图分类号:TP391        文献标识码:A    文章编号:2096-4706(2024)01-0180-05

Analysis of Land Use Dynamic Changes Based on Random Forest Algorithm

LI Ming1, YANG Zhengyi2, JIANG Qi3

(1.Shandong Province Land Surveying and Mapping Institute, Ji'nan  250102, China; 2.Zhiyang Innovation Technology Co., Ltd., Ji'nan  255086, China; 3.Shandong University of Science and Technology, Qingdao  266590, China)

Abstract: In order to explore the dynamic change of land use in Shandong Peninsula, this paper takes Shandong Peninsula as the study area, and uses the GEE platform, based on Landsat remote sensing images, DEM data, and spectral index data, and extracts seven periods of classified data of land use in Shandong Peninsula from 1991 to 2021 based on the Random Forest Algorithm, and analyzes the dynamic changes of land use in the Shandong Peninsula from 1991 to 2021. The results of the study show that the OA index of each period data exceeds 87%, and the Kappa coefficients are above 0.85, indicating that the classification results of the Random Forest Classification Algorithm are reliable in terms of accuracy. The area of construction land and water area has increased, while the area of cultivated land, unused land, and grassland has decreased. The overall change in forest area is relatively small, showing a stable state. The research results contribute to optimizing the land use pattern and ecological environment protection in the Shandong Peninsula.

Keywords: land use change; Random Forest; Shandong Peninsula

0  引  言

土地資源是人类生存和发展的根本,是社会进步的物质基础[1]。随着我国城市化进程的加快,人们加速了对土地资源的开发与使用,不仅改变了土地覆被格局,而且深刻地影响着全球生态环境[2]。

随着全球人口的急剧膨胀,地球资源的快速消耗,如何缓解人类活动与生态环境间的矛盾冲突问题日益重要。而土地利用/土地覆盖变化(LUCC)正是一项人类社会经济活动与自然环境互动的研究,因此成为国际上全球变化研究的前沿和热门课题。近年来,高时空分辨率遥感影像在地表利用分类中的应用,使地表利用产品由原来的千米级向30米甚至更高的空间分辨率发展。欧洲空间局制作了一套哥白尼全球陆地植被数据集CGLS-LC100[3]。在国内,吴炳方等[4]编制了中国2000年和2010年的30米分辨率土地覆盖产品ChinaCover,并对中国10年间土地利用变化进行了分析。此外宋文杰等[5]以1965—2015年土地利用数据为例,分析了人为因素和政策因素对天山北坡区经济社会发展的作用。目前,国内外科学家在GEE平台上取得了一些进展。例如,Kelsey等人利用GEE研究了南卡罗来纳州和佐治亚州的萨凡纳河在1999、2005、2009和2015四个时期内出现的地表覆盖类型和分布[6]。Huang等[7]基于GEE平台,对北京地区的NDVI数据进行了时序分析,得到了2015年城市用地类型。桑国庆等[8]利用GEE云计算平台,结合Sentinel遥感影像,构建了湖南省高精度的水稻收获决策树模型,并在此基础上,获取了2017—2020年间的高精度水稻种植格局。朱德海等[9]基于GEE遥感数据,对山东省温室大棚进行纹理、时域、频域分析,采用随机森林方法,得到近30年来山东省温室大棚的空间分布规律及时空演变规律。

鉴于此,本文利用GEE云计算平台,以Landsat遥感影像数据为基础,结合DEM数据和光谱指数,基于随机森林算法,提取出山东半岛1991—2021年7期土地利用分类数据,利用空间分析工具制作空间对比图,分析山东半岛土地利用结构变化、土地利用动态变化、土地利用转移变化和土地利用景观格局变化等,对山东半岛1991—2021年土地利用时空演变特征进行研究,探讨其转化特征及规律。研究成果可为山东半岛城市发展提供数据支持。

1  研究区概况

山东半岛是中国最大的半岛,位于中国山东省的东侧,三面临海,西连华北大平原,北纬35°05′~

37°50′,东经119°16′~122°42′。该地区长290千米,宽190千米,总面积6.2万平方千米。山东半岛地形以平原丘陵为主,丘陵海拔多在200米左右。半岛东部有数条东北—西南走向的山脉,崂山为其最高峰,海拔1 130米。

山东半岛处在暖温带季风气候区,四季分明,具有明显的季节性和地域性特征。与同纬度内陆相比,受海洋的影响,气候更加温和。年平均温度变化范围为11~14 ℃,无霜期从西北向西南递增。山东半岛降水季节分布不均,夏季降雨量集中,约占全年降雨量的70%。山东半岛研究区概况图如图1所示。

2  数据来源、处理及研究方法

2.1  数据来源及处理

本研究基于GEE平台提供的1991—2021年间的山东半岛遥感数据,影像选取了当年5月至10月间Landsat 5 TM、Landsat 7 TM和Landsat 8 OLI影像数据。其中Landsat 5平台于1984年开始运行,它搭载了主题映射仪(TM)的传感器,可在不同波段中捕捉地球表面的图像,包括可见光、近红外和热红外波段。Landsat 7是在1999年发射的卫星,它搭载了一个增强型主题映射仪加(ETM+)的传感器,可以捕捉地球表面在多个波段上的图像,范围从可见光到热红外线。相比之下,2013年发射的Landsat 8搭载了两个传感器,分别是操作在可见光谱和近红外波段的OLI(Operational Land Imager)以及操作在热红外波段的TIRS(Thermal Infrared Sensor)。这两个传感器提供高分辨率、高重复性的数据,使科学家们能够更好地监测陆地表面的变化。本研究使用的所有Landsat图像数据均在GEE平台上直接获取。预处理的主要任务为影像去云、镶嵌与裁剪。

2.1.1  影像去云

本研究从Landsat數据集中选择了SR表面反射率产品,并基于GEE平台对其进行去云处理。该处理方法主要采用QA波段,结合QA波段的位运算对像素值筛选。同时,我们还选取了GEE平台提供的Landsat上层大气反射率产品中的TOA数据,可以直接调用地球引擎中定义的ee.Algorithms.Landsat.simpleComposite()函数来进行去云处理。

2.1.2  镶嵌与裁剪

本研究区域范围较广,需要对各期图像进行镶嵌。在通过GEE平台调用mosaic()函数进行图像镶嵌的过程中,通常会遇到了两个问题:首先,在对遥感图像进行去云处理后,可能会出现“空洞”。为了解决这个问题,可以通过线性插值法填补丢失影像数据。其次,由于不同图像之间存在重叠区域,因此可能会出现部分区域重叠不连续的情况。可使用median()函数计算出图像集的中位数,并选择与中位数相差最小的图像进行镶嵌处理。我们根据山东半岛的边界矢量,调用clip()函数裁剪掉研究区以外的图像区域,最终得到遥感图像预处理的结果。

2.2  研究方法

2.2.1  分类样本集构建

依据土地利用分类标准,将山东半岛土地利用类型划分为草地、耕地、建设用地、林地、水域和未利用地。在不同时期,不同土地利用类型成像具有明显不同的特征[8]。遥感影像分类的精度不仅受制于遥感影像质量,还与样本数据的选取质量直接相关。样本的选择应遵循均匀分布、随机选择的原则,同时考虑地形、气候等影响,尽量避免有云雾和阴影的地区。本研究在GEE平台上,选取1991、1996、2001、2006、2011、2016年和2021年高分辨率遥感影像为研究对象,按照分类标准选择6类土地利用类型,构建7个时段的分类样本集。对样本数据进行格式转换和赋值处理后,输入到GEE平台。在获得初步分类结果后,可以根据分类结果进一步增减样本点,反复迭代直至达到满意的精度。

2.2.2  多维分类特征集构建

在进行遥感图像分类时,仅使用原始光谱波段进行分类可能会出现伪影,如森林地区,可能会导致相当杂乱的分类结果。所以需要进行数据变换再提取光谱指数,根据修改后的光谱指数来辅助分类。然而,利用单一光谱特性进行分类存在一定的缺陷,并且会受到同谱异物和异谱同物的影响。为了克服这些问题,提高图像的分类精度,本研究引入了纹理特征和地形特征,构建一套多维分类特征作为随机森林分类器的输入,从而获得更可靠的分类结果。

对于多光谱波段特征,本研究考虑可见光波段中地物的判别特性以及各波段中不同地物反射率的差异。因此,选择多个波段作为图像的分类特征。此外,引入光谱指数,来更好地反映地物的波谱特性,从而提升地物分类的准确率。在遥感图像的分类中,纹理是区分物体的一个重要特征,反映图像的结构特征。通过考虑不同地形类别的纹理特征,可以有效地帮助图像分类。目前,提取方法主要包含统计法、基于原始纹理分析的结构法、基于模式的方法和信号处理法四类。在地物纹理特征提取中,灰度共生矩阵是地物纹理特征提取中最常用且效果最好的方法之一。山东半岛的地形主要以丘陵和平原为主。在本研究中,调用USGS/SRTMGL1_003数据的ee.Algorithms.Terrain()函数,选取坡度和高度作为地形特征参与影像分类。表1为本研究的分类特征集。

2.2.3  基于随机森林算法分类

随机森林(Random Forest, RF)是一种高效、准确、稳定的集成学习算法模型[10]。相较于其他传统分类方法,RF算法有着许多优点,首先它可以减少过拟合问题,并提高模型的泛化能力;其次,随机森林可以处理高维数据,避免了数据稀疏性和维度灾难问题;最后,随机森林可以评估变量的重要性,并在特征选择上起到了一定作用。此外,它还能够处理高维数据,在遥感图像分类领域拥有广泛应用和巨大优势。分类示意图如图2所示。

3  结果与分析

3.1  分类精度分析

本研究基于随机森林算法对山东半岛6种土地利用类型进行分类,将分类结果与剩下30%的样本进行混淆矩阵的精度分析,通过混淆矩阵分析来验证随机森林算法在分类中的效果。分类结果如表2所示。

山东半岛1991、1996、2001、2006、2011、2016年和2021年7期分类结果的总体精度OA指数分别为87.09%、90.85%、87.73%、91.48%、91.77%、93.59%和94.84%,Kappa系数分别为0.86、0.88、0.86、0.89、0.90、0.92和0.93均在0.85以上。2021年的OA指数和Kappa系数最大,分别为93.84%和0.92,OA指数均高于87%,1991年的OA指数和Kappa系数最小,分别为87.09%和0.85。总体而言,基于GEE平台的随机森林算法的分类效果良好。

3.2  土地利用动态变化分析

为了分析山东半岛1991—2021年土地利用动态变化情况,基于土地利用数据,计算出各类土地在1991—2021年的动态变化值,根据表3和图3可得,山东半岛的不同土地利用类型均发生了显著变化。

按照面积总变化量从大到小排序为耕地、水域、建设用地、未利用地、林地、草地,主要表现为:

1)建设用地、水域两类用地面积增加:30年间建设用地面积增加了2 725 km2,其比重上升了4.39%,水域面积增长显著(增加3 041 km2),增长范围主要集中在山东半岛西北部黄河三角洲附近。

2)耕地、未利用地、草地三类用地面积减少:30年间耕地面积减少3 042 km2,面积比重由1991年的63%下降至58.11%,其次是未利用地,面积由1 921 km2下降至654 km2,面积比重降低2.04%。草地下降较为明显,由3.08%下降至1.61%,面积减少907 km2。

3)林地面积整体变化较小,呈现较稳定的状态,变动幅度不大,占比在15.7%~14.83%浮动。

3.3  土地利用时空变化分析

基于山东半岛七期土地利用现状图,分析山东半岛在1991—2021年的土地利用时空分布变化的情况。

由图4至图7可知,山东半岛的耕地主要分布在中部、南部和西北部,集中于东营、潍坊中北部和青岛中西部等平原区域。林地主要分布在东北部、西南部和东南部,集中于烟台、威海、潍坊南部和青岛北部等丘陵区域。草地则比较分散,分布范围较广。山东半岛的水域包括大沽河、峡山水库、产芝水库、胶莱河以及沿海人工鱼塘等,分布区域相对零散。建设用地主要集中于山东半岛各城镇区域,分布范围广泛。未利用地主要分布在北部沿海地区。

4  结  论

本研究在GEE环境下完成了土地利用分类样本集的构建。采用随机森林算法对山东半岛6种土地利用类型进行分类,得到了1991—2021年7期土地利用分类数据,并进行了土地利用动态变化变化分析。研究发现,在这30年间,建设用地、水域两类用地面积增加,耕地、未利用地、草地三类用地面积减少,林地面积整体变化较小,呈现较稳定的状态,变动幅度不大。山东半岛的耕地主要分布在中部、南部和西北部,林地主要分布在东北部、西南部和东南部,草地与水域则比较分散,分布范围较广。建设用地主要集中于山东半岛各城镇区域,未利用地主要分布在北部沿海地区。

参考文献:

[1] 周鸿翔.基于3S技术开展土地利用动态监测综述 [J].测绘与空间地理信息,2019,42(6):56-57+63.

[2] 黄宝华.基于遥感的山东省土地利用时空变化和驱动力分析 [J].农学学报,2021,11(4):62-67.

[3] BUCHHORN M,LESIV M,TSENDBAZAR N,et al. Copernicus Global Land Cover Layers—Collection 2 [J/OL].Remote Sensing,2020,12(6):1044(2020-03-24)[2023-06-26].https://doi.org/10.3390/rs12061044.

[4] 吴炳方,苑全治,颜长珍,等.21世纪前十年的中国土地覆盖变化 [J].第四纪研究,2014,34(4):723-731.

[5] 宋文杰,张清,刘莎莎,等.基于LUCC的干旱区人为干扰与生态安全分析——以天山北坡经济带绿洲为例 [J].干旱区研究,2018,35(1):235-242.

[6] CHEN B Q,XIAO X M,LI X P,et al. A mangrove forest map of China in 2015: Analysis of time series Landsat 7/8 and Sentinel-1A imagery in Google Earth Engine cloud computing platform [J].ISPRS Journal of Photogrammetry and Remote Sensing,2017,131:104-120.

[7] HUANG H B,CHEN Y L,CLINTON N,et al. Mapping major land cover dynamics in Beijing using all Landsat images in Google Earth Engine [J].Remote Sensing of Environment,2017,202:166-176.

[8] 桑國庆,唐志光,毛克彪,等.基于GEE云平台与Sentinel数据的高分辨率水稻种植范围提取——以湖南省为例 [J].作物学报,2022,48(9):2409-2420.

[9] 朱德海,刘逸铭,冯权泷,等.基于GEE的山东省近30年农业大棚时空动态变化研究 [J].农业机械学报,2020,51(1):168-175.

[10] BREIMAN L. Random Forests [J].Machine Learning,2001,45(1):5-32.

作者简介:黎明(1981—),男,汉族,北京人,副研究馆员,硕士,研究方向:地理信息成果及档案管理;通讯作者:杨征义(1997—),男,汉族,山东济宁人,前端开发者,硕士,研究方向:地理信息系统应用;江琪(1999—),女,汉族,安徽安庆人,在读硕士,研究方向:地理信息系统应用。

猜你喜欢

土地利用变化随机森林山东半岛
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
基于随机森林算法的飞机发动机故障诊断方法的研究
南京市土地利用变化与社会经济发展指标耦合研究
基于最大似然法的南京市土地利用类型分类研究
贵州花江示范区土地利用变化及驱动力分析
对山东半岛与韩国贸易关系影响分析
基于熵权法的山东半岛蓝色经济区集中集约用海可持续发展现状评价
山东半岛蓝色经济区集中集约用海可持续发展路径研究