APP下载

结合珠海一号高光谱影像和XGBoost算法的珠江口滨海湿地分类

2024-01-15刘燕君曹晶晶

测绘通报 2023年12期
关键词:珠江口珠海尺度

刘燕君,刘 凯,4,曹晶晶,4

(1. 中山大学地理科学与规划学院,广东 广州 510006; 2. 广东省公共安全与灾害工程技术研究中心,广东 广州 510006; 3.广东省城市化与地理环境空间模拟重点实验室,广东 广州 510006; 4. 南方海洋科学与工程广东省实验室(珠海),广东 珠海 519000)

湿地是水陆相互作用形成的特殊自然综合体,是地球上生物多样性最丰富的生态系统和人类重要的生存环境之一,被誉为“地球之肾”[1]。湿地科学分类作为湿地研究的基础,是湿地科学理论的核心问题之一[2]。遥感技术已成为大范围湿地信息提取和遥感分类的重要手段,对于准确、及时监测湿地生态系统受自然因素和人为干扰的动态信息至关重要。

国内外遥感技术的发展为湿地分类研究提供了丰富的数据源,包括多光谱影像、雷达影像和高分影像等[3-5]。其中,高光谱遥感以其丰富的光谱信息在复杂环境下的湿地类型精细识别中表现出显著优势[6-8]。相比于机载或无人机载高光谱遥感,星载高光谱遥感具有大范围、易获取、重访率高等优势,在区域或更大空间尺度的湿地分类中表现出了极大的应用潜力。

鉴于面向对象分类方法相比于基于像元的分类方法,能在较大程度上解决混合像元问题,减小分类结果的“椒盐效应”[9]。近年来,极端梯度提升(eXtreme gradient boosting, XGBoost)作为一种基于决策树的集成机器学习算法由于其运行速度快、分类效果好等优势广受关注,但其在湿地遥感分类中应用潜力仍有待探究。

综上,本文运用具有较高空间和光谱分辨率的珠海一号高光谱影像,结合多维影像特征、XGBoost算法和面向对象技术,针对珠江口滨海湿地进行遥感分类,并对比SVM和RF两种机器学习算法,分析XGBoost算法在湿地类型信息提取中的有效性。

1 研究区与数据源

1.1 研究区概况

珠江口湿地是我国重要的滨海湿地,位于南海北侧近岸海域,是三角洲网河和残留河口湾并存的河口,河口区河汊发育、水网密布。属于南亚热带季风性海洋气候,常年温暖、多雨、湿润,夏季时间长,冬季温暖干燥[10]。珠江口湿地种类丰富,有许多相互连通的河道,包括低地岛屿、河滩沼泽地、大型低洼田(如稻田、鱼池和虾塘)、滩涂和红树林等。

1.2 数据及预处理

选用2019年1月25日覆盖珠江口滨海湿地的珠海一号高光谱影像,数据来源于欧比特珠海一号遥感数据服务平台。珠海一号高光谱卫星共有4颗星,空间分辨率为10 m,时间分辨率可达2天,成像范围为150 km×2500 km,谱段数为32个,光谱分辨率为2.5 nm,波谱范围为400~1000 nm。除了空间和时间分辨率的优势外,珠海一号高光谱影像还具有红边波段。

对珠海一号高光谱影像进行预处理,包括辐射校正、几何校正和图像裁剪。首先,基于日照差异纠正模型进行辐射校正,将影像灰度值转换为辐亮度值;然后,以Sentinel-2影像为基准影像,结合地面控制点进行影像配准。

2 研究方法

针对珠海一号高光谱影像进行面向多尺度影像分割,基于相关性的特征选择(correlation-based feature selection, CFS)算法获取最优的特征集合,并对比SVM、RF和XGBoost 3种不同机器学习算法的湿地分类效果,探讨XGBoost算法在湿地分类应用的可行性。技术路线如图1所示。

图1 湿地分类技术路线

2.1 湿地分类体系

参考《中华人民共和国国家标准:湿地分类》(GB/T 24708-2009)和《湿地公约》及现有湿地分类体系[11-13],针对研究区的湿地类型,制定本文的湿地分类体系(见表1),包括自然湿地、人工湿地和其他土地类型。其中,河流湿地主要为永久性河流,沼泽湿地以红树林为主,人工湿地主要为水库和水产养殖场。

表1 湿地分类体系

2.2 多尺度分割

采用多尺度分割算法,基于eCognition易康软件进行珠海一号高光谱影像分割。多尺度分割是指在影像信息损失最小的前提下,以任意尺度生成异质性最小、同质性最大的有意义影像多边形对象的过程,不同的地物类型可以在相应尺度的对象上得到反映[14-15]。使用一种无监督自动选择尺度方法[16],经过多次试验确定分割尺度和参数因子。

2.3 特征提取与选择

根据不同湿地类型的特征和珠海一号的影像特征选取了光谱特征、形状特征、纹理特征和指数特征4类共192个特征,见表2。多种类别特征的加入可辅助识别光谱特征相似的湿地类型[17]。

表2 本文使用的分类特征

针对上述特征集,本文采用经典过滤器模式CFS算法进行分类特征筛选[18]。该算法对单一特征对应于每个分类的作用进行评价,评估每个特征的预测能力及相互之间的冗余度,倾向于选择与分类类别相关度高,但相互之间相关度低的特征[19]。

2.4 机器学习算法

2.4.1 极端梯度提升

XGBoost算法属于梯度提升机器算法的扩展[20],该算法的基学习器通常为树和线性分类器,得到带L1+L2惩罚的线性回归或逻辑回归,其损失函数采用二阶泰勒展开,具有高准确度、不易过拟合、可扩展性的特点,能够分布式处理高维稀疏特征[21]。

2.4.2 支持向量机

支持向量机(SVM)是一种基于统计学习理论的机器学习算法,能够很好地应用于小样本、非线性及高维模式识别[22]。SVM算法针对的是小样本的统计估计和预测,以结构风险最小化作为准则[23]。

2.4.3 随机森林

随机森林(RF)是一种基于决策树的集成学习算法[24]。它利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模。每棵树通过Bagging算法形成独立分布的训练样本集,组合多棵决策树的预测,通过投票得出最终预测结果[25]。

3 结果与分析

3.1 影像分割

针对研究区珠海一号高光谱影像进行多尺度分割,对比多次试验的分割效果如图2所示,最终确定分割尺度为60,该分割尺度下获取的对象内部同质性较高,边界轮廓较为清晰,具有较好的可分离性与代表性。同时,考虑研究区地物形状大多较规整,确定影像分割的紧致度为0.6、形状因子为0.4。

图2 不同分割参数对应的影像分割效果

3.2 分类特征筛选

利用CFS算法筛选得到30个分类特征,包括18个光谱特征、3个形态特征、5个纹理特征和4个指数特征。图3给出了各个特征对于湿地分类的F1得分,其中光谱特征的重要性最高。红边指数和阴影指数的重要性仅次于光谱特征。纹理特征和形状特征的重要性排名靠后,这可能是由于珠海一号高光谱影像的纹理信息相对较弱的原因。

图3 各特征重要性排序

3.3 湿地分类结果

3.3.1 3种机器学习算法分类结果对比

基于XGBoost、RF和SVM 3种机器学习算法得到研究区湿地分类精度,如图4所示。可以看出,利用XGBoost算法进行湿地分类效果最好,总体精度87.2%,Kappa系数为0.84。其中,制图精度最高的是沼泽湿地,主要分布于研究区西南部,用户精度最高的是水产养殖场。XGBoost算法对细小水体的分类更为准确,对沟渠和细小河流的分辨能力更高,且对旱地、建筑等非湿地类别更为敏感,能够有效提高湿地分类精度。

图4 基于3种机器学习算法的珠江口湿地分类精度

基于3种机器学习算法获取的珠江口湿地类型空间分布如图5所示。对比3种算法的分类结果,可以看出,RF算法的结果中在河流湿地有明显错分,大多数被分为建筑用地或湖泊湿地;利用SVM算法能够较好地提取河流湿地,但会混淆养殖场和沼泽湿地;XGBoost算法应用于湿地分类的效果最佳,其中部分河流湿地被误分水库、坑塘或建筑用地,这可能是由于河流湿地分割较为细碎,影响了分类器对河流湿地同质性的判断,且其样本受河流上船只的影响,也在一定程度上影响了分类结果。

图5 基于3种机器学习算法的珠江口湿地分类结果

3.3.2 特征优选前后的湿地分类结果对比

基于特征优选的湿地分类雷达图如图6所示。对于3种机器学习算法而言,相比使用全部特征集,利用优选特征集得到的总体精度和Kappa系数均有所提高,其中XGBoost算法得到的总体精度上升2.0%。SVM和RF算法尽管特征优选后的总体精度也有所提升,但湖泊湿地、水库和沟渠的识别精度降低了。基于XGBoost算法得到的各类湿地识别精度均有提高,如湖泊湿地的用户精度提升近20%,虽然河流湿地和沟渠的制图精度有所下降,但下降幅度很小。

图6 基于特征优选的湿地分类雷达图

4 结 论

本文利用珠海一号高光谱影像获取的光谱特征、形状特征、纹理特征和指数特征,采用XGBoost算法和面向对象方法识别珠江口滨海湿地类型。主要结论如下:

(1)珠海一号高光谱数据以较高的空间分辨率和光谱分辨率的优势,能够准确识别不同湿地类型,分类精度基本都在80%以上,其中光谱特征在分类结果中具有较高的重要性。

(2)相比于SVM和RF机器学习算法,XGBoost算法能够提供更高精度的湿地分类结果,总体精度为87.2%,Kappa系数为0.84,且能更为准确地区分沟渠和细小河流,并对旱地和建筑用地这些非湿地类型更为敏感。

(3)优选特征集相比于全部特征集而言,3种算法得到的湿地分类精度均有所提高,最高提升为2.1%,其中XGBoost算法提取的大多湿地类型的识别精度均有明显提升,这也表明了筛选有效特征对于提高湿地分类效果的重要性。

珠海一号高光谱影像为大范围的湿地信息提取提供了新的数据源,本文结合先进的机器学习算法验证了其在湿地类型识别中的应用潜力。然而,我国湿地分布广泛且类型繁多,后续有必要结合多源遥感数据进一步提升湿地类型的识别能力。

猜你喜欢

珠江口珠海尺度
珠江口地区岩土层工程地质特征及物理力学性质研究
财产的五大尺度和五重应对
珠海开放大学
这条鱼今日在珠海掀起热浪!7.7亿诠释珠海水产业发展新态势
从珠江口到大屿山
珠海之旅
风口浪尖上的珠海银隆
宇宙的尺度
生活污水对珠江口渔业水域环境的影响评价
9