APP下载

特征优化结合随机森林算法的干旱区植被高光谱遥感分类方法

2023-07-14肖成志

农业工程学报 2023年9期
关键词:纹理植被光谱

帅 爽 ,张 志 ,张 天 ,张 焜 ,肖成志 ,陈 安

(1. 青海省青藏高原北部地质过程与矿产资源重点实验室,西宁 810300;2. 中国地质大学(武汉)地球物理与空间信息学院,武汉 430074;3. 武汉轻工大学土木工程与建筑学院,武汉 430023;4. 中交第二公路勘察设计研究院有限公司,武汉 430056;5. 武汉市第十四中学,武汉 430000)

0 引言

星载[1]与机载[2]高光谱遥感技术已广泛应用于植被类型制图,而利用遥感技术在干旱-半干旱区区分植被物种、评价各植被物种在区域尺度碳循环中的作用仍具有挑战性[3]。2019 年9 月中国成功发射的资源一号O2D(ZY-1 02D)星同时搭载高光谱(Advanced HyperSpectral Imager,AHSI)传感器和多光谱(Visible and Near Infrared Camera,VNIC)传感器,可同步获取高光谱和高空间分辨率数据,有利于缓解稀疏植被与土壤背景构成的混合像元效应,提升对植被类型精细识别与监测的能力[4]。

结合使用遥感图像光谱特征和纹理特征已经成为遥感植被类型分类的常用方法[5-11]。以往的植被类型遥感图像分类研究中,大多利用单一的纹理提取窗口大小[9-10]和窗口移动方向[7,9]提取图像纹理特征,或对不同窗口移动方向计算的纹理特征进行均值处理[5,9,11],少有研究利用不同窗口大小和窗口移动方向提取多尺度纹理特征参与图像分类,并定量分析纹理提取窗口大小和窗口移动方向对图像分类精度的影响。

高维光谱特征空间产生的休斯效应[12]是影响高光谱图像分类效率和精度的因素之一,多尺度纹理特征的加入会增加分类特征空间的维度,进而加剧休斯效应。遗传算法(genetic algorithm,GA)和粒子群优化算法(particle swarm optimization,PSO)等传统特征优化算法已广泛应用于高光谱波段选择[13-14]。广义正态分布优化算法(generalized normal distribution optimization,GNDO)[7]、原子搜索算法(atom search algorithm,ASO)[15]和海洋捕食者算法(marine predators algorithm,MPA)[16]等仿生优化算法在特征优化领域显示出优于传统算法的性能,但还少有应用于解决高光谱数据的特征优化问题的研究。各特征优化算法在初始化种群,随机生成个体(波段组合方案)的基础上,利用目标函数更新个体实现特征优化的方式造成了特征优选结果的随机性[13,17],进而也造成分类精度的不确定性。

面向高维光谱纹理特征空间的降维和特征优化算法结果的不确定性等问题,此次研究旨在结合特征优化算法和图像分类算法提出高光谱与多尺度纹理特征融合的遥感植被分类方法,以期为干旱区高光谱植被类型分类中的特征提取、特征优化和分类方法的选择提供新的思路。

1 研究区与数据源

研究区位于青海省海西蒙古族藏族自治州都兰县宗加镇(96°24′~96°28′E,36°25′~36°31′N),平均海拔2 775 m,年平均气温4.3℃,属于高原干旱大陆性气候,年平均蒸发量(1 358~1 765 mm)远大于降雨量。研究区南部为宗加镇居民区,主要植被类型包括人工种植的枸杞林和道路两侧的防风杨树林,其中枸杞林可分为2018 年后种植的枸杞林(新)和2018 年前种植的枸杞林(老),研究区北部为戈壁荒漠与河流滩地,植被类型主要为梭梭林和河岸草地,其他地物类型为裸地和建筑用地(图1)。

图1 研究区影像图与样本位置Fig.1 Image of study area and location of samples

此次研究数据源主要为ZY-1 02D 多光谱数据(VNIC,包含单波段2.5 m 空间分辨率全色波段和8 波段10 m 空间分辨率多光谱波段)和高光谱数据(AHSI,166 波段,30 m 空间分辨率)。对AHSI 数据和VNIC 数据分别进行辐射定标、大气校正处理,获取地表反射率数据;再对AHSI 数据、VNIC 数据多光谱波段和全色波段进行几何校正,保证其空间位置配准。将VNIC 数据全色波段与多光谱波段进行图像融合,获取8 波段2.5 m 空间分辨率数据(图1)用于选取训练样本和验证样本。

2 研究方法

在选取地物类型训练样本和验证样本的基础上,利用VNIC 全色波段影像提取多尺度纹理特征,与AHSI高光谱数据组成高维光谱纹理特征空间,利用不同算法分别构建模型进行植被类型分类,并对比分类精度。

2.1 训练样本与检验样本选取

利用VNIC 融合图像开展人工目视解译并结合野外调查,选取枸杞林(老)、枸杞林(新)、草地、梭梭林、杨树林、人工建筑和裸地样本区55、64、54、66、70、30 和32 处,样本区分布如图1。以分层随机抽样的方式选择各植被类型全部样本区的50%作为训练样本数据集,其余50%的样本区作为检验样本集。为了排除各植被类型训练像元数量不同对植被分类精度的影响,在各植被类型训练样本数据集中,以随机采样方式分别选取数量为200 像元的训练样本,应用于各分类模型的构建。

2.2 多尺度纹理特征提取与样本可分离性分析

本研究采用灰度共生矩阵方法,选择均值、方差、同质性、对比度、相异度、熵、二阶矩和相关性8 种统计参量,对研究区 VNIC 数据全色波段提取纹理图像。按照 3×3 像元、5×5 像元、7×7 像元、9×9 像元、11×11像元 五种窗口大小和0°、45°、90°、135°四种窗口移动方向提取了160 组纹理图像,与160 波段的AHSI 数据合并成320 波段的高维光谱、纹理特征空间。利用Jeffries-Matusita(J-M)距离[18]定量评价不同窗口大小、窗口移动方向提取的纹理图像对研究区各植被类型间、植被与背景地物类型间的可分离性差异。

2.3 分类方法

面向高维光谱纹理特征空间的降维、特征优选和植被分类精度提升的问题,本研究将GA[19]、PSO[20]、GNDO[21]、ASO[15]和MPA[16]等特征优化算法与RF[22]图像分类算法相结合,以总体分类精度(overall accuracy,OA)提升为目标,提出GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF 图像分类算法,算法流程如下:

1)参数初始化设置。初始个体数量设置为20 个,即20 个特征组合方案,最大迭代次数均设置为200 次,迭代次数为t(t=1,2,…,200),适应度函数选择随机森林方法计算的OA;

2)输入归一化的光谱纹理特征空间数据和训练样本数据;

3)当t≤200,运行特征优化算法(GA、PSO、GNDO、MPA、ASO),获得特征优选结果,构建分类模型,进行精度评价,获得总体分类精度集(OAt);

4)当t>200,终止运算,计算总体分类精度集中最大值Max(OAt),输出分类结果和特征选择结果。

2.4 精度评价

图像分类精度评价是将各植被类型及地物样本区中作为训练样本外的50%的样本区作为检验样本集进行混淆矩阵[23]计算,以获取OA、Kappa 系数、生产者精度(producer’s accuracy,PA)和用户精度(user’s accuracy,UA)等分类精度评价指标,对不同分类方法的分类结果进行精度评价。

3 结果与分析

3.1 多尺度纹理图像的样本可分离性

各植被类型及背景地物在不同窗口大小、不同窗口移动方向提取的纹理特征中的J-M 距离如图2 所示。可见多尺度纹理中,建筑物与其他地物的可分性较好,J-M距离均大于1.80。草地与其他地物的可分性较差,J-M距离均小于1.65。在不同窗口大小提取的纹理中,各地物间的可分性也有较大差异,在3×3 像元窗口大小纹理图像中,枸杞林(老)与枸杞林(新)、草地与枸杞林(新)间J-M 距离最大,分别为1.56 和1.65,而在11×11 像元窗口大小纹理图像中,梭梭林与枸杞林(新)、梭梭林与枸杞林(老)、梭梭林与杨树林、裸地与草地间的J-M 距离最大,分别为1.91、1.90、1.99和1.92。另外,在7×7 像元窗口大小纹理图像中,杨树林与建筑物的可分性最好,J-M距离为1.88。此外,在不同窗口移动方向提取的纹理中,各植被类型间的可分性也有较大差异,在0°窗口移动方向纹理图像中,杨树林、梭梭林与其他植被类型J-M距离分别大于1.87 和1.86,可分性最好;90°窗口移动方向纹理图像中,草地与其他植被类型可分性最好,J-M距离均大于1.18;135°窗口移动方向纹理图像中,杨树林与梭梭林、建筑物与草地、裸地与建筑物J-M 距离最大,可分性最好。

图2 各地物类型在不同窗口大小、不同窗口移动方向提取的纹理特征中的J-M 距离Fig.2 Jeffries-Matusita(J-M) distances for each land type in texture features extracted from different window sizes and different window movement directions

3.2 分类结果

研究中利用传统RF 算法分别对AHSI 高光谱反射率数据和光谱纹理特征空间数据构建植被分类模型(RF(160)和RF(320)),同时分别利用此次提出的GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF算法对光谱纹理特征空间数据构建分类模型,完成研究区植被类型图像分类,各分类结果如图3,精度评价结果如表1。从分类精度评价结果看,相较RF(160),RF(320)的OA 和Kappa 系数分别提升了8.02 个百分点和0.099。此次提出的GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF 算法分类结果精度均优于传统RF算法分类结果(RF(320)),其中MPA-RF 算法分类结果获得了最高的分类精度,OA 为88.92%,Kappa 系数为0.86。

表1 各分类方法的精度评价Table 1 Classification accuracy of each classification method

图3 各方法的植被及地物类型分类结果图Fig.3 Vegetation and objects classification results of different methods

4 讨论

不同窗口大小、窗口移动方向和统计参量提取的160 组多尺度纹理特征的J-M 距离评估结果显示,不同窗口大小和窗口移动方向提取的纹理特征有利于区分不同的植被类型。表明根据图像标准差大小选择单一窗口大小提取纹理特征[8]和选择单一窗口移动方向提取纹理特征参与植被分类[7,9]的方法可能会导致其他窗口大小提取的关键纹理特征的损失。从总体分类精度上看,加入了多尺度纹理特征的RF(320)的分类精度相较仅有光谱特征的RF(160)分类精度显著提升。从单一植被类型分类精度上看,多尺度纹理特征加入后,枸杞林(老)、枸杞林(新)、建筑物、裸地和杨树林的分类精度有效提升,PA 和UA 分别提升3.59~29.69 个百分点和0.51~32.21 个百分点,其中杨树林的分类精度提升最大,其高大冠层和规则线性排布形成的图像纹理增强了与其他地物类型可区分性。多尺度纹理特征的加入对梭梭林的分类精度提升不明确,相较RF(160),RF(320)的PA 升高,而UA 降低,这可能是纹理特征加入对分类精度的正向提升和特征维度增加引起休斯效应增强共同作用的结果。经特征优化后,梭梭林的PA 进一步升高,UA 大幅提高,优于RF(160)。多尺度纹理特征加入后,草地的分类精度下降,UA 有所升高,而PA 大幅降低,经特征优化后PA 进一步降低,分类效果不佳,可能是由于纹理特征的加入导致草地像元与周边裸地、梭梭林像元的可区分性减弱。

本文提出的GA-RF、PSO-RF、GNDO-RF、ASORF 和MPA-RF 方法与传统RF 方法相比,OA 分别提升了1.41、1.32、1.41、1.65 和2.40 个百分点,有效缓解了特征优化算法的随机性。相较GA、PSO 等传统算法,ASO 和MPA 算法对总体植被分类精度的提升更显著。对于单一植被类型分类精度,相较RF 方法,本次提出各方法分类结果的枸杞林(老)、枸杞林(新)、建筑物、裸地和梭梭林的分类精度均有效提升。而特征优化后,草地的PA 显著下降,大量草地像元被误分为裸地或梭梭林,原因是研究区内草地的零星分布导致获取的草地训练样本数量和质量受限,同时混合像元效应对面积较小的草地识别影响严重。另外,GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF 算法经过特征优化后的特征数分别为83、118、124、159 和57 个,其中MPARF 方法优选的特征数量最少,降维性能最佳。综合来看,MPA-RF 算法在特征降维和图像分类精度提升方面均显示出良好效果。

此次提出MPA-RF 方法对高维光谱纹理特征空间取得了最高的总体分类精度(88.92%),接近或高于WAN等[24]、帅爽等[7]、GEORGE 等[25]利用GF5 AHSI 数据、ZY1-02D AHSI 数据和Hyperion 数据进行香港红树林树种分类、青海干旱区植被类型分类、喜马拉雅西部植被类型分类时获得的OA,验证了本文提出方法对于高光谱植被类型分类的可行性。然而,此次研究获得的最高OA 低于LIU 等[26]和LIU 等[27]利用更高空间分辨率高光谱数据(AVIRIS 数据)和深度学习算法(3D-CNN)进行植被类型分类时获得OA(93.41%和94.18%)。表明空间分辨率是制约星载高光谱数据的植被类型分类精度的因素之一,同时,深度学习算法相较传统机器学习在遥感图像分类领域显示出优势,下一步研究中将基于深度学习框架,设计高光谱数据和高空间分辨率数据差异性学习和深度融合的植被分类模型,进一步提升分类精度。

5 结论

本文针对多尺度纹理特征与高光谱数据构建的高维光谱纹理特征空间降维、特征优化算法随机性等问题,将遗传算法(genetic algorithm,GA)、粒子群优化算法(particle swarm optimization,PSO)、广义正态分布算法(generalized normal distribution optimization,GNDO)、原子搜索算法(atom search algorithm,ASO)和海洋捕食者算法(marine predators algorithm,MPA)等特征优化算法与随机森林分类算法(Random Forest,RF)相结合提出了GA-RF、PSO-RF、GNDO-RF、ASO-RF 和MPA-RF高光谱图像分类算法,并应用于都兰县宗加镇干旱区植被类型分类。主要取得了以下结论:

1)多尺度纹理特征的加入有效提升了高光谱植被分类精度,整体分类精度提升了8.02 个百分点;不同窗口大小、窗口移动方向提取的图像纹理特征有利于区分不同的植被与地物类型。

2)此次提出的GA-RF、PSO-RF、GNDO-RF、ASORF 和MPA-RF 算法将高光谱特征优化与图像分类一体化结合,利用迭代优化的方式,缓解了仿生优化算法结果的随机性,与传统RF 方法相比,总体分类精度提升了1.32~2.40 个百分点,其中MPA-RF 方法取得了最高的图像分类精度(OA 和 Kappa 系数分别为88.92%和0.86)。

猜你喜欢

纹理植被光谱
基于三维Saab变换的高光谱图像压缩方法
基于植被复绿技术的孔植试验及应用
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
绿色植被在溯溪旅游中的应用
TEXTURE ON TEXTURE质地上的纹理
消除凹凸纹理有妙招!
星载近红外高光谱CO2遥感进展
基于原生植被的长山群岛植被退化分析
苦味酸与牛血清蛋白相互作用的光谱研究