基于无人机遥感的荒漠草原微斑块识别研究

2023-01-19杜建民

广西师范大学学报（自然科学版） 2022年6期

张涛，杜建民

(内蒙古农业大学机电工程学院，内蒙古呼和浩特 010018)

草原生态系统是我国第二大陆地生态系统[1]，也是我国北方重要的生态屏障，在防风固沙、维持碳平衡等方面具有重要作用[2]。但受到人们过度放牧、开发以及气候等因素的影响，内蒙古草原的生物群落遭到破坏，原本的草原植被群落逐渐被其他植被和灌木替代。这些植被与原本的植被相差较大、长势稀疏，导致土壤长期暴露在外面，使得土壤逐渐沙化形成荒漠草原。草原荒漠化造成草原生物多样性减少[3]、生产能力下降[4]、生态系统功能衰弱[5]等一系列问题，对当地牧民的经济收入造成一定影响。

据统计，内蒙古自治区拥有草原面积8.8×107hm2，占全国草原总面积22%，全区土地面积的一半以上[6]。根据2015年全国荒漠化土地面积监测，内蒙古自治区荒漠化面积达6.09×107hm2，占全国荒漠化总面积23.3%，是我国草原荒漠化最严重的地区之一。2017年内蒙古自治区生态环境状况公报显示，内蒙古草原退化面积接近70%，严重威胁当地生态环境安全。因此，亟需探索一种高效、快速的先进方法对荒漠草原进行有效监测，为荒漠草原的动态监测和防治提供理论基础。

荒漠草原微斑块的识别与分类，是评价草原荒漠化的一个重要指标。传统的荒漠草原动态监测主要有人工实地统计勘测以及卫星遥感监测。人工监测在时间、地域、面积等方面都有诸多约束，无法进行大范围、高时效的荒漠草原监测；卫星遥感也常应用于植被覆盖度估算，有相对成熟的理论基础，但是由于卫星遥感的分辨率低等问题，面对荒漠草原微斑块的识别无法满足精度要求[7-8]。高光谱具有波段数多、分辨率高、特征信息丰富等特点[9-11]，常被应用在农业监测[12]、水资源监测[13]、自然灾害评估[14]等领域。目前康拥朝等[15]采用支持向量机结合最小噪声分离法对地面微斑块识别，探索支持向量机对地面微斑块识的有效性；皮伟强等[16]提出SMPI方法对地面微斑块识别，分步实现从植被到鼠洞的识别。朱相兵等[17]通过选取特征波长结合差值植被指数实现鼠洞与其他微斑块之间的区分。综上所述，一方面目前的荒漠草原微斑块识别主要采用传统机器学习方法和阈值法进行识别分类，在预处理阶段过于繁琐耗时，对于实验对象属于地面微斑块的识别探索阶段，还未探索空中遥感的微斑块分类；另一方面也表明利用高光谱图像对荒漠草原微斑块识别的可能性。

卷积神经网络是深度学习的代表算法之一，具有较强的特征提取能力，善于处理复杂多维数据问题，常被应用在计算机视觉、自然语言处理等领域。在遥感图像的识别分类任务中，卷积神经网络也表现出巨大潜力[18-19]。本文以内蒙古自治区乌兰察布市四子王旗的荒漠草原为研究对象，通过使用无人机携带高光谱仪完成高光谱数据收集工作，并采用卷积神经网络对不同的地物种类进行识别。为增强卷积神经网络的特征提取能力，本文将不同卷积层的特征进行拼接，进而提出一种具有多层特征融合的2D卷积神经网络(multilayer feature fusion 2D convolutional neural network, MFF-2DCNN)识别方法，为草原荒漠化的治理与预防提供理论基础，以期实现智能化遥感草原退化监测。

1 材料与方法

1.1 研究区域

本文研究试验区域设在内蒙古自治区乌兰察布市四子王旗科研基地，地理坐标为东经111.88°、北纬41.78°。该区域处于内蒙古自治区中部，平均海拔高度1 456 m。气候类型属于中温带大陆性季风气候，年均气温1～6 ℃；昼夜温差大、白天日照足、无霜期短；降水量少而集中，年降水量280 mm。草地主要类型为短花针茅、冷蒿及无芒隐子草等，植被稀疏低矮，土壤类型以淡栗钙土为主，属于我国荒漠草原的典型代表[20]。

1.2 试验器材

本研究采用四川双利合谱科技有限公司研制的GaiaSky-mini型高光谱仪。成像系统采用内置扫描系统和增稳系统，单幅图像采集时间为7 s。共设置采集波段数128个，光谱分辨率为3.5 nm，波长范围在400～1 000 nm。无人机采用大疆M600 Pro，并使用A3 Pro飞行控制系统。空机质量9.5 kg(含电池)，最大载荷6 kg，满载时可持续飞行16 min。无人机高光谱数据采集系统如图1所示。

图1 无人机高光谱数据采集系统Fig. 1 UAV hyperspectral data acquisition system

1.3 数据获取

野外高光谱数据采集时间在2018年与2019年的7月份。为减少采集过程中阴影的影响，选择采集时间为10:00-14:00，风力在3级以下的晴朗天气，无云雾，自然光下采集。试验区采集总面积为2.5 hm2，共放置10个地物样方，样方尺寸采用1 m×1 m，并采用地垫进行标记。此外，样方内地物需包含鼠洞、植被和裸土三类地物。根据实验区的草原植被长势情况，设置无人机飞行高度为30 m。高光谱数据单幅图像空间尺寸大小为696×709像素，波段数量为128，空间分辨为 1.73 cm。为提高采集数据的可用性，每个样方拍摄不少于3次。

2 实验原理

2.1 数据预处理

2.1.1 反射率校正

采集过程受诸多因素影响，需要将高光谱数据导入Spec VIEW软件中进行筛选，对过曝光、欠曝光等成像不佳的数据进行剔除；然后，将筛选出的数据在Spec VIEW软件中进行反射率校正；最后，根据反射率校正后的数据进行再次筛选，挑选出可用的数据。经反射率校正后的植被、裸土、鼠洞和其他(地垫和垃圾等)地物的光谱曲线如图2所示。

图2 地物光谱曲线Fig. 2 Spectral curves of ground features

由图2可知，4类地物的光谱特征具有很好的光谱差异性，其中，植被的光谱特征由于叶绿素的影响，分别在562.29 nm和681.90 nm处形成一个反射峰和吸收峰，随后反射率值陡增；裸土的反射率在619.20 nm之前随着波长的增加而增加，之后降低至716.09 nm时趋于稳定；其他(地垫和垃圾等)的反射率在520.20 nm处形成一个峰谷，随后开始陡增，直至到达619.20 nm时反射率达到最大值，之后降低至721.00 nm时趋于稳定；鼠洞的反射率在全波段上并无明显变化，达到922.59 nm之后，由于噪声的影响出现一些波动。

2.1.2 样本标签制作

高光谱的邻近波段之间往往存在大量冗余信息，波段之间具有较强相关性。同时，高维度的特征还会产生Hughes现象，增加网络的计算量，影响分类精度。因此，有必要对高光谱数据进行降维。基于主成分分析(principal component analysis, PCA)的降维算法是应用最为广泛的数据降维方法之一，常被应用于高光谱图像的数据降维[21-22]。因此，本研究采用PCA降维算法，将高光谱数据从128个波段压缩至30个波段，从而减少数据的冗余信息，消除特征之间的相关性。

考虑到网络计算成本问题，同时将数据尺寸进行裁剪，最终获得的高光谱数据空间尺寸大小为520×520像素。根据大量的地面调查和实际样方中各个地物的分布情况记录，通过ENVI 5.3对所采集的数据进行选择和生成样本，最终获得植被、裸土、鼠洞及其他地物4类地物的样本标签，无人机高光谱假彩色影像和地面真值图像如图3所示，每类地物的样本数量分别为144 121、123 888、65、2 326，共计270 400个样本数据。植被样本主要包括短花针茅、无芒隐子草、冷蒿和驼绒藜等，在草原中植被稀疏低矮，覆盖面积最大；对于裸土样本，主要是由于人类活动和气候变化的共同影响致使草原植被退化，进而形成光秃的裸地，还有鼠类动物的挖掘行为形成的洞群土丘；鼠洞样本是由于鼠类动物打洞造穴形成的洞群，大量洞群的出现加剧了草原的退化进程；其他样本主要包括地垫和垃圾等地物，在后续讨论中统称为其他地物。不同地物样本的RGB影像如图4所示。本文将不同地物样本随机打乱，并每类选取2 000个样本作为训练集，不足2 000个样本的按该类样本总数的60%作为训练集，其余作为验证集。训练集与验证集的样本分配情况如表1。

图3 无人机高光谱假彩色影像和地面真值图像Fig. 3 UAV hyperspectral false color image and ground truth image

图4 不同地物样本图片Fig. 4 Photographs of different feature samples

表1 无人机高光谱数据选取训练集和验证集的数量Tab. 1 Number of training and validation sets selected for UAV hyperspectral data

2.2 MFF-2DCNN网络结构

本文提出一种多层特征融合的2D卷积神经网络(MFF-2DCNN)方法，对荒漠草原高光谱图像进行分类，该方法的主要思想是将每一层卷积后的特征与最后一层的特征进行合并，加强不同层之间的特征重用，并采用2层全连接层进行分类。其中，第1层全连接主要是将合并后的特征进行线性融合，第2个全连接层主要进行高光谱图像的分类。

网络结构一共包含3层卷积，卷积层采用二维卷积核，前2层卷积之后均采用Batch Normalization加快网络的收敛速度，之后再加入ReLU激活函数来提取数据的稀疏特征，从而提高网络的分类准确率。卷积核尺寸越大，感受野也就越大，获得的信息也越多。因此，将第1层卷积的卷积核尺寸设置为5×5，从而扩大卷积的感受视野来提取更多信息，而后2层则采用3×3卷积核提取细节特征，并设置每一层的卷积核个数分别为64、128、256。在神经网络中，浅层网络卷积分辨率高，提取的更多是细节特征，深层网络分辨率低，提取的更多是语义特征[23]。为了将不同层之间的特征进行融合，在每一层卷积之后通过全局平均池化层将数据压缩至C×1×1(其中C为通道数)，最后将3层卷积之后的结果进行拼接传入全连接层。在全连接层中，第1层全连接将拼接后的数据进行线性特征融合并压缩至256维度的特征；第2层全连接对降维后的数据进行分类。由于全连接层中采用的是线性特征映射，因此对于全连接层需要采用ReLU激活函数增加模型的非线性，并采用Dropout防止训练过程中的过拟合现象。具体网络结构见图5。

图5 多层特征融合的2D卷积神经网络模型结构Fig. 5 Structure of 2D convolutional neural network model for multi-layer feature fusion

3 实验结果与分析

3.1 参数设定

实验中所采用的计算机硬件配置为GeForce GTX 1050 Ti、i7-6700 CPU 3.40 GHz、内存16.0 GiB，软件环境为Pycharm Pytorch 1.7。实验采用总体精度(overall accuracy, OA)、Kappa系数作为模型的精度评价指标。实验设置的数据集批处理大小为128；优化器选择Adam；损失函数采用交叉熵损失函数；训练迭代次数定为20次；学习率设置为0.000 1。经过多次实验，最终确定邻域输入尺寸为9×9×30，此时对于荒漠草原地物的分类效果最佳。训练过程中设置随机种子为500，确保每一次训练结果的稳定性。此外，为了缓解训练样本不均衡问题带来的影响，在训练过程中将对鼠洞样本进行翻转、模糊处理和加入噪声等数据增强。

3.2 实验结果

为了验证本文所提方法的有效性，分别选取SVM、KNN、2D-CNN 3种高光谱分类算法进行对比。为保证实验的公平性，所有实验采用相同的预处理方法，并在同一个实验环境下进行对比实验。同时，为验证本文将多层卷积特征融合后的优势，将其与原始2D-CNN分类算法进行比较。本实验使用混淆矩阵(如图6)计算上述4种分类模型对不同地物的识别准确率，计算结果如表2所示。为观察更为细致的分类效果，将鼠洞区域进行局部放大展示，各种实验分类可视化对比如图7所示。

表2 分类结果精度对比Tab. 2 Comparison of accuracy of classification results

图6 本实验分类模型的混淆矩阵Fig. 6 Confusion matrices for this experimental classification models

图7 地面真值图像和分类结果可视化图Fig. 7 Ground truth image and visualization of classification results

3.3 实验结果分析

由图7可以看出，除KNN分类算法以外，其余3种分类算法在植被地物的分类上均表现出很好的分类性能。SVM和KNN 2种传统的机器学习算法在总体分类效果上表现欠佳，其中KNN分类算法与地面真实标签相比总体分类效果最差，而SVM分类算法相对于地面真实标签总体分类效果有较大提升，但是从图中还是可以明显看出对于其他地物的分类上明显存在诸多错误分类。对于2D-CNN分类算法，与传统机器学习方法相比，效果提升明显，但是从图中可以看出有小部分植被错误地识别成了鼠洞。通过将2D-CNN不同卷积层的特征进行融合后的MFF-2DCNN分类算法，在分类效果上比2D-CNN有所提升，相对于地面真实标签，4类地物类别都表现出很好的分类效果。

由表2可以看出，本文所提MFF-2DCNN分类算法的总体精度和Kappa系数在所有对比分类算法中表现最好，表明本文所提算法的有效性。对于荒漠草原地表微斑块的识别，在4种分类算法中KNN分类算法识别效果最差，其总体分类精度为66.52%。SVM分类算法的总体精度为87.88%、Kappa系数为0.756 6；与KNN分类算法相比，总体精度和Kappa系数分别提升21.36个百分点和0.413 2。由此可见，SVM分类算法的总体识别精度较KNN分类算法提升较大，但是对于鼠洞地物的识别效果表现较差，分类精度仅为44.00%，主要原因是鼠洞样本过于稀少，只有40个样本参与训练，同时也体现了SVM分类算法对于小样本分类的不稳定性。2D-CNN分类算法的总体分类精度可达91.28%，其中鼠洞地物和其他地物的分类精度可达100%，其余两类地物(裸土与植被)的分类精度也在90%以上。2D-CNN分类算法与SVM和KNN 2个传统机器学习分类算法相比，总体精度和Kappa系数都有较大的提升，相对SVM分类算法分别提升3.4个百分点和0.069 1，相对KNN分类算法分别提升24.76个百分点和0.482 3。由此说明，卷积神经网络相对于传统机器学习具有较好的识别效果，能更好地提取无人机高光谱图像的光谱特征和空间特征。本文提出的MFF-2DCNN分类算法在所有分类算法中总体分类性能最好，其中总体分类精度为92.23%、Kappa系数为0.843 7。MFF-2DCNN分类算法与未加入多层卷积特征融合的2D-CNN分类算法相比，OA值和Kappa系数分别提升0.95个百分点和0.018 0。由此可以看出，通过将不同卷积层的特征进行融合后，可以有效利用多层特征的输出进行分类，加强不同卷积层之间的信息重用，从而提高网络模型的特征提取能力，增强网络模型的泛化能力。

由以上分析可以得出，与传统机器学习算法相比，卷积神经网络在荒漠草原的地表微斑块上的识别分类更具优势，尤其是在小样本的分类识别中，卷积神经网络也表现出理想的分类性能。而本文通过将不同卷积层进行特征融合后，加强了信息之间的重用，进一步提升了卷积神经网络的分类能力。

4 结语

本文将无人机高光谱数据和卷积神经网络结合，对荒漠草原微斑块的分类实现从地面识别到空中识别，验证了卷积神经网络在荒漠草原微斑块识别中的可行性。本研究通过对卷积神经网络的不同卷积层进行特征融合，提出MFF-2DCNN识别方法，进一步增强了普通卷积神经网络模型的特征提取能力，该方法具有更好的泛化能力，OA和Kappa系数分别可达92.23%、0.843 7，较SVM、KNN和2D-CNN 3种分类算法分别提升4.35、25.71、0.95个百分点的总体精度。今后将考虑采用不同的算法模型提升荒漠草原微斑块的识别精度，并在此基础上探索更加精细的荒漠草原退化指示物种的识别分类，为今后草原荒漠化监测和恢复治理提供新方法。