基于卷积神经网络高光谱影像土地利用分类方法研究

2022-11-24刘雅辉张永彬宋唐雷李春雨王兴坤

赤峰学院学报·自然科学版 2022年10期

刘雅辉，张永彬，宋唐雷，李春雨，王兴坤

（1.华北理工大学矿业工程学院，河北唐山 063210；2..河北省第二测绘院，河北石家庄 050030）

1 引言

高光谱图像广泛应用于目标检测[1]、土地利用制图[2]、变化检测[3]等领域，具有很强的地物识别能力和纳米级光谱分辨率的分类能力。遥感影像分类结果是许多领域应用的基础，因此以图像分类为重点的遥感研究长期以来一直受到遥感界的关注。高光谱图像除了提供丰富的光谱信息外，还存在信噪比低、数据冗余等问题。此外，在分类过程中可能会出现休斯现象（Hughes）即在训练样本数量有限的情况下，分类精度随着特征数量的增加而增加；但在达到某个极值后，分类精度随着特征数量的增加而减少[4]。目前，普遍是通过数据降维的方法来避免Hughes现象的产生。

传统的机器学习算法广泛应用于高光谱图像分类，如多分类支持向量机，构建一个超平面作为决策面来实现分类。它的优势在于仅用有限的训练集，SVM就能表现出最好的泛化能力。如Wang等提出了一种结合光谱、空间和语义信息的高光谱图像SVM分类方法，实验表明，即使只有非常有限的训练样本也能得到很好的效果[5]。Dobrinic等人使用RF对Sentinel-1(S1)SAR和Sentinel-2(S2)时间序列数据进行土地利用制图，产生了最高的总体准确度为91.78%[6]。主动学习作为半监督机器学习方法，在样本集有限的情况下，通过迭代地将未标记的样本输入到训练集中，可以获得更好的高光谱分类结果[7]。其他机器学习算法如逻辑回归、人工神经网络、核稀疏表示分类等，都取得了很好的分类效果[8]。

传统的机器学习分类算法仅利用图像的光谱信息进行分类，而忽略了图像中包含的丰富的空间信息。空间信息的加入使得遥感影像分类技术取得了较好的分类效果，特别是使分类器具有良好的抗噪性，可以有效地消除“椒盐”噪声[9]。传统分类方法由于数据拟合能力和特征表示能力有限而导致分类精度不高，但深度学习方法的出现有效地改善了这种缺陷。如CNN可以通过提取图像的高维信息以及空间信息，从而获得良好的分类结果。如Yu等人提出了一种新的双分支CNN架构，用于GF-5图像的云分割。实验结果表明，与当前主流的基于CNN的检测网络相比具有更高的F1分数（0.94）和更少的参数[10]。Alou等人提出了一种新的3D2D卷积神经网络组合用于高光谱图像分类。引入了一个3D快速学习块，然后是一个2D卷积神经网络来提取光谱空间特征。实验使用了四个数据集，结果表明，与现有方法相比，所提出的方法在小型和大型训练数据上均取得了优异的效果[11]。

因此，本文以高分五号高光谱影像为数据源，联合主成分分析与卷积神经网络对河北省唐山市曹妃甸区进行土地利用分类，并与随机森林和支持向量机分类结果进行对比。

2 研究区及数据源

2.1 研究区概况

研究区位于河北省曹妃甸区（38°54′N～39°26′N，118°59′E～118°54′E），地处环渤海中心地带，南临渤海，属东部季风区温带半湿润地区，大陆性季风特征显著，年均气温11℃，年降水量636毫米，四季分明，总面积为1943平方千米（图1）。曹妃甸区水资源丰富，有大面积的水稻种植与养殖池，被誉为“中国生态稻米之乡”“中国东方虾之乡”和“中国红皮海蜇之乡”等。

图1 研究区地理位置与验证点分布

2.2 数据处理与样本制作

本研究以GF-5高光谱数据作为数据源。GF-5卫星于2018年发射，在太阳同步轨道上运行，平均轨道高度为705公里，倾角为98.2°，地面覆盖宽度为60公里。GF-5卫星上的可见光和短波红外多光谱传感器可以获得光谱间隔为5nm（VNIR）和10nm（SWIR）的330个波段图像，光谱范围从0.4到2.5μm，空间分辨率为30m。在330个波段中，150个波段为可见光和近红外（VNIR）部分，波长为0.39~1.03μm，180个波段为短波红外（SWIR）部分，波长为1.0~2.5μm。本研究中采用的GF-5数据拍摄于2019年9月24日。该图像没有云层覆盖，适合提取地表覆盖信息。

高光谱影像具有超高的光谱分辨率，因而可以形成近似连续的地物光谱曲线，可以探测到更加精细的光谱信息以区分相似的地物类型，因此高光谱影像相较于多光谱和可见光影像在地物分类方面具有显著的优势。结合辐射定标、大气校正和影像裁剪等数据预处理后的影像与Google Earth高清影像选取训练样本和验证样本，将研究区内地物分为林地、草地、水田、旱田、人工表面、湿地、水体以及其他用地共八种（图1）。

3 研究方法

3.1 特征提取方法

特征提取是指使用线性或非线性方程将原始高维特征变换到低维特征子空间的过程。本文使用PCA方法对GF-5号原始高光谱影像进行特征提取。PCA是通过将相关特征以线性变换的形式变换成无相关性的特征，然后按照方差进行排序。通常经PCA变换后的前几名主成分能含有原始影像的绝大部分特征信息。PCA可以通过以下步骤来实现：(a)获取原始影像数据集。(b)计算数据集每个维度的平均值。(c)求数据集的协方差矩阵。(d)计算协方差矩阵的特征向量和特征值。(e)保留前n维（本为中n为6）特征向量作为输出主成分。

3.2 基于SVM和RF的机器学习分类算法

SVM算法作为一种机器学习算法，具有完善的理论性、稀疏性和鲁棒性，使用少量样本就可以得到较好的分类效果。它可以根据训练集中提供的标记数据，在两个不同的类之间进行泛化。实验中SVM算法采用径向基函数（RBF）作为算法内核，通过与RBF核的结合，SVM可以表达出非常复杂的分类界线，从而达成很好的分类效果。

随机森林算法的原理是将Bagging集成学习思想与随机子空间方法相结合。随机森林（RF）分类器依赖于一组CART来预测和投票最有可能的类别。与其他机器学习技术相比，它的计算效率更高，处理时间更快。本实验中RF树的颗数设置为300。RF算法核心过程主要是从训练集中抽取部分子集，然后构造出CART决策树，然后再其节点处采用有放回的抽取方式抽取特征变量并统计其包含的信息。

3.3 基于CNN的深度学习分类算法

CNN具有稀疏交互、参数共享和等变映射的特点，可以降低网络的复杂度和训练参数大小，同时还具有很强的鲁棒性和容错性，在图像识别和影像分类任务中展现出了高效、准确的优势[13,14]。

CNN模型中卷积层对特征提取起决定性作用。对于第i个卷积层，其输出的特征图yni生成过程可表示为：

式中，yni表示本次卷积的结果；wni表示第i个卷积层第n维卷积核的权重向量；bni表示第i个卷积层第n维卷积核的偏置项；*表示卷积运算；f表示非线性激活函数（ReLU）。

本文设计的CNN模型结构由一个输入层、两个卷积层和两个全连接层构成（图2）。首先是大小为9×9×d的输入层，d为输入的特征层数。然后经过两个卷积核大小为3×3卷积层，得到90个5×5大小的特征图，然后经过Dropout函数处理来避免模型过拟合，同时提高运行效率。第四层和第五层为全连接层，分别含有315和30个神经元，在两层全连接层中间再次使用Dropout函数。最后经过Softmax层，得到五类地物的概率并输出分类结果。

图2 CNN分类模型结构图

4 结果与精度评价

本实验使用主成分分析对高分五号原始高光谱影像330个波段进行特征提取。结果显示，主成分分析结果中前六个主成分包含了原始影像信息的98%以上。因此，选择主成分分析的前六个主成分进行后续的分类研究。

根据图3可以看出，从总体上三种分类方法获得的土地利用图大体上呈现出一致性。从分类结果可以看出，曹妃甸区分布最广泛的地物主要为水体、人工表面和水田。其中水体主要是以养殖池为主，养殖池主要分布在西南部和东部沿海地区。水田主要分布在北部以及东北部内陆区域。人工表面主要分布在西北部以及南部的曹妃甸港。

图3 三种分类方法分类结果图

在SVM和RF分类结果中存在许多“椒盐”噪声，这是由于这两种方法为基于像素的分类方法且不能很好的利用影像的空间信息导致的。在CNN分类结果中由于CNN的分类方法可以有效地提取影像的空谱特征从而很好地抑制了“椒盐现象”的产生。

从三种分类模型的混淆矩阵表（表1-3）中可以看出基于SVM分类方法、RF分类方法以及CNN分类方法总体分类精度分别为78.67%、79.67%和87.67%，Kappa系数分别为0.72、0.74、0.84。从总体精度来看三种分类方法均高于75%。基于CNN的分类方法总体分类精度相较于基于SVM和RF分类方法的总体精度分别提高了9.00%和8.00%，说明基于CNN的分类方法的分类效果要显著优于基于SVM和RF的分类方法。

表1 基于SVM的分类结果混淆矩阵

表2 基于RF的分类结果混淆矩阵

表3 基于CNN的分类结果混淆矩阵

从各类地物的生产者精度和用户精度来看，基于RF和SVM的分类结果的草地、其他用地和林地的用户精度以及林地和湿地的生产者精度都比较低，这是由于RF和SVM分类方法分类时仅利用地物的光谱特征，对于易混淆的地物区分效果较差。且研究区内其他用地主要为未建设完成的建设用地，部分区域分布着非常稀疏的杂草，容易与草地混淆。由于CNN可以提取到更高维的特征，因此在基于CNN的分类结果中草地和其他用地的用户精度有了明显的提升，取得了较好的结果。

5 结论

本文基于高分五号高光谱影像，采用主成分分析的方法进行特征提取，采用基于CNN的分类方法进行分类，并与基于RF和SVM的分类方法作为对比。

基于主成分分析的特征提取方法可以有效地提取高光谱影像的特征，仅需前几个主成分就可以包含高光谱影像的绝大部分信息。将主成分分析方法与CNN分类方法相结合可以取得很好的分类效果。

基于RF和SVM的分类方法对草地、林地以及其他用地等的分类精度较低，这是由于其他用地主要为未建设完成的建设用地，易与人工表面混淆，且部分区域分布着稀疏的杂草，容易与草地混淆。基于CNN的分类方法可以提取到高维的影像特征，从而有效的改善这种情况，受“同谱异物”与“同物异谱”的影响最小。

由于三种方法都是基于像素的分类方法，因此会不可避免地产生“椒盐”噪声，在RF和SVM的分类结果中，“椒盐”噪声比较明显，而基于CNN的分类方法可有效地提取图像的空谱特征从而抑制“椒盐现象”的产生，并且CNN分类精度更高，分类效果也更好。这表明基于CNN的深度学习分类方法在高光谱影像土地利用制图方面具有显著的优势。