结合面向对象和深度特征的高分影像树种分类

2019-05-10滕文秀施慧慧许振宇

测绘通报 2019年4期

滕文秀，王妮，施慧慧，许振宇

(1. 南京林业大学林学院，江苏南京 210037； 2. 滁州学院地理信息与旅游学院，安徽滁州 239000； 3. 安徽省地理信息智能感知与服务工程实验室，安徽滁州 239000)

树种分类对森林资源管理和森林资源监测具有重要意义[1]。传统树种调查方法主要依赖于实地调查或利用大比例尺航片进行人工判读[2]，该方法成本高且效率低下。高分辨率遥感图像具有丰富的光谱和空间信息，为树种分类提供了一种高效的方式。现有的树种分类方法主要采用手工提取特征结合传统机器学习的方法。文献[3]综合利用光谱、纹理、植被指数、时相、地形等特征，在不同层次上采用适用于该层的支持向量机、人工神经网络(artificial neural network，ANN)、多分类器组合(multiple classifier combination，MCC)等分类方法。文献[4]利用光谱和纹理特征结合随机森林(random forest，RF)和支持向量机(support vector machine，SVM)进行树种分类。文献[5]探讨不同移动窗口大小对纹理特征的影响，选择合适的窗口大小及纹理因子组合提高了树种分类精度。上述方法取得了较好的分类结果，但手工提取特征的方式自动化程度低，而且这些特征是针对特定研究区特定任务设计的，如果使用在其他研究区其他任务上错误率可能显著提高，这种特征具有不可迁移性。深度学习[6]是人工智能的重要进展之一，它颠覆了传统算法的设计思路，能够自动从数据中学习特征，避免了传统算法中人工设计、提取特征的复杂性和局限性，在没有人为干预的情况下，具有极大的特征学习潜力，特别是深度卷积神经网络(deep convolutional neural network,CNN)[7]已经被广泛用于遥感图像的分类、提取、识别和检索，基本全面超越了传统方法[8]。为此本文将深度学习技术和高分影像树种分类相结合，提出一种结合面向对象和深度特征的高分影像树种分类方法，实现端到端的树种分类，可以为森林资源管理和监测提供技术支持。

1 研究区概况与数据来源

皇甫山国家森林公园位于安徽省滁州市，地处北亚热带温润性季风气候区，海拔399.2 m，占地面积35 533 km2，是皖东地区保存最完整、面积最大的原始次生林国家森林公园。保护区森林覆盖率达到96%，区内建设有皇甫林场，以人工林著称，主要分布具备根系发达、树冠浓密、落叶丰富易分解、生长迅速、郁闭紧密等特点的树种，在江淮流域地区植被类型有一定的代表性。其中，以松(pinus)和麻栎(quercus acutissima)为主，占总株数的60%左右，其他数量较多的树种还有刺槐(robinia pseucdoacacia)、杨树(populus)、柳树(salicaceae)、枫香树(liquidambar formosana)，以及辅助经济树种，如桃树(persica)等。本文采用2017年2月QuickBird遥感影像数据，像素分辨率为0.61 m，区域无云覆盖，质量较好，利用二类调查成果与野外调查成果验证树种分类精度。

2 研究方法

针对现有树种分类方法采用人工提取特征自动化程度低并具有不可迁移性的问题，提出了一种结合面向对象和深度学习的高分影像树种分类方法。为了获取精确的树种边界，首先利用多尺度分割技术分割整幅遥感影像，并选择训练样本作为深度卷积神经网络的输入。为了避免样本数量少导致过拟合问题，采用迁移学习方法，使用ImageNet上训练的VGG16模型参数初始化深度卷积神经网络，并利用全局平局池化压缩参数，在网络最后添加1024个节点的全连接层和7个节点的Softmax分类器层，利用反向传播和Adam优化算法训练网络。最后分类整幅遥感影像，生成树种专题地图。本文分类流程如图1所示。

图1 结合面向对象和深度迁移学习的高分影像树种分类流程

2.1 面向对象多尺度分割

现有基于卷积神经网络的遥感影像制图方法中，滑动窗口方法没有考虑像素的空间和光谱相关性，生成块状专题地图，地图边界模糊[9]，而像素级别的分类效率较低，容易出现“椒盐现象”，已经被证明不适合高空间分辨率遥感影像制图[10]。为了获得更精确的树种专题地图，本文引入面向对象技术，首先利用图像分割技术分割整个遥感影像。图像分割技术面向对象分类的基础，它在整个影像信息提取中有着非常重要的作用。多尺度分割技术[11]是指采取不同的分割尺度对不同尺度的图像对象层次进行分割，进而生成一个由不同尺度数据构成的影像层次网状结构。它采用一种自下而上的分割算法，合并异质性阈值以内的空间邻近对象，逐渐合并对象由小及大，循环往复，直至没有相邻对象小于异质性阈值，最终结束合并。多尺度分割算法中需要设置的参数包括尺度参数、形状因子的权重和紧致因子的权重，影像分割后的区域在光谱信息上有一定的相似性，同时也有纹理、大小或上下文之间的一致性。通常假设每个区域中的全部像素都是属于一个类别的，但在实际应用中很难成立，为了避免一个对象中包含多个树种对分类产生影响，本文采用过分割的方式分割整幅遥感影像，确保区域内的像素具有相同的树种类别。本文选取最优分割尺度为35，最优形状因子为0.6，紧致度为0.4。多尺度分割后选择部分对象作为卷积神经网络的训练样本。

2.2 结合深度迁移学习的高分影像树种分类模型

深度卷积神经网络参数数量多，利用少量的样本训练一个深度卷积神经网络会导致过拟合问题，为此本文引入迁移学习方法，避免过拟合问题并加速网络的学习和优化。为了避免样本数量少导致过拟合问题，采用迁移学习方法，使用ImageNet[12]上训练的VGG16模型参数初始化深度卷积神经网络，并利用全局平局池化压缩参数，在网络最后添加1024个节点的全连接层和7个节点的Softmax分类器层，最后利用反向传播和Adam优化算法训练网络。本文设计的高分影像树种分类模型如图2所示。

图2 高分影像树种分类模型

卷积和池化层：将大型卷积及神经网络模型VGG16去掉全连接层，利用剩余的卷积和池化层提取树种影像的特征图。假设输入树种影像为I，Fi为卷积神经网络第i层的特征图(F0=I)，卷积和池化操作可分别表示为

Fi=f(Fi-1⊗Wi+bi)

(1)

Fi=subsampling(Fi-1)

(2)

式中，Wi为第i层卷积核的权值；⊗代表卷积核与第i-1层图像或特征图进行卷积操作，卷积的输出与第i层的偏移bi相加，最终通过非线性的激活函数f(x)得到第i层的特征图Fi；subsampling为下采样(池化)函数，修正线性单元(Relu)作为激活函数，可表示为

(3)

(4)

全连接层：经过特征提取和全局平局池化后，将全局平局池化后的所有特征值与全连接层每个节点连接，VGG16包含两个4096个节点的全连接层，由于本文数据量较少，为了避免过拟合问题，本文利用一个1024个节点的全连接层。

Softmax分类器：最后一层使用Softmax分类器，将网络输出的特征放到Softmax分类器中进行分类，其类标签为y∈{1,2,…,K}，K为类别标签数量，本文N=7，分为松树、麻栎、杨树、柳树、枫香树、毛竹、杉木7类。

对于模型的训练，本文利用Adam优化算法和反向传播更新全连接层可训练参数。Adam优化算法[14]能够自适应选择每个训练参数的学习率，并且该算法对内存需求较小，具体表示为

(5)

(6)

3 试验与分析

为验证本文方法的有效性，采用本文方法对皇甫山森林公园的QuickBird高分影像进行树种分类，并利用二类调查成果与野外调查成果验证分类精度。首先利用多尺度分割技术分割整幅遥感影像，最优分割尺度为35，最优形状因子为0.6，紧致度为0.4，然后选择训练样本，将训练样本从影像中裁剪下来后缩放到模型输入大小，本文采用预训练模型为VGG16[15]，模型输入大小为224×224像素，对于模型的训练，速率衰减周期设置为100 epoch，Batch size设置为32，Adam优化算法中初始学习速率设置为0.000 1，epsilon设置为10-8，速率衰减因子为0.9，训练过程中的精度和损失变化曲线如图3所示，从图中可看出，模型在前40个epoch精度迅速上升，损失迅速下降，在经过40个epoch后基本稳定，因此使用预训练模型初始化网络参数能够有效加快网络的训练，避免过拟合问题。

图3 训练精度及损失变化曲线

模型训练完成后对整幅遥感影像进行分类，利用二类调查成果与野外调查成果验证分类精度。为了验证本文方法的有效性，本文分别用支持向量机、随机森林及本文方法对树种进行分类，利用混淆矩阵、总体精度和Kappa系数进行精度评价，结果见表1，制图结果如图4所示。本文方法树种分类总体精度和Kappa系数分别为78.98%和0.685 0，比支持向量机高15.63%和23.85%，比随机森林高6.82%和13.01%，其中柳树、麻栎、杉木、杨树、毛竹的分类精度都高于传统浅层机器学习方法支持向量机和随机森林，松树和枫香树的分类精度相比传统方法精度相对较低，但都很接近。总体来看，由于深层结构模型包含多层非线性变换，具有更强的表达与建模能力，能够从树种影像中自动学习有效的特征表示，因此分类精度优于传统浅层机器学习方法。综上所述，本文方法能够有效提高高分影像树种分类精度，而且自动化程度更高，更具有稳健性，是一种有效的树种分类方法。

表1 皇甫山高分影像树种分类精度评价

4 结论

本文针对传统手工提取特征方法需要专业领域知识，提取高质量特征困难，提出了一种结合面向对象和深度特征的高分影像树种分类方法。利用面向对象分割技术获取树种的精确边界，并利用迁移学习方法，将现有的知识迁移到高分影像树种分类中，避免了树种训练样本较少容易导致过拟合问题，实现了端到端的高分影像树种分类，避免了手工提取特征的不可迁移性。为验证本文方法的有效性，以安徽省滁州市的皇甫山国家森林公园为研究区，QuickBird高分影像作为数据源，采用本文方法进行树种分类。试验结果表明，本文方法树种分类总体精度和Kappa系数分别为78.98%和0.685 0，在保证树种精度的同时实现了端到端的树种分类，可以为森林资源管理和监测提供技术支持。