APP下载

利用卷积神经网络提取高分辨率遥感图像喀斯特森林信息

2020-07-14王修信杨路路汤谷云罗涟玲潘玉英

科学技术与工程 2020年17期
关键词:喀斯特植被卷积

王修信, 杨路路, 汤谷云*, 罗涟玲, 孙 涛, 潘玉英

(1.广西师范大学计算机科学与信息工程学院,桂林 541004;2.广西多源信息挖掘与安全重点实验室,桂林 541004;3.广西师范大学生命科学学院,桂林 541004)

中国西南喀斯特是世界连续分布面积最大的岩溶地区之一,占国土面积5.35%,约5.136×105km2。岩溶山峰植被(森林、灌木等)对维持喀斯特地区生态平衡起着至关重要的作用。随西南喀斯特地区社会、经济的快速发展,不合理的传统开垦方式、山羊放牧养殖等人类活动加强,岩溶山峰植被遭到人为破坏,而岩溶山峰岩石间的土层瘠薄,恶劣的植被生长环境极易造成大面积基岩裸露、植被稀少、水土流失的喀斯特石漠化现象。快速、准确地获取喀斯特地区森林覆盖信息对监测石漠化状况具有重要意义[1]。

传统人工野外勘察方法调查喀斯特森林需耗费大量的人力、物力、财力和时间,而且以有限个样点的调查结果来代表大面积地区的喀斯特森林状况存在较大误差。遥感技术的发展,特别是高分辨率遥感图像的出现,为精细化调查大面积喀斯特森林信息提供了唯一快速、经济、可行的方法[2]。

图1 卷积神经网络的结构框架Fig.1 The architectures and structures of convolutional neural network

遥感森林信息识别提取通常使用统计模式方法(最大似然法、最小距离法、K-均值聚类法等),分类特征选取遥感图像的光谱、纹理等[3]。然而在高分辨率遥感图像中存在大量的细节信息,喀斯特森林与邻近农作物等地面植被常存在明显的光谱重叠,“异物同谱”现象极易造成“误识别和漏识别”,给喀斯特森林的遥感自动提取引入一定的误差[4]。

针对经典算法应用于高分辨率遥感图像分类存在精度不高的问题,出现了大量的机器学习算法,如决策树[5]、人工神经网络、支持向量机、随机森林等,这些算法属于浅层结构的模型。人工神经网络具有较强的学习、容错和非线性处理能力,但提取遥感森林信息时存在局部极值、过拟合和时间复杂度较高等问题[6]。支持向量机适用于小样本统计学习,较好地解决了人工神经网络提取遥感森林信息时的过拟合问题,但核函数的选择和参数设置缺乏理论依据的支持,当森林信息样本数变大时“误识别和漏识别”的概率也变大[7]。随机森林是一种由多个决策树分类器构成的树型集成分类器,对噪声数据不敏感,学习速度较快,提取遥感森林信息的精度较高,但泛化能力不足,处理遥感高维数据时效果不佳[8]。

深度学习作为一种深层次非线性结构的神经网络,能更好地选择和提取分类特征,实现复杂分类问题的建模,迄今为止不少研究已成功地实现了高分辨率遥感图像更高精度的分类[9-15],但尚未见应用于喀斯特地区山区复杂地形地物分类的研究。

因此,针对喀斯特地区高分辨率遥感图像受山区复杂地形影响,地物光谱特征较复杂和细节信息较多,喀斯特森林植被与邻近农作物的光谱特征相近,使得早期的机器学习算法提取森林信息精度不高的问题,根据实践经验将光谱特征、主成分分析前3个分量和纹理特征实现多源多特征融合,构成分类特征,改进标准的卷积神经网络,引入支持向量机与卷积神经网络相结合,对喀斯特地区高分辨率遥感图像进行分类,提取喀斯特森林信息,并与卷积神经网络、随机森林、支持向量机等方法进行比较,探讨准确获取喀斯特森林覆盖信息的方法。

1 改进的卷积神经网络方法

卷积神经网络(convolutional neural network,CNN)由输入、卷积、池化(下采样)、全连接和输出等多层网络组成[14],是一种典型的深度学习模型。

根据西南喀斯特地区的实际情况和比较分类实验结果,采用卷积神经网络LeNet-5 提取喀斯特地区高分辨率遥感图像森林植被信息,由2个卷积层和2个池化层组成的森林植被特征提取器,结构框架如图1所示。

输入样本图像的大小取32×32像元,深度取遥感数据波段数。卷积层作为特征映射层,具有权值共享和局部连接的特征,取6个核尺寸5×5过滤器,卷积核以1个像元为步长沿图像滑动,每个过滤器均产生一个特征图像,遥感一个波段数据的输入第1个卷积层将生成6个大小28×28像元的特征图像。池化层是特征提取层,核尺寸取2×2,选择最大池化方法,池化核以2个像元为步长沿图像滑动,第1个池化层将生成6个大小14×14像元的特征图像。全连接层取ReLU激活函数,该函数能较好地解决网络反向传播中梯度消失的问题,减少网络参数间的依存关系,缓解网络过拟合问题的发生。

网络输出值与标签值的差异使用损失函数来评估,网络训练过程等效于求解损失函数最优数值的过程,损失函数的数值越小,则网络输出值就越准确,所建模型提取喀斯特森林信息的效果越好。模型损失函数取Softmax交叉熵函数解决线性多类的分类问题,并能在一定程度上提高获取喀斯特森林信息的网络学习速度。输出层使用3个节点对应分类结果。

改进标准的卷积神经网络,构建卷积神经网络与支持向量机(support vector machine,SVM)结合(CNN-SVM)方法,该方法将支持向量机代替CNN的输出层,CNN用于喀斯特森林信息特征提取并进行空间扩展,SVM作为网络分类器。CNN-SVM将CNN与SVM结合,建立混合网络模型,可实现单个网络分类器的优势互补。

经实验,设置改进卷积神经网络的学习率初始为0.1,采用指数衰减法,衰减因子取0.1,权重衰减因子取0.98,网络迭代次数取1 000。

2 结果与分析

2.1 多源多特征融合

选取覆盖喀斯特地区QuickBird高分辨率遥感图像数据A和B,波段1、2、3合成彩色图如图2所示,可见地物主要为喀斯特森林、种植农作物的农田、建筑/道路,图像区域无河流、湖泊等较大水体,农作物的灌溉主要通过较小的沟渠引水,由于中国西南喀斯特主要位于亚热带气候区,植被生长所需的水热条件较好,几乎不存在裸土。

图2 高分辨率遥感图像数据A和BFig.2 The high resolution remote sensing data A and B

遥感图像分类特征提取的有效性决定了分类结果的精度。根据实践经验,将遥感数据的光谱特征、主成分分析前3个分量和纹理特征实现多源多特征融合构成提取喀斯特森林信息特征。

遥感图像纹理特征采用灰度共生矩阵提取。使用包含图像大部分信息的主成分分析的第一主成分提取纹理特征。分别对0°、45°、90°、135° 4个方向计算灰度共生矩阵,纹理特征取平均值、方差、熵、同质性、对比性、不相似性、角二阶矩、相关性。

为获得采用灰度共生矩阵提取高分辨率遥感图像喀斯特森林纹理特征的最优窗口大小,窗口从小到大分别取3×3~11×11像元,分析窗口大小变化对CNN提取喀斯特森林林地精度的影响,结果如图3所示,可见5×5像元窗口纹理特征提取林地的精度较高,大于5×5像元窗口后随窗口大小的增加提取林地的精度下降。

图3 不同纹理特征窗口大小的林地分类精度Fig.3 The forest classification accuracies with different window sizes of textures

2.2 分类结果比较

样本数据采集分别从A、B两遥感图像的光谱特征、主成分分析前3个分量和纹理特征数据中裁剪32×32像元大小包含林地、农田、建筑/道路等地物信息的三大类子图像,裁剪后的三大类子图像分别旋转90°、180°、270°,以增加3倍的输入样本数据。

对林地、农田、建筑/道路等地物样本数据进行标注。数据A中取林地样本536组,农田样本516组,建筑/道路样本524组;数据B中取林地样本568组,农田样本544组,建筑/道路样本508组。将样本数据的2/3作为网络训练样本集,余下1/3作为测试样本集。

分别利用训练样本集和卷积神经网络与支持向量机结合(CNN-SVM)、卷积神经网络(CNN)、随机森林(random forest,RF)、支持向量机(SVM)等方法对遥感图像进行分类,提取喀斯特森林植被信息,结果如图4和图5所示。然后使用测试样本集检测分类效果,各种地物的平均分类精度如表1、表2所示。比较使用4种方法提取林地、农田、建筑/道路3种地物的平均分类精度,CNN-SVM和CNN两种方法均达到90%以上,比RF和SVM两种方法的低于90%有明显提高,CNN-SVM略高于CNN,RF略高于SVM,CNN-SVM可较有效地区分农田中的农作物、较准确地提取喀斯特森林植被信息。林地、农田的分类精度相对高于建筑/道路,主要是建筑/道路周边混杂了部分植被,影响分类精度。

图4 数据A 4种方法的分类Fig.4 The land cover classification results from data A using four methods

图5 数据B 4种方法的分类Fig.5 The land cover classification results from data B using four methods

表1 数据A的地物分类精度Table 1 Land cover classification accuracies from data A

表2 数据B的地物分类精度Table 2 Land cover classification accuracies from data B

3 讨论

喀斯特地区的地表起伏较大,太阳辐射下受山区复杂地形的影响,覆盖喀斯特森林植被的岩溶山峰存在阳坡和阴坡,在高分辨率遥感图像中森林植被的细节信息较多,阳坡森林植被的光谱反射率较高而阴坡森林植被的光谱反射率较低,森林植被的光谱特征较复杂,加之森林植被与农作物的光谱特征相近,“同物异谱”和“异物同谱”现象严重,导致使用传统的统计模式方法和早期的机器学习算法提取森林信息的精度不高,深度学习方法提供了解决问题的一种新思路。

使用深度学习CNN-SVM和CNN提取喀斯特森林植被信息的精度高于SVM和RF,原因是CNN模型属于深层次非线性结构神经网络,具有学习地物更高阶特征和更强的抗干扰能力,能探索高分辨率遥感图像中不同种类植被隐藏的复杂空间模式;而SVM和RF属于浅层模型结构,输入层和输出层之间由有限的线性/非线性变换组合连接,无法充分学习到遥感图像中不同种类植被的复杂结构信息。由于改进模型CNN-SVM综合了CNN模型的高阶特征学习能力和SVM模型的分类能力,使用CNN-SVM提取喀斯特森林植被的精度高于CNN。

研究的创新点在于针对喀斯特地区高分辨率遥感图像分类时,受山区地形起伏的影响太阳辐射下的岩溶山峰存在阴影区域,喀斯特森林植被的光谱特征较复杂的问题,根据实践经验实现多源多特征融合构成分类特征,引入SVM作为输出层,与深度学习CNN结合,构建CNN-SVM以改进标准的CNN,探讨提高喀斯特森林植被提取精度的方法。

尽管深度学习CNN-SVM模型具有分类精度较高的优势,但由于CNN的参数较多,导致构建模型的训练时间较长,存在过拟合、耗时、对计算机硬件要求高的局限和不足,尚不能满足对大量遥感数据进行处理、快速提取森林信息的要求,有待于进一步深入研究。

4 结论

(1)深度学习卷积神经网络与支持向量机结合,卷积神经网络两种深层次非线性结构神经网络提取高分辨率遥感图像喀斯特森林的精度均明显高于随机森林和支持向量机等浅层模型结构,具有更强的探索遥感图像中隐藏的不同种类植被复杂空间模式和提取高阶特征的能力,获得更优的分类效果。

(2)引入支持向量机作为输出层,构建深度学习卷积神经网络与支持向量机相结合模型,改进标准的卷积神经网络,综合卷积神经网络提取遥感图像不同种类植被高阶特征的能力和支持向量机的分类性能,可有效地区分农作物、提高喀斯特森林植被信息的提取精度,分类精度在90%以上,高于标准的卷积神经网络。

(3)将喀斯特地区高分辨率遥感图像光谱特征、主成分分析前3个分量和纹理特征实现多源多特征融合,构成分类特征,可提高喀斯特森林植被信息的提取精度,可避免单源特征无法有效区分喀斯特森林与农作物之间的差异、导致分类精度较低的问题。

猜你喜欢

喀斯特植被卷积
呼和浩特市和林格尔县植被覆盖度变化遥感监测
基于植被复绿技术的孔植试验及应用
基于3D-Winograd的快速卷积算法设计及FPGA实现
追踪盗猎者
第一节 主要植被与自然环境 教学设计
九寨沟喀斯特湖泊水体的神奇色彩
卷积神经网络的分析与设计
“别有洞天”的喀斯特王国
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法