APP下载

基于改进DeepLab v3+的耕地自动化提取方法

2024-12-06高威于龙昊

中国新技术新产品 2024年21期
关键词:迁移学习

摘 要:耕地是地表覆盖的主要类型之一,也是粮食生产的直接载体。本文针对耕地提提取不准确和效率低的问题,提出一种改进的DeepLab v3+提取方法。首先,使用轻量级网络 替代DeepLab v3+模型的特征提取网络Xception,以减少模型参数量,提高训练速度。其次,引用SE注意力加入模型,提高网络对耕地的提取精度。并在GID数据集上进行试验,结果显示,本文方法具有优秀的分割性能,能够有效解决经典模型分割结果中存在的不同程度的误分、漏分等问题,在耕地提取中具有高效性,为后续耕地提取任务提供支持。

关键词:迁移学习;SE注意力;MobileNet v2;耕地提取;DeepLab v3+

中图分类号:P 208" " " " " " 文献标志码:A

耕地是地表覆盖的主要类型之一,也是粮食生产的直接载体,耕地变化对生态环境稳定性和粮食安全具有非常重要的影响[1-2]。

传统的耕地统计方法主要基于实地调查,不仅会导致数据更新滞后,还会极大地消耗人力和物力。传统机器学习算法对含有复杂地物信息的高分辨率遥感影像信息提取效果较差,因此,应用需求和遥感数据增加对耕地语义分割提出了更高要求。

深度学习在计算机视觉应用中的成功使基于卷积神经网络(Convolutional Neural Network,CNN)[3]的方法逐渐应用于遥感影像解译领域,为遥感影像中的耕地提取识别带来了重大突破。JADHAV等[4]采用ResNet101网络对高分辨率遥感影像进行土地覆盖和作物类型的语义分割,实现了主要作物的准确分类。陈玲玲等[5]借鉴轻量级网络与UNet模型的优点,有效改进了传统模型提取耕地结果零散的情况。尽管上述方法在耕地提取中各有优势,但是长时间训练是一个主要问题,并且上述方法在提取结果方面存在整体结构不连续、边缘细节提取不准确等问题。

为解决上述问题,本文以DeepLab v3+ 模型为基础,融合迁移学习和注意力机制,旨在提高高分辨率遥感影像中耕地信息提取的精度和效率。

1 道路提取网络结构设计

为了更好地进行遥感影像耕地提取,本文在DeepLab v3+模型的基础上进行了3项改进。编码器采用的特征提取模块Xception网络结构复杂,参数量和内存占用较大,可能会导致模型拟合速度缓慢、分割效率低。因此,将其替换为轻量级网络MobileNet v2,以减少语义分割模型的参数量,提高模型训练效率。引入通道注意力机制SENet,对特征通道权重进行重新分配,改进目标被漏分或误判的问题,从而提高分割精度。如此可在降低模型复杂度的同时提高分割性能。改进的DeepLab v3+网络结构如图1所示。

在图1中,遥感影像被输入编码层中,在MobileNet v2网络中经过深度可分离卷积处理后得到低级特征。低级特征分别输入空洞空间金字塔池化中和解码层中。在空洞空间金字塔池化中经过最大池化层、平均池化层以及3个空洞率分别为6、12和18的空洞卷积中进一步处理,再经1*1卷积合成后得到深层特征信息。深层特征信息和低级特征信息经过SENet进一步筛选目标特征,最后经过2个3*3卷积不断恢复边界信息和上采样,得到输出结果图。

1.1 DeepLab v3+

DeepLab v3+网络于2018年推出,采用编码器-解码器的结构。编码器部分包括主干特征提取网络与空洞空间金字塔池化模块。特征提取网络采用串行空洞卷积,将主干网络MobileNet v2网络提取出的耕地特征分别传入解码器与ASPP模块并进行特征提取。ASPP模块中由1个平均池化层、1个全局池化层以及3个空洞率分别为4、8和12的空洞卷积层组成。不同空洞率的空洞卷积分别捕捉多尺度特征信息,以提高网络的感受野。深层特征经过ASPP模块提取后进行堆叠,经1*1卷积调整通道数后进入解码器部分。在解码器部分,浅层特征经1*1卷积降维后,与由编码器部分输出并经过4倍上采样操作的深层特征融合。该融合特征由3*3卷积进行特征提取,并最终采用4倍上采样操作,获得与输入影像尺寸相同的预测结果。

1.2 MobileNet v2网络

MobileNet v2是一种轻量级的深度神经网络,适用于移动和嵌入式设备的计算资源有限的场景。在MobileNet v2中,图像进入网络前需要进行归一化操作,将像素值缩放到[0,1]。利用MobileNet v2的核心深度可分离卷积对每个输入通道进行独立的空间卷积操作。再利用卷积核进行通道间的混合和降维操作,并应用ReLU激活函数引入非线性特性。在每个卷积层后应用加入批量归一化,有助于加速训练过程并提高模型的泛化能力。在MobileNet v2的某些层中使用残差连接,有助于减少梯度消失和梯度爆炸问题,并提升训练效果。将最后一个卷积层的输出进行全局平均池化操作,转换为一个向量,该向量的每个元素表示对应特征图的平均值。最后,利用一个1*1的卷积层将全局平均池化后的特征图转换为最终输出。

1.3 注意力机制

本文使用SENet对编码器区域内的输出应用不同权重,以优化特征图,从而在较小的额外计算成本下为提升现有分割模型性能,弥补轻量级特征提取网络可能带来的精度损失。SE注意力结构如图2所示。图2(a)为普通注意力机制,其中的输入特征经过残差快处理后,分别采用平均池化、全卷积、ReLU激活函数、全卷积和Sigmoid激活函数操作,得到权重后与输入特征进行加权,最后输出特征图。SENet注意力机制模块的结构如图2(b)所示。与普通注意力不同的是,SENet输入特征经过残差块处理后由平均池化和最大池化共同作用,进一步提高了对目标特征的筛选能力,更有利于目标特征识别。

2 试验与分析

2.1 数据集构建

将改进的DeepLab v3+网络分别在GID数据集中进行训练,切片大小为(512×512)ppi。本文选取640张照片作为试验对象,将其按照7∶2∶1的比例划分为训练集、测试集和验证集。数据集上的部分影像和对应的标签如图3所示。

2.2 试验结果和分析

为了验证本文算法在处理耕地遥感影像方面的有效性和优越性,本文针对影像中耕地的分布、形状和季节分布等特点,选择具有代表性的测试影像进行试验。使用U-Net、PSPNet、DeepLab v3+以及本文算法对测试影像进行耕地提取,并比较试验结果。影像的部分试验结果如图4所示。

由图4可知,本文方法无论是在提取准确度上,还是在边缘细节处理山均比较准确。对于主要分布在山区的耕地,周围的森林等地物是影响其提取效果的主要因素。从各算法的提取结果可以看出,U-Net算法的错误提取明显,对耕地的整体结构提取不完全。PSPNet算法的提取结果碎片化比较严重,错误提取较严重。DeepLab v3+算法的提取结果稍好一点,但是仍然存在错误提取的情况。本文算法的提取结果与标签图相似,提取结果比其他3种方法更优。综上所述,在SENet注意力的作用下,本文方法的多余耕地识别能力得到了增强,在边缘细节和结构的完整度上具有明显优势,并在迁移学习的作用下,对耕地类型的多样性辨别能力有所提升,能够准确提取耕地。综上所述,本文方法在提取耕地上具有有效性和优越性。

U-Net、PSPNet、DeepLab v3+和本文方法的定量评价结果见表1。从表1可看出,本文方法在各个指标上均为最优。在交并比上,比U-Net高了16.17%,比PSPNet高了15.32%。在召回率上,比U-Net高了18.51%,比DeepLab v3+高了13.04%。在总体精度指标上,除了U-Net,其他3种方法均在90%以上,而本文方法远高于其他3种方法,为98.10%。在模型参数上,本文方法将MobileNet v2作为主干网络,模型参数量远小于其他3种方法,仅为22.85 MB。PSPNet的模型参数量为259.64 MB,远高于本文方法。以上数据均说明本文方法在耕地提取上具有高效性。

3 结论

粮食是人类生存的根本,快速且相对准确的推算出粮食生产量离不开耕地信息统计。由于场景庞大、细节复杂且受光照和成像角度的影响,经典语义分割模型对耕地信息的提取通常存在泛化性差、训练效率低、目标识别不准确和精度不高的问题。为了解决这些问题,本文提出一种融合迁移学习和注意力的轻量级DeepLab v3+ 遥感影像耕地提取算法。主干网络替换后的模型参数为22.71 MB,改进完成的本文算法的参数仅有22.85 MB,与拥有259.64 MB参数的PSPNet模型、94.95 MB的UNet模型以及208.7 MB的DeepLab v3+ 模型相比,分割效率显著提升。本文方法融合了SE注意力机制,抑制了易受干扰的通道,使模型能重点关注有效信息。引入迁移学习思想,将预训练模型参数作为网络的初始权重参数,使模型分割效果更出色,在GID数据集用于耕地信息提取研究中表现出了优秀性能。为进一步验证本文方法在大尺度遥感影像中进行耕地提取的有效性,以实例作为试验区,结果显示本文算法交并比为85%以上,证实了本文方法具有良好的泛化性,可作为耕地信息提取通用模型。

参考文献

[1]陈红,吴世新,冯雪力.新疆耕地时空变化特征[J].地理科学进展,2010,29(3):312-318.

[2]杨忍,刘彦随,陈玉福,等.环渤海地区耕地复种指数时空变化遥感反演及影响因素探测[J].地理科学,2013,33(5):588-593.

[3]LECUN Y,BOTTOU L.Gradient-Based learning applied to

document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.

[4]JADHAV J,SINGH R.Automatic semantic segmentation and

classification of remote sensing data for agriculture[J].Mathematical models in engineering,2018,4:112-137.

[5]陈玲玲,施政,廖凯涛,等.基于卷积神经网络的高分遥感影像耕地提取研究[J].农业机械学报,2022,53(9):168-177.

猜你喜欢

迁移学习
《宋史·曾公亮传》传主形象论析
基于深度神经网络的人体动作识别研究
威斯顿相互作用法在社会保险学课程教学中的实践
基于卷积神经网络的图像分类技术
迁移学习在专业课程教学中的实践研究
迁移学习研究综述
从认知角度探讨大学英语网络教学模式
基于多特征融合的跨域情感分类模型研究
奇异值分解与移移学习在电机故障诊断中的应用
一种基于迁移极速学习机的人体行为识别模型