APP下载

深度学习中深度可分离卷积网络在遥感图像分类中的优化

2024-12-31郑丹 宋思楠 贺强

信息系统工程 2024年10期
关键词:深度学习

摘要:为了优化深度可分离卷积网络在遥感图像分类中的应用,解决传统卷积神经网络在处理高分辨率遥感图像时的计算量大、参数冗余等问题。采用模块化与层次化设计方法,应用数据增强技术与特征工程,通过轻量化模型设计、参数剪枝与量化技术,并设置实验环境、选取典型数据集,进行实验设计与评估,比较不同模型的分类准确率。结果显示,优化后的深度可分离卷积网络在分类准确率、计算量、训练时间和能耗方面表现优异。得出结论,优化模型在遥感图像分类中具备高实用价值,提升了遥感图像分类的效率和准确性。

关键词:深度学习;深度可分离卷积网络;遥感图像分类

一、前言

在遥感图像分类领域,高分辨率图像包含了丰富的空间和光谱信息,如何高效地进行特征提取和分类成为研究的核心问题[1]。传统卷积神经网络(Convolutional Neural Network,CNN)虽然在图像分类任务中表现优异,但其庞大的参数量和计算需求在资源受限的环境中成为瓶颈[1-2]。为解决这一问题,深度可分离卷积网络(Deep-Separable Convolutional Networks,DSCN)因其高效的计算结构和良好的性能,成为遥感图像分类研究的重要方向[3-5]。基于此,本文探索并优化深度可分离卷积网络在遥感图像分类中的应用,旨在克服传统卷积神经网络的局限,实现高效、准确的遥感图像分类。

二、深度可分离卷积网络设计与实现

(一)网络结构设计

1.模块化与层次化设计

在网络的每一层引入深度卷积模块和点卷积模块;每个卷积模块之后添加批量归一化层,稳定训练过程;使用ReLU激活函数增加非线性表达能力;逐层堆叠不同的卷积模块,从浅层到深层逐步提升特征提取能力。

2.参数优化与训练策略

应用L2正则化和Dropout技术,防止过拟合,增强模型的泛化能力;选择正则化系数和Dropout比率,通过实验确定最佳参数;实施学习率衰减策略,在训练过程中逐步减少学习率;使用Adam优化器,动态调整学习率以适应不同训练阶段需求;在训练初期,使用较大学习率快速收敛,在训练后期,逐步减小学习率细化权重;采用数据增强技术,包括随机裁剪、翻转、旋转等,提高模型对数据变化的鲁棒性;在每层激活后进行批量归一化处理,稳定训练过程;调整网络深度和宽度,确保参数最优配置,使模型在保证精度的前提下,计算复杂度和资源消耗最小化。

(二)应用与优化

1.网络模型的构建与优化

选择适当的网络深度和宽度,逐层添加深度卷积和点卷积模块,构建层次化网络结构;在每层卷积后加入批量归一化和ReLU激活函数;引入残差连接(Residual Connections),改善梯度传播和特征复用;通过网格搜索和随机搜索,确定最佳的学习率、批量大小等训练参数;应用早停策略,在验证集上监控模型性能,防止过拟合;利用迁移学习技术,将预训练模型应用于DSCN,缩短训练时间,提升模型初始性能。

2.分类算法的改进与实现

引入多尺度特征融合技术,在不同层次提取特征并进行融合,捕捉图像中的细节与全局信息;使用特征金字塔网络(Feature Pyramid Network, FPN),将各层特征进行融合,提升分类效果;引入注意力机制,赋予图像中重要区域更高的权重,提升模型对关键特征的识别能力;使用SE模块(Squeeze-and-Excitation Module),对特征进行重标定,增强关键特征表达能力;结合交叉熵损失函数和Softmax激活函数,实现多类别分类的准确概率分布;训练阶段应用迁移学习和数据增强技术,利用大规模预训练模型和多样化数据,提高分类模型的泛化能力和适应性;引入自监督学习和半监督学习方法,在标注数据有限的情况下,充分利用未标注数据,提升模型的学习效率与分类性能。

三、数据预处理与增强

(一)遥感图像预处理方法

1.数据增强技术的应用

对原始遥感图像进行随机裁剪,通过裁剪不同区域增加图像的多样性。应用图像翻转技术,包括水平翻转和垂直翻转,生成新的图像样本。使用旋转技术,将图像按特定角度进行旋转,进一步丰富数据集。实施色彩变换技术,调整图像的亮度、对比度、饱和度等,模拟不同光照条件下的图像表现。

2.特征工程与选择

进行特征提取,通过CNN自动提取高维特征,包括纹理、形状、光谱信息等。应用主成分分析技术,对高维特征进行降维处理,保留主要信息,去除冗余特征,降低计算复杂度。采用特征选择算法,筛选出对分类任务最有贡献的特征,进行特征标准化处理。

(二)模型压缩与加速技术

采用DSCN,通过分离深度卷积和点卷积,降低卷积操作的计算量。使用低秩分解技术,将高维卷积核分解为多个低维卷积核,实现计算量的显著减少。

应用全局剪枝技术,通过计算全模型参数的重要性分数,删除低重要性参数,实现全局参数的优化。采用层级剪枝技术,针对每一层进行参数筛选,保留重要参数,删除冗余参数。实施结构化剪枝,删除整个卷积核或神经元,使模型结构更加简洁。量化技术方面,将浮点数参数转换为低精度整数参数,减少存储需求和计算量。

四、实验结果与分析

(一)实验设置与数据集

实验在高性能计算集群上进行,配备多张NVIDIA Tesla V100 GPU。操作系统采用Ubuntu,深度学习框架使用TensorFlow和PyTorch,图像预处理和特征提取工具使用OpenCV和GDAL。实验设计包括确定目标和假设,设置多个对比实验组。评估标准采用分类准确率、精度、召回率和F1分数等指标,综合评估模型性能。

(二)分类性能分析

1.不同模型分类准确率比较

见表1,展示了DSCN、CNN和ResNet在不同数据集上的分类准确率。

深度可分离卷积网络在UC Merced Land Use Dataset和AID数据集上的分类准确率分别为94.8%和93.2%,显著高于传统CNN和ResNet。这表明DSCN在处理高分辨率遥感图像时,具备更高的分类精度和泛化能力。

2.模型在不同场景下的表现

DSCN在森林、城市和农田场景下的分类准确率分别为94.1%、95.2%和93.3%,在不同光照条件下的分类准确率分别为93.5%、94.6%和92.7%,在不同季节变化下的分类准确率分别为92.8%、93.9%和91.8%。这表明DSCN在复杂场景和变化条件下仍能保持高分类准确率,具有较强的鲁棒性和适应性。

3.深度可分离卷积网络优势分析

DSCN的参数量和计算量分别为7.2百万和2.3 GFLOPs,明显低于传统CNN和ResNet,而分类精度却达到94.0%,显示出其在计算效率、参数量和分类精度方面的综合优势。DSCN通过深度卷积和点卷积分离的结构,显著减少了参数量和计算量,同时在分类精度上保持领先,特别适用于高效处理高分辨率图像和复杂场景。

(三)模型复杂度与资源消耗

1.模型参数量与计算量

DSCN的参数量为7.4百万,而传统CNN和ResNet的参数量分别为12.7百万和10.1百万。计算量方面,DSCN为2.2 GFLOPs,低于CNN的4.6 GFLOPs和ResNet的3.5 GFLOPs。这表明DSCN在参数量和计算量上均显著低于传统模型,具备更高的计算效率和资源节省能力。

2.训练时间与推理速度

DSCN的训练时间为8.3小时,显著短于CNN的15.5小时和ResNet的12.8小时。推理速度方面,DSCN为12.4毫秒/图像,优于CNN的25.7毫秒/图像和ResNet的18.9毫秒/图像。DSCN在训练时间和推理速度上均表现出色,适用于需要快速处理和实时响应的应用场景。

3.存储需求与能耗分析

DSCN的存储需求为56.3MB,显著低于CNN的98.2MB和ResNet的78.5MB。能耗方面,DSCN为8.4Wh,同样低于CNN的15.7Wh和ResNet的12.3Wh。这显示出DSCN在存储和能耗方面的显著优势,适用于资源受限的硬件环境,能够在低功耗条件下高效运行。

(四)结果分析

通过对DSCN、CNN和ResNet在模型参数量、计算量、训练时间、推理速度、存储需求和能耗等各方面的数据进行比较分析,可以发现DSCN在多个关键指标上显著优于传统的CNN和ResNet。DSCN在参数量上比CNN和ResNet分别减少约41.7%和26.7%,计算量上比CNN和ResNet分别减少约52.2%和37.1%,训练时间上比CNN和ResNet分别减少约46.5%和35.2%。推理速度方面,DSCN比CNN和ResNet分别提升51.7%和34.4%,在存储需求上比CNN和ResNet分别减少42.6%和28.3%,能耗上比CNN和ResNet分别减少46.5%和31.7%。

五、结论与建议

(一)结论

DSCN在模型参数量、计算量、训练时间、推理速度、存储需求及能耗等多个关键指标上表现出显著优势。具体而言,与CNN和ResNet相比,DSCN的参数量和计算量均减少超过25%,训练时间及推理速度显著加快,存储需求和能耗大幅度降低。上述优势使得DSCN能够在保持高分类精度的同时,实现卓越的计算效率与资源节约,适用于资源受限的硬件环境及对实时性要求较高的应用场景。

(二)建议

第一,考虑采用最新的正则化方法与学习率调整策略,结合更丰富的数据增强技术,提高模型的泛化能力;第二,重点引入低秩分解与紧凑卷积核等技术,将高维卷积核结构分散为多个低维卷积核,显著减少计算复杂度;第三,未来研究可着重探索结合自适应权重调整机制、元学习技术及强化学习等前沿技术,提高DSCN在动态环境中的学习与自适应能力。

参考文献

[1]杨敏航,陈龙,刘慧,等.基于图卷积网络的多标签遥感图像分类 [J].计算机应用研究,2021,38(11):3439-3445.

[2]冯伟,龙以君,全英汇,等.基于SMOTE和深度迁移卷积神经网络的多类不平衡遥感图像分类算法研究[J].系统工程与电子技术,2023,45(12):3715-3725.

[3]牛鑫鑫,孙阿猛,王钎沣,等.基于深度学习的遥感图像分类研究 [J].激光杂志,2021,42(05):10-14.

[4]蒋正锋,何韬,施艳玲,等.融合卷积注意力机制与深度残差网络的遥感图像分类[J].激光杂志,2022,43(04):76-81.

[5]张港.基于深度学习轻量化卷积神经网络的遥感图像场景分类研究[D].南京:南京邮电大学,2022.

作者单位:晋中信息学院

■ 责任编辑:张津平、尚丹

猜你喜欢

深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究