APP下载

基于ResNet 神经网络的花卉图像分类研究

2024-12-01赵友山

电脑知识与技术 2024年32期

摘要:本研究基于计算机视觉和深度学习技术,提出了一种高效、准确的花卉图像识别与分类方法,采用基于残差网络(ResNet)的ResNet50卷积神经网络模型。相较于传统的人工识别方式,该方法显著提高了识别速度与准确性,同时降低了成本。实验验证表明,ResNet50模型在花卉识别和分类任务中表现出卓越性能:验证集准确率达82.771%,Kappa系数为0.825,表明该方法具有出色的一致性和相对于随机性的显著改进。此外,本文对ResNet模型的结构和性能进行了深入分析和讨论,为未来在花卉分类领域的研究和应用提供了有益的指导。本研究对推动植物学领域的数字化、智能化发展具有重要意义,为相关研究提供了有益参考。

关键词:深度学习;ResNet;花卉识别;花卉分类

中图分类号:TP18 文献标识码:A

文章编号:1009-3044(2024)32-0023-03 开放科学(资源服务)标识码(OSID) :

0 相关研究

随着计算机视觉和深度学习技术的快速发展及其广泛应用[1-2],将这些技术引入植物学研究领域,尤其是花卉图像分类任务中,对推动植物学研究的智能化和数字化发展具有重要意义。本文将重点关注和探讨计算机视觉技术,特别是基于深度学习的方法在花卉图像分类中的应用研究。

植物多样性是生态系统中的关键组成部分,对于生态平衡和生物多样性的维护至关重要。而在这个多样的植物世界中,准确识别和分类花卉是植物学研究的基础。传统的花卉分类方法通常依赖于人工观察和专业知识,这不仅费时费力,而且容易受到主观因素的影响[3-4]。因此,迫切需要一种高效、准确且自动化的方法来进行花卉分类,以推动植物学研究的发展[5]。

计算机技术在花卉分类上的应用为这一需求提供了新的解决方案。计算机视觉技术通过模拟人类视觉系统的工作方式,使计算机能够自动从图像或视频中提取信息。在花卉分类中,这意味着计算机可以学习和识别花卉的特征,实现对不同植物的自动分类。这种方法不仅能够加速花卉分类的过程,还能提高分类的准确性,减少人为误差。

本文将深入分析和讨论基于计算机视觉的方法在花卉图像分类任务中的应用效果,探究其技术优势和局限,并对未来可能的改进和发展方向进行展望。通过本研究,有望为植物学领域提供一种更为高效和精确的花卉分类方法,推动植物学研究迈向数字化、智能化的新阶段。

1 材料和方法

1.1 数据收集

本文使用了Oxford 开源的花卉数据集,该数据集包含102个来自世界各地的常见花卉类别,涵盖植物学中的多样性,包括小型花朵、中型花卉和大型花卉等不同类型。每个类别的图像数量在40到258张不等,均为在不同视角和光线环境下拍摄。这种设计使得数据集更具挑战性,更能模拟真实世界中花卉图像的多样性。图1展示了一部分节选的数据。

1.2 数据预处理

为了提升神经网络模型在训练过程中的准确性、鲁棒性和泛化能力,以应对各种复杂情况,对花卉数据集进行了必要的数据预处理。数据预处理主要采用了数据增强技术,包括以下步骤:

1) 随机裁剪。将原始图像按照其大小的90%进行裁剪,以生成输入。

2) 随机旋转。分别将原始图像旋转45°、90°和135°。

3) 高斯模糊。对部分图像进行高斯模糊处理,生成较模糊的图像作为输入。

通过这些数据增强操作,能够有效提升模型在不同情境下的适应性,并增强其在花卉分类任务上的性能。

1.3 ResNet 神经网络

ResNet(Residual Network) 由Kaiming He 等人于2015年提出,是一种深度神经网络架构[6]。其设计独特之处在于引入了残差学习的思想,通过使用残差块(Residual Blocks) 使信息在网络中更直接地传递,有效解决了深度神经网络中的梯度消失和梯度爆炸问题。这使得ResNet能够轻松训练数百层的深度网络,为图像分类等任务提供了强大的表征能力[7]。

在本研究中,选择ResNet50作为基础模型,原因在于其卓越的性能和对深层网络的有效训练。ResNet50的网络结构包含多个关键组件:

1) 输入层。接受大小为224×224像素的RGB图像,并通过一系列卷积、池化和规范化操作逐渐提取特征。

2) 第一卷积层。由7×7的卷积核组成,步幅为2,用于降低图像分辨率,随后的3×3最大池化层进一步提取特征。

3) 残差块。每个残差块包含两个卷积层和一个跳跃连接(残差连接),帮助缓解梯度消失问题,使网络更易于训练。整个网络被划分为四个阶段,每个阶段包含一系列残差块,这有助于从低级到高级学习不同层次的特征。

3) 全局平均池化层。通过计算每个特征图的平均值来降低空间维度,减少参数数量,从而帮助防止过拟合。

4) 全连接层。用于输出对不同花卉类别的概率分布。

ResNet通过引入残差连接,使网络可以更深,同时减轻了梯度传播的问题,这对于花卉分类任务中处理复杂特征是至关重要的。

1.4 迁移学习

迁移学习是一种机器学习方法,其核心思想是通过将已学到的知识迁移到新任务上,从而提高模型在新任务上的性能[8]。在计算机视觉领域,迁移学习通常使用在大规模图像数据上预训练的模型。此方法的优势在于预训练模型已经学会了通用的图像特征,可以在新任务中提供更好的初始化参数,进而缩短模型的训练时间。

1.5 ResNet 神经网络在花卉分类任务中的应用

本文通过使用在大规模图像数据集(如Ima⁃geNet) 上预训练的ResNet模型,充分利用其已学到的丰富图像特征,包括边缘、纹理和高级语义特征。这一选择的合理性在于,预训练的ResNet已经在各种图像任务中表现出卓越性能,通过迁移这些学到的特征,可以更为有效地训练模型,从而在花卉分类任务中取得更好的性能表现。

在花卉分类任务中,本文采用了迁移学习的方法,包括模型微调、特征提取和迁移多层特征。通过模型微调,本研究调整了预训练模型的权重,使之适应花卉分类任务的特定上下文,同时保留通用特征。通过使用预训练模型作为特征提取器,本研究冻结了大部分权重,提取模型中间层的高级特征以提高分类效率。利用ResNet的深层结构,本研究选择了不同层次的特征进行迁移,以更好地满足花卉分类任务的需求。

2 实验

2.1 实验环境

硬件实验环境的配置信息如下:CPU为Intel Corei9-12900K;内存为32 GB;显卡为RTX 4090,显存24GB。软件实验环境的配置信息为:操作系统为Ubuntu 22.04;Python版本为3.9;使用Pycharm 2022.3 进行开发;Pytorch版本为2.1.0,CUDA版本为11.8。

2.2 评价指标

本研究使用验证集的准确率和Kappa 系数作为模型评估的指标,以期达到更好的效果。

准确率(Accuracy) 是分类正确的样本占总样本个数的比例,其计算公式如方程(1) 所示。

Accuracy = TP + TN/TP + FP + FN + TN (1)

Kappa 系数是一种用于评估分类器在分类任务中性能的统计指标。它通过考虑随机一致性因素,提供了对准确度的更全面评估,其计算公式如方程(2) 所示。

Kappa = Po - Pe /1 - Pe (2)

Kappa 系数基于混淆矩阵,通过比较观察到的准确率(3) 和由随机猜测导致的准确率(4) ,提供了一个在类别分布不均匀时进行修正的方法。Kappa 系数的取值范围在−1到1之间,其中正值表示分类器的性能优于随机猜测,负值表示性能不如随机猜测,而0表示性能与随机猜测相当。

Po = TP + TN/TP + TN + FP + FN (3)

Pe = (TP + FP) ⋅ (TP + FN ) + (TN + FP) ⋅ (TN + FN )/(TP + TN + FP + FN )2 (4)

2.3 模型训练结果与分析

实验结果表明,将花卉数据集应用于ResNet50网络模型进行训练与验证时,经过250轮的训练,模型表现出令人瞩目的性能。图2和图3分别展示了训练集和验证集的准确率及损失(loss) 在训练过程中的变化趋势。

通过分析准确率曲线和损失曲线的变化,可以观察到ResNet50网络模型在训练初期实现了快速学习和优化。尽管在训练后期略有波动,但整体趋于平稳,这表明模型对训练数据具有出色的学习能力。

在ResNet网络模型的训练过程中,本研究采用了多种评价指标,如表1所示。其中,Kappa系数作为关键的性能评估指标,全面评估了模型在准确性方面相对于随机分类的表现。实验结果显示,当训练到第200个Epoch 时,验证集的准确率达到了最高,此时损失函数的值为1.025。ResNet50网络模型取得了显著的0.825的Kappa 系数,突显其在花卉分类任务中的卓越表现。较高的Kappa系数反映了模型在对102种不同花卉类别的准确分类上,已超越了随机猜测的水平。

此外,高Kappa 系数进一步表明相对于随机性,模型有显著的改进。即便在高准确率下,模型仍然远远超越了仅比随机分类稍好的水平。在稳定性方面,Kappa 系数计算考虑了分类错误和正确的概率,表现出模型对不同花卉类别的相对稳定的分类能力,不容易受到随机性的干扰。

总体而言,实验所取得的高Kappa 系数为ResNet50网络模型在花卉分类任务中的可靠性和卓越性能提供了有力支持。验证集上82.771%的准确率,以及模型相对较小的规模(参数数量为23.663 M,模型大小为9.296 M) ,进一步强调了其在实际应用中可能具备的广泛适用性。这一系列实验结果为本研究对模型分类结果的信心提供了坚实的基础。

3 讨论与总结

当前,花卉识别主要依赖于人工方法,但人工识别存在识别速度慢和需要专业知识等问题。为了解决这些问题,本研究应用计算机视觉和深度学习技术,提出了一种基于ResNet50神经网络的新方法,旨在识别和分类102 种常见花卉。在实验过程中,重点分析了ResNet50模型在花卉识别与分类中的表现,包括其准确率、模型大小、参数量以及Kappa 系数。实验结果表明,ResNet50模型在花卉识别方面具有较高的准确率,验证集的准确率达到82.771%,Kappa系数为0.825。

本研究提出的花卉识别方法通过实验验证了其可行性。未来的研究将致力于优化ResNet 模型的结构,以适应更多种类的花卉识别任务,并将轻量化的ResNet 模型移植到移动设备上。这些努力将进一步提升花卉识别技术的性能和实用性。

参考文献:

[1] 余杭. 基于激光雷达的3D目标检测研究综述[J]. 汽车文摘,2024(2): 18-27.

[2] 李涛, 等. 基于深度学习的金属表面缺陷检测[J]. 高师理科学刊, 2024, 44(1): 36-42.

[3] 张永伟. 野生草本花卉在园林中的应用:以塞罕坝机械林场为例[J]. 现代园艺, 2022, 45(10): 140-142.

[4] 牛素华. 露地花卉的分类及生长习性[J]. 现代农村科技,2022(3): 39-40.

[5] 黎施欣, 范小平. 图像处理与识别在果蔬成熟度监测中的研究及应用[J]. 包装工程, 2024, 45(3): 153-164.

[6] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learningfor image recognition[C]//Proceedings of the IEEE Conferenceon Computer Vision and Pattern Recognition. Las Vegas:IEEE, 2016: 770-778.

[7] 刘峻渟,周云成,吴琼,等. 基于卷积神经网络的番茄叶部病害识别方法[J].河南农业大学学报,58(2):287-297.

[8] 周旷, 姜名. 基于迁移学习的小样本目标识别研究进展与展望[J]. 航空科学技术, 2023, 34(2): 1-9.

【通联编辑:唐一东】