APP下载

基于Light-ResNet50的番茄病害检测可视化平台开发与研究

2024-09-26林祺烨王增宇王润泽

现代信息科技 2024年14期

摘 要:为了及时准确地识别和监测番茄病害,通过Flask框架开发一种基于改进Light-ResNet的番茄病害网页系统,系统使用预训练ResNet50模型作为基础网络,通过添加注意力机制、深度可分离卷积实现了ResNet50网络的轻量化改进及识别精度优化,并对其进行微调以适应番茄病害识别任务。最后通过将最终模型Light-ResNet50与传统ResNet50网络相对比,结果表明模型参数量缩减了39.84%,最终精度为97.27%,该系统具有更高的准确性和鲁棒性,为番茄生产提供了可靠的决策支持工具。

关键词:ResNet;迁移学习;注意力机制;深度可分离卷积

中图分类号:TP391.4 文献标识码:A 文章编号:2096-4706(2024)14-0049-06

Development and Research of a Tomato Disease Detection Visual Platform

Based on Light-ResNet50

LIN Qiye, WANG Zengyu, WANG Runze

(Jilin Agricultural University, Changchun 130118, China)

Abstract: In order to timely and accurately identify and monitor tomato diseases, a tomato disease Web system based on improved Light-Res Net is developed using the Flask framework. The system uses a pre trained ResNet50 model as the basic network, and achieves lightweight improvement and recognition accuracy optimization of the ResNet50 network by adding Attention Mechanism and Depthwise Separable Convolutions. It is also fine tuned to adapt to the tomato disease recognition task. Finally, by comparing the final model Light-ResNet50 with the traditional ResNet50 network, the results show that the model parameter quantity is reduced by 39.84%, and the final accuracy is 97.27%. The system has higher accuracy and robustness, providing a reliable decision support tool for tomato production.

Keywords: ResNet; Transfer Learning; Attention Mechanism; Depthwise Separable Convolution

0 引 言

农作物作为生活中不可或缺的组成部分,关系着大众的日常生活,关乎国家经济的繁荣稳定发展。番茄作为我国的重要经济作物之一,其生长期间易受到多种病害的干扰,对番茄产量的影响极为严重。但传统的番茄病害防治方法主要依靠农民的经验和肉眼观察,这种方法存在判断不准确、反应时间慢、防治措施不恰当等问题,使得防治效果受到了很大的限制。然而随着计算机技术和人工智能技术的不断发展,农作物病虫害识别技术已经得到了广泛应用,可以大大提高识别的准确性和效率。利用计算机视觉和深度学习等技术,可以快速准确地识别出农作物病害,为农业生产提供重要的技术支撑。目前,通过深度学习和计算机视觉技术,可以识别出多种作物病害,为农业生产的智能化和数字化发展提供了有力的支撑。因此,在当今时代,通过深度学习技术的发展,农作物病虫害识别的研究,不仅可以有效地遏制病虫害的蔓延,降低农业生产的损失,提高农产品的市场竞争力,也可以推进农业现代化的进程。本文基于Light-ResNet50番茄病害检测可视化平台开发与研究,针对番茄病害问题采用基于改进的Light-ResNet50模型进行识别与分类,可有效提高准确度,抑制病害的蔓延,降低农业生产的损失,具有非常重要的应用前景。

1 设计思路与方案

农作物病虫害识别系统是一种基于人工智能技术和计算机视觉技术的应用系统,本文通过图像识别和分类技术,自动识别出农作物病虫害的类型和程度,为农民提供有效的防治措施和技术支持。以下是设计思路与对应方案:

1)数据采集和处理:系统需要采集大量的农作物病虫害图像数据,并对其进行处理和标注,建立起庞大的数据集,以便进行模型训练和优化。

2)模型训练和优化:通过深度学习和计算机视觉技术,建立起农作物病虫害的识别模型,并对其进行训练和优化,提高识别准确率和识别速度。

3)系统设计和开发:基于识别模型,设计和开发出具有可视化界面和交互性的农作物病虫害识别系统,方便农民进行操作和使用。

4)数据分析和应用:通过数据分析和应用技术,对识别结果进行统计和分析,为农民提供农作物病虫害的预警和防治方案,以及农业生产的指导和决策支持。

2 模型训练

2.1 数据集收集

本文数据集选AI Challenger 2018病害分类数据集的番茄病害分区,此数据集包含番茄健康叶片样本和患有白粉病、疮痂病、早疫病、叶霉病、斑点病、斑枯病、黄化曲叶病毒病等11类样本,共12 882张图片。

2.2 数据集预处理

在本次研究中,为了增强模型的鲁棒性和泛化能力。通过调整尺寸、影像裁剪、归一化、颜色抖动对图像进行了预处理,因ResNet50输入的尺寸为224×224,以下关键步骤和详细描述便以此为例。

2.2.1 调整尺寸

先将图片较短的那条边,随机缩放到[256,480]这样一个范围内。注意,此时的图片是等比例缩放的。举个例子,原始图片的尺寸为[1 000,800,3],假设图片短边缩放到256,那么此时图片的尺寸即为[320,256,3],即图片的长宽比例是不变的[1]。

2.2.2 影像裁剪

将图片进行水平翻转,然后从原图片和翻转后的图片中,随机裁剪出224×224的图片。假设裁剪过后的图片尺寸为[256,256,3],如果按照步长为1,最多可以裁剪出(256 - 224)×(256 - 224) = 1 024张,再加上水平翻转的图片乘以2,也就是2 048张图片。一张图片扩展了2 048倍,因结果较为夸张,所以,可根据测试计算机性能进行随机裁剪[2]。

2.2.3 归一化

具体做法就是统计数据库中所有图片的每个通道的均值和标准差,每个通道分别减去训练集该通道平均值[3]。

2.2.4 颜色抖动

对于每张图片,每个通道的数据先由二维转成一维(例如256×256×3,转成65 536×3),再对该图片(65 536×3)三个通道求出协方差矩阵(3×3),再求出协方差矩阵的特征向量p和特征值λ,最后执行Python中的广播机制,即图片每个通道65 536个像素点都加上同一个数[4]。

在预处理结束后,通过数据集划分脚本将数据集按照8:2划分为train和test两个数据集。

2.3 模型选择

2.3.1 残差网络

残差结构使用了一种shortcut的连接方式,也可理解为捷径。让特征矩阵隔层相加,所谓相加是指特征矩阵相同位置上的数字进行相加[5]。残差网络结构如图1所示,残差单元分为两种情况,浅层残差网络如(ResNet18、ResNet34)使用Basic Block如图1(a)所示,深层残差网络如(ResNet50、ResNet101、ResNet152)使用Bottleneck如图1(b)所示[6]。两者区别在于Bottleneck其中第一层的1×1的卷积核的作用是对特征矩阵进行降维操作,第三层的1×1的卷积核是对特征矩阵进行升维操作,将特征矩阵的深度变回输入深度,从而让特征矩阵隔层相加。而Bottleneck降低特征矩阵的深度主要是为了减少参数的个数。下面为了方便比较将输入的特征矩阵深度都设为256,所以Basic Block和Bottleneck的参数个数为[7]:

Basic Block:256×256×3×3 + 256×256×3×3 = 1 179 648

Bottleneck:1×1×256×64 + 3×3×64×64 + 1×1×256×64 = 69 632

由此可见在深层残差网络中Bottleneck对减少参数个数具有显著性效果。

此外在降维时的shortcut通过步长为2的1×1的卷积核进行了维度处理让特征矩阵在长宽方向降采样,从而实现隔层相加,在残差单元中用虚线表示[8],如图1(c)和(d)所示。

2.3.2 迁移学习

迁移学习是一种机器学习的方法,指的是一个预训练的模型被重新用在另一个任务中。具体就是将为任务A开发的模型作为初始点,重新使用在为任务B开发模型的过程中,通过从已学习的相关任务中转移知识来改进学习的新任务[9]。按照迁移方式的不同,通常将迁移学习分为样本迁移、特征迁移、模型迁移和关系迁移四类,其中参数迁移为本研究采用的方法。通过深度学习网络利用参数迁移方法能够更快、更好地完成模型训练。在病虫害图像分类中,即先采用预训练CNN模型参数迁移,后对病虫害图像进行特征提取,再利用全连接层和分类器完成场景分类任务[10]。

2.3.3 实验环境

在进行实验时,我们使用了特定的实验环境以确保研究的准确性和可重复性。这些参数涵盖了硬件、软件和其他配置,通过这些环境设定,我们能够在一致的条件下进行实验,以得出可靠的结果并进行对比分析。本文采用的实验环境如表1所示。

2.3.4 对比实验

本次实验利用PyTorch框架提供的在ImageNet数据集上训练的ResNet网络模型进行参数迁移并分别测试ResNet34、ResNet50、ResNet101的随机初始化权重参数训练网络和微调网络,设置微调网络的学习率为0.000 1,随机初始化训练学习率为0.01,下降方式采用自适应调整方法,batch_size = 16,分别训练30个Epoch并记录测试集准确率、测试集准确率最高时Epoch数,平均训练时间及总训练时间,训练结果如表2所示。

通过训练集准确率和训练时间综合比较,可以看到ResNet50微调模型在数据集上表现最优,所以接下来选择ResNet50进行模型优化,并且通过随机初始化训练和微调网络的对比可以看出,虽然本次实验的病害数据集和ImageNet数据集有一定的差异,但是从中学习到的一些低级特征还是可以为模型训练提供显著的帮助。

2.3.5 模型优化

本次优化实验本文通过分布进行来比较不同优化操作对模型性能的具体影响,首先是将原有的ResNet50模型中的Bottleneck模块中3×3的卷积核替换为深度可分离卷积和逐点卷积并在后面分别接上BN层和ReLU激活函数。进行轻量化改进后的模型params相较于原先的ResNet50模型由原来的26 699 120缩减为15 538 792,对比实验结果如图2、图3所示。

可以看到通过深度可分离卷积改进的ResNet轻量化网络相较于原始ResNet模型,在参数减少了41.8%的情况下其拟合曲线以及精度都并无出现显著降低的现象,由此可以看出通过深度可分离卷积对ResNet模型的改进是可行的。

随后将ResNet50网络的最后一层添加CBAM注意力机制,同样使用深度可分离卷积进行轻量化操作最终实验结果如图4所示。

由图4可得出,在相同Epoch下添加了CBAM注意力机制模型可以达到更高的精度并且参数量为16 063 178,相较于原来的26 699 120模型参数量缩减了39.84%,最终精度为92.27%。由此得到了Light-ResNet50作为最终训练模型。

3 可视化平台开发

本文在提出Light-ResNet50模型的基础上,用Python语言在Anacoda编译环境下,利用第三方库,实现对已有的病虫害数据集进行图像特征提取。利用jinja2和Flask,设计登录界面及后端接口并使用JavaScript编写供用户传入图片的前端接口,最后由Python flask编写的后端接口读取上传图片数据,后端接口接收数据并对样本数据进行处理后将其分类。同时为了方便用户更加便捷使用平台,为此添加了登录注册系统、百度百科系统以及历史记录系统具体如图5所示。

4 结 论

番茄病害给番茄生产造成巨大损失,由于传统作物病害识别存在诸多问题,使防治效果受到了很大的限制。为解决问题,本研究提出了一种基于改进的轻量化模型Light-ResNet50,并开发相应可视化平台,通过选取10类番茄病害进行试验,最终结果表明,本文基于改进的Light-ResNet50模型相较于原模型参数缩减39.84%,最终精度为92.27%,验证其有效性并成功开发出对应可视化平台,满足实际生产需求。

参考文献:

[1] 刘梦雅,毛剑琳.一种改进池化模型对卷积神经网络性能影响的研究 [J].电子测量技术,2019,42(5):34-38.

[2] 徐述腾,周永章.基于深度学习的镜下矿石矿物的智能识别实验研究 [J].岩石学报,2018,34(11):3244-3252.

[3] 陈科圻,朱志亮,邓小明,等.多尺度目标检测的深度学习研究综述 [J].软件学报,2021,32(4):1201-1227.

[4] 杨文龙,郭明钰.轻量级注意力X射线矿石检测方法 [J].电子测量技术,2022,45(18):71-79.

[5] 吕建成,叶庆,田煜鑫,等.类脑超大规模深度神经网络系统 [J].软件学报,2022,33(4):1412-1429.

[6] 何东健,王鹏,牛童,等.基于改进残差网络的田间葡萄霜霉病病害程度分级模型 [J].农业机械学报,2022,53(1):235-243.

[7] 曾伟辉,唐欣,胡根生,等.基于卷积块注意力胶囊网络的小样本水稻害虫识别 [J].中国农业大学学报,2022,27(3):63-74.

[8] 刘庆珲.基于图像的柑橘分级方法研究 [D].北京:北京邮电大学,2020.

[9] 万军杰,祁力钧,卢中奥,等.基于迁移学习的GoogLeNet果园病虫害识别与分级 [J].中国农业大学学报,2021,26(11):209-221.

[10] 许景辉,邵明烨,王一琛,等.基于迁移学习的卷积神经网络玉米病害图像识别 [J].农业机械学报,2020,51(2):230-236+253.

作者简介:林祺烨(2002—),男,汉族,福建莆田人,本科在读,研究方向:机器视觉、计算机网络;王增宇(2002—),男,汉族,吉林长春人,本科在读,研究方向:机器学习、深度学习;王润泽(2002—),男,汉族,吉林长春人,本科在读,研究方向:数据科学与大数据技术。

DOI:10.19850/j.cnki.2096-4706.2024.14.010

收稿日期:2024-01-12

基金项目:吉林省大学生创新创业训练计划项目(S202310193051)