基于蔬菜表型特征的病虫害识别技术研究
2024-03-22庞利民
庞利民
(宁波大龙农业科技有限公司,浙江 宁波 315000)
蔬菜病虫害是影响蔬菜生产的重要因素,传统的病虫害检测方法主要依靠人工观察和经验判断,具有效率低下、精度不高等缺点。随着图像识别技术的发展,利用基于深度卷积神经网络的蔬菜病虫害识别方法[1],可有效提高识别效率和准确性。结合RGB 和HSV 颜色空间信息,通过训练神经网络模型对病虫害图像进行自动分类,收集蔬菜病虫害RGB 格式的原始图像后,进行降噪、增强、转换等方式预处理,并计算RGB 图像的显著性图[2],利用阈值化技术得到二值图像,实现蔬菜表型病虫害的识别。
1 数据收集与预处理
基于图像识别的蔬菜表型特征的病虫害识别技术主要利用图像处理和机器学习算法,对蔬菜叶片、果实等部位进行特征提取和分类识别,主要分为图像收集、图像预处理、特征提取、分类识别和后处理等步骤。
图像预处理是病虫害识别的基础步骤,主要通过降噪、增强、转换等方式改善图像质量,提高后续处理的精度和稳定性。特征提取是从预处理后的图像中提取出与病虫害相关的表型特征,如颜色、形状、纹理等。分类识别是利用机器学习算法对提取的特征进行分类和识别,从而确定病虫害的种类和严重程度。后处理是对分类识别的结果进行进一步的处理和分析,如数据可视化、结果评估等。
图像预处理的去噪算法主要包括以下5 种。
1)Wiener 滤波算法。Wiener 滤波器是一种基于频域的滤波器,通过最小化噪声功率谱来去除噪声,Wiener 滤波器在去除噪声的同时尽量保留图像的细节。
2)高斯滤波算法。高斯滤波器是一种线性平滑滤波器,通过使用高斯函数对图像进行卷积来去除噪声,高斯滤波器在去除噪声的同时能够保持图像的平滑。
3)双边滤波算法。双边滤波器是一种非线性平滑滤波器,在保持图像边缘清晰的同时去除噪声。双边滤波器通过将像素点的值设置为邻域内像素点的加权平均值来去除噪声,其中权重的计算考虑了像素间的空间距离和灰度差异。
4)自适应滤波算法。自适应滤波器能够根据图像的局部特性自适应地调整滤波器的参数,以达到更好的去噪效果。常见的自适应滤波器包括自适应Wiener 滤波器和自适应中值滤波器等。
5)基于深度学习的去噪算法[3]。近年来,基于深度学习的图像去噪算法取得了很大的进展,这些算法通过训练深度神经网络来学习图像去噪的映射关系,能够在去除噪声的同时较好地保留图像的细节和纹理。
本研究采用Wiener 滤波算法,适合在蔬菜表型特征病虫害的识别。如式(1)所示。
式中:y(n)表示输出信号,X(n)表示输入信号,H(m)表示滤波器的冲击响应。
为了确定最佳的滤波器系数,Wiener 滤波器利用了最小均方误差MSE 准则,即最小化输出信号与期望信号之间的误差平方和。通过求解最优滤波器的系数,可以使得输出的均方误差最小[4]。
2 特征提取与表示
为了更好地表示蔬菜病虫害的特征信息,本研究采用了多种特征提取方法。利用颜色衰减技术从原始RGB 图像中提取出具有代表性的颜色特征,这一过程有助于减少冗余信息,突出蔬菜病虫害特征的颜色差异。此外,将原始RGB 图像转换为HSV 颜色空间,进一步提取出与人类视觉感知相近的颜色特征。同时,通过计算各颜色在整张图像中的比例,提取出更具有代表性的颜色信息。
使用K-means 方法对HSV 图像进行聚类,将HSV图像转换为K-means 算法可以处理的格式,K-means算法是一种无监督的机器学习算法,用于将数据点聚类成K 个不同的组。在此场景中,使用K-means 算法将HSV 图像中的像素聚类成若干颜色近似区域。计算RGB 图像的显著性图包括以下几个步骤。
1)计算区域间的距离和面积。在完成聚类后,需要计算区域间的距离和面积。对于区域内的像素点,需要计算像素点之间的空间距离Ds,以及任意其他区域的面积A(ri)。
2)计算RGB 颜色空间距离。RGB 颜色空间距离是衡量2 个像素颜色差异的重要指标。在RGB 颜色空间中,颜色差异可以通过比较像素值的差异来度量。Dr表示2 个区域的RGB 颜色空间距离[5]。
3)计算显著性值S。每个区域的显著性值S见式(2)。式(2)是基于颜色和空间信息的加权函数,用于衡量一个区域相对于其他区域的显著性。
根据K-means 方法将HSV 图像聚类成若干颜色近似区域,并根据式(2)计算在衰减的RGB 图像的对应区域内计算各区域的显著性值S。
式中:rk为当前区域,ri为任意其它区域,Ds为2 个区域中心点的空间距离,A(ri)为任意其他区域的面积,Dr为2 个区域的RGB 颜色空间距离。ε的取值区间为0.3~0.5。
Dr(r1,r2)的计算公式详见式(3)。
式中:p(cm,n)为第m 个区域中第n 种颜色所占的比例,D(c1,i,c2,j)为2 种颜色在衰减后的RGB 颜色空间中的距离,n1、n2分别为r1、r2区域中颜色的总数。
通过以上步骤,可以计算出RGB 图像的显著性图[6]。显著性图是一种反映不同区域显著性的图像,有助于突出图像中的重要信息,提高图像识别的准确性和效率。在后续的图像处理和分析中,显著性图可以作为重要的特征输入到深度卷积神经网络中进行训练和分类。
3 基于深度卷积神经网络的分类模型
深度卷积神经网络(CNN)是一种深度学习的算法模型,广泛应用于计算机视觉领域。本研究采用CNN 作为主要的分类模型,通过训练学习从输入的蔬菜病虫害图像中提取出有价值的特征信息。
具体而言,构建一个包含多个卷积层、池化层和全连接层的神经网络模型。在训练过程中,将前面提取的特征输入到神经网络中进行学习分类。通过反向传播算法不断调整网络参数优化模型的分类性能,同时采用交叉验证等技术防止过拟合现象的发生,进一步提高模型的泛化能力。
蔬菜图像数据的准备对卷积神经网络的深度学习模型训练有着重要影响,当样本数据数量不足的时,会严重影响模型训练或者导致训练的模型泛化程度不够,识别率与准确率不高。通过基于标准化方法和基于生成对抗网络的深度学习方法进行蔬菜长势与病虫害数据集的增强。蔬菜数据增强标准化方法如图1所示。
图1 蔬菜数据增强标准化方法
基于生成对抗网络的深度学习方法进行蔬菜病害数据增强,对生成的数据进行分类,该网络有利于对数据的学习,并且实现数据增强,即数据处理和分类器训练可以在内存中同步处理,不需要另外的数据存储空间。
在病虫害识别和程度分析上采用了VGG 模型作为基础模型,并使用预训练和参数微调的方式来加速网络收敛。
VGG 模型是一种卷积神经网络模型,VGG 模型首先从蔬菜图像中提取特征,然后通过分类器对这些特征进行分类,以确定是否存在病虫害以及其种类。
为了提高模型的泛化能力,采用预训练和参数微调的方法,在大型图像数据集上训练模型,然后将其用作其他任务的初始化模型,再使用特定任务的训练数据对模型进行微小的调整,使其更适合该任务。
4 模型训练与优化
为了训练高效的蔬菜病虫害识别模型,采用合适的优化方法来更新网络参数并最小化分类误差,算法包括梯度下降、随机梯度下降、Adam 等。根据试验效果选择合适的优化器以及调整超参数(如学习率等)来提高模型的训练效果。在训练过程中,采用批归一化技术加速训练进程并提高模型的泛化能力,同时采用早停法防止过拟合现象的发生,提高模型的性能。
二值图像所指代区域作为初始区域,以GrabCut算法经分4 次迭代分割所述二值图像所指代的RGB 图像区域,获得蔬菜病虫叶片目标。
基于二值图像分割病虫害目标的方法主要包括以下几个步骤。
1)预处理和阈值化。预处理原始RGB 图像,包括降噪、归一化等操作,以提高图像质量。利用阈值化技术将图像转换为二值图像,以便于后续的区域提取和分割。
2)提取初始区域。在二值图像中,以通过形态学操作、区域增长算法等技术将连通的病虫害目标区域作为初始区域。
3)GrabCut 算法迭代分割。使用GrabCut 算法对初始区域进行迭代分割,以获得更精确的病虫害目标。GrabCut 算法是一种图像分割算法,通过迭代优化一个能量函数来获取最优的分割结果。
4)迭代次数控制。GrabCut 算法经过至多4 次迭代来分割初始区域。在每次迭代中,算法会根据图像的特征和先验知识来更新分割边界,直到达到预定的迭代次数或满足收敛条件。
5)后处理和提取。对分割得到的病虫害目标进行后处理,如去除噪声、平滑边界等,以提高目标的准确性和完整性。根据处理后的结果提取出害虫或蔬菜叶片目标,并进行必要的特征提取和分类识别。
通过以上步骤,基于二值图像分割病虫害目标的方法能够有效地从原始RGB 图像中提取出病虫害目标,为后续的识别和分类提供准确可靠的特征信息。这种方法能够降低误判率,提高识别精度,为农业病虫害监测和防治提供有力的技术支持。
5 技术应用
基于图像识别的蔬菜表型特征的病虫害识别技术为现代农业发展提供了有力支持,具有广阔的应用前景和发展空间。基于图像识别的蔬菜表型特征的病虫害识别技术可以应用于各种类型的蔬菜生产中,如叶菜类、根茎类、果菜类等。通过应用该技术,可以实现对蔬菜生长过程的实时监测和记录,对不同生长阶段的各种病虫害风险进行预测和预警,提前采取防治措施,减少病虫害的发生和扩散。同时,该技术还可以为蔬菜生产提供科学依据,优化生产管理,结合大数据和人工智能技术,实现病虫害防治方案的智能化推荐和决策支持,提高蔬菜的产量和质量。随着技术的不断进步和应用领域的拓展,该技术将为农业生产带来更多创新和价值。
6 优势与局限性
基于图像识别的蔬菜表型特征的病虫害识别技术具有以下几种优势。1)自动化程度高,可减少人工成本。2)检测精度高,可避免传统检测方法中的人为误差和漏检问题。3)可实现实时监测和预警,有利于提前采取防治措施。4)可优化生产管理,提高蔬菜的产量和质量。
然而,该技术也存在一定的局限性,对于复杂背景或光照不均的图像处理效果较差。对于不同品种、不同生长环境的蔬菜可能需要进行特定的训练和学习,对于一些特殊或罕见的病虫害种类可能会出现误判或无法识别的情况。随着人工智能和计算机视觉技术的不断发展,基于图像识别的蔬菜表型特征的病虫害识别技术将进一步优化和完善,提高识别精度和速度,通过改进算法和优化模型,提高病虫害识别的准确度和处理速度。实现多模态信息融合,将图像信息与气象、土壤等其他类型的数据进行融合,进一步提高识别准确度。
7 结束语
基于图像识别的蔬菜表型特征的病虫害识别技术是一种高效、准确的蔬菜病虫害检测方法。该技术通过自动化地提取和分类蔬菜表型特征,能够快速、准确地检测和识别蔬菜病虫害的种类和发生程度,为及时采取防治措施提供科学依据。该技术的应用有利于提高蔬菜生产效率、质量和安全性,促进农业可持续发展。该技术还有望在智能农业、精准农业等领域得到更广泛的应用和发展,是现代农业信息技术的重要组成部分。