APP下载

基于图像处理的茶叶害虫智能识别方法研究*

2019-02-12潘梅李光辉周小波李玉玲曾文明

四川农业与农机 2019年2期
关键词:分类器害虫预处理

□潘梅 李光辉周小波,2 李玉玲 曾文明

/1.四川省农业机械研究设计院 2.南方丘区节水农业研究四川省重点实验室

0 引言

茶叶在中国有着深厚的文化内涵,深受全国人民的喜爱。茶叶种植在我国已有几千年的历史,福建、云南、四川等省份都有大量的茶叶种植地,但田间茶叶种植常年面临着多种害虫的侵蚀,这严重危害着茶叶的产量和品质。因此,茶叶识别害虫效率的高低直接决定着害虫治理的效果,影响着茶叶的产量和品质。对茶叶害虫的识别,传统的方法是依靠茶农自身经验或者他人传授经验等人工识别,这种方法需人工深入田间辨识,劳动强度大,无法实现害虫的自动定位与识别,不利于茶叶植保时施药的机械化、高效化及智能化。

图像处理技术始于20世纪20年代,是用计算机及相关技术对图像信息进行增强、复原、分割和识别等处理[1],从而实现图像分析、图像识别等目的。该技术具有处理信息量丰富、处理精度高等优点。目前,图像处理的应用已深入航空航天、生物医学、军事等诸多领域[2]。在现代农业方面,图像处理技术已应用于农作物长势监测、作物缺素识别诊断、农产品品质分级等。随着计算机技术、机器视觉技术等现代科技水平的不断提高,许多研究者已将图像处理技术应用于害虫识别中,但专门针对田间茶叶害虫智能识别的研究还较少,有待进一步深入研究并应用于实践。

1 茶叶害虫智能识别流程

基于图像处理的茶叶害虫智能识别系统的实现可分为两大阶段,一是生成分类器模型的训练阶段,二是利用分类器模型的预测阶段。其主要由以下识别流程组成(见图1):建立害虫样本图像库、图像预处理、害虫定位、特征提取、分类器设计训练与害虫识别。

首先,采用图像采集设备获取茶叶害虫样本图像、待识别图像等目标物的图像,建立覆盖茶园中可能出现的各种情况的害虫样本图像库;其次,对样本图像和待识别图像进行图像裁剪、对比度调整等图像预处理;接着,对预处理后的待识别图像进行颜色分割、边缘检测等操作,过滤出害虫区域,实现害虫自动定位;然后,对预处理后的害虫样本及定位出的害虫局部图像进行特征提取获得特征数据;最后,利用提取出的害虫样本特征数据、模式识别算法设计分类器并训练获得分类器模型,再采用该模型进行害虫预测,实现害虫智能分类,得到识别结果。

2 茶叶害虫智能识别方法

2.1 建立茶叶害虫样本图像库

在茶叶害虫智能识别系统中,害虫样本图像库的建立是第一步,也是系统的核心之一。图像库包括正样本图像集和负样本图像集。正样本是指待智能识别的茶叶害虫多形态、多角度图像,如黑刺粉虱、茶蚜等常见茶叶害虫的蛹、幼虫和成虫等不同形态、多角度、多场景图像。每一种害虫标记为同一类型,不同害虫标记为不同类型,以实现多种害虫多分类识别。负样本是指茶园环境中除正样本外的其他所有相关图像,即除系统拟识别的害虫以外的所有可能存在的干扰图像,如茶树叶、枯枝、杂草、土壤等图像。大量的正样本和负样本共同形成害虫样本图像库,样本图像库应该覆盖茶园中可能存在的各种害虫情况。样本选取的数量和样本选取的典型性决定了识别效果的好坏程度,丰富、多样的样本能够提高茶叶害虫种类判别模型的鲁棒性。

2.2 图像预处理

图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强茶叶害虫等有关信息的可检测性[3],从而改进害虫定位、特征提取和模式识别的可靠性。图像预处理主要包括图像裁剪、直方图均衡化、滤波去噪、轮廓提取、图像增强等操作。对于正样本图像,通过图像裁剪剔除茶树叶片等复杂背景、保留害虫图像必不可少。对于害虫待识别图像,由于其获取茶叶环境图像的角度、天气、光照等差异较大,对其进行光照、对比度调整是重要的预处理操作。预处理属于图像分析的低层处理,其处理结果对害虫定位的准确性和识别的精度有显著影响。

2.3 害虫自动定位

害虫定位主要是从包含茶树叶片、杂草、土壤等复杂背景的待识别图像中定位出害虫位置,得到仅包含害虫的局部图像。害虫定位采用的主要技术是图像分割。图像分割是把图像分成若干个特定的、具有独特性质的区域,进而提取出感兴趣目标的技术和过程[4]。对于茶叶害虫识别来说,就是提取出害虫及疑似害虫区域。图像分割方法分为基于阈值的分割、基于边缘的分割、基于区域的分割和基于特定理论的分割等。陈晶等首先采用SLIC 超像素算法进行初分割,再使用DBSCAN聚类算法进行二次聚类分割,实现了从复杂背景中定位茶小绿叶蝉图像[5];杨国国等应用一种基于全局对比度的显著性区域检测方法对复杂背景下的害虫目标进行定位[6]。另外,颜色空间、形态学处理、形状检测等操作也常用于害虫定位中,韩瑞珍基于HSV颜色空间模型,采用Otsu阈值分割方法实现图像背景和害虫目标的分割[7]。准确定位害虫是害虫分类识别的前提,其定位的精度直接影响识别结果的正确率。

2.4 害虫特征提取

特征提取是指从图像中提取有用的数据或信息,得到图像的数值、向量和符号等的表示或描述过程。具体而言,对于茶叶害虫智能识别系统的特征提取,就是将训练阶段的正负样本图像及预测阶段的害虫定位局部图像的典型特征属性采用数据方式进行表达、描述的过程。该过程获得的数值、向量和符号等的表示或描述就是图像的特征数据。常用的图像特征主要有颜色特征、纹理特征、形状特征和空间关系特征等[8]。对于自然环境中茶叶害虫的智能识别,选取的特征应对光照、旋转、尺度等具有不变性,即特征数据不受图像的光照明暗程度、旋转角度、远近大小等的影响。常用的茶叶害虫特征描述算子有SIFT 特征、SURF 特征、ORB 特征、HOG特征等。吴翔针对图像分割后的害虫目标,提取了形态、颜色和纹理等全局特征,同时利用SURF算法提取了害虫的局部特征用于建立分类模型[9];张永玲等将HSV颜色特征和HOG特征进行融合,采用稀疏表示识别模型实现了较高的农业害虫识别率和较低的误检率[10]。特征提取的数据是实现分类器训练生成分类预测模型的数据基础,图像特征选择的典型性和不变性可直接影响甚至决定预测结果的准确率。

2.5 分类器设计、训练与识别

分类器的设计与训练是利用特征描述数据,通过模式识别算法教会计算机识别图像,得到分类器模型以用于预测阶段的害虫智能分类的过程,其实质是机器学习(通过利用数据,训练出模型,然后使用模型预测) 的过程。该过程的核心是分类算法的选择和设计,常用的茶叶害虫分类算法有人工神经网络、Adaboost 算法、随机森林、SVM、贝叶斯分类及其改进算法和多种算法的融合应用等。许振伟将BP神经网络分类器应用于储粮害虫图像检测和识别中,实现了害虫的快速、高效检测和分类[11];潘春华等将SVM算法和区域生长结合,实现了烟粉虱等四类害虫的分类识别[12]。分类器的选取、设计和优化直接影响识别结果的正确率及计算机的处理速度,也直接影响茶叶害虫智能识别模型的稳定性和可靠性。

对待识别图像的害虫识别则是利用训练生成的分类器模型进行预测分类的过程。另外,害虫定位虽然可以去除大部分背景,定位到害虫,但仍然存在少量类似害虫的非害虫、误定位局部图像。这些误定位图像的特征与害虫的特征不同,通过训练好的分类器模型进行预测后可正确识别。

3 结束语

本研究对基于图像处理的茶叶害虫智能识别方法进行了研究和阐述。首先,对图像处理技术应用于茶叶害虫智能识别方面的必要性和研究现状进行了分析。接着,阐述了智能识别的具体实现流程和步骤。然后,对实现的主要步骤:建立茶叶害虫样本图像库、图像预处理、害虫自动定位、害虫特征提取、分类器的设计与训练、害虫智能识别等方面进行了方法研究和概述。本研究中的技术可为茶叶害虫智能识别的实现提供方法指导,与植保无人机等施药机械结合,可促进田间茶叶植保实现施药的机械化、高效化和智能化。这将明显减少人工操作的劳动强度、节约大量的人工成本,同时,大幅度提高茶叶的植保效率。

猜你喜欢

分类器害虫预处理
求解奇异线性系统的右预处理MINRES 方法
蜗牛一觉能睡多久?
高COD二噻烷生产废水预处理研究
冬季果树常见蛀干害虫的防治
枣树害虫的无公害防治
基于预处理MUSIC算法的分布式阵列DOA估计
基于差异性测度的遥感自适应分类器选择
草坪主要害虫的危害与防治
基于实例的强分类器快速集成方法
基于膜过滤的反渗透海水淡化预处理