基于人工智能的竹类主要害虫识别系统开发与应用

2021-05-17李非非舒智慧

世界竹藤通讯 2021年2期

李非非杨帆余飞季猛舒智慧徐杰

(1 成都星亿年智慧科技有限公司成都 610095； 2 电子科技大学成都 611731； 3 邛崃市规划和自然资源局成都 611500)

竹子作为典型的生态经济型植物，是我国重要的生态、产业和文化资源。加快竹产业健康持续发展，对推动生态文明建设、推进农业供给侧结构性改革以及促进农民就业增收具有重要意义。四川省独特的自然条件，形成了以丛生竹为主，丛生竹、散生竹、混生竹兼有的竹资源富集区，竹林面积达116余万hm2，居全国首位，产业发展潜力巨大。目前在竹类虫害防治工作中，对害虫种类的识别严重依赖于专业人员鉴定，但在我国基层森林管护体系中具备相关专业知识的人员稀缺，通常无法准确判断虫害发生种类并及时采取有效防治措施，进而将导致森林经营效益受损[1]。随着计算机技术的快速发展，利用电脑代替人工对特定物体进行精确判别已成为可能，由此衍生出了对害虫图像进行计算机识别分类的技术[2-3]，可以有效解决当前森防实践中存在的判断偏差和防治延误等问题。然而，在现有计算机识别系统的主流应用中，大多是以传统的图像识别技术为基础，识别模型以浅层次结构为主，对图像的特征提取依赖人工设计的提取器，导致识别准确率较低，难以满足在复杂生态环境下对害虫进行精准识别的森防工作实际应用要求。近年来，以人工智能深度学习技术为代表的图像识别技术展现出了突出的优势，智能识别模型采用了更深层次的网络结构，且模型靠自身提取图像特征，避免了人为干预。目前，卷积神经网络(CNN)、VGG网络、残差网络(ResNet)等深度学习模型已广泛应用于许多领域的图像识别[4-6]，并已取得显著的应用效果。

目前，深度学习技术在农林业害虫识别领域已取得了一些初步研究成果，如陈娟等[7]针对北方园林害虫识别问题，提出了一种基于改进残差网络的害虫图像识别方法，通过在残差块中添加卷积层和增加通道数提取更多的害虫图像特征，优化超参数，提高了害虫识别准确率。钱蓉等[8]构建了基于VGG16卷积神经网络的水稻害虫智能识别模型，该模型采用VGG16卷积神经网络为核心网络结构,根据水稻害虫的个体特征和自然场景，对VGG16网络的卷积层局部调整，优化主要模型参数，实现了水稻害虫的智能识别。然而这些方法大多基于传统的深度学习识别模型，对差异较大的害虫类别识别效果较好，但容易忽略子类别间细微的差异，导致识别准确率不高。为解决上述问题，对以深度卷积网络为基础的细粒度图像识别模型的研究逐渐成为重点[9-10]，为更准确的识别害虫提供了全新的技术手段。

在当前四川省竹产业大发展的有利背景下，将人工智能技术引入竹子的经营管理，并逐步将以计算机、互联网、人工智能等高新技术为代表的科技支撑手段应用于竹产业发展的各个方面，实行精细化管理以提升生产效益，是竹产业高质量发展势在必行的趋势，具有极其重要的现实意义。鉴于此，本文论述了基于人工智能技术开发的竹类主要害虫识别系统(以下简称“系统”)原理及构架，并分析了其在四川省邛崃市相关竹产业基地实际森防场景中的应用情况。

1 系统概况

1.1 系统整体结构

本系统由应用服务器、数据存储和用户软件3大部分构成，系统结构图如图1所示。应用服务器作为整个系统核心部分，包含识别服务器和云服务器，其中：识别服务器内嵌人工智能算法以实现害虫识别的核心功能；云服务器主要提供地理信息系统(GIS)、系统各种请求响应等相关远程服务。数据存储部分主要存储竹类害虫细粒度数据集以及系统运行数据。用户软件部分主要实现在移动设备客户端的具体操作，例如害虫拍照上传、害虫定位等。

1.2 用户软件总体功能框架

用户软件作为直接面向用户的操作平台，系统的所有功能均是通过其予以直观呈现。用户软件总体功能包含“虫情”“地图”“识虫”“互动”和“用户”5大功能模块，其中“识虫”为用户软件的核心功能模块，其余功能模块均是为了更好地服务于核心功能而设置的辅助功能模块。用户软件功能框架如图2所示。

图1 系统结构图Fig.1 The diagram of system structure

图2 用户软件功能框架图Fig.2 The software function framework for users

1.3 害虫智能识别流程

对害虫进行智能识别是本系统的核心功能，该功能由用户软件、害虫识别服务器和云服务器共同配合完成，其主要工作流程如下(图3)：

1) 通过用户软件上传目标害虫图片到云服务器，经云服务器处理后将图片发送至识别服务器；

图3 害虫智能识别流程图Fig.3 The process of intelligent recognition for pests

2) 识别服务器对接收到的害虫图片再次进行预处理后通过人工智能识别模型对图片进行细粒度识别；

3) 识别服务器将识别结果和准确率经云服务器反馈至用户软件展示(图4)。

图4 用户软件识别结果界面Fig.4 The recognition result interface of user software

2 人工智能识别模型

实现对害虫的精准识别依赖于人工智能识别模型的构建，人工智能识别模型的关键技术及相关实验结果分析如下。

2.1 构建细粒度实验数据集

数据集是搭建人工智能识别模型的重要前置基础条件。在实验中，通过在生态环境中拍摄高质量照片，构建了一个包含竹类主要害虫在内的120种虫类、图片数量超过8 500张图片的基础图片数据集。

神经网络需要大量已完成标记的图片数据来训练其学习能力，而本文实验数据集图片数量有限，因此采取了人工智能研究中常用的数据增强技术，以有效扩充图片数量。数据增强也叫数据扩增，是在不实质性增加数据的情况下让有限的数据产生等价于更多数据的价值[11-12]。对于本次采用的实验数据集，通过翻转、旋转、随机裁剪、调节亮度、对比度、饱和度等方法来倍增样本数量，经数据增强后的橙粉蝶图片如图5所示。

图5 经数据增强后的橙粉蝶图片Fig.5 The butterfly pictures enhanced by data

2.2 基于Inception V3神经网络搭建人工智能识别模型

卷积神经网络(CNN)是深度学习中的重要模型。卷积神经网络结构主要由卷积层、池化层、全连接层以及最后的输出层构成，通过卷积和池化等操作，提取图像特征用于识别，最后输出识别结果。

GoogLeNet(Google Inception Net)是卷积神经网络的一种结构，GoogLeNet的核心思想在于增加网络深度和宽度以提高卷积神经网络性能，在增加神经网络宽度方面主要采用深度卷积网络Inception[13-14]，如图6所示。Inception V1是Inception网络的第1个版本，在随后的几年里，研究人员对Inception神经网络进行了数次改进以增强其性能，本文实验便是基于最新的Inception V3神经网络搭建了害虫识别模型。

图6 Inception结构图Fig.6 The structure of Inception

在Inception结构中，i×i Convolutions表示在卷积层使用i×i大的卷积核来提取虫类图像特征，3×3 Max Pooling表示图片每3×3矩阵输出一个最大值。

传统版本的Inception神经网络使用3×3的卷积核会带来巨大的计算量，Inception V3神经网络引入了“分解为小卷积”的思想，将1个较大的二维卷积拆成2个较小的一维卷积，比如将3×3卷积拆成1×3卷积和3×1卷积，且在每个卷积层后加入ReLU激活函数来增加模型的非线性，如图7所示。Inception V3神经网络相比于图像识别领域的其他神经网络模型，增加了模型的深度和宽度，在显著减少参数和计算量的同时也减轻了过拟合[15]。

图7 Inception V3卷积拆分结构图Fig.7 The split structure of Inception V3 convolutions

2.3 实验结果与分析

本文实验所使用的计算机GPU为2块RTX2080，操作系统为Ubuntu16.04.7 LTS，英伟达显卡驱动版本为450.80.02，CUDA版本为11.0。实验使用Python语言，深度学习框架为Pytorch。

实验中，数据集被分为训练集和测试集2个独立的部分。其中训练集用于训练模型，测试集用于检验经筛选的最优模型的识别性能。实验中训练集使用Adam优化器，基本学习率参数设置为1e-4，权重衰减系数为1e-5，采用以32张图片为一组的小批量训练，共进行30轮训练，参数学习率训练至第8轮下降0.3，训练至第14轮再下降0.3，此后不再调整。

在已构建的实验数据集中随机选取2 000张图片进行数据增强后对Inception V3神经网络进行训练。在训练完成的基于Inception V3神经网络搭建的害虫识别模型上使用533张分辨率大小为299×299的图片进行测试，结果显示识别效果良好，平均准确率达98.9%，除2种天牛识别准确率未达到90%、十斑大瓢虫和蚜虫准确率未达到100%外，其余种类识别准确率均达到100%(表1、图8)。

表1 实验识别准确率Tab.1 The recognition accuracy of experiments

图8 实验识别准确率条形图Fig.8 The bar graph of the experimental recognition accuracy

3 系统在森防场景中的测试

系统在开发完成后针对模型的识别准确率进行了测试，获得了较好的结果。本次在森防场景中，对应用服务器、数据存储和用户软件方面对系统进行整体测试，以期在自然生态条件下对系统的实际识别准确率、稳定性、可操作性等关键方面进行验证，为后期在森防领域推广应用本系统积累经验。

3.1 测试地的选择

根据《四川省竹产业发展规划(2017—2022年)》，四川省将构建“一群三带+其他区”的竹产业发展格局，以邛崃市为核心的“龙门山竹产业带”被规划定位为四川省现代竹业发展格局中的重要组成部分。邛崃市竹林总面积3.26万hm2，占全市土地总面积的23.6%，占全市林地总面积的45.7%。邛崃市竹产业基地已经形成一二三产业协同发展的较为完善的产业链条，是成都市乃至四川省现代竹产业发展重要区域，具有极大的发展潜力。因此，鉴于在竹类资源面积、竹类害虫丰富度、森防及森林管护队伍体系等方面的优势，选择在四川省邛崃市相关竹产业基地开展工作，具备相应测试基础条件且具有示范意义。

3.2 测试内容

3.2.1 测试人员范围

系统开发的主要目的是为竹产业基地森防工作提供有效的科技支撑，在后期森林经营过程中引入精细化管理措施，提升竹产业基地整体效益。为保证测试过程有组织、有计划的推进，测试结果能顺利收集，测试在邛崃市林业系统内进行，由当地林业主管部门的基层森防、森林管护及其他相关人员参与测试，参与人数共计48人。

3.2.2 测试时间段

在理想状态下，测试时间段应涵盖主要竹类害虫的全生命周期，以便有机会识别已录入数据集的害虫的各时期形态，根据四川省的实际情况，观察竹类害虫的周期从4月至10月为最佳。

测试于2020年4月开始，但由于疫情及洪灾等不可抗力的影响，测试时间段被迫压缩且未能够高密度连续进行，实际测试工作主要集中在5、6、7、9、10月期间，其他月份则零星开展测试活动。在测试完成后根据实际测试效果评估，测试过程中已监测到邛崃市有记录的绝大部分竹类主要害虫，基本达到了测试预期目的。

3.2.3 测试方法

所有参与测试的基层管护人员均在移动设备上安装智能识别APP，按照常规森林管护计划对各自负责区域内的相关竹产业基地进行巡护，巡护线路不预设，在巡护过程中对沿线随机发现的虫类(包括但不仅限于竹类害虫)在自然生态条件下进行多次拍摄并利用智能识别APP进行即时识别。由此，可得到各种类害虫在不同时段、不同背景、不同光线及不同角度的大量现场图片，进而测试本系统在复杂且有干扰的森防场景中的实际识别效果。

3.3 测试效果

本次测试有效拍摄虫类种类共计63种(未纳入数据集的虫类无法识别)，其中竹类害虫共计18种[16]，其余为在竹林内发现但不对竹林造成显著危害的其他虫类。按照系统设置，拍摄一张图片即完成实时识别一次，本次纳入统计范围的18种竹类害虫共计拍摄图片2 191张，识别2 191次。实际识别准确率以该类害虫的识别正确次数除总共识别次数计算得出。

经统计，实际识别准确率最高为100%，最低为84%，平均实际识别准确率为96.26%，其余45种其他虫类的平均实际识别准确率也达到该水平。可见，本识别系统在自然生态条件下的识别率效果较好，达到了预期目标。

表2 竹类主要害虫实际识别准确率统计Tab.2 The actual recognition accuracy statistics of the main bamboo pests

表2(续)

另外，在测试中系统网络通信良好，响应速度达标，多人同时在线使用未发生掉线、卡顿、系统崩溃等情况，相关人员经简单培训后均可熟练操作使用。

3.4 问题分析及解决方案

3.4.1 影响实际识别准确率的因素

1) 目标特征显著性的影响。目标特征的显著性是影响系统实际识别率的重要因素，在对本次纳入统计的18种竹类主要害虫的实际识别准确率情况进行统计后发现，实际识别率较低均是由于特征相似或特征不明显而导致，如十斑大瓢虫和双带盘瓢虫，大足象和长足大竹象这类害虫具备较为相似的外形特征，山窗萤、竹梢凸唇斑蚜等则个体较小特征不明显，对于个体较大、特征显著、虫体色彩鲜明的害虫，其实际识别准确率均普遍较高。

2) 拍摄条件的影响。在自然生态环境下，如光线、天气、背景等外部因素可导致所拍摄的目标害虫图片出现形态畸变、色彩失真等情况，以及相机分辨率，拍摄目标的完整度、清晰度等，这一系列因素均可对实际识别准确率造成较大影响。

3.4.2 解决方案

就本次测试所发现的问题，提高识别准确率的路径应分为2个方向：一是加强人员培训，使其在实际操作过程中尽量保证规范拍摄，最大限度地在所拍摄的标本图片中突出目标特征，确保清晰度；二是加强数据集的收集，增加虫类的标本图片，扩展广度，为神经网络训练提供更加充分的大数据基础，修正完善算法，提高识别准确度。