APP下载

温室甜瓜自动采摘系统目标检测模型及空间定位研究

2022-04-30赵华民LAWALOlarewaju许德芳

广东农业科学 2022年3期
关键词:网络结构甜瓜摄像头

赵华民,LAWAL Olarewaju,许德芳

(1.山西农业大学农业工程学院,山西 太谷 030801;2.吕梁学院经济管理系,山西 吕梁 033001)

【研究意义】甜瓜(Cucumis meloL.)在我国种植广泛,是一种深受大众喜爱的夏季水果[1]。目前甜瓜以温室种植较多,其成熟期温室内温湿度较高,且藤蔓及果实上遍布绒毛,人工采摘环境较差[2]。随着智能农机迅速发展,采摘机器人成为研究热点。采摘机器人作业的首要步骤是快速准确地对目标进行识别和定位。甜瓜采收期枝叶繁茂,目标果实大多被叶片和藤蔓遮挡,温室内光照变化等对甜瓜 的自动化采摘目标识别带来很大挑战。建立YOLOResNet70 模型,使甜瓜在光照变化和叶片藤蔓遮挡严重情况下自动采摘快速识别,并结合RGB-D 视觉传感器实现目标的空间定位具有重要意义。

【前人研究进展】基于机器视觉的目标检测和识别技术近年来发展迅速,深度学习的突破性进展为计算机视觉技术在农业视觉任务中的应用铺平道路[3-5],如卷积神经网络(CNN)可以自动直接从输入图像中提取复杂特征[6]。目前常用的目标检测网络分为以Faster R-CNN 为代表的Two-stage 检测网络和以YOLO 为代表的Onestage 两 种。Inkyu 等[7]采 用Faster R-CNN 对 哈密瓜等水果的RGB 图像和近红外信号进行混合检测,取得良好的检测效果,F1值达到84.8%,但是对于小目标的检测速度需要提升。Bargoti等[8]同样基于Faster R-CNN 方法研究果园水果检测,F1值超过90%,但对密集型水果的检测有遗漏。虽然Two-stage 检测方法效果较好,但是相比One-stage 检测方法,其速度远不能满足移动设备的需求。YOLOv3 是最流行的One-stage 目标检测方法之一,与Two-stage 的目标检测方法相比,其可在一个网络中直接预测目标的边界及其相应类别,速度大幅提升[9]。YOLOv3 使用DarkNet53(1,2,8,8,4残差块排列方式)为主干网络,并在3 个不同尺度上预测对象〔类似于特征金字塔网络(FPN)[10]〕,其改进版为YOLOv4。YOLOv4 的AP 比YOLOv3 和检测速度(FPS,帧/s)分别提高10%和12%,由CSPDarknet53 主干网、空间金字塔池化(SPP)[11]、作为Neck的路径聚合网络(PANet)和YOLOv3 头部组成。CSPDarknet53 主干网通过Mish 增强CNN 的学习能力[12]。在不降低网络运行速度的前提下,加入SPP 可以显著增加接收野,分离出最重要的上下文特征。在YOLOv4 中,PANet 代替YOLOv3中使用的FPN来收集不同比例的特征。Jocher等[13]提出的YOLOv5 采用CSPNet 主干进行特征提取,PANet 得到特征金字塔,YOLOv3 头部进行最终检测,比YOLOv4训练时间短,检测速度大幅提升,但其精度较YOLOv4 稍差。目前部分学者已将YOLO 模型应用于水果采摘目标检测,如Koirala等[14]采用改进的YOLOv3进行芒果实时检测研究,F1值达到96.8%,AP 达98.3%,但其速度只有14 FPS;Zheng 等[15]应用深度学习在大量水果数据集上进行分类和目标检测研究,分类准确率达99%以上,检测准确率达92%以上,并且针对温室端到端的检测任务,从速度、准确性和鲁棒性3 个方面对YOLOv3 网络进行了改进,其中针对甜瓜的检测在速度为40 FPS 时AP 达到87.36%,但是其数据集针对的是没有遮挡的甜瓜的检测。Rahnemoonfar 等[16]提出一种改进的inception-ResNet 网络用于水果计数,该方法对图像的精度可以达到91%。另外,Liu 等[17]提出一种采用圆形边界框代替矩形边界框的YOLO-tomato 模型,该模型以YOLOv3 为主框架,采用DenseNet为主干网络,AP 达到93.91%,但由于其权重文件太大导致检测速度过慢。Lawal 等[18]同样提出基于YOLOv3 的西红柿检测模型,AP 可以达到99.3%。武星等[19]研究基于轻量化YOLOv3的苹果检测方法。在目标空间定位研究方面,孙力等[20]研究了基于TOF 成像技术的柑橘实时识别与定位,自然生长状态下柑橘的识别正确率达86.7%。王玲等[21]研究了基于结构光SR300 深度相机的褐蘑菇原位测量技术。冯青青等[22]、程伟[23]分别研究了采用结构光视觉传感器的果实定位技术。【本研究切入点】从以上研究可以发现,对YOLO 模型的网络结构进行针对特定检测目标的优化可以大幅度提高检测精度,并且采用基于结构光的深度摄像头能够实现采摘目标的空间定位。截至目前,很少学者对甜瓜的检测进行研究,特别是在叶片藤蔓遮挡严重情况下的检测模型未见报道。【拟解决的关键问题】本研究基于改进的YOLOv3 模型,提出一种鲁棒性好、精度高、速度快的YOLOResNet70 模型用于温室复杂光照和枝叶遮挡情况下的甜瓜检测,并且研究将模型与结构光传感器融合实现甜瓜空间定位的算法,为甜瓜采摘机器人的研究提供理论和技术支持。

1 材料与方法

1.1 数据集建立及训练平台

数据集图像采自山西省太谷县侯城乡侯城村甜瓜种植温室。采用华为Mate10pro 拍摄,分辨率为3 968×2 976。选择不同光照强度、不同时段进行拍照,以保证数据集更具有随机性,训练模型对光照鲁棒性更好。图1 展示了不同情况下的数据集图像,共810 张,分别按照75%、15%、10%划分为训练集、验证集和测试集。采用labelImg 标注成YOLO 格式的数据集[24],类别为一个甜瓜类,共得到2 562 个目标边界框,标注后的数据集图像如图2 所示。模型训练和测试采用的计算机配置如下:AMD Ryzen 5 3600x CPU,32 GB RAM,NVIDIA GeForce GTX 1080Ti GPU,CUDA v10.2,cuDNN v7.6.5,OpenCV v4.2.0。YOLOv5 采用PyTorch 平台,其他模型在DarkNet 平台上实现。

图1 不同光照和遮挡环境下的甜瓜Fig.1 Muskmelons under different illumination and occlusion

图2 LabelImg 标注后的甜瓜数据集图像Fig.2 Image of muskmelon data set after LabelImg annotation

1.2 网络优化及测试

One-stage 检测模型一般由主干网络(Backbone)、颈部(Neck)和头部(Head)3部分网络组成。主干网络从输入图片中提取重要特征,颈部网络生成特征金字塔来识别不同大小和尺度的同一目标,头部网络完成最终检测。常用的主干网络有VGG、ResNet、SqueezeNet、DenseNet 等,其中ResNet 是由He 等[25]提出。ResNet 引入如图3 所示的快捷连接(Short cut),以解决CNN 层数增加时的网络退化问题,将1×1 卷积层添加到网络的开始和结束,从而减少网络参数,而不会降低网络性能,其优秀的性能使ResNet50 和ResNet101 等网络在目标检测模型中得到广泛应用,本检测网络同样采用ResNet的网络结构。颈部网络FPN、BiFPN[26](Bidirectional feature pyramid network)、PANet 等 是不同类型的特征金字塔技术。FPN 是一种简单有效、自顶向下的通道,PANet 提供自底向上的路径,BiFPN 允许自顶向下和自底向上连接。研究表明,不同的主干网络与颈部网络搭配对检测网络的准确率有很大影响[26],因此研究不同主干网络和颈部网络的结合对探测器具有重要意义。不同的激活函数对网络性能也有影响,目前最先进的激活函数是Leaky ReLU 和Mish,同样需要根据网络参数进行优化。根据Huang 等[27]研究,SPP 是一个特征增强模块,提取特征图的主要信息并进行拼接,该SPP 网络有助于提取同一检测阶段的多尺度全局特征和局部特征,如果提取的特征图形状被模糊,目标甜瓜的位置信息将变得不准确甚至丢失。为避免漏检和降低检测精度,采用SPP 网络。数据集中的甜瓜存在多个重合的情况,需要采用GreedyNMS 进行候选框合并,从多个重叠候选框中选择一个最佳候选框,因此将GreedyNMS 应用到检测网络中。

图3 ResNet 网络的Shortcut 链接结构Fig.3 Shortcut link structure of the ResNet network

主干网络的选择方面,首先根据DarkNet53残差块排列形式,结合ResNet 网络结构,提出ResNet70 代替YOLOv3网络的DarkNet53,网络结构如图4 所示。ResNet70 网络的残差块的排列采用与DarkNet53 相同的1,2,8,8,4 布置形式,加上最后的全连接层共70 层。通过将ResNet 架构引入检测模型能够训练更深入的网络,解决网络退化问题,加快网络收敛速度,实现更深层次的网络和丰富的信息特征提取。因为主干网络为ResNet70,基于YOLOV3 进行优化,所以命名为YOLOResNet70。为提高检测速度,YOLOResNet70 模型将YOLOv3 原有的6 个检测层裁剪为4 层,并通过13×13、26×26、52×52 特征向量对3 个检测尺度进行反馈。在YOLOResNet70 中,使用FPN 作为Neck来获得特征金字塔模型,Neck 接收了主干网络生成的特征向量,使模型能更好地进行对象缩放。为优化网络检测性能,通过对比检测模型的主干网络、激活函数、SPP、颈部网络结构、损失函数来优化最佳网络结构,并与YOLOv3、YOLOv4、YOLOv5 进行比较,训练和测试结果如表1 所示。

图4 YOLOResNet70 网络结构Fig.4 YOLOResNet70 network structure

表1 不同检测模型的网络结构Table 1 Network structure of different detection models

模型锚框(Anchor)的大小是在模型训练前通过甜瓜数据集中计算得出。采用k 均值聚类算法生成9个锚框,并根据检测层的3 个尺度嵌入模型中。为改进甜瓜检测模型,将9 个锚框按第1 个尺度到第3 个尺度的降序分别分配到其他模型配置文件中。模型接收416×416 像素的输入图像,学习率为0.001,迭代数设置为4000;batch 和subdivision 分别设置为64 和32,以减少内存使用;动量和衰减分别设为0.9 和0.0005。YOLOv5使用auto-anchor 生成,训练300 个epoch,初始学习率为0.01,动量为0.937,权重衰减为0.0005。同时,使用随机初始化方法初始化训练YOLOResNet70 和YOLOResNet50(主干网络为ResNet50)模型的权值,使用官方预训练权值训练YOLOv3、YOLOv4 和YOLOv5 模型。

模型性能采用精确率(Precision)、召回率(Recall)、F1分数和AP(Average Precision)进行评估。精确率是正确检测到的甜瓜数量与检测到的甜瓜总数量之比,召回率是正确检测到的甜瓜数量与数据集中甜瓜总数量之比,F1分数同时兼顾精确率和召回率,能显示训练模型的综合性能。各参数计算公式如下:

式中,TP 为正确检测甜瓜数,FN 为漏检甜瓜数,FP 为错误检测甜瓜数。平均精度AP 描述了模型在不同置信阈值下的整体性能,定义如下式所示:

2 结果与分析

2.1 YOLOResNet70 优化结果分析

不同网络结构的YOLOResNet70 模型性能如表2 所示。通过更换模型的主干网络,SPP 等部分对比得出最佳的模型网络结构。由表2 可知,SPP 和PANet 两部分网络对模型的权重大小影响明显,未添加SPP 的YOLOResNetA 和YOLOResNetC 的模型大小为164 MB,添加SPP的YOLOResNetB 和YOLOResNetD 的模型大小为188 MB;加 入PANet 的YOLOResNetE 和 加入BiFPN 的YOLOResNetF,其模型大小分别增加到227 MB 和223 MB,表明PANet 对模型尺寸的贡献大于FPN 和BiFPN。表2 中几种优化下的模型交并比(IOU)均大于50%,表明模型预测结果较好,然而它们之间性能也有差异,使用SPP 的YOLOResNetB 和YOLOResNetC 模型相比较A 和D,其F1分数分别从79%和84%上升到85%,说明SPP[11]对模型性能提升作用明显。SPP 网络从ResNet70 骨干网中分离出最重要的特性。与YOLOResNetB 和YOLOResNetD 相比,YOLOResNetE 和YOLOResNetF 的F1评分最低,表明本模型FPN 比PANet 和BiFPN 对模型性能提升更有效。

表2 不同网络结构的YOLOResNet70 性能Table 2 YOLOResNet70 performance of different network structures

由表2 可知,对比F1分数,YOLOResNetC和YOLOResNetD 的Mish 激活函数优于YOLOResNetA 和YOLOResNetB 的Leaky 激活函数,但在AP 指标下Leaky 优于Mish 激活函数。AP 被认为比F1分数更准确,因为其从全局显示精确率和召回率(P-R)关系。图5 为6 个网络将IOU 阈值设置为50%时的P-R 曲线,性能较好的模型其P-R 曲线应具有较大的曲线下面积(AUC),因此YOLOResNetB 的性能优于其他模型。

图5 不同网络结构的YOLOResNet70 网络P-R 曲线Fig.5 P-R curves of YOLOResNet70 networks of different network structures

模型的检测速度以FPS 衡量,与权重文件的大小成反比,权重文件越大,检测深度越慢。在没有SPP 的情况下,YOLOResNetA 的64.9 FPS 和YOLOResNetC 的66.6 FPS 均比YOLOResNetB(61.8 FPS)、YOLOResNetD(62.1 FPS)、YoloResnetE(54.7 FPS) 和YOLOResNetF(49.3 FPS) 快,且带有PANet 的YOLOResNetE 的检测速度比嵌入BiFPN 的YOLOResNetF 快。以速度指标衡量时,采用Mish 激活函数的模型比Leaky 激活的模型表现更好,表明在本模型中Leaky 激活对检测精度有较好效果,Mish 激活函数对检测速度有较好效果。此外,与文献中FPN、PANet 和BiFPN 影响模型检测性能[26]的结论不同,应用FPN 的YOLOResNet70 模型其检测性能优于PANet 和BiFPN。综合考虑AP 和检测速度,由于YOLOResNetB 和YOLOResNetD 的AP 和FPS 差异分别为1.2%和-0.4%,因此得出YOLOResNetB模型为最佳模型,命名为YOLOResNet70,由Leaky 激活函数、SPP 网络和FPN 组成。

2.2 YOLOResNet70 与现有模型比较

YOLOResNet70 与现有模型对甜瓜的检测性能比较结果(表3、图6)显示,YOLOv5 权重文件最小、检测速度最快,但其准确性较低;YOLOv4 的AP 性能优于YOLOv3、YOLOResNet70和YOLOv5,主要是由于CSPDarknet53 骨干网络深度更深,但其检测速度不如YOLOResNet70和YOLOv5。由表3 可知,在检测速度方面,YOLOv5 系列中以YOLOv5s 最快,YOLOResNet50次 之,随后是YOLOResNet70,YOLOResNet70比YOLOv3 和YOLOv4 约快14%。虽然YOLOv4在AP 方面大于YOLOResNet70,但两者差异(1.6%)非常小;YOLOResNet50 检测速度较快,但AP 较YOLOv4 低5.1%。综合检测速度和AP,YOLOResNet70 检测速度比YOLOv4 快14%,AP比YOLOv5 提升7.4%,拥有较好的检测性能。从图6 可以看出,YOLOv4 的P-R 曲线略优于YOLOResNet70,而YOLOResNet70 的P-R 曲 线优于YOLOv3 和YOLOv5。

表3 YOLOResNet70 及现有网络的性能比较Table 3 Performance comparison between YOLOResNet70 and existing networks

图6 YOLOResNet70、YOLOv3、YOLOv4 和YOLOv5s 的P-R 曲线Fig.6 P-R curves of YOLOResNet70,YOLOv3,YOLOv4 and YOLOv5s

2.3 模型鲁棒性测试

甜瓜检测过程中叶片和藤蔓遮挡、光照变化会影响检测结果的准确性[18]。为验证YOLOResNet70 模型鲁棒性,本研究从测试集中选取29 张甜瓜图片,其中包含叶片遮挡和藤蔓遮挡等情况的甜瓜共100 个,并采用曝光增强和曝光减弱的方法进行图像增强[28],然后进行测试,并与YOLOv3、YOLOv4 和YOLOv5s 检测结果进行对比,采用精度(Precision)、Rcall 和F1分数进行评价。

由表4 可知,YOLOv3 漏检个数为15 个,而YOLOResNet70 是6 个、YOLOv4 为5 个、YOLOv5s 为8 个,这是由于YOLOv3 模型中没有SPP 网络,其F1分数的排序也与前文相同。本节中测试图片中的甜瓜大部分被叶片和藤蔓严重遮挡,因此对模型的检测能力要求更高。图7 中红色椭圆标出的甜瓜为YOLOResNet70 和YOLOv4漏检的甜瓜,其被遮挡面积超过50%;蓝色椭圆标出的甜瓜被YOLOResNet70 检测到,其他模型都未检测到。

图7 YOLOResNet 70(A)和YOLOv4(B)模型漏检甜瓜Fig.7 Muskmelon missed detection in YOLOResNet 70 and YOLOv4 models

表4 未进行图像增强数据集检测结果Table 4 Detection results of data sets without image enhancement

经数据增强后图像的检测结果见表5、表6。对比表5 结果,YOLOResNet70 的F1分数在两种情况下仅分别降低0.8、1.8 个百分点,且F1值比YOLOv4 高0.5 个百分点,表明其鲁棒性良好;YOLOv3、YOLOv5 模型正确检测个数下降明显,表明其鲁棒性稍差。图8 为YOLOResNet70 模型检测结果。YOLOResNet70 对数据增强后的部分图像检测结果如图9 所示。

表6 曝光降低后数据集检测结果Table 6 Data set detection results after exposure reduction

图8 未增强数据集YOLOResNet70 检测结果Fig.8 Detection results of YOLOResNet70 without enhanced data set

图9 曝光增强和降低后数据集YOLOResNet70 检测结果Fig.9 Detection results of YOLOResNet70 with enhanced data set and reducted data set

表5 曝光增强后数据集检测结果Table 5 Data set detection results after exposure enhancement

2.4 基于RealSense D435i 的甜瓜距离检测

通过采用YOLOResNet70 模型,得到甜瓜在图像中的X 和Y 坐标,但如果需要机械手进行采摘,还需获取甜瓜的实际坐标,因此需要采用深度摄像头与YOLO 算法进行融合,将图中的像素坐标转换为实际坐标,并且通过深度摄像头的深度测量得到甜瓜距离摄像头的实际距离(即Z 坐标)。本研究选择基于结构光原理的Intel RealSense D435i 作为测距摄像头。Intel RealSense D435i 可以通过识别目标的像素坐标和深度值获取目标点的真实坐标,其具体原理如图10 所示,其 中Target_xy_pixe l[x]、Target_xy_pixel[y]表示检测物体在图中的像素坐标,Target_xy_true[x]、Target_xy_true[y]表示被测物体的实际坐标,ppx、ppy 为相 机的基本内部参数,可以通过cvsprofile.get_intrinsics()命令获取。坐标计算公式如下:

图10 物体实际深度和实际坐标计算示意图Fig.10 Schematic diagram of actual depth and coordinate calculation

式中,Target_xy_pixel[x]、Target_xy_pixel[y]可通过目标检测模型获取,相机可以采用 get_distance(Target_xy_pixel[0]、Target_xy_pixel[y])计算得到物体的Target_depth,最后计 算Target_xy_true[x]、Target_xy_true[y],即可求出物体的实际X、Y、Z 坐标,以便后期通过机械臂进行采摘。

2.4.1 Intel RealSense D435i 距离检测实验 根据前文原理分析,本研究通过将英特尔RealSense SDK2.0 的Python 包装程序pyRealsense2 集成进YOLO 测试程序,采用YOLOResNet70 模型进行甜瓜实际距离检测实验,研究算法的可靠性。实验设备图如图11 所示,通过检测程序控制深度摄像头检测挂在对面的仿真甜瓜及藤蔓,根据实际采摘机械臂长度设置藤蔓距离摄像头的距离500 mm 和700 mm。由于甜瓜藤蔓吊挂后,上面的甜瓜错落排列在不同平面上,因此通过移动挂甜瓜藤的不锈钢架来改变距离,测试两种距离下摄像头及算法的检测准确性和检测能力。

图11 甜瓜深度距离测试实验设备Fig.11 Experimental equipment for measurement of muskmelon depth distance

实验中首先将摄像头红外光线发射面与不锈钢架距离500 mm,然后开启检测程序,运行后检测截图如图12 所示。从图12 可以看出,由于距离较近,摄像头视野较小,只有3 个甜瓜在摄像头视野内并被成功识别;在检测界面右下角,不断输出3 个检测框中心像素的实际坐标和实际距离。实际距离测量方式如图13 所示,每个瓜的测量距离量距离为甜瓜预测框中心点到摄像头红外光发射面的垂直距离。

图12 仿真距离500 mm 时检测截图Fig.12 Detection screenshot at 500 mm of simulation distance

图13 实际距离测量示意图Fig.13 Diagram of actual distance measurement

从摄像头距离支架500 mm 时的甜瓜检测和距离测试结果(表7)可以看出,手动测量距离与摄像头测量的距离差距很小。表8 和图14 为支架距离摄像头700 mm 时检测结果,由于甜瓜和藤蔓相对架子的平面凸出,因此检测到的甜瓜距离比架子距离小。由表8、表9 可知,程序控制深度摄像头测定距离准确,能够达到实际应用的要求。

表7 仿真距离500 mm 时检测目标实际距离和实际坐标Table 7 Actual distances and coordinates of the targets detected at 500 mm of simulation distance

表8 仿真距离700 mm 时检测目标实际距离和实际坐标Table 8 Actual distances and coordinates of the targets detected at 700 mm of simulation distance

图14 仿真距离700 mm 时检测截图Fig.14 Detection screenshot at 700 mm of simulation distance

2.4.2 遮挡目标距离检测 甜瓜采摘时叶片遮挡严重,为研究甜瓜被叶片遮挡时的距离测量问题,设计甜瓜被叶片遮挡时的距离测量实验。如图15所示,实验设计3 个被叶片遮挡的甜瓜,从左起第2、3、6 号甜瓜,其中2、3 号检测卡中心点在甜瓜上,而6 号甜瓜其检测框中心点在叶片上。检测结果(表9)显示,2 号和3 号甜瓜虽然被遮挡,但是其目标框中心点仍在甜瓜上,因此深度摄像头测量的距离为到甜瓜的距离,而6 号甜瓜其遮挡叶片正好在目标识别框的中心点上,因此深度摄像头测量的距离为到此叶片的距离,与到甜瓜的距离有一定差距,需要继续改进检测程序。

图15 叶片遮挡时测距实验截图Fig.15 Screenshot of distance measurement experiment with leaves block muskmelons

表9 目标遮挡实验检测数据Table 9 Detection data of object occlusion experiment

3 讨论

采摘目标的精确快速识别和定位是自动采摘机器人采摘成功的基础。本研究基于YOLOv3 模型,在对比采用不同主干网络、FPN、激活函数和是否采用SPP 等不同组成结构的基础上,得出最佳YOLOResNet70 网络模型结构。该模型采用ResNet70 网络作为主干,以Leaky ReLU 作为激活函数,用SPP 避免漏检和减少误差,以FPN 作为颈部网络用于获取特征金字塔,GreedyNMS 用来提升检测效率和准确度,采用CIoU 损失函数时为最佳的检测网络结构。表明通过对检测模型的不同部分进行调整、组合可以实现更好的目标检测结果,这也是目前基于深度学习的目标检测网络的重要优化措施,本研究的优化措施可为其他果实采摘目标检测网络的优化提供重要借鉴。

本研究得出的检测模型专门针对不同光照强度和不同遮挡情况采集数据集进行训练优化,通过不同模型的鲁棒性检测对比,发现该模型在不同光照环境下对严重遮挡的甜瓜检测F1分数优于YOLOv3 和YOLOv5 模型,与YOLOv4模型相似,表明本研究提出的模型在不同情况下对温室甜瓜检测都具有良好的稳定性。与其他已发表的研究结果相比,尽管数据集甜瓜遮挡较严重,但YOLOResNet70 模型的性能相比YOLOv3-DarkNet53(AP 为88.93%,40 FPS)在CropDeep[15]数据集和RetNet-ResNet50(AP 为87.36%,13 FPS)在Deepfruits[7]数据集上对哈密瓜的检测性能分别提升0.47%和2.04%。

通过将YOLOResNet70 模型与RealSense D435i深度视觉传感器融合实现对目标真实坐标的准确定位。但是对叶片遮挡甜瓜的定位会产生一定误差,需要提高检测精度,可采用双摄像头从不同角度检测,以弥补单摄像头的不足,这是本课题需要继续研究的一个关键问题。

本研究仅针对众多甜瓜中一种薄皮甜瓜的目标检测模型进行了参数优化,对其他品种甜瓜的检测结果还有待验证和继续研究,未来研究中可以继续采集不同品种的甜瓜图像,并针对多个甜瓜品种优化得出更具有通用性的目标检测模型,以适应所有甜瓜的采摘目标检测需求。采集全部品种的甜瓜图像形成完整的甜瓜数据集也是另一项需要继续深入的工作,能为未来其他学者的研究提供数据集支持,为甜瓜自动采摘设备早日成型、减轻农民的劳动强度提供支持。

4 结论

本研究针对甜瓜温室复杂光影和遮挡生长条件下甜瓜果实检测困难的问题,优化得出一种YOLOResNet70 模型。与目前主流网络结构相比,YOLOResNet70 网络比Faster R-CNN、YOLOv3、YOLOv4 和YOLOv5 网络具有明显的速度优势,检测速度比YOLOv4 提升14%,精度比YOLOv5提升7.4%,更加利于在低功率移动设备上使用。模型具有较好的鲁棒性,在不同光照强度下都具有良好的检测稳定性。对曝光增强和曝光降低的图像,其检测F1分数值分别达95.8%和94.8%,表明模型能适应温室复杂的光照环境。优化得到的模型与Intel RealSense D435i 摄像头结合能够实现检测目标的空间定位,且距离定位准确、误差小,能够达到实际使用需求。

猜你喜欢

网络结构甜瓜摄像头
试论分布式计算机网络结构分析与优化
带通信配网故障指示器故障监测方法及安装分析
一种电脑专用摄像头
非常规突发事件跨组织合作网络结构演化机理研究
我喜欢吃甜瓜
甜瓜有多重
无法开启摄像头的解决方案
购买摄像头的经验
找出摄像头花屏的“罪魁祸首”