基于PP-ShiTu 的快递轻薄件识别系统设计
2023-12-08吴蓬勃张金燕王拓张静
吴蓬勃,张金燕,王拓,张静
(1.石家庄邮电职业技术学院,河北省高校快递智能技术与装备应用技术研发中心,河北石家庄,050021;2.河北工程技术学院,河北石家庄,050091)
0 引言
近年来,作为现代流通体系重要组成部分的邮政快递业正向着数字化、智能化方向快速发展。随着交叉带分拣、摆轮分拣、AGV 分拣等技术的不断成熟,快递包裹的分拣效率逐步提高;但是,快递包裹中占比10%以上的超轻、超薄异形件[1~2]仍然需要人工分拣,分拣效率一直无法提高。
经分析发现:传统分拣机主要依靠包裹自身重力脱离分拣机托盘,进而落入指定格口实现分拣;但是轻薄件无法通过重力掉落并且易吸附在分拣机托盘上,从而导致轻薄件无法上机分拣。
本文基于飞浆PP-ShiTu 图像识别系统,设计了轻薄件智能识别系统,结合机械臂抓取和AGV 搬运等设备,可实现快递轻薄件的智能分拣,从而降低作业人员劳动强度、提高分拣效率。
1 系统总体设计
系统架构图如图1 所示,系统主要包括:NVIDIA AGX嵌入式平台(以下简称:AGX 平台)、机械臂、3D 相机、路由器和AGV 分拣机器人。AGX 平台通过网络分别连接3D相机和机械臂;3D 相机对轻薄件进行三维图像采集;AGX平台对采集的图像进行物体识别和定位,并将轻薄件三维位置信息发送给机械臂;机械臂抓取轻薄件,首先扫描底部条码并放置到AGV 托盘上,如果底部扫描到条码,则AGV 开始进行分拣作业,如果底部未扫描到条码,则进行顶部条码扫描,如果扫描到条码,则AGV 开始分拣作业,如果两次都未扫描到条码,则AGV 将轻薄件倒入拒识格口,由人工进行分拣。
图1 系统架构图[3]
本系统主要包括:轻薄件识别、图像坐标到机械臂坐标的转换两个部分,本文重点对第一部分进行介绍,第二部分请参考文献[3]。
2 模型选择与训练
■2.1 模型选择
快递轻薄件在运输中会出现脏污、翻滚、相互挤压变形等情况,各异的形态会导致一些轻薄件的识别率下降,需要再次采集数据并进行模型训练和更新;模型训练和更新耗时越短,对生产作业的影响越小。
因此,本系统选用了可快速进行模型更新的PPShiTuV2(PP-ShiTu 的第2 个版本)实时轻量级图像识别系统对轻薄件进行识别。PP-ShiTuV2 基于百度飞浆图像识别开发套件PaddleClas,主要包括:主体检测、特征提取和向量检索三个部分,如图2 所示。系统主要思路为:主体检测部分基于PicoDet 模型将图像前、背景分离,提取物体的ROI 图像;特征提取基于PP-LCNetV2 模型提取物体图像特征;向量检索部分基于Faiss 算法,在已知图像特征库(即:通过对训练集图片提取特征而构建的特征库)中进行快速检索,查找出与物体图像特征最相似的特征,获取该特征所对应的分类,从而实现物体识别。
图2 PP-ShiTuV2 框架[4]
采用PP-ShiTuV2 进行轻薄件识别的好处在于:仅需要训练一套模型,在生产中如出现未识别的轻薄件,只需采集少量代表性图片,放入底库图片(一般为训练集图片)gallery 中并进行特征提取,生成底库图片特征库即可。
■2.2 轻薄件数据采集与处理
本系统共采集了1533 张轻薄件图像用于模型训练,如图3 所示,其中包括:单个轻薄件(正、反面)、多个轻薄件无序堆叠两种形式。为了在识别轻薄件的同时也可以判断其正反面(有面单的为正面),缩短后续读码时间,在进行图像分类时,将轻薄件正反面分开。根据材质,轻薄件共分为6 类:envelop(信封袋,面单在上)、envelopN(信封袋,面单在下)、paperBag(纸箱,面单在上)、paperBagN(纸箱,面单在下)、plasticBag(塑料袋,面单在上)和plasticBagN(塑料袋,面单在下)共计6 个类别。
图3 轻薄件数据集
由于PP-ShiTuV2 系统的主体检测模型PicoDet 已在大量公开数据集上进行了训练,具备一定的目标检测能力,所以不再进行模型训练。本系统中重点对特征提取部分进行模型训练,即对主体检测模型输出的物体图像进行分类。图像分类模型的输入需为单个物体的图像,所以需要对轻薄件数据集中的图片依据标注文件进行分割,图片分割效果如图4所示。
图4 分割后的图像
■2.3 模型训练
本部分主要对特征提取模型PP-LCNetV2 进行训练。PPLCNetV 模型基于飞浆图像识别与分类工具集PaddleClas 进行训练,首先,需要修改模型配置文件GeneralRecognitionV2_PPLCNetV2_base.yaml(位于ppcls/configs),设置:预训练模型位置、训练设备(cpu 或gpu)、推理文件保存路径、图像数据集路径等参数;然后,运行tools 目录下的train.py文件开启模型训练,设置训练批次batch_size=16,初始学习率learning_rate=0.06,当训练批次epoch=100 时,损失率loss 达到一个相对稳定的数值1.85,图5 展示了模型训练中损失率的变化曲线;最后,通过tools 目录下的eval.py 进行模型评估,均值平均精度mAP 达到了0.97246(如图6 所示),表明模型在数据集中有非常好的表现,可进一步在实际场景应用[5]。
图5 模型训练中损失率的变化曲线
图6 模型评估
■2.4 向量检索
基于训练好的特征提取模型,对所有底库(一般为训练集)图片进行特征提取,构建底库图片特征库。待识别物体通过特征提取后,可得到相应的特征向量,将该特征向量在底库图片特征库中进行快速检索(基于Faiss 算法),找到最相似特征,获取其对应的分类标识,即可实现物体识别。向量检索工作原理,如图7 所示。
图7 向量检索工作原理
对底库图片建立特征索引库的具体步骤为:修改配置文件inference_general.yaml(位于deploy/configs),设置:主体检测模型、图像分类模型以及数据集文件的路径;通过运行build_gallery.py(位于deploy/python)建立特征索引库。
3 系统测试
将模型部署到AGX 平台上,进行图像识别测试。测试效果如图8、图9 所示。图8 展示了对信封和纸箱材质轻薄件的识别效果,图9 展示了对塑料材质轻薄件的识别效果。
图8 轻薄件识别测试1
图9 轻薄件识别测试2
4 总结与展望
本文面向快递业轻薄件分拣场景,设计了一套基于视觉的机械臂分拣系统。选取PP-ShiTu 轻量级图像实时识别系统进行轻薄件的识别,构建了轻薄件图像数据集,对图像特征提取模型PP-LCNetV2 进行了训练,并建立了图像特征索引库,最终实现了轻薄件的图像识别。将轻薄件中心像素坐标通过坐标变换,可转换为机械臂坐标系坐标,结合3D 相机测距,可实现视觉引导机械臂抓取轻薄件,结合条码读取和AGV 分拣机器人,最终可实现轻薄件的智能分拣。