APP下载

基于YOLO-V2 算法的翻车机摘钩视觉识别

2024-02-23裴传福崔凯成功

中国设备工程 2024年3期
关键词:车钩基座手柄

裴传福,崔凯,成功

(华能沁北发电有限责任公司,河南 济源 459000)

1 背景

目前,在我国由铁路运输的煤炭,需要将车厢部分,经由整套翻车设备将车厢内矿料倒入指定工位,早在20世纪50 年代我国就已经将成套的翻车设备投入使用,但是受技术的限制,翻车系统的各个部分未实现有效连接,效率低下。至今,在不断的改良与进步中,国内厂家设计开发“C”型单车、双车翻车机等改良型设备,实现了翻车机系统部分的连锁作业,其作业效率、稳定性、安全性都显著提升。

但是,在当下的大部分铁路运输设备中,人工实现摘钩复钩等作业任务仍然是必须的,人工摘钩存在多种弊端:摘钩工作接连不断,长时间工作带来的精力消耗,且摘钩工作需要在与列车同步时进行,不仅影响效率而且存在危险;人工作业受现场天气、光线等环境的影响;翻车机卸料设备的粉尘污染,造成的职业健康问题(图1)。

图1 火车摘钩作业现场

华能沁北发电有限责任公司位于河南省济源市五龙口镇境内,北倚太行山,南临沁河,距济源市区17 公里。电厂发电机组装机容量4×600MW+2×1000MW,是国家计委确定的首批超临界国产化依托项目、国家“十五”规划的重点工程,于2004 年投产发电。

华能沁北发电有限责任公司火车来煤卸车有两台单翻和一台双翻三套翻车机接卸系统,位于储煤场的南部,翻车工艺采用流水线设计,火车煤接卸作业流程中运行设备包括拨车机、翻车机、推车机、牵车台、带式输送机、带式给煤机、活化给煤机、斗轮机等,最后通过两条胶带机运输线以及斗轮机将煤运送到煤场内存放。

为更充分、更高效地利用翻车机系统及工作人员的职业健康,华能沁北发电有限责任公司计划选择一套翻车机系统,通过研发、安装、调试等工作,实现一套自动摘钩、正钩、复钩机器人与翻车机自动连锁作业,希冀实现单套翻车机全自动作业。在诸多的技术难题中,对列车车厢的车钩进行高效、准确的追踪与识别是首要解决的问题。

2 基于深度学习的YOLO-V2 车钩识别算法

2.1 深度学习

深度学习是指具有多个处理层次的多个数据表达的模型,它们的出现极大地提高了语言识别、视觉识别等技术的发展。深度学习是通过正向与反向传播进行参数确定,从而发现数据中的重要结构特征。

深度学习的普遍定义为一种利用多层非线性结构,通过有监督或者无监督的特征变换与提取,进行模式分析与分类的模型方法。它的运作原理是先于计算机输入初始数据,经神经网络检测、提取和分类其中包含的各类特征。该方法有着多个用于处理数据的网络层级,能够通过简单、非线性的处理方式来拟合,每个级别将上一个级别所输出的特征处理成一个更具有高维特征、更抽象的输出结果。有了层层的网络层级和各个层级的对应输出,我们就可以用它来进行更准确的学习,更深层次的拟合处理,能进行高效、高精度、工作量庞大的分类任务(图2)。

图2 传统神经网络(左)和深度学习模型(右)

2.2 摘钩任务中的图像识别

摘钩自动化系统中的目标捕捉技术应该实现两大问题:一是判断列车车钩的位置和状态;二是能够在各种环境下准确的分割出列车车钩。针对实际使用情况与本次所规划系统之中任务目标,目标捕捉部分应具有以下功能。

(1)精确检测多类型多状态车钩手柄。车钩手柄受工作环境影响形状各异,由于不同形状摘钩方式或有区分,因此准确判断车钩手柄类型即当前状态是实现准确摘钩的必要条件。现实中通过提拉车钩手柄解锁车钩,对手柄的位置精度要求较高,检测系统还需要精确分割出车钩轮廓。

(2)适应复杂的环境。车钩手柄处于两节车厢之前,且可能有粉尘影响、光线较差,周围有各种零部件且与车钩手柄颜色相近,以上成为了获取车钩手柄信息时的干扰因素。编组站通常为露天,光线及天气等外部环境会影响图像质量。因此,目标捕捉系统应能在各种干扰环境下保证稳定性。

2.3 YOLO-V2 算法

针对翻车机车钩改进后的YOLO-V2 模型的车钩识别算法,该算法通过改进K-means 聚类算法选择最佳车钩手柄和手柄基座的候选框长宽和数量,完成ancher预设,然后利用获得的ancher 预设训练神经网络模型。相较于传统的RCNN 算法,YOLO-V2 算法的计算速度大大提升,又相较于YOLO-V1,YOLO-V2 在目标定位的准确率和召回率有明显的改善。通过不断调整YOLO-V2 模型中的网络深度和卷积层以得到更有效的各类车钩特征,然后利用改进后的YOLO-V2 算法在目标训练集上不断迭代更新,获得到最优权重,不断提高训练所得模型的效果,输入图片、视频进行识别效果检测,输出车钩检测结果,判断其识别结果的正确性,最后输出所识别车钩状态图像和车钩坐标位置信息(图3)。

图3 YOLO-V2 结构示意图

2.4 残差模块

神经网络的深度和宽度是表征网络复杂度的两个核心因素,这其中深度特征对神经网络影响更大,为了进一步提高车钩识别的准确率,增加神经网络的复杂程度是行之有效的方法,但是过量增卷积层数,增深网络深度,往往会直接影响神经网络的梯度,模型收敛性下降、过饱和、模型退化、准确率下降的等各种情况伴随发生。而引入残差网络模块则能有效改善以上问题,残差网络允许原始输入信息直接传输到后面的网络层,即在后面卷积层之间加入几个全等映射层,利用全等映射层把前一层特征传输到后面层,就能有效规避训练模型梯度消失、不收敛的问题,选择合适的残差卷积核,也能降低全等映射带来的扰动特性。

2.5 损失函数

损失函数的目的是优化神经网络参数,通过神经网络将目标的实际值与预测值进行匹配比较,损失函数会计算出损失值,然后通过梯度下降算法优化网络权重,降低算法训练过程损失,不断地更新神经网络所训练出的模型。

当下主要的损失函数包括均方差损失函数和交叉熵损失函数,实际效果中均方差损失假设误差服从高斯分布,在分类任务下这个假设没办法被满足,因此,在大多数分类任务中效果会很差,所以针对车钩手柄和手柄基座进行多元分类,选用多分类交叉熵损失函数,原理公式如下所示:

2.6 小结

在运用YOLO-V2 算法识别车钩前,首先,要进行数据集的预处理包括且不限于通过翻转、旋转、噪声、颜色变换四种图片增强方法得到更丰富的数据样本,然后对数据集进行准确标注,保证模型训练所需要的基础数据。基于深度学习的YOLO-V2 车钩识别算法中,通过改进K-means 聚类算法选择最佳车钩手柄和手柄基座的候选框长宽和数量,完成ancher 预设;在神经网络的结构中增设残差模块提升视觉识别的准确率;选用多分类交叉熵损失函数,用作神经网络模型的训练。

3 车钩识别实验

通过运用改进后的YOLO-V2 算法来实现对火电厂列车车厢车钩的实时识别,进而使自动摘钩机器人能够进行准确的摘钩作业。目标数据集包括在光线、时间、角度等诸多不同情况下的4875 张图片,训练集图片包含2875 张华能沁北列车的车厢车钩手柄基座的图片及相应的标注;测试集图片包含2000 张列车车钩的图片,对训练集中的车钩手柄及基座进行标注,标注的标签包含四种输出情况,即A 手柄(A-handle)、B 基座(B-pedestal)、C 手柄(C-handle) 及D 基座(D-pedestal),正确的输出为A 手柄、B 基座或C 手柄、※※D基座,基座与手柄同时收集并标注计为标注成功(图4)。

图4 车钩识别图像结果

模型训练进行2000 次,通过对比目标数据集中图片的预测结果与真实值的重合率达到了97.3%,YOLO_V2检测一张图片平均用时为30ms,约33 帧/s,基本满足现场的实际需求。在现场测试过程中,以翻车机工作现场采集的图像序列为测试数据源,针对现场采集的图像在原实验训练模型的基础上再次进行训练,针对现场不同的时间段,不同光线环境下的数据进行实时数据分析处理,最终得到的手柄基座的准确率高达95%以上。

4 结语

机器学习、图像识别的不断研究与运用大大地提升了翻车机摘钩机器人智能化程度,相较传统的电气控制系统,该套算法的利用在整体结构和识别摘钩手柄的准确率上都有了质的提高。在实际应用中,尽管车钩的检测时间很短,经由YOLO-V2 算法所训练的模型仍能及时地反馈其信息,但是,为了提高系统整体的稳定性,该算法的鲁棒性仍然需要针对性提升。翻车机车钩识别理论的不断更新与研究以及在摘钩机器设备上的运用,使翻车机系统在实现全自动化道路上迈出坚实的一步。

猜你喜欢

车钩基座手柄
一种基于ResNet的车钩状态识别方法及其应用
基于NXnastran的异步电动机基座有限元强度分析
基于PLC控制的手柄座钻孔攻丝一体机的研发
心脏固定器基座注射模设计
超大型FPSO火炬塔及船体基座设计
13号车钩分离故障原因分析
一种多功能无线手柄的设计
设有挡肩的尾端圆弧接触重载车钩稳钩能力研究
高速动车组过渡车钩设计有关问题的探讨
为什么厨具的手柄不是金属的?