OCR智能识别技术在工器具管理中的研究与应用
2022-11-15余汉伟张志峰李立光
余汉伟,张志峰,李立光
(安徽送变电工程有限公司,合肥 230601)
安全生产是电力企业的永恒主题,安全工器具的好坏将直接影响生产过程中人身和设备的安全与否。安全工器具全寿命周期管理过程中,由于种类、规格和数量繁多,在实际操作中甚为烦琐[1-2]。当前,安全工器具的管理方式还比较落后,安全工器具的日常检查及进出仓库都需要人工的手写、纸笔进行记录,工作强度大,且在统计过程中出错的风险比较大;其次现场多采用在工器具上张贴纸质标签、二维码等方式进行出库、入库及追溯管理,而工器具在服务于现场施工过程中,常暴露于风吹、日晒和雨淋的恶劣环境之中,使得张贴于工器具设备上的标签存在磨损、刮花、污损及脱落的现象,这对后续入库、出库及追溯管理提出了新的挑战[3-4]。
OCR(光学字符识别),能够高效地毫秒级识别图片中的文字信息,已经迅速地应用到各行各业中,极大地提高了人工校核的效率,然而目前通用的OCR技术,在垂直领域,如电力行业、工业生产等表现不佳,这需要专门针对垂直领域进行模型定制化研发和优化,才能达到应用级水平[5-6]。
为提质增效,更好地进行安全工器具全寿命周期管理,提出了基于OCR智能识别技术的安全工器具跟踪技术方案,可提高工器具在出入库、收发、维保和检验试验等环节的效率,实现安全工器具全生命、全过程周期的跟踪管理。
1 OCR技术方案的研发
1.1 技术难点
相对于通用的文字识别,电力设备编码识别具有以下难点。
(1)设备磨损、刮花和黄土覆盖严重,导致大部分编码不能被正常地检测和识别。
(2)编码数字之间的相似性大,一旦出现磨损,数字被误识其他数字的可能性增大。
(3)电力设备多为金属质地,金属表面的反光特性使得扫描识别过程中存在干扰的风险因素。
(4)识别检测过程中,拍摄角度的随意性,会加大模型的检测和识别难度。
(5)以视频的形式进行文字识别和检测,要求模型需具备毫秒级推理能力。一般模型越大,模型推理速度越慢,因此需要在满足推理速度同时,让模型识别率达到最优状态,增加了模型开发难度。
1.2 总体技术路线
针对以上5个难点,研发了一套新的OCR技术方案,总体技术路线如图1所示。
图1 技术路线图
整体的技术流程包括:数据预处理、方向分类器、设备编码检测、设备编码识别、模型推理速度优化和移动端模型开发与部署6大步骤,接下来针对6大步骤进行详细说明。
1.3 技术路线分解
1.3.1 数据预处理
数据预处理是整个技术方案的第一步,需要对手机拍摄的照片进行预先处理。包含设备区域检测、模糊图片去除和数据增强方案。
首先对图片进行区域定位,将图片中具有编码区域的子图片切割出来,对区域的设备进行切分处理,有利于排除不利干扰,采用分割任务(dskj_device_seg)算法完成。
此外,针对拍摄模糊的照片,通过dskj_remove_vague算法,筛选清晰的图片进行识别,减轻模型的推理压力,提高模型的推理速度。为丰富样本库、增加程序训练量,将采集的原始图片运用随机旋转、加噪等方式进行数据增强。
1.3.2 方向分类器
方向分类器包含方向分类器数据标注、方向分类器算法开发。在实际进行推理和应用阶段,采取逐张拍摄的方式进行检测和识别,由于相机在拍照过程中,实际摄入图片的方向具有不确定性,因此需要对照片方向进行分类判断。为此通过对现场采集源照片及对采集的源照片运用随机旋转、加噪等方式处理,累计标记和增强了超2万张照片作为方向分类算法的数据集,同时研发了1套dskj_director_cls算法进行方向分类,通过将输入的图片压缩成指定大小,来进行图片分类,具体算法流程如图2所示。
图2 算法流程图
1.3.3 设备编码检测
设备编码检测需要将照片中的设备编码区域检测出来,供后续的识别模型进一步识别。如图3所示。
图3 设备编码截图
为避免检测时因调整拍摄角度而消耗太多时间,研发了支持任意角度的检测算法,有效减少了拍摄角度调整的时间,具体算法流程如图4所示。
图4 算法流程图
1.3.4 设备编码识别
设备编码经过了检测后,通过识别模型进行字符识别。为准确识别各种模糊、划痕及反光等不清晰设备的编码,针对性地研发了一种专用识别模型算法,如图5所示。
图5 识别模型流程图
1.3.5 模型推理速度优化
为有效提升模型的推理速度,分别研发了dskj_pact和dskj_quant算法进行模型剪枝及轻量化处理,保留了2个版本的模型,分别是服务端模型和移动端模型,其中移动端模型大小压缩到17 M左右,在ARM8的芯片上每张图片的推理速度达到100 ms。
1.3.6 模型开发与部署
为了便于现场使用,本模型采用服务端和移动端2套模式部署,移动端模型为主,服务端模型为辅助的策略。基于ARM8架构的手机移动端CPU(中央处理器)上,对整体推理模型使用了C++进行重构,最终有效提升了模型的推理效率。
2 试验与验证
将该程序集成于一款手机软件上,打开软件即可进行扫描识别与检测。为检测该方案的实用效果,在仓库中随机选取了100套刻有编码的工器具进行扫描识别。试验结果:总用时469 s,平均每套用时4.69 s,准确识别个数91套,识别准确率91%。对清晰、角度端正的图片,文字检测率达到97%;对有轻度破损、划痕和灰尘覆盖的图片,文字检测率达到94%;对重度划痕、重度模糊及重度破损的图片凡通过人眼能够辨识的,文字检测率达到82%。
3 结论
(1)该方案的成功应用有效解决了工器具出入库管理繁琐及追溯管理困难的问题,提高了工器具出库、入库的效率,降低了人工成本,提高了准确率。
(2)目前整体技术方案能满足电力行业各类数字编码识别,在精度和召回上都达到业界最优,而且便于快速应用到其他不同类型的设备编码识别上。
(3)在检测方案上进行了大量的优化和改进,共计迭代了数十个版本的模型,解决了因拍摄角度不同而影响识别速率与准确率的问题,且针对设备上数字存在缺损现象,对数字进行了专门的模型设计,有效降低了数字的误识率。
(4)由于目前采集的数据量不够完善,大部分数据依靠增强方案来实现,计划后期通过系统,源源不断地进行真实数据的采集及回流,随着系统数据不断增加,模型效果也会进一步的提升。