OCR智能识别技术在工器具管理中的研究与应用

2022-11-15余汉伟张志峰李立光

科技创新与应用 2022年32期

余汉伟，张志峰，李立光

（安徽送变电工程有限公司，合肥 230601）

安全生产是电力企业的永恒主题，安全工器具的好坏将直接影响生产过程中人身和设备的安全与否。安全工器具全寿命周期管理过程中，由于种类、规格和数量繁多，在实际操作中甚为烦琐[1-2]。当前，安全工器具的管理方式还比较落后，安全工器具的日常检查及进出仓库都需要人工的手写、纸笔进行记录，工作强度大，且在统计过程中出错的风险比较大；其次现场多采用在工器具上张贴纸质标签、二维码等方式进行出库、入库及追溯管理，而工器具在服务于现场施工过程中，常暴露于风吹、日晒和雨淋的恶劣环境之中，使得张贴于工器具设备上的标签存在磨损、刮花、污损及脱落的现象，这对后续入库、出库及追溯管理提出了新的挑战[3-4]。

OCR（光学字符识别），能够高效地毫秒级识别图片中的文字信息，已经迅速地应用到各行各业中，极大地提高了人工校核的效率，然而目前通用的OCR技术，在垂直领域，如电力行业、工业生产等表现不佳，这需要专门针对垂直领域进行模型定制化研发和优化，才能达到应用级水平[5-6]。

为提质增效，更好地进行安全工器具全寿命周期管理，提出了基于OCR智能识别技术的安全工器具跟踪技术方案，可提高工器具在出入库、收发、维保和检验试验等环节的效率，实现安全工器具全生命、全过程周期的跟踪管理。

1 OCR技术方案的研发

1.1 技术难点

相对于通用的文字识别，电力设备编码识别具有以下难点。

（1）设备磨损、刮花和黄土覆盖严重，导致大部分编码不能被正常地检测和识别。

（2）编码数字之间的相似性大，一旦出现磨损，数字被误识其他数字的可能性增大。

（3）电力设备多为金属质地，金属表面的反光特性使得扫描识别过程中存在干扰的风险因素。

（4）识别检测过程中，拍摄角度的随意性，会加大模型的检测和识别难度。

（5）以视频的形式进行文字识别和检测，要求模型需具备毫秒级推理能力。一般模型越大，模型推理速度越慢，因此需要在满足推理速度同时，让模型识别率达到最优状态，增加了模型开发难度。

1.2 总体技术路线

针对以上5个难点，研发了一套新的OCR技术方案，总体技术路线如图1所示。

图1 技术路线图

整体的技术流程包括：数据预处理、方向分类器、设备编码检测、设备编码识别、模型推理速度优化和移动端模型开发与部署6大步骤，接下来针对6大步骤进行详细说明。

1.3 技术路线分解

1.3.1 数据预处理

数据预处理是整个技术方案的第一步，需要对手机拍摄的照片进行预先处理。包含设备区域检测、模糊图片去除和数据增强方案。

首先对图片进行区域定位，将图片中具有编码区域的子图片切割出来，对区域的设备进行切分处理，有利于排除不利干扰，采用分割任务（dskj_device_seg）算法完成。

此外，针对拍摄模糊的照片，通过dskj_remove_vague算法，筛选清晰的图片进行识别，减轻模型的推理压力，提高模型的推理速度。为丰富样本库、增加程序训练量，将采集的原始图片运用随机旋转、加噪等方式进行数据增强。

1.3.2 方向分类器

方向分类器包含方向分类器数据标注、方向分类器算法开发。在实际进行推理和应用阶段，采取逐张拍摄的方式进行检测和识别，由于相机在拍照过程中，实际摄入图片的方向具有不确定性，因此需要对照片方向进行分类判断。为此通过对现场采集源照片及对采集的源照片运用随机旋转、加噪等方式处理，累计标记和增强了超2万张照片作为方向分类算法的数据集，同时研发了1套dskj_director_cls算法进行方向分类，通过将输入的图片压缩成指定大小，来进行图片分类，具体算法流程如图2所示。

图2 算法流程图

1.3.3 设备编码检测

设备编码检测需要将照片中的设备编码区域检测出来，供后续的识别模型进一步识别。如图3所示。

图3 设备编码截图

为避免检测时因调整拍摄角度而消耗太多时间，研发了支持任意角度的检测算法，有效减少了拍摄角度调整的时间，具体算法流程如图4所示。

图4 算法流程图

1.3.4 设备编码识别

设备编码经过了检测后，通过识别模型进行字符识别。为准确识别各种模糊、划痕及反光等不清晰设备的编码，针对性地研发了一种专用识别模型算法，如图5所示。

图5 识别模型流程图

1.3.5 模型推理速度优化

为有效提升模型的推理速度，分别研发了dskj_pact和dskj_quant算法进行模型剪枝及轻量化处理，保留了2个版本的模型，分别是服务端模型和移动端模型，其中移动端模型大小压缩到17 M左右，在ARM8的芯片上每张图片的推理速度达到100 ms。

1.3.6 模型开发与部署

为了便于现场使用，本模型采用服务端和移动端2套模式部署，移动端模型为主，服务端模型为辅助的策略。基于ARM8架构的手机移动端CPU（中央处理器）上，对整体推理模型使用了C++进行重构，最终有效提升了模型的推理效率。

2 试验与验证

将该程序集成于一款手机软件上，打开软件即可进行扫描识别与检测。为检测该方案的实用效果，在仓库中随机选取了100套刻有编码的工器具进行扫描识别。试验结果：总用时469 s，平均每套用时4.69 s，准确识别个数91套，识别准确率91%。对清晰、角度端正的图片，文字检测率达到97%；对有轻度破损、划痕和灰尘覆盖的图片，文字检测率达到94%；对重度划痕、重度模糊及重度破损的图片凡通过人眼能够辨识的，文字检测率达到82%。