基于SURF+OCR 的变电检测仪器数据定位识别研究

2022-03-23童军心吴宇睿王金明单松兴

江西电力 2022年2期

童军心，童超，吴宇睿，王金明，单松兴

（1.国网江西省电力有限公司电力科学研究院，江西南昌 330096；2.南昌工程学院，江西南昌 330096；3.国网江西省电力有限公司超高压分公司，江西南昌 330096；4.国网江西省电力有限公司樟树市供电分公司，江西宜春 336000）

0 引言

为了准确了解电力系统输变电设备的运行状态，需要对系统进行安全评估，对可能存在的风险进行预警，需要对输变电设备进行大量检测试验，而大量仪器仪表的数据需要被记录便于进行数据挖掘和分析。在复杂的检测场景下，一些检测仪器无通讯接口，只能通过纸笔抄录完成报告后再输入系统中，效率低下且容错率低。为了给变电检测现场过程提质增效，运用图像识别技术对仪器数据进行定位识别，再将识别结果自动返回报告中[1-3]。

仪表的数字识别过程由区域定位、字符分割、字符识别三部分组成。其中，仪表区域定位是数字识别的前提，起着关键性作用。基于SIFT、SURF 的定位算法广泛应用于电力系统中目标检测与研究中。文献[4]针对SIFT 算法中特征向量的维数过高问题，提出了一种双向SIFT 匹配的方法，降低了特征向量维数，提高了匹配精度，较好地应用在电力设备识别中。SURF 算法借鉴了SIFT 简化近似思想，将DOH 中的高阶、二阶微分模板进行了近似简化，可以采用积分图像计算，实验证明SURF 算法综合性能优于SIFT算法[5-8]。

传统图像文字识别技术大多采用传统光学字符识别，该技术需输入图像背景干净，字体简单且排布整齐，才能达到很高的识别水平，对复杂仪表图像几乎无法识别。与纯文字的图片不同，复杂环境下的仪表信息识别则面临着图像背景复杂、拍摄角度和光线强弱等众多因素造成的分辨率低、对比度和亮度不均匀等问题。

基于此，文中提出基于SURF+OCR 对变电检测仪器数据定位[9]识别方法，根据尺度不变特征变换实现仪器面板特征匹配、关键数据位置定位与截取，实现对仪器面板重要信息的获取，获取后的图片经过预处理后放入Tesseract-OCR[10-11]引擎中识别，继而得到精确的识别结果。

1 理论基础

1.1 SURF算法基本原理

SURF算法的实现主要有以下5个步骤：

1）构造比例空间：利用高斯模糊形成不同尺度的图像，构成高斯金字塔。为确保图片中的要素与比例无关，通过高斯函数计算出不受尺度和旋转影响的极值点。

2）关键点本地化：对极值点进行拟合三维二次函数运算，去除影响SURF 算法的边缘响应点，同时确定极值点的尺度和位置，进而确定合适的特征成为关键点。

3）方向分配：提取图像在某个特定小区域内的梯度值的最大值，并作为该关键点的方向特征值，确保关键点角度不变。

4）关键点描述符：在关键点领域内，计算出选定区域的梯度大小，并用该梯度值表征图像在局部区别内光照、形状变化，为每个关键点分配独特的指纹。

5）图像匹配：运用汉明距离、欧氏距离等方法对两幅图像关键点特征向量进行相似运算，之后通过单应性矩阵对图片进行调整。

1.2 图像预处理

为了提高识别的准确率，在对数字仪表的重要信息识别前，对图像进行预处理。

1）中值滤波

结合图像背景考虑，文中采用中值滤波对图像进行图像平滑处理。中值滤波是一种非线性的平滑技术，对于胡椒噪声和盐噪声有非常显著的影响。中值滤波取当前像素点和它周围的临近奇数个像素点的像素值，将像素值排序，取中间位置的像素值作为当前像素点像素值。中值滤波原理用式（1）表示为：

式中：Xi，j表示像素点在坐标为（i，j）时的像素值；A为滤波窗口；Med 为中值滤波函数；Yi，j为滤波窗口内的中间像素值。

2）图像形态学操作

为简化图像，对图像采用形态学处理，以提高数字仪表图像的质量，减少字码中断带来的影响。膨胀和腐蚀处理是形态学运算的基础。设两幅图像X、B，若X是被处理对象，B是用来处理X的，那么则把B称为结构元素。

其中膨胀处理和腐蚀处理分别如式（2）、式（3）所示：

式中：B表示结构元素；X表示为原始图像。D为X和B的逻辑异或操作的值，B的黑色和X的黑色有一个对应就让该个点为黑色；E为X和B的逻辑与操作的值，B的黑色和X的黑色完全对应，就让该个点为黑色。

3）图像二值化

为提高识别的准确率，在对数字仪表识别前，对图像进行二值化处理。对此，文中采用Otsu 算法，以减少光照和对比度给二值化带来的不利影响。假设连通区域S，其像素的灰度范围表示为[0，255]，其中灰度级x的概率用p（x）表示。Otsu 就是求式（4）得到最大灰度级m值。

而上述值则为最佳的分割阈值。

1.3 Tesseract-OCR

Tesseract 是HP 实验室开发由Google 维护的OCR 引擎，Tesseract-OCR[12]运行过程：首先将经过预处理的二值化图片传入OCR 引擎中进行分析，通过识别引擎获取目标区域，采用自适应分类器定位文本行、分割字。通过两次字符分析识别使OCR 引擎对图片中的模糊区域进行改进，校验字符是否正确后将图片识别输出文本。Tesseract-OCR 架构图如图1所示。

图1 Tesseract-OCR架构图

2 变电数字仪表特征定位提取

2.1 变电数字仪表数据特征分析

如图2 为变压器铁芯接地电流测试仪面板，面板中有操作按钮和显示屏2 个区域。面板中间部位的电流值和频率值是测量的结果数据，即该仪器关键信息、数据特征为数值型，面板下部为操作按钮区。拍照时应满足拍摄规范，如拍摄角度不得过大，被测仪器尽量清晰并且大部分处于图片中。

图2 变压器铁芯接地电流测试仪面板

2.2 模板制作

利用尺度不变特征变换对仪器面板进行重要数据定位，需要对变压器铁芯接地电流测试仪面板建立标准化模板图片，如图3所示。该模板含有足够的不变特征，将重要信息区域（电流值、频率值）用纯白色背景替换，减少了干扰特征。

图3 仪器面板模板图

2.3 提取效果

对按要求拍摄情况下变压器铁芯接地电流测试仪图像进行尺度旋转不变特征检测并匹配模板照片，其特征点匹配的效果如图4所示，特征点匹配直线图表明，该算法能实现模板的完整匹配。在此基础上依据定位流程算法，依次通过优质关键点筛选、求解单应性矩阵、计算映射四边形、图片旋转摆正、定位截取数据等步骤，实现对电流值和频率值的提取，如图5所示。

图4 角度不同的特征点匹配图

图5 电流值和频率值的定位提取图

3 仪表关键信息处理与识别

3.1 定位图片处理

对图片进行预处理后，Tesseract-OCR 对图片识别的效果更佳。因此对于本次实验所用仪器样本，分析由定位算法所得图片，经过各种方法的验证，得到最佳的处理效果，处理步骤如图6所示。

图6 定位图片预处理步骤

定位图片处理结果如图7所示。

图7 定位图片处理结果图

3.2 定位图片识别

本例图片是规则的数字，根据Tesseract-OCR 引擎自带的“chi_sim”字库对这个字符具有较高的识别率，识别结果如表1所示。

表1 定位图片识别结果

3.3 结果分析

通过上述方法的试验效果可知（见表2）：

表2 不同角度获得的图片定位及识别结果

1）对图片拍摄角度发生变化时，图片定位成功率较高，在0°～30°之间高达100%，在45°时达90%。该定位算法实时性好、匹配点多，有较多准确的匹配点，400 张随机拍摄的样本整体定位成功比例高于97.5%，证明该算法稳定性好，具有一定的鲁棒性。

2）通过对比定位图片前后的识别率，处理后的图片识别率远高于处理前的，高达95%以上，证明图片经过预处理后形成的二值化图片更适合放在Tesseract-OCR引擎中识别。

4 结语

在变电检测现场中，为了有效减轻检测人员仪器读数工作强度，避免人工读数误差，用相机对试验仪器进行图像获取，文中提出基于SURF+OCR对变电检测仪器数据定位识别的方法，设计了在变电检测现场可能出现的情况，对400 张受拍摄角度影响的情况下的随机样本图片进行SURF 定位算法测试，样本整体定位成功率高于97.5%。对定位的样本图片进一步预处理，利用Tesseract-OCR 引擎对定位样本图片进行识别，识别率高达95%以上。在特定场景下的仪器图片，经预处理后识别效果仍不佳，可以训练该类仪器专属的字符库，以提高识别率。因此，文中所提出的方法具有一定的工程实践价值。