基于机器视觉的输电线路杆塔编号识别方法研究
2020-08-31吴婕萍赵文昊于文萍何柯辰
吴婕萍 赵文昊 于文萍 何柯辰
摘要:为实现对输电线路杆塔编号的识别,本文采用基于机器视觉的字符识别方法,先对编号图像预处理,随后对编号定位,提取出单个字符,最后利用BP(Back Propagation)神经网络对提取的字符进行识别。实验结果表明,识别精度为80.6%,可以满足特定条件下的巡检任务,为后续输电杆塔检测工作的开展提供有效参考。
Abstract: This paper adopts the character recognition method which is based on machine vision to identify the transmission line tower's serial number. First, it preprocesses the numbered image, then locates the number, extracts single characters, and finally identify these characters by using BP(Back Propagation) neural net. Experimental results show that the identification accuracy is 80.6%, which can fulfill inspection tasks in certain conditions and provide valid references for the implement of subsequent tasks to transmission line tower's detection.
关键词:字符识别;BP神经网络;图像定位;字符分割
Key words: character recognition;BP neural network;image location;character segmentation
中图分类号:TM75 文献标识码:A 文章编号:1006-4311(2020)23-0229-02
0 引言
输电杆塔有着传输电能的作用,是电力系统的重要组成部分,当遭受极端恶劣天气与环境时,输电杆塔容易发生断线、短路,会直接波及到整个电力网络。因此定期对输电杆塔及其配套设施进行检查,对电力系统的稳定运行具有重要的意义。
在对输电杆塔进行巡检的过程中,输电杆塔的编号发挥着重要的作用,利用编号信息可以集中管理输电杆塔及其配套设施状态情况,同时也可在巡检中提供输电杆塔的位置信息。因此把输电杆塔编号与巡检任务结合起来,是一种重要的巡检手段,可以提高巡检效率,且可以配合无人机对输电杆塔实现自动巡检,在巡检过程中发现故障时,可以通过对输电杆塔编号的识别实现对故障区域的精确定位。
目前,利用输电杆塔的编号进行巡检已有较多技术出现,人工巡检是目前的主要巡检方式,但巡检效率很低;基于RFID字符识别技术与基于二维码字符识别技术工作效率高,但对设施要求较高,成本高且时间周期长;而基于机器视觉的字符识别技术识别精度高、计算速度快、工作效率高、检测手段符合人类感知且不需要对现有设施进行大幅度改造。
综上,为实现输电线路杆塔编号的识别,本文采用基于机器视觉的字符识别技术,对输电杆塔编号区域自动定位,提取出单个字符并自动识别字符内容,最后应用BP(Back Propagation)神经网络对字符进行識别。
1 输电杆塔编号字符提取
利用机器视觉对编号字符进行识别的技术路线如图1所示,首先采用一种去除背景冗余信息的图像预处理算法,然后对输电杆塔区域进行精确定位并且提取出来,把提取出来的编号区域内的字符分割为单个字符,最后利用BP神经网络对字符进行识别。
1.1 图像预处理
计算机直接对原图(如图2(a)所示)进行处理耗时长,因此需要重新调整图像尺寸并转化为灰度图像,用以提高效率。为了使视觉效果更好,便于后续算法的处理,可以利用直方图均衡化把局部分布扩展,增加其表示范围,优化图像的对比度[1]。
1.2 编号定位与字符提取
经过了图像预处理后便需提取编号区域,提取过程如图2所示,首先是滤波处理与边缘检测[2](如图2(b)所示),在编号的边缘位置,灰度值会出现突变,边缘检测就是计算编号灰度变化率最突出的区域[3]。由于噪声和边缘的灰度都会发生突变,噪声易被误检为边缘,在检测边缘前需要对图像进行滤波去除噪声信息。
边缘检测后图像还存在着冗余的背景信息,需要进一步的图像进行形态学处理。这里采用腐蚀(如图2(c)所示)缩小图像边界,利用闭运算(如图2(d)所示)和开运算(如图2(e)所示)消除冗余信息,对编号区域的文字部分进行强调突出,方便后续对其提取。
为了将三行文字分别提取出来,采用一种基于灰度统计值的投影法,首先把图像在行方向上进行投影,统计每一行的像素点,则文字的上下边界在像素点统计图的波谷位置,同理分别对这三块文字部分区域进行列方向上的处理。通过行方向像素点统计和列方向像素点统计,最终能将文字部分精确的提取出来,得到编号区域的图像。
1.3 单个字符提取
由于已经分离出字符的上下边界,因此只需确定每个字符的左右边界便可以提取出单个字符。这里通过列方向像素点统计提取单个字符,并且把单个字符进一步的处理,包括去除上下边界和归一化处理,一是为了统一标准库的字符规格,二是为了消除字符中多余的噪声,为后续的字符识别做准备。
2 基于神经网络的编号字符识别
神经网络是模拟人的大脑中某些机能,抽象出来建立的一种模型,其优点在于可以学习和自适应一些不确定的系统[4],把神经网络应用到输电杆塔编号识别的系统中是可行的。
利用BP神经网络对编号字符进行识别,首先需要搭建并设计神经网络的结构,实验中调试BP神经网络的参数设置为:误差目标值0.0000001,终止迭代次数5000,学习速率0.003。目前学术界并没有一个统一的确定隐含层神经元数目的办法。本文根据文献[5]的算法确定隐含层神经元个数,如公式(1):
其中输入层神经元数m=800,输出层神经元数n=5,可以计算出隐藏层的神经元节点数为282。最后利用处理的数据对神经网络训练建模,并对测试组进行识别,识别结果如图3所示。
3 实验结果分析与对比
将6幅图片对神经网络进行训练后,对10幅测试组图像进行字符识别,得到的实验结果如表1所示。造成字符识别失败的原因是图像背景过于复杂,且字符存在残缺、污损、偏移等,同时训练组太少导致误差也较大。
4 结论
本文针对输电线路杆塔编号的识别,提出一种基于机器视觉的字符识别方法,采用尺寸调整、边缘检测、直方图均衡化等预处理操作,对编号区域进行定位,然后按行分割为3块字符区域,分别提取出单个字符,对字符归一化处理后再利用BP神经网络对字符进行识别,实验最终的准确率为80.6%。由于图像背景复杂、字符不完整和训练组太少等原因,仍会出现误判现象。
参考文献:
[1]凌佳宁.车牌定位与车牌字符识别算法的研究与实现[D]. 电子科技大学,2012.
[2]吴娱.数字图像处理[M].北京:北京邮电大学出版社,2017.
[3]杨璐雅,黄新波,张烨,等.基于边缘检测的瓷质绝缘子裂缝特征检测方法[J].广东电力,2018,31(07):106-111.
[4]張坤艳,钟宜亚,苗松池,等.一种基于全局阈值二值化方法的BP神经网络车牌字符识别系统[J].计算机工程与科学, 2010,32(02):88-90.
[5]高大启.有教师的线性基本函数前向三层神经网络结构研究[J].计算机学报,1998(01):80-86.