基于分类模板数据库的电气铭牌识别
2021-01-16石煌雄潘文林
胡 洋,石煌雄,蒋 作,潘文林
(云南民族大学 电气信息工程学院,云南 昆明 650500)
0 引 言
电气设备常年在野外工作,经受自然天气侵害导致设备老化[1]。因此,需要定期对设备进行巡检和维护,排除设备故障,保证电网安全稳定的运行[2]。进行巡检和维护[3]的第一步是电力工人查看电气铭牌,读取设备的产品信息及重要参数。此外电气铭牌对于设备管理、资产清理、设备统计和资产入库等工作都十分重要[4]。当前对电气铭牌信息提取是通过拍照,查看照片绘制成表单,工作效率低、成本高。若借助人工智能技术和信息系统[5]来完成铭牌照片读取工作,则能够大幅度提升工作效率,对某些危险环境下还能够保护工作人员。
常见电气铭牌识别技术可分为以下几类:尹远等人提出基于融合字符及字符排列特征的电气铭牌识别方法,相比传统OCR 方法对电气铭牌识别率[6]提高12.6%。陈晓龙等人提出基于深度学习的电力设备铭牌识别方法使用端到端文本识别模型TDRN,避免图像裁剪字符分割,提高了识别准确率[7]。陈习等人基于移动端PCANet 识别算法进行电力铭牌文字识别,该方法能够即拍即识别[8]。上述电气铭牌识别研究总体分为三个部分:首先对电气铭牌文字区域定位,然后对文字区域分割,最后对字符进行识别[9]。识别字符类别有中文、英文、数字和特殊符号等,其中,汉字和特殊符号识别难度大[10]。铭牌内汉字和特殊字符最多,现有识别技术是对电气铭牌字符进行直接识别,因此识别效果欠佳。而且还有大量识别错误,研究停留在理论阶段,无法进行工程实践、落地应用。
汉字和特殊字符识别是电气铭牌识别中的主要难点,同时汉字和特殊字符也是构成电气铭牌密集的文本行。为了解决这一难点,对电气铭牌文本行分布进行分析。将识别分为可变区域和不可变区域。不可变区域包括电气铭牌内绝大多数的汉字和特殊字符以及90%的识别量。可变区域基本不涉及汉字和特殊字符,只涉及英文和数字等极少量的识别量。对不可变区域建立分类模板数据库,并将同一张电气铭牌图像和对应模板打上相同标签。引进卷积神经网络对电气铭牌图像分类[11],并根据输出标签调用模板,完成不可变区域识别。经实验结果分析,该方法能够有效解决电气铭牌大多数文字和特殊字符识别问题,进一步提高识别的准确率。
1 总体设计
对电气铭牌进行构造分析,将铭牌识别分为不可变区域识别和可变区域识别。提出将不可变区域制作成为标准模板转化为图像分类,通过图像预测完成不可变区域识别。
1.1 电气铭牌构造分析
根据图1 所展示电气铭牌可以分为不可变区域和可变区域。不可变区域为:第一行图1a):固定式交流低压配电柜,图1b):ZJM 配电柜、型号、功率、电压和电流等字样。可变区域为:图1a)出厂编号和出厂日期、图1b)功率和型号等后面空白处未填写内容。不可变区域在电气铭牌生产出厂时已经固定不变,可变区域根据实际需求进行改变。从识别字符方面分析,不可变区域包括大多数中文字符和特殊字符,可变区域为阿拉伯数字、英文字母和极少量中文。从识别量方面分析,不可变区域占识别量的90%以上。
图1 电气铭牌
1.2 电气铭牌识别思路设计
根据电气铭牌在生产制作时的特点,将不可变区域制作成电气铭牌标准模板,如图2 所示。
图2 电气铭牌标准模板
图3 电气铭牌识别思路设计流程
2 不可变区域分类模板数据库模型搭建
如图4 所示,不可变区域分类模板数据库模型由三部分组成,首先是预处理部分对图像进行处理以及对原图和模板图标打上相同标签,然后搭建网络部分,对电气铭牌进行分类,最后进行标签测试部分,根据网络输入标签与模板标签进行比较,完成不可变区域识别。接下来对每部分进行详细介绍。
图4 不可变区域分类模板数据库流程
2.1 预处理部分
1)图像处理:电气铭牌原图统一尺寸变化、图像降噪等工作[12]。
2)不可变区域模板库制作:电气铭牌原图不可变区域制作成为模板如图2 所示,并将所有制作模板存入数据库,依次标上标签。
3)原图标签和模板标签:电气铭牌原图和对应标准模板打上相同标签,并放入数据库中进行调用。
4)经过图像处理数据集,按训练集∶验证集∶测试集=6∶2∶2 进行划分。
2.2 网络部分
选用卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层和输出层组成。综合考虑电气铭牌分类类别量、计算机性能和网络特点,采用VGGNet 网络[13]。该网络有以下几个特点:使用多个3×3 卷积核代替一个卷积核较大的卷积层,不仅可以减少参数还能够增加网络拟合能力;VGG16 通道数量增加,使得更多特征能够被提取;VGG16 模型框架的设计更深更宽,增加了控制计算量规模。
2.2.1 网络搭建
苏楠很想再见杨小水一面——单纯的见面,没什么目的。她心里空得慌,想见一个人,一个离她近的人。真是滑稽,律师竟然和她的委托人成了最亲的人,成了母女。母女还不应该见见面?
VGG16 训练层由5 层卷积层和3 层全连接层组成[14]。训练层选取激活函数:ReLU,全连接层选取激活函数:Softmax 为分类器。最后输出层为50 类电气铭牌分类输出。
VGG16 网络模型如图5 所示。
图5 VGG16 网络模型
2.2.2 网络训练
进行200 轮训练,每1 轮进行一次验证,每20 轮进行一次模型保持保存。保证学习率每次步长为30。全连接层1 000 类展开,最后网络输出神经元为50。如图6 所示为分类模型训练和验证损失,图7 为分类模型训练和验证精度,图6 和图7 横坐标为训练轮数,从图中可以发现随着训练轮数的增加,纵坐标训练和验证的损失逐渐下降,精度逐渐上升。训练轮数在75 时,模型波动小于1%,基本没有波动,该模型实验准确率达到98%。实验结果表明,将电气铭牌进行分类能够避免对铭牌不可变区域进行直接识别,系统鲁棒性强。分类模型最终训练精度在99%,测试精度为97%。
图6 分类模型训练和验证损失
图7 分类模型训练和验证精度
2.3 标签测试部分
该部分通过预处理和网络模型部分之后,将网络训练好的模型进行电气铭牌标签预测。输入一张电气铭牌图像,网络返回三个标签概率值,取概率值最大的标签输出。如图8 所示,大类相同铭牌预测结果为输入四张电气铭牌大类标签(不可变区域)为19,小类(可变区域)不同的标签为19_1,19_2,19_3 和19_4 的电气铭牌预测结果为19。
如图9 所示,大类不同铭牌预测结果为输入多张标签为1,16,21 和31 的电气铭牌预测结果准确。实验结果表明该系统均能够对输入多张同大类或者多张不同大类电气铭牌准确预测标签。
图8 大类相同铭牌预测结果
图9 大类不同铭牌预测结果
3 实验结果与评估
3.1 数据集
选用电气铭牌图像为研究对象。数据集将过度曝光、模糊等不符合当前实验设置条件数据进行剔除。针对不可变区域进行模板建库,对可变区域采用随机生成数据。不可变区域为50 类,可变区域随机生成50 类,共有50×50=2 500 张数据。其中,1 500 张数据用于训练,500 张用于验证,500 张用于测试。
3.2 实验结果
基于分类模板数据库的电气铭牌识别结果与引言中当前主流电气铭牌识别结果进行对比。对电气铭牌不可变区域识别结果进行分析。
1)基于传统方法的电气铭牌识别
根据文献[3]使用小波变换和N 阶马尔科夫字符排列模型方法进行电气铭牌识别,结果如图10 所示。
图10 传统方法电气铭牌识别
由图10 可知,图10a)为文献[3]提出方法,能够对铭牌进行识别,识别内容为“110 kV 仓线端子箱”;图10b)为传统OCR 方法,识别内容为“一D 七仓幼子抽”。根据识别结果对比,文献[3]方法识别效果更好,但是该方法不能对文本行太多的铭牌进行识别。
2)基于深度学习的电气铭牌识别
根据文献[4]使用基于深度学习避免字符分割对电气铭牌进行识别结果,如图11 所示。
图11 基于深度学习电气铭牌识别
由图11a)识别结果可知,10 kV 电力线缆识别结果为“10 kV 电力缆缆缆”;投运日期:2008 年12 月运行单位:东区供电公司识别结果为“投运日期:2000008 运运位位位供电位位位位”。图11b)识别结果分析,CNP 污水污物潜水电泵控制柜识别效果为“CNP 污水物物潜水电泵制制”。识别优点:能比传统技术识别更多文本行;缺点:单行识别效果差,准确度低。
3)分类模板数据库方法
对电气铭牌建立标准模板库,预测电气铭牌分类标签调用模板得到不可变区域识别结果,如图12、图13 所示。图12a)是输入标签为1 的电气铭牌,预测出标签为1,此时调用标签为1 的电气铭牌模板。输出图12b)结果不可变区域识别结果正确。分析图13a)、图13b)识别结果正确。
图12 标签为1 电气铭牌不可变区域识别
图13 标签为16 电气铭牌不可变区域识别
综上所述,基于传统方法的电气铭牌识别,只能对背景简单、字符较少的铭牌进行识别;而基于深度学习的识别方法,虽然避免了对字符进行分割减少识别流程,但是对文本行太多构造和更复杂铭牌无法进行准确识别。
上述两种方法都无法进行工程应用。所以本文提出分类模板数据库方法,能够准确预测分类标签通过调用预先建立的模板完成不可变区域识别。通过比较识别结果,该方法能够很好地识别不可变区域,而且避免大量中文和特殊字符识别,稳定性强,识别精度高。
4 结 语
文章针对文本行密集、中文量大和特殊字符的电气铭牌存在识别效果欠佳、存在大量识别错误等问题,分析电气铭牌构造,提出分类模板数据库辅助电气铭牌识别的方法,将识别区域分为不可变区域和可变区域。与当前识别方法进行对比,该方法能够避免对大量字符进行直接识别,通过分类标签预测调用模板,完成不可变区域识别。直接降低电气铭牌识别难度,提高识别准确度。该方法基于电气铭牌大类数目一定的特点,能够进行有限遍历。但是该方法只能识别已经入库的电气铭牌,对电气行业大量电气铭牌和新类型的电气铭牌,对每一大类都需要进行入库训练才能使用该方法,存在一定局限性。未来将进一步开展基于分类模板数据库完成电气铭牌可变区域识别的工作。
注:本文通讯作者为潘文林。