APP下载

基于深度学习的电力通信线缆配线标签识别技术研究

2023-11-27付连宇

中国新技术新产品 2023年20期
关键词:配线电力通信线缆

付连宇

(1.天津工业大学,天津 300000;2.国网天津市电力公司信息通信公司,天津 300000)

由于智能电网不断发展,电力通信网络规模迅速变大,因此产生了很多通信线缆配线标签,电力通信线缆作为数据信息交互的重要介质,对其配线标签进行管理至关重要,对通信资源的合理调度和管理具有重要影响。一般通过配线标签对人工进行排查和校验,因为网络资源种类多、线缆数量多且基站分布广,所以采用传统的识别方法进行标签排查和校验会浪费较多的人工和时间成本。将人工智能技术和标签识别相结合,可以有效提高标签文本的识别精度和识别效率,并降低人工成本。为了保证充分利用电力通信数据,提高通信数据信息的质量,实现通信资源管理的信息化和精益化,需要对电力通信线缆配线标识进行智能化识别技术研究,保障电力通信网运行安全[1]。

1 深度学习网络模型

基于对神经网络技术的深入研究,对数据信息的深度学习可以采用神经元模拟的方法来实现,各个隐含层间的密切关系为多层感知学习网络构建提供了条件,为了提取数据特征,采用基于神经网络的方法对数据维度进行调整,从而刷新数据表达方式。

1.1 LSTM单元结构

LSTM采用连接众多小模块的方式来构建时间递归神经网络,通过数据训练提取时间序列中的延迟事件,并依托神经网络存储相关事件。LSTM通过引入遗忘门和输入门为子模块的长期记忆功能提供保障,输入门可以对RNN输入补充新记忆,遗忘门可以遗忘没有价值的信息,通过遗忘门和输入门的协作更新和剔除数据信息,从而实现遗忘和保留的功能。

对LSTM进行专业设计,可以使输入门、输出门、遗忘门和更新门相互交互,LSTM对上述门结构进行组合,形成1个称为cell的处理器。

当输入门有外界数据进入时,cell根据一定的规则对进入cell的数据信息进行判定,并对其进行保留或者遗忘,即1个输入对应2个输出,通过多次计算可以有效避免发生神经网络自有的长序依赖现象。LSTM的适应性较强并且具有较高的灵活性,LSTM依托模型中各个cell间的结构实现了长时间记忆,可以保证数据信息和误差信号的无衰减传递,数据经过长时间训练后仍然可以通过LSTM进行保留,同时可以实现对当前状态进行更改的功能[2]。

LSTM单元结构如图1所示,当数据信息特征差异较大时,LSTM单元在多次计算后可以明显改善特征值,具有较好的效果。

图1 LSTM单元结构

1.2 LSTM训练思路

通过上述介绍可知,LSTM能适应各种数据结构,具有很高的灵活性,为了开发一种与LSTM单元结构匹配的训练算法,引入反向传播算法(Back Propagation Through Time,BPTT),当该算法的回传特性应用于数据训练过程时,可以为数据信息的完整传递提供重要保证。当误差数据在cell间传递时,当前cell会保存其数据信息,并朝更前的时间状态反向传播数据[3]。

当输入/输出门以及cell输入有误差数据时,继续以反向传播的方式进行数据传递,为了达到理想的数据训练目的,还需要对当前cell的各模块的权值进行修正。

2 标签识别模型构建

标签在通信线缆的端子处粘贴,容易受软体线缆的影响而出现扭曲和层叠现象,同时受环境因素、标签文本方向不同和文本变形等干扰因素的影响,现有的标签识别技术性能发挥受到限制,因此需要开发一种基于深度学习的智能识别技术。

基于LSTM实现电力通信线缆配线标签识别需要对其识别模型进行构建,主要包括文本检测和文本识别。首先,对标签矩形区域的文本信息进行提取,从而实现定位任意区域文本信息的功能。其次,对任意区域的文本信息进行识别,从而实现获取文本信息的功能。最后,对文本信息进行校准,以获取准确的标签信息。

2.1 文本检测

采用YOLO v5版对文本进行预检测,包括文本框选取和坐标点选取。通过文本框选取识别标签信息所在区域,并对该区域的图像进行剪切,文本框包括除了文本外的其他变形的图像信息。坐标点选取可以定位文本框区域的图像坐标。

通过获取图像的左上、左下、右上和右下4个点坐标来确定图像所在矩形区域的位置,并对其长度、宽度和高度进行测量,从而构建新图像的4个坐标点,将其视为所要识别的图像矩形区域坐标。通过变换矩阵将源图像所在区域透视化处理为目标图像所在的矩形区域,从而生成校准后的图像。

数据预处理是进行文本检测的关键步骤,采集文本信息对正确识别标签具有重大影响。该文采用近邻补全算法对缺失的数据和质量差的数据进行修正。序列数据具有相邻数据相似的特点,如果序列中的一段数据丢失,该段数据的前后具有连续性,定义一个中间变量,并提取相邻的k个数据信息,对其求平均值并用该值替换丢失的数据[4]。

为了获取缺失数据在数据序列中的距离,采用欧式距离法判断数据远近,如公式(1)所示。

式中:Xi为第i个样本点前m维数据,Xi={xi1,xi2,xi3,...,xim};Xj为第j个样本点前m维数据,Xj={xj1,xj2,xj3,...,xjm};xjn为第j个样本点的第n维属性;xin为第i个样本点的第n维属性。

通过上述计算完成数据远近判断后,需要对数据序列进行为归一化处理,从而使数据在[0,1]变化,如公式(2)所示。

式中:yi为经过归一化处理后的输出值;xi为输入值;max(x)为数组的最大值;min(x)为数组的最小值。

完成LSTM单元的输入数据预处理后,需要对输入量进行挑选,合理选择数据及标签是搭建线缆标签识别模型的重要步骤,通过选取输入量来实现重复训练神经网络的功能。影响线缆标签识别的因素有很多,对传统的物理识别方法来说,其输入量通常选择众多因素中最关键的一个,采用基于深度学习的方法识别线缆标签,不需要对大量的数据进行筛选,减少了工作量。LSTM网络在数据进行迭代计算的过程中会遗忘权重影响小的特征值。

采用PSEnet模型定位任意形状文本框并提取图像特征,通过分割特征图得到多个预测区域,采用扩展算法对较大区域的像素进行扩展,从而实现文本检测的功能[5]。

2.2 文本行矫正

如果线缆标签所处的环境相对复杂,那么对其进行检测时同一个文本行会被分成多个区域,存在多次检测现象,为了解决上述问题,需要对这些区域进行合并,避免发生过分割现象。

对上述若干个小区域进行合并需要满足以下2个条件:1) 要保证所合并的文本区域行高接近。2) 要保证所合并的文本区域距离相近。

文本区域的行高是否接近可以通过公式(3)进行度量。

式中:D(M)为M元素的方差;q为文本行的区域个数;Mi为待合并的一个小区域的上、下边缘线的中位数;Mj为待合并的另一个小区域的上下边缘线的中位数。

其中,Mi上、下边缘线中位数如公式(4)所示。

式中:Tyj、Byj分别为小区域的上边缘和下边缘线的Y坐标。

文本区域的距离是否接近可以通过公式(5)进行度量。

式中:ωw为文本区域一个字的宽度;T1为某区域上边缘的坐标;T'100为该区域上边缘的右坐标;B1为某区域下边缘的左坐标;B'100为该区域下边缘的坐标。

根据上述条件对多个小区域进行合并,通过线性插值的方法对出现断层的区域进行补齐修复,对交叉的区域来说,采用MeanShift方法对该区域进行融合处理。在合并文本行多个小区域后,根据薄板样条插值原理(Thin Plate Spline,TPS)和变换矩阵对图像进行矫正,从而通过提高像素值实现对文本行进行水平矫正的功能。

2.3 文本识别

LSTM模型可以对字符序列进行推理并对其特征进行提取,该文通过密集神经网络对预测的文本框区域的图像特征进行提取,通过Seq2Seq提取相邻像素间的特征,并在Attention中引入额外权重信息,从而建立文本识别模型[6]。

LSTM通过反向传播算法对循环神经网络进行训练,为了提高文本识别的精度,同时兼顾LSTM模型的复杂度,对模型的相关参数进行优化配置,主要参数包括单神经元的偏置和多神经元间的连接权重,利用梯度下降算法对其进行调整,如公式(6)所示。

式中:C为代价;a为神经元输出值;y为实际值;ω为神经元间连接权重;b为神经元偏置;x为序列数据样本;z为神经元输入;σ为激活函数[7]。

2.4 文本纠错

为了保证识别标签信息的正确性,通过纠错模型对文本进行纠错,包括传统的纠错模型和深度学习纠错模型。其中,常见的低级别错误通过传统模型进行纠正,而复杂的高级别错误通过深度学习模型进行纠正。文本纠错模型如图2所示。

图2 文本纠错模型

纠错模型主要由N-gram模型、Seq2Seq_Attention模型和Transformer模型构成,N-gram模型主要是对常见的低级别错误进行纠正,模型表达式如公式(7)所示。

式中:l为文本总词数;n为参考的词数;w为各个词;P(w)为词概率。

由图2可知,文本纠错模型中的Seq2Seq_Attention模型是基于Seq2Seq模型实现Attention功能的,模型收敛效果好,并且更适用于对长文本进行纠错;Transformer模型采用Attention结构,与LSTM结构相比,它可以更好地提取文本信息特征。分别通过Seq2Seq_Attention模型和Transformer模型对文本信息进行纠正并各自生成备选句子,再通过N-gram模型对上述备选句子的疑难度进行分析,最终的文本纠正结果以疑难度最低的备选句子为准。

3 算例分析

为了验证该文提出的配线标签识别算法的可行性,以某变电站的现场文本数据为支撑,对其进行建模并识别标签。首先,采集数据集中的图像样本,包括文字方向不一致、变形扭曲以及光照不均等文本。其次,根据数据集对所建标签识别模型进行训练,结合现场实际情况,提取60个历史数据作为1个批处理进行预测,并对其输入层维度进行确定,该文输出层采用单维度,LSTM识别模型的输出为单通道,结合统计方法并通过深度学习算法建立电力通信线缆配线标签识别模型,配线标签识别模型的计算流程如图3所示。

图3 标签识别模型计算流程图

挑选1 000个数据序列的图像样本,经分析发现,样本中数据信息变化较大,因此需要采用Adam优化器对标签识别模型进行优化处理,以保证识别精度。首先,对采集的样本数据进行清洗。其次,按照6∶4的比例进行拆分,将归一化处理后的图像数值作为LSTM的输入,模型学习率设为0.001,时序隐藏元个数设为59,隐藏层数设为3,批尺寸设为30。基于建立的识别模型对电力通信线缆配线标签进行识别,通过实际文本信息与识别结果的对比验证了该文提出的通信电缆配线标签识别方法的可行性和准确性[8]。

4 结语

配线标签的准确识别可以充分利用电力通信数据信息,实现精益化管理通信资源的目标。该文基于深度学习对电力通信线缆配线标签识别方法进行研究,详细介绍了深度学习网络模型,分析了影响标签识别结果的各种因素。为了满足文本检测和文本识别的需求,该文基于LSTM算法对标签识别模型进行建模并验证了其功能,该识别技术为标签的自动化和智能化识别提供了数据支撑,有利于提高电力通信的运行管理效率,该技术还可以推广应用到物流包裹等领域,具有一定的通用性。

猜你喜欢

配线电力通信线缆
关于无配线车站码序设计方案优化研究
上海福尔欣线缆有限公司
ZD6型道岔转辙机配线技术的改进与应用
无线通信技术在电力通信专网中的应用
弹上线缆布设技术研究
50Hz轨道电路配线测试工装技术探讨
冷接技术在电力通信的应用
华通线缆:“通”向未来的品牌梦
电力通信工程建设存在的问题与对策
OTN技术在电力通信中的应用