基于tesseract 训练的电力告警信号特征识别方法
2023-08-27陈东海吴昱浩
陈东海,王 猛,吴昱浩,杨 淇
(国网宁波供电公司,浙江宁波 315000)
tesseract 训练引擎码源由C#、C++两种语言混编而成,在编译过程中,所有接口函数直接存储于baseapi.h 文件中。一般来说,一个tesseract 训练引擎码只能处理一类Image 信息,且随着应用时间的延长,已被读取数据指标会占据原信息文件的传输位置,不但会避免传输数据文件出现过量堆积情况,也可建立一个信息参量与另一个信息参量之间的函数连接,加强数据与数据之间的联系紧密性[1-2]。在智能电网、电力体系等应用环境中,电压信号、电流信号等特征指标可作为tesseract 训练引擎的传输对象,且随着数据读取指令的执行,这些文件信息可直接存储于既定数据库主机中,以供其他编译码源的调取与利用。
电力告警信号是指能够描述错误电信号传输行为的指标参量,在智能配网环境中,电网主机对于告警信号特征的识别准确性直接决定电网体系的应用稳定性。传统多特征组合识别方法通过电力告警信号特征逐级分析的方式,建立核心信号标记节点与下级信号标记节点之间的物理连接关系,再借助已知编码原则,确定特征信号参量的位数识别结果[3]。然而,与该方法匹配的电力告警信号峭度指标极值差水平较高,不利于增强电网主机对于告警信号特征的识别准确性。为解决上述问题,设计基于tesseract 训练的新型电力告警信号特征识别方法。
1 信号字符标记
在tesseract 引擎支持下,电力告警信号的字符标记主要由tesseract 训练环境布局、字符行区域识别、字符列区域识别三部分组成。
1.1 tesseract训练环境布局
训练环境布局是tesseract 引擎码源设计的关键环节,可将既定电力告警信号特征聚集在同一数据信息存储环节中,并可按照既定调用函数,将信息参量分割为多个应用模式,一部分可供电力主机体系直接调取;另一部分则能够为行、列区域提供可识别的备选字符信息[4-5]。
规定第一个tesseract 引擎码源的定义系数项为u1,第n个tesseract 引擎码源的定义系数项为un,且标记节点n的取值结果始终大于1。规定由式(1)决定的tesseract 引擎标记行为恒成立,则认为电力告警信号特征的训练环境布局原则始终满足式(2):
式中,e表示tesseract 引擎码源标记系数,β表示电力告警信号的训练特征值,w1表示第一个tesseract 引擎码筛查系数,wn表示第n个tesseract 引擎码筛查系数,p表示tesseract 引擎中的数据信息行为项。环境布局形式决定了tesseract 训练引擎的应用能力,一般来说,待识别的电力告警信号特征量越多,tesseract 训练环境对于数据信息参量的容纳能力也越强。
1.2 字符行区域识别
字符行区域是以行分布系数为基础划分的电力告警信号特征识别区域,在识别取样过程中,行区域覆盖面积越大,则表示tesseract 训练引擎的横向布局能力越强,反之则越弱[6]。字符行区域识别可以理解为对电力告警信号特征行区域环境的规划,在配电网环境中,由于信号传输特征的不同,与之匹配的数据训练方式也有所不同,这也是导致电网主机对于告警信号特征识别结果出现明显差异性的主要原因[7-8]。
设ΔS表示tesseract 训练环境的行区域跨度量,r表示电力告警信号特征的行区域跨度系数,qr表示行区域跨度系数取值为r时的告警信号特征值,m、d表示两个不同的行区域字符节点标记系数,联立式(2),可将字符行区域识别结果SR表示为:
若以tesseract 训练布局环境为背景,则可认为行区域识别结果直接决定了电力告警信号特征的横向传输能力。
1.3 字符列区域识别
字符列区域是以列分布系数为基础划分的电力告警信号特征识别区域,在识别取样过程中,列区域覆盖面积越大,则表示tesseract 训练引擎的纵向布局能力越强,反之则越弱。字符列区域识别可以理解为是对电力告警信号特征列区域环境的规划,在配电网环境中,与每一列电力告警信号特征所匹配的实时传输行为有所不同,此时为充分激发tesseract训练引擎的应用能力,应对电力告警信号特征所属的列区域环境进行严格规划与部署[9-10]。
设ΔD表示tesseract 训练环境的列区域跨度量,i表示电力告警信号特征的列区域跨度系数,qi表示列区域跨度系数取值为i时的告警信号特征值,c表示列区域字符节点标记系数,可将字符列区域识别结果DR表示为:
若以tesseract 训练布局环境为背景,则可认为列区域识别结果直接决定电力告警信号特征的纵向传输能力。
2 电力告警信号的特征识别
2.1 信号特征提取
在tesseract 训练布局环境中,电力告警信号特征提取行为能够决定特征参量识别结果准确性,对不同数据信息指标,与之相关的信号特征提取结果也会有所不同[11-12]。在不考虑其他干扰条件的情况下,电力告警信号特征提取结果同时受到数据信息传输变化量、特征指标判别条件两项物理量的直接影响。
数据信息传输变化量可表示为ΔG,在单位判别时间内,该项物理指标取值结果越大,电网主机能识别到告警信号特征值也就越多。特征指标判别条件可表示为χ,若单纯以tesseract 训练引擎作为干扰项影响条件,则可认为该项物理指标的取值结果将直接影响电网主机对于电力告警信号特征的识别与处理能力。在上述物理量的支持下,联立式(4),可将信号特征提取表达式定义为:
其中,z表示电力告警信号特征的传输干扰项,λ表示tesseract 训练引擎对于电力告警信号的判别系数。假设tesseract 训练引擎的应用稳定性不会发生改变,则可认为信号特征提取条件能够直接影响电网主机对于告警信号特征指标的识别。
2.2 识别阈值
识别阈值也称为tesseract 训练引擎对电力告警信号特征所设置的识别判断权限,在已知信号特征提取结果情况下,该门限指标的取值结果越大,电网主机对于告警信号特征的准确识别能力也就越强,反之则越弱[13-14]。
设vmax表示电力告警信号特征在tesseract 训练引擎中传输速率的最大值,vmin表示传输速率的最小值,在实际应用过程中,不等式(vmax-vmin)>1 恒成立。规定j表示一个既定的信号特征标记条件,ϖj表示该条件下电力告警信号特征的预设实值结果,在上述物理量的支持下,联立式(5),可将识别阈值表达式定义为:
式中,k表示已知的特征数据判别项指标。通常情况下,在tesseract 训练引擎的支持下,指标k的取值结果始终不会大于自然常数e。
2.3 暂态行为处理
暂态行为处理是电力告警信号特征识别方法设计的末尾执行环节,在tesseract 训练环境中,电网主机可以通过规划电力告警信号特征存储区间的方式,确定暂态识别行为的实际执行能力[15-16]。
设xα表示电力告警信号暂态行为标记系数为α时待识别特征指标参量,xˉ表示待识别特征指标参量的平均值,α表示信号特征参量的实际识别权限,b表示实时系数项,φ表示既定的信号数据识别特征值。在上述物理量的支持下,联立式(6),可将暂态行为处理结果表示为:
3 实例分析
为验证基于tesseract 训练的电力告警信号特征识别方法实际应用价值,设计如下对比实验。通过人工干预方式模拟电力告警信号的传输行为,选取两台配置完全相同的电网主机作为实验对象,其中实验组主机配置基于tesseract 训练的特征识别方法,对照组主机配置多特征组合识别方法。具体的实验环境配置流程如图1 所示。
图1 实验环境配置流程图
电力告警信号峭度指标极值差能够反映电网主机对告警信号特征识别准确性,一般来说,极值差水平越低,表示电网主机对于告警信号特征的识别准确性越强,反之则越弱。表1 记录电力告警信号峭度指标极值差的理想数值水平。
表1 电力告警信号峭度极值差的理想数值
分析表1可知,随着实验时间的延长,峭度指标极大值、极小值均表现出不断波动的数值变化趋势。当时间取值为20 min时,峭度极值差的数值水平最大,达到了13.4°/V,当时间取值为40 min时,峭度极值差的数值水平最小,达到了7.5°/V,二者差值为5.9°/V。
图2 为实验组、对照组电力告警信号峭度指标极大值的实验数值结果。
图2 电力告警信号峭度指标极大值
图3 为实验组、对照组电力告警信号峭度指标极小值的实验数值结果。
图3 电力告警信号峭度指标极小值
对照图2、图3,计算实验组、对照组电力告警信号峭度指标的实际极值差结果,具体数值如表2所示。
表2 电力告警信号峭度极值差的实际数值
对比表1、表2 可知,当时间取值为50 min 时,实验组电力告警信号峭度极值差达到最大值8.3 °/V,与理想最大值13.4°/V 相比,下降了5.1°/V。当时间取值为40 min 时,对照组电力告警信号峭度极值差达到最大值21.8°/V,与理想最大值13.4°/V 相比,上升了8.4°/V。
4 结束语
与多特征组合识别方法相比,新型识别方法在tesseract 训练引擎作用下,分别对字符行区域与列区域进行准确识别,通过阈值判别方式完成暂态行为处理。从实用性角度来看,随着这种新型识别方法应用,电力告警信号峭度极值差的实际数值水平得到了较好控制,符合增强电网主机对于告警信号特征识别准确性的实际应用需求。