APP下载

基于果蝇算法优化LSTM 的用户异常用电行为预测

2023-02-23张敏李晓明辛玲玲董昊男

电子设计工程 2023年4期
关键词:果蝇电信号用电

张敏,李晓明,辛玲玲,董昊男

(国网甘肃省电力公司,甘肃兰州 730030)

果蝇优化算法是从仿生学角度提出的新型群体智能优化算法,该算法根据果蝇觅食行为,推演出了一套完善的数值求解方法,既能缩短数据排查所需的时间,也可大幅提升数值解的应用可行性[1]。LSTM是一种简单的长短期记忆网络结构,附属于传统的时间循环型神经网络之上,其目的在于解决数据信息参量之间的长期依赖问题,并且在应用过程中,要求所有网络模块都必须保持链式连接的存在形式[2]。在一个标准的网络结构体中,重复出现的LSTM 模块之间仅依靠小型神经结构体相连。

异常用电是一种极为严重的错误电量消耗行为,包括擅自改变用电类别、擅自超过合同约定容量用电、擅自迁移电能计量装置等多种表现形式,在不同的电网环境中,异常用电行为带来的负面影响也不同[3]。近年来,随着电信号输出量的不断增大,用户用电负荷量始终呈现相对集中的表现状态,在此情况下,因电信号堆积而造成的异常用电行为问题也更加明显[4]。为解决上述问题,将果蝇优化算法与LSTM 网络结构融合起来,并以此为基础,设计一种新型的用户异常用电行为预测模型。

1 基于果蝇算法优化LSTM的用电量记忆

1.1 算法初始化

果蝇算法对于LSTM 网络的优化思路在于可根据用户异常用电行为数据,控制群体果蝇节点的步进寻优程度,一般可以分为如下几个步骤:

1)初始化预设

初始化预设就是设定群体果蝇的初始化行为参数,包含数据迭代次数、群体大小、起始位置等指标参量[5]。设i代表果蝇群体节点的定义系数,X(i)代表果蝇群体的实时行进距离,在果蝇队列项为λ的情况下,联立上述物理量,可将X(i) 表达式定义为:

其中,x0代表群体果蝇的行进起点坐标,xi代表群体果蝇的行进终点坐标。

2)移动

移动就是在群体果蝇节点中选择数据浓度最高的个体,在记录该节点所处位置后,按照步长值结果,设定数据信息的实际传输速率[6]。

3)迭代

重复上述操作,直到数据浓度满足所设定的最大迭代次数值。设n表示数据信息的实际迭代次数,yi代表果蝇群体节点定义系数为i时的数据浓度量,i代表数据浓度特征值,具体计算公式如下:

根据迭代与初始化预设结果的真实性,可判断用户异常用电数据在果蝇算法作用下的传输行为能力。

1.2 用电数据预处理

完成果蝇算法的初始化配置后,需要根据用户异常用电行为的表现形式,对相关用电数据进行初步加工,也就是用电数据的预处理[7-8]。LSTM 网络可在分离提取用电数据后,根据算法坐标系内决策节点的排列方式,获取数据信息参量的时序序列模型,并以此为基础,实现对预处理数据结果的有效判别。为了保障果蝇算法对于LSTM 网络的优化作用能力,在执行用电数据预处理步骤时,必须控制X(i)表达式、σ(i)表达式的数值结果始终大于零。设φ代表果蝇算法的理想优化标度值,f代表LSTM 网络的稳定性系数,ΔP代表用户异常用电行为数据的单位传输量,联立式(1)、式(2),可将用电数据的预处理结果表示为:

根据用户异常用电行为数据传输量水平的不同,数据信息的预处理结果也会发生相应的改变。

1.3 LSTM超参数

根据用户异常用电行为,选取LSTM 超参数,需要在果蝇算法的基础上,确定信息参量在节点集合体中的浓度衰减情况。首先,根据LSTM 网络中用户异常用电行为数据的覆盖现状,确定果蝇算法的优化更新速率,从而将不同的超参数直接赋值到个体果蝇节点上[9]。其次,判断个体果蝇节点在LSTM 网络中所代表的超参数适应度水平,并分别计算个体节点处的数据量浓度。最后,按照个体果蝇节点所属的步长值序列,得到准确的LSTM 超参数计算结果[10]。设代表用户异常用电行为数据的备选特征值,β代表单位时间内的果蝇算法优化执行次数,联立式(3),可将LSTM 超参数计算结果表示为:

其中,s代表LSTM 网络对于果蝇算法的基本适应度数值,n代表LSTM 网络的迭代权限值。在LSTM 网络中,由于果蝇算法的存在,用户异常用电行为数据总是能够保持相对集中的传输表现形式。

2 用户异常用电行为预测模型

2.1 评价指标选取

在LSTM 网络中,为获得较为理想的用户异常用电行为预测结果,需要根据异常数据信息量的存在形式,确定预测模型的实际应用价值,且在此过程中,应利用相关已知条件,选取未知的评价指标参量[11]。在实时选取指令时,必须判断用户异常用电行为所属类型,一般来说,由改变用电类别、超出额定用电量等行为带来的异常用电数据累积量较大,而由迁移电能计量装置所带来的异常用电数据累积量相对较小[12]。对于选取预测评价指标而言,若不能掌握异常用电行为所属形式,不但会造成预测结果出现偏差,也会使果蝇算法的优化应用能力大打折扣。设A0代表异常用电数据的初始判别量,Am代表异常用电数据的实时判别量,m为既定的数据信息判别条件,联立式(4),可将用户异常用电行为预测模型的评价指标选取结果表示为:

式中,Dmax代表最大的异常用电数据筛查系数,k代表LSTM 网络中的数据信息量筛查条件。为突出果蝇算法的优化应用能力,在实际应用过程中,用户异常用电行为数据评价指标的选取应以真实性作为主要参考标准。

2.2 缺失值计算

缺失值是指因人为原因或机械原因造成的某项样本数据严重缺失的情况,在预测处理过程中,若不能准确掌握样本数据的实时缺失情况,势必会影响用户异常用电行为数据的传输能力,从而造成数据信息缺口量继续增大[13-14]。为解决此问题,果蝇算法通过优化LSTM 网络的方式,为所选取评价指标提供一个相对稳定的预测背景环境,并可在不断融合用户异常用电行为数据的同时,从中提取出具有明显缺失特征的信息参量,并将其独立存储于既定的网络结构体模块之中。设ξ代表用户异常用电行为数据的实时融合系数,代表异常用电数据信息在LSTM 网络中的存储量均值,代表缺失量筛查条件,联立上述物理量,可将LSTM 网络中异常用电数据的缺失值计算结果表示为:

如果待预测的数据样本中存在大量的缺失值参量,则需针对相关数据信息参量进行初步剔除处理,再按照缺失值计算公式,对后续的用户异常用电行为预测指令进行妥善安排。

2.3 决策参数

决策参数能够决定电信号训练指令的执行与应用能力,若依照数据样本条件,对用户异常用电行为信息量进行预测,则应将决策参数作为关键的数值考核指标[15-16]。假定在已知缺失值计算量的情况下,决策参数的数值结果只能在极大值bmax、极小值bmin之间不断波动,且在已知LSTM 网络中果蝇算法优化作业能力的情况下,可认为待预测的异常电量数据越多,决策参数的数值结果越靠近极大值方向。设W1、W2代表两个不同的电信号训练强度值,在上述物理量的支持下,联立式(6),可将决策参数表达式定义为:

其中,代表用户异常用电行为数据的预测考核系数值,θ代表用电数据缺失值的标准计算项系数。至此,完成相关指标参量的计算与处理,在果蝇算法优化LSTM 原理的支持下,实现用户异常用电行为预测模型的顺利应用。

3 实例分析

按照果蝇算法优化LSTM 原则对用户异常用电数据进行选取(如图1 所示),在圈定果蝇群体范围的条件下,将满足个体果蝇定义标准的数据作为实验组变量,将不满足个体果蝇定义标准的数据作为对照组变量(非果蝇算法优化LSTM 的用户异常用电数据)[17-19]。

图1 用户异常用电数据选取

在集中负荷情况下,将时间区段划分出10 min、20 min、30 min、40 min、50 min 五个节点位置,并在每一节点处,分别对用户异常用电行为数据进行提取,如图2、图3 所示。

图2 集中负荷情况下的横向用电行为选取

图3 集中负荷情况下的纵向用电行为选取

将每一节点处输出的用户异常用电行为数据都看作一个独立的电信号,记录这些电信号在用户用电集中负荷时所需消耗的训练时长,详细实验结果如表1 所示。一般来说,电信号训练时间越长,与之对应的用户异常用电行为堆积现象也就越明显。

分析表1 可知,在横向用电负荷量、纵向用电负荷量数值均保持一致的情况下,随实验时间的延长,实验组电信号训练1 000 次所需的消耗时间始终小于对照组,从第10 min 到第50 min,二者之间的差值依次为11.93 s、2.82 s、2.55 s、3.13 s、2.17 s。整个实验过程中,实验组电信号训练1 000 次所需的消耗时间均值为412.24 s,与对照组均值416.76 s 相比,下降了4.52 s。

表1 电信号训练时间

综上可知,随着果蝇算法优化LSTM 理论的应用,集中负荷情况下电信号数据所需的训练时间长度明显缩短,不但解决了电信号堆积的问题,也可更为准确地对用户异常用电行为进行预测。

4 结束语

文中提出了基于果蝇算法优化LSTM 的用户异常用电行为预测模型,通过初始化标准算法的方式,得到理想化的数据信息预处理结果,再联合LSTM 超参数指标,选取异常用电行为预测所需的数据信息参量,由于缺失值系数项的存在,决策参数能够影响最终电信号训练指令的实施强度,这也是该模型在用户用电负荷量较为集中的情况下,可以直接解决因电信号堆积而造成的异常用电行为问题的主要原因。

猜你喜欢

果蝇电信号用电
果蝇遇到危险时会心跳加速
基于联合聚类分析的单通道腹部心电信号的胎心率提取
2021年大樱桃园果蝇的发生与防控
安全用电知识多
对输配电及用电工程的自动化运行的几点思考
小果蝇助力治疗孤独症
基于Code Composer Studio3.3完成对心电信号的去噪
果蝇杂交实验教学的改进策略
为生活用电加“保险”
用电安全要注意