APP下载

基于对冲对抗机制与图注意力网络的异常用电检测

2022-11-28王炜韬王小宇

电力系统自动化 2022年22期
关键词:台区潮流用电

王炜韬,赵 健,王小宇

(上海电力大学电气工程学院,上海市 200090)

0 引言

目前,以用户异常用电为首的非技术性损耗占据配电网总损耗的65%~70%[1-2],是电力公司运营管理中的痼疾。据不完全统计,中国每年因用户异常用电造成的损失高达200 亿元[3],如何提升对于用户异常用电稽查的效率和准确性仍是亟待解决的问题。由于人工排查的方法耗时耗力,在用户台账、用电负荷、电量计量等多维度用电信息的支撑下,基于数据驱动的异常用电检测方法得到了快速发展,根据机理可大致分为3 类:

第1 类:基于聚类的方法[4-8]。异常用电用户的某些用电特征指标相较正常用户存在差异,可通过聚类方法找出偏离聚类簇的异常用户。但在复杂的用电行为中找出具有代表性的特征较为困难,这使得该类方法误报率高。

第2 类:基于分类的方法[9-12]。主要以带有标签的特征指标训练分类器,使其能够判断无标签用户的用电情况,检测效果在多数情况下优于聚类方法。然而人为设计特征指标,难以很好地描述异常用电的情况。另外,分类器的训练以用电量稳定为前提,对于相当一部分用电不稳定的用户将失去异常检测的作用。针对该问题,文献[13]提出一种二次筛选方法,为电量不稳定造成漏报和误报提供新的研究思路,有待进一步研究与完善。

第3 类:基于潮流约束的方法。配电网电气量具有强耦合性,节点的注入功率与电压受潮流方程约束[14]。其中,最主要的一类方法是基于状态估计的异常检测方法[15-16],通过比较节点电压、功率估计值与量测值的残差推断量测值是否被篡改,判断用户是否发生异常用电。该类方法较好地解决了分类方法处理用电不稳定用户时高误报的问题,但是其过于依赖网络的本构参数,即拓扑和线路参数精度,在实际一般的配电网,尤其是直面大量用户的0.4 kV配电网(台区)很难满足辨识要求。

针对状态估计遇到的问题,本文利用人工神经网络对潮流方程式进行等值计算,建立并挖掘潮流约束,实现异常用电检测。首先,建立基于卷积神经网络对冲反向传播(CNN-HBP)网络潮流计算模型,实现本构参数信息欠缺下具有快速适应性的潮流计算,并从潮流方程约束与实际台区台账信息角度,建立了多场景CNN-HBP 网络潮流计算精度优化模型。其次,在CNN-HBP 网络的对冲反向传播中加入改进对抗攻击算法,形成对冲对抗机制,该机制在潮流约束中回溯与量测电压潮流匹配的回溯功率,以回溯距离作为回溯功率与量测功率间的差距,量化量测功率与量测电压间的潮流匹配度。再次,针对回溯距离特有的分布特性,采用图注意力网络(GAT)作为分类器,通过对异常回溯距离逐时刻精确辨识实现对用户异常用电的检测,同时设计了一种异常累加器以降低检测误报率。最后,结合台区历史用电数据与仿真验证所提方法明显提高了异常检测的准确性,降低了误报率,并且能辨识出用户异常时间段。

1 基于CNN-HBP 网络的潮流计算

1.1 神经网络潮流计算可行性分析

潮流方程式中以节点连接关系和线路导纳参数等构成潮流约束,共同描述和约束节点电压与功率间变化关系,从而实现潮流计算。目前,由于台区本构参数不精确,难以构建物理潮流模型利用潮流约束进行异常用电检测。神经网络因其强大的拟合能力,可代替物理潮流方程式建立神经网络潮流模型,挖掘潮流约束,这使得进行异常用电检测成为可能。

文献[17]建立了配电网线性物理潮流方程模型,光伏节点可看作是有双向计量的PQ节点。对于包含m个PQ节点正常运行的低压台区,其潮流方程如式(1)所示。

式中:下标N和S分别表示PQ节点和平衡节点;G和B分别为支路电导和电纳矩阵;X为潮流计算待求矩阵,由PQ节点的电压与相角组成;PN、QN∈Rm×1为节点注入功率;VS为平衡节点电压幅值;W为功率信息矩阵;J∈R2m×2m包含了网络接连与导纳信息;δN、VN∈Rm×1分别为PQ节点相角和电压矩阵。

当节点的PN、QN可观时,通过映射矩阵J存在唯一对应的X。因此,可通过神经网络从用户历史量测电压、功率中提取出潮流约束用以等效映射矩阵J,实现神经网络潮流计算。本文着重以数量众多的0.4 kV 台区用户作为潮流计算、异常用电检测的研究对象。

1.2 多场景潮流拟合输入选择

在神经网络拟合过程中,输入网络的台区本构信息越完整,潮流拟合速度越快、精度越高。然而不同台区本构特征存在差异,需建立差异化的训练方案以最大化提升潮流精度。

1)场景1:台区拓扑与线路参数明确

假设J中包含了台区真实的线路参数信息,而导纳信息矩阵J*中包含了拓扑与台账所记录的线路参数,如此存在一个信息矩阵M使存在如下关系:

2)场景2:台区拓扑明确,线路参数不完整

在台区只有拓扑明确时,可以建立PQ节点间的无向邻接矩阵A。为了避免A的奇异性,构建非奇异矩阵T∈R2m×2m:

式中:U和L分别为A的上三角、下三角矩阵。T下半部分L与U分别包含了上游节点有功功率的流向与下游节点无功功率的流向。

在台区台账中,配电变压器进线的线路参数(平衡节点到相邻PQ节点)是普遍已知的,则线性潮流如式(6)和式(7)所示。

式中:W2∈R2m×1为拓扑信息矩阵;MT为T的非奇异信息矩阵。由于T只包含一半的拓扑信息及少量线路参数信息,使得J与MT间含有更大信息差。各矩阵非奇异性证明见附录A。

3)场景3:台区本构参数未知

当低压配电网的本构参数未知时,可用W*∈R2m×1作为输入或忽略平衡节点至相邻PQ节点的线路导纳而采用W3=[PN,QN]T∈R2m×1,潮流精度相对较差,实际中此类台区较少。大量一般低压台区符合场景1、2。

1.3 潮流计算神经网络选择

若台区拓扑发等参数发生变化,则在物理潮流模型中用以描述和限制节点功率和电压变化关系的映射矩阵J随之改变。神经网络需在变动后的拓扑中利用采集到的量测电压和功率继续训练,才能等效新的映射矩阵J,实现在新拓扑中的潮流计算。但新拓扑下的训练集需要由智能电表量测的数据累积产生,较复杂神经网络利用小规模训练集继续训练效果并不理想,这导致神经网络在较长时间内都无法进行潮流计算。针对该问题,本文选择对冲反向传播网络进行潮流拟合,对冲反向传播机制通过不 断 更 新 网 络 层 权 重α(0),α(1),…,α(L)(L为 网 络 层数),使得网络随输入数据复杂度的提升自适应激活深层网络,模型复杂度随之快速提升,维持模型较优的泛化能力[18]。此外,网络主体采用卷积层,选择较大卷积核,放弃池化层[19],组合成兼顾自适应性和拟合精度的CNN-HBP 网络,神经网络结构见附录B。

2 基于对冲对抗机制的潮流功率回溯

2.1 异常用电特征与潮流约束关系分析

异常用电大多围绕智能电表计量原理,衍生出了多种异常用电的方法[20],异样用电特征可归纳为以下2 个方面:1)当用户出现欠压法或移相法时,量测到的电压Vmea偏离电压真实值Vreal,Vmea<Vreal;2)当用户出现欠流法或移相法时,量测到的功率Pmea偏 离 功 率 真 实 值Preal,Pmea<Preal。

当用户出现异常用电时,由于量测功率或电压与真实值不再相等,使得量测功率在潮流计算中得到的计算电压将与量测电压相互偏离,这是基于潮流约束进行异常用电检测的机理。

然而,当用户以异常量测功率作为CNN-HBP网络的输入时,会造成相邻多个用户计算电压与量测电压间相互偏离的情况,导致无法锁定异常用电用户。通过在输出侧比较计算电压与量测电压间差异性的异常检测方法在此类情况下失效。

对此,提出一种具有普适性的改进对抗攻击算法,在不改变CNN-HBP 网络内部参数的情况下,反向回溯与量测电压潮流约束相匹配的回溯功率,通过在输入侧比较量测功率与回溯功率是否相等,间接判断Vmea与Pmea间潮流约束是否匹配。

2.2 对冲对抗机制构建与功率回溯

目标快速梯度符号法(targeted fast gradient step method,Targeted FGSM)为一种基于梯度的对抗攻击方法,在不改变神经网参数的情况下,通过若干次对输入量的小扰动影响判别器分类结果。为了适应CNN-HBP 拟合过程,构建改进对抗攻击算法。

式中:xn为网络中第n次更新后的输入;η为学习率,用 于 代 替Targeted FGSM 扰 动 量;L(θ,xn,Vpre,n,Vmea)为 损 失 函 数;Vpre,n为CNN-HBP 第n次 电 压 计算值;θ为原神经网络参数。

为避免出现梯度消失的现象,结合CNN-HBP网络的权重α,构建对冲对抗机制如下:

式(10)各层损失函数增大是由异常用户引起,因此其梯度下降最快的方向就是异常用户节点对应功率,这使得异常用户功率在初步迭代时修改最为显著。台区潮流约束随着异常用户功率的修改快速恢复正常,在恢复的过程中减弱了对相邻正常用户引起的电压偏移程度,使得相邻正常用户功率在后续迭代过程中基本不发生变化。由此,可将多个不确定用户计算电压与量测电压间的差异,转变为只有异常用户的回溯功率与量测功率间的异常。

2.3 功率回溯边界条件

由于CNN-HBP 网络潮流映射没有考虑相角,式(9)的回溯功率并不唯一,正常用户的功率亦会有不同程度的修改。为了扩大异常用电用户功率修改前后的差异性,由潮流约束自然地引入以下边界条件。

1)CNN-HBP 网络预测电压总是大于或等于量测电压,故需增大用户侧功率以满足该过程,即回溯后的有功功率总是大于等于用户智能电表量测有功功率。

2)通过限制无功功率变化,可扩大异常用电行为用户的有功功率在回溯前后的差异性,具体如下:

式中:Pmea和Qmea分别为智能电表量测有功和无功功率矩阵;Patt和Qatt分别为回溯后的有功和无功功率矩阵;v为一个较小松弛量,用于扩大异常用电行为用户有功功率回溯前后的差异。

在边界条件下,对冲对抗机制的功率回溯流程如图1 所示。图中,δ为阈值,N+为PQ节点集合,|Vpre,n,i-Vmea,i|表 示 在 第n次 迭 代 时 第i个PQ节 点 的计算电压与量测电压差的绝对值。

图1 对冲对抗机制功率回溯流程图Fig.1 Flow chart of power backtracking in hedge-antagonism mechanism

3 基于回溯距离的异常用电行为检测

3.1 回溯距离定义及分布特性分析

为比较回溯功率与量测功率间的差异实现异常用电行为检测,定义回溯距离如下:

图2 为某台区历史正常数据的回溯距离热力图,每一行代表1 个用户回溯距离统计情况,黄色部分越亮表明回溯距离在该段分布越密集,可得出以下结论:1)受量测误差影响,回溯距离并非完全为0;2)各时刻回溯距离较小,总体呈正态分布;3)电气距离靠近的用户,即图中红色框,其回溯距离分布类似。若某时刻用户回溯距离不满足以上特性,则可能存在异常用电行为。

图2 用户正常回溯距离分布热力图Fig.2 Thermal map of user’s normal backtracking distance distribution

3.2 异常回溯距离判断

3.2.1 基于GAT 的异常回溯距离判断

由3.1 节可知正常的回溯距离具有邻近拓扑特性,GAT 将每个节点的特征量通过图注意力层转化为节点之间的注意力系数,进而得到新的特征量,使得能够关注邻近节点的变化[21]。因此,GAT 能学习到各用户节点回溯距离大小以及邻近节点之间回溯距离的分布变化关系,提升异常回溯距离辨识准确性。同时,GAT 具有拓扑外推能力,若台区的拓扑因为整改等原因发生变动,只要在原邻接矩阵A训练完成的GAT 中输入拓扑变动后的邻接矩阵B即可自适应进行异常判别[22]。

3.2.2 GAT 负样本生成

GAT 以回溯距离为输入,输出1 和0 分别表示异常和无异常。负面样本的生成采用以下方案:1)计算台区所有用户在较长时段标签为0 的回溯距离;2)以单个用户作为分析对象,确定分布的上界,认为超出上界的误差为粗大误差,进而确定不同用户的误差上界;3)在原有的标签为0 的回溯距离训练样本中,随机选择各个时刻一定数量用户节点,修改回溯距离为λ,使得0 <-3σ<b,b为阈值,σ为回溯距离标准差,并将标签修改为1。

3.2.3 异常累加器设计与GAT 样本强化

GAT 对于用户用电行为是逐量测点进行检测,对此为每个用户设置1 个初值为0 的累加器Chx,当发现异常点时累加1,上界为2,当无异常点时减1,下界为0。异常累加器记录了用户用电行为异常的可能性,当其持续为2 时即判定用户用电行为异常;当台区未出现异常而异常累加器在0、1、2 间波动时,表明GAT 未训练充分,此时减小阈值b重新生成负样本直到GAT 满足判别要求。

综上,异常用电行为检测框图如图3 所示。

图3 异常用电行为检测框图Fig.3 Block diagram of abnormal electricity consumption behavior detection

3.3 异常用电辨识评价标准

采 用 检 出 率kTPR、误 报 率kFPR[23]、F1-score 和 受试者工作特征曲线下面积(area under receiver operating characteristic curve,AUC)综合评价用户异常用电行为检测效果:

式中:PTP为异常被检测为异常用户数;PFN为异常被检测为正常用户数;PFP为正常被检测为异常用户数;PTN为正常被检测为正常用户数;Fscore为F1-score 值;FAUC表示AUC 值;ri为样本经分类器分类且按概率排序后正常用户所在序号;d、e分别为正常、异常用户数。

4 算例分析

4.1 多场景潮流计算结果对比

为验证1.3 节所提不同场景输入下的潮流计算效果,在异常台区集合中选取近10 年建设的台账明确的中国浙江某居民台区。智能电表采集频率为15 min/次,采集2021 年5 月2 880 组电压、功率有效值按4∶1 进行训练与测试。其中,单相用户119 个,三相用户1 个,在CNN-HBP 网络中采用Adam 优化,batch size 为16,共800 轮,进行12 800 次迭代,网络结构、参数、训练过程中卷积核的选择以及测试集效果见附录C 表C1、表C2 和图C1。

选 择2021 年6 月1 日 至6 月10 日960 组 数 据 作为验证集,场景1 电压拟合相对误差分布最小且最稳定,为0.07%~0.29%,场景3 电压拟合相对误差分布在0.21%~0.79%。在融入台账信息后,神经网络潮流计算的精度有进一步提升。3 种场景下每日所有用户CNN-HBP 电压拟合与实际电压的相对误差最值与均值详见附录C 图C2。

4.2 CNN-HBP 网络自适应性检验

随着输入数据复杂度上升,通过调节权重α使CNN-HBP 网络具有快速适应能力。本文将场景2与文献[17]电压拟合卷积神经网络(VolCNN)进行比较,分析网络的自适应性。

在异常台区集合中选择台账明确的22 号农村居民类台区,共39 个用户,拓扑见附录D 图D1。设CNN-HBP 网络与VolCNN 在拓扑变化前时段Ta已得到充分训练,即二者已学习了某种映射关系,该台区开展过电压治理,由于b 号干线重负荷,故将3、4、8、9 号用户移至a 号干线。

采集拓扑变化的各用户的量测电压与量测功率。将拓扑变化后Tb时段内的电压、功率输入这2 个神经网络中继续训练。设Tb时段分别以300、400、500、600、700、800、900 个量测点的数据作为训练集,以Tb后第900~1 000 个量测点的数据作为验证集,图4(a)为CNN-HBP 网络与VolCNN 在验证集中电压拟合误差均值以及训练时间与训练数据量的关系。从图中可以看出,CNN-HBP 网络在300 个量测点数据(约3 d 的数据量)下快速收敛,与实际电压量测值的相对误差均值降到0.156%,用时422 s完成训练;VolCNN 则需要约800 个量测点数据才收敛且用时1 810 s,这验证了CNN-HBP 网络在拓扑变化时具有快速的适应能力。图4(b)为CNNHBP 网络训练时权重α随迭代次数的变化关系。从图中可以看出,随着拓扑变动后新数据的输入,CNN-HBP 网络的各项权重都在自我调节变化,以适应新的拓扑。

图4 CNN-HBP 网络的自适应性检验Fig.4 Adaptability test of CNN-HBP network

4.3 异常用电检测能力评估

4.3.1 各分类器异常用电检测能力评估

为了评估以含异常累加器的GAT 作分类器的异常用电检测能力,选取中国浙江某区域内60 个有异常用电记录的台区作为检测目标,具体类型及规模见附录E 表E1 和表E2。计算各用户的回溯距离,分别以极限学习机、支持向量机、GAT、有异常累加器的GAT 几种分类器对回溯距离进行分类,结果如表1 所示。

表1 不同分类器中异常用电检测结果Table 1 Detection results of abnormal electricity consumption in different classifiers

场景2 带有异常累加器的GAT 的kTPR都在0.95以上,异常检测结果较优,同时kFPR几乎为0,即接近零误报,FAUC在0.9 以上说明分类器有较为优秀的分类能力。以28 号台区为例开展具体检测效果分析,该台区部分用户一段时间内的回溯距离热力图见附录F 图F1,其中,20、25 号用户属异常用户,其回溯距离间歇性较其他用户更强,34、48 号虽然是正常用户,但相较于其他正常用户的回溯距离略强不易辨识。本文方法清晰地检测出了20、25 号用户,而极限学习机只检测到20 号用户异常并且误将34、48号用户检测为异常,详细辨识结果见附录F 图F2。在实际中,误报将使异常用电稽查失去靶向性[1],对于数据驱动的异常用电检测方法,降低其异常用电的误报率要比降低漏报率更为重要。

对冲对抗机制逐时间点提取回溯距离,通过GAT 可以判断出一天中用户异常用电时间范围。图5 为1 号台区的某网损异常日的回溯距离,该台区共有120 个用户,可观察到大致在01:00—04:00 期间,23 号用户回溯距离异常,发生了异常用电的行为,经营销系统核实23 号用户在整改前的确出现过凌晨期间异常用电的情况。

图5 1 号台区异常网损日的回溯距离Fig.5 Backtracking distance of No.1 power distribution area on day with abnormal network loss

此外,其他各类典型异常用电台区的异常检测结果分析与回溯距离见附录G。分析发现,这些未能检测出的用户都在以年为单位的用电过程中累积造成电力公司经济损失,但在各个量测时刻用电并无明显异常。

4.3.2 基于对冲对抗机制与GAT 的异常用电检测能力评估

表2 给出了本文所提的基于对冲对抗机制与GAT 的异常用电检测方法、传统基于分类的检测方法对于60 个台区的异常用电检测结果。传统方法以台区用户异常用电时段对应负荷曲线作为训练集,并且以各用户3 个月的功率曲线作为验证集,负荷采集频率为15 min/次。相比于利用日用电量等负荷时间序列的传统辨识方法,本文所提异常用电检测的kTPR接近1,有很好的辨识效果,且kFPR十分接近0,防误报性能良好。相应的Fscore和FAUC都接近1,表明综合异常检测结果较优。

表2 60 个台区用户异常用电检测效果Table 2 Detection effect of abnormal electricity consumption of 60 power distribution areas

以43 号台区15 号用户为例进行分析,其在智能电表前私拉电线分时段接入部分负荷,由于接入负荷比例较小,异常行为较为隐蔽,从其回溯的功率曲线与用电功率曲线也可观察到二者十分相似,这导致传统方法都未能识别出该用户,然而基于对冲对抗机制与GAT 通过回溯距离可清晰地辨识出其在300 个量测断面内出现了5 次异常用电行为。该用户负荷曲线与回溯距离见附录H 图H1。

4.3.3 GAT 外推能力评估

由于22 号台区拓扑变动前后4 号用户都存在异常用电史,因此22 号台区作为GAT 外推能力评估。拓扑变动前后共39 个用户,检测结果大于0.5视为存在异常用电行为,拓扑变动前后4 号用户异常概率分别为0.90 和0.73,都检测为异常,而其他用户判断为正常。详细辨识结果见附录I 图I1。

4.4 多目标异常用电检测能力评估

为了检验基于对冲对抗机制的异常用电检测方法对于同时段多用户异常用电的检测能力,分别在用户数为25、50、75、100、125 及150 的台区中替换一定类型、数量的异常用户进行异常辨识。检测结果见附录J 图J1。由图J1 可知,存在4 个异常用户时,在6 种规模的台区中的kTPR值可保持为1,异常检出能力较为优秀;当异常用电用户数为5 时,在小用户数台区中表现良好,但在大用户数台区中kTPR值迅速降低,检出效果显著下降;当异常用电数为6~7 时,检出效果较差,但趋于稳定,受台区用户数影响较小。

kFPR值代表异常用电的误检情况,kFPR值越大表明误检情况越严重。异常用户数量为4~5 时,在小于等于100 个用户数的台区基本可以做到正常用户的零误检;当异常用户数为6 时,kFPR值处在较低位且缓慢上升,表明在各类用户数台区中误检增多,但随着台区用户数上升增加不明显,并且不同异常用电类型混合的误检差异不明显;当异常用户数为7 时,误检较为严重,且随着台区中用户数的增多,误检量迅速上升。

5 结语

本文所提方法不完全依赖本构参数,实现基于潮流约束的异常用电检测,异常检测能力明显提高,CNN-HBP 网络能在多种本构参数场景下实现较高精度的潮流计算,GAT 机制能更准确地对有拓扑特征的回溯距离进行分类。

本文方法从潮流约束角度进行异常检测,适用于绝大多数的异常用电行为,然而对于少数直接篡改智能电表电量记录的手段还不适用,且不能检测出具体异常用电的类型,有待通过研究用户用电特性等进一步改进。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢

台区潮流用电
低压台区三相不平衡治理的换相优化方法
计及分布式光伏的农村配电台区断零故障分析
基于k-medoids聚类算法的低压台区线损异常识别方法
对输配电及用电工程的自动化运行的几点思考
用电安全要注意
多业务协同提升低压台区线损基础管理研究分析
潮流
潮流
潮流
从2014到2015潮流就是“贪新厌旧”