APP下载

四阶段端到端的用户异常用电模式检测网络

2023-01-05万磊江锐黄文杰卢涛刘威

关键词:用电检出率样本

万磊,江锐,黄文杰,卢涛,刘威*

(1国网湖北省电力有限公司,武汉 430077;2武汉工程大学 计算机科学与工程学院,武汉 430200;3湖北华中电力科技开发有限责任公司,武汉 430077)

在电力系统中,输配电损失中的非技术性损失,一直是各国电网企业期望解决的问题.它指的是用户异常用电行为所造成的经济损失,比如用户窃电行为等,严重影响地区电网的正常调度.据不完全统计,在其他一些发展中国家,非技术性损失的增长率(11%)远远高于其国家的GDP增速(4%~5%)[1].尤其在巴西、印度和墨西哥,其全国的用电总量中,非技术性损失所占的比列分别达到了惊人的16.85%、26.2%和15.83%[2].虽然,非技术性损失在我国的电网输配送中占有的比列相对较低,但是由于我国对电量的需求总体庞大,并随着经济的不断发展、人们生活水平的不断提高,导致用电量不断攀升,随之带来的损失也相当可观.据报道,仅中国福建这一个省,每年因窃电所造成的经济损失高达1亿元人民币[1].因此,对用户异常用电行为模式的检测研究显得尤其重要,它是降低非技术性损失、提高经济效益的重要手段之一.

近年来,国内外学者针对用户异常用电行为模式的检测进行了深入的研究,并取得了很多优秀的成果.尤其随着神经网络的不断发展,越来越多的学者采用网络来提取异常用电特征,相较于传统的手工提取特征的局限性,该类方法具有更为强大的特征提取能力,且在特征的表征上也更为全面,使得方法具有较好的泛化性.文献[3]提出了一种基于深度学习的用户异常用电模式检测方法,该方法以Tensorflow框架为基础,采用长短记忆网络(LSTM)来提取网络特征,并利用全连接网络(FCN)输出最终的异常用电数据检测结果.实验结果表明,与非深度学习的检测模型相比较,该方法能够更好的完成对用户异常行为的检测.文献[4]提出了一种基于小波和长短记忆混合网络的电力用户异常用电模式检测模型,该模型同样采用LSTM来获取网络特征,并利用小波神经网络来实现序列特征到用电模式的映射,能有效提高模型对用户用电异常行为的检测率.

然而,上述方法基于有监督训练,需要大量的有标签数据,但是现实生活中很难获取这些数据.因此,为解决此问题,文献[5]提出了一种基于无监督学习的电力用户异常用电模式检测方法,该方法适用于电力用户数据缺乏训练样本的情况,且采用主成分分析来实现对用电特征的降维,解决了网络中由于信息的重叠所造成的特征提取效率低下的问题,同时大大提高了模型对异常用电的检测准确率.由此可见,主成分分析(PCA)方法对于有效特征的提取有着明显的优势.基于PCA的主成分分析网络[6](PCANet)已经发展成熟,同时它也是一种非监督式的特征提取方法,其主要应用在许多图像分类任务中,并取得了很好的分类效果,针对一维信号的特征提取,该方法还鲜有涉足.文献[7]提出了一种基于PCANet和SVM的谎言测试方法,该方法不仅能有效提取一维的脑电信号特征,并且大大提高了模型的训练和测试准确率.

综上所述,针对一维的用户用电量信号,为了更好的从中提取有效数据特征,提高模型的检测准确率,本文提出一种新颖的端到端的用户异常用电模式检测网络模型.该模型为四阶段特征映射网络模型:前三个特征映射网络为特征提取模型,利用改进的PCANet网络结构完成从用户用电数据中提取有效序列特征;第四阶段特征映射网络为异常用电检测模型,通过小波神经网络(Wavelet Neural Network,WNN)完成从序列特征到用户用电行为模式的空间映射,实现对异常用电的检测.

1 用户异常用电检测模型

1.1 模型总体架构

在用户异常用电检测方法中,通常采用手工特征来分析用电异常行为,具有一定的主观性和不确定性,同时造成方法具有一定的局限性,使得方法的泛化性较差.因此,为提高用户异常用电检测模型的鲁棒性和泛化性,本文提出一种四阶段端到端的用户异常用电检测网络模型,如图1所示,该模型将用户的用电量数据与用户用电行为模式联系起来,从而检测出异常用电数据.

图1 基于四阶段PCANet的异常用电检测模型Fig.1 Abnormal power consumption detection model based on Four-stage PCANet

1.2 用电特征提取网络

本文采用三阶段的PCANet特征映射结构作为用电特征提取模型,不同的是,为了进一步提高模型的检测精度,本文将第一阶段PCA的输入特征通过下采样的方式嵌入到第二阶段PCA中(如图2所示),从而参与第三阶段的滤波特征提取,并最终获取用电特征.因此,给定N个m×n的输入训练样本这里的m为采集用户用电量的时间序列数,n为采集的用户用电量的离散点数),改进的PCANet对特征提取的过程主要分为以下三个步骤[6].

图2 改进的基于PCANet的用电特征提取网络Fig.2 Improved PCANet-based electrical feature extraction network

(1)第一阶段PCA映射.

此阶段是对网络输入层和中间层的处理.对于每一个样本Si,采用大小为w1×w2的滑动窗口来获取样本片段:xi,1,xi,1,...,xi,mn∈R k1k2,这里xi,j表示第j个矢量化窗口中Si的第i个样本向量.同时为了更好的利用底层信息、防止信息丢失,对每一个样本Si都用a1×a2的滤波窗口进行下采样得到Di:

其中ψ表示相同的卷积层,并将其嵌入到第二阶段PCA(如图2所示).这样做的原因是因为通过窗口卷积在获取特征时,由于填充(padding)操作效应,导致输出的特征容易丢失一些边缘细节信息,因此将一阶段原始输入信息下采样嵌入到二阶段的输出中,能够有效弥补细节的损失,从而提高PCANet的检测精度.将所有窗口中的样本向量进行去均值处理后得到:

因此,对于所有数据样本,构造上述相同的矩阵,并将其合并在一起得到:

对于第i层的Li个滤波器,PCA需要在这些正交滤波器中最小化重构误差:

式(3)中,SL1为L1×L1的单位矩阵.对于上式的解,即为UUT的L1个主特征向量.为此,PCA滤波器被表达为:

式(4)中,matk1,k2(·)表示投影函数,在这里将样本向量投影到矩阵W;pl(UUT)代表UUT的第l个主特征向量.

(2)第二阶段PCA映射.

第二阶段的PCA网络结构和处理过程与第一阶段相同,不同的是第二阶段的输入为第一阶段的输出.这里定义第一阶段的PCA输出为:

类似于第一阶段,整合所有滤波器去均值化后的输出矩阵,将其定义为:

式(7)中,L2表示第二阶段中PCA的滤波器数量,最终第二阶段输出L1L2个特征向量.针对第一阶段PCA映射过程中所获取的下采样特征Di,将其嵌入到上述特征向量中来获取第二阶段PCA最终的输出特征向量,其表达式为:

(3)第三阶段输出映射.

为了增强网络的鲁棒性,采用赫维赛德阶跃函数来处理特征向量,将其二值化:

式(9)中,H(·)代表赫维赛德阶跃函数,其中每一个特征向量被约束在[0,2L2-1]的范围内.最终,对于每一个数据样本Si,将其对应的输出分为B个块单元,并对每一个块单元进行直方图统计计算,并将所有的直方图整合为一个向量,得到最终的特征输出结果[8-11]:

这里,Bhist(·)代表对每一个块单元进行直方图统计计算,fi代表通过PCANet对样本Si所提取的最终特征向量,即用户用电序列有效特征.

1.3 用户异常用电映射网络

在系统工况故障检测[12]、配电网架空线路断线故障检测[13]等数列数据分析领域,小波神经网络被广泛应用.特别在输配电系统中,文献[4]将其成功应用于电力用户的异常用电模式检测中.因此,基于前期PCANet对样本数据所提取的有效特征,本文同样选取小波神经网络作为系列特征到用户用电异常行为检测的关联映射.如图1所示,在小波神经网络中,输入信号序列为σi(i=1,2,...,n)(即PCANet输出的用户用电序列有效特征),因此,隐藏层的输出计算公式为:

其中l(j)代表第j个隐藏层节点的输出值,wj代表小波函数,ωij代表输入层在隐藏层中所对应的权重,aj和bj分别代表小波函数wj的平移因子和尺度因子.为了平滑连续的小波震荡同时获得时间序列的幅值和相位信息,本文选取Morlet小波[10-11]作为母波,其公式为:

Morlet小波是非正交的并且具有指数复小波,复小波由高斯函数调整.因此,输出层的计算公式为:

其中ωij代表隐藏层到输出层的权重,l(i)代表第i个隐藏层的输出值,i和m分别表示隐藏层和输出层的节点数.同时采用梯度正交的方法对小波函数的参数和网络权值进行校正,使预测输出接近真实输出.WNN训练阶段涉及以下步骤:

(1)初始化平移因子bj和比例因子aj,随机初始化连接权重wij和wjk.

(2)将信号序列作为σi输入小波神经网络,进行预测并算出误差e.

(3)根据误差e更新网络的权值和小波函数的参数,使网络预测值更加接近实际值.

(4)重复第二步和第三步直至网络收敛.

综上,本文所提的异常用电检测算法如下所示.

算法1 用户异常用电检测算法输入:用户天用电量样本si=[s1,s2…sn]输出:异常样本数据η(k)步骤1 对于每一个样本si,用w1×w2的滑动窗口来获取样本片[xi,1,xi,2…xi,mn],然后利用a1×a2的滤波窗口进行下采样得到Di并根据以下公式计算出一阶段PCA映射结果Sl i和Di:■■■■■■ ■■■W1 l =matk1 k2( )pl( )UUT Sl i=Si*W1 l,i=1,2,…,N Di=ψa1a2(Si)步骤2 将步骤1所得到的输出Sl i作为输入,重复步骤1,根据以下公式得到第二阶段输出L1 L2个特征向量:ol i=[{Sl i*W2 l}L2 l=1,Di]步骤3 用赫维赛德阶跃函数H(λ)将得到的特征向量约束在[0,2L2-1]的范围内,并计算得到第三阶段输出σi:■■■■■■ ■■■ςl i=∑L2 2l-1 H( )[Sl i*W2 l,Di]σi=[Bhist( )ς1 i ,Bhist()ς2 i,…,Bhist(ςL1 i)]T步骤4计算异常样本数据η(k):■■■■ ■■■■■ ■■ ■ ■■■■ ■■l()j=wj■ ■■ ■■■■■■■ ■■■ ■■ ■■■■■■■ ■■∑i=1 k ωijσi-bj aj η()k =∑i=1 l ωikl(i)

2 实验结果与分析

2.1 数据集及其预处理

本文采用国家电网公司发布的一个真实用电数据集[15],该数据集包含1035天内42372个电力客户的电力消费数据,用电时间从2014年1月到2016年10月,因此,该数据集总的维度尺寸为42372*33.而在实际的训练过程中,本文将该数据集划分成847份,每50个电表用户(时间范围从2014年1月到2016年10月)为一个二维训练样本,即每个样本的维度尺寸为50*33.但是,该数据集中包含一些错误的数据和缺失的值,而神经网络对这些奇异值很敏感.因此,为了提高网络训练的稳定性,提高网络的检测精度,需要对原始数据进行预处理.本文首先采用插值法[15]对数据中的缺失值进行处理:

式(13)中,xi代表某一时间范围内用户的用电量,NaN指的是xi的值为空值或为非数字值.解决了缺失值后,接下来,本文对该数据集进行归一化操作:

这里,X为整体样本数据集,min(X)为数据集中的最小值,max(X)为数据集中的最大值.另外,在本文中,70%的样本数据集用于网络训练,另外30%的数据用于网络测试.

2.2 评价指标

本文采用三种客观评价指标来对比分析本文方法与其它检测方法.这些检测方法分别是:LSTM+WNN[4],WDNN[15],PCANet+SVM[6],SVM[16];选取误检率γFPR、检出率γDR和贝叶斯检出率γBDR三种客观评价指标[3],来对比分析本文方法与其它方法.其中,客观评价指标的计算公式如下:

式(15)中,NFP表示网络预测类别为真且真实类别为假的样本个数,NTN表示网络预测类别和真实类别都为假的样本个数,NTP代表预测类别和真实类别都为真的样本个数,NFN代表预测类别为假且真实类别为真的样本个数;λ表示的是用户用电行为异常所发生的概率.检出率与贝叶斯检出率越高、误检率越低,代表模型的检测精度越高,更适合应用于对电力用户异常用电模式的检测.

2.3 实验结果对比分析

本文采用MATLAB作为实验平台,在进行最终的不同检测方法的对比实验之前,非常有必要先分来析本文所提模型的参数对检测精度的影响.与PCANet[6]一样,本文所提模型中一阶段PCA映射与二阶段PCA映射中的滤波器数相同,即L1=L2;且两阶段计算过程中的分片大小也相同,即K1=K2.另外,为了提高检测精确度,通常以增加WNN的隐藏层数来训练网络.然而,层数过少会导致网络对数据的抽象提取能力不足,过多容易造成网络的过拟合.因此,为了保证本文所提模型的检测精度,设置合理的隐藏层数是至关重要的.如表1所示,分别取WNN的隐藏层数为1,2,3,4在相同的数据集上实验,且每层的隐藏节点数都一样,本文选取50.

表1 模型参数分析Tab.1 Model parameter analysis

表1中,WNN-1,WNN-2,WNN-3和WNN-4分别表示WNN的隐藏层网络数为1,2,3和4.从表1中可以看到,当PCANet的滤波器和分片大小一定时,模型的检出率随着WNN隐藏层数的增加而增大.但是观察WNN-3和WNN-4的结果发现,从WNN-3到WNN-4的检出增长率缓慢.另外,从上表中可以观察到,当WNN的隐藏层数一定时,随着PCANet的滤波器和分片大小增大时,模型的检出率大体上呈递减的趋势,而当L1=L2=8,K1=K2=6时,模型的检出率最大.因此,综上分析,本文选取WNN的网络隐藏层数为3,PCANet各阶段的滤波器和分片大小分别为8和6.

为进一步验证本文所提方法的有效性,将本文方法与其他方法进行对比,如表2所示.从表2可以看出,本文在检出率和贝叶斯检出率上都要高于其它的方法,且误检率都要低于其它的方法.特别与PCANet+SVM的方法相比较,无论在检出率上,还是在贝叶斯检出率上,本文方法具有明显的优势,且具有更低的误检率.究其原因是因为,小波神经网络相较于SVM具有更好的特征表达能力,更适合用于对数据序列特征的提取与分类.因此,相较于其他检测方法,本文所提方法更适用于对用户异常用电模式的检测,且网络具有更高的鲁棒性和检测精度.

表2 不同异常用电检测方法的对比结果Tab.2 Comparison resultsof different abnormal electricity usage detection methods

3 结束语

为了提高神经网络在用户异常用电模式检测中的鲁棒性和泛化性,本文在实际用户用电量数据的基础上,提出了一种四阶段端到端的用户异常用电检测网络模型,该模型采用改进的PCANet来检测用电异常特征,其中包括前三阶段的用电特征提取网络和第四阶段的用户异常用电映射网络.另外,采用三种客观评价指标对比分析了本文方法与其它异常用电检测方法.实验结果表明,与其他方法相比,本文方法具有更好的检测效果,更适合应用于电力大数据中对用户异常用电行为的检测.在后续的工作中,将进一步改进模型的网络架构,并且将无监督学习引入到该模型中,从而提高异常用电的检测准确率和检测效率.

猜你喜欢

用电检出率样本
QCT与DXA对绝经后妇女骨质疏松症检出率的对比
安宁市老年人高血压检出率及其影响因素
长程动态心电图对心律失常的检出率分析
用样本估计总体复习点拨
安全用电知识多
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计