基于ARIMA和递归贝叶斯的窃电用户识别算法
2022-06-08胡一伟刘珊黄浩
胡一伟,刘珊,黄浩
(1.国网北京城区供电公司, 北京 100031; 2.广东电网有限责任公司珠海供电局, 广东 珠海 519000; 3.美国德州农工大学,美国 德克萨斯州 77840)
0 引 言
窃电一般通过对计量装置的改动,达到少计、不计电能的目的,其会严重危害电网运行,带来用电安全隐患[1]。目前,供电公司常见的城市低压用户窃电治理成本高、效率低,并使配电运维人员工作十分繁重。随着泛在电力物联网的建设[2],电网系统信息采集速度显著提高,可用于分析用户用电习惯的数据量成倍提升,将数据分析模型深化运用于日常窃电治理可明显提高工作效率。
由于窃电用户电量与正常用电用户间数据特性存在客观差距,应用数据模型进行窃电行为判别是近年热门的研究方向。文献[3]曾对多种窃电方式进行过深入分析,并给出了一种可行的在智能电网条件下的窃电识别架构。文献[4]通过研究窃电行为和正常用电行为之间的分类规律,运用有关数据分析方法,得到了一种基于实值深度置信网络的用户侧窃电行为检测模型。文献[5]使用人工神经网络,分析了不同窃电时长的数据规律,对比了全天窃电、四小时窃电和一小时窃电情况之间的差异。文献[6]曾将堆叠去相关自编码器与支持向量机相运用到窃电检测中。长期以来,供电公司运用多种技术与管理手段进行窃电防治,文献[7]曾对此进行过总结。由于配电网用户有用电量小、金额低,对电网整体影响小,使现有识别方法准确率不高。现阶段,低压用户对电力质量的要求不断提高,对电力企业的精细化管理提出了更高的要求,研究低压用户窃电行为自动识别算法有重要的现实意义。
本文结合配电网低压用户的用电负荷特点,利用ARIMA和递归贝叶斯算法,构建了一种针对配电网低压窃电行为的识别方法。
1 配电用电信息采集系统
当前主流的配电用户数据采集系统由高级应用层、统一集采与监控平台层、数据传输层和设备现场层组成[8],实现了数据远程读取、电表故障自动检测、台户关系自动识别等功能[9-11]。目前,电力公司常使用微功率无线通信作为用电现场本地通信信道,实现集中器与用户电能表间的通信,其具有组网灵活方便,易于维护的特点。但微功率无线通信的缺点也十分明显,其数据传输速度较慢,集中器信号覆盖范围有限,且在城市地区受建筑物遮挡等情况影响,信号衰减明显[12]。同时,无法对大量用户信息实时更新,采集数据量有限,给窃电治理带来了众多困难。
随着高速电力载波通信技术(High-speed Power Line Communication, HPLC) 成熟,其在电力通信领域的应用范围不断扩大。相比微功率无线,其具有传输速率快,终端实时在线的特点。相较传统载波通信方式,HPLC采用正交频分复用等新通信技术,对比线路典型的负荷的噪声库进行噪声滤除,有效降低了噪声干扰,数据传输速度显著提升[13]。HPLC的使用大幅度提高了配电网等级电力数据的采集量,提高了对用户用电信息进行深层次分析的可行性。
2 窃电行为判别方法
2.1 信号采集部分
低压电网中存在大量的居民用户,各用户间用电量差异大,规律性较差,日常随机活动对负荷曲线影响大[14]。为提高判别的准确性,需对数据进行选取与处理。
如表1所示,英国伦敦地区部分配网低压用户各时间段用电量数据相关系数的存在差异,用户每日20时至次日8时的用电量数据相关系数绝对值较其他时段更接近于1,其数据的相关性更高,其中20时-24时的相关系数最高,为0.412 6。故本文使用夜间用电负荷数据进行分析。
表1 低压用户各时段间电量相关系数比较
本算法以某一时间点前推一段时间的负荷变化曲线作为一个数据单元,每个数据单元称为一个时间段。如图1所示,每个数据单元间拥有相同的时长,仅结束时间点有所不同,不同数据单元间会在时间上有所重叠。
图1 时段示意图
2.2 差分整合移动平均自回归模型(ARIMA)
ARIMA是一种时间序列预测分析方法,常被运用于天气、经济预测等领域,对波动数据具有良好的预测效果[15-16]。其时域公式可表示为[17]:
Xt-α1Xt-1-...-αp′Xt-p′=εt+θ1εt+...+θqεt-q
(1)
式中Xt的值为实数时域数据;εt是平均值呈正态分布的误差项;α是自回归参数。引入滞后算子和L单位根d后,可得ARIMA模型表达式[18-19]:
(2)
式中p,d,q为正整数。此模型的预测效果对时域数据的稳定性要求较高,在数据不稳定时细节预测准确性不佳,因此,应用时常需结合其他法进行准确性提升。
2.3 递归贝叶斯算法
递归贝叶斯算法的本质是对贝叶斯定理的循环应用,已被应用于识别配电网线路切改后台户关系变化,配电用户相序识别等研究[20]。递归贝叶斯算法的公式可表示为式(8):
(3)
式中k为递归的次数;N表示被识别为疑似窃电用户的数量;P(eik|ηi)是关于预测曲线与线损增量曲线差异在第k个递归,第i个疑似窃电用户时的条件概率;P(ηi|εk-1)是其先验概率,表示第k-1次递归时第i个疑似窃电用户窃电的概率。
2.4 识别算法模型
电力公司在配电变压器低压侧出线安装有计量变压器送出电量的考核用电能表,常被称作台区表,台区表记录的电量可表示为:
Ptotal=P1+P2+P3+...+PN+Ploss
(4)
式中Ptotal为台区表计量电量;P1、P2、...、PN为用户电能表计量电量;Ploss为变压器电量损失[5]。正常运行台区电量损耗浮动范围有限,且低压用户常用的窃电方法会使其表计数据变化极小,故本算法假设相较正常运行时的电量损失增量全部为窃电所致,窃电用户电量负荷可记为ΔPloss。
如图2所示,实现窃电用户自动识别的流程为:计算当前时段内的台区线损率,判定台区线损是否合理,并将用电量小于设定值的全部用户均设为疑似窃电用户。利用ARIMA模型和疑似窃电用户的历史数据,对当前时段各疑似窃电用户负荷曲线进行预测,并将预测曲线与本时段ΔPloss曲线图像进行对比。
图2 识别算法流程
其中,第i个疑似窃电用户预测曲线与线损增量曲线的差异记为ei,又因电力系统中相关数据分布一般负荷正态分布[21],则式(3)可表示为式(5)[22]:
(5)
式中n为调整收敛速度的调整系数,n越大时,收敛的速度也将越快。本算法各疑似窃电用户的起始概率相同(1/n)。在每次递归中,窃电概率将利用本时段的曲线差异与上一时段的窃电概率进行重新计算。窃电行为主要以少计或不计电量为目的[1],因此在理想情况下,窃电用户的曲线差异将小于非窃电用户,其的窃电概率也将较大,未窃电的疑似用户表现出的概率也将较小。在经过多次递归后,窃电疑似用户的概率将趋近于1,未窃电疑似用户的概率将趋近于0,因此,文中方法可自动识别出窃电用户。
3 算例分析
文中使用IEEE13节点测试模型进行算例仿真,其模型示意图如图3所示[23]。仿真中,节点652将作为一条配电支路,为10户低压用户供电,其中3户用电量将低于阈值,作为疑似窃电用户,其中1户存在实际窃电行为。由于低压用户窃电常以电能表绕接等方式进行,窃电时电能表示数变化极小,故将三个低于阈值用户的被测时段数据设为0,其中两户为未用电,一户为窃电,其余使用真实用户用电数据。本算法将筛选出的疑似窃电用户与安装于650位置的变压器台区表数据进行分析,识别出存在窃电行为的用户。由于先前假设窃电用户表计用电量示数为0,故认为电能表节点650位置安装的台区表测得线损差值ΔPloss为当日窃电用户的真实用电量。
图3 IEEE13节点测试模型示意图
文中使用2015年英国伦敦电力用户公开数据。算例选取的时段长度为3 h,每个时段包含有6条数据,每半小时采集一次电量数据,所选第一个时间段起始于每日晚23时,最后一个时间段起始于次日早5时,每个时间段间隔半小时。
使用用户先前一周20时至次日8时时段数据进行基于ARIMA的当日用电负荷曲线预测。部分ARIMA模型预测曲线与真实用电曲线对比如图4所示。
图4 ARIMA预测负荷曲线与实际负荷曲线对比
此算例中使用的图像对比的方法是将疑似窃电用户的负荷预测结果、线损增量曲线和若干组变形增量曲线进行主成分分析。变形增量曲线可表示为:
L′=n1L(t-t0)+n2
(6)
式中L表示原差异曲线;L′表示变形差异曲线;t表示负荷测量时间;t0、n1、n2为调整系数。ei为第i个疑似窃电用户预测曲线与线损增量曲线主成分分析相关系数最大的两组结果的距离。各疑似窃电用户的起始窃电概率均为1/3,将ARIMA预测与台区线损差值ΔPloss带入递归贝叶斯算法,对每时段疑似窃电户的窃电概率进行迭代计算,可得最终识别结果。
算例中进行基于不同组别的模拟识别1 365次,识别准确性随贝叶斯递归次数增加而提升,如表2所示。完成全部7此递归后,共1 266次正确识别出窃电用户,正确率为92.75%,高于传统机器学习方法对窃电行为约85%的识别准确率[24-26]。
表2 23时至次日5时递归次数与识别正确率关系
若数据采集系统采集间隔不变,本方法的递归次数上限受时间段长度限制,时间段长度增加将减少递归次数。时间段每减少半小时,递归次数将增加一次,而得出递归上限结果的时间也将晚半小时。同时,在相同递归次数情况下,时间段长度越长,正确率将越高。
时间段长度与递归次数上限和识别准确率关系如表3所示。当进行5次递归时,3 h时间段长度的正确率明显高于0.5 h时间段长度,而0.5 h时间段长度段,相较3 h时间段长度可多进行5次递归,因而在达到递归上限时,其正确率反而高于3 h时间段。在达到递归上限时,1 h和1.5 h时间段间正确率最高,达92.89%,但各时间段间正确率差距不大。
表3 时段长度与递归次数上限和识别正确率关系
4 结束语
本文提出了一种基于ARIMA和递归贝叶斯的低压窃电自动识别算法。通过对低压用户与台区表夜间各时段电力负荷数据进行分析,通过多次递归,识别出存在窃电行为的用户。此算法识别准确率随迭代进行逐步提高,实际应用中,应根据实际数据特点进行时间段长度和迭代次数调整,以达到最好的识别效果。
在下一步工作中,将结合我国实际情况与窃电行为特点对模型准确性加以进一步验证。同时,还将引入更多用户节点,以及三相不平衡等用电情况,进行更深入测试,并在对算法优化后测试多户窃电、计量设备故障等更复杂情况。未来,还将引入天气、节假日等影响电量负荷的因素,继续优化ARIMA模型,提高识别的准确率。