基于用电信息采集系统的多时间尺度用电异常分析方法
2021-07-07国网上海市电力公司市北供电公司施昱青陈佳瑜
国网上海市电力公司市北供电公司 施昱青 夏 澍 董 帅 陈佳瑜
台区线损率为台区总供电量与台区总售电量的差值除以台区总供电量,它是供电公司一项非常重要的考核指标,直接影响着公司的经济效益。目前大多数供电公司要求台区线损率在10%以内。然而受人员、设备、窃电等因素的影响,用电情况会出现异常,从而使得台区线损率较高,需进行排查和消缺。以往大多通过现场巡检或基于用户每月电量、月度线损情况,凭经验来确定电能计量异常用户,这些传统的方法时效性差、准确率低。因此如何有效处理用电异常问题引起了现场运维人员的广泛关注。
用电信息采集系统能对用电信息进行实时监控、分析和处理。随着用电采集系统的推广应用,采集覆盖范围从专变用户逐步扩大到居民用户、一般工商业用户等,每日获取的用电数据量也越来越全面。这些用电数据之间存在着关联性,潜藏着用电行为等大量有价值的信息,能为用电异常分析提供依据。目前已有学者基于用电采集系统提出了相关的分析方法。
文献[1]分析了窃电手段及原理,进而基于电压电流值的规律,结合离群点检测法确定了窃电判定算法;文献[2]提出基于格兰杰归因分析的高损台区窃电检测方法,通过分析用户用电量与台区线损时间序列间的长期趋势来辨识窃电用户;文献[3]研制了一套计量装置在线检测和智能诊断系统,能分析出用户窃电和计量装置故障等情况;文献[4]通过对营销大数据的深度挖掘和分析,开展了用电异常事件的分类统计和过程描述,并设计了用户窃电特征分析判据,为查处窃电提供技术指导。上述研究取得了一定进展,然而这些文献仅对某一种方法进行了分析,而每一种方法有各自的适用范围能处理的异常情况也有限制。因此,如何在用户电量海量数据的基础上对数据和方法进行归类和预处理,分析出各种方法的适用情况,使其能够推广应用,辅助工作人员进行电能计量异常排查还需进一步的研究。
1 多时间尺度用电异常分析方法总体框架
考虑到用电信息采集系统获取的数据量较大、包含的信息量较多,因此按照时间尺度对数据进行分类,进而有针对性地提出了相应的分析方法来识别用户异常的嫌疑用户。基于用电信息采集系统的多时间尺度用电异常分析方法具体过程如下:首先按照时间尺度,对系统采集的数据进行分类,短期数据可分为每时刻电流电压集合和每日24小时电流电压集合,中长期数据可分为月度每日用电量集合和年度每月用电量集合,针对短期数据可采用电流电压判定算法进行异常辨识,针对中长期数据可采用聚类算法和相关系数法进行异常辨识,从而从不同的时间尺度搜索到异常用电嫌疑用户。
上述方法针对不同用户,具体操作存在一定的差别。目前用来采集用电信息的装置主要有两种,一种是专变终端、另一种是集中器。其中专变终端能获取用户的电流电压和用电量等信息,对于这部分用户,可采用短期和中长期时间尺度的异常用电分析方法进行综合判断;而集中器一般没有开通获取电流电压信息的通道,只能获取用户用电量信息,对于这部分用户可采用中长期时间尺度的异常用电分析方法进行异常辨识。
2 用电异常分析方法
2.1 短期时间尺度的用电异常分析方法
电压电流判定指标。专变终端主要是对三相用户采集信息,正常情况三相用户电压会维持在额定值附近,同时电流不平衡率也较小。当出现明显的电压偏移或存在较大的不平衡电流时,表明此用户可能用电异常,需要排查。因此本文选用电压偏移系数βU和三相电流不平衡率βI作为用电异常的判断指标,具体计算公式如下,式中U为电压;Ue为额定电压;Imax和Imin分别为三相中最大和最小的相电流。
基于实时用电数据的分析方法。专变终端可以实时获取用户的电压、电流数据,进而基于这些数据,根据式(1)和式(2)计算用户A相、B相和C相的电压偏移系数βAU、βBU、βCU以及电流不平衡率βI,并做式(3)判断,式中和分别为电压偏移系数和电流不平衡率的限值,||表示并且的逻辑关系。当式(3)结果为布尔值TRUE时表示该用户存在用电异常嫌疑。
基于日用电数据的分析方法。专变终端会按照15min的时间间隔对用户的电压和电流数据进行采样,绘制日电压和电流曲线。考虑到异常用电通常会维持几个小时以上,因此从中选取各整点时刻的电压、电流数据作为分析的依据即可说明问题。每日24小时的三相最大电压偏移系数欧式距离dU和三相电流不平衡率欧式距离dI计算公式分别如下,若dU值超过其限值或dI值超过其限值,则表示该用户存在用电异常嫌疑。
2.2 中长期时间尺度的异常用电分析方法
2.2.1 聚类算法
对于相同用电类别的用户,相互之间的用电行为特征具有一定的相似性。基于这一特征,首先可通过聚类分析得到该用电类别的典型用电负荷曲线,进而将需排查的用户与典型用电负荷曲线进行比较,找出用电异常嫌疑用户。在各种聚类方法中K-means聚类算法具有收敛速度快、易于实现等优点,被广泛应用于用电负荷分析中,因此本文选用该方法[5]。基于K-means算法可得到聚类中心集合,即典型用电负荷集合Q={q1,q2,…,qK}。进而将需要排查的用电负荷数据W与Q对比,计算最小欧式距离dW,式中dist(·)为欧式距离函数。若dW值超过其限值则表示该用户存在用电异常嫌疑。
2.2.2 相关系数法
表计计量误差的计算公式为ΔWi=W′O,i-WO,i(4),式中W′O,i为用户实际用电量;WO,i为表计显示电量。对于同一种表计回路接线错误,通常用户电表显示电量和真实电量是线性关系式(5),因此式(4)可转化成式(6),从中可看出,当用户电表显示电量WO,i越大计量误差ΔWi就越大,台区线损ΔW也就越大,WO,i与台区线损之间具有明显的相关性。因此可以利用相关系数法计算台区线损和用户电表显示电量之间的相关系数,若相关性高则该用户存在异常嫌疑。在常用的相关系数中,皮尔逊相关系数[6]能有效衡量两个变量间线性相关程度,因此可选用该方法进行用电异常分析。对于台区线损ΔW和用户电量WO,i,皮尔逊相关系数计算公式如式(7),式中E(·)为期望值函数。若ri大于其阈值则表示该用户存在用电异常嫌疑。
2.3 基于月度及年度用电数据的分析方法
基于月度用电数据的分析方法计算过程如下:选取台区线损合理的用户最近一个月30天日用电量数据作为样本数据,提取待分析的台区用户最近一个月30天日用电量数据做为分析数据;针对样本数据和分析数据中缺失部分,利用三次样条插值[7]结合线性插值的方法补充缺失数据,其中满足三次样条插值条件的采用三次样条插值,不满足时采用线性插值处理;在补全所有用电量数据后,为消除不同量纲的影响,更好的体现用电变化规律,需对原始数据进行归一化处理,把数据压缩在区间[0,1]之间。具体处理公式如式(8),式中w、W′分别为用户日用电量的原始数据和变换后的数据,wmin和wmax分别为用户在一个月内的日用电量最小值和最大值;对归一化后的样本数据按照用电性质进行分类,并利用聚类分析查找出用电异常嫌疑用户;根据待分析台区的关口总表数据和用户日用电量数据计算出台区日线损量,进而利用相关系数法计算台区日线损量和用户日用电量之间的皮尔逊相关系数,查找出用电异常嫌疑用户;对上两个步骤中发现的所有用电异常嫌疑用户进行现场核查,找出用电异常用户。
基于年度用电数据的分析方法和基于月度用电数据的分析方法类似,只是将所分析的数据从一个月30日的日用电量数据变成一年12月的月用电量数据,其它计算过程相同。
3 算例分析
3.1 短期时间尺度的异常用电实例分析
以某地区线损较高的5个台区139个专变终端用户为分析对象,验证短期时间尺度的异常用电分析方法的有效性。设=0.1、=0.2,根据实时数据可判断出异常嫌疑用户(电压异常)数量为6个,经现场排查发现该6个表计全部存在异常;设=0.2,=0.4,根据日用电数据可以判断出异常用电的用户为9个,除以上的6个用户外,还有2个用户存在异常用电(电流异常)嫌疑,经现场排查确实存在计量问题。由此可见,基于电流电压判定算法的短期异常用电分析方法具有较高的准确性。
3.2 中长期时间尺度的异常用电实例分析
为验证聚类算法的有效性,首先选取台区线损合理的5789户居民用户和1951户商业用户作为样本数据进行聚类分析,得出典型负荷曲线,然后将某个包含62户居民用户和7户商业用户的台区作为分析对象,与典型负荷曲线进行对比,判断出嫌疑用户。在聚类分析中,居民用户和商业用户的聚类数分别设置为15个和10个,基于月度用电数据得到30日的典型负荷曲线如图1所示。将分析对象与典型负荷曲线进行对比,距离限值取1.1,共分析出7户居民用户有异常嫌疑,现场排查发现其中5户表计确实存在异常,准确率为71.43%,由此可见聚类算法能够有效的甄别出嫌疑用户。
图1 典型负荷曲线
为验证相关系数法的有效性,计算62户居民用户和7户商业用户与台区线损的相关系数,并选取相关系数大于0.9的作为嫌疑用户,具体计算结果如表1所示,共包含4户居民和1户商业用户,经现场排查发现,2户居民用户和1户商业用户存在用电异常,准确率为60%。对比聚类算法和相关系数法可发现:聚类算法查找到的居民用户异常数量和准确率都高于相关系数法,而相关系数法比聚类算法多查出了一户商业用户用电异常,由此可见两种算法具有不同的适用性。
表1 基于相关系数法的分析结果
基于年度数据,利用聚类分析算法查出用电异常嫌疑用户7户,查实4户,准确率为57.14%;利用相关系数法查出用电异常嫌疑用户6户,查实3户,准确率为50%。相比于月度数据,基于年度数据的用电异常排查方法准确率都要略低一点,经分析主要包括两个原因:月度数据包括30个时段,而年度数据包含12个时段,月度数据样本量大,能够更好反映用电变化的规律;月度数据采样周期短,而年度数据采样周期长,月度数据能更好反映用电变化的实时性。但由于采集通道问题,日用电量数据会存在一定程度缺失,即使利用插值方法弥补也会存在部分失真现象,而对于月用电量数据,由于有人工补抄环节所以数据较为完整,体现的信息更为真实,因此基于年度数据的用电异常排查方法也有一定的价值。
3.3 多时间尺度的异常用电实例分析
利用所提出的多时间尺度用电异常分析方法,对21个台区2079个用户进行分析,共排查用电异常嫌疑用户97户,查实用户62户,此21个台区平均月线损率下降了8.23%,由此可见所提方法能够有效的辅助监控人员及时甄别用户异常用电情况。
综上,本文按照时间尺度,将用电采集系统获取的数据梳理成了短期用电数据和中长期用电数据,进而提出了一种多时间尺度用电异常分析方法来辨识用电异常情况,通过实例分析得出以下结论:基于电流电压判定算法的短期异常用电分析方法具有较高的准确性,适用于辨识专变终端用户异常情况;聚类算法和相关系数法具有不同的适用范围,两者结合都能够有效的甄别中长期用电异常用户;基于月度数据的异常分析方法较基于年度数据的方法实时性好,但年度数据真实性好,两者都有一定的分析价值。