基于大数据用户用电特征正态分布分析方法
2018-05-21沟华伟
沟华伟
摘 要:电力用户的用电行为会对电网产生实质性的影响,不良的用电行为对电网产生较大的负面影响。同性质用户用电趋势正态分析非常清晰的展示了同类用户的整体用电情况和一些个性特征,通过这些特征现象分析,可以发现规律和异常,实现有效管理。
关键词:用电特征分析;正态分布;同性质用户;同行业;大数据
0 引言
随着供电事业的大力发展,客户要求已由原来的“用上电”转变為“用好电”,这些使得企业从计划经济时期的“以产品为中心”转变为“以客户为中心”。在这种观念的转变下,了解现有客户、认识并满足他们的需求,对现有客户的培养和潜在客户的挖掘,是企业获得进一步成功的关键。运用用电数据来进行客户特征的分析,再密切追踪客户行为,获得客户的详细信息及潜在需求,通过对客户用电数据的深入挖掘分析实现有效管理[1]。
1正态分布原理
查正态分布表可以得到正态分布曲线与横轴围成的面积等于1,当以μ为中心加减一个平均误差σ为范围时所包含的面积为68.27%,表明落在此范围内的各个抽样指标占总体所有可能样本的68.27%。而当x以加减2σ为范围时所包括曲线的面积为95.45%,表明落在此范围内的各个抽样指标占总体所有可能样本指标的95.45%,等等[4]。
正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。在联系自然、社会和思维的实践背景下,以正态分布的本质为基础,以正态分布曲线及面积分布图为表征,进行抽象与提升,抓住其中的主要内涵[3]。正态分布曲线及面积分布图非常清晰的展示了整体和重点,用整体来看事物才能看清楚事物的本来面貌,抓住重点,才能得出事物的根本特性[3]。
2 同性质用户正态分布分析方法
同性质用户指具备一些相似的特征的用电用户,例如使用同性质用电设备,在同一个区域而具备相同的气候条件和经济环境,从而在用电特征上也具备一定的相似性。同性质用户可以从以下几个维度来划分:同行业、同容量、是否高能耗设备、同区域、同线路等。
对于企业而言,同性质用电企业使用类似的用电设备,具备相同的作息时间,同一地区的同行业企业其外部经济环境和气候环境基本相似,那么其能耗趋势也具备一定的相似性。
对于居民而言,居住在同一个区域的邻居处在相同的环境中,用电特征也具备一定的相似性,比如说天气热的时候都会开空调,那么能耗都会比未开空调时有所上升。结合家庭人口、面积、天气情况综合分析能更了解用户的用电特征和需求。
基于正态分布原理,求得所有同性质用户的指定日每个小时的电能用量的平均值和均方差得到正态分布中心和用电波动范围,将指定用户的用电情况与同性质用户平均用电水平、68%同性质用户的用电水平以及95%同性质用户的用电水平的对比分析,如图3所示。
设每个时间点t时刻的指定用户电能用量值为Et,i,同类用户的电量为Et,x,则正态分布的均值μt和均方差σt为
μt=avg(Et,x)
σt=stdev(Et,x)
其中,avg是求取样本平均值的函数,stdev是求取均方差的函数。图中存在两条曲线和两个区域面积图,红色的曲线依据每个时间点t的同性质用户的平均用电水平,即正态分布的中心μt,绘制的曲线;橙色面积区域是依据每个时间点μt 1σt绘制出68.27%同性质用户的用电范围;橙色面积区域是依据每个时间点μt 2σt绘制出95.45%同性质用户的用电范围;蓝色曲线依据指定的被比较的用户电能用量Et,i绘制的曲线。
从图2可知,该用户的用电水平与同性质用户用电趋势一致,其能耗远远高于同性质用户。对于这类用户,我们结合其企业规模可知该企业在该地区该行业中是产量较高的企业,其用电趋势符合能耗与产出一致的规律。
3 同行业同容量用电趋势分析
3.1分析方法
本文选取同区域、同行业、同变压器容量的企业用电用户作为同性质用户,因其市场环境、能耗性质和气候环境相同,而具备类似的用电曲线和用电趋势。若某用户的用电曲线经常与同性质用户用电趋势背离,在排除系统设备故障和参数设置错误后,可以从以下几个角度来分析其用电特征:
(1)指定用户的用电曲线与同性质用户不符
-该用户的作息时间与其他用户不同
-用户有窃电嫌疑,可能变更了计量设备的峰平谷费率时段的设置
(2)指定用户的用电远远高于同性质用户
-该用户年产出在同行业中较高
-该用户能源利用率不高,需提出节能建议
(3)指定用户的用电远远低于同性质用户
-该用户年产出在同行业中较低
-该用户存在窃电嫌疑,改动电表及其接线等手段使得计量数据与实际不符,或虚报报装容量、修改变压器铭牌参数等
3.2同性质用户用电特征分析
图3(1)展示的是公共照明的用电特性,从图上可以看出,该类用户用电具备以下特征:每日8点至18点处于用电低谷,用电量基本为0;18点至次日8点处于用电高峰,小时平均用电量在15kWh,总体用电量不高,用电高峰与用电低谷变化明显。
图3(2)展示的是印刷企业的用电特性,该类用户用电全天无明显的用电高峰和低谷的变化,凌晨2点至6点用电量略有增加,符合印刷企业需要夜间印刷次日新闻报刊的作业特性,且由于印刷企业存在大量的印刷机等机械设备,每小时的耗电量较高,平均在380kWh左右。
由于白天对大型货运运输车辆交通限行的影响,物流运输业夜间23点前后处于每日作业最繁忙状态,用电在这个时段达到高峰,白天的用电量明显较低,由于这些企业的电能主要是用于仓储或转运场地的照明和搬运机械操作,每日用电量不大,如图3(3)所示。
图3(4)中纺织业的每日用电趋势符合每日早上8点上班,中午用餐,下午18点下班,部分车间工作到晚上22点的作业特征;且纺织业通常使用电动制衣设备,每日用电量较高,高峰期每小时用电量约70kWh。
总之,通过同性质用户的用电特征正态分布分析,发现该类用户的规律,了解作息時间和能耗规模,若某一用户表现为不同的用电特性,则说明该用户存在用电异常,结合其他数据分析可以进一步分析异常原因。
3.3错峰用电与窃电嫌疑辅助分析
图4列出的两个用户的用电曲线都与同类用户用电趋势严重背离,其共同点都是用电曲线与平均用电曲线的波动不一致,两个用户的用电高峰都出现在每日的0点到8点之间。
分析不同之处发现,左图的用户在其用电高峰期间,其用电量远高于平均用电水平,整日电能用量符合平均水平,结合其他用电数据和计量设备分析,该用户无其他用电异常信息,属于错峰用电用户。
右图的用户在其用电高峰期间,其用电量远低于平均用电水平,整日电能用量远低于平均水平,结合其他用电数据和计量设备分析,与该用电趋势吻合,该用户每日7点43分存在计量上报的二次侧CT开路发生事件,对应的23点43分有二次侧CT开路恢复事件,此期间计量的电流值为0,该用户存在窃电嫌疑。
3.4企业生产规模与能耗水平一致性分析
图5分别是两个企业的用电情况,左图中的企业电能用量低行业平均水平,右图中的企业电能用量远高于行业平均水平。一个企业用户的用电趋势与同区域同行业的相同企业的用电水平对比,若该企业的用电水平低于行业平均用电水平,但是该企业的生产规模(可以从工商、税务部门获取企业年报)处于行业较高水平,二者背离较大时,则考虑是否存在参数设置错误、计量设备故障或窃电嫌疑了;若该企业的用电水平远高于行业平均用电水平,那么在排除系统错误后,我们考察一下该企业的生产规模是否领先于该行业,否则则说明该企业的能源成本很高,需要采取节能措施以降低能耗。
近年来,智能电能表的发窃电方式与以往的窃电方式有较大的差别,其窃电原理是在原有窃电方式的基础上,附加了许多防检验功能,具备了窃电延时、监控、自动复原等功能[5]。但是无论是何种窃电方式,最终都是使电量计量变少,从而达到窃电的目的[6]。能耗水平分析发现一些隐蔽的窃电行为手段之一,这些窃电行为不会造成电压、电流显著波动,而是通过各种技术使得电量计量变少,对比该用户与同行业同容量企业的用电趋势,若其能耗水平与平均水平存在显著背离,那么该用户则存在窃电嫌疑。
4 结论
供电企业常常用很多指标来考核各部门业务完成的情况,重点关注的指标包括客户满意度、电费回收率、线损合格率等[1]。通过对用户用电特征分析,深入了解客户,从质的源头出发,通过改善管理办法和管理手段,达到指标量的改变。用户用电特征正态分布分析方法清晰明确的展示了同类用户的一般用电规律和特定用户的用电特征,通过分析二者之间的差异,发现用电异常行为,结合人口密度、经济环境、气候环境的多维数据分析,有效帮助供电企业发现用户用电特性和处理异常,可广泛应用与用电检查、用电经济性分析、行业景气度分析等领域,减少管理成本,提高工作效率,改善企业管理。
参考文献:
[1] 王克宜,薛冰,彭翎,王慧琴. 用数据说话:迎接电力营销服务的大数据时代[M]. 中国电力出版社,2014
[2] 吴涛,李南.概率论与数理统计:经济数学基础[M].中国商业出版社,2001
[3] 百度百科,正态分布,http://baike.baidu.com/view/45379.htm?fr=aladdin, 2014
[4] 李洁明.统计学原理[M].复旦大学出版社,2006
[5] 沈明炎,黄洪,张杰梁,肖娜丽. 智能电能表新型窃电方式的研究[J]. 福建:机电技术,2014(10).
[6] 王惠玲.电能表窃电案例分析与防范[J].北京:中国计量,2012(10).