客户用电行为风险识别模型研究
2018-01-24赵永良
谢 颖, 王 征, 赵永良
(1.国网浙江省电力有限公司绍兴供电公司,浙江 绍兴 312000;2.国家电网有限公司,北京 100031)
0 引言
“量、价、费、损”是电力公司经营业绩与同业对标核心指标,也是客户服务与营销风险控制的焦点环节[1]。受经济形势与产业转型升级影响,2016年浙中某地区用电量增速放缓,1—9月,全社会用电量271.45亿kWh,同比增长0.98%,全省排名第7;工业用电量214.87亿kWh,同比减少0.68%,用电营销形势较为严峻[2]。
以下从提升主动服务能力入手,利用现有用电信息采集系统电量与负荷实时数据,构建基于用户日电量波动率、变化率、负荷利用率指标的用电风险识别模型,完善现有市场分析预测方法,改进以往只关注月度结算电量,容易造成信息获取滞后、过程预控手段缺乏的问题[3]。
考虑到用户与用电信息采集系统数据规模较大,仅选取该地区报装容量在1 000 kVA及以上用户作为分析对象,其用电量约占地区售电量的70%,具有较强的样本适应性[4]。分析模型结合营销业务特点,运用大数据分析方法,对2016年用电数据进行分析与钻取,总结当前用电形势的行业、地域、季节变化特征,筛选和预警高危用户,有效提升主动服务能力,降低电费回收等经营风险[5-6]。
1 数据处理方法
1.1 拉格朗日插值法
由于用户的电量及负荷数据来源于用电信息采集系统,而系统受信号干扰、设备故障等原因可能出现部分数据缺失、失真的情况,会影响分析结果,对此使用拉格朗日插值法对缺失、失真的数据进行补全[7]。
拉格朗日插值法的公式见式(1),其原理就是对实践中的某个物理量进行观测,在若干个不同的地方得到相应的观测值(x0, x1, x2, …, xn), 找到一个多项式lk(x),其恰好在各个观测的点取到观测的值[8-9]。数学上来说,拉格朗日插值法可以给出一个恰好穿过二维平面上若干个已知点的多项式函数[10]。
1.2 线性回归算法
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析[11-16]。
线性回归算法主要用于计算用户日电量的变化趋势,下文中将会具体阐述。
2 用电风险识别模型简介
2.1 模型指标
根据用电业务特征以及大数据分析处理理论,归纳总结出了3项反映用户电量情况的指标,并对这3项指标分别进行了深入的数据挖掘。
2.1.1 电量波动率指标σ
利用方差原理计算日电量的离散程度,用于分析统计期间用户日用电量均衡程度,模型定义为:
i为累计时长。σ为标准差模型,其值越大,说明样本偏离度越高,也即电量波动大,反之电量波动小。σ过大往往反映出企业经营状况的波动与不稳定。
2.1.2 负荷利用率指标μ
用于分析统计期间用户报装容量的利用效率,模型定义为:
式中:cap为报装容量;cosθ为功率因数(一般取0.9)。μ表示实际用电量与需求电量之比,其值越大表示负荷利用率越高,反之负荷利用率低。μ连续过高反映出可能存在超容用电情况,μ过低反映用户可能存在生产状况不佳或报装方案不合理。
2.1.3 电量变化率指标λ
利用线性回归算法计算出日电量变化的拟合值,用于分析统计期间用户日用电量变化趋势,模型定义为:
式中:ti为时间序列;N为累计时长。λ为线性回归分析的线性拟合函数斜率,λ>0表明电量逐日增加,λ<0表明电量递减。λ出现较大负值往往反映用户经营状况出现不良态势。
2.2 用电行为分析模型建立
在完成了电量波动率指标σ、负荷利用率指标μ、电量变化率指标λ这3个指标独立分析的基础上,进一步构建用户电量分析模型。该模型将这3个指标做为评价用户风险的重要依据,按照用户所满足的阀值条件的数量划归为3类,所建模型如图1所示。
图1 用电行为分析模型示意
(1)潜在风险用户:只满足3个指标阀值中1个阀值的用户,此类用户在生产过程中存在一定的不稳定因素,电费风险有加大的可能性,业务部门可根据行业及地域情况有侧重地加以关注。
(2)一般风险用户:只满足3个指标阀值中2个阀值的用户,此类用户的生产不稳定性较大,电费风险也较大,业务部门需要加以关注。
(3)高风险用户:指同时满足3个指标阀值的用户,此类用户生产存在重大的不稳定性,业务部门需要加以重点关注和持续跟踪。
3 模型应用示例
本节根据某电力公司2016年用户日电量及日负荷数据,利用用电行为分析模型进行分析,并给出示例。
3.1 电量波动率指标应用
3.1.1 电量波动指标阀值确定
数理统计表明,2016年1—9月,该地区1 000 kV以上大用户日电量波动率σ呈指数分布,波动率σ在[0,0.07]区间用户密度最大,占比超过70%;[0,0.15]区间用户占比超过90%;σ>0.2的用户占比约5%,确定日电量波动率95%置信区间为[0,0.2]。由此选定σ>0.2作为电量波动异动判断阈值,并进行跟踪分析。
3.1.2 电量波动典型用户定位
在确定了指标阀值的基础上,筛选出2016年电量波动指标大于0.2的用户,则可对用户行业分类、典型用户进行下钻分析。
从图2可以看出,2016年纺织业、造纸业、非金属矿产业行业占比最高,总计超过75%,反映出地区产业结构特征与经济调整的影响。
图2 波动率过大用户行业分布
在此基础上,还可以继续对用户进行下钻,如将阀值调整到0.3,发生次数调整为2次,定位到共有13家用户符合条件,其中某纸业公司具有典型特征,该用户1—9月的波动率均在0.4以上,9月更是达到了0.73,从电量波动情况可以看出该用户的生产较不稳定,经过业务部门核查,确定用户产能的确出现下降,随即采取措施,及时预防电费风险的产生。
3.2 负荷利用率指标应用
负荷利用率监测分两个层面进行。一方面监测负荷利用率较低(<15%)的情况,主要分析用户可能存在的生产萎缩或报装方案不合理;另一方面监测负荷利用率过高用户(>100%),主要分析可能存在的安全运行与超容用电风险,本节示例只针对利用率较低的用户。
从图3看出,区域A占比最高,一定程度反映这些区域传统加工出口企业面临新形势的风险较其他单位大。
图3 长期低效大用户占比地域分布情况
以某印染有限公司为例,该用户原容量2 600 kVA,行业类别为纺织业,除2月外,7—9月的平均日电量为1 119 kWh,平均利用率为0.05。该用户7—9月日电量与利用率统计数据见图4。
图4 用户日电量与利用率统计
7—9月期间,除7月1日外,该用户日电量均小于1 500 kWh,利用率低于0.07,从用户的日电量及利用率数据可以看出,用户生产情况较为严峻,通过营销系统查询得知用户于9月16日完成永久减容1 600 kVA,减至1 000 kVA。
3.3 用户日电量变化率指标应用
日电量变化率采用线性回归算法,线性拟合系数λ<0为趋势递减用户,考虑变化趋势的显著性,选择λ<-1%作为电量递减阈值开展分析。
从图5可以看出,2016年纺织行业电量呈递减趋势的用户数远远大于其他行业用户,出现记录数最多的五个行业分别为纺织、水泥、造纸、化学原料、制药。
图5 日电量递减用户行业分布
3.4 利用模型定位高风险用户
通过模型定位到的高风险用户共14家,通过营销系统业务变更情况追溯,发现其中5家2016年出现过暂停或强停情况。如浙江某家私有限公司,被定位为高风险用户,且2016年已经关停。
从行业分布来看,这14家高风险用户主要在纺织业和化工业,其余11家虽没有业务变更,但通过对相关企业电量、负荷的连续追溯表明:在1个月内同时满足三率异动阀值,其生产运营情况的确需要引起关注。
4 结语
基于对电量波动率、负荷利用率、电量变化率指标的分析,构建了用户用电风险识别模型,具有较强的业务适用性。模型固化后分析周期可由原有每月缩短到每日进行,能够有效帮助营销部门提升高风险用户识别预控能力。主要创新点表现在以下几个方面:
(1)利用用电信息采集系统日电量、日负荷数据对用户用电行为进行分析,改进以往只关注月度结算电量的方式,大大缩短了用户分析周期,基本实现了对用户的实时分析,极大提高了用户风险定位的及时性。
(2)通过建模的方式,利用科学的算法对用户用电数据进行特征分析,能够较为全面、准确地刻画用户用电行为特征,有助于提高业务部门的工作效率,具有很强的实用性。
(3)基于大量的用户用电数据,还可以向着预测用户电量走势的方向进行拓展,对业务部门进行负荷预测提供科学有力的辅助,具有很好的拓展性和延伸性。