大电量客户窃电风险识别研究
2019-08-23张佳轩
李 昂,李 佩,叶 欣,张佳轩
(陕西理工大学 电气工程学院,陕西 汉中 723000)
0 引 言
长久以来,客户窃电问题一直困扰着电力企业[1],严重影响电网的安全经济运行,并破坏了电力市场的经济秩序和公平性[2]。反窃电保护作为供电企业经营的核心问题,对电网经营效益影响巨大,关系到企业的经营成本[3]。传统的预防窃电行方法主要包括定期巡检、定期校验电表以及人为举报等。这些方法对人的依耐性强,抓窃查漏的目标不明确[4],且日常开展的用户检查工作存在查证难、取证难以及定量难的问题。工作人员在查证上往往无从入手,常以人工整理数据的方式开展工作。然而,原始数据存放在一张表中,表结构过于冗长,无法建立表间关系[5],不利于相关人员挖掘数据的价值。
可视分析起源于互联网大数据研究领域,基本方式是将自动的数据分析方法(包括数据挖掘、机器学习、统计分析等各种基于数据的分析方法)与可视化相结合,通过构建人机互动的分析环境,实现对海量数据的快速分析。事实上,人的数据处理能力有限,但对图形模式的识别能力极强。可视分析的核心思想是利用人的感知能力和计算机的计算优势,让两者协同工作,互相促进[6]。近年来,随着国家电网公司信息化建设的快速发展,海量的营销数据中包含有较为完备的用户基础信息、用户用电信息、电费信息、缴费信息以及其他相关信息[7]。大电网海量数据缺乏有效的可视化策略,难以帮助分析人员快速掌握电网运行信息。因此,本文将基于软件Tableau对大客户用电量历史数据进行可视化建模与分析,挖掘潜在价值,提出以数据可视化判别窃电客户的方法,以较为准确地识别窃电嫌疑,精确定位客户,提高电力企业实施重点监控的效率,从而及时防范并应对异常客户的拖欠行为。
1 设计思路
1.1 Tableau简介
Tableau是目前全球最易上手的报表分析工具,拥有强大的统计分析扩展功能,是一款定位数据可视化敏捷开发和实现的智能展现工具,具有操作简单快速、实现灵活高效的即时分析能力。它能够根据业务需求对报表进行迁移和开发,实现业务分析人员的独立自助,以界面拖拽式操作方式对业务数据进行联机分析处理,已被广泛应用于各行各业,用来实现可交互的、可视化的分析。它无需使用向导或是编写程序,能够跟随思维轨迹快速进行视图切换和生成,依靠核心的数据处理引擎,能够处理各种规模的数据,并同时保证近乎实时的快速数据提取分析,提供可视化交互,并把结果展示出来,方便用户理解结果,从而为企事业相关工作人员完善和改进业务提供依据[8-9]。
1.2 模型搭建
模型基于R语言脚本运行的Tableau软件,链接客户历史用电量数据,制作包括客户用电量环同比增减图和客户信用体系表,并且将其相互耦合,将复杂冗长的文本数据转化为直观、清晰、高效、易理解和使用的可视化图形信息[10]。流程如图1所示。
图1 可视化建模过程流程图
2 数据处理
采取相应算法抽取存储在不同源数据库中的所需数据,最后整合到数据仓库中。从历史数据库中提取2016年和2017年某市10 kV、35 kV、110 kV以及330 kV电压等级的大电量客户的历史用电量数据和非法用电记录的客户信用历史数据。大量实践调查研究发现,在电力生产过程中,档案资料更新不及时会导致电网业务在数据存储分析时准确性不高。如果将这些数据作为系统的运行指标,将直接影响评价的准确性。因此,应该提取可用数据分析判断其特征。原始电网业务在数据库中采集数据时,存在数据不完整性、数据不一致性等严重的质量问题。因此,在保证不减少数据所包含信息的前提下[11],应对数据进行历史样本抽取,然后开展分析、排查、清洗等操作,改善数据的质量,如图2所示。样本数据处理具体情况如下:若存在缺失值现象,为保证建模数据的有效性,将这类数据剔除;数据指标,电量的输入输出差值波动大概能反映窃漏电特征,因此考虑引用线损率衡量线损信息[12]。进行excel数据排版成Tableau可识别的格式,然后将数据源连接到Tableau软件,调整相应数据类型并根据数据类型将数据源的字段分成“维度”和“度量”两类,调整字段属性。
图2 数据处理流程图
3 交互界面
3.1 创建客户体系表
创建4个计算字段分别统计各个电压等级的客户数,以“交流10 kV”为例,打开创建计算字段编辑窗口,编写程序命令“IF[电压等级]=交流10kVTHEN[客户]END”,并将标题命名为“交流10 kV”。类似地,可以创建35 kV、110 kV、330 kV电压等级的计算字段,如图3所示。
图3 某市各个电压等级客户数
3.2 客户电量柱状图表
制作电量柱状图,显示客户各月用电量情况。图4为某市所有客户用电量大小,宽条形代表2017年用电量,窄条形代表2016年用电量;颜色区分客户类型,鼠标放到条形图,可以智能化显示每个客户的编号、电压等级以及用电量等数据;条形图的高低则可以清楚展示用电量最大的客户为客户2403000083。添加客户筛选器和电压等级筛选器,通过筛选器选择不同的电压等级,可以智能化显示某市各个电压等级下的客户用电量情况。通过筛选器选择不同的客户,可以查看每个客户的具体用电量大小。
3.3 构建客户用电环比表
制作客户用电量环比增减度条形图,显示各个客户用电量环比增减度。如图5所示,以时间10个月为横轴,2017年的电量信息为纵轴,构建用电量条形图,并将标题命名为“环比(形状)”,以区分电量环比增减度。其中,向上的箭头显示电量环比增加,向下的箭头表示电量环比减少。箭头在坐标系中的位置表示增减度的大小。
图4 某市2016年和2017年客户用电量柱状图
3.4 创建客户同比表
制作客户用电量同比增减度折线图,显示各个客户用电量同比增减度。如图6所示,以时间10个月为横轴,2016年和2017年的电量信息为纵轴,绘制电量折线图。其中实折线和虚折线分别代表2016年和2017年用电量,并将标题命名为“电量同比增减度”。构建到视图中,调整为百分比显示,将创建的计算字段“环比(形状)”显示到形状中,向上的箭头显示电量同比增加,向下的箭头表示电量同比减少。箭头在坐标系中的位置表示增减度的大小。
图5 客户用电量环比增减度
图6 客户用电量同比增减度
创建一张仪表板,将前述制作好的工作表排版到仪表板上,调整大小,添加文字和图像,合理布局,相互耦合,添加适当的筛选器并应用到所有工作表完成大客户用电量可视化模型的搭建。
4 模型分析与验证
为了测试该模型的可行性和准确性,应用该模型,通过滑动筛选器,结果如图7所示。直观清楚地发现,2017年7月和9月,客户2401000023的用电量为负值,分别为-360 kW·h和-436 kW·h,而11月环比增长度为134.9%。该企业2016年11月用电量24 109 kW·h,2017年11月用电量152 kW·h,同比减少99.37%。再从历史信用数据来看,该企业存在窃电记录,该数据严重反常,足够说明客户用电异常。通过走访调查发现,该客户报装电能计量装置电能表电压进线断开,使用电不计量,零电压、零电。经现场检查人员和计量中心人员勘察后,该户属于违约用电,确实存在窃电行为。
另外,如图8所示,模型可视化清晰显示2017年12月客户2401000082用电量环比下降23.26%,同比下降94.90%,但该客户的历史用电信用数据却较高。通过对该客户的走访调查,发现该企业电量确实下降,但不存在窃电行为,主要是企业经营状况不佳,受到了市场和政策的严重影响。鉴于此,电力企业帮其通过政府增加直购电指标帮扶该客户。可见,该模型可以有力排查缩小窃电用户的范围,大大减少了防窃电工作量,有助于工作人员快速发现问题并解决问题。
图7 客户2401000023的用电量异常分析模型图
图8 客户2401000082的用电量异常分析模型图
5 结 论
针对长期以来供电企业面临的预防窃电及查处难等问题,结合用电信息采集系统反窃电功能发展现状,本文利用Tableau软件对某市客户历史用电量数据进行模型搭建、数据处理、模型分析以及验证,通过两个算例分析验证了算法的有效性。实践表明,本方案缩小了窃电嫌疑用户范围,减少了防窃电的工作量,为供电企业进行窃电侦查提供了依据,有助于工作人员快速发现问题并解决问题,节约了相关的人力、物力和财力,降低了供电企业的损失,保障了电网安全,提升了公司效益,可为反偷查漏工作提供借鉴。