APP下载

大数据分析应用下的台区线损综合治理排查模型研究

2022-07-04董茵张涛

电子测试 2022年10期
关键词:台区排查聚类

董茵,张涛

(广东电网有限责任公司广州供电局,广东广州,510000)

0 引言

本文以国家电网公司提出的线损精益化管理目标为指导要求,以台区线损治理为着眼点,采用大数据挖掘技术,构建台区线损综合治理排查模型,设计出一套可以精准监控台区线损情况的线损精益化管理平台,实现线损归真和自动生成,实时监测关口、表计、设备、电量等关键节点信息,掌握各层级、各环节、各元件的线损情况,强化供售电量的精细管理,杜绝跑冒滴漏,提升公司经营效益。

1 线损的含义及导致线损不合格的因素分析

1.1 线损的含义

电能在输电线路上传输所产生的能量损耗简称线损。现阶段供电企业计算线损主要是采用供电能量与售电能量差值除以供电能量。一般线损率在-1—5%判定为合格。

1.2 导致线损不合格的因素

1.2.1 违约用电用户窃电

窃电目前造成线损不合格的主要原因在于存在大量的违约用电用户,例如路灯、红绿灯、交通监控等民生工程大部分是直接接入电网而没有开户装表用电,导致大量电能流失。小区广电网络基站无表用电现象尤为严重。城区一些老旧小区线路走向复杂,客户通过布设暗线私自违约用电。

1.2.2 户变关系不准确

台区老旧小区、郊区户变关系紊乱。以前在治理线损时为了平衡指标随意组合台区,将高线损台区与负线损台区随意组合,现场的户变关系与实际存在较大差异,给后期的线损治理工作带来巨大麻烦。

1.2.3 运维检修

调度信息沟通不畅停电检修致使总表采集失败导致线损率为负。以洪泽区供电分公司某台区为例,2020年1月9日配网计划停电导致关口总表采集失败,当日供电能量1.45kWh,售电能量 1597.31kWh,线损率 -110059.31%。运维人员更改表计接线,台区未及时通知营销人员在系统更改台区,导致后期系统采集数据异常。

1.2.4 设备原因

现如今采集器取代过去的人工抄表,提高了工作效率,但是采集器一旦出现故障,导致用电能量无法回传,严重影响当日线损指标。表计出现时差导致系统采集用电能量与关口总表计量数据不一致。电流互感器变比现场与系统录入不一致也将导致线损异常。营销系统信息采集延迟当前的用电信息采集系统只能查看三天前的线损数据,无法实时记算客户当前的线损信息,致使营销稽查人员无法开展有效的治理措施。

1.2.5 装表接电流程归档不及时

流程处理不及时导致营销系统数据采集异常。例如现场已经送电,且客户已正常用电,但系统还未归档,采集器无法上传实时数据,导致台区供售电能量数据异常。

1.2.6 管理因素

线损管理人员配备不足、规章制度不健全、奖惩制度不明确。目前,部分供电企业针对线损管理还未出台相应的规章制度,还未成立专门线损治理班组,专业从事线损排查治理的人员配备不足。

2 台区线损综合治理排查模型构建的关键技术分析

2.1 聚类分析

聚类分析是一种根据数据本身结构特征对数据进行分类的方法,通过聚类分析,可以把数据分成若干个类别,使得类别内部的差异尽可能的小,类别间的差异尽可能的大。聚类分析按照研究对象的不同,一般分为样本聚类和变量聚类;按照分析方法不同,一般分为分层聚类、快速聚类和两步聚类。

层次聚类法又称系统聚类,主要思想是对相近程度最高的两类进行合并组成一个新类,不断重复这一过程直至归为一类。或者采用相反的过程,先把所有样本归为一类,再逐次分类,直至分为n类。

快速聚类法又称K-均值聚类,主要思想是将数据视为K维空间上的点,以距离为标准进行聚类分析,将样本分为指定的K类。其中K-means最为常用,改进型算法K-Medoids也有较为广泛的应用。

两步聚类又称两阶段聚类,主要思想是先以距离为依据形成相应的聚类特征树节点,构建聚类特征树,然后通过信息准则确定最优分组个数对各个节点进行分组。

2.2 聚类分析在台区线损综合治理排查中的具体流程

依托用电信息采集系统,对海量数据进行深入挖掘,以台区线损率与计量在线监测异常事件为分析对象,提出了一种基于聚类算法的台区线损分析方法,该方法的分析流程如图1所示。

图1 台区线损分析方法流程

2.3 台区线损综合治理排查模型构建流程

本文主要以低压用户为研究对象,通过多种算法构建适用于台区线损综合治理的问题排查模型。该模型主要分为3个方面:

(1)对4类常见线损问题的历史案例进行分析,通过聚类分析法梳理每种问题的关键变量,确定其判别规则。

(2)对用户用电变化趋势和台区线损变化曲线进行拟合,框定疑似用户范围。

(3)对比分析疑似用户用电特征与4类问题的辨别规则,确定疑似问题,找出疑似用户。

3 大数据分析应用下的台区线损综合治理排查模型构建与应用

3.1 基础数据抽取

本文所使用的研究数据主要来源于用电信息采集系统、营销系统等数据库。具体为某供电公司的280603个用户的基本信息和用电情况。其中,数据主要包括用户基础信息、台区线损信息、台区用户用电量信息等,具体涵盖用户户名、户号、用电地址、用电类别、用电容量、用电量、台区综合线损、用户电压、用户电压等数据信息,具体如表1所示。

表1 抽取数据内容

3.2 数据甄别处理

为了有效支撑模型的构建工作,需要对获取的数据做以下预处理:

(1)划定所需数据范围。为提高线损治理工作成效,主要对综合线损率为负或线损率超过考核要求的红线部分台区所涉及用户进行分析,即优先分析线损不合格台区相关用户。

(2)确定清洗规则。对于所取数据字段不完整、为空或者偏差较大的用户档案信息进行清除,不作为后续分析的数据源;去掉数据部分为0、为空或者不完整的用户用电数据,为之后分析建模提供用户数据支撑。

3.3 特征值生成

本文主要针对表计快走、表计慢走、用户窃电和用户窜台区这4类发生概率大、影响比重高的常见线损类问题进行研究。其具体实现流程如图1所示:输入用户的基础信息后,首先判断户变一致率是否为100%,如为“否”则与损失电量进行对比看是否匹配,如为“是”则将用户档案进行输出,不触发模型。若户变一致率为100%,则判断公变终端、台区低压用户采集成功率是否为100%,如为“否”则对比采集失败用户电量与台区线损电量是否一致,如为“是”则输出采集数据,不触发模型。

图2 特征值生成及模型触发

3.4 聚类分析

本文应用SL层次聚类分析法,收集历年发现并已处置的各种典型案例,着重分析表计快走、表计慢走、用户窃电、窜台区4类问题的基本用电特征,将相关数据进行类比。由于考察的是定性指标,且需自动建议选择最佳类别,结合输入的各项用户基本信息数据,本文采用SL层次聚类分析法对4类问题用户的基本采样数据特征进行分析。规定每个类间距离等于2类对象之间的最小距离,即各类中的任一对象与另一类中任一对象的相似度取最大值。使用用户基础信息、用电容量、用电类别、表计接线方式、电能表额定值、电压等级、电流值、零线电流值、电量值、电能表事件值等十余种用户基本信息和用电数据项作为聚类变量,使用上述确定的聚类方案得到聚类结果,确定与4类线损问题关联性最强的几个关键因素变量,具体如图3所示。

图3 SL层次聚类分析法逻辑

3.5 模型应用

基于上述得到的台区线损综合治理排查模型,依托移动作业终端开展相关应用探索实践,进行线损精益化管控平台的设计,其功能架构如图4所示。该平台基于模型计算得到线损异常用户名单,以台区线损作为采集质量、营配基础档案质量、现场用电情况、线损异常波动的指标,持续提高台区线损日监测达标率;以线损作为打击窃电及违约用电的专项行动依据,开展现场核查工作运用大数据挖掘技术,跨系统关联用电信息采集系统、营配贯通平台、营销业务应用系统等相关业务数据,通过应用所构建的数据模型,实现对线损异常用户的筛选排查。基于排查结果,对线损异常的台区用户从电量、营配关系、采集异常、地理位置等维度进行自动分析,在符合国网安全接入要求的前提下利用移动作业终端对线损异常台区进行现场核对,并对违约窃电行为进行拍照留存,固化证据,提高台区线损日监测达标率。如图4所示,该平台包括PC端应用和移动端功能应用。在PC端,包括线损异常台区线损筛选、采集电量数据缺失用户预警、异常用电用户分析、现场核查工作查看等功能。在移动端,有基于模型计算得到的线损异常用户名单、异常用电用户核查、用户轨迹定位等功能。

图4 线损精益化管控平台功能架构

4 结论

本文采用大数据分析方法,以国网公司的线损精益化管理要求为指导,以台区线损治理为目标,针对当前线损治理的难题,通过梳理营配关系、整改档案信息,创新数据挖掘方法,研究构建适用于台区线损综合治理的问题排查模型,并应用该模型快速定位疑似用户、框定疑似问题并指导现场排查。

猜你喜欢

台区排查聚类
一种傅里叶域海量数据高速谱聚类方法
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
关于同期系统高(负)损台区治理的思考
美国煤矿安全风险管控和隐患排查治理
多业务协同提升低压台区线损基础管理研究分析
如何排查并改错
抚松农发行开展贷款风险排查