APP下载

基于多源数据挖掘的低压配电网线损智能诊断模型

2018-01-24宋惠忠顾华忠韦安强周子誉

浙江电力 2017年12期
关键词:海宁台区电量

宋惠忠,顾华忠,顾 韬,韦安强,周子誉

(1.国网浙江海宁市供电有限公司,浙江 海宁 314400;2.国网浙江省电力有限公司嘉兴供电公司,浙江 嘉兴 314000)

0 引言

电网线损是电网企业的重要管理和考核内容,发电、输电、变电、配电和用电等各环节均会带来线损。其中,配电网的台区线损是供电企业的重要指标之一。由于配电网存在线路杂乱、用户量大、台区档案管理薄弱、现场环境复杂、业务系统复杂、数据质量较差等问题,导致台区线损存在管理难度大、治理效率低等问题。目前,台区线损治理主要方法为人工经验法,即由工作人员凭借个人经验进行判断和治理,而缺乏科学、智能的诊断模型。随着电网信息化、智能化建设的发展,各个环节信息化、智能化水平得到不同程度的提高,使得全网线损管理的信息化、智能化成为可能。

目前,国内外大量的研究工作集中在台区理论线损计算和线损管理方式方面[1-10],传统的理论线损计算方法通过电网实时负荷数据、拓扑数据进行计算[2-3],但实际应用比较困难。因此提出了基于统计学的简便计算方法,如使用回归算法[4]、聚类算法[1]、神经网络算法[5,11-12]、支持向量机[13]等等。而关于诊断与降低线损的论文较少,且主要集中在网架结构和运行方式、管理水平优化上,根据理论线损对网架结构和运行方式进行优化[2,14-15],或者在现有的管理基础上提出具有针对性的管理方式[8-9,16-17],但对线损智能诊断的研究更少。以下通过技术手段融合计算机科学、电力专业、统计学等多学科,通过变革传统的人工线损报表与管理模式,使线损管理走向信息化、透明化和智能化。

文章首先分析了浙江省海宁地区的台区线损现状,针对海宁地区的线损现状,提出了相应的诊断模型,并使用海宁的准确数据对模型进行校核。然后对海宁地区316个典型低压台区进行模型验证,结果显示模型能够有效识别异损台区存在的异常问题。

1 海宁地区低压台区线损现状

供电所负责所辖区内的低压台区线损管理,目前主要是通过线损治理专员每日通过系统查询异损台区,并手工比对相关用户数据,查找异损原因,效率低下。调研统计发现,线损治理效率约为1人·天/台区。

为分析海宁地区的线损现状,对海宁地区的3个供电所进行线损异常原因调研。表1统计了海宁市2017年1月的线损异常数据,其中电量缺失、电量异常、户变关系异常、窃电、接线/设备故障占比分别为42.12%,28.08%,10.27%,8.22%和4.79%。电网运行方式、功率因数和设备选型等问题占比不高,并涉及到电网设计问题,整改难度大、周期长。因此,海宁地区线损异常的主要原因为采集电量缺失、电量异常、户变关系异常、窃电和接线/设备故障等。

表1 海宁地区线损异常原因调研

目前采用人工方式分析异损台区,具体流程如图1所示。通过人工比对台区的档案数据、电量数据、运行状态、拓扑数据等电网运营数据,找到嫌疑用户。其中,电网运营数据比较完整,用电采集提供客户端抄表与关口抄表情况、关口表负荷数据较完整,客户表负荷数据需要通过召测获取;营销业务系统中用户档案数据、业务数据较完整。但这些数据散乱分布,缺乏科学分析模型,导致人工比对效率和准确率都较低。

图1 线损异常台区人工分析流程

为提高线损分析效率,对多系统/多业务模块的数据进行整合,包括:营销档案数据、营销业务数据、电网运行数据、拓扑结构数据、抄表数据等,建立基于电网多源数据的配电网线损智能诊断模型,实现线损分析的智能化,具体分析流程如图2所示。

图2 线损智能诊断分析流程

2 配电网线损异常智能诊断模型及参数

通过对海宁地区线损基本情况调研,掌握线损治理现状、线损异常原因总结、电网运营数据情况等。根据调研结果,建立适用于海宁地区的配电网台区线损智能诊断模型,分为户变关系异常分析、用电数据采集异常分析和异常用电行为分析3个模块。

2.1 户变关系异常分析模型及参数整定

由于电网业务流程中档案录入失误,导致用户与台区对应关系错误。台区中户变关系异常的用户会影响台区的总用电量计算结果,造成台区线损异常。电网运营数据中能够反映户变关系的数据极少,其中用户的用电地址能够一定程度上帮助找到户变异常的台区。根据配电网线路的设计特点,用户就近连接配电变压器,即同一台区的用户地址比较接近。因此,提出基于用电地址的户变关系异常分析模型,找到距离台区整体用电地址较远的用户,并定义为户变关系异常嫌疑用户。

用户地址为文本数据,针对文本数据的分类算法通常包括文本分词、重构文本数据、模型训练、模型测试等过程[18]。中文分词算法可分为两大类,第一类是基于词典的分词算法(字符串匹配分词算法),第二类是基于统计的机器学习算法[19-20]。目前,用电地址已实现结构化,按省、市、县、街道等地域从大至小共同构成,具有地理词语规律和词长较短的规律。因此,首先基于词典进行分词,针对未收录词典的词语基于统计学进行分词。户变关系异常识别归属于异常点识别范畴,通常基于距离、密度、频率等特征进行识别。考虑到地理词语的随机性,不具有普通文本词语的连贯性,因此采用基于频率的异常点识别算法。Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集[21],通过给定的最小支持度,找到出现概率满足最小支持度的频繁项集。

为验证模型可行性,选取海宁地区户变关系正常台区作为实验台区。考虑到城区(小区)、城郊和农村地理特征差别,随机选取海宁地区424个线损长期正常台区,其中城市(小区)台区85个,农村台区219个,城郊(镇)台区120个。根据历史现场查验比例,随机选择1‰的用户打乱其台区属性,计算模型的最优准确率和召回率。重复进行100次实验,平均准确率和召回率如图3所示。可以看出,召回率和准确率均最优时,城郊用户的准确率最低,但也达到了91.75%,可满足现场检查需求。

图3 海宁地区城市(小区)、城郊、农村(镇)调参曲线

2.2 用电数据采集异常分析

用电采集系统采集各表计的冻结电量数据,计算台区线损率。用电数据采集异常分为3类:采集电量缺失、采集电量异常变小、采集电量异常变大。针对不同异常类型,给出对应的判断规则。若当日抄表电量为空,则判断为采集电量缺失。若当日抄表电量小于前日抄表电量,则判断为采集电量异常变小。采集电量异常变大的判断规则较为复杂,因此将其纳入异常用电行为分析模块中。

用电数据采集异常分析的目的是为评估采集异常对台区线损的影响。常用的预测方法较多,包括平均数法、趋势预测法、统计回归法等[22]。同时,新的理论和方法不断涌现[23-26],神经网络、时间序列、贝叶斯、模糊理论、小波分析、回归分析、支持向量机等技术为电力负荷预测提供了有力的工具。但目前的方法均有其不足之处,短期负荷预测方法受坏数据、气候因素、用电随机性的影响,导致预测误差较大。为避免上述因素对电量预测的影响,选取部分适用的历史电量用于电量预测:

(1)为避免坏数据的影响,选取线损正常日期的电量。

(2)为避免用电随机性的影响,将历史电量根据工作日/节假日属性进行分类,选取预测当日属性相同的历史电量。

(3)为避免气候原因的影响,选取预测日期近期电量作为历史电量。

针对训练数量较少的情况,一般采用简单模型,降低因参数精度对模型准确度的影响,即采用最常用的平均值模型。

式中:Wi为近期同类型且台区线损正常的用电量;W估算为估算得到的电量;N为相似天数。

为验证模型的可行性,选用海宁地区抄表数据均正常的用户作为实验数据。考虑到不同类别用户的用电习惯,分别选用海宁地区200名工业、商业、农业和居民用户的电量数据作为训练集合。用于计算平均值的相似天数从1~50 d,分别计算其电量估算相对误差,结果如图4所示。其中,农业用户相对误差最高,达到12.82%;工业用户相对误差最低,为9.86%。因此,模型满足现场使用需要。

图4 不同相似天数时电量估算精度统计

2.3 异常用电行为分析

窃电、违约用电、设备故障等异常特征不明显,影响难以估量,是台区线损异常的主要因素之一,因此将其归类为异常用电行为。考虑到现有的数据,分为以下4个维度进行分析:表计电量变化趋势、表计电量与台区线损率关联性、异常事件与台区异损关联性、历史异常用电行为。

2.3.1 表计电量变化趋势异常分析

为避免坏数据、气候因素、用电随机性的影响,将用电数据分类为工作日且线损正常、节假日且线损正常、工作日且线损异常、节假日且线损异常4类。针对每块表计,根据分析日期的节假日/工作日属性,选择历史节假日/工作日且线损正常的用电数据为对比数据。统计学中常定义最小值与最大值之间为合理区间,因此,找到对比数据的电量值及电量占比(电量占比指表计电量占台区总电量的比例)的合理区间。若线损异常当天,客户/关口表计的电量值或电量占比任一超过合理区间,则定义该块表计的电量变化趋势异常。

2.3.2 表计电量与台区线损关联性分析

若表计电量的波动与台区线损率波动相关,则该表计电量为台区线损波动的因素之一。为找到与台区线损率波动关联性强的表计,使用皮尔逊相关系数作为关联系数[27],计算每块表计与台区线损率的关联性。皮尔逊相关系数公式如下:

式中:ρx,y为待分析用户用电量和所属台区线损率的皮尔逊相关系数;xi和yi分别为第i天该用户用电量和所属台区的线损率。

给定最小相关系数,若皮尔逊相关系数的绝对值大于给定值,则定义为该用户电量与台区线损关联性异常。根据文献[27]研究,当相关系数绝对值大于0.5,即认定为具有强关联。

2.3.3 异常事件与台区异损关联性分析

部分异常用电行为,如表计故障、窃电都会引起表计异常,具体表现如开盖记录、失流、失压、断相、断流、电能表倒走、电能表飞走、反向电量异常、恒定磁场干扰、电压断相、单项表分流等。因此,将表计的异常事件与台区异损结合分析,能够有效识别导致台区异损的异常事件。针对前两个维度发现的异常用户,后台进行数据召测,分析判断是否存在异常事件,若存在,则异常事件与台区异损关联性异常。

2.3.4 历史异常用电行为嫌疑系数

为合理评估用户的异常级别,综合上述的3个异常用电分析维度,建立能反映用户异常级别的嫌疑系数。常用的方法为加权法,与异常用电行为关联性强的维度权重高,关联性弱的维度权重低。为验证上述3个维度的可行性,选择历史查处的164名存在异常用电行为用户,分析异常用户是否在这3个维度出现异常。由统计(见图5)可知,3个维度发生的频次分别为151,74,46。为合理表征3个维度的权重,根据其发生频次进行归一化后得到权重,分别为0.56,0.27和0.17。

图5 历史异常用户各维度异常统计

2.4 线损治理智能决策

线损智能诊断模型从户变关系异常分析、用电数据采集异常分析和异常用电行为等3个模块精准定位台区异常嫌疑用户。为进一步提高线损治理效率,应根据嫌疑用户对台区线损的影响程度,合理安排检查计划。异常用电行为包括窃电、违约用电、表计故障,影响难以评估,因此根据异常嫌疑系数优先处理。户变关系异常和用电数据采集异常则根据对台区线损的影响程度进行排序,优先处理对台区线损影响大的异常。通常采用线损试算结果评估异常用户对台区线损的影响程度,即计算修正异常用户后台区线损率的变化情况。

3 案例分析

选取海宁地区配电网数据作为实验数据,导出海宁地区38 107名用户的用电地址,分析其户变关系。经分析共识别68名嫌疑用户,经现场查证其中57名确为异常用户,另有4名异常用户未识别,准确率约为93.44%,召回率约为83.82%,结果如图6所示。

图6 海宁地区户变关系异常分析案例结果

自2017年1—6月累计分析了海宁地区316个异损台区,共计12 017名用户(异常用电分析结果如图7所示),准确识别用电数据采集异常的次数9 517次;共计识别异常用电嫌疑用户93名,准确识别76名,未识别8名。

图7 异常用电分析案例结果

海宁地区的案例分析结果如图8所示,配电网线损智能诊断模型能够有效识别包括户变关系异常、用电数据采集异常、异常用电行为等用户,并给出合理的治理策略。

图8 海宁地区案例分析结果

4 结语

线损智能诊断技术能够快速定位导致台区线损异常的关键点,精准识别户变关系异常、电量缺失或不准确、异常用电行为的表计或用户,辅助工作人员合理制定工作计划和台区整改工程布点,极大减轻了基层人员工作量,有效提升了线损管理水平,取得了显著的经济效益、社会效益和管理效益,为其他地区台区线损治理提供了可推广复制的新途径。下一步将在现有模型的基础上,使用更多地域的电网运营数据,对现有模型进行改进,提出适用范围更广的智能诊断模型。

猜你喜欢

海宁台区电量
刘海宁作品(一)
储存聊天记录用掉两个半三峡水电站电量
配电台区变-户拓扑关系异常辨识方法
平凡的人 伟大的事
物联网智能燃气表电量自补给装置
基于功率的电量智能修复算法研究
天下奇观海宁潮
降低台区实时线损整治工作方法
10kV变压器台区设计安装技术研究
基于用电信息采集系统的台区线损管理研究