基于离散Fréchet距离和剪辑近邻法的低压配电网拓扑结构校验方法*
2017-12-20耿俊成张小斐郭志民孙玉宝
耿俊成,张小斐,郭志民,孙玉宝
(1.国网河南省电力公司电力科学研究院,郑州450052;
2.南京信息工程大学江苏省大数据分析技术重点实验室,南京210044)
0 引 言
电网公司通常使用电网GIS平台维护配电网拓扑结构,主要包括电力用户与台区变压器的拓扑连接关系,配变与馈线的拓扑连接关系[1]。配电网拓扑结构对95598报修定位、配电网故障研判、停电计划优化管理等业务都有着重要意义,但由于GIS平台的配电网拓扑结构数据缺失或存在很多错误,严重影响了上述业务正常开展。为了校验和修改这些错误,电网公司的通常做法是:当配电网实际拓扑结构发生变化时,需要人工记录这些变化并更新GIS平台相关数据,或者专门组织人力实地巡测修正这些错误。这些方法既耗费大量的人力、时间,准确性又不够。
针对配电网拓扑结构校验,很多专家学者已经提出了较好的研究思路。在配电网中,由于各处负荷的不确定性,电压经常在波动。电气距离比较近的负荷,其电压波动曲线比较相似(相关度高),而电气距离比较远的负荷,其电压波动曲线相似度比较低(相关度低)[2]。文献[3-5]提出通过比较不同电力用户智能电能表电压曲线之间的相关系数,检验两个用户是否属于同一个台区。采用相关系数比较电压曲线相似性对电压数据质量要求高,同时又很难确定一个相关系数的阀值判断两个用户是否属于同一个台区。本文提出使用一种基于离散Fréchet距离和剪辑近邻算法的配电网拓扑结构校验方法,通过离散Fréchet距离计算不同用户智能电表电压曲线的相似性,进而运用剪辑近邻法快速检验配电网的拓扑结构,并以某电网公司的实际数据对算法进行验证,取得了良好的应用效果。
1 配电网拓扑结构校验方法原理
电网GIS平台里配电网拓扑关系存在问题主要有以下2种:(1)未记录用户所属的台区或未记录配变所属的馈线;(2)用户所属的台区或配变所属的馈线记录错误,而且通常是把某个台区用户错误地挂接到相邻台区,或者把某个馈线变压器错误挂接到相邻馈线。近年来随着智能电能表和用电信息采集系统的全面推广,电网公司获取了史无前例的超大量数据[6]。某台区智能电能表电压序列数据如图1所示,其中电能表m03所属台区关系标识错误。从图中可以看出,电能表m01与m02电压曲线相似性较高,m03与m01,m02电压曲线之间相似性较低。通过智能电能表电压曲线相似性可以对电力用户与台区的拓扑连接关系进行校验。
某台区及其相邻台区用户智能电能表电压曲线相似性分布如图2所示,其中各对象之间距离代表它们电压曲线相似性的大小,距离越大两条曲线的相似性越低。TG1,TG2,TG3是TG0地理位置上相邻的台区,U1和U2用户是TG0台区的两个用户,其中U1的所属台区未记录,属于上述问题的第一种情况;U2所属的台区关系可能错误,属于上述问题的第二种情况。
图1 某台区智能电能表电压曲线Fig.1 Distribution of smartmeter voltage curve in a certain area
图2 某地区智能电能表电压曲线相似性分布图Fig.2 Voltage curves similarity distribution of smartmeters in a certain area
第一种情况,需要对未记录其台区关系的用户进行正确分类,标记该用户所属的台区;或者是对未记录其馈线关系的配变进行正确分类,标记该用户所属的馈线。第二种情况,需要识别、修正用户所属的台区错误或者配变所属的馈线错误。本质上,上述两种情况都可以归纳为校验对象的分类问题。数据挖掘领域中基于距离(相似性)度量的分类技术可以很好解决配电网用户、台区之间拓扑连接关系的校验问题(配电变压器与馈线之间拓扑连接关系校验相类似,不再重点论述)。
2 智能电表电压曲线相似性度量
曲线相似性判别在电力行业有着广泛的应用前景,例如使用曲线相似性判别进行负荷分类[7];使用曲线相似性进行电动汽车电池健康状态诊断[8];使用某地区电网负荷曲线相似性判别进行负荷预测“相似日”的选取[9]。当前曲线相似性判别分析方法主要有相似性函数定义法和特征值法。相似性函数定义法在判别分析过程需要将曲线表示为相似性函数。由于曲线通常是由一些无规律性的离散点组成,将曲线表示为函数比较困难。特征值法选取曲线的特征参数进行比较分析,简单易行,效果通常也比较好。本文选取智能电能表电压曲线关键特征参数来研究各条曲线之间相似性。
离散Fréchet距离是目前采用特征值法研究曲线相似性判别的主流方法之一,例如文献[10]将其应用到在线手写签名的认证,文献[11]将其运用在电力用户用电轨迹的异常识别,文献[12]将其应用在门极电压响应曲线的相似性度量。本文提出将离散Fréchet距离作为智能电能表电压曲线之间的相似性度量,进而校验配电网拓扑连接关系。离散 Fréchet距离具体定义如下:
定义 1[10]:(1)给定一个有 n个至高点的多边形链 p=
(2)给定两个多边形链 A=
(3)一个沿着链A和 B的组合步W={(Ai,Bi}的花费(cost)就是:
则链 A和 B间的离散 Fréchet距离为:dF(A,B)=
这个组合步称为链A和B之间的Fréchet排列。在两条曲线上的离散点是固定的情况下,可以有很多种不同的Fréchet排列,且每种Fréchet排列都对应一个相应的离散Fréchet距离,然后再根据实际应用选取最好的 Fréchet排列以及对应的离散 Fréchet距离。
但是上述离散Fréchet距离只是表示出两条曲线至高点间的距离,对判别智能电能表电压曲线的相似性还不够全面,还需要考虑它们的至低点间的离散 Fréchet距离。
dF(A,B)为两条智能电能表电压曲线之间离散Fréchet距离。
3 基于剪辑近邻的用户与台区拓扑连接关系校验
KNN是数据分析挖掘领域基于距离度量的分类技术,由于其实现的简单性,在很多领域得到了广泛的应用。然而由于电网中用户数量众多,在整个样本集中搜索K个近邻需要耗费时间,效率低下。为此,本文提出基于剪辑最近邻的用户与台区拓扑连接关系校验方法,首先生成由较少样本构成的剪辑样本集,进而在此样本集上运用KNN算法进行快速分类,可以很好地解决配电网用户、台区之间拓扑连接关系的校验问题。
3.1 基于剪辑近邻的用户与台区拓扑关系校验算法
剪辑近邻法是基于类比学习,通过将给定的检验元组和它相似的训练元组进行比较来学习。设将已知类别的样本集 X(N)分为参照集 X(NR)和测试集X(NT))两部分,这两部分没有公共元素,它们的样本数各为NR和NT,NR+NT=N。利用参照集 X(NR)中的样本y1,y2,…,yNR采用K近邻规则对已知类别的测试集 X(NT)中的每个样本 x1,x2,…,xNR进行分类,并执行剪辑操作,若 y0,y1,…,yk是 x∈X(NT)的,剪辑掉不与K个近邻中多最多类别同类的x,余下的判别正确的样本集组成剪辑样本集X(NTE),之后利用剪辑后的样本集X(NTE)对待识别模式x采用K近邻规则进行分类[13]。
在配电网拓扑关系校验中,电力用户对象使用其智能电能表电压曲线描述,“邻近性”使用电压曲线相似性度量;通过比较校验用户与所属台区及邻近台区所有其它用户的智能电能表电压曲线相似性,找出该用户k个“最近邻”,进而确定该用户台区类别或检验该用户台区类别关系是否正确。具体工作流程如图3所示。
3.2 基于GIS经纬度坐标的邻近台区搜索方法
使用剪辑近邻法进行配电网拓扑连接关系校验时,如果训练对象的数目很大,那么计算的开销会很大。电网GIS平台里配电网拓扑关系存在问题通常是把某个台区用户错误地挂接到相邻台区,所以校验某台区用户的台区类别是否正确时,只需要将该台区及其物理位置上邻近台区的用户作为训练样本集合。
国家电网公司企业标准《配电网规划设计技术导则》明确,220/380 V线路应该有明确的供电范围,A类区域供电半径不宜超过150米,B类不宜超过250米,C类不宜超过400米,D类不宜超过500米[14]。两个物理位置上邻近台区如图4所示,两台配变与它所供电用户之间距离应小于500米,若配变A与配变B之间物理距离小于1 000米,则本文认为这两台变压器是相邻的,否则不相邻。
图3 配电网拓扑结构校验工作流程Fig.3 Workflow of distribution network topology verification
图4 两个物理位置上相邻近的台区Fig.4 Two positioned adjacent transformer areas
目前各省市电网公司都基本完成了配网设备GIS坐标数据的采录工作。根据两台配电变压器的经纬度坐标,可计算出两者之间的物理距离,具体公式如下:
其中配变 A、B的经纬度分别为(jA,wA)(jB,wB),地球半径为R。
3.3 台区类别判别方法
4 应用实例
2014年,国家电网公司组织开展了营配贯通工作,希望通过“变电站-线路-配变-用户”数据的采录和治理,建立准确的配电网拓扑连接关系。目前大部分省市电网公司已基本完成数据采录工作。本文提出的基于离散Fréchet距离和剪辑近邻法的低压配电网拓扑结构校验方法,在某地市供电公司的营配贯通数据核查工作进行了试用验证。
(1)根据电网GIS平台配电变压器的经纬度坐标,利用公式3计算校验用户台区变压器与其它配电变压器之间的物理距离,根据合适的距离阀值(根据经验确定为1 000米)搜索校验用户台区的邻近台区。
(2)从用电信息采集系统提取校验用户、所在台区其它用户、邻近台区用户智能电能表最近一天的电压序列数据。例如,某校验用户智能电能表m01及其训练样本集合中部分用户智能电表电压曲线如图5所示。
图5 智能电表电压曲线Fig.5 Voltage curves of smartmeters
(3)计算校验用户智能电能表电压曲线与训练样本集合中用户电压曲线之间的离散Fréchet距离。
首先将用户电压曲线表示成{(i,ui)}i=1…k,其中i是按提取电压值的时间顺序排列的序列号,ui是采集的电压值。智能电能表采集间隔一般为15分钟,若提取一天的电压数据,则k=96。
接着,需要找出用户电压曲线的至高点与至低点。如果一个点比前两个点电压值大同时还比后两个点大,就称它为一个至高点;如果一个点比前两个点电压值小同时还比后两个点小,就称它为一个至低点;并将它们表示成 A=<(1,u1),…(m,um)>,其中,(1,u1)…(m,um)是用户电压曲线的 m个至高点(至低点)。
然后,可以根据离散 Fréchet距离的公式(2)计算检验用户电压曲线与训练样本集合中用户电压曲线之间的离散Fréchet距离。
(4)依据剪辑近邻法,剪辑掉不与 k个离散Fréchet距离最近的近邻中多最多类别同类的x,余下的判别正确的样本集组成剪辑样本集x(NTE)。
(5)基于离散Fréchet距离在剪辑样本集中选择出该校验用户的7个“最近邻”(通过实验k=7效果最佳),具体情况如表1所示。
表1 校验用户m01的k个最近邻Tab.1 The k nearest neighbors of the verified userm01
(6)根据每个“最近邻”与校验用户之间的离散Fréchet距离值以及每个“最近邻”所属的台区类别,判别出校验用户的台区类别,进而判断该用户与台区拓扑连接关系是否正确。例如,校验用户m01的台区类别判断为XXXXXX5,该用户与台区拓扑连接关系是正确的。
根据本文提出的校验方法,对该公司200个台区23 014用户的拓扑连接关系进行校验,同时该公司配电运检人员也进行了现场核查,统计结果如表2所示。
表2 校验结果及现场核实情况Tab.2 Test results and on-site verification
上述校验方法查准率达到93.1%。查全率率达到90%,证明与仅仅依靠人工现场抽查相比,该方法是有效的。出现校验结果不正确的原因,主要包括:(1)该单位个别台区拓扑连接关系错误的用户所占比例较大;(2)该单位用电信息采集系统中的电压序列数据有缺失、不准确情况。
5 结束语
针对当前电网公司GIS平台配电网拓扑连接关系缺失或存在错误的问题,本文提出了一种基于离散Fréchet距离和剪辑近邻法的低压配电网拓扑结构校验方法。基于电网GIS平台配变经纬度坐标数据计算校验用户台区变压器与该地区其它变压器之间的距离,搜索校验用户的邻近台区。通过计算待校验用户与所在台区其它用户、邻近台区所有用户之间智能电能表电压曲线离散Fréchet距离,计算不同用户智能电表电压曲线的相似性,进而运用剪辑近邻法快速检验配电网的拓扑结构,并以某电网公司的实际数据对算法进行验证,取得了良好的应用效果。