基于改进局部异常因子算法的拓扑辨识技术①
2017-06-07杨建平齐敬先曹越峰
杨建平,肖 飞,叶 康,齐敬先,曹越峰
1(国网上海市电力公司,上海 200122)
2(南瑞集团公司(国网电力科学研究院),南京 211000)
基于改进局部异常因子算法的拓扑辨识技术①
杨建平1,肖 飞1,叶 康1,齐敬先2,曹越峰2
1(国网上海市电力公司,上海 200122)
2(南瑞集团公司(国网电力科学研究院),南京 211000)
针对电网中的拓扑错误和不良遥测信息严重影响电网的安全运行的现象,提出了基于改进局部异常因子算法的拓扑辨识方法.该方法利用统计理论对开关及刀闸的状态信息和电网的遥测信息进行评估,同时考虑到遥测及遥信信息对拓扑错误辨识的影响不同,采用相对熵对其数据进行加权处理,并在异常拓扑状态检测过程中,通过网格来屏蔽那些非异常的对象,提升算法效率.实验结果表明,该算法能够快速识别电网中的拓扑错误,发现其中的不良遥测信息.
局部异常因子;权重;开关变位;拓扑辨识
电网拓扑结构的正确与否对于状态估计有重要影响,拓扑错误经常导致状态估计结果不可用或者状态估计不收敛[1].拓扑错误分为支路型拓扑错误和厂站拓扑错误[2],且支路型拓扑错误通常是由厂站拓扑错误引起的.目前拓扑错误辨识方法主要有规则法[3-5]、人工神经网络法[6,7]、残差法[8-11]、新息图法[12-14]、最小信息损失法[15,16]、转移潮流法[17]及状态估计法[18,19].规则法虽然应用简单,但规则间容易存在冲突现象.人工神经网络法对于规模较大且网络拓扑结构经常变化的网络适应能力较差.残差法难以区分由不良数据和拓扑错误引起的残差.新息图法对于单一的不良数据和拓扑错误具有良好的效果,但是难以辨识不良数据和拓扑错误同时存在的场景.最小信息损失法建模复杂,难以应用于实际的分析.转移潮流法能够辨识支路型拓扑错误及不良数据,但对于厂站拓扑错误辨识困难.
针对上述问题,本文在状态辨识模型中提出两个改进方案[21]:(1)在状态辨识模型中引入更多的信息用于拓扑错误辨识;(2)进一步提高状态辨识求解算法的计算效率.本文采用局部异常因子算法对开关的状态信息及其遥测数据进行分析,充分利用采集到的多源冗余数据,最大可能性还原电网运行状态,将电网运行信息转化为需要进行辨识的对象,通过计算每个对象的局部异确认电网存在拓扑错误的可能性.常规的局部异常因子算法由于未考虑对象属性的权重及对象分布区域密度的因素,导致算法运行效率较低,本文采用相对熵对对象属性进行权重设置,并通过网格和稠密单元过滤掉非异常的状态变化信息,进一步提高了算法的效率及结果的可靠性.
1 对象建模
电网拓扑错误的发生可以分为两种情况:一种是电网中没有发生拓扑变化,而表示开关及刀闸状态的信号反应出状态变化,即误发;另一种是在电网中发生了拓扑变化,而开关及刀闸信号却没有对其相应的变化做出反应,即漏发.这两种情况均可以通过设备相关的电气量测量数据和状态遥信数据反映出来,因此,通过引用其遥测、遥信信息来对开关及刀闸进行模型定义从而发现处于非正常运行状态的设备来辨识拓扑错误.
电网拓扑状态由刀闸、开关等设备开断状态来决定,某时刻拓扑状态决定于上一时刻该设备的状态及其到当前状态的转换方式.假设上一时刻不存在不良遥测数据及拓扑错误,则可以通过判定状态转换的合理性来判定下一时刻电网是否存在拓扑错误.因此可以利用遥测变换值及遥信变换值来对状态转换进行定义,通过发现异常的状态转换来判定电网是否存在拓扑错误.
由于在拓扑关系中,刀闸和开关是连接关系的核心,为此,通过定义每个刀闸和开关的状态转换来确认电网拓扑正确性.假设t0时刻某开关R的状态为:
其中YC代表遥测信息,YX代表遥信状态信息;
t1时刻开关R的状态为:其中YC’代表遥测信息,YX’代表遥信状态信息,从而该开关的状态转换可以表示为:
即某时刻开关和刀闸的拓扑状态可以通过该状态转换来进行对象定义,并通过判定所有开关和刀闸状态转换的合理性,辨识电网运行的拓扑错误.
根据设备类型及所连接的其他主设备来对遥测和遥信信息类型进行确认.
表1 设备类型及引用属性
由于遥测及遥信信息对于判定拓扑错误影响不同,故而在进行拓扑错误辨识时需要进行属性权重定义来区别属性对于异常值的贡献程度.
2 局部异常因子算法
2.1 常规局部异常因子算法
局部异常因子(LOF)算法是由Breuning首次提出的一种基于密度的异常检测算法,它通过赋予对象一个表示其异常程度因子的方式来确认对象相对于其局部邻域的异常程度.
该算法的流程如下:
第三步,计算对象p与其k距离邻域中对象的可达距离,对象p相对于对象o的可达距离为:
局部异常因子越大,对象是异常数据的可能性越大.
2.2 改进的局部异常因子算法
为了解决LOF算法计算量大的问题,需要对原始数据进行筛选,通过网格约简技术的应用可以排除掉那些不可能的异常数据,进而减少了计算量.另一方面,为了提高LOF算法的检测准确率,在计算对象之间的距离时,以信息论中的相对熵为对象属性设置权值,达到为对象异常程度较大的属性赋予较大权值的目的.
改进的局部异常因子算法首先通过确认稠密单元和稠密区域排除不可能的异常点,然后基于相对熵对对象属性赋权重,最后在常规局部异常因子算法中将对象距离计算公式改为加权的距离计算公式来进行局部异常因子计算,进而确认可能的异常点.
2.2.1 基于网格进行数据约简
GDLOF算法[21]证明稠密单元和稠密区域中的点不可能是异常点.其基本思想为:将数据集D的每一维度进行等宽划分,每个子区域称为一个网格.p是数据集D中的一个对象,若对象p的所有m最近邻q都在某网格内,并且q的所有m最近邻o也在该网格内,则称该网格为稠密单元[23].若单元满足其中和分别为单元的标识序列),则这两个单元为邻居单元.若对象p的所有m最近邻q都在某网格内,并且q的所有m最近邻o也在某单元集内,且该单元集内的任意两个单元均为邻居单元,则这个单元集合为稠密区域.
通过不断确认及更新稠密单元和稠密区域,仅对边缘区域的数据进行LOF计算,从而可以达到数据约简的目的.
2.2.2 对象属性权重赋值
信息论是一门将信息作为研究对象,以揭示信息的本质特性及规律为基础,应用数学方法来研究信息存储、传输、处理、控制和利用等一般规律的科学[22].信息熵可以用来度量一个系统的无序和杂乱程度.熵值越大,系统中的数据越无序.由于信息熵完全建立在原始数据基础上,故具有很强的客观性,可以用于识别离群点数据,即确认非正常的状态转换,进而确认拓扑错误.同时,基于网格对数据约简后,将大大的减少局部异常因子算法的计算量.
2.2.2.1 信息熵
2.2.2.2 相对熵
在对象集中,每个对象的每个属性对该对象的异常贡献度均不一样,通过确认其属性的相对熵来为该对象与其他对象距离计算时提供权值.从而对象之间的距离计算公式为:
其中wi为对象p的第i维属性的权值.
2.2.3 局部异常因子计算
基于常规局部异常因子算法,将加权的对象距离公式(13)替代公式(4)来进行局部异常因子计算.
3 案例分析
3.1 常规局部异常因子算法
表2给出了某变电站母联开关设备特定连续时刻的8个状态数据,描述属性包括负荷、电流、遥信值.
表2 母联开关属性数据
根据局部异常因子算法计算其结果如表3所示.
表3 常规算法局部异常因子
u2 0.832 u3 18.334 u4 18.138 u5 1.465 u6 0.852 u7 1.214
3.2 改进的局部异常因子算法
3.2.1 基于网格进行数据约简
基于网格进行数据约简,将数据每一维进行等分求出数据网格,得出:效果如图1所示.
图1 对象网格分布
3.2.2 对象属性权重赋值
利用公式(12)进行对象属性权重赋值,各个对象属性的相对熵如表4所示.
表4 辨识对象的相对熵
加了权重之后的对象基于公式(13)进行对象间距离计算,其局部异常因子结果如表5所示.结果比对如表6.
表5 改进算法局部异常因子
表6 两种算法异常因子结果对比
由结果可知,通过对数据对象运用相对熵添加相应的权重使得数据的异常因子计算更为准确,在实际运用中可以更加准确的判定数据的异常程度.
3.3 K值影响分析
本文采用某变电站设备实际运行数据进行分析,该站包含8个开关,29个刀闸,通过局部异常因子算法确认其在一段时间内开关和刀闸的连接是否存在拓扑错误.将选取的数据进行离散化和归一化预处理.
图2 厂站接线图
最终实验结果如表7所示.
表7 不同K值实验结果对比
结果表明本方法对如下三种拓扑异常均能正确辨识:
1)负荷与电流变化较大,遥信未变化;
2)负荷变化较小,电流值变化较大,遥信未变化;
3)负荷与电流变化较小,遥信发生变化.
同时,k值的选择根据数据规模有所不同,k值过大或过小都会导致最后正确率的下降,导致漏辨识,需要经过反复实验,该过程可根据最稀疏聚类的密度对k值进行调整,从而确认较为合理的k值,进而提升局部异常因子算法的正确率及工作效率.
4 结论
本文提出了基于改进局部异常因子算法的拓扑辨识方法,通过电网状态变化的相关遥测值及遥信值快速辨识拓扑错误.网格算法可以对大量数据进行预处理,提高辨识效率,同时将将权重设置应用于节点距离计算,充分利用了数据本身隐含的信息,提高辨识的准确性.实例证明,本文提出的改进方法能够对电网拓扑状态进行快速有效的辨识,为后续基于拓扑的电网应用分析打下坚实基础.
1于尔铿.电力系统状态估计.北京:水利电力出版社,1985.
2 Abur A,Gomez A.Power system state estimation:Theory and implementation.New York:Marcel Dekker,2004.
3 Sing N,Glavitsch H.Detection and identification of topological errors in online power system analysis.IEEE Trans.on Power Systems,1991,6(2):324–331.
4 Sing N,Oesch F.Pratical experience with rule-based on-line topology error detection.IEEE Trans.on Power Systems, 1994,9(2):841–847.
5张婷,翟明玉,张海滨,齐苗苗,龚成明,李雷.基于不确定性推理的变电站拓扑错误辨识.电力系统自动化,2014,38(6): 49–54.
6 Souza JCS,Leite da Silva AM,Alves da Silva AP.Online topology determination and bad data suppression in power system operation using artifical neutral networks.IEEE Trans. on Power Systems,1998,13(3):796–803.
7 Souza JCS,Leite da Silva AM,Alves da Silva AP.Data debugging for real-time power system monitoring based on pattern analysis.IEEE Trans.on Power Systems,1996,11(3): 1592–1599.
8 Wu FF,Wen H,Liu E.Detection of topology errors by stateestimation.IEEE Trans.on Power Systems,1989,4(1): 176–183.
9 Alsac O,Vempati N,Betal S.Generalized state estimation. IEEE Trans.on Power Systems,1998,13(3):1069–1075.
10 Abur A,Kim H.Identifying the unknown circuit breaker statuses in power networks.IEEE Trans.on Power Systems, 1995,10(4):2029–2037.
11 Mili L,Steeno G,Dobraca F.A robust estimation method for topology erroridentification.IEEE Trans.on Power Systems,1999,14(4):1469–1474.
12周苏荃,柳焯.新息图法拓扑错误辨识.电力系统自动化, 2000,24(4):23–27.
13周苏荃,柳焯.新息图法的智能特征.电力系统自动化,2000, 24(13):15–19.
14周苏荃,柳焯.新息图法识别多重网络结构动态变化.中国电机工程学报,2001,21(10):67–72.
15孙宏斌,高峰,张伯明.最小信息损失状态估计中潮流和拓扑统一估计的通用理论.中国电机工程学报,2005,25(17): 1–4.
16孙宏斌,高峰,张伯明.最小信息损失状态估计在拓扑错误辨识中的作用.中国电机工潮流的状态估计模型.电力系统自动化,2010,34(2):39–42.
17 Li Abur A,Hongrae.Identifying the unknown circuit breaker statuses in power networks.IEEE Trans.on Power Systems, 1995,10(4):2029–2037.
18李宾.基于专家系统的不良遥信数据辨识.电力信息化,2010,(7):22–25.
19张净,孙志挥,宋余庆,倪巍伟,晏燕华.基于信息论的高维海量数据离群点挖掘,2011,38(7):148–151.
20李存华,孙志挥.GridOF:面向大规模数据集的高效异常检测算法.计算机研究与发展,2004,40(11):1586–1592.
21 Agyemang M,Ezeife CI.Lsc-mine:Algorithm for mining local outliers.Proc.of the 15th Information Resource Management Association(IRMA)International Conference. New Orleans.2004,1.5–8.
22何光宇,常乃超,董树锋,等.基于集合论估计的电网状态辨识:(一)建模.电力系统自动化,2016,40(5):25–31.
Topology Identification Based on Optimized Local Outlier DetectionAlgorithm
YANG Jian-Ping1,XIAO Fei1,YE Kang1,QI Jing-Xian2,CAO Yue-Feng2
1(State Grid Shanghai Municipal Electric Power Company,Shanghai 200122,China)
2(Nari Group Corporation State Grid Electric Power Research Institute,Nanjing 211000,China)
In view of the fact that grid topology errors and bad telemetry information affect the safe operation of power grids seriously,this paper proposes a topology identification method based on improved local outlier factor algorithm. The method uses statistical theory to evaluate the state information of breakers and disconnectors and telemetry information of the power network.While taking into account the different influence of telemetry and remote communication on topology error identification,we weight its data by relative entropy.In the process of abnormal topology state detection,non-anomalous objects are shielded to enhance efficiency of the algorithm.Experimental results show that the algorithm can quickly identify the grid topology errors and find bad telemetry information.
local outlier factor;weight;dislocation;topology identification
2016-08-26;收到修改稿时间:2016-10-08
10.15888/j.cnki.csa.005762