基于保护状态信息与凝聚层次聚类的电网故障定位算法*

2022-04-28陈义森张厚荣郑文坚宋云海尚佳宁崔曼帝赖光霖

电器与能效管理技术 2022年2期

何森, 陈义森, 张厚荣, 郑文坚, 宋云海,尚佳宁, 崔曼帝, 王奇, 常安, 赖光霖

(1.中国南方电网超高压输电公司检修试验中心,广东广州 510700;2.华南理工大学,广东广州 510640)

0 引言

随着我国电网规模的扩大以及电网数字化水平的提高,故障定位算法成为故障发生时处理海量故障相关信息不可或缺的手段。电网故障定位算法旨在通过对故障发生时电网运行维护中心收到的海量故障相关信息,进行数据分析来确定故障元件位置[1-2]。

众多文献对电网故障定位算法进行了研究与创新。文献[3]提出一种融合T-S模糊模型、粗糙集理论以及遗传算法的电网故障诊断方法,对故障信息杂乱、缺失的故障场景具备一定分析能力。文献[4]应用优化Petri网与BP神经网络算法实现了故障区域的快速准确定位。文献[5]应用组合型交叉熵算法将电网故障诊断问题表示为目标函数最小化的0～1整数规划问题,算法具有收敛快以及稳定性好等优点。

文献[6]应用模糊C均值法对广域测量系统实时测量的电网状态量及电气量做聚类分析,实现电网故障区域定位。文献[7]同样将模糊C均值聚类分析方法应用于电网故障定位,在准确识别元件的同时实现对受故障元件影响严重区域的判别。上述方法均应用聚类算法实现电网故障定位,由于需要用到实时电气量,故涉及数据量较大,运算时间较长。

对此,文献[8-9]对聚类算法在电网故障定位问题的应用做出改进,二者分别应用改进的模糊C均值法以及谱聚类算法,对智能电子装置提供的电网各断路器及其所配置的各保护状态信息做聚类分析,由于算法输入量仅涉及保护与断路器的状态信息,因此算法在快速性上有所提升,但仍存在准确性以及容错性方面的不足;且模糊C均值法与谱聚类算法均需预设聚类簇数,而实际电网故障时无法预判聚类簇数,进而难以得到最佳的聚类效果,即上述两种方法均存在故障定位结果不稳定的问题。

综上所述,本文以保护状态信息所建立特征向量作为输入量,提出一种基于凝聚层次聚类(Agglomerated Hierarchical Clustering,AHC)的电网故障定位算法。通过智能电子装置(Intelligent Electronic Device,IED)获取电网各断路器及其所配置的保护状态信息,构建特征向量作为输入;利用凝聚层次聚类分析以及预设的电网元件与IED信息关联方式,对特征向量集做聚类分析;依据聚类分析结果得出故障元件,通过仿真算例对所提算法在准确性、容错性以及稳定性上的优势进行验证。

1 基于AHC的电网故障定位算法原理

1.1 AHC

AHC算法是一种自下而上的聚类算法,相比K-means等传统聚类算法,具有不需要指定聚类簇数、对距离度量标准选择不敏感的优点[10-11]。

该算法首先将每个数据点视为1个单一的簇,然后计算所有簇之间的距离来合并簇,直到所有的簇聚合成为1个簇为止。

其具体算法步骤如下:

(1)将样本集X=(x1,x2,x3,…,xn)的每个数据视为1个单一的簇,其中,x1～xn为特征向量,n为样本数。

(2)选择测量2个簇之间距离的度量标准,计算每2个簇之间的距离,形成距离矩阵。此处选取average linkage距离[12]作为标准,其计算公式为

(1)

式中:davg(ci,cj)——簇ci与簇cj之间的average linkage距离;

x-x′——向量;

‖x-x′‖——2个特征向量x和x′之间的欧氏距离;

ni、nj——簇ci、簇cj中特征向量数目。

(3)在每次迭代中,将2个具有最小距离的簇合并成为一个簇。

(4)重复步骤(3)直到所有的数据点合并成1个簇,然后选择需要多少个簇。

当n=5时,AHC算法聚类过程示意图如图1所示。其中圆表示初始样本集的各数据点,椭圆则表示聚类过程所得到的簇。

图1 AHC算法聚类过程示意图

δIEDi=[M,N,DI,DII,DIII,B,F]

1.2 特征向量构建

依据电网中断路器的保护配置情况定义故障定位特征向量为

(2)

式中:δIEDi——断路器i的保护与断路器状态信息对应的特征向量;

M、N、B、F——线路主保护、母线主保护、断路器以及方向元件的动作情况。

DI、DII、DIII——距离保护一段、二段、三段的动作情况。

每个特征量的取值集合为{-1,0,1},其中:“-1”表示未启动(或负方向);“0”表示信息丢失;“1”表示启动(或正方向)。这些信息均可通过IED获取,将各断路器对应的特征向量按行排列成特征矩阵即可作为电网故障定位算法输入参量。

南方某电网220 kV局部拓扑及装置编号如图2所示。图2中,B1～B10表示母线,L1～L14表示线路,C1～C28表示断路器,IED1～IED28为监测断路器C1～C28及其各自所配置保护状态的智能电力装置。

图2 南方某电网220 kV局部拓扑及装置编号

以图2电网为例,当线路L2发生短路故障时,假设所有保护与断路器均正确动作且信息传递准确,则与故障元件关联的IED2,IED6对应的特征向量为δIED2=δIED6=[1,-1,1,1,1,1,1],IED3、IED4、IED8由于方向元件判断故障为正方向,故其特征向量为δIED3=δIED4=δIED8=[-1,-1,-1,-1,-1,-1,1],其余IED对应跳闸向量各元素均为-1。将特征向量排列为矩阵,得到特征矩阵A。

(3)

1.3 基于聚类分析的电网故障定位算法原理

当电网某设备发生故障时,相应的保护会发生动作,控制与该设备连接的断路器跳闸将故障设备隔离,而故障区域以外的保护与断路器一般不会动作,因此故障区域与非故障区域对应的IED特征向量各元素将存在明显区别,可利用聚类算法对特征向量做聚类分析,得出故障区域对应的IED特征向量簇,进而利用IED与电网元件的连接关系确定故障元件。

由于电网故障设备与非故障设备相比,具备稀疏性,因此可以认为所包含特征向量数最少的簇为故障设备对应的簇。

为方便依据故障设备对应簇所得的IED特征向量确定对应的故障设备,定义元件关联域规则[8-9]。

(1)线路关联域,即为线路直接相连的2个IED组成。

(2)母线关联域,由与母线直接相连的线路近母线侧的IED组成,与相连线路数目相等。

通过上述规则,判断故障设备对应簇所得IED特征向量所属的线路关联域或母线关联域,即可确定对应的故障线路或母线。

2 故障定位算法流程

2.1 故障定位算法的实现

以上述特征矩阵A为输入量,应用AHC算法对网络中所有IED进行聚类分析。基于故障区域最小原则,判断聚类结果所得最小簇为故障区域关联簇,簇内特征向量对应的关联母线或线路即为故障元件。值得注意的是,由于IED特征向量被分为3或者4个簇时,均可能得到准确的故障区域关联簇[9-10],故在AHC运算完成后,需依据所得故障区域关联簇中特征向量关联情况选取合适聚类簇数。

基于AHC分析的电网故障定位算法流程如图3所示。

图3 基于AHC的电网故障定位算法流程

2.2 算法计算量与容错性分析

如前所述,IED特征向量聚类簇数难以确定,当应用K-means、FCM等需要预设聚类簇数的聚类算法做故障定位时,往往需要进行不止一次聚类运算方可得到正确的故障定位结果。而由于AHC算法是自下而上的聚类方法,聚类完成后可依据需求自由选取所需要的聚类簇数,故该文算法只需依据故障区域关联簇中特征向量的关联域,判别结果选取适当聚类簇数即可避免多次聚类运算,节省了计算量。

对于IED信息的容错性方面,相较于FCM等聚类算法的聚类结果易因故障区内IED向量畸变导致的距离度量标准值变化从而无法得到理想聚类结果,AHC算法由于采取自下而上的聚类方式,每次将距离最近的两簇合为一簇,故单一对象(特征向量)的畸变对于聚类结果影响较小,所以具备较好的容错性。