基于保护状态信息与凝聚层次聚类的电网故障定位算法*
2022-04-28陈义森张厚荣郑文坚宋云海尚佳宁崔曼帝赖光霖
何 森, 陈义森, 张厚荣, 郑文坚, 宋云海,尚佳宁, 崔曼帝, 王 奇, 常 安, 赖光霖
(1.中国南方电网超高压输电公司 检修试验中心,广东 广州 510700;2.华南理工大学,广东 广州 510640)
0 引 言
随着我国电网规模的扩大以及电网数字化水平的提高,故障定位算法成为故障发生时处理海量故障相关信息不可或缺的手段。电网故障定位算法旨在通过对故障发生时电网运行维护中心收到的海量故障相关信息,进行数据分析来确定故障元件位置[1-2]。
众多文献对电网故障定位算法进行了研究与创新。文献[3]提出一种融合T-S模糊模型、粗糙集理论以及遗传算法的电网故障诊断方法,对故障信息杂乱、缺失的故障场景具备一定分析能力。文献[4]应用优化Petri网与BP神经网络算法实现了故障区域的快速准确定位。文献[5]应用组合型交叉熵算法将电网故障诊断问题表示为目标函数最小化的0~1整数规划问题,算法具有收敛快以及稳定性好等优点。
文献[6]应用模糊C均值法对广域测量系统实时测量的电网状态量及电气量做聚类分析,实现电网故障区域定位。文献[7]同样将模糊C均值聚类分析方法应用于电网故障定位,在准确识别元件的同时实现对受故障元件影响严重区域的判别。上述方法均应用聚类算法实现电网故障定位,由于需要用到实时电气量,故涉及数据量较大,运算时间较长。
对此,文献[8-9]对聚类算法在电网故障定位问题的应用做出改进,二者分别应用改进的模糊C均值法以及谱聚类算法,对智能电子装置提供的电网各断路器及其所配置的各保护状态信息做聚类分析,由于算法输入量仅涉及保护与断路器的状态信息,因此算法在快速性上有所提升,但仍存在准确性以及容错性方面的不足;且模糊C均值法与谱聚类算法均需预设聚类簇数,而实际电网故障时无法预判聚类簇数,进而难以得到最佳的聚类效果,即上述两种方法均存在故障定位结果不稳定的问题。
综上所述,本文以保护状态信息所建立特征向量作为输入量,提出一种基于凝聚层次聚类(Agglomerated Hierarchical Clustering,AHC)的电网故障定位算法。通过智能电子装置(Intelligent Electronic Device,IED)获取电网各断路器及其所配置的保护状态信息,构建特征向量作为输入;利用凝聚层次聚类分析以及预设的电网元件与IED信息关联方式,对特征向量集做聚类分析;依据聚类分析结果得出故障元件,通过仿真算例对所提算法在准确性、容错性以及稳定性上的优势进行验证。
1 基于AHC的电网故障定位算法原理
1.1 AHC
AHC算法是一种自下而上的聚类算法,相比K-means等传统聚类算法,具有不需要指定聚类簇数、对距离度量标准选择不敏感的优点[10-11]。
该算法首先将每个数据点视为1个单一的簇,然后计算所有簇之间的距离来合并簇,直到所有的簇聚合成为1个簇为止。
其具体算法步骤如下:
(1)将样本集X=(x1,x2,x3,…,xn)的每个数据视为1个单一的簇,其中,x1~xn为特征向量,n为样本数。
(2)选择测量2个簇之间距离的度量标准,计算每2个簇之间的距离,形成距离矩阵。此处选取average linkage距离[12]作为标准,其计算公式为
(1)
式中:davg(ci,cj)——簇ci与簇cj之间的average linkage距离;
x-x′——向量;
‖x-x′‖——2个特征向量x和x′之间的欧氏距离;
ni、nj——簇ci、簇cj中特征向量数目。
(3)在每次迭代中,将2个具有最小距离的簇合并成为一个簇。
(4)重复步骤(3)直到所有的数据点合并成1个簇,然后选择需要多少个簇。
当n=5时,AHC算法聚类过程示意图如图1所示。其中圆表示初始样本集的各数据点,椭圆则表示聚类过程所得到的簇。
图1 AHC算法聚类过程示意图
δIEDi=[M,N,DI,DII,DIII,B,F]
1.2 特征向量构建
依据电网中断路器的保护配置情况定义故障定位特征向量为
(2)
式中:δIEDi——断路器i的保护与断路器状态信息对应的特征向量;
M、N、B、F——线路主保护、母线主保护、断路器以及方向元件的动作情况。
DI、DII、DIII——距离保护一段、二段、三段的动作情况。
每个特征量的取值集合为{-1,0,1},其中:“-1”表示未启动(或负方向);“0”表示信息丢失;“1”表示启动(或正方向)。这些信息均可通过IED获取,将各断路器对应的特征向量按行排列成特征矩阵即可作为电网故障定位算法输入参量。
南方某电网220 kV局部拓扑及装置编号如图2所示。图2中,B1~B10表示母线,L1~L14表示线路,C1~C28表示断路器,IED1~IED28为监测断路器C1~C28及其各自所配置保护状态的智能电力装置。
图2 南方某电网220 kV局部拓扑及装置编号
以图2电网为例,当线路L2发生短路故障时,假设所有保护与断路器均正确动作且信息传递准确,则与故障元件关联的IED2,IED6对应的特征向量为δIED2=δIED6=[1,-1,1,1,1,1,1],IED3、IED4、IED8由于方向元件判断故障为正方向,故其特征向量为δIED3=δIED4=δIED8=[-1,-1,-1,-1,-1,-1,1],其余IED对应跳闸向量各元素均为-1。将特征向量排列为矩阵,得到特征矩阵A。
(3)
1.3 基于聚类分析的电网故障定位算法原理
当电网某设备发生故障时,相应的保护会发生动作,控制与该设备连接的断路器跳闸将故障设备隔离,而故障区域以外的保护与断路器一般不会动作,因此故障区域与非故障区域对应的IED特征向量各元素将存在明显区别,可利用聚类算法对特征向量做聚类分析,得出故障区域对应的IED特征向量簇,进而利用IED与电网元件的连接关系确定故障元件。
由于电网故障设备与非故障设备相比,具备稀疏性,因此可以认为所包含特征向量数最少的簇为故障设备对应的簇。
为方便依据故障设备对应簇所得的IED特征向量确定对应的故障设备,定义元件关联域规则[8-9]。
(1)线路关联域,即为线路直接相连的2个IED组成。
(2)母线关联域,由与母线直接相连的线路近母线侧的IED组成,与相连线路数目相等。
通过上述规则,判断故障设备对应簇所得IED特征向量所属的线路关联域或母线关联域,即可确定对应的故障线路或母线。
2 故障定位算法流程
2.1 故障定位算法的实现
以上述特征矩阵A为输入量,应用AHC算法对网络中所有IED进行聚类分析。基于故障区域最小原则,判断聚类结果所得最小簇为故障区域关联簇,簇内特征向量对应的关联母线或线路即为故障元件。值得注意的是,由于IED特征向量被分为3或者4个簇时,均可能得到准确的故障区域关联簇[9-10],故在AHC运算完成后,需依据所得故障区域关联簇中特征向量关联情况选取合适聚类簇数。
基于AHC分析的电网故障定位算法流程如图3所示。
图3 基于AHC的电网故障定位算法流程
2.2 算法计算量与容错性分析
如前所述,IED特征向量聚类簇数难以确定,当应用K-means、FCM等需要预设聚类簇数的聚类算法做故障定位时,往往需要进行不止一次聚类运算方可得到正确的故障定位结果。而由于AHC算法是自下而上的聚类方法,聚类完成后可依据需求自由选取所需要的聚类簇数,故该文算法只需依据故障区域关联簇中特征向量的关联域,判别结果选取适当聚类簇数即可避免多次聚类运算,节省了计算量。
对于IED信息的容错性方面,相较于FCM等聚类算法的聚类结果易因故障区内IED向量畸变导致的距离度量标准值变化从而无法得到理想聚类结果,AHC算法由于采取自下而上的聚类方式,每次将距离最近的两簇合为一簇,故单一对象(特征向量)的畸变对于聚类结果影响较小,所以具备较好的容错性。
3 算例分析
为验证本文提出的基于保护状态信息与AHC电网故障定位算法的电网故障定位能力及其对IDE信息的容错性,以图2南方某电网220 kV局部拓扑为案例展开分析,利用MATLAB编程,应用所提算法对IDE信号正常、缺失、误报、漏报等典型故障案例进行故障定位分析。
3.1 保护正常动作且IED信息准确时的电网故障定位
首先,通过保护正常动作且IED信息准确情况下故障案例分析详细介绍所提算法分析过程。
设线路L4发生单相接地短路故障,线路主保护动作控制断路器C7、C8跳闸隔离故障元件。检测网络各IED信息知,线路L5距离保护I段、II段、III段阻抗继电器启动,母线保护未动作,IED7、IED8、IED17、IED23、IED2、IED4故障方向元件均指示正方向。依据上述信息形成输入跳闸矩阵为
经过AHC算法计算后,首先选取聚类簇数为3,得出分类向量C,由于向量C为1×28的行向量,为方便展示以两行2×14的形式列出,第一列为IED1~IDE7,第二列为IED8~IDE14,即
(5)
式(5)中向量每一元素的数字表示对应IED所属簇编号,簇“0”所包含特征向量最少,而簇“0”所对应的元件为IED7、IED8。进而判断其关联性,由元件关联域定义知,IED7、IED8所关联元件为L4,故判断故障元件为L4,与预设故障场景相同。
上述分析只需依据故障区域关联簇中特征向量的关联域判别结果选取适当聚类簇数,避免进行多次聚类运算,有效提升了运算效率。
3.2 IED信息存在畸变时的电网故障定位
设置了故障元件相关的IED信息部分丢失、全部丢失以及信息错误情况下母线与线路故障案例,验证该文算法对IED信息的容错性。IED信息存在错漏时故障定位结果如表1所示。为验证所提算法的有效性,将本文算法的故障定位结果与文献[8]的FCM算法、文献[9]的改进谱聚类算法进行对比。
表1 IED信息存在错漏时故障定位结果
由表1可知,在故障关联IED信息部分丢失,故障关联IED信息全部丢失、故障非关联IED信息丢失等IED信息畸变这3种场景下,本文算法均能准确定位故障元件;而文献[8]及文献[9]在IDE信息丢失或信息畸变的场景下,可能出现误判。综上可见,本文算法对于IED信息具备较高的容错能力。
4 结 语
本文提出了一种基于保护状态信息与AHC的电网故障定位算法。该方法应用AHC算法对反映电网断路器及保护状态的IED信息特征向量进行聚类分析,依据聚类结果以及元件关联域定义确定故障元件。多场景算例验证了本文算法具备较高的故障定位准确性以及对IED信息具有较强的容错性。