APP下载

基于聚类的智能变电站SCD文件内部比对

2022-06-08钟文吕飞鹏廖小君王星宇

电测与仪表 2022年6期
关键词:端子间隔聚类

钟文,吕飞鹏,廖小君,王星宇

(1.四川大学 电气信息学院,成都 610065; 2.国网四川省电力公司技能培训中心,成都 610065)

0 引 言

智能变电站SCD文件描述了整个变电站IED的实例配置和通信参数信息、IED之间的连接结构以及变电站一次系统构架[1-3]。该文件配置正确性对智能变电站安全运维起到十分重要的作用。

为保证智能站配置正确性与继电保护可靠性,智能变电站在正式投运之前必须进行资料验收、设备验收、网络验收、屏柜及接线验收、辅助设备验收等工作[4-5]。现场验收人员运用试验装置对一次功能进行模拟,同时操作监控后台下发操作命令,验收人员通过观察设备接收报文的情况来判断功能的完成情况[6-9],需要大量人力及时间成本,且难以发现潜在的隐藏设计错误。

为减少验收工作量,文献[10]设计SCD/ICD标准化检验程序,对SCD和ICD文件做规范性校验,保证虚端子信息准确传递;文献[11]开发了虚回路检验工具并提出双重验收方案,能够检测AB套设备配置的独立性。文献[10-11]没有检验IED之间连接关系及虚端子信号的确切含义,因此不能发现IED连接与虚端子配置具体差异和缺失;文献[12]提出并构建220 kV智能站验收模板,通过二次系统网络间报文传递判断二次功能执行的合格性,但模板类型不完整,且通用性不高;文献[13]基于位置的文文中件对比算法,对比前后不同版本的SCD文件生成检修策略。不同版本SCD文件比对能发现SCD文件配置信息变化,但难以发现SCD文件本身存在的配置信息差异及配置错误,对同一SCD文件内部同类IED之间进行配置比对研究尚未见报道。

文中提出了一种SCD文件内部比对校验方法,首先通过聚类算法分别对IED按变电站间隔与设备类型聚类。其次根据聚类结果,以SCD文件同类间隔、同类IED以及双重化配置的A、B套IED存在的相似性作为依据,对同类间隔IED配置数量及连接结构进行比对、对同类IED以及双重化配置IED的连接及虚端子具体内容进行比对,发现并输出差异。通过同类间隔、同类IED以及双重化配置三个方面的SCD文件内部比对,容易在智能变电站现场验收之前发现配置差异及错误,减少校验工作量及站内SCD文件的频繁升级、反复设备调试,且对不同电压等级及接线方式的智能站有良好的通用性。

1 聚类分析原理

1.1 马尔科夫随机游走

将IED视为顶点,IED间虚端子信息传递视为边,则智能变电站IED及其虚端子信息可映射为图。

G=(V,E)

(1)

式中V={V1,V2,……Vn}为n个IED集合;E={|1≤i,j≤n}为边集合。

对图顶点的聚类称为图聚类。图聚类将网络中的顶点划分为多个簇,使簇内顶点间联系相对紧密,不同簇顶点间联系尽可能稀疏[14]。马尔科夫聚类算法(MCL)[15]是基于随机游走过程的图聚类算法。该算法通过修改状态转移概率矩阵,使顶点在簇内游走的概率变大,走出簇的概率变小。在SCD文件不同IED之间绝大多数的信息连接主要存在于本间隔内多个IED之间[16],即在间隔内IED联系较紧密,间隔间IED联系较稀疏,因此MCL算法适合对IED按间隔聚类。

使用邻接矩阵A来表示无向图G。其中:

(2)

式中Vi为顶点;E为边;ω为边的权重。

为防止在偶数次随机游走过程中出现永不可达的情况,为每一顶点添加自环,即:

A′=A+eye(n)

(3)

式中eye(n)为n维单位矩阵。

将矩阵A′按列归一化,可得从任意顶点出发,经一步游走到的其他顶点的概率矩阵,称其为状态转移概率矩阵P,其中:

(4)

为连接图的不同区域,计算第n-1次状态转移概率矩阵的e次幂,可得在以状态n-1为起点,状态n为终点,经过e步转移的概率,这个过程称为扩张(Expansion)。

(5)

为改善Expansion过程的概率趋同问题,增加膨胀(Inflation)操作,可使大概率增大,小概率减小,增大簇间区分度。

(6)

式中r为Inflation过程参数。

重复Expansion和Inflation过程,直到转移概率矩阵收敛,列数值相近表示节点游走概率相似,可聚类为一簇。MCL聚类并不直接得到聚类簇结果,而是给出一个可以度量IED相似性的矩阵,通过密度聚类可以自动寻找这些簇。

1.2 密度聚类

基于密度的聚类方法通过低密度区域分割高密度区域[17],将每个独立的高密度区域作为一个簇,不属于任何簇的对象为噪声。DBSCAN是一种聚类速度较快的密度聚类[18],给定半径Eps和簇内对象个数最小值MinPts,能自动决定将聚类数目,并降低“噪声”影响而发现任意形状的聚类。

首先选取样本数据矩阵,并采用欧氏距离度量节点间相似性,集合V中节点i与j的欧氏距离定义为:

(7)

式中xik和xjk分别为数据对象i和j个的第k个样本值。其次检查i的Eps邻域,即以i为中心,以Eps为半径的超球体空间。

NEps(i)={j∈N|d(i,j)≤Eps}

(8)

若i的Eps邻域至少包含minPts个对象,标记为核心点;若i在核心点Eps邻域内,但其Eps邻域内点的数量小于MinPts,标记为边界点;若i不是核心点和边界点,标记为噪声点。标记完成后,删除噪声点,连接距离在Eps内的所有核心点,将每组连通的核心点形成一个簇,并将每个边界点指派到与之关联的核心点的簇中。

DBSCAN聚类的准确性与Eps和minPts 2个参数的选择有关[19]。由于最少2个IED就可以完成间隔保护工作,设定minPts=2。对于i∈N,采用k最邻近算法查找与i距离最近的第k个对象的距离distk(i)。遍历n个对象,得到集合Distk,排序并绘制成KNN-dist曲线,合适的Eps在曲线的拐点即斜率突增处取得。文中通过与模块度Q结合,自动选取最优Eps,如图1所示。

图1 KNN-dist曲线图

1.3 聚类质量评估

使用模块度Q评估聚类质量,其值越接近1,则类内部节点相似度越高,类间节点相似度越低,在实际的网络分析中,Q值的最高点一般出现在0.3~0.7之间。计算公式为:

(9)

式中m为网络中边的总数;ki为节点i的度;aij为式(2)中取w=1的值,函数δ(Ci,Cj)取值如下,Ci为节点i的聚类类别:

(10)

2 IED聚类

2.1 按变电站间隔聚类

以IED邻接矩阵作为样本数据矩阵,通过MCL与DBSCAN算法,将同一间隔的IED聚为一类。若IED连接配置满足间隔内连接紧密,间隔间稀疏的特征,则一个间隔的聚类结果应包含该间隔所有相关的保护、测控、合并单元及智能终端IED。若IED连接配置存在潜在错误如出现漏连、错连,使其与间隔内的IED连接不再紧密,则不会与同间隔的IED聚为一类。根据此聚类结果,一方面设计人员通过查看聚类情况,能了解变电站配置结构,并初步判断发现配置缺漏,另一方面,根据聚类结果寻找同类型间隔,并通过后续比对,方便查找间隔差异。对IED按间隔聚类的步骤如下。

(1)解析SCD文件可得IED连接矩阵L,设共有n个节点,m条连接信息。

(11)

式中i为源节点;j为目标节点;weightij为边的权重。由于某些IED如母线保护装置需要接收多个间隔信息,导致不同间隔的节点均向其游走,干扰聚类结果,对比节点i,j的英文简写名称的间隔类型位,若相同,则边权重为1,否则边权重为0.1;

(2)由IED连接矩阵L计算无向加权连接图的邻接矩阵A;

(3)以A为样本数据矩阵,进行MCL聚类。根据对多个不同电压等级和不同规模智能站的试验与计算,选取e=2,r=2时聚类效果最好;

(4)以MCL聚类得到的转移概率矩阵的转置PT为样本数据矩阵,计算k=2的KNN-dist曲线,计算曲线每个点的差分,并从大到小排列,依次取差分值点distk(i)作为Eps,对样本数据矩阵做DBSCAN聚类并计算模块度Q,令取得最大Q值的distk(i)为最终Eps参数;

(5)间隔名称自动识别。对步骤4聚类出的每一个间隔,使用最长公共子序列(LCS)算法,将间隔内所有IED功能描述的公共字符串作为间隔名称。

间隔聚类的噪声节点为两类:(1)仅与一个非同类间隔IED相连接的节点,无法构成间隔,又难以向连接紧密的节点游走,如文中算例中35 kV电容保护装置;(2)连接的间隔多,但连接不紧密的节点,如变压器保护装置,由变压器高中低压侧三个间隔共用,因此不适合归于某一侧间隔。

2.2 按IED类型聚类

对IED按类型聚类,即同一电压等级且功能相同的IED聚为一类,着重在于区别IED内部的逻辑设备、逻辑节点、虚端子连接。若两个IED的内部配置相同,则通过聚类算法能够聚为一类,若配置不同,则IED归为噪声。在按类型聚类结果基础上,通过后续IED连接及虚端子比对查找可能存在的配置错误。

解析SCD文件可得IED节点矩阵Node。

(12)

式中nodei保存节点i的信息,依次为IED节点入度、出度、度,访问点个数,通信子网个数,LD总数量,分别接于G1、S1、M1访问点的LD数量,输入、输出虚端子信息数量。

选用Node矩阵作为样本数据矩阵,取Eps=0,minPts=2,进行DBSCAN聚类,得到每个簇至少包含两个配置无差别IED的聚类结果。聚类完成后,使用LCS算法,识别每类IED类型。

按类型聚类的噪声节点为三类:(1)配置有差异的IED;(2)SCD文件中仅配置一个,无相同功能的IED;(3)有相同功能的IED,但配置均不相似的IED。对于第一类噪声节点,寻找其与已聚类节点的差异是有意义的。

3 SCD文件内部比对

3.1 间隔结构比对

SCD文件中同类型间隔,如所有220 kV线路间隔,包含的IED数量及连接结构应该是高度相似的,根据这种配置上的相似性,将每一个间隔与同其类间隔比对,可得到此间隔IED数量及连接结构上的差异,设计人员应特别注意核查。

首先将LCS算法得到的间隔名称规范化为“电压等级+间隔类型”,若某两类的规范化后间隔名称相同,则为同类型间隔。按IED名称字母顺序对间隔内节点排序,以保证不同间隔节点对应性,生成间隔内节点邻接矩阵,比对邻接矩阵的每个元素,若不同,则为连接结构差异,找出差异元素对应行列的IED节点,可解析出差异连接。

3.2 同类IED比对

同类型IED如PL2201A与PL2202A功能相同,其配置也应该是高度相似的。由于按类型聚类能保证已聚类节点IED内部配置在数量上相同,因此对同类型IED配置具体内容比对,若有差异则可能为误连。将第一类噪声节点与参照节点相比对,若有差异,则设计人员可根据差异的具体内容对SCD文件进行修改。

对于SCD文件中的每一个IED,若IED非噪声,将其与其同类IED依次比对,查找本类中每个IED连接及虚端子信息配置内容差异。若IED为第一类噪声,通过名称及IED描述,寻找非噪声的相同功能IED并比对其连接、虚端子差异,如通过名称识别,将已聚类节点SL1104作为噪声节点SL1113的参照节点。若为第二类,则判定此节点无相似节点。若为第三类,则判定此节点无可参照节点。

进行连接比对时,根据间隔聚类结果,将IED之间的连接类型分为间隔内与间隔间连接。匹配连接类型,若相符,再比对其连接节点的设备类型与电压等级,若相符则认为两条连接对应。进行虚端子比对时,将SCD文件中虚端子的配置整理为“源节点-外部引用地址-外部虚端子信号描述-目标节点-内部引用地址-内部虚端子信号描述”。首先判断两条虚端子信息的源节点与目标节点是否对应,若是,再比对其外部引用地址、外部虚端子信号描述、目标节点、内部虚端子信号描述,只要其中之一相符,则认为两条虚端子传递内容相同。为保证比对过程中每一条内容一一对应,防止重复比对,为每一条比对内容添加比对标记属性,若查找到对应连接或虚端子,则比对标记置1。比对完成后,若比对标记为0,则表示此条内容无对应。

3.3 双重化配置比对

双重化配置节点理论上A套和B套设备总体结构以及两套之间数据连接包括其拓扑和虚端子连接应大部分相似。通过AB套IED配置内容比对,输出的差异除了因生产厂家不同而存在的配置差异外,还包括AB套都应该配置却仅在一套IED中配置的内容,若此类虚端子配置有缺失,设计人员可根据需求进行修改。

对于双重化配置节点,查找AB套IED的连接配置差异。分别将AB套IED的连接与虚端子配置信息储存在ListA、ListB中,按上一节方法比对并输出差异。

完整SCD文件内部比对流程如图2所示。

图2 SCD文件内部比对流程

4 算例分析

以220 kV智能站ZTB作为算例进行分析。该站有220 kV、110 kV和35 kV三个电压等级,主变两台。ZTB共有139个IED,463条IED连接信息,6 079条虚端子连接信息。

4.1 按间隔聚类结果

根据IED聚类步骤4,算法自动取Eps=0.511 3,聚类模块度Q=0.334 6。将IED连接信息转化为图,节点标签为IED类别,标签下方为IED名称,使用力导算法布局,结果见图3所示。由图知,MCL与DBSCAN结合,聚类效果良好。cluster1为220 kV母联间隔;cluster2-7为220 kV线路间隔;cluster8为110 kV母线间隔A;cluster9-10分别为220 kV母线间隔A、B;cluster11-12为110 kV母线分段间隔;cluster13-18为110 kV线路间隔;cluster19为110 kV母线间隔B;cluster20-21为主变本体间隔;cluster22-23为变压器110 kV侧间隔;cluster24-25为变压器220 kV侧间隔;cluster26-27为变压器35 kV侧间隔。

图3 按间隔聚类结果

与文献[12]解析IED名称与功能描述构建全站层次数据模型寻找间隔的方式相比,文中聚类算法(1)以IED之间连接拓扑结构作为聚类依据,根据聚类结果能反映连接可能存在错误的IED,是后续比对的基础;(2)可避免因IED信息缺失或命名不规范而产生无法解析与错误识别节点间隔的问题;(3)IED间隔区分更细致,根据拓扑结构可区分变压器高中低压侧间隔;可区分出不共用测控装置的母线AB套保护间隔;另外,在500 kV的智能站测试中,可识别3/2接线方式按照串进行布置的间隔。

4.2 按类型聚类结果

IED按类型共聚为28类,46个节点为噪声,结果展示为图4,纵坐标为聚类的类别,横坐标为IED实例编号。形成节点表时,节点按类型顺序输出,所以聚类结果呈现阶梯形状。cluster1为220 kV母联保护装置;cluster2为220 kV线路保护装置;cluster3为35 kV电容器保护测控装置;cluster4为110 kV线路保护测控装置等。由结果可知,此算法将不同类型的IED做出了准确的区分,将同类型且内部配置相同的IED聚为一类。

图4 IED按类型聚类结果

与解析IED名称与功能描述对IED分类的方式比较,采用聚类算法(1)目的不同,聚类算法以IED内部结构配置数据为依据不仅能找出相同功能节点,且保证已聚类节点IED内部配置在数量上相同;(2)通过查看噪声节点,设计人员能初步定位配置可能存在配置错误的IED;(3)可避免因IED信息缺失或命名不规范而产生无法解析与错误识别问题。

4.3 按间隔聚类比对结果

对变电站间隔结构比对结果见表1。由表可知,同类间隔比对能够找出结构不同的间隔及具体差异。内佛一线间隔连接结构有差异,其合并单元ML2205B没有与PL2205B连接。110 kV母线间隔B,相较于110 kV母线间隔A缺少一套测控与合并单元装置。

表1 变电站间隔结构比对结果

4.4 按类型聚类比对结果

对同类型节点连接及虚端子比对结果见表2,表中15条虚端子差异为ML2201B向PL2205B发送的全部15条虚端子信息。由于已聚类节点其IED内部配置在数量上相同,根据结果容易分析出连接ML2201B-PL2205B为错连。

表2 同类型IED比对结果

对于噪声节点,其与参照节点的部分比对结果见表3,共查找出6条连接差异,174条虚端子差异,差异具体内容可见附件,连接差异比例为1%,虚端子差异比例为2.8%,极大减少检验工作量。

表3 噪声节点比对结果

4.5 双重化配置节点比对结果

双重化配置的IED部分比对结果如表4所示,共查找出双重化配置连接差异33条,虚端子差异915条,差异具体内容可见附件。由表可知,双重化对比能找出AB套设备之间全部配置差异。

表4 双重化节点比对结果

文中所提SCD文件内部比对检测方法利用SCD文件同类间隔、同类IED本身存在的相似性作为比对依据,无需创建多个验收模板,因此通用性高。以多角度(间隔、类型、双重化配置)查找IED配置信息差异,方便设计人员发现配置错误。

5 结束语

文中提出了一种通过聚类算法分析SCD文件并对其进行内部比对检验SCD文件配置的方法,得到如下结论:

(1)通过聚类算法以IED间连接拓扑结构和IED内部配置作为依据对IED按间隔与按类型划分,聚类结果良好,并便于后续比对发现SCD文件配置差异;

(2)从同类型间隔、同类型IED与双重化配置三个方面比对并展示IED配置信息差异,使设计人员及时检查差异发现配置错误,减少校验工作量与现场验收SCD文件更新的频率,消除设计中可能存在、难以发现的隐藏错误及缺失,提高智能站配置正确性、运行可靠性;

(3)所提方法对不同电压等级及接线方式的智能站有良好通用性。

猜你喜欢

端子间隔聚类
电线电缆及端子
◆ 电线电缆及端子
电线电缆及端子
间隔问题
间隔之谜
基于DBSACN聚类算法的XML文档聚类
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究
上楼梯的学问
倍福 接线端子盒EJ系列