APP下载

基于Hausdorff距离与OPTICS聚类的电压暂降同源识别方法

2022-05-10李天楚伍智鹏刘红岩

中国测试 2022年4期
关键词:同源持续时间波形

李天楚, 伍智鹏, 刘红岩

(1. 海南电网有限责任公司电力科学研究院,海南 海口 570311; 2. 海南省电网理化分析重点实验室,海南 海口 570311)

0 引 言

现代工业高速发展,大量对电压暂降敏感的智能化、自动化工业设备大量投入到生产中。电压暂降导致设备工作失效,对用户造成巨大的经济损失[1-2]。为合理评估暂降的影响、危害以及提出有效的治理方法,电网公司安装大量的电能质量监测装置,实现对电压暂降的感知。但随着监测装置的增多,监测数据呈现出冗余状态[3],一次故障事件被多台监测终端记录,对暂降的评估和治理造成了不利影响。因此,必须实现电压暂降同源识别,排除冗余信息干扰,才能掌握电压暂降真正的水平和状态,实现对电压暂降的有效治理。

目前对电压暂降同源识别的研究尚处于起步阶段。文献[4]通过Wasserstein距离度量电压暂降波形间相似度,并使用波形相似度作为同源识别的特征,采用DBSCAN聚类进行同源聚类,该文献为电压暂降同源识别的研究提供了思路,但存在无法识别大电机启动事件的问题;文献[5]将三维典型波形特征共同作为同源识别特征,并采用改进DBSCAN进行同源聚类,具有良好的识别效果,但聚类参数的设置依赖于电网拓扑结构信息,当电网结构不明确时可能发生误判。当前对电压暂降进行同源识别存在以下挑战:1)暂降经变压器传播后波形会发生改变,无法通过直接比较监测数据波形之间是否相似进行同源识别[6];2)不同监测装置之间常存在毫秒或秒级的对时误差[7],且雷击、台风等自然灾害可能同时在电网不同位置触发电压暂降[8],因此利用监测装置时标进行同源识别存在误差;3)不同监测装置采样率不同,监测到的暂降数据长度不同,无法通过直接比较数据长短进行同源识别。

为应对现有研究的不足及挑战,本文以电压暂降持续时间和幅值为切入点展开研究。持续时间是判断电压暂降同源性的有效特征,其由线路的保护类型、定值设置等因素决定,具有明显区分度。但是,相同电压等级保护装置设定的保护定值相似,同电压等级的不同暂降源可能持续时间接近,仅依靠持续时间进行判定,必定存在误差。暂降幅值特征可辅助进行同源识别,暂降幅值受故障类型、故障位置、电网拓扑等因素影响,不同暂降源在不同监测点造成的幅值往往不同[9]。另外,暂降经变压器传播后幅值可能发生改变。因此,同源识别过程中需考虑暂降经变压器传播后的各种形态,用暂降幅值所有可能的变换进行同源识别,可保证识别结果的准确性,但随之也带来了计算量过大的问题。

基于上述问题及分析,本文首先提出了一种基于Hausdorff距离的电压暂降波形相似度计算方法,通过波形相似度和持续时间特征,共同反映不同录波数据的相似程度。其次,构建电压暂降同源识别特征矩阵,进一步提出一种基于多维尺度分析算法的同源识别特征矩阵降维方法,减少同源识别的数据量,以提高识别效率。最后,提出一种电压暂降同源识别算法,通过特征提取、特征降维及OPTICS同源聚类进行同源识别,并应用实测数据验证了所提方法的有效性。

1 同源识别特征提取

电压暂降同源识别的本质为不同暂降监测数据的相似度度量,通过数据的相似程度识别是否为同一暂降源触发。由电压暂降的特征可知,暂降数据相似度包括暂降持续时间和波形相似度[10],因此,本文将二者作为同源识别特征。

1.1 特征 1:持续时间

同一暂降源触发的暂降录波数据,其持续时间接近,提取暂降持续时间作为同源识别特征。

传统的90%阈值法[11]无法准确识别暂降的起始点和结束点,导致持续时间计算出现误差。本文运用文献[12]的有效值绝对差分法,通过计算两个相邻滑动窗口之间的绝对均方根电压差,得到暂降的起始时刻与结束时刻,暂降持续时间可表示为:

式中:ps、pe——暂降起始与结束时刻对应的采样点;

p——录波数据在一周期内(0.02 s)的总采样点数;

t——持续时间,单位为周期。

对m条暂降数据S1~Sm进行同源识别,首先计算其特征1。通过计算暂降起始时刻和结束时刻,可得m条暂降数据的持续时间特征矩阵:

其中tm为第m条录波数据Sm的持续时间。

1.2 特征 2:波形相似度

不同暂降源引起的暂降幅值一般不同,波形特征迥异。但是,经变压器传播后,暂降的波形、幅值等特征会发生明显改变。监测终端的录波数据往往经过了多重变压器传播,难以直接进行波形相似度比对,判断录波数据的同源性。本文提出考虑变压器多重传播特性和Hausdorff距离的暂降波形相似度算法,计算暂降波形相似度,作为同源检测的第2个特征。

1.2.1 电压暂降经变压器的多重传播特性

监测终端布点位置与故障发生地点,可能间隔一台或多台变压器,而暂降经变压器传播后,波形可能发生变化。电压经变压器的相电压传递公式为:

式中:Va、Vb及Vc——电压经变压器传递前的三相电压;

VA、VB及VC——电压经变压器传递后的三相电压;

Tx——变压器传递矩阵,其表达式如表1所示[4],x取值为1~8。

表1 变压器传递矩阵表达式

T1~T8为不同类型、不同数量的变压器所有可能的传递矩阵[4],采用T1~T8对录波数据进行波形变换,构成暂降数据S1~Sm所有可能变换组成的波形集合,再对不同波形集合之间计算波形相似度进行同源识别。

1.2.2 基于 Hausdorff距离的暂降波形相似度算法

应用波形间距离度量波形相似度,两波形间距离越小,其波形相似度越高;反之越低。Hausdorff距离算法是一类以图像特征点为对象的算法,可用于计算离散数据之间的相似度,并具有考察数据序列整体特性,不受数据采样频率、数据序列长短影响的优点[13]。电压暂降监测数据是包含波形信息的离散采样序列,且录波数据长短不一,因此可使用Hausdorff距离计算两电压波形之间的距离。计算方法如下:

其中|·|表示数据A与数据B的距离范数,本文采用欧氏距离。

考虑变压器多重传播特性,使用Hausdorff距离计算各录波数据的波形相似度,具体步骤如下:

1)对m条录波数据S1~Sm进行同源识别,从中随机选取一条暂降数据作为基准暂降Sz,其余为非基准暂降,计算各暂降的起始点与结束点。

2)将各暂降电压有效值标幺化,并提取暂降开始前一周期至暂降结束后一周期的数据序列,将波形沿时间轴往左平移直至第一个采样点时间为0,得到处于同一尺度坐标下的暂降数据S1′~Sm′。

3)将暂降数据S1′~Sm′中非基准数据三相电压有效值分别与T1~T8相乘得波形变化后暂降波形矩阵,以Si′(i∈[1,m]且i≠z)为例:

式中:Qi——暂降数据Si′经变压器传递变换后的波形集合;

S'i8——变压器传递矩阵T8乘以暂降数据Si′后得到的暂降波形。

4)运用Hausdorff算法计算各非基准暂降与基准暂降的波形相似度。以a相为例,非基准暂降数据Si与基准数据Sz的波形相似度矩阵Dia为:

5)令基准暂降与其自身的波形距离为0,最终可得进行同源识别的m条暂降数据的波形相似度为:

2 同源识别特征矩阵降维

2.1 同源识别特征矩阵构建

提取电压暂降同源识别特征后,构建同源识别特征矩阵C:

式中:Cm——暂降数据Sm的特征值矩阵;

cm,25——第25个特征值,即d(S'm8c,S'z8c)。

电压暂降同源识别特征矩阵由暂降持续时间与暂降波形相似度构成,二者存在量纲与重要性的不同。为准确进行同源识别,需统一不同特征的量纲,并衡量不同特征的重要性,增强重要特征在同源识别中的影响力。应用下式进行量纲统一:

其中cti,j表示暂降数据Si的第j个特征值统一量纲后的取值。

根据电压暂降传播性质,传播过程不改变暂降持续时间,却能使暂降深度变浅[7],进而影响同源识别的波形相似度特征。因此,进行同源识别时,不受影响的持续时间特征应比易受影响的波形相似度特征具有更大重要性。本文将持续时间特征值进行放大,放大系数α为2。

经过量纲归一化和特征放大后的同源识别特征矩阵为:

该矩阵有25列,若直接进行同源聚类,过高的维数会大幅增加计算时间。为提高计算效率,同时保证计算准确度,采用MDS算法对同源识别特征进行降维。

2.2 特征矩阵降维

MDS是一种将非线性多维数据映射到低维空间的算法,在降维的同时可以保证低维空间与高维空间的相似度,符合同源识别特征降维的要求[14]。

本文提出基于MDS的同源识别特征降维算法,具体步骤如下[15]:

令m条暂降数据中任意两暂降的同源识别特征的欧氏距离为 λij=|C′i- C′j|,其中 i、j∈[1,m],由其构成欧氏距离矩阵:

本文降维后的维数为3,则选取Δ中前3个较大的特征值Δ*,及其对应的特征向量U*。最终可得降维后的同源识别三维特征矩阵:

3 基于 OPTICS 聚类的同源识别方法

3.1 OPTICS聚类算法

电压暂降同源识别的本质为将不同电压暂降数据进行分类,将同一暂降源引发的暂降数据归为一类,运用同源识别特征作为分类依据,特征相近的数据则为同源。

聚类算法是研究分类问题的一种统计方式,其中基于密度的聚类方法无需事先知道聚类结果的类数,满足电压暂降同源识别的使用前提。OPTICS(ordering points to identify the clustering structure)聚类算法是一种经典的密度聚类,具有对输入参数不敏感,可发现不同密度簇的优势[16],其聚类结果为一种可展示数据集密度结构的增广数据集排序图(可达图),通过分析可达图中凹陷域的个数,可得所有暂降波形的同源事件数[17]。OPTICS的具体实现步骤不再赘述。

在使用OPTICS进行电压暂降同源识别时,有两点需注意:

1)使用OPTICS进行同源识别前,需设定参数MinPts,理想的MinPts取值应接近于同簇数据包含的元素个数。由于OPTICS对在合理范围内的参数设定值不敏感,因此,本文设定同源识别的MinPts为m/n,其中m为暂降数据总量,n为进行同源识别区域的电能质量监测装置总个数。

2)可达图可直观展现电压暂降源事件数,若需得知同源暂降包括的暂降数据,查询处于同一凹陷域的暂降数据即可。

3.2 基于 OPTICS聚类的同源识别方法流程

本文提出基于OPTICS聚类的电压暂降同源识别算法,具体流程如图1所示。主要包括4个步骤:预处理、特征提取、特征降维和同源识别。

图1 电压暂降同源识别算法流程图

4 算例验证

为验证本文所提方法的有效性,应用我国中部某地区电网14处监测点10 min内记录的50条实测电压暂降数据,将其与人工分类法及文献[11]所提方法进行对比。

根据监测数据的暂降持续时间及波形,考虑电压暂降经变压器传播的规律,分析得到50条实测电压暂降主要由4次故障事件引起。为实测数据编号,其中数据1~14、数据15~28、数据29~38、数据39~50分别同源。部分实测数据电压有效值波形如图2所示。

1)人工分类法

人工分类法为根据监测装置记录的暂降发生时刻对暂降进行同源识别,该法误差较大,如图2(c)~2(d)虽为同一暂降源引起,但由于监测装置的对时误差导致暂降记录的发生时刻不一致,使得人工分类出现误判。

图2 部分实测数据的三相电压有效值波形

2)基于Wasserstein距离的多电压暂降事件同源检测方法

该法基于Wasserstein距离度量,度量电压暂降波形数据间的相似程度,并使用DBSCAN进行同源聚类,其同源识别结果如图3(a)所示,使用本文Hausdorff距离的DBSCAN聚类结果如图3(b)所示,图中圆圈表示圈内数据同源,其中数据3及数据37被识别为噪声,其余识别结果与实际情况相符,表明该方法具有暂降同源识别的效果,但一定程度上受DBSCAN聚类算法的缺陷限制。同时由图3可知Wasserstein距离与Hausdorff距离均能较好度量波形间相似程度,但同源数据之间的Hausdorff距离更接近,更利于同源识别。

图3 基于 DBSCAN 聚类的同源识别结果

3)本文所提方法

提取50条暂降数据的持续时间与波形相似度形成同源识别特征矩阵C50×25,其中采用有效值绝对差分法提取的持续时间特征值如表2所示。

表2 各数据持续时间

采用MDS进行数据降维得到三维特征矩阵Z50×3,其在3个维度的特征值如图4所示。

图4 同源识别三维特征值

使用OPTICS聚类算法对Z50×3进行同源聚类,得到此次聚类结果可达图如图5(a)所示。由图中凹陷域的数量可知此次同源识别的真实电压暂降事件数为4起,且对象1~14、15~24、25~38及39~50分别各自为一簇。通过查阅可达图对象序列所对应的数据编号可得,数据1~14、数据15~28、数据29~38及数据39~50同簇同源,与实际情况相符,证明了所提方法的有效性,同源聚类时长为0.11 s。若直接使用同源识别特征矩阵C50×25进行聚类,结果如图5(b)所示,与实际情况一致,但聚类时长为5.27 s,表明使用MDS算法进行数据降维后计算效率较高,有利于在线系统的使用。

图5 电压暂降同源识别聚类可达图

5 结束语

针对电能质量监测装置大量安装导致的电压暂降监测数据冗余的问题,本文提出一种基于Hausdorff距离与OPTICS聚类的电压暂降同源识别方法。提出电压暂降持续时间特征与基于Hausdorff距离的波形相似度作为同源识别特征,构建同源识别特征矩阵。提出基于MDS的同源识别特征矩阵降维方法,减少识别计算量。运用OPTICS聚类算法进行同源聚类,通过可达图中凹陷域数量及对应点数据,得到同源识别结果。最后,通过实测数据与其他同源识别方法进行对比,验证了所提同源识别方法能更精准识别出电压暂降真实事件数,为电压暂降的精确感知、合理治理提供一定参考。

猜你喜欢

同源持续时间波形
基于“乙癸同源”理论辨治股骨头缺血性坏死
基于时域波形掩护的间歇采样干扰对抗研究
以同源词看《诗经》的训释三则
基于Halbach阵列磁钢的PMSM气隙磁密波形优化
“铤”有“直”义的词源学解释——兼说/直/义的同源词族
用于SAR与通信一体化系统的滤波器组多载波波形
全新迈腾B7L车喷油器波形测试
同源宾语的三大类型与七项注意
近10年果洛地区冻土的气候特征分析
外部冲击、企业投资与产权性质