APP下载

基于分布式传感数据的电抗器故障智能感知

2022-08-16佳木斯电机股份有限公司哈尔滨技术研发分公司哈尔滨电气国际工程有限责任公司

电力设备管理 2022年13期
关键词:电抗器分类器准确率

佳木斯电机股份有限公司哈尔滨技术研发分公司 宫 洵 哈尔滨电气国际工程有限责任公司 关 悦

麦肯食品(哈尔滨)有限公司 陈 阳

干式空心电抗器由于其结构简单,自投入使用后一直被认为是免维护设备,其运维技术的发展一直处于滞后状态。由于检修技术处于初级阶段,主要是人力定期检修。随着电网规模的扩大和智能化水平的提升,定期检修模式暴露出越来越多的问题:资源浪费严重、检修标准具有较强的主观性以及影响电网运行等,因此该模式已不能满足电网和电力设备的管理要求。

1 故障感知的分层模型及数据

1.1 分层模型思路

对于运行在电力系统中的电抗器而言,需对电抗器的运行状态和故障类型进行实时监测,可使用一个特定的模型进行判断。当电抗器存在故障并通过模型判断出电抗器的故障类型后进一步使用特定的故障位置识别模型对故障位置进行识别。

本文提出一种基于CNN的分层诊断模型,连续识别电抗器的运行状态、故障类别以及故障位置。分层诊断模型由两层CNN级联组成,第一层用于识别电抗器的运行状态及故障类型,以准确识别电抗器的故障。第一层输出结果用于第二层故障位置识别模型的选择,进一步对电抗器该故障类型下的故障位置进行判断。基于CNN的分层诊断模型具有较强的灵活性和可移植性,该分层模型最大限度的实现了模型内部参数的解耦,可根据具体的需求将其重新配置以实现设备的故障诊断,避免了内部参数高度耦合造成的模型准确率降低的问题,且该分层模型的方法可应用于其余电气设备的故障诊断中,这种灵活性打破了传统故障诊断方法的局限性[1]。

1.2 分布式数据

本文使用的电抗器故障数据是通过MATLAB软件进行数值仿真计算得到的准稳态故障数据、是非时序数据,实际电力系统中通过分布式传感器测量得到的是一系列时序分布式数据。在考虑理想情况下各传感器性能上没有太大的偏差,特别是对于各电气量的测量时没有相位误差,即所有传感器几乎在同一时间点对电气数据进行测量。由此可将MATLAB软件计算得到的准稳态故障数据转化为时序数据,时序数据所使用的采样频率为1000Hz,即一个工频周期的采样数为20个点。

2 基于卷积神经网络实现电抗器故障识别模型

2.1 卷积层描述

本文主要通过CNN模型实现对电抗器故障的识别。为表现CNN模型在数据特征提取上的优越性,CNN的卷积核使用无数据特征的“空核”,在CNN分类器训练的过程中前馈不断更新该卷积核,使其卷积核具有电抗器不同故障类型数据、某种故障类型下不同故障位置数据的主要特征。模型的分类器在电抗器未发生故障时则输出“无故障”,而电抗器发生故障时则可输出电抗器的故障类型、故障位置。CNN模型通常包括卷积层、池化层和全链接分类器,由于卷积层和池化层不参与分类器的训练,因此在一定程度上可将卷积层和池化层看作电抗器故障数据的特征提取器,把数据特征进行分类识别的是带有Softmax激活函数的全链接层,可将其看作分类器[2]。

对于分布式电流数据,使用卷积核在信号进行卷积运算并得到故障数据的卷积特征表示。每个卷积核是一个尺寸为的矩阵,当进行卷积操作时,卷积核沿着数据热图的时间维度平行移动,和预期重合部分的信号进行点积运算,得到该时间步上对应三个线圈支路的数据特征,卷积核移动的步长记为,当卷积核移动到右端顶边时下跳一格重复此操作。设置卷积核的填充数为个单位、尺寸为的电抗器运行数据,通过卷积核的卷积计算得到的特征张量(图像)尺寸:Qc=(Ic-Dc+Lc)/ls。

需注意的是,在CNN进行训练过程中,由于卷积核进行了归一化操作,此处与卷积核发生点积运算的信号块也进行该操作,这样能更好地提取数据信号的故障特征。卷积操作时的卷积层有k个卷积核,每个信号热图(电抗器运行数据)可相应得到k个特征表示矩阵,由于该数据热图的尺寸小,因此该卷积操作的计算量是极小的,整个卷积计算的时间自然也就很短。

2.2 模型构建的参数设置

整个基于卷积神经网络的电抗器故障识别模型内有三个子模型,分别是故障类型诊断模型(模型A)、匝间短路故障位置判断模型(模型B1)、单匝断路故障位置判断模型(模型B2),三个子模型的思路及构建方法一致,其内部参数会因为分类标签、分类个数的不同而存在一定的差异。

CNN:定义一次完整的卷积学习为输入数据依次经过卷积层、激活函数、池化层,卷积学习的输出为单次卷积学习的特征。本节所采用的CNN模型结构如图1,使用卷积对提取特征的操作进行三次卷积学习过程。第一次卷积学习过程的输入为40×41的二维热图,使用的卷积核的尺寸大小为3×3,卷积核个数为8个,卷积学习得到的特征使用激活函数进行激活,池化层所使用的池化尺寸为2×2,因此,该次卷机学习过程输出的结果为20×20×8的特征表示。第二次和第三卷积学习过程卷积核尺寸仍为3×3,但其卷积输出分别设置为16和32,经过函数激活,尺寸为2×2的池化层进行池化后,最终得到5×5×32的特征表示。

图1 故障类型识别模型的训练表现

Softmax分类器:由于故障数据CNN卷积学习后得到32个特征表示,且每个池化后的卷积特征表示的尺寸为5×5,将其展开后长度为25,因此Softmax分类器的输入大小设置为800,权重衰减参数Si为0.0001。对于模型A,Softmax激活函数的输出为一个长度为3的向量,对应为该数据为何种故障种类的概率表现;对于模型B1和B2,Softmax激活函数的输出为一个长度为41的向量,对应为该数据为对应故障概率位置。

2.3 模型训练及其表现

模型的训练过程中涉及到对训练参数的调节,对参数设置及调整策略将对模型的训练效果造成直接的影响。梯度下降是针对单个参数进行优化最常用的方法,其基本思路是沿着梯度下降速度最大的方向进行探索,在其基础上衍生出了随机梯度下降算法,解决了梯度下降易陷入局部最优值无法“逃出”的问题,并加快了算法的训练速度,但这一类算法都无法实现对大规模样本的复杂模型进行训练。Adam(Adaptive Moment Estimation)算法是一种计算梯度的一阶与二阶矩估计改良神经网络训练过程中参数的方法,集中了适应性梯度与均方根传播算法的优点,能自动选择参数的学习率来改善梯度的稀疏水平,同时能较好的处理非稳态在线的问题[3]。

另外,学习率较大时可使得模型的训练速度更快,但易造成不收敛的情况;学习率较小不仅使得训练速度变慢,还易进入局部最优解。因此,对于学习率的设置采用了学习率衰减的方法来加快模型训练,随着训练的不断深入,学习率不断衰减使模型的训练更优化。本文采用的学习率衰减策略为每隔一定的训练代数,学习率减小一个数量级。

对于故障类型识别模型的训练,设置学习率(LR)为0.01,训练代数(Epoch)设置为10,批量大小(Batch size)设置为64,学习率衰减步数为2个训练代,衰减率为0.1时其训练结果如图1所示。模型在第一代训练的初始准确率不到80%,经过4代的训练,训练准确率和测试准确率均到达了100%,且训练损失函数在第7代训练后低至0.0027。测试集准确率对于训练集准确率具有很好的跟随性且一直保持一致,不存在测试集准确率低于训练集准确率的情况,因此对于故障类型识别模型不存在过拟合现象。

同样地,对于短路故障位置识别模型训练参数的设置与故障类型识别模型的参数一致(LR为0.01、Epoch为10、Batch size为64、衰减步数为2、衰减率为0.1),训练结果如图2。模型的训练初始准确率为85.67%,经过4代训练,训练准确率和测试准确率也达到了100%,两者也保持了非常好的跟随性,不存在过拟合现象。

图2 短路故障位置识别模型的训练表现

断路故障位置识别模型的训练参数的设置与调整与前两者不一样,其初始学习率为0.01,训练代数为20、批量大小设置为64、学习率衰减步数设置为5、衰减率为0.1。训练结果如图4,模型的训练初始准确率只有2.47%,经过11代的训练,训练结果到达100%,模型初始损失函数值也高达3.7,最终降至0.06。同样地,断路故障位置识别模型也不存在过拟合现象,训练准确率和测试准确率一直保持一样。

图3 断路故障位置识别模型的训练表现

图4 模型在在线监测场景下的故障类型识别结果

将三个模型按照CNN的结构连接,使用测试集对整个故障诊断系统进行测试,当系统对测试集某一条数据进行判断,其正确率的表示如下式,含义为只有当故障类型和故障位置均识别正确时才视其结果为正确,否则视为对该数据的识别错误。在仿真得到的分布式数据中再随机抽取20%的数据作为试验集,对训练的到的模型进行验证。模型的识别准确率达到100%,验证了通过模型分层的故障识别方法的有效性。

3 电抗器故障智能辨识方法在线监测上的表现

在上述研究中,用于学习特征和训练分类器的波形信号段对应的是相同的时间范围(即使用的训练数据都是以故障发生时间作为起点)。但在实际应用过程中,模型的输入量包含了非故障数据和故障数据的模糊区域,模糊区域可能会使得模型对故障的判断出现误判或漏判的情况。鉴于此,在本节使用不同时间范围内的数据形成训练集,另外由于电抗器在发生故障后几乎没有暂态过程、直接进入故障准稳态,故障波形在模糊区域是逐步出现,在故障发生的早期模型无法准确的提取处故障特征进行故障识别。因此本节探究非故障和故障混合的数据中故障时长占整个时间窗口的比例对故障识别模型的影响。

利用ANSYS Maxwell仿真软件对电抗器的故障进行仿真,得到含有电抗器故障暂态过程的分布式电流数据,最终通过遍历不同的参数取值可得到5043条数据样本,包含2952条短路故障和2091条断路故障的暂态过程数据,暂态过程数据包括三个工频周期的正常运行数据和两个工频周期的故障后准稳态数据。每条数据的采样频率为1000Hz,时间窗口长度为100。在数据划分时,选取的训练窗口长度为40(两个工频周期),设定非故障和故障混合的数据中故障时长占训练窗口时长比例大于P定义为“有故障”,小于P定义为“无故障”。

具体而言,含有80个点的暂态过程数据,故障开始点为第40个点(对应时间为t,单位ms),则第零点时间为t-40,第80点的时间为t+40,当故障时长占训练时间窗口比例P设为20%时,两个工频周期数据中,故障数据时长8ms,正常数据时长32ms,即窗口时间可表示为[t-32,t+8]。起始时间低于t-32的窗口数据均为“无故障”,起始时间晚于t-32的窗口数据为“有故障”。由此可得到302580条数据。随机将80%的数据分入训练数据集(242064个样本),剩余的20%则分入测试数据集(60516个样本)。

绘制CNN模型在在线监测场景下对故障类型识别的结果。由于故障起始时间为20ms,且训练数据中设定故障时长占比为P>12.5%的为故障数据。因此在检测到故障之前,每个样本的输出结果均为“无故障”。为清楚地展示每个信号样本的输出结果,在图中将各个样本的结果随机地上移或下移了一定的距离。

在对模型的输出进行后处理后,各种类型故障对应的样本均可得到稳定的故障选相结果,且结果在故障发生后基本不发生变化,尤其是在训练样本不覆盖的30ms至60ms时间范围内也没有观察到选相错误。所有故障类型的故障检测时间基本上在10ms以内。考虑到在模型的实现中将包含故障后波形比例低于12.5%(对应5ms)的信号段归入“无故障”类别,这样的响应速度是较为迅速的。另外,观察到在22.5~27.5ms的时间范围内会存在误判的情况,但在5ms后其判定基本稳定,因此可在在线监测场景下设置当模型连续3次判断到故障时则最终判定故障。以此,也能在故障发生后的10ms(半个工频周期)内将故障识别出来。

猜你喜欢

电抗器分类器准确率
学贯中西(6):阐述ML分类器的工作流程
电容器组串联电抗器烧毁的原因分析与处理方法探讨
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
基于朴素Bayes组合的简易集成分类器①
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
6Kv串联电抗器的应用
基于特征选择的SVM选择性集成学习方法
基于差异性测度的遥感自适应分类器选择