基于自编码网络的局部放电信号特征提取与识别

2021-06-16李玉杰田阳普赵科刘成宝王林杰毛恒

电力工程技术 2021年3期

李玉杰,田阳普,赵科,刘成宝,王林杰,毛恒

(1. 国家电网有限公司GIS设备运维检修技术实验室(国网江苏省电力有限公司电力科学研究院),江苏南京 211103；2. 红相股份有限公司,福建厦门 361005；3. 国网江苏省电力有限公司检修分公司,江苏南京 211102)

0 引言

气体绝缘金属封闭开关设备(gas insulated switchgear,GIS)因体积小、运行稳定以及电磁污染低等优点应用广泛[1]。在设计、运输、制造及长期运行过程中,GIS内部往往会出现各种绝缘缺陷,继而诱发设备绝缘故障[2]。局部放电是各种潜伏性绝缘故障的重要特征[3—4],不同的局部放电类型对设备的损坏程度各异,及时有效地监测、识别局部放电,对设备故障预警及运行稳定性提升具有重要意义[5]。

GIS发生局部放电时,会向外界辐射超高频(ultra-high frequency,UHF)信号[6]。UHF信号分析及特征提取广泛运用于GIS绝缘状况实时监测[7]。采用原始放电信号进行局部放电模式识别具有放电信息保留完整、数据处理量小、速度快以及采集设备经济等优点。目前大多局部放电模式识别均采用UHF原始信号作为数据源,通过人工特征设计获得局部放电的典型特征。

原始放电信号的可用特征主要包括脉冲宽度、信号方差和信号均值等,其根据专家自身知识领域进行设计,主观性较强且不确定性较大,无法充分体现局部放电模式的有效特征[7]。同时,依靠人工设计难以充分挖掘数据内部更深层次的联系,所提取的特征往往是数据的浅层表达,因此基于人工特征衍生的相关局部放电识别算法,精度和泛化能力均较差[8]。

针对上述问题,文中提出将深度学习领域广泛使用的卷积神经网络及其扩展自编码网络技术引入局部放电模式识别领域。自适应提取特征可代替人工设计特征[9],实现对原始局部放电信号更深层次的数据挖掘[10]。实验表明,基于文中方法提取的特征相较人工特征具有更高的辨识度,可有效识别GIS局部放电模式。

1 基于自编码网络的局部放电特征提取与模式识别

1.1 数据采集

由于获取大批量实际条件下的局部放电数据极为困难,文中研究主要围绕仿真数据开展。依托自主研发的数据采集平台,模拟GIS实际运行的复杂环境及物理仿真局部放电现象,并采集相关数据。数据采集平台的主要技术参数及电路分别如表1、图1所示。

表1 数据采集平台参数Table 1 Parameters of data acquisition platform

图1 数据采集平台电路示意Fig.1 Schematic diagram of data acquisition platform circuit

1.1.1 数据采集流程

将UHF传感器用橡皮筋固定在盆式绝缘子的浇注孔位置。依次连接传感器、调理模块、高速采样示波器,利用网线建立示波器与控制软件间的通信。使用50 pC的校准方波对放电模拟装置进行校准。将被测典型缺陷模型旋入指定位置,并保证检测设备及本体壳体可靠接地。设定采样参数、通道参数、信号调理参数。调节信号调理模块增益至指定档位,将GIS升压至典型缺陷模型起始放电电压,通过控制软件启动信号采集。4种典型局部放电(尖端放电、颗粒放电、气隙放电、悬浮放电)缺陷模型如图2所示。

图2 4种局部放电缺陷模型Fig.2 Four types of partial discharge defect models

1.1.2 数据预处理

采集上述4种局部放电的UHF原始数据,此外,对采集数据引入多种类型的噪声,如手机通话、机器设备噪声等进行数据增扩,保证数据的多样性。

由于单个原始放电信号受检测传感器参数、位置以及是否有遮挡物影响较大,文中将包含40个脉冲的时域信号作为特征提取单元。同时为了减少数据量,突出时域信号的主要成分,对原始时域信号进行预处理。假设时域信号长度为L,对每个脉冲时域信号进行开窗操作设置的窗口大小为N,设置大小为L/N的滑动窗口。取窗内时域信号的幅值最大点,最终获得大小为40×N的数据样本。通过一系列比较实验,设置N为500。

1.2 基于自编码网络的局部放电模式识别

1.2.1 自编码网络基础

自编码网络是一种针对输入数据高效编码的神经网络[11]。给定一个神经网络,假设其输入与输出相同,对网络进行训练并调整其参数,即可得到每一层的权重以及输入数据的不同表示(每一层代表一种表示),这些表示即为网络提取到的特征量。自编码网络的目的是尽可能地复现输入信号,因此必须捕捉最能代表数据特征的成分,实现输入数据最本质特征的提取。自编码网络基本结构见图3。

图3 自编码网络基本结构Fig.3 Basic struction of auto-encoder network

研究表明,局部放电信号的时域波形特征与绝缘缺陷的性质存在相关性,不同类型缺陷激发的放电信号典型特征各异[12],表明局部放电原始信号中存在有待学习的隐含模式。文中所提识别方法运用自编码网络在足够多的数据条件下学习此模式,并将其中隐含的特征提取出来。

1.2.2 网络结构设计

针对4种局部放电模式识别的实际问题,文中所提基于自编码网络的局部放电类型识别网络结构示意如图4所示。

图4 基于自编码网络的局部放电类型识别网络结构示意Fig.4 Schematic diagram of partial discharge pattern recognition network structure based on auto-encoder network

自编码网络由编码网络与解码网络构成,编码网络完成输入数据的非线性映射输出特征图,解码网络主要利用这些特征图重构输入数据。因此可认为编码网络生成的特征图有效保存了输入数据的主要成分。提取编码网络的输入,将其作为辨识特征输入分类器进行训练,即可获得分类结果。值得注意的是,文中仅仅将自编码网络作为特征提取器使用,所提取特征可供各种形式分类器使用,因此分类器的选择不再局限于深度学习方法。传统的经典机器学习分类器如支持向量机(support vector machine,SVM)、随机森林算法等都可与其进行衔接。通过上述方法既可充分发挥自编码网络的特征提取能力,又可将传统机器学习方法与深度学习方法有机结合,有效提升文中所提识别方法的灵活性。

1.2.3 局部放电模式识别

基于自编码网络的局部放电模式识别,具体结构及参数如图5所示。编码网络对输入信号进行特征提取以及维度压缩,解码网络负责重构原始信号,分类器网络利用编码网络提取的特征进行任务分类。

图5 基于自编码网络的局部放电模式识别具体结构及参数Fig.5 The detailed structure and parameters of partial discharge pattern recognition based on auto-encoder network

基于自编码网络的局部放电模式识别,各个部分结构如下。

(1) 输入层。输入数据为40×500的一维数据。

(2) 编码网络。编码网络由3层卷积层与2层最大值池化层交替构成。通过卷积层对输入数据进行特征提取,然后利用最大值池化层对卷积层提取的特征进行压缩,实现特征降维。

(3) 解码网络。解码网络由2层卷积层与2层反卷积层交替构成。对编码网络提取的特征进行解码处理,再利用反卷积层映射并扩大输出特征图尺寸,重构输入信号。

(4) 激活函数。网络卷积层与反卷积层之后均采用激活函数LeakyReLU。LeakyReLU函数是ReLU函数的改进版本,解决了训练过程中部分输入落到硬饱和区导致对应权重无法更新的问题。

(5) 全局平均池化层。为了降低编码网络输出的特征维度,文中在编码网络的输出后接“卷积层+全局平均池化层”结构,通过全局平均池化层将编码网络输出的特征图进行图层面的平均池化。每一张特征图对应一个特征点,最后这些特征点组合成特征向量,因此对于不同尺寸的输入信号,网络提取的特征维度固定(128维)。

以下对训练流程以及参数设置进行介绍。基于自编码网络的局部放电模式识别训练过程分为两阶段。第一阶段为训练自编码网络阶段,即重构原始信号,保存网络参数。第二阶段为训练分类器网络阶段,即在训练好的编码网络后接一层卷积层和全局平均池化层,并与分类网络相连,再次训练,保持编码网络的参数不变,只更新新添卷积层与分类网络的参数,训练完成后移除分类器。因此最终全局平均池化层的输出即为自编码网络提取特征量,可以供给各分类器进行分类。训练阶段的参数设置如表2所示。

表2 训练阶段参数设置Table 2 Parameter setting during training phase

2 实验结果与分析

基于物理仿真数据,导入自编码模型,将原始放电信号转换为128维向量作为该信号的辨识特征。同时文中选取11组基于局部放电原始信号提取的人工特征进行比较实验[13]。表3为2种特征采用SVM以及随机森林算法分类器的识别准确率对比。

表3 局部放电识别准确率对比Table 3 Comparison of partial discharge recognition accuracy %

针对同一分类器,文中方法提取的特征相较人

工特征均获得了更高的识别准确率,侧面表明了自编码网络可以提取比人工特征更高辨识度的特征。同时,当输入特征均来源于自编码网络时,2种分类器对于不同局部放电类型的识别水平存在较大差异,SVM对颗粒放电、气隙放电表现出更为良好的分类性能,而随机森林则对尖端放电、气隙放电有着较好的识别能力。但每种分类器无论使用哪种特征,对于悬浮放电的识别准确率均处于较低水平。相较人工特征,文中方法提取的特征仍有效提升了悬浮放电识别水平。

图6为人工特征与自编码网络提取特征通过t-SNE聚类可视化的结果,t-SNE是一种广泛使用的数据降维方法[14]。与主成分分析方法(principal component analysis,PCA)[15]相比, 其保留的数据属性信息更具代表性,可更好地反映样本之间的差异。

图6 局部放电可视化特征Fig.6 Visualization features of partial discharges

由图6可知,基于自编码网络提取的特征聚类效果更佳,该特征具有比人工特征更高的质量,可以更好地表征不同类别的局部放电。

3 结语

针对GIS局部放电原始信号的模式识别问题,文中构建了基于自编码技术的卷积神经网络,自动提取原始波形信号的辨识特征。相较于传统方法,文中方法摒弃了繁琐的人工特征提取工作,特征的提取来源于神经网络的自动学习,不依赖专家经验,可以捕捉到数据更深层次的本质特征,具有更强的表达能力。此外,文中进一步将这些特征作为经典分类器的输入,实现了深度学习方法与传统机器学习方法的有效结合。实验表明,在使用相同分类器时,文中方法提取的特征可以获得比人工特征更高的分类准确率,具有优越的局部放电模式识别能力。