APP下载

基于卷积神经网络的高压电缆局部放电模式识别

2018-05-16王干军彭小圣文劲宇陈清江杨光垚李朝晖

电力自动化设备 2018年5期
关键词:网络层池化模式识别

杨 帆,王干军,彭小圣,文劲宇,陈清江,杨光垚,李朝晖

(1. 华中科技大学 电气与电子工程学院 强电磁工程与新技术国家重点实验室,湖北 武汉 430074;2. 广东电网公司中山供电局,广东 中山 528400)

0 引言

高压电缆是电力系统重要的电力设备,其运行状态影响着电网供电的安全性与可靠性[1]。然而由于设计缺陷、安装过程中的工艺缺陷、外力破坏、水树入侵等因素,电缆系统中不可避免地会产生绝缘缺陷[1-2]。局部放电PD(Partial Discharge)既是绝缘劣化的主要原因,又是电缆绝缘缺陷和绝缘老化的重要表征[2]。电缆绝缘缺陷形式多样,不同缺陷类型引发的PD具有不同的表现形式,对设备安全运行的影响以及绝缘的危害程度也不同[3-4]。准确识别出电缆PD类型进而判断绝缘缺陷类型有着十分重要的意义。利用电缆不同绝缘缺陷下PD产生机理存在的差异性,通过对PD信号进行检测和特征分析,可以识别绝缘缺陷类型,评估电缆的绝缘状态,及时发现故障征兆,实现故障预警,为制定合理的检修计划提供科学依据[5-6]。

不同类型的电缆绝缘缺陷诱发的PD信号具有一定的差异性,但是部分绝缘缺陷类型之间具有很高的相似度,这给电缆PD模式识别带来了很大挑战。电缆PD模式识别方面已有大量的研究成果,其中以反向传播神经网络(BPNN)和支持向量机(SVM)的应用较为广泛[7-10]。传统BPNN由于网络层数限制,对大规模样本的学习能力有限,在深层次特征提取方面存在不足[7-8]。SVM也因核函数受Mercer条件限制、规则化参数选取困难以及当识别对象类型多时计算复杂等特点,而在实际应用中具有一定的局限性[9-10]。

近年来深度学习理论引领了人工智能的前沿,以卷积神经网络(CNN)为典型代表的深度学习算法在语音识别、图像识别等诸多领域取得了很高的识别精度,并在电力行业也引起了研究人员的广泛关注[11]。深度神经网络在敏感性与鲁棒性特征提取与构建方面表现优异,能从海量数据中自动学习特征信息,为电缆PD模式识别带来了新的契机。

本文提出了基于CNN的高压电缆PD模式识别方法,首先在实验室环境下模拟了5种电缆绝缘缺陷类型,通过加压测试获取了大量PD实验数据,然后提取PD瞬时脉冲,并构建了34个特征参数,最后利用CNN实现缺陷类型的识别。为证明所提方法的有效性,本文分别研究了不同网络层数、不同激活函数以及不同池化方式对CNN性能的影响,并在电缆绝缘缺陷识别效果方面将CNN与传统的浅层分类器SVM和BPNN进行了比较,结果表明CNN在识别精度和识别速度上都具有一定的优势,优于传统的BPNN和SVM模式识别方法。

1 实验数据获取与特征构建

1.1 乙丙橡胶电缆与人工缺陷

实验选取实际电力系统中应用的11kV乙丙橡胶EPR(Ethylene Propylene Rubber)电缆进行PD测试。EPR电缆由铝芯、内半导电层、EPR层、外半导电层、屏蔽铜带、铝铠甲层及聚氯乙烯PVC(PolyVinyl Chloride)护套构成,如图1所示。实验采用无缺陷电缆构建5种典型的电缆绝缘缺陷[12-13]如图2所示,图中,各数据单位为mm。

图1 EPR电缆样品示意图Fig.1 Schematic diagram of EPR cable sample

图2 5种典型的电缆绝缘缺陷Fig.2 Five kinds of typical cable insulation defects

a. 电缆绝缘缺陷类型1:绝缘层空穴,直径0.4mm,深2mm。通过以下方法得到:使用直径0.4mm的钻头从外壁向电缆本体钻孔,在主绝缘产生圆柱形空穴,然后将铜带固定在空穴上,与PVC护套接触,用以密封缺陷。

b. 电缆绝缘缺陷类型2:外半导体尖刺缺陷,直径0.4mm,深2mm,通过将印刷电路板钻头插入电缆中得到。

c. 电缆绝缘缺陷类型3:外半导体非接触性尖刺缺陷,直径0.4mm,深2mm,通过将印刷电路板钻头插入电缆中得到。电缆绝缘缺陷类型3与电缆绝缘缺陷类型2的区别在于,电缆绝缘缺陷类型2中尖刺与外导体及PVC护套接触,而缺陷类型3中的尖刺则不与外导体及PVC护套接触。

d. 电缆绝缘缺陷类型4:电缆外护套破损,通过在电缆护套上切下面积为7mm×7mm的区域得到。

e. 电缆绝缘缺陷类型5:电缆端部沿面放电,通过将电缆样品屏蔽铜带的一部分暴露并接地得到。

1.2 实验建立与数据获取

采用结合高频电流互感器HFCT(High Frequency Current Transformer)和IEC60270的实验系统进行PD测试[12-13],实验系统的连接示意图见图3。图中,电压探头用于获取50Hz相位信息并作为PD数据采集的触发装置,宽带放大器用于将HFCT耦合到的信号调整到示波器输入范围(±10V)内,示波器以100MS/s(S/s为采样点/s)的采样率采集原始数据。

图3 实验系统原理图Fig.3 Principle diagram of experiment system

EPR电缆样品的长度为1.5~2m,每根电缆设置图2所示的5种缺陷之一,然后连接到实验系统进行PD测试。采样时间长度设置为20ms,即50Hz工频周期。

实验电压从0开始以1kV的步长增加到PD起始电压,直至超过预先设定的最大电压。对于电缆绝缘缺陷类型1、4和5,最大电压为电缆额定电压,即11kV。对于缺陷类型2和3,最大电压分别为13kV和12kV。表1列出了每次PD测试的电压水平和获取的相应原始数据的数目。

表1 每种电缆绝缘缺陷的PD测试电压和原始数据数目Table 1 PD testing voltage and number of original data for each cable insulation defect type

基于PD测试原始数据提取PD瞬时脉冲,获得了5种电缆绝缘缺陷对应的PD瞬时脉冲样本,并对每种缺陷类型各挑选了700个样本用于后续的PD模式识别研究。5种类型缺陷的PD相位谱图如图4所示。从图4可以看出,电缆绝缘缺陷类型2和3对应PD信号的混叠程度相对较大。而结合1.1节中人工缺陷的构造可知,电缆绝缘缺陷类型2和3的区别为尖刺是否与外导体及PVC护套接触,差别较小,因而诱发的局放信号区分度较低。

图4 HFCT耦合的5种PD信号的相位图谱Fig.4 Phase diagram of five types of PD signals detected by HFCT

1.3 特征构建

特征构建是开展模式识别的基础。本文基于1.2节得到的3500组PD瞬时脉冲信号,从频率、幅值、相位图谱方面考虑并参考其他文献中广泛使用的特征,构建了34个PD脉冲的特征参数如下。

a. 幅值特征:放电量、峰值电压、平均电压、均方根值、标准差。

b. 频率特征:脉冲宽度、上升时间、下降时间、等效时间长度[12-13]、等效宽度[12-13]、主频、小波特征参数(ED1—ED5,EA5,Ea1—Ea5,Ed1—Ed5)。其中,小波特征参数获取方法为:使用小波变换对信号进行5层分解,根据小波系数构造信号的小波特征参数。ED1—ED5为分解后5层信号的细节能量比参数,Ea1—Ea5为分解后5层信号的全局能量比参数,Ed1—Ed5为分解后5层信号的细节能量参数,EA5为全局的能量比参数。

c. 相位图谱特征:相位角。

d. 其他特征:脉冲极性、偏度、峰度、波峰因数、形状因子、PD位置。

包括单位和示例在内的PD脉冲的特征参数的详细信息如表2所示。

2 CNN

CNN是受生物视觉系统结构的启发提出,能够学习和识别视觉图像中的特定特征和模式[11,14]。20世纪60年代,Hubel等发现视觉信息从视网膜传递到大脑进行处理由多层次的感受野激发完成[14]。1980年Fukushima第一次提出基于感受野思想的自组织多层神经网络模型Neocognitron[14]。1998年LeCun等提出采用基于梯度的反向传播算法进行有监督训练的CNN—LeNet-5[15]。2012年Krizhevsky等提出的AlexNet在ImageNet图像分类竞赛中夺冠,使得以CNN为代表的深度学习成为学术界关注的焦点[16-17]。CNN由于出色的特征提取能力已经被广泛的应用在图像识别、语音识别等领域。

2.1 典型CNN架构

典型CNN结构见图5,其由输入层、1个或多个交替连接的卷积层和池化层、全连接层以及输出层组成[11]。CNN的输入为二维数据矩阵,即原始图像。

表2 PD特征Table 2 PD features

卷积层可直接从二维图像中提取特征并形成特征图,多个卷积层间穿插池化层能够减小特征图大小并逐渐建立更高程度的空间和结构不变性。经过多个卷积层和池化层的交替传递,全连接层使用所提取的特征进行预测。最后由输出层给出识别结果。CNN本质上是使原始输入经过多个层次的数据变换与降维而映射到一个新的特征表达的数学模型[14]。

图5 CNN结构Fig.5 Structure of CNN

a. 卷积层。

卷积层的卷积核完成感受野的功能,可以将低层的局部区域信息通过卷积核激发到更高层次。前一层的输入特征图与可学习的卷积核进行卷积运算,卷积后的数据经激活函数作用后得到该层的输出特征图。

b. 非线性激活函数层。

激活函数用来在网络中加入非线性,对CNN性能有着重要影响。典型的非线性激活函数有双曲正切函数(tanh)、Sigmoid函数和ReLU函数等[17]。

Google Brain团队提出了一种新型自门控激活函数Swish,其具备无上界有下界、平滑且非单调的特性[18]。Google Brain团队指出,Swish在深度学习模型上的性能优于ReLU函数,训练Swish网络时使用稍低于ReLU网络的学习率可取得更好效果[18]。

c. 池化层。

原始输入特征图包含的特征数目较多,直接使用从卷积层得到的所有特征可能会使计算开销过大。池化操作对池化窗口内的特征进行聚合统计,能减小特征图尺寸,实现数据降维。不同池化方法的效果存在差异。目前2种主流的池化方式为最大池化和平均池化。最大池化选取池化窗口内的最大值形成输出特征,是现阶段应用最广泛的池化方式,平均池化函数则是在池化窗口内取输入的平均值。

d. 全连接层。

在CNN架构的最后通常设置一个全连接层。该层网络使用卷积层和池化层的输出特征进行预测和分类。

2.2 训练方法

CNN一般使用梯度下降法进行有监督训练。CNN中所有滤波器的权重都通过训练过程进行迭代更新以使损失函数最小化。标准梯度下降法在整个训练数据集上更新权重,计算开销太大。小批量随机梯度下降算法通过小批量训练样本集上的平均梯度来更新权重,可以有效减小计算代价[18]。

3 基于CNN的PD模式识别

基于CNN的PD模式识别流程如图6所示。首先开展5种电缆绝缘缺陷的测试实验并收集原始数据,进行数据去噪和PD脉冲提取,构建34个PD特征参数得到PD特征数据集。然后将特征数据集分为训练集和测试集(两者所占比重分别为85%和15%),通过在训练集上使用小批量随机梯度下降算法以最小化模型预测输出和实际输出之间的误差来训练优化CNN,通过测试集来评估基于CNN的PD模式识别性能。

图6 基于CNN的PD模式识别流程Fig.6 Flowchart of PD pattern recognition based on CNN

4 结果与评估

本节对CNN的分类性能进行评估,研究了不同网络层数、不同激活函数和不同池化方式对PD模式识别效果的影响,并与浅层分类器BPNN和SVM进行了比较。所使用的计算机配置为:Windows 7操作系统,Intel i5-4200M CPU,12G内存。

4.1 不同网络层数CNN的比较

研究表明,CNN分类性能与网络层数有较大相关性[19]。本文分别测试了1层、2层、3层、4层、6层和9层CNN的性能,使用的池化方式为最大池化,激活函数采用ReLU函数,每层的卷积核数目均为32,卷积核大小均为3×3,测试结果见表3和图7。

表3 不同层数CNN的识别精度Table 3 Recognition accuracy of CNN with different layers

图7 不同网络层数的CNN的PD模式识别误差对比Fig.7 Comparison of PD pattern recognition error among CNN with different layers

当网络层数减少时,CNN对样本数据的拟合能力会降低;当网络层数增加时,CNN的学习能力增强,但所需训练的参数会增多,对样本数据量的需求也会相应增大,对于小样本数据会产生过拟合的风险[18-19]。而本文有3500个样本,数量较少,对应的最佳网络层数也应该较少。由图7可知,2层CNN效果最好,不同迭代轮次的误差率均低于其他网络层数的CNN,并且当步数达到40时,模型误差率降低到10.03%。

4.2 采用不同激活函数的CNN的比较

不同类型的激活函数对识别效果会产生较大的影响[18]。基于前文设计的2层CNN,本文比较了Swish函数的ReLU函数的性能,结果如图8所示。

图8 不同池化方式和激活函数CNN识别误差对比Fig.8 Comparison of recognition error among CNN withdifferent pooling modes and activation functions

Swish函数无上界有下界、平滑且非单调的特点使其收敛性能好于ReLU函数。由图8可见,使用Swish函数的CNN在不同迭代轮次的误差均小于使用ReLU函数的CNN;在迭代至40轮的时候,采用Swish函数的识别精度比使用ReLU函数高0.7%。

4.3 采用不同池化方式的CNN的比较

基于Swish函数的2层CNN,本文还比较了最大池化和平均池化方式的性能,结果见图8。由图8可见,最大池化方式由于能够提取最有表征能力的特征,相比平均池化方式具有更好的识别精度。

4.4 CNN识别混淆矩阵

根据前文分析,本文最终使用的CNN架构包含2个卷积层和2个池化层,采用最大池化方式和Swish激活函数,每个卷积层的卷积核数目为32,卷积核大小为3×3。CNN模式识别的混淆矩阵见表4。

表4 CNN识别混淆矩阵Table 4 Confusion matrix of CNN recognition

由表4可知,电缆绝缘缺陷类型2和3是PD模式识别误差的主要来源,这2种类型的识别结果之间存在较大程度的混淆。电缆绝缘缺陷类型3的样本有17.40%被误识别为电缆绝缘缺陷类型2,电缆绝缘缺陷类型2的样本则有18.21%被误识别为电缆绝缘类型3,这在很大程度上降低了总体识别率。5种电缆绝缘缺陷类型中,电缆绝缘缺陷类型4和5与其他3种类型的表现形式差异最大,识别精度也最高,分别达到了99.07%和99.15%,这印证了1.3节中关于PD相位谱图的分析。

4.5 与传统浅层分类器的比较

本文比较了CNN与BPNN和SVM的性能,结果如表5和图9所示。

从表5可知:3种方法中CNN的总体精度最高,达到了90.67%;SVM其次,总体精度为86.96%;BPNN最差,总体精度为86.61%;CNN方法的总体精度分别比BPNN和SVM高4.06%和3.71%。

表5 CNN、BPNN和SVM的识别精度对比Table 5 Comparison of recognition accuracy among CNN,BPNN and SVM

图9 CNN、BPNN和SVM的识别误差对比Fig.9 Comparison of recognition error among CNN,BPNN and SVM

由于电缆绝缘缺陷类型1、4、5的差异较为明显,比较容易识别,CNN对三者的识别精度分别为95.37%、99.07%和99.15%,与BPNN和SVM方法相同。而电缆绝缘缺陷类型2和3的相似度较高,识别难度较大。CNN特殊的网络结构能够对数据特征进行深入挖掘,可以较好地捕捉细节信息并学习到更全面、更抽象的特征。CNN对电缆绝缘缺陷类型2的识别精度为80.86%,相比BPNN和SVM分别提高了3.55%和14.20%;CNN对电缆绝缘缺陷类型3的识别精度为78.90%,相比BPNN和SVM分别提高了16.51%和5.20%。

5 结论

本文将CNN应用于5种高压电缆缺陷类型的模式识别,研究了不同网络层数、不同激活函数和不同池化方式下CNN的性能,并与传统方法的识别效果进行了比较,得到的结论如下:

a. 网络层数、激活函数、池化方式、迭代轮数对CNN的识别精度具有较大的影响,在CNN构建时,应该充分考虑这些因素;

b. 采用Swish函数的情况下,CNN的识别精度比采用ReLU函数的情况高0.70%,Swish函数无上界有下界、平滑且非单调的特点使其收敛性能好于ReLU;

c. CNN中的卷积层和池化层具有优异的特征学习能力,可以捕捉到数据的细节特征,信息丢失少,对高相似度缺陷识别能力强、鲁棒性好,对于相似度较高的电缆绝缘缺陷类型2和3的识别精度,相比SVM分别提高了14.20%和5.20%,相比BPNN分别提高了3.55%和16.51%;

d. CNN能更全面地捕捉到输入数据表现的高阶相关性,在顶层形成更具表征能力的高维抽象特征向量,相比传统浅层分类器BPNN和SVM,总体识别精度分别提高了4.06%和3.71%。

参考文献:

[1] WANG X,WANG C C,WU K,et al. An improved optimal design scheme for high voltage cable accessories[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2014,21(1):5-15.

[2] 王德文,刘晓建. 基于MapReduce的电力设备并行故障诊断方法[J]. 电力自动化设备,2014,34(10):116-120.

WANG Dewen,LIU Xiaojian. Parallel fault diagnosis based on Map-Reduce for electric power equipments[J]. Electric Power Automation Equipment,2014,34(10):116-120.

[3] International Electrotechnical Commission. High-voltage test techniques:partial discharge measurements:IEC60270[S]. Geneva,Switzerland:International Electrotechnical Commission,2015.

[4] 孙文星,李朝晖,程时杰,等. 一种发电机故障放电信号特征实时在线自动识别方法及其应用[J]. 电网技术,2015,39(2):543-549.

SUN Wenxing,LI Zhaohui,CHENG Shijie,et al. A real time on-line method for automatic signal feature recognition of fault discharge in generator and its application[J]. Power System Technology,2015,39(2):543-549.

[5] 魏振,齐波,左健,等. 基于局部放电图像特征的换流变压器油纸绝缘缺陷诊断方法[J]. 电网技术,2015,39(4):1160-1166.

WEI Zhen,QI Bo,ZUO Jian,et al. A method to diagnose defects in oil-paper insulation of converter transformer based on image feature of partial discharge[J]. Power System Technology,2015,39(4):1160-1166.

[6] 常文治,李成榕,苏錡,等. 电缆接头尖刺缺陷局部放电发展过程的研究[J]. 中国电机工程学报,2013,33(7):192-201,S25.

CHANG Wenzhi,LI Chengrong,SU Qi,et al. Study on development of partial discharges at the defect caused by a needle damage to a cable joint[J]. Proceedings of the CSEE,2013,33(7):192-201,S25.

[7] SCHAIK N V,CZASZEJKO T. Conditions of discharge-free operation of XLPE insulated power cable systems[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2008,15(4):1120-1130.

[8] WU M,CAO H,CAO J,et al. An overview of state-of-the-art partial discharge analysis techniques for condition monitoring[J]. IEEE Electrical Insulation Magazine,2015,31(6):22-35.

[9] 尹金良,朱永利,俞国勤,等. 相关向量机及其在变压器故障诊断中的应用[J]. 电力自动化设备,2012,32(8):130-134.

YIN Jinliang,ZHU Yongli,YU Guoqin,et al. Relevance vector machine and its application in transformer fault diagnosis[J]. Electric Power Automation Equipment,2012,32(8):130-134.

[10] 张哲,赵文清,朱永利. 基于支持向量机的电力变压器状态评估[J]. 电力自动化设备,2010,30(4):81-84.

ZHANG Zhe,ZHAO Wenqing,ZHU Yongli. Power transformer condition evaluation based on support vector machine[J]. Electric Power Automation Equipment,2010,30(4):81-84.

[11] LECUN Y,BENGIO Y,HINTON G. Deep learning[J]. Nature,2015,521(7553):436-444.

[12] PENG X,WEN J,LI Z,et al. SDMF based interference rejection and PD interpretation for simulated defects in HV cable diagnostics[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2017,24(1):83-91.

[13] PENG X,WEN J,LI Z,et al. Rough set theory applied to pattern recognition of partial discharge in noise affected cable data[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2017,24(1):147-156.

[14] LEE Y P. Multidimensional Hebbian learning with temporal coding in neocognitron visual recognition[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2017,47(12):3386-3396.

[15] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE,1998,86(11):2278-2324.

[16] DONG C,LOY C C,HE K,et al. Image super-resolution using deep convolutional networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(2):295-307.

[17] SZEGEDY C,VANHOUCKE V,IOFFE S,et al. Rethinking the inception architecture for computer vision[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas,NV,USA:IEEE,2016:2818-2826.

[18] ELFWING S,UCHIBE E,DOYA K. Sigmoid-weighted linear units for neural network function approximation in reinforcement learning[J/OL].(2017-12-12)[2018-01-11]. https:∥doi.org/10.1016/j.neunet.2017.12.012.

[19] ZEILER M D,FERGUS R. Visualizing and understanding convolutional networks[C]∥European Conference on Computer vision. Cham,Switzerland:Springer,2014:818-833.

猜你喜欢

网络层池化模式识别
基于Sobel算子的池化算法设计
卷积神经网络中的自适应加权池化
设施蔬菜病害识别中的CNN池化选择
基于卷积神经网络和池化算法的表情识别研究
论物联网安全威胁及其应对策略
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
物联网技术在信息机房制冷系统中的应用
第3届亚洲模式识别会议
电气设备的故障诊断与模式识别