基于CNN_LSTM模型的复杂支路故障电弧检测*
2022-05-19余琼芳
余琼芳,徐 静,杨 艺
(1.河南理工大学 电气工程与自动化学院,河南 焦作 454003;2.大连理工大学 北京研究院博士后科研工作站,北京 100000)
0 引言
故障电弧是引发电气火灾的主要原因,是由电极间绝缘介质被击穿所导致的气体游离放电现象,并产生巨大的弧光和热量[1]。在低压供配电系统中,由于线路材料绝缘老化、虚连,电力设备接触松动、质量不合格等原因时常发生故障电弧[2]。
串联型电弧故障发生时,相当于1个阻抗,导致线路回路的实际电流略小于正常电流而无法使用断路器动作。串联故障电弧的发生是隐蔽、突发的,且一旦发生极易引发灾难。现阶段的检测分3类:1)基于电弧数学模型的研究,有Mary模型和Cassie模型,但由于参数量大、应用条件等限制难以在实际情况中使用;2)在故障电弧发生的位置安装传感器来检测弧光弧声,但电弧发生的时间和位置都是随机的,而难以实现[3];3)基于电弧电压电流波形的特征检测是目前研究最多的检测方法,可分为3类:1)通过故障电弧电流的时域、频域或时频域特征进行检测,涉及傅里叶变换、小波分解、支持向量机等复杂运算,文献[4]提出了1种基于小波包变换与高阶累积量相结合的电弧故障识别方法,文献[5]对电流数据进行快速傅里叶变换,从频谱分析结果中提取3个特征值作为判断依据;2)使用机器学习等智能算法,将电流信号直接作为检测对象输入到神经网络中,由网络自主挖掘隐含在电流数据背后的特征,文献[6]直接将采集到的电流数据输入到改进的AlexNet卷积神经网络中检测串联故障电弧,文献[7]采用滑窗法对输入到自组织特征映射网络的电流数据进行连续检测;3)先通过信号分析工具提取电流数据特征,然后通过神经网络模型进行电弧检测,文献[8]利用全相位傅里叶变换提取电流数据的频谱特征量,再输入到Logistic回归深度学习模型中进行分类训练,文献[9]用EMD对电流数据进行时频分解后,再通过PNN模型进行故障识别,文献[10]对电流数据进行小波分解后,送往AlexNet网络中进行学习并输出检测结果。
目前,大量的检测方法能较好地实现单个负载回路发生串联故障电弧的检测。然而在实际低压配电系统中,电路网络结构复杂、负载混联。当某1条支路发生电弧故障时,故障特征容易被干路电流“淹没”而造成漏判而难以区分出故障情况。在区分出故障的基础上,再区分出是哪类负载所在支路发生的,则能更及时地排除故障支路。本文提出1种CNN和LSTM结合的复杂支路串联故障电弧检测方法,各支路上发生电弧故障时通过采集干路电流信号直接作为模型输入,通过CNN层进行故障特征信息提取,LSTM层学习故障特征,最终实现故障分类。
1 电流信号采集分析
1.1 电弧故障实验平台
根据国家标准《电弧故障保护电器(Arc Fault Detection Devices,AFDD)的一般要求》(GB/T 31143—2014),搭建实验数据采集平台如图1[11]。采用单相交流220 V/50 Hz电源供电,以4 mm铜线作为电路连接线,以100W1P电阻作为采样电阻,示波器使用TiePieSCOPE HS801五合一虚拟综合测试仪。干路上有总开关K和QF,来控制总电源。通过各支路上的开关Kn控制几个支路同时工作,与故障位置并联的开关Sn模拟故障是否发生。
图1 实验原理
电弧发生装置有碳化通道式和拉弧式,本文采用拉弧式来获取电弧[12]。装置由6 mm碳棒的静电极、6 mm铜棒的动电极和步进电机组成,如图2所示。2电极从正常闭合位置,在步进电机的驱动下动电极向断开的方向移动。在接触面分离前的一瞬间,I2R能量集中加热在最后1个极小的金属体积,其温度迅速上升而引起爆炸式气化。在间隙充满高温金属蒸气的条件下,触头间形成稳定的电弧。
图2 电弧发生装置示意
1.2 实验方案与数据采集
实验设计单、双、3,4,5,6支路负载实验。实验负载既有小功率用电设备,也有大功率用电设备,包括阻性、感性和非线性负载,负载属性及参数如表1。
表1 各负载及参数
实验包括18组实验,共6大类:每1类实验囊括了3种负载类型,随机搭配以模拟电网末端用电设备的多样化连接。其中1,2,3,4,5,6分别为故障发生的位置,实验方案如表2。进行每1类实验时,只有1支路模拟发生故障,其余支路均正常工作,在干路采集电流。每1类实验正常数据和电弧故障数据各1 200组。
表2 实验方案及负载参数
1.3 数据预处理与波形分析
在采样频率为50 kHz/s下,采集到10 000个采样点的10个周期的电流波形,以DAT格式存储至计算机中。在1个故障波形数据中,当存在8个及以上的半周故障的电弧波形时,即判断该数据为故障数据。在采集故障数据时,由于电弧熄灭引起的电弧畸变不计为故障电弧。
单负载电路结构下的3种类型负载发生故障的电流波形如图3所示。电视是内部含有整流设备的非线性负载,正常工作时的电流是周期性波形,发生电弧故障时,局部信号出现突变,电流波形出现了大量的尖峰脉冲;热水壶是纯阻性负载,发生电弧故障时波形过零点处出现“零休”现象,此时电弧能量最小而自动熄灭,随着电压换向,电弧在1段时间后重燃[13],因其导电系数呈现强非线性特征,在非“零休”时段电流信号中含有高次谐波;空调是感性负载,正常工作时电流是近似正弦波形,发生电弧故障时,过零点出现“零休”现象、其他时段尖峰脉冲增多。
图3 单支路不同负载电流波形
对于不同的电路结构,同一负载支路(以热水壶为例)发生电弧故障的电流波形如图4所示。在单、3、6支路的电路结构中,正常工作时干路电流均是近似的正弦波形,单支路发生故障电弧时波形发生畸变,过零点出现“平肩”现象和尖峰脉冲增多现象。随着电路的结构趋于复杂,电路运行趋于稳定,支路故障受到其他支路负载电流的影响,故障电弧特征削弱。在6支路电路结构中,电流整体变化并不明显,如图4(f)所示,增大了故障识别难度。
图4 不同支路同一负载支路电流波形
2 CNN_LSTM网络模型
CNN_LSTM模型主要由输入层、卷积层、池化层、LSTM层、分类层和输出层组成,如图5所示,图中波形是1个完整的故障电流波形,是一维时间序列,故模型输入为1*10 000的矩阵。将其送入CNN卷积层进行卷积计算,经池化层进行池化操作,然后将特征矩阵输入LSTM层,学习故障特征。最后使用softmax激活函数,对故障特征进行分类,完成故障诊断。该模型不仅保留了输入数据的特征及其相互关系,且保证模型的时序性。
图5 CNN_LSTM网络结构
2.1 CNN特征提取过程
卷积神经网络(CNN)是LeCun等[14]首次提出的1种深度学习模型,用于解决视觉任务。与传统神经网络的非线性复合不同,CNN将输入信号的局部信息与卷积核进行卷积计算提取数据特征。CNN具有局部权值共享、最大池化的特殊结构,降低了网络的复杂性从而减少了计算。本文直接将一维的电流信号作为检测对象送入CNN,所以卷积层使用一维卷积函数,卷积核也作出相应的调整。
CNN卷积层通常包含多个相同维度、大小不同的卷积核,本文选择4个卷积核,即通道数为4。CNN卷积层将一维的电流数据作为输入信号与一维的核进行卷积运算生成特征矩阵,如式(1)所示:
x(n)=wm*i(n)+bm
(1)
式中:i(n)表示电流数据第n个区域,wm和bm分别表示权重和偏置,x(n)表示输出矩阵。
池化层设置在卷积层之后,其目的是继续降低特征矩阵的维度,提高运算速度。池化运算选取max-pooling,池化窗口对特征矩阵从左到右进行扫描,同时选取池化窗口中最大值作为该位置输出,最后得到维数更小的特征矩阵,如图6所示。
图6 最大池化原理
2.2 LSTM基本原理
循环神经网络(RNN)用于解决样本输入是连续的序列,如基于时间序列的问题。长短期记忆网络(LSTM)是Schmidhuber提出的RNN的1种特殊变种[15],被广泛地应用到各个领域,其网络的模型结构如图7所示。不仅能够很好地解决RNN的梯度消失和梯度爆炸的问题,而且能够充分地挖掘时间序列数据的时序性、非线性的关系。
图7 LSTM网络单元结构
LSTM主要由3个门结构来控制数据的流通。
1)遗忘门主要是对上1个神经元传进来的信息进行选择性忘记,如式(2)所示:
ft=σ(wf[ht-1,xt]+bf)
(2)
式中:σ表示sigmoid激活函数,ht-1是前1个神经元的输出;xt是CNN的输出。
2)输入门对新输入信息有选择性地进行记忆,起到控流的作用,如式(3)~(4)所示:
it=σ(wi[ht-1,xt]+bi)
(3)
Ct=ft*Ct-1+it*tanh(wc[ht-1,xt]+bc)
(4)
式中:tanh表示双曲正切激活函数;ct-1是上1个神经元的状态,ct是当前神经元的状态。
3)输出门将决定哪些将会被当成当前状态的输出,控制多少信息提取到隐含状态中,如式(5)所示:
yt=ht=σ(wo[ht-1,xt]+bo)*tanhCt
(5)
式中:yt是当前神经元的输出。
2.3 性能指标
为了衡量网络分类预测的准确性,本文选用准确率作为衡量标准,可以直观地观察到网络性能,2分类混淆矩阵如表3所示。
表3 2分类混淆矩阵
准确率是模型所有分类预测正确的样本占全部样本的比例,如式(6)所示:
(6)
准确率函数虽然可观,但是该函数不可微而无法应用于网络训练,于是提出将损失函数应用于网络来更新网络参数。损失函数计算步骤如下:先对网络全连接层的输出进行softmax处理,即预测出结果属于哪个类别。再对softmax预测的标签向量与实际标签向量做交叉熵,并求平均值即可得到损失函数,计算如式(7)~(8)所示:
(7)
(8)
3 模型优化与实验结果
主机采用intel(R) Core(TM) I7-7700HQ处理器,16.00 GB运行内存。在Ubuntu16.04系统下,利用PycharmCommuntiy 2018.2版软件的tensorflow-gpu配置构建改进的CNN_LSTM模型。
3.1 判别故障的分类结果
将实验数据分为“有弧”加标签1、“无弧”加标签0的数据集,按照5∶1的比例划分训练集和测试集。模型通过实际标签和预测标签值的误差求出残差,再根据链式求导法则,将残差通过求解偏导数逐步向前传递,从而调整权重以及偏置。经过反复测试来调整模型参数,最终确定模型参数如表4。最终发现学习率和epoch分别为0.000 9和2,训练批次为100,dropout为0.5的情况下,训练和测试效果比较好。
表4 模型各层参数说明
以单回路电路的电流数据为例,将6 000个训练样本送入模型中进行训练。模型在迭代120次(2个epoch)后,训练结束,如图8~9所示。随着迭代次数的增加,训练准确率呈整体上升的趋势,训练损失值呈整体下降的趋势。准确率和损失值在迭代60次后基本收敛,最高具有99%的准确率,损失值收敛在0.1左右。
图8 训练准确率变化
图9 训练损失值变化
将单支路1 200个测试样本输入到训练好的模型中进行检测,测试结果总体维持在98.33%左右。将18组实验数据分为正常和故障数据进行训练,对不同的支路数下的检测准确率进行统计,如表5所示。随着电路趋于复杂,运行稳定,发生电弧故障时,主干路的故障电流中包含各支路的正常电流而使得检测难度加大,准确率降低。
表5 不同支路数检测准确率
3.2 判别故障支路的分类结果
应用本文所提出的算法对电流样本进行有无故障电弧辨识具有极高的准确率。基于此,提出将所有的“无弧”样本归为1大类,所有“有弧”样本划分为纯阻性、纯感性和非线性样本3大类,从而进行4分类。以此识别电路正常工作和哪1类负载支路下发生电弧故障的情况。其中正常电流数据为21 600组,纯阻性、纯感性和非线性支路故障电流数据各为7 200组,标签依次设计为0,1,2,3。同一标签下随机打乱后,按照5∶1的比例划分训练集和测试集,构成最终数据集。并送入CNN_LSTM网络中进行训练,网络参数不变。每个类别的准确率和总体准确率如表6所示。
表6 识别故障支路的测试结果
3.3 与其他模型的比较
为了验证所提模型检测电弧故障的性能,在同样的数据集上使用不同的模型进行测试,选取准确率和总时间作为衡量标准,如表7所示。
表7 不同模型的计算结果
1D CNN由1层卷积层和全连接层组成,检测准确率约85%,但是全连接层导致网络训练慢。AlexNet由5层卷积层和全连接层组成,准确率为95%左右,但是网络结构复杂且网络参数较多,训练时间尤其缓慢。LSTM仅有单个记忆门控单元组成,参数较少,训练时间较短,在2分类时表现较好,但是在多分类时,准确率较低。本文所提CNN_LSTM结构简单,参数量少,训练时间短且准确率较高。
4 结论
1)在对所有的实验数据进行正常故障分类时,单支路到6支路的测试准确率呈下降趋势,总体达到了99.04%。在对故障支路用电设备的类型进行分类时,正常类、纯阻类、纯感类、非线性4大类的识别准确率依次降低,总体达到了97.90%。
2)虽然用电设备的增多、负载支路数的增加、电流波形故障特征不明显,检测准确率略有下降,但依然具有较高的准确率,该方法为复杂支路下的串联故障电弧识别方法提供分析思路。