基于小波降噪和深度学习的电能质量扰动分类方法
2022-12-15左先旺徐敬伟
刘 烨,程 杉,王 瑞,左先旺,徐敬伟
(1.三峡大学电气与新能源学院,宜昌 443002;2.电力系统智能运行与安全防御宜昌市重点实验室(三峡大学),宜昌 443002;3.国网山东省电力公司东营供电公司,东营 257000)
电能质量受到高渗透率可再生电源并网和电力系统的电力电子化的影响日益凸显[1-3],而解决的基础和关键之一是对电能质量扰动PQD(power quality disturbance)信号的有效识别。检验识别方法的两个重要指标是识别多种单一扰动和混合扰动的正确率及低信噪比环境下信号分类的准确率。
正确识别PQD信号的关键步骤之一是准确地提取扰动信号的特征。为此,文献[4]采用快速傅里叶变换(fast Fourier transform)和S变换提取7种PQD信号特征,然后采用融合决策树和支持向量机的分类器识别扰动,并借助简单的判别树对扰动信号进行正确分类。然而,由于傅里叶变换、小波变换、S变换等传统方法在提取信号特征时需要先验知识,十分耗时且难深度获得扰动信号特征[5],逐渐被深度学习等机器学习方法替代;文献[6]提出了利用卷积神经网络CNN(conventional neural network)从原始二维灰度图中自适应地提取特征后对PQD分类。而文献[5]利用稀疏自动编码器获取扰动特征后应用Softmax分类器对PQD信号进行分类;文献[7]则利用循环神经网络提取PQD信号的深层次特征后连接到Softmax分类器输出各信号的识别率;文献[8]采用格拉姆角场(Gramian angular field)将PQD信号映射为二维图像后将其作为CNN的输入自动提取特征并加以分类。上述方法的不足之处在于图形映射过程复杂,在噪声影响下某些图像特征不明显,且构造的网络模型对PQD信号的针对性弱,导致识别准确率不够高。
有效处理PQD信号中的噪声有助于提高低信噪比环境下信号识别的准确率,而小波阈值去噪算法在实际中被广泛应用[9-10]。在Donoho等[11]提出的软、硬阈值函数降噪方法基础上,学者们提出了不同的阈值函数改进方法。文献[12]提出的软、硬阈值函数的折衷法仍然无法避免阈值函数不连续的缺点;文献[13]提出的改进软硬阈值折衷函数去噪法改善了连续性问题;文献[14]提出的模乘方阈值函数通过将阈值分层从而避免了硬阈值函数不连续和软阈值函数固定偏差的缺点;文献[15]提出的改进阈值函数结合自适应阈值的去噪算法对PQD信号有优越的降噪效果。综上,分层阈值和自适应阈值方法能够有效避免固定阈值函数过度降噪导致的信号特征值丢失问题。
通过采用小波阈值降噪和改进深度神经网络的方法对如何提高低信噪比环境下PQD信号的分类准确率问题进行了研究。研究时首先采用一维CNN直接对含噪PQD信号进行分类;接着针对CNN特征提取缺乏时间相关性的缺点,对其改进得到抗噪性能更好地改进卷积神经网络E-CNN(enhanced-conventional neural network)分类模型;最后采用分层自适应阈值函数HATF(hierarchical adaptive threshold function)降噪法对含噪信号进行降噪处理[16],将降噪后的PQD信号再次输入至CNN和E-CNN中得到结果,验证本文所用方法的有效性。
1 基于深度学习的电能扰动信号分类模型
1.1 CNN分类模型
CNN结构如图1所示,CNN由输入层、卷积层、池化层、归一化层、全连接层和输出层组成。
图1 CNN结构Fig.1 CNN structure
卷积层可以很好地捕获输入信号f(m)|m=0,1,…,N中的简单特征,并随着层数的叠加,产生的特征映射会捕获输入信号中越来越多更复杂的全局属性,即有
式中:N为输入数据(fn)的长度;g(n)为卷积层的核函数序列,其长度与卷积核的长度一致;T[n]为f和g经过卷积后提取到的第n个特征序列。
每层卷积层使用双曲正切函数tanh作为激活函数来提高CNN的表达能力,表示为
在每两层卷积层后添加一层池化层,用来保留主要特征,减少计算量。然后经过归一化层将池化后的特征向量变为一维,最后进入全连接层使用softmax函数分类,计算过程为
式中:ai为softmax层第i个神经元的输入量;k为类别的数量;softmax(ai)为对应标签的概率。
采用反向传播梯度下降法训练模型参数,使用交叉熵损失函数作为训练的目标函数,即
式中:L为预测结果与实际结果的偏差;n为样本总数;i表示第i个样本;yi为真实标签;si为经过softmax激活后的实际输出值。
各层卷积网络卷积核中的权重w和偏置b更新公式为
式中:wi、bi和wi+1、bi+1分别为第i代和第i+1代的权重和偏置值;α为学习速率,当损失L随着迭代次数的增加逐渐减小并趋于0时,表示CNN模型已经训练好。
优化器采用自适应时刻估计方法ADAM(adaptive moment estimation)[17],评价指标metrics选用“accuracy”。
为CNN分类模型提供数据,根据IEEE标准[7,16],搭建了如图2所示的10种电能质量扰动信号,其中6种单一类型的扰动信号为:电压暂降、电压暂升、电压中断、暂态振荡、瞬时脉冲、谐波,分别记为C1~C6;4种复合类型的扰动信号为:暂降+振荡、暂升+振荡、暂降+脉冲、暂升+脉冲,分别记为C7~C10,并对每种信号进行归一化处理。
图2 10种电能质量扰动信号示意Fig.2 Schematic of 10 kinds of PQD signal
对上述10类PQD信号每类各生成300个数据样本,共3 000个样本。设置训练集样本数为2 100,测试集样本数为900。训练集用来逼近真实类别训练网络,测试集用来测试效果。
分别在无噪环境、30 dB(弱噪声)和20 dB(强噪声)的高斯白噪声环境下,利用CNN分类模型对PQD信号进行分类。不同信噪比环境下CNN模型的分类准确率如表1所示。
表1 不同信噪比下CNN的分类准确率Tab.1 Classification accuracy of CNN at different values of SNR
由表1可知,CNN分类模型本身具有一定抗噪性,在无噪环境和弱噪声(30 dB)环境下的分类表现良好,与文献[6]的仿真结果相契合。但强噪声(20 dB)环境下的分类准确率发生了明显的降低,C1(电压暂降)、C4(暂态振荡)、C7(暂降+振荡)和C8(暂升+振荡)的分类准确率出现了较大程度的下降。这是因为小幅度的暂降、暂升和振荡故障在低信噪比环境下容易被噪声覆盖,导致错误分类。
对强噪声环境下的分类问题进一步研究,在20 dB强度的高斯白噪声下,CNN每次训练过程中的准确率和交叉熵损失如图3所示。
图3 CNN训练过程Fig.3 CNN training process
由图3可知,随着训练次数的增多,CNN模型的准确率不断上升,损失逐渐下降,但模型的训练准确率和损失在训练后期仍有较大程度的波动,无法收敛。CNN的识别准确率最后稳定在93%左右。这是由于卷积层中的卷积核提取到的特征缺乏时间依赖性,捕获到的特征在数据片段中的位置不具有高度相关性,识别复杂含噪信号的分类准确率较低。
1.2 E-CNN分类模型
针对CNN的上述不足,在图1网络结构的基础之上引入长短期记忆LSTM(long short-term memory)神经层。针对PQD信号具有时序性的特点,LSTM能够学习其时间上的相关性。LSTM的细胞状态包括遗忘门、输入门和输出门3种结构,如图4所示。
图4 细胞状态结构Fig.4 Structure of cell state
其中,遗忘门结合权重和激活函数有选择地保留输入xt和上一时刻的输出ht-1,有
输入门对上一时刻的ht-1和输入xt进行输入,有
输出门选择重要信息作为输出,有
式中:σ为Sigmoid激活函数;tanh(·)为双曲正切激活函数;wf和bf分别为遗忘门的权重和偏置量;wi和bi分别为输入门的权重和偏置量;wc和bc分别为神经元状态的权重和偏置量;wo和bo分别为输出门的权重和偏置量;ft为遗忘门限;it为输入门限;Ct为当前神经元的状态;ot为输出门限;ht为t+1时刻对该神经元本身的输出值。
在图1中的CNN模型上将最后2个一维卷积层和一个池化层替换为LSTM层,得到E-CNN分类模型。多次试验后设置LSTM层的神经元数量为64,激活函数仍用tanh,return_sequences设为“True”,具体结构如图5所示。
图5 E-CNN结构Fig.5 Structure of E-CNN
PQD信号输入后,由卷积层和池化层提取其特征序列并进行简化,随后进入LSTM层,学习特征时间序列的相关性,最后进入归一化层将LSTM筛选后的数据化为一维,用全连接层的Softmax函数分类。
网络训练方法与CNN相同,训练过程中的准确率和交叉熵损失如图6所示。
图6 CNN和E-CNN训练过程Fig.6 CNN and E-CNN training processes
由图6可见,相比CNN的训练过程,E-CNN的准确率更高,损失更低,曲线更加平滑,网络的识别准确率最后稳定在96%左右,说明E-CNN改进了CNN提取特征缺乏时间依赖性的缺点,拥有更强的抗噪性能。
2 HATF降噪算法
为了进一步提升低信噪比环境下PQD信号的分类准确率,从信号降噪的角度出发,采用HATF降噪法对信号进行处理。
HATF降噪流程如图7所示。
图7 HATF降噪流程Fig.7 Flow chart of HATF noise reduction
具体步骤如下。
步骤1选择小波基函数。选择具有良好的相似性与对称性的Sym4小波。
步骤2确定最大分解层数M为
式中:Δt为采样周期;f0为小波基函数的中心频率;fmin为信号的最小频率。
步骤3得出分解层的调节参数μj为
式中,Enj和Esj分别为第j层分解中噪声信号和原含噪信号的能量。而En1≈Es1,其余则有Esj=2jEnj。
步骤4计算各分解层的阈值λ[18]。
步骤5由μj与λ得到各分解层的自适应阈值函数为
由此处理小波分解后的细节系数。
步骤6由各分解层的近似系数与细节系数对信号进行小波重构,得到降噪后的信号。
以含有20 dB高斯白噪声的C7(暂降+振荡)复合扰动信号为例,HATF降噪法的实际降噪效果如图8所示。
图8 HATF降噪效果Fig.8 Noise reduction effect of HATF
由图8可见,HATF降噪法在有效滤除噪声的同时,基本完整地保留了故障处暂降和振荡的局部特征。可以有效避免小幅度故障信号被强噪声覆盖的问题,提升深度学习模型的分类准确率。
3 分析比较
3.1 网络训练
在20 dB噪声下对比分析PQD信号经过HATF降噪后CNN和E-CNN两种模型的分类效果。训练集和测试集的构建在第1节已经说明;使用Python编程语言,在anaconda的spyder平台搭建神经网络,训练过程如图9所示。
图9 降噪后CNN和E-CNN训练过程Fig.9 CNN and E-CNN training processes after noise reduction
由图9可知,与降噪前相比,2种网络处理降噪后PQD信号的识别准确率更高,损失更低,并且在训练后期两曲线更加平稳。CNN模型的准确率达到了95%左右,E-CNN模型的准确率达到了98%左右,两者都有了一定程度的提高。
3.2 结果分析
对比降噪前后4种情况的测试集分类准确率,如表2所示。
表2 10种扰动信号的分类准确率Tab.2 Classification accuracy of 10 kinds of disturbance signal
由表2分析可得如下结论。
(1)在未去噪时,CNN模型对扰动信号C1(电压暂降)、C4(暂态振荡)、C7(暂降+振荡)、C8(暂升+振荡)的识别准确率较差。造成这种现象的原因一方面是由于噪声的干扰,使得C7、C8中小幅度的电压暂降/暂升分辨出现错误;另一方面由于模型缺乏对扰动信号时序性的提取,容易产生C4和C7、C8这样单一与复合信号的区分错误。
(2)E-CNN模型增加了信号时序性的分辨,提升了对单一扰动信号和复合扰动信号的区分能力,对C1(电压暂降)、C4(暂态振荡)的识别准确率有了较大程度的提升。若以未经过降噪的CNN分类模型为基准(0),E-CNN分类模型的效果提升率为3.37%。
(3)对扰动信号进行降噪后再识别,显著地提高了对C7(暂降+振荡)、C8(暂升+振荡)两种复合信号的识别准确率。但由于HATF降噪算法在去噪的过程中,有时会导致信号的局部特征失真的现象,对C1(电压暂降)、C4(暂态振荡)的识别准确率反而有所下降。总体而言,降噪仍能提升PQD信号分类的准确率。类似地,以未经过降噪的CNN分类模型为基准(0),经HATF降噪的CNN和E-CNN分类模型的效果提升率分别为1.73%和5.49%。
3.3 与现有扰动分类方法的比较
为明显体现低信噪比环境下本文方法的有效性,在20 dB的高斯白噪声环境下,与文献[3]和文献[19]的综合分类准确率进行对比,如表3所示,可以看出,本文方法在分类准确率上高于其他方法。
表3 不同方法的分类准确率Tab.3 Classification accuracy of different methods
4 结语
本文提出了一种针对强噪声环境下PQD信号的识别方法。首先采用HATF降噪法对信号降噪处理,使降噪后的信号曲线在正常运行时间段内保持平滑,并在非正常运行时间段内尽可能多地保留局部特征;接着对网络的结构进行改进,在CNN的结构之上添加LSTM层得到E-CNN,使网络模型拥有更强的抗噪能力,既可以提取识别扰动信号故障的波形特征,又可以识别故障发生的时序性。
由仿真分析可知,在强噪声(信噪比为20 dB)环境下,结合HATF和E-CNN的PQD信号分类方法明显提高了电能质量扰动信号的识别准确率。后续将进一步研究:①尝试对HATF改进,更好地保留PQD信号的故障处特征;②改进得到更适合PQD信号特点、抗噪性更强的神经网络分类模型;③推广至微电网、智能电网的PQD信号分类。