配电网单相接地故障类型CNN识别方法研究
2022-10-12王佳豪钟加勇
杨 佳,陈 勇,冯 波,王佳豪,潘 鑫,钟加勇
(1.重庆理工大学 电气与电子工程学院, 重庆 400054;2.重庆市能源互联网工程技术研究中心, 重庆 400054;3.国网重庆市电力公司电力科学研究院, 重庆 401123)
0 引言
目前,配电网中单相接地故障占比较高,其故障类型主要分为金属性接地、低阻接地、高阻接地和电弧接地故障。在供电企业生产实践中,准确识别单相接地的故障类型有助于分析接地原因,进而制定更有效的单相接地处置措施,防范单相接地故障演变为相间接地或者瞬时性接地演化为永久性接地等更严重后果。同时,准确识别单相接地故障类型也有助于分析并解决小电流接地选线和故障区段定位问题[1]。
配电网的故障识别主要通过分析稳态或暂态2种电气量来实现的。在稳态电气量方面,提取故障特征较为容易,但受到系统自身参数的因素影响较大,存在明显的局限性[2-3]。在暂态电气量方面,包含丰富的故障信息并能直观反映故障本质,其识别过程主要先通过小波变换[4]、梯度运算(gradient)-闭运算(closing)变换[5]、经验模态分解(EMD)[6]等方法进行特征处理后,再用智能算法完成故障的分类识别。分类识别的方法主要有支持向量机法(support vector machine,SVM)、模糊控制法、神经网络法等。文献[7]采用局部特征尺度分解(LCD)对故障三相电压、电流和零序电压进行分解,构建了故障特征矩阵的奇异值,并输入多级SVM的分类器进行故障识别,该方法能分类识别多种故障类型但径向基核函数参数优化速度会随着样本容量的增加而降低;文献[8]通过海量的现场故障数据分类出6种单相接地情形,提取出五种故障特征,输入到模糊推理系统中进行识别,有一定的识别精度,但要建立合理的模糊控制规则比较依赖于人工经验且难于自主学习。文献[9]应用S变换提取故障特征量,将其作为BP神经网络的输入量进行故障识别,能有效识别高阻单相接地故障,但该方法收敛速度慢且容易出现局部过拟合现象;文献[10]采用S变换提取故障特征量,输入至ANN神经网络中进行故障识别,其高速寻优特征向量,可以高效识别不同故障类型,但要解决一个合理的网络结构模型,需要人工建立输入与输出之间的模型关系,而实际工况复杂往往难于求解;文献[11]利用EMD法对故障信号进行时频分解,构造出特征量,结合蚁群算法优化模糊神经网络的权值,提高了收敛速度,改善了识别精度。
本文中采用以EMD为基础的HHT变换提取故障特征的方法,其对非平稳故障信号的特征提取比小波变换更具有适应性,且避免了小波基的选取问题。将其变换出的故障时频谱图输入至深度学习模型—CNN中进行训练学习,通过采用自适应学习率和正则化的方法寻求模型收敛速度和识别精度的最优解,且配电网丰富的故障数据正好满足CNN的样本需求,使之在受到故障位置、过渡电阻、故障初相角等因素影响较大情况下均具有较高的精度。
1 CNN识别原理
基于CNN的配电网故障分类识别流程如图1所示。具体如下:
步骤1采集配电网10 kV侧母线的三相电压、三相电流和零序电压的故障数据,作为训练样本。
步骤2采用HHT带通滤波器对7个故障信号进行滤波,构造时频功率矩阵,将时频功率矩阵转换为35×35的时频谱图,输入至CNN中完成训练学习。
步骤3利用已训练好的CNN模型对测试样本进行识别,调整参数,改善识别精度。
步骤4丰富故障样本数据库,利用步骤3实现对单相接地故障类型的实时识别。
图1 单相接地故障分类识别流程框图
1.1 希尔伯特-黄变换
HHT是先将故障信号进行经验模态分解,再对每个固有模态函数(IMF)进行Hilbert变换,得到故障信号的时频分布。因此,原始信号x(t)由n个IMF分量和1个残差R组成:
(1)
式中:ci(t)是第i个IMF分量;R(t)是残差。
对每个IMF分量应用Hilbert变换,得到相应的瞬时幅值和频率。则原始信号可以表示为式(2),残差R(t)是1个可以忽略的极小分量。
(2)
式中:ai(t)和fi(t)分别为第i个IMF分量的瞬时幅值和频率;Re{·}表示复数的实部。通过求取大量时频特征后发现信号的瞬时频率集中在0~1.5 kHz范围内,故选择0~1.5 kHz的频率宽度。a相金属性接地故障时b相的电压波形及其IMF分量如图2所示,可以看出:故障信号采样总时长为0.2 s,在0.05 s时发生a相金属性接地故障,0.11 s时结束故障。可见a相电压故障期间,b相电压升高。b相电压经EMD分解成IMF1、IMF2、IMF3固有模态函数和R残差分量,最后R分量分解结果近似于0,说明HHT分解效果很好。
图2 b相电压原始波形及其IMF分量曲线
1.2 构建时频功率矩阵
对每个故障信号采集N个数据,并利用HHT将其划分为M个子频带,每个子频带的数据点为Sij(i=1,2…,M和j=1,2…,N)。为了高效利用数据量,将各子频带的数据沿采样的时间轴K等分。因此,故障分量中每等分数据点的数量是E(E=N/K,N是K的整数倍),则能将整个时频谱划分为等频带、等时段的小时频段[6],各分量中各时频段的功率为:
(3)
式中:Ail(m)是假设子频带i中的时频片段l的数据点m的幅值;Δt是采样时间。1个故障信号的时频功率矩阵为:
(4)
对7个故障信号采样的总时长为10个周期,1个周期为20 ms,采样频率为100 kHz。研究中假设M=5,N=20 000,K=40,E=500,每个子频带的带宽为300 Hz,则每个故障信号的时频功率矩阵(Pf),其维数为35×40,即:
(5)
式中:PUa到PP0分别为三相电压(Ua、Ub、Uc)、三相电流(Ia、Ib、Ic)、零序电压U0的时频功率矩阵。为抑制边界端点效应的影响,裁剪首位前3列和尾位2列,矩阵Pf构建成维度为35×35的时频功率矩阵。在输入CNN进行训练之前,需要对时频功率矩阵数据Pf进行minmax归一化处理,转化为35×35大小的图像。如式6所示,P(i,j)即所生成的图像的像素组成。
(6)
式中:Pfmin为时频功率矩阵中的最小功率点;Pfmax为时频功率矩阵中的最大功率点;Pf[35(j-1)+i]表示对时频功率矩阵进行步进运算中的功率点。以a相金属性接地故障为例,7个原始故障信号波形图和时频功率谱图见图3和图4。图4中,纵轴代表7个故障信号的分频频段,横轴表示数据采样时间,颜色棒表示等时段累计的归一化后的幅值。
图3 7个原始故障信号波形
图4 时频功率图谱
由图4可以看出:当t=0.05 s时,a相发生金属性接地故障,t=0.11 s时故障结束,a相电压恢复正常。故障阶段b、c两相电压升高,a相电流增大,出现了较高的零序电压。图4具体体现了图3的故障特征,综合反映出故障信号在时间、频率与功率之间的关系。故障期间a相频率和功率值较低呈蓝色,而b、c两相功率达到归一化的最大值并呈深红色,零序电压在故障期间也出现了明显的频率及功率特征。因此,由图4可以得出结论:在发生金属性单相接地故障时,各故障信号的频率特征主要集中在600 Hz以内,且故障相的功率降低,非故障相的功率升高,零序电压也会产生较高的功率值。
1.3 构造CNN模型结构
构建的是一个7层CNN网络结构,它包括1个输入层、2个卷积层、2个池化层、1个全连接层和1个输出层,如图5所示。
图5 CNN网络结构示意图
CNN运用多个移动卷积核,以横向和纵向沿时频谱图执行卷积运算,通过权重共享和稀疏连接自主提取局部特征量。对于二维一通道时频功率图像P,进行卷积核大小为rf×cf,步进值为1,卷积操作见式(7)。
(7)
其中:Wk是权重系数矩阵;Bk是偏置系数。
利用卷积运算提取局部特征后,采用最大池化层操作,既保留了关键特征,又极大降低了数据量。
代表误差的损失函数采用交叉熵损失函数来最小化分类错误。如式(8)所示,将训练的故障样本划分为N批次,每个批次里有k个图片;yik表示真实分类标签值,n表示节点数量,xik为Softmax激活函数(式(9))的值。
(8)
(9)
式(9)中:fSoftmax(xi)表示第i神经元的输出概率,xi为第i个神经元输入,分母表示所有节点求和。
激活函数采用线性整流函数(rectified linear unit,ReLU),相比sigmoid激活函数能有效解决梯度爆炸和梯度消失问题[12],如式(10)所示。
(10)
CNN模型训练采用Adam优化算法,不仅能自适应超参数调节,还能有效解决稀疏梯度问题[13]。构建的CNN模型各层参数如表1中所示。
表1 CNN模型各层参数
2 仿真试验与分析
2.1 训练样本
以图6中所示的10 kV辐射式中压配电网为例,基于PACSAD/EMTDC搭建仿真模型获取故障样本数据。
图6 10 kV辐射式中压配电网络接线示意图
如图6所示,主变压器(T1)采用中性点不接地运行方式,容量为31.5 MVA。T1的短路损耗▽Pk=121 kW;空载损耗▽P0=25.6 kW;空载电流百分比为I0%=0.12;短路电压百分比是Uk%=10.93;每条馈线的负载为Sload=0.5+j0.25 MVA;系统阻抗为ZS=0.21+j2.04 Ω。
10 kV馈线的正序和零序分布参数如表2。
表2 10 kV馈线参数
变压器(T2)采用Z形连接方式与消弧线圈连接构成10 kV母线的零序通路。消弧线圈采用过补偿方式,补偿度为8%。消弧线圈的电感和电阻参数分别为0.69 H和6.46 Ω。
训练时打开开关K,切除消弧线圈。在图6中设置故障点f1—f14,选取f1—f7作为训练样本的故障点。配电网单相接地故障以过渡电阻大小划分,可分为金属性接地、低阻接地以及高阻接地; 依据故障点是否存间歇性电压畸变或者电压谐波含量远大于电流谐波含量等燃弧特征,可判断是否发生电弧接地(RG)现象[14-16],其过渡电阻具有非线性变化的特点。通过实验数据和实际继电保护对过渡电阻的耐受能力综合分析,高阻接地(HG)与低阻接地(LG)的过渡电阻分界值为 1 000 Ω[17],金属性接地故障(MG)过渡电阻值为0。为全面覆盖故障特征样本,选取低电阻值为5、50、500 Ω;高电阻值1、10、100 kΩ,故障初相角在0°~180°随机选取。目前,电弧模型包括Cassie、Mayr和“控制论”电弧模型等。由于“控制论”电弧模型能通过控制弧长直观表现电弧的变化过程,更好地反映实际燃弧情况,故选取“控制论”电弧模型来获取电弧故障样本。由于主要研究对电弧接地故障和电阻接地故障的辨识问题,而各电弧接地模型之间具有较为丰富的故障特征,对配电网故障分析也具有较高的工程实用价值,因此可作为下一步研究工作的重点。
表3列出了在训练过程中所模拟的故障样本数据。
表3 训练样本参数
续表(表3)
通过Adam 优化算法调整参数,缩小偏差。准确率越高则损失值越低,本轮训练迭代周期共150次。训练过程如图7和图8所示,在训练初期,代价函数快速下降,在迭代周次数20时,准确率已经超过90%。迭代至40次时,损失函数和准确率的收敛速度逐渐开始放缓,不过损失值仍在缓慢降低,同时准确率也持续升高,表明模型仍在继续优化。迭代至110次后,模型性能开始趋于稳定,误差的范围稳定在恒定值,准确率也逼近至100%。
图7 训练准确率
图8 训练损失率
2.2 测试样本
同训练样本所考虑因素一致,图6中故障点f8—f14采集到的数据用作测试集。应用基于CNN的故障分类识别方法,测试故障分类识别的准确性。α表示CNN识别故障准确率,如式(11)所示。
(11)
针对2 640个故障样本,其识别测试结果如表4所示。本文方法主要针对4种单相接地故障类型进行识别,平均准确率达到99.25%。其中,电弧接地故障有10个样本误判为金属性接地,均为故障点f13在故障初相角为180°时的样本,分析其原因发现,发生电弧电压在零休期间变化剧烈,电压增幅达到金属性接地故障时的电压值,从而引起误判。高电阻接地故障和低电阻故障的最小α值均达到了98%,说明训练好CNN的网络在测试样本中实现了较好的识别准确率。
表4 识别测试结果
在高电阻接地故障中,最小α值为98.40%,表明180个高电阻接地故障中最多出现3个错误分类。其原因是当过渡电阻达到万欧级以上时,故障相的电压不再是三相当中最低的,可能造成相序误判。本研究中个人计算机的处理器、RAM和操作系统分别为3.2GHz Intel CoreTM i7-8700、32(GB)RAM和Win64。Matlab(2020b)故障分类算法程序单次迭代时间在7 s以内完成,输入故障数据0.3 s内可完成判断,反应较为迅速。
3 对比与分析
在配电网线路故障识别领域,SVM[7]和BP神经网络[18]是2种常用的传统机器学习识别算法,均具有较高的识别率。将CNN分别同SVM和BP神经网络在单相接地故障类型识别率上进行比较分析,验证CNN识别效果。
3.1 低电阻接地故障识别
取2.2节测试样本,过渡电阻5 Ω的504个单相接地故障样本,低电阻接地故障方法识别结果结果如表5所示。
表5 低电阻接地故障方法识别结果
由表5可见,本文方法对低电阻接地故障识别率高于SVM和BP神经网络。因低电阻接地故障相电压跌幅受过渡电阻的影响,导致电压线性变化明显,CNN对故障频谱图的自主提取特征的能力强,使其避免了SVM对核函数需人工寻优和BP神经网络易于陷入过拟合的问题,提高了识别故障的准确率。
3.2 高电阻接地故障识别
发生高电阻接地故障时,故障相与非故障相电压值比较不一定最低,非故障相电压也并非总是升高,会增加识别难度。取2.2节测试样本,过渡电阻1 500Ω的504个单相接地故障样本,高电阻接地故障方法识别结果如表6所示。
表6 高电阻接地故障方法识别结果
由表6可见,本文方法对高电阻接地故障识别率高于SVM和BP神经网络识别方法。因高电阻故障电压电流故障特征不明显,增加了SVM阈值设置的难度,同时BP神经网络网络结构的选择问题上,仍需根据人工经验试凑才能保证相应的精度,因此这也表明了CNN自主学习的优势。
3.3 电弧接地故障识别
发生电弧接地故障时,因未投入消弧线圈补偿装置,故障处的零序电流不能迅速降低,导致持续燃弧,使电阻值变化区间过大且呈非线性,易影响其识别率。取2.2节测试样本中300个电弧故障样本,电弧接地故障方法识别结果见表7。
表7 电弧接地故障方法识别结果
由表7可见,本文方法准确率高于SVM和BP神经网络。因所采用的HHT先提取出了非线性故障信号时频特征,优于SVM依赖人工经验选取核函数和BP神经网络面对非线性问题时出现权值极值而造成的误判,因此本文方法对非线性故障具有良好识别精度。
4 适应性验证
首先通过投入消弧线圈和调整辐射式配电网络结构的方法,进一步验证所提基于CNN的故障分类识别方法的泛化能力和实用性。
4.1 中性点经消弧线圈接地
配电网发生故障时,为了能保证带故障运行2 h,需要投入消弧线圈。按图5给出的消弧线圈参数。选取故障点f4、f10、f13,综合考量因素同于表3,投入消弧线圈测试结果见表8。
表8 投入消弧线圈测试结果
由表8可见,平均识别率为88.68%,具有较好的泛化能力。导致识别率下降的原因是在消弧线圈发挥补偿作用的过程中,感性电流会使容性故障电流减弱,相位逐渐反向,从而造成误判。
4.2 调整网络拓扑结构
随着用户用电需求不断增加,因此实际配电网也时常会增加出线间隔,或者对线路大修技改,将某些线路退出运行。模拟3种不同的拓扑结构,增减馈线测试结果如表9所示。
表9 增减馈线测试结果
由表9可见,改变网络拓扑结构后综合平均正确率达到了98.6%。检查错误样本,发现与表3中相同,均为BC两相低电阻接地故障在故障点f10处,当故障初相角为90°时,在故障后的第一个半周波内暂态零模电流增幅较大而引起误判为金属性接地故障,导致误判原因与调整拓扑结构无关。
4.3 加入噪声污染
在实际配电网的数据采集过程中,会有存在噪声干扰情况,使数据发生畸变。选取表4中的金属性接地故障测试样本,数量300个并对数据加入30dB的高斯白噪声,噪声污染后的识别结果识别结果见表10。可以发现,对数据加入噪声污染后,经过HHT带通滤波器的作用,除了BMG的准确率略低外,其余测试结果均达到了100%,说明该算法可以克服噪声干扰在配电网中的影响。
表10 噪声污染后的识别结果
5 结论
针对配电网单相接地故障类型难以分类识别的问题,利用PSCAD/EMTDC软件仿真获取配电网大量故障数据,通过对故障数据进行HHT带通滤波,构造时频谱图,按比例将图片分为训练集和测试集。同时结合Matlab仿真软件搭建7层CNN模型结构,利用CNN模型对训练集进行学习,学习后的模型对测试集进行故障类型识别。仿真实验结果表明本文提出的方法,平均识别准确率达到98.8%,极大提高了传统依赖人工经验判断的效率。同时,通过投入消弧线圈和改变网络拓扑结构,平均识别准确率也达到93.6%,进一步验证了基于CNN深度学习算法在配电网故障识别应用中良好的适应性和鲁棒效果。但对于中性点经消弧线圈接地的运行方式,在故障发生后,消弧线圈要在十几毫秒内输出稳定的补偿电流,致使零序电流的幅值和相位均发生剧烈变化,会影响识别效果。因此,消弧线圈投入过程中,如何进一步提高识别率,值得继续深入研究。