基于特征迁移和深度学习的配电网故障定位

2022-02-03齐振兴张倩丁津津李国丽

科学技术与工程 2022年33期

齐振兴，张倩，丁津津，李国丽

(1.安徽大学电气工程及自动化学院，合肥 230601； 2. 安徽大学工业节电与电能质量控制协同创新中心，合肥 230601; 3. 教育部电能质量工程研究中心(安徽大学)，合肥 230601； 4. 国网安徽省电力有限公司科学研究院，合肥 230601；5. 工业节电与用电安全安徽省重点实验室(安徽大学)，合肥 230601)

输电线路是配电网的主要组成部分，电力通过输电线路从发电站传输到用电站。随着能源和电力系统的发展，电网的拓扑结构和运行方式也越来越复杂，以及用户对安全、可持续和电能质量需求的提高，大大增加了电力系统的复杂性。一旦发生故障，将造成难以估量的危害[1]。而基于传统的机理模型分析方法需要大量的先验知识[2]，在复杂的大电网结构下，无法建立机制模型。因此，如何及时精准地实现故障诊断，是亟待解决的问题。

在电网发生故障时，其中暂态分量幅值比稳态分量幅值更大[3]，故障特征也更加突出，在已有研究中，多是对于暂态电流信号进行特征分析。文献[4]通过在电线设置不同测量点，计算相邻测点零序电流的相似性指标，从而实现故障识别，但该方法只适用于线路分支较多、线路较短的风电场景，适用性不强。近年来，人工智能算法的兴起，如专家系统[5]、贝叶斯网络[6]、Petri网[7]、人工神经网络[8]等，在电网故障诊断领域已有了广泛的应用，文献[9]利用蚁群优化算法对Elman神经网络进行优化，进而通过神经网络实现故障测距。文献[10]将离散小波变换与人工神经网络相结合，实现电网故障区段识别。卷积神经网络(convolutional neural network，CNN)[11-12]作为深度学习中的经典模型，能够挖掘数据间深层次的特征，从大量样本数据中提取故障特征并且自动分类。文献[13]利用CNN算法对配电网区间内外进行故障类型的识别以及故障选线。文献[14]利用CNN自动提取数据间的时序特征，实现端到端的暂态稳定性评估。综上所述方法，在一定程度上实现了故障分类，但是当配电网的拓扑结构变化时，新场景下的目标域数据和源域数据存在特征差异性，机器学习效率大大降低，不能精准地分类预测。

为了提高深度学习模型的泛化性，引用迁移学习[15]的思想，它能够将不同域的数据进行充分提取，并将提取到的特征迁移到目标域中，提高了模型预测精度。文献[16]将迁移学习引入牦牛的图像识别，将训练好的CNN模型权重迁移到目标域模型中，提高了识别速度。文献[17]将训练完成的CNN预训练模型迁移到新场景中，实现了线路故障选相。但上述方法需要不同域间的数据相似度尽可能高，分布差异性小。为此，现引入半监督迁移成分分析(semi-supervised transfer component analysis，SSTCA)方法[18]，将不同域间的数据映射到Hilbert空间中，在核空间中采用希尔伯特-施密特独立性系数衡量嵌入空间中数据和标签的依赖关系，保留局部几何结构，提高数据间的相似性。最后利用CNN对映射后的特征数据集进行故障分类训练，从而完成了配电网目标域故障定位任务，解决跨域间深度学习模型精度无法提高的问题。

1 配电网接地故障特征分析

实际配电网发生的故障大部分为小电流接地故障，而小电流接地故障产生的暂态零序电流幅值远大于稳态零序电流值，且不受消弧线圈的影响。以图1中性点不接地配电网零序等效网络来分析故障时的零序电流特征。

uk0为故障点零序虚拟电压源，数值上等于故障点暂态零序电压；非故障线路用电容来等效，CIu0、CId0、CⅡ0、CⅢ0、Cs0分别为故障点线路对地电容；线路Ⅰ发生接地故障，ik0为线路故障线路暂态零序电流，ihⅡ0和ihⅢ0分别为非故障线路暂态零序电流图1 中性点不接地配电网零模等效网络Fig.1 Zero-mode equivalent network of the neutral ungrounded distribution network

根据图1，对于非故障线路j，暂态零序电压u0(t)与电流ij0(t)满足关系式为

(1)

式(1)中：Cj0为非故障线路电容。

故障线路k的暂态零序电压u0(t)与电流ik0(t)满足关系式为

(2)

式(2)中：Cb0为所有非故障线路电容与母线及其背后系统分布电容之和。

由式(1)、式(2)可知，非故障线路出口暂态零序电流为本线路对地分布电容电流，而故障线路出口暂态零序电流为其背后所有非故障线路暂态零序电流之和。所以故障线路的暂态零序电流幅值较大，且极性与非故障线路相反。因此以各线路的零序电流作为研究对象，分析故障线路与非故障线路之间零序电流的特征差异性，从而实现对配电网的故障诊断。

2 特征迁移学习策略

2.1 领域自适应

配电网新增线路的接入、线路节点的变化、电机组的并网都会引起系统拓扑结构和参数的变化，从而导致新拓扑结构下的目标域数据和源域数据存在分布差异性。

为了提高跨领域的学习能力，将源域和目标域的特征样本集映射到同一特征子空间中，在子空间中缩小数据间的距离。领域自适应过程如图2所示。

图2 领域自适应图Fig.2 Domain adaptive graph

2.2 加权半监督迁移成分分析

SSTCA是在无监督主成分分析的基础上增加对标签的应用改进而来，主要优化目标是在嵌入空间中将源域和目标域数据分布最大程度地对齐、增强标签与数据间的依赖关系、保留数据的几何结构。

2.2.1 核函数

当电网拓扑结构改变时，不同域的零序电流信号存在分布不同的情况，为了减少数据间的差异性，构造高斯径向基核函数Krbf和多项式核函数Kploy，根据Mercer定理对Krbf和Kploy按照不同比例进行加权混合，提升核函数泛化能力，以达到最佳映射的目的。加权混合核函数表达式为

K=λKrbf(xi,xj)+(1-λ)Kploy(xi,xj)

(3)

式(3)中：λ为多核权衡系数；(xi,xj)为不同域的输入样本集。

2.2.2 分布匹配

假设源域为XS，目标域为XT，φ(XS)和φ(XT)为经过希尔伯特空间进行映射后的源域和目标域样本，映射后的距离公式表达式为

(4)

式(4)中：xi∈XS,yj∈XT；n1、n2分别为源域和目标域样本个数；‖.‖H为RKHS范数。

直接最小化该式来求解，容易陷入局部极小值，为了简化计算，引入域适应方法——最大均值差异(maximum mean discrepancy，MMD)。将映射函数转换到核矩阵K上，最后再降维到共享的低维潜在空间，其中核矩阵K表达式为

(5)

式(5)中：K∈(n1+n2)×(n1+n2)；KS,S、KT,T为域间的核矩阵；KT,S、KS,T为跨域的核矩阵。

(6)

Dist[φ(XS),φ(XT)]=trace(KL)

(7)

式中：trace表示求矩阵的迹。

(8)

根据式(7)转换为

Dist[φ(XSw),φ(XT)]=trace[(KWWTK)L]

=trace(WTKLKW)

(9)

2.2.3 标签依赖性

HSIC为希尔伯特-施密特独立性系数，用于度量两个样本之间的独立性，衡量嵌入空间中数据和标签的依赖关系，表达式为

(10)

式(10)中：X、Y分别为核空间特征样本和源域特征样本对应的类别标签；Kyy为标签核矩阵。

Kyy=γKl+(1-γ)Kv

(11)

式(11)中：Kv为单位矩阵；Kl为源域样本矩阵；γ为建立映射后数据和标签依赖、映射后数据方差两者之间进行权衡。

若xi、xj均属于源域，则[Kl]ij=kyy(xi,xj)，否则[Kl]ij=0。

2.2.4 局部信息保留

在MMDE中，通过目标核矩阵增加距离限制来保留局部几何结构，引入了密度矩阵M，元素表达式为

(12)

式(12)中：σ为参数；dij为特征空间中跨域间的距离。

(13)

式(13)中：λ为权衡系数；μ为正则化数据。

3 基于特征迁移的CNN故障诊断流程

3.1 CNN参数训练

CNN作为深度学习中典型的神经网络，主要由卷积层和池化层构成，本质是卷积网络中多层滤波器响应不同复杂度的特征，相比较于其他网络在处理稀疏数据方面表现更好，结构如图3所示。

图3 CNN结构原理图Fig.3 CNN structure schematic

首先，对不同线路的零序电流时序数据进行预处理。其次，通过这些滤波器，输入数据在前向通道中卷积。

(14)

(15)

式(15)中：⊗为卷积操作；k为降采样核。

最后，利用全连接层对上一层的特征信息进行组合排列，得到一个特定的故障诊断向量。向量中的不同索引代表着不同的故障线路，其中索引的数值越大，代表此条线路发生故障的概率就越大。

3.2 配电网故障诊断策略

当配电网拓扑结构变化时，源域和目标域特征分布不均衡，采用加权核SSTCA-CNN故障诊断方法如图4所示，主要步骤如下。

图4 基于特征迁移学习流程图Fig.4 Flow chart of feature-based transfer learning

步骤1搭建配电网故障仿真模型，生成大量带标签的零序电流数据；改变模型拓扑结构，在新场景下生成目标域零序电流数据。

步骤2引入SSTCA算法，将源域和目标域的故障样本集特征映射到Hilbert空间中，降低样本维度，去除不相关成分，缩小数据间的距离，使得样本分布更加相似。

步骤3将经过映射筛选后的源域数据输入到CNN中进行迭代训练，分别设置不同的CNN网络结构、卷积核大小、学习率等参数。用映射后的目标域数据作测试样本，从而完成基于CNN的配电网线路故障诊断。

4 仿真与结果分析

4.1 配电网仿真实验

为了验证所提方法的准确性，通过仿真生成大量暂态数据与其他数据驱动算法进行评估。为模拟实际电网拓扑结构，在Simulink模块中搭建 10 kV经消弧线圈接地配电网进行仿真分析，系统接线图如图5所示。在这个系统中，共有4条馈线，由电缆线和架空线组合构成，每条线路上均有若干个线路节点，一共有23个节点，22条支路。

图5 10 kV配电网拓扑结构Fig.5 10 kV distribution network topology

为了模拟实际配电网发生故障的情况，设置系统仿真时长为0.2 s，故障从0.03 s开始到0.16 s时故障切断，从故障开始前0.01 s开始采样直到故障切除。在每个故障位置处设置不同故障类型(共10种)；并按照等步长对系统电压、采样频率、系统负荷、故障电阻等参数设置不同值，如表1所示。偏历表上参数一共采集到10 800组零序电流数据，构成带标签的训练数据，作为源域样本集。

表1 系统参数遍历表Table 1 System parameter traversal table

4.2 CNN网络结构的选择

CNN模型结构参数的设置，直接影响预训练模型的准确率和效率。因此设计了4种不同的CNN网络结构，以序号2为例，第一层网络卷积核大小为3×3，滤波器数量为16，池化层阶数为2×2；第二层网络卷积核大小3×3，滤波器数量为64，池化层阶数为2×2。如表2所示。

表2 CNN模型结构参数Table 2 CNN model structure parameters

由图6所示，当CNN结构为序号2时，预测效果最好，准确率提升最快，且接近100%正确率，因此选用结构2作为CNN的基本结构。

图6 不同CNN结构预测效果图Fig.6 Prediction effect of different CNN structures

4.3 改变模型拓扑结构

考虑配电网重构的情况，改变10 kV配电网模型的拓扑结构。方案1：断开线路L5，将节点4连接到节点5。方案2：在方案1的基础上，断开线路L21的连接。方案3：在方案2的基础上，为节点11增加一个电机模块和线路负载。结构如图7所示，将此3种新场景下采集到的故障数据作为目标域样本集。

图7 新场景的仿真模型Fig.7 Simulation model of the new scene

4.4 基于SSTCA的CNN模型的故障测试

4.4.1 混合核与单核实验对比

为了方便处理，将源域样本设为A,目标域样本分别设为B、C、D。首先对SSTCA算法参数初始化，通过多次实验对比将内核参数设为10，高斯径向基函数设为1，正则化参数u设为1，knn取值为5，同时构建加权混合核函数和其他单一核函数进行对比，加权系数λ为0.6。将映射后的源域样本作为CNN模型的训练样本，目标域线路作为CNN模型的测试样本，不同核函数对比结果如表3所示。

表3 不同核函数对比实验Table 3 Comparison experiments of different kernel functions

从表3中结果可以看出,混合核的模型测试准确率均比单一核要高，且平均准确率高达98%。因此在源域和目标域样本分布不均匀时，混合核函数处理效果更好。

4.4.2 混合核SSTCA与其他算法对比

选用A作为训练样本，目标域B、C、D分别作为测试样本的前提下，同时保持CNN模型结构参数不变。

为了测试混合核SSTCA特征映射的性能，分别选用KPCA、PCA算法进行对比实验，对样本集映射后的维度均设为30，结果如图8所示。

从图8可以看出目标域样本B、C、D和源域样本在经过SSTCA特征映射后的CNN分类准确率最高，更符合配电网故障识别高精确率的要求。

图8 不同特征映射算法对比Fig.8 Comparison of different feature mapping algorithms

4.5 不同训练模型的预测性能

选择源域数据集A作为预训练模型的输入，目标域C作为测试集，分别经过混合核SSTCA的特征映射作为模型的输入。利用CNN对目标域进行预测分类，同时选用深度信念网络(deep belief network，DBN)和支持向量机(support vector machine，SVM)进行对比实验，结果如图9所示。