基于生成对抗网络与局部电流相量的配电网拓扑鲁棒辨识

2023-02-02邵晨颖刘友波邵安海高红均刘俊勇

电力系统自动化 2023年1期

邵晨颖，刘友波，邵安海，邱高，高红均，刘俊勇

（1. 四川大学电气工程学院，四川省成都市 610065；2. 国网福建超高压公司，福建省厦门市 361004）

0 引言

精确的拓扑信息是配电网各类分析计算的基础，对配电网的安全运行、灵活控制及经济规划有重要意义。近年来，电动汽车等新型设备在配电网中的渗透率逐渐增加，分布式能源（distributed energy resource，DER）大规模接入，为实现灵活可靠供电，配电网拓扑变化愈发频繁［1-3］。在实际中，配电网测量数据经常发生部分缺失，通信延迟和故障、数据丢包等问题会导致数据采集与监控（supervisory control and data acquisition，SCADA）系统和高级量测体系采集的数据缺乏精确性与同步性［4］，这也给其拓扑的实时鲁棒辨识带来挑战。同步相量测量装置（phasor measurement unit，PMU）能够精确测量同步电压电流相量，但成本较高。如何在有限投资和局部可观条件下实现抗噪、抗数据缺失的配电网拓扑鲁棒辨识显得愈发重要。

不少学者基于数据建立物理判据［5-7］或模型［8-10］驱动拓扑辨识，如文献［5-7］以节点电压的关联性指导拓扑辨识；文献［8-10］将拓扑辨识简化为混合整数线性规划（mixed-integer linear programming，MILP）问题。与大多数利用电压数据的方法不同，文献［10］使用馈线电流互感器获取电流数据进行拓扑辨识。馈线电流互感器能实时获得精确电流相量，成本低且无须停电安装［11-13］，在设备投资成本方面极具优势。然而，基于数据统计关系的方法容易受DER 接入容量和类型的影响，难以适用于有源配电网；基于物理模型的算法则计算量大，时效性差。

为提高拓扑辨识效率，基于人工智能的无模型辨识方法成为新的研究方向。文献［14-18］利用监督学习挖掘量测信息和拓扑间的关联关系。文献［19-21］筛选出最有效的电压量测，以尽量少的数据实现高精度的辨识。但是，传统监督学习对未知拓扑的识别效果较差，且不少方法需要使用全量测信息或装设一定数量的PMU 才能得到准确的辨识结果，经济性较低。

因此，基于少量低成本馈线电流互感器的有源配电网无模型拓扑辨识仍有待深入研究。条件生成对抗网络（conditional generative adversarial network，CGAN）已被应用于电力系统负荷预测、量测数据重建等电力领域中［22］，而利用其进行拓扑辨识的研究尚少。原始CGAN 存在梯度消失和模式坍塌问题，训练难度较大，为此，本文提出一种基于梯度惩罚优化条件生成对抗网络（wasserstein CGAN with gradient penalty，WCGAN-GP）的配电网拓扑辨识算法，其特点在于：1）CGAN 利用数据参数化模型在高维超平面中仿射物理模型，类似于专家思维但鲁棒性更优，对已知拓扑和未知拓扑都能有较好的辨识效果，经梯度优化改进的CGAN 有效提高了训练的稳定性；2）利用观测窗中的时序电流数据，进一步提升拓扑识别准确度，增强了算法的抗噪和抗数据缺失鲁棒性；3）基于有限电流观测量的辨识方式大幅降低了电力系统的设备投资成本。

1 传统配电网拓扑辨识模型

1.1 物理模型驱动的配电网拓扑辨识模型

物理模型驱动的配电网拓扑辨识模型为：

式中：i∈Nnode，Nnode为节点集合；k∈K，j∈Ni，node，K和Ni，node分别为装设量测装置的节点集合和与节点i相连的节点集合；Xk，m和Xk分别为第k个量测装置测得的特征值和其对应潮流计算值；Ii和Iij分别为节点i的注入电流和线路ij的电流；Vi和yij分别为节点i的电压和线路ij的导纳值；I*i为节点i注入电流的共轭；Si为节点i所带负荷；sij和bi分别为线路ij上开关的状态和节点i与电网其余部分的连接状态。

该模型本质上是将采集到的量测值与潮流计算值相匹配，解出所有线路的二进制变量sij以推出网络拓扑。该优化问题是一个混合整数非线性规划问题，求解的时间和空间复杂度都较高。因此，一般将其转化为更易处理的MILP 形式后再求解，但转化后其时效性问题仍未得以解决。

1.2 监督学习驱动的配电网拓扑辨识模型

基于监督学习的配电网拓扑辨识方法的内在机理在于通过离线训练挖掘量测信息与拓扑之间的映射关系，在线辨识时以实时量测为输入，输出预测拓扑，相关模型为：

式中：Te和T分别为预测拓扑和真实拓扑；Nnn(·)为监督学习网络（如深度神经网络、深度置信网络、卷积神经网络等）的输出函数；α为损失项系数；wn为第n层网络权重；M为网络层数；Lloss为损失函数。

这种通过直接学习输入与输出映射的方式容易导致算法的泛化能力不足，针对训练集外的未知拓扑形式识别效果较差。

2 基于生成对抗网络的配电网拓扑辨识

2.1 生成对抗网络驱动的配电网拓扑辨识

为了克服上述传统物理模型的时效性问题和监督学习的泛化性问题，考虑采用生成对抗网络进行配电网拓扑辨识。生成对抗网络驱动的配电网拓扑辨识与监督学习类似，依托于机器学习技术，其辨识速度要优于传统物理模型驱动的配电网辨识模型。不同的是，生成对抗网络不直接学习量测信息与拓扑间的映射关系，而是训练2 个优化目标相互对立的网络，间接挖掘到拓扑的分布情况，从而增强算法的泛化能力。

生成对抗网络由生成器G和判别器D组成。生成器旨在学习输入随机噪声与真实样本分布之间的关联关系，由随机噪声产生符合给定样本分布的数据，以此欺骗判别器。判别器的任务在于尽可能分辨生成器产生的样本和真实样本。通过交替训练，G和D在对抗中不断优化。然而，生成对抗网络只能随机生成拓扑而无法生成某种特定条件下对应的拓扑，不能直接使用生成对抗网络进行拓扑辨识。

2.2 CGAN 辨识拓扑基本原理

CGAN 在生成器和判别器的输入中额外加入条件信息。判别器不仅需要区分生成器生成数据和真实数据，还需判断数据是否与条件信息相对应。CGAN 的目标函数为：

式中：D(·)和G(·)分别为判别器和生成器的输出；x和z分别为真实样本和噪声；Ex，Pdata(·)和Ez，Pz(·)分别为x在真实样本分布中采样和z在噪声分布中采样的期望值；c为条件信息。

考虑到配电网不同拓扑在不同负荷场景下的线路电流观测量也有所不同，故配电网拓扑与电流、负荷信息间存在一定的对应关系。如果将电流相量和其他量测数据作为条件信息，相应的拓扑信息作为样本输入，则CGAN 的生成器就能够学习到与量测数据相关的拓扑样本分布情况，从而生成预测拓扑。在配电网拓扑辨识场景下，CGAN 的作用机理如图1 所示。

图1 CGAN 原理图Fig.1 Schematic diagram of CGAN

3 基于改进生成对抗网络的配电网拓扑辨识

3.1 梯度惩罚优化的CGAN

一方面，CGAN 使用Jensen-Shannon（JS）散度来衡量真实数据分布和生成器生成数据分布之间的距离，而任意2 个无重合的分布之间的JS 散度恒为log 2，当判别器训练到一定程度，真实拓扑分布和生成器估计拓扑分布无重合时，生成器的损失函数将保持恒定，造成梯度消失而无法继续训练，此时模型将失去辨识能力；另一方面，在CGAN 训练过程中，判别器与生成器很难同时收敛，容易出现模式崩塌［23］，导致生成器只能生成少数几种拓扑，无法实现电流测量信息与拓扑的正确对应。

不同于JS 散度，Wasserstein 距离对2 个无重叠的分布仍能精准反映它们的远近，从而为生成器拟合拓扑数据分布提供精确的训练方向［24］。因此，采用Wasserstein 距离定义生成器的损失函数可以有效解决上述问题。同时，使用梯度惩罚实现Wasserstein 距离中的1-Lipschitz 条件限制，从而得到WCGAN-GP 的优化函数为：

式中：λ为惩罚项系数；xdata和xg分别为真实拓扑数据和生成器生成拓扑数据；ε为一个随机数，服从［0，1］上的均匀分布；Ex̂(·) 为x̂ 的期望函数；||∇x̂D(x̂)||2为将x̂输入判别器后其梯度的二范数。

3.2 改进生成对抗网络驱动的配电网拓扑辨识模型

利用物理模型的拓扑辨识方法计算效率低、模型更新困难，基于监督学习的数据驱动方法虽然识别速度快，但无法准确辨识训练集外的未知拓扑。为解决上述问题，提出了一种基于WCGAN-GP 的配电网拓扑辨识算法。WCGAN-GP 通过学习真实拓扑样本的分布，把握拓扑数据的分布特征，将电流和负荷量测作为条件变量引入，挖掘配电网有限观测量与拓扑之间复杂的非线性关系，对训练集中存在和不存在的拓扑都能精确辨识。将原始WCGAN-GP 模型应用到配电网拓扑辨识场景中，得到该模型的数学形式，如式（7）所示，其原理图如图2 所示。

图2 适用于配电网拓扑辨识的WCGAN-GP 模型Fig.2 WCGAN-GP model of topology identification for distribution network

式中：t∈H，H为装设馈线电流互感器的线路集合；F和Fe分别为判别器对真实拓扑和生成器生成拓扑输出的判别结果；It，m和θt，m分别为第t条装设馈线电流互感器的线路电流幅值和相角测量值；PL，m和QL，m分别为节点总有功和无功伪测量值；EGP为式（5）中的惩罚项。

1）数据集构建：在不同光-荷场景下对真实拓扑进行潮流计算，得到拓扑对应的部分线路电流幅值、相角和节点总负荷构成的配电网量测数据集。

2）离线训练：将量测数据作为条件信息与服从高斯分布的随机噪声输入生成器，生成器生成估计拓扑；再将真实拓扑、估计拓扑和量测数据输入判别器，其判别结果反馈给生成器和判别器，二者根据反馈结果分别更新自身参数进行优化，提高各自的生成能力和判别能力，最终得到基于WCGAN-GP 的拓扑辨识器。

3）在线辨识：将馈线电流互感器实时量测的电流数据和节点总负荷伪测量数据输入训练好的模型中，生成器将会生成预测拓扑。

配电网拓扑变化（如计划停运、故障隔离与复电、重构转供等）频率往往远小于量测设备采集频率，因此，在实际中可以在2 个相邻的拓扑状态间采集到连续时间断面的量测数据。对于数据驱动的辨识方法而言，量测误差的存在容易影响其辨识精度。为提升模型对量测数据误差的鲁棒性，在量测误差较大时也能保证辨识的准确率，采用连续观测窗内的多个断面的数据进行拓扑辨识。虽然开关状态从一个测量断面到另一个测量断面是固定的，但是由于每个节点所带负载和光伏出力的随机性，电流测量值也是随机变化的。在这种情况下，每个测量断面都是一个新的随机场景，为估计拓扑提供了冗余，有利于更好地缓解测量误差的影响。

3.3 模型结构设计

在配电网拓扑估计中，多断面的量测数据是一个时序面板数据，为了更好地挖掘其中隐含的信息，提高WCGAN-GP 的稳定性、收敛速度和生成器生成数据的质量［25］，引入一维卷积神经网络（onedimensional convolutional neural network，1D-CNN）构造生成器模型，判别器采用全连接网络。WCGAN-GP 的具体结构参数如附录A 表A1 所示。由于生成器需要产生0-1 变量表示的估计拓扑，故使用Sigmoid 作为最后一层全连接层的激活函数。

3.4 数据的生成与处理

3.4.1 数据生成

WCGAN-GP 的训练集和测试集数据生成步骤如下。

步骤1：基于文献［26］中提出的配电网辐射状约束，对有效开关状态组合进行轮询，生成一定数量的辐射状配电网拓扑；

步骤2：利用拉丁超立方采样（Latin hypercube sampling，LHS），生成负荷和光伏出力在基准值的80%～120%范围内波动的光-荷场景；

步骤3：将拓扑与光-荷场景组合，分别对各个样本进行潮流计算，得到线路电流幅值、相角和节点负荷结果；

步骤4：在样本潮流计算结果上加上高斯噪声干扰，以增强WCGAN-GP 的抗噪性能。

3.4.2 数据预处理

1）数据标准化

数据在输入WCGAN-GP 前，由于尺度、量级、单位有所不同，需要对其进行标准化处理，将各维数据变换为服从均值为0，方差为1的正态分布，表达式为：

式中：bnorm和b分别为标准化后和标准化前的数据；μ为均值；σ为方差。

2）缺失值处理

实时数据采集时，可能因通信问题或设备故障而造成部分数据缺失。由于模型的输入数据中包含了一个连续观测窗内的多个断面数据，这些断面数据都对应于同一个拓扑。受益于馈线电流互感器较高的采集频率，收集足够断面数据所需时间较短，节点负荷在这期间一般不会出现较大波动，断面数据间的差异不会太大。因此，采用其余时间断面数据的平均值补全缺失数据，有利于降低数据缺失对拓扑辨识带来的影响。

3.5 模型训练

WCGAN-GP 模型的具体训练步骤如下。

步骤1：根据3.4 节生成大量数据并对其进行预处理，划分出训练集、验证集、已知拓扑测试集和未知拓扑测试集。

步骤2：根据3.3 节搭建G和D并随机初始化。

步骤3：利用训练集数据，先训练ndiscr次D（固定G参数，更新D参数），然后训练1 次G（固定D参数，更新G参数），生成器和判别器的损失函数分别如式（9）和式（10）所示，二者根据其损失函数进行随机梯度下降更新。

式中：LG和LD分别为生成器和判别器的损失函数。

步骤4：重复步骤3，交替训练G和D，直至达到纳什平衡，即LD不再下降时结束训练。

3.6 模型评价指标

为了评估模型的辨识效果，模型的评价指标为：

式中：η为拓扑辨识的准确率；nCT为辨识正确的拓扑数；nET为辨识错误的拓扑数。

4 算例分析

仿真中使用OpenDSS 实现对配电网的潮流计算，利用Python 的Keras+Tensorflow 架构搭建并训练WCGAN-GP，所使用的处理器型号为Intel Core i5-11400，主频为2.60 GHz，内存为16 GB。在改造的IEEE 33 节点和IEEE 69 节点系统上分别进行测试，系统结构图如附录A 图A1 所示。

为了考虑DER 的影响，在原始结构中的部分节点接入一定容量的光伏，配置如附录A 表A2 所示。使用含恒阻抗、恒电流、恒功率的静态负荷（ZIP）模型模拟系统中各类负荷的存在，且满足占比PZ∶PI∶PP=QZ∶QI∶QP=0.2∶0.3∶0.5。由文献［10］可知，为了实现配电网拓扑准确辨识，每个环路上都至少应配置一个馈线电流互感器。因此，在IEEE 33 节点系统放置了5 个馈线电流互感器。IEEE 69 节点系统结构更加复杂，为了加速WCGAN-GP 的训练和收敛，在每个环路上都放置了2 个馈线电流互感器。

根据3.4.1 节，样本生成情况如附录A 表A3 所示。其中，训练集和验证集中不包含未知拓扑测试集中的拓扑，只包含已知拓扑测试集中的拓扑。对训练集样本随机加入5%、10%、15%、20%这4 种高斯噪声，以增强模型的泛化性能。WCGAN-GP训练参数取值如表A4 所示。

为了验证所提算法的优越性，将本文方法（WCGAN-GP）与贝叶斯网络［14］（Bayasian network，BN）、融合注意力机制的卷积神经网络［17］（attention mechanism and convolutional neural network，ACNN）、深度神经网络［19］（deep neural network，DNN）3 种监督学习算法和基于物理模型的MILP［10］一起进行多项测试并对比测试结果。

4.1 准确性测试

线路电流相量可由馈线电流互感器测量，根据可用互感器的不同类型，电流幅值的测量误差可达1%至3%，电流相角的误差可达1°至5°［10］。节点总负荷伪测量值可由SCADA 系统预测得到。因此，考虑实际量测中可能存在的误差，在测试集中加入不同高斯噪声组合，以e1表示馈线电流互感器量测的电流幅值和相角误差，e2表示节点负荷伪测量误差，模拟在不同电流测量误差和伪测量误差组合下模型的识别性能，已知拓扑测试集上的测试结果如图3 所示。

图3 不同误差组合下识别效果Fig.3 Identification effects of different error combinations

由图3 可知，5 种算法在测量误差较小的情况下都能有较好的辨识效果，WCGAN-GP 的辨识性能最好，是唯一能实现100%辨识准确率的算法。此外，基于物理模型的MILP 和基于传统监督学习的ACNN、DNN、BN 在测量误差增大后，辨识准确率都有明显下降，而WCGAN-GP 即使在e1=10%和e2=50%的情况下，仍能保证93.6%以上的准确率，可见测量误差对WCGAN-GP 辨识拓扑的影响较小。这主要是因为，一方面，所提模型使用了连续观测窗内的多断面量测数据，有效减少测量误差可能带来的估计错误；另一方面，生成对抗网络中的判别器相当于提供了一种根据任务、数据集不同而自适应的损失，与损失形式相对固定的传统监督学习方式相比，这种自适应的生成对抗损失训练得到的模型精度更高。

4.2 鲁棒性测试

为了验证所提WCGAN-GP 模型的鲁棒性，在e1=1%和e2=5%的情况下，分别测试了DER 渗透率、数据缺失和负荷模型对拓扑辨识准确率的影响。

4.2.1 DER 渗透率的影响

考虑实际系统中接入的DER，测试了DER 渗透率在10%～30%下各种算法的辨识效果，测试结果如附录A 图A2 所示。各方法对DER 渗透率的鲁棒性都较强，但整体来看WCGAN-GP 的识别效果更好，DER 渗透率不超过25%时，准确率都在99%以上。随着DER 渗透率增至30%，系统潮流出现反向，靠近接入DER 节点的线路电流由末端流向首端，造成WCGAN-GP 模型的识别效果略有下降。

4.2.2 数据缺失的影响

实际采集量测数据时可能会出现数据丢失的情况。考虑到拓扑变化过于频繁时可能无法获得足够的断面数据，对WCGAN-GP 在数据缺失和断面缺失的情况下进行测试。缺失率定义为：

式中：ρ为数据缺失率或断面缺失率；Nl为缺失的数据量或断面数；N为总数据量或断面数。

测试时，随机选取一定数量的数据置零模拟实际中存在的缺失数据。不同缺失率下的辨识准确率如图4 所示。

图4 不同数据缺失率下的识别效果Fig.4 Identification effects of different data missing rates

显然，数据缺失率小于70% 时，WCGAN-GP的断面缺失辨识准确率在99%以上，数据缺失辨识准确率在86%以上。这是因为数据缺失会使其冗余度降低，采用一个连续观测窗内其余断面数据的平均值补全缺失数据可以尽可能降低数据缺失的影响，保证冗余度，使其对数据缺失的鲁棒性较强。MILP 基于物理模型，对数据依赖性强，因此数据稍有缺失都会对辨识结果产生较大的影响；BN 虽然随着缺失率的升高识别准确率整体变化不大，但其整体识别效果不如WCGAN-GP；DNN 和ACNN 由于没有数据补全预处理，故只要出现数据缺失就完全无法正确辨识拓扑。

4.2.3 负荷模型的影响

配电网中存在各种类型的负荷，为了研究不同负荷占比对辨识效果的影响，对系统接入不同比例的ZIP 负荷，测试结果如附录A 表A5 和表A6 所示。可见，WCGAN-GP 模型的识别效果在各种ZIP 负荷场景下只有轻微变化，且准确率均高于其余算法。

4.3 对未知拓扑的适应性测试

为了证明WCGAN-GP 模型对训练集中不存在的拓扑类型的辨识适应性，用未知拓扑测试集对各种方法进行测试，结果如图5 所示。

图5 各算法对未知拓扑识别效果Fig.5 Identification effects of each algorithm for unknown topologies

图5 中，BN 选择拓扑库中可能性最高的拓扑作为预测拓扑，由于拓扑库中不存在未知拓扑，其辨识准确率始终为0；而DNN 和ACNN 作为传统监督学习算法，直接学习量测信息与拓扑间的映射关系，对未知拓扑的适应性较差。WCGAN-GP 则通过学习真实拓扑的分布特征，并将其与量测数据关联起来，生成器可以输出和训练样本中的真实拓扑在某些特征（由判别器提取得到）上保持一致的预测拓扑，在未知拓扑测试集上具有更高的准确率，解决了传统监督学习算法在未知拓扑辨识上的缺陷与不足，这一点在量测误差增大后愈发明显。

4.4 时效性分析

配电网拓扑辨识对于实时性具有一定的要求，其辨识时间必须小于拓扑变化周期。使用馈线电流互感器采集电流数据时，其采集周期可达毫秒级［13］。一般情况下，WCGAN-GP 在一个拓扑变化周期内完全可以收集到足够多的断面数据。在这个基础上，对比WCGAN-GP 和其他算法的在线识别时间，结果如附录A 表A7 所示。WCGAN-GP 的辨识速度虽不如传统监督学习，但与MILP 相比仍有较大的优势。WCGAN-GP 在系统规模变大时，识别时间变化不明显，MILP 的识别时间则与系统节点数有很大关系。

4.5 经济性分析

目前，配电网分布式同步相量测量装置（distribution PMU，DPMU）的配置成本远高于馈线电流互感器［10，27］。DPMU 需要考虑停电安装、调试造成的经济损失，馈线电流互感器不仅安装时无须停电，不存在停电损失，而且安装简便，只需要将其钳装在中压架空线或开关柜电缆相应位置即可。不同拓扑辨识方法所须装设的量测设备类型及数目如附录A 表A8 所示。可见，从经济性出发，MILP 在实际应用中所需的设备投资成本最低，WCGANGP 次之，但综合辨识准确性、鲁棒性、时效性和经济性来看，WCGAN-GP 的性能最好，有助于实现高性价比的拓扑辨识。

5 结语

本文将CGAN 应用于有源配电网拓扑辨识场景中，提出了基于局部连续电流相量和WCGANGP 的拓扑辨识方法。利用拓扑信息在不同光-荷场景下潮流计算得到的部分线路电流幅值、相角和系统总有功、无功负荷值离线训练模型，并运用馈线电流互感器采集实时数据实现在线辨识拓扑。针对IEEE 33 节点、IEEE 69 节点算例系统，通过分析WCGAN-GP 的拓扑识别性能并与其他算法进行对比测试，得到结论如下：

1）传统监督学习能通过挖掘量测数据与拓扑之间的映射关系来准确预测一定泛化域内的已知拓扑，但在泛化域外的未知拓扑测试集上辨识效果欠佳，而WCGAN-GP 能通过历史数据学习到与电流和负荷信息相关的拓扑数据分布特征，对未知拓扑识别的准确率更高，适应性更强；

2）算法使用了连续观测窗内的多断面数据，对应于同一拓扑的多个场景数据为拓扑辨识提供了冗余，同时多断面的量测为缺失值的补全提供了数据基础。与其他算法相比，WCGAN-GP 有效提升了算法的识别性能，并大幅降低了实时数据测量误差或缺失的影响，保证在输入数据误差或缺失率较大时仍能实现高精度的拓扑辨识，表明了本文方法在配电网拓扑辨识时有着较好的鲁棒性；

3）基于有限电流观测数据的WCGAN-GP 模型只需装设少量低成本的非接触式馈线电流互感器即可实现拓扑辨识，在实际应用中经济性较高。

后续研究工作中，将考虑馈线电流互感器的布点优化问题，旨在以最少的测量点数量得到最佳的辨识效果，以支撑覆盖一定供电区域的网格化有源配电网全局拓扑高准确度快速辨识。

附录见本刊网络版（http：//www.aeps-info.com/aeps/ch/index.aspx），扫英文摘要后二维码可以阅读网络全文。