基于迁移学习的智能静态电压稳定评估方案

2022-02-17晏光辉刘颂凯张磊龚小玉

电测与仪表 2022年2期

晏光辉，刘颂凯，张磊，龚小玉

(1. 三峡大学电气与新能源学院，湖北宜昌 443002； 2. 三峡大学经济与管理学院，湖北宜昌 443002)

0 引言

随着智能电网和能源互联网的建设与推进，电力系统的规模和复杂度不断增加，系统运行日益接近稳定极限，电压稳定问题愈发凸显[1]。近年来，由电压失稳导致的大停电事故频频发生，造成了巨大的经济损失和严重的社会影响[2]。因此，实时、准确的静态电压稳定评估对于保障电力系统安全稳定运行至关重要。

静态电压稳定分析的实质是通过迭代求解潮流，获取系统当前运行点到电压崩溃点之间的量化距离[3]。传统基于机理分析的静态电压稳定评估方法主要从潮流多解[4]、奇异值分解[5]、模态分析[6]和灵敏度分析[7]等方面展开研究。由于计算复杂度高，耗时长，此类方法难以保障在线应用的时效性。

近年来，随着广域测量系统(Wide Area Measurement Systems，WAMS)在电力系统中的快速发展，相量测量单元(Phasor Measurement Unit，PMU)获取的大量量测数据为基于数据驱动的静态电压稳定评估研究奠定了坚实的基础[8]。这类研究的基本思路：首先，通过数据仿真生成大量训练样本；其次，数据驱动工具通过离线训练建立电力系统运行特征与电压稳定指标之间的映射关系；从而实现静态电压稳定评估。文献[9]利用支持类别特征的梯度提升(Gradient Boosting With Categorical Features Support，Catboost)算法进行电压稳定评估，并基于沙普利值加性解释方法(Shapley Additive Explanations，SHAP)对评估结果进行可解释性分析。文献[10]基于梯度提升决策树(Gradient Boosting Decision Tree，GBDT)算法实现电压稳定裕度的在线监测，其对噪声干扰具有较好的鲁棒性。文献[11]通过模态分析和相关系数分析进行数据降维，进而利用决策树(Decision Tree，DT)算法实现在线静态电压稳定裕度评估。文献[12]提出了一种基于极限学习机(Extreme Learning Machine，ELM)的分层自适应数据分析方法进行短期电压稳定评估，并利用多目标优化实现评估准确率和时间的最优权衡。

上述数据驱动方法取得了诸多成果，但在实际电力系统的应用中仍存在不足之处。第一，随着系统规模的逐渐扩大，电力系统的运行特征不断增加，大量与电压稳定分析无关的特征和冗余的特征会严重影响评估模型的性能；第二，电力系统拓扑结构可能发生改变，离线生成的训练样本集难以包含时变电力系统所有潜在的运行工况，训练好的模型可能无法为未知拓扑的系统提供准确可靠的评估结果。

基于上述分析，文中提出了一种基于迁移学习的智能静态电压稳定评估方案：考虑特征冗余问题，通过最大相关最小冗余(Maximal Relevance Minimal Redundancy，MRMR)准则[13]和shapley值[14]建立S-MRMR特征选择框架，实现有效的数据降维，使得评估模型可以利用较少的输入特征提供准确的结果；采用梯度提升分段线性回归树(Gradient Boosting With Piecewise Linear Regression Trees，GBDT-PL)算法[15]构建静态电压稳定评估模型，有效提高评估准确率和计算效率；为了提升评估模型的泛化能力，将迁移学习引入静态电压稳定评估中，对评估模型进行实时更新。通过在23节点系统和1648节点系统上的性能测试，验证文中所提智能电压稳定评估方案的有效性。

1 基于S-MRMR的电力系统关键特征选择

随着智能电网规模日益增大，系统运行特征(母线电压幅值和相角，发电机和负荷的功率等)呈指数级增长。然而，大量不具有代表性的特征不仅不能提高数据驱动模型的性能，还增大了模型的学习难度。针对该问题，目前一些特征选择方法(如Fisher线性判别[16]和ReliefF[17-18]等)被用来降低输入数据的维数，但这些方法仍存在许多不足。首先，冗余特征难以完全剔除；其次，共同作用的相互依赖的特征经常作为冗余特征被剔除。为了解决上述问题，文中基于MRMR准则和shapley值构建S-MRMR特征选择框架，该框架能够有效降低输入数据的维度，选择较少的关键特征来训练高性能的评估模型。

设电力系统静态电压稳定评估原始数据集为Z，即:

(1)

式中Vi和θi分别为母线i的电压幅值和相角；PLi和QLi分别为负荷i的有功功率和无功功率；PGi和QGi分别为发电机i的有功功率和无功功率；QSi为分流器i的无功功率；PTi-j和QTi-j分别为输电线路i-j的有功功率和无功功率；y为电压稳定指标，且y∈{1,0},1表示稳定，0表示不稳定；n为样本数量。

基于互信息的MRMR准则由最大相关准则和最小冗余准则两部分构成，即:

(2)

(3)

式中X为所选的关键特征集；|X|为X中的特征数量；I(xi,y)为特征xi与电压稳定指标y的互信息值；I(xi,xj)为特征xi与特征xj的互信息值；O为X中特征与指标间互信息的平均值，表征相关性；R为X中特征间互信息的平均值，表征冗余性。

结合相关性和冗余性，MRMR准则为：

maxJ(O,R),J=O-R

(4)

尽管MRMR准则可选择与电压稳定指标相关性最大且与已选特征冗余性最小的特征，但实际应用时，一些评估结果可能需要多个特征共同表征。这些相互依赖的特征作为个体与电压稳定指标并无强相关性，且它们之间高度关联。因而，此类特征往往被当作冗余特征[19]。针对此问题，文中引入博弈论中的shapley值对MRMR准则进行改进，通过赋予特征不同的权重来区分特征间的依赖关系和冗余关系。特征xi的shapley值的计算方式如下：

(5)

Δi(E)=(P(E∪{xi})-P(E))

(6)

式中Δi(E)为特征xi的边际贡献；E为不包含特征xi的子集；P(E)为仅使用特征集E作为输入时模型对于样本处于不稳定状态的评估概率；P(E∪{xi})为使用特征集E和特征xi作为输入时模型对于样本处于不稳定状态的评估概率；P(E∪{xi})和P(E)之差反映了特征xi对评估结果的影响。

通过上述分析，所提基于S-MRMR的电力系统关键特征选择过程如下：

(1)设原始数据集Z中每个特征的初始权重β(xi)为1，计算Z中每个特征与对应电压稳定指标y之间的互信息值，选取互信息值最大的特征作为关键特征集X中的首个特征；

(2)计算Z中剩余候选特征的shapley值w(xi)，对其特征权重进行更新，即:

(7)

(3)结合MRMR准则和更新后的权重构建式(8)所示的评价函数ξ(xi)，对Z中剩余候选特征进行评价。ξ(xi)值越大表明特征与电压稳定指标之间的相关性越强，且与已选特征的冗余性越弱。选取ξ(xi)值最大的特征作为关键特征:

ξ(xi)=β(xi)′×J

(8)

(4)重复步骤(2)～步骤(3)，直至m个关键特征被选出。

2 GBDT-PL电压稳定评估模型

GBDT是由Friedman提出的一种集成学习算法，它以DT作为基学习器来构建分类模型，其基本原理如下：

(9)

令l表示单个数据点的损失函数，引入表示DT：tk复杂度的正则化项Ω(tk)来防止过拟合，可得目标函数为:

(10)

(11)

(12)

GBDT虽然呈现出较好的评估性能，但仍存在容易过拟合、训练速度慢等问题。为了加快GBDT的收敛速度，降低过拟合概率，提高准确率，GBDT-PL采用分段线性回归树(Piecewise Linear Regression Trees，PL Trees)代替GBDT中的分段常数树，用线性模型fs代替叶子上的常数值，则式(12)可替换为:

(13)

式中ϑ(fs)表示fs的L2范数；Γs表示叶子s上的数据集。

对于树的每个节点，通过最小化式(13)寻找最优分裂方式。为了减少训练PL Trees的计算成本，在树的生长过程中采用增量特征选择(Incremental Feature Selection，IFS)策略和半加性拟合(Half-Additive Fitting，HAF)方法来约束线性模型的大小。

3 迁移学习

泛化能力不佳是数据驱动工具在实际工程应用时所需要解决的重要问题。对于时变电力系统而言，系统拓扑结构会因各种可能的运行需求(如定期维护和发电调度等)而发生变化。现有的训练数据集难以包含所有潜在的运行工况，当未知的系统拓扑导致预测集与训练集数据分布不同时，离线训练的数据驱动模型可能无法为拓扑改变后的系统提供准确可靠的预测结果。因此，有必要对训练好的模型进行更新以适应新的拓扑结构，提高模型评估性能。

迁移学习旨在将源域中学到的知识迁移到目标域中，使得在源域训练好的模型可以直接用于目标域上，且不会造成严重的性能损失。因此，文中利用如图1所示的迁移成分分析(Transfer Component Analysis，TCA)法[20]对GBDT-PL评估模型进行实时更新，以改善GBDT-PL模型泛化能力不足的问题。

图1 TCA示意图Fig.1 Schematic diagram of TCA

设基于电力系统基准拓扑生成的数据集(源域)为DS={XS,YS},XS为源域特征矩阵，YS为电压稳定指标向量。当电力系统拓扑结构改变后，设其数据集(目标域)为DT={XT}，XT为目标域特征矩阵。XS和XT的维数可能不同，为便于处理，对维数较低的特征矩阵补充零向量，使XS和XT维数一致[21]。由于XS和XT所对应的电力系统拓扑结构不同，导致其边缘概率分布不同P(XS)≠P(XT)，若直接利用由DS训练好的GBDT-PL模型对XT进行评估，评估准确率难以保证。

(14)

式中nS为源域样本数；nT为目标域样本数；H表示再生核希尔伯特空间。

为降低计算难度，引入核矩阵K和分布差异矩阵L，则式(14)可简化为:

(15)

式中tr表示求矩阵的迹；K和L的计算公式为：

(16)

(17)

式中KS,S、KT,T、KS,T和KT,S分别表示源域，目标域及跨域数据的核矩阵。核矩阵中的元素为：

Ki,j=φ(xi)Tφ(xj)

(18)

(19)

(20)

综上所述，TCA最终的优化目标为：

(21)

式中μ为正则化参数；tr(WTW)为正则化项，用于控制W的复杂度；H=InS+nT-[1/(nS+nT)]VVT为中心矩阵，V是全为1的列向量；I为单位矩阵；约束条件用于维持数据的散度。通过拉格朗日乘子法求解式(21)的目标函数，得到的映射矩阵W即为φ。

4 静态电压稳定评估流程

基于S-MRMR特征选择框架、GBDT-PL算法和迁移学习，文中提出了如图2所示的电力系统智能电压稳定评估方案，包括特征选择，模型训练和在线评估三个阶段。

图2 智能电压稳定评估方案流程图Fig.2 Flow chart of intelligent voltage stability assessment scheme

4.1 特征选择

原始数据集中包含母线电压幅值和相角、负荷有功/无功功率、发电机有功/无功功率、分流器无功功率、输电线路有功/无功功率和相应的电压稳定指标。基于S-MRMR特征选择过程，筛选出与电压稳定指标相关性较强的关键特征，剔除无关特征和冗余特征，降低GBDT-PL评估模型的训练难度。

4.2 模型训练

将选择的关键特征作为GBDT-PL评估模型的输入，相应的电压稳定指标作为评估模型的输出，对评估模型进行离线训练，建立电力系统输入特征与电压稳定指标之间的映射关系。模型训练过程中，通过网格化方法寻找最优超参数，最终设置GBDT-PL模型的迭代次数为500，学习率为0.1，每棵树的叶子数目为256，L2正则化系数为0.01。

4.3 在线评估

在线应用阶段，若电力系统当前的拓扑结构未改变，则将PMU实时收集的电力系统运行数据输入到训练好的GBDT-PL模型中进行电压稳定评估；若电力系统当前的拓扑结构发生改变，则通过TCA将源域特征矩阵和目标域特征矩阵映射到再生核希尔伯特空间，基于映射后的源域数据对GBDT-PL模型进行重新训练，使之对映射后的目标域数据输出更为准确的评估结果。

5 算例分析

文中采用由电力系统仿真软件PSS/E提供的23节点系统和1648节点系统作为测试系统来验证文中所提智能评估方案的有效性。所有性能测试均在配置为Intel Core i7 3.40-GHz CPU和8 GB RAM的计算机上进行。

5.1 静态电压稳定指标

P-V曲线能够反映随着负荷的增加，节点电压持续降低直至电压崩溃的过程，如图3所示，其中A为当前运行点，B为电压崩溃点(最大功率传输点)，C为临界运行点。

图3 P-V曲线Fig.3 P-V curve

文中基于连续潮流(Continuous Power Flow，CPF)法[22-23]获取电力系统P-V曲线，以此确定系统最大功率传输点，进而计算电压稳定裕度(Voltage Stability Margin，VSM)，即:

(22)

式中Pmax为最大功率传输点的负荷功率；P0为当前运行点的负荷功率。

根据VSM将电力系统当前运行状态分为稳定状态和不稳定状态，即:

(23)

式中u为用户自定义的阈值，可根据不同的静态电压安全标准进行调整。

5.2 模型评价指标

文中选取总体准确率(Accuracy, Acc)和不稳定样本识别准确率(True Negative Rate, TNR)作为模型性能的评价指标。定义电力系统静态电压评估的混淆矩阵如表1所示，表1中TP表示预测正确的稳定样本，FN表示预测错误的稳定样本，FP表示预测错误的不稳定样本，TN表示预测正确的不稳定样本。Acc和TNR的表达式为：

表1 混淆矩阵Tab.1 Confusion matrix

(24)

(25)

总体准确率越高表示模型误分类概率越小，模型评估性能越好；不稳定样本识别准确率越高，模型对不稳定情况的预测越准确。

5.3 23节点系统

5.3.1 样本生成

23节点测试系统拓扑结构如图4所示，包含23条母线、6台发电机和10台变压器。

图4 23节点测试系统Fig.4 23-bus test system

文中基于PSS/E仿真软件和Python程序进行潮流分析和数据仿真，利用MATLAB程序从潮流报表中提取电力系统运行特征。所有的潮流计算结果都进行越限检查，并剔除所有出现过载或电压越限的样本。

为了生成足够的样本数据，以10%为步长，设置70%～130%范围内的7种负荷水平，并对每种负荷水平的发电机和负荷增加80%～120%范围内的随机扰动。然后，基于CPF确定最大功率传输点，进而根据式(22)和式(23)计算电压稳定指标，共仿真生成5 730个样本，其中稳定样本3 381个，不稳定样本2 349个。每个样本包含403个运行特征和相应的电压稳定指标。利用S-MRMR特征选择框架进行特征选择，最终选取30个关键特征作为GBDT-PL评估模型的输入特征。

在下述的算例分析中，采用五折交叉验证法对模型性能进行测试，随机选取80%的样本作为训练集，其余20%作为测试集。

5.3.2 评估模型性能对比

为了证明GBDT-PL评估模型的优势，文中将其与支持向量机(Support Vector Machine，SVM)、DT、深度神经网络(Deep Neural Network，DNN)、随机森林(Random Forest，RF)和GBDT进行对比。在此次测试中，SVM使用径向基核函数，DT使用C 4.5算法，DNN的学习率为0.001，RF的树个数为100，GBDT的迭代次数为500，其余参数使用Scikit-learn默认值。

通过表2所示的测试结果可以看出，SVM、DT、RF和GBDT在总体准确率和不稳定样本识别准确率上都低于GBDT-PL；DNN的总体准确率虽然略高于GBDT-PL，但由于其模型相对复杂，参数过多，导致其训练时间相对较长。综合对比，GBDT-PL评估模型展现出优越的整体评估性能，更适用于电力系统静态电压稳定评估领域。

表2 不同模型性能对比Tab.2 Performance comparison of different models

5.3.3 泛化能力测试

为了分析文中所提智能电压稳定评估方案的有效性，通过考虑如表3所示的拓扑结构变化情况对文中所提方案进行性能测试。对于表3中6种不同的拓扑结构，采用5.3.1节中样本生成方法生成6组不同的测试集(A，B，C，D，E，F)，每组测试集包含1 000个样本。相应的测试结果如表4所示，其中Acc1表示未使用迁移学习的GBDT-PL评估模型的总体准确率，Acc2表示基于迁移学习更新后的GBDT-PL评估模型的总体准确率。

表3 拓扑结构变化Tab.3 Topology changes

表4 泛化能力测试结果Tab.4 Generalization ability test results

测试结果表明，对于不同的拓扑结构，文中所提方案的评估性能未出现较大的波动，均能展现出95%以上的总体准确率。与不使用迁移学习的方案对比，文中所提智能电压评估方案可以大幅度提升评估模型的泛化能力，使其对于电力系统的各种拓扑变化具有较好的鲁棒性。

5.4 1648节点系统

为了进一步分析文中所提方案应用于大电网时的有效性，将其应用于1648节点系统进行性能测试。1648节点系统包含1 648条母线、313台发电机、182个分流器和2 294条线路。基于5.3.1节中的样本生成方法生成12 574个样本，每个样本包含37 439个运行特征。

5.4.1 特征选择框架效果测试

为了测试文中所提S-MRMR特征选择框架对于GBDT-PL模型性能提升的效果，选取不同数量的输入特征进行模型性能测试，测试结果如图5所示。当特征数量为800时，评估模型准确率为98.74%，训练时间为60.24 s。之后再增加输入特征，模型准确率无明显提升，但模型训练时间大幅度增加。文中所提S-MRMR特征选择框架可以选择较少特征训练出准确率较高的评估模型，显著缩减模型训练所需时间。

图5 模型性能随特征数量变化关系Fig.5 Relationship between model performance and number of features

5.4.2 PMU测量误差

文中所提智能电压稳定评估方案在实际应用时可能会受到PMU测量误差的影响。为了分析测量误差对文中所提方案的影响，通过在数据集中添加不同信噪比的高斯白噪声模拟PMU测量误差进行性能测试。根据IEEE C37.118标准，PUM测量的总矢量误差(Total Vector Error，TVE)应小于1%[24]。在测试过程中，考虑如下两个场景:场景1：只在测试集中添加噪声;场景2：训练集和测试集中均添加噪声。

两种场景下文中所提智能评估方案的性能测试结果如图6所示。可以看出，智能评估方案在场景2下的总体准确率高于场景1下的总体准确率。此外，随着噪声的增大，两种场景下的智能评估方案性能均略有下降，但仍然保持在一个可接受的范围(Acc>96%)。由此可见，文中所提智能评估方案对PMU测量误差具有较强的鲁棒性。