基于CBAM-CNN 的电力系统暂态电压稳定评估
2024-05-07柳圣池李新宇陈德秋郭攀锋
李 欣,柳圣池,李新宇,陈德秋,鲁 玲,郭攀锋
(1.三峡大学电气与新能源学院,宜昌 443000;2.智慧能源技术湖北省工程研究中心(三峡大学),宜昌 443000;3.中国长江三峡集团有限公司,宜昌 443631;4.国网湖北省电力有限公司咸宁供电公司,咸宁 437100)
电力系统的暂态电压稳定SVS(short-term volage stability)是指系统电压在受到重大扰动后,在不发生电压崩溃的情况下保持或恢复到允许范围的能力[1]。随着电力消费的快速增长、可再生能源的大规模整合,以及动态负载的不断渗透,暂态电压不稳定已经成为电力系统的突出问题[2-3]。因此,正确评估电压稳定性、及时采取措施并防止停电事故的发生至关重要。
目前,用来进行SVS评估的方法主要有时域仿真法和轨迹灵敏度分析法等。时域仿真法的结构简单,但仿真所需要的时间长,且对电力系统模型和参数的准确性要求较高。轨迹灵敏度分析法可以实现电力系统的实时评估,但无法处理电力系统内部高度复杂的非线性关系。随着广域测量系统WAMS(wide area measurement system)和相量测量单元PMU(phasor measurement unit)[4]的普及,数据驱动方法为SVS评估提供了新的思路。
基于数据驱动的SVS 性评估模型,可以直接利用PMU 收集到的实时数据对当前系统稳定性状态给出准确评估结果。近年来,许多现有的机器学习ML(machine learning)方法,例如,人工神经网络ANN(artificial neural network)[5]、决策树DT(decision tree)[6-7]、和随机森林RF(random forest)[8]等已被用于基于数据驱动的SVS研究,并取得了较好的评估结果。随着ML 技术的快速发展,一些深度学习DL(deep learning)[9-10]模型在模式识别领域取得了优于上述相关技术的性能,卷积神经网络CNN(convolutional neural network)作为DL 领域最具代表性的模型之一,凭借其从原始数据中获取重要特征的强大能力,在SVS评估中得到了广泛的应用。
文献[11]提出一种基于随机权重神经网络的智能系统,将SVS 评估问题划分为瞬态电压崩溃的分类子问题和不可接受的动态电压偏差的预测子问题。由于文献[11]所提方法是由数据驱动,输入数据的质量会影响其准确性,且没有考虑数据丢失、数据不确定及坏数据对模型性能的影响,面对日益复杂、多变的电网结构,模型的鲁棒性和泛化性有待进一步研究。文献[12-13]均使用卷积神经网络CNN(convolutional neural network)来建立SVS 评估模型,通过卷积操作实现对局部特征的提取和学习,但电力系统的暂态电压问题往往涉及到全局性的系统行为和相互作用,单纯的CNN 算法可能无法很好地捕捉到电力系统各个部分之间的复杂关系。文献[14-15]对传统的CNN模型进行了改进,引入残差网络ResNet(residual network)增强模型的可解释性,但没有考虑系统拓扑结构发生改变的情况下模型的适应性问题,缺少在线更新的过程;文献[16]设计一种具有残差结构的新型多图注意力网络来捕获其稳定性特征,结合注意力机制与迁移学习的优点,应用改进的图注意力机制,增强其对电力系统拓扑变化的适应性,但该方法用于功角稳定的研究,并未涉及电压问题。综上所述,目前电力系统SVS评估研究中还存在着模型提取特征能力差、系统拓扑结构发生改变时的适应性差,以及暂态安全评估指标复杂且不明确等问题。
为解决上述问题,本文将DL 与注意力机制相结合,将卷积块注意力模块CBAM(convolutional block attention module)[17]插入传统CNN 中,该模块将PMU 的数据沿着通道和空间两个独立的维度依次提取重要特征,自动调整输入数据中内容信息和位置信息的权重。在保证较小时间损耗的同时,进一步提升CNN 对系统暂态电压状态的识别能力。同时,所提方法还与迁移学习相结合,加快了模型的更新速度,提高了模型在系统拓扑结构发生变化时的适应性。
1 基于注意力机制的CNN 模型
1.1 模型的整体框架
SVS 评估问题本质是一个二分类问题,针对该分类问题开发基于CNN 的模型,旨在将DL 应用于SVS评估,所开发的模型的思路是利用系统故障后的实时数据与SVS评估建立映射关系,实现提前评估系统的稳定状态,从而为应急控制行动提供依据。由于SVS 与母线电压幅值和负荷变化息息相关,因此选用故障后的母线电压、负荷的有功功率和无功功率信息作为输入变量。这些数据本身就是时间序列数据,可以用CNN的卷积操作提取这些数据的时间特征。插入卷积块注意力的卷积神经网络CBAM-CNN(convolutional block attention module-convolutional neural network)模型引入了通道注意力机制和空间注意力机制,能够自适应地关注输入特征图中的重要通道和空间位置,进而将系统网络拓扑信息集中到学习模型中以利用空间信息。通过这种方式,所提模型模拟了具有完整卷积结构的SVS的时空特征。具体来说,输入数据和样本标签首先被排列成适合CNN 处理的类似于图像的矩阵样式,即
式中:Xn为输入模型的特征向量;Yn为每个样本对应的标签;n为样本总数;Uij为第i时刻第j条母线的电压值,i的值由观测窗口大小决定;PiB、QiB分别为负荷的有功功率和无功功率;B为系统中负荷数;yj为第j条母线对应的稳定状态。
CBAM模块被插入到CNN中,自动调整输入数据中内容信息和位置信息的权重,从而增强模型的分类效果。在模型的在线更新阶段,CBAM 提取的重要特征被用作新数据的筛选条件。在此基础上,结合微调技术,实现模型的快速更新,其具体结构如图1 所示。图1 中,softmax 为分类函数;ReLU 为激活函数;FC为全连接层;BN为归一化操作。
图1 暂态电压稳定评估模型Fig.1 Short-term voltage stability assessment model
1.2 用于SVS 评估的CNN 结构
为了确定模型的详细结构并应用于后续问题,首先设计了具有较大网络容量的模型,训练模型直到过拟合,再通过减少神经元的数量或添加dropout操作来减轻过拟合的影响[18]。使用的模型参数如表1所示。
表1 CNN 模型的具体参数Tab.1 Specific parameters of CNN model
为提高模型的收敛速度,防止发生梯度消失的情况,选择ReLU作为激活函数,其表达式为
式中,x为激活层的输入ReLU函数,用来提取权重最大的特征。
1.3 CBAM-CNN 的原理
CBAM-CNN通过CBAM来增强模型的全局感知能力。注意力机制可以自适应地调整各个特征图的权重,使模型能够更加关注电力系统中具有重要影响的区域或特征。在电力系统中,不同部分之间存在复杂的相互作用关系,例如发电机、变压器、输电线路等。CBAM-CNN 通过注意力机制能够捕捉到这些重要的全局信息,从而更准确地评估SVS。
注意力计算的整体过程可以总结为
式中:⊗为逐元素乘法;F为中间特征图;F′为经过通道子模块后的输出;F″为最终的细化输出;Mc(F)为通道注意力;Ms(F′)为空间注意力。
CBAM-CNN 的整体工作原理如图2所示,输入的数据先经过常规卷积操作得到一个中间特征图F∈RC×H×W。其中,C、H、W分别为特征图的通道数、深度和宽度,R 为实数集。CBAM 对中间特征图进行处理,进而得到通道注意力图Mc∈RC×1×1和空间注意力图Ms∈R1×H×W。CBAM 的引入可以使模型充分学习通道轴和空间轴上的信息,从而有效地帮助信息在网络中的流动。
图2 CBAM-CNN 的整体结构Fig.2 Overall structure of CBAM-CNN
1.3.1 通道注意力模块
通道注意力子模块提取的是输入数据的内容信息特征,利用特征之间的通道关系生成通道注意力图,并将其传递到空间注意力子模块,特征图的每个通道都是一个特征检测器。为解决通道注意力难以计算的问题,采用对输入特征图的空间维度进行压缩的方法,通道注意力子模块的工作原理如图3所示。
图3 通道注意力模块Fig.3 Channel attention module
首先,为了对特征图的空间信息进行汇总,本文将经过常规卷积操作提取的特征分别传入到平均池化层和最大池化层中,生成代表平均池化特征的空间环境描述符和代表最大池化特征的空间描述符。由于平均池化操作可以提取特征图中所有特征信息,而最大池化操作则保留权重最大的特征,所以采用将两种操作相结合的方法来提高模型提取重要特征的能力。然后,这两个描述符通过共享的多层感知机网络进行处理。最后,在共享网络应用于每个描述符后,使用逐元素求和法将输出特征向量进行合并,计算得到通道注意力,生成通道注意力图Mc∈RC×1×1。
综上所述,通道注意力的计算方法可表示为
式中:σ为sigmoid 函数;MLP 为多层感知机;AvgPool(F)与MaxPool(F)分别为对中间特征图F进行平均池化操作和最大池化操作;W0∈RC/r×C、W1∈RC×C/r为多层感知机网络的权重系数,用来处理描述符并生成通道注意力图的过程。需要注意的是,该权重系数在输入中是共享的,并且在W0后使用了ReLU激活函数。
1.3.2 空间注意力模块
与通道注意力不同,空间注意力子模块提取的是输入数据的位置信息特征,利用空间内部关系生成空间注意力图,这与通道注意力互相补充。为了解决空间注意力难以计算和难以生成有效的空间特征图的问题,采用将通道细化的特征沿通道轴依次经过最大池化层和平均池化层的方法。空间注意力子模块的工作原理如图4所示。
图4 空间注意力模块Fig.4 Space attention module
首先,对通道细化特征F′进行两个池化操作,对特征图进行通道信息的聚合,进而生成两个二维空间特征图∈R1×H×W和∈R1×H×W。然后,将这两个特征图进行拼接并通过一个标准的卷积层进行卷积操作。最后,生成空间注意力图Ms(F)∈RH×W。
综上所述,空间注意力的计算方法可表示为
式中:f7×7为卷积操作中过滤器的大小为7 × 7;为经过通道方向的平均池化操作得到的特征图;为经过通道方向的最大池化操作得到的特征图;[]表示连接操作。
1.3.3 注意力模块的顺序
对于输入的电力系统信息,通道和空间这2 个注意力模块计算互补注意力,分别关注输入数据的内容信息和位置信息。2个子模块的排列方式也会对模型的性能产生影响,可以并列或顺序排列。在模型调试过程中,发现顺序排列比并列排列能给出更好的效果,因此本文采用2个子模块顺序排列的方式。
2 SVS 评估的具体流程
2.1 方案流程
CBAM-CNN 算法具有实时性和高效性的优势。一旦CBAM-CNN模型训练完成,它可以在实时或快速评估的场景中进行预测。所提方案的具体实施过程主要包括3个步骤,离线训练、实际应用、在线更新。其方案流程如图5所示。
图5 方案流程Fig.5 Flow chart of the proposed scheme
2.1.1 离线训练
首先,在考虑负荷、电动机占比、故障和发电机出力等因素下,建立广义的初始数据库;然后,将时域模拟得到的样本与历史运行数据混合,形成初始数据集D0;最后,离线训练模型以构建映射和特征提取器。
2.1.2 实际应用
最终的评估模型可以根据PMU 接收的实时测量数据快速生成稳定性评估结果。评估结果若为失稳(功角失稳和电压失稳),运行人员立即启动相应的控制措施,防止出现大规模停电事故;如果出现D0中未考虑到的场景,则通过仿真软件获得相应新网络架构的新数据集Dnew,并在原始模型上进行测试;如果Dnew的测试精度PDnew未能达到设定的阈值Aset,则应及时更新模型,直到测试精度大于阈值时,停止学习。
2.1.3 在线更新
微调技术与CBAM 被用来实现在线更细新功能。一个新的含有不同的负载水平和某些突发事件的数据集Di被用来更新模型。对Di的数据进行筛选,选取CBAM 提取的重要特征对应的数据,用这些数据进行训练,可以更快地更新模型。如果Di的测试精度PDi在设置的最大迭代次数内没有达到阈值,则需继续进行仿真训练。这就意味着需要进行更多基于Dnew的时域模拟,以构建更准确映射关系的完整数据集。在案例研究中,Aset= 97%、最大迭代次数为200。
2.2 SVS 判据
根据文献[19-21],本文采用的SVS判据为
式中:ASVSI为SVS系数SVSI(short-term voltage stability index);Umin为故障后母线电压的最小值;Us为不发生电压崩溃的电压最小值,取0.8 p.u.;Ud为故障清除后母线电压在任意同一个周期内最大值与最小值的差值;Tu为实际电压值小于Us的时间;Ts为实际工程中允许电压低于Us的最大时长,取10 s。式(7)中2 个不稳定判据分别针对电压崩溃和电压振荡2 种情况,当USVSI值为1 时表示系统电压稳定,贴标签为1;反之则不稳定,贴标签为0 且认为系统中任意一条母线失稳则系统发生失稳。
2.3 模型性能的评价指标
采用混淆矩阵构建4个指标来全面衡量SVS模型的评估效果。混淆矩阵如表2所示。
表2 混淆矩阵Tab.2 Confusion matrix
表2 中,TP 为稳定样本预测为稳定的样本个数;FN 为稳定样本预测为失稳的样本个数;FP 为失稳样本预测为稳定的样本个数;TN 为失稳样本预测为失稳的样本个数。
4个评估指标表达式分别为
式中:Acc 为整体样本预测的准确率;TNR 为预测正确失稳样本占所有整体失稳样本的比例;TPR 为预测正确的稳定样本占所有稳定样本的比例;FPR为预测错误的失稳样本占所有失稳样本的比例。
3 算例分析
本文所提方案在IEEE 39和IEEE 300节点系统中进行测试。样本集均由软件PSS/E的瞬态稳定性仿真模块批量生成。算例研究的硬件平台为CPU Intel(R)Core(TM)i7-10750H CPU@2.60GHz 2.59 GHz,RAM 64 GB,GPU Nvidia Geforce RTX 2060,CBAM-CNN的框架是在Tensorflow中实现。
3.1 样本生成
IEEE 39 节点系统由10 台发电机组、39 条母线、12 台双绕组变压器、19 个负荷组成,其单线图如图6 所示。仿真时间为20 s,间隔采样时间为0.01 s。通过设置不同的潮流水平、不同的故障位置、不同的故障清除时间、不同的感应电机变比,最终生成9 450 个样本。这部分数据为原始数据集D0,其中,稳定样本为6 432个,不稳定样本数量为3 018个,具体设置见表3。将观测窗口内窗口长度为2 s 的数据排列成类似图片的形式,每一个样本的输入数据维度为U∈R200×39,P∈R200×19,Q∈R200×19,输出结果为0或1。
表3 IEEE39 节点系统样本生成方案Tab.3 Sample generation scheme for IEEE 39-bus system
图6 IEEE 39 节点系统接线Fig.6 Wiring of IEEE 39-bus system
3.2 模型训练与测试结果
样本被随机分为训练集占80%和测试集占20%。母线电压等数据在输入模型前要经过最大最小归一化处理,以消除不同特征之前的幅度和数量级的差异,重复多次测试取测试结果的平均值作为最终结果,以消除偶然性带来的影响。图7给出了不同迭代次数下模型的准确率和损失函数值曲线。由图7可以看出,损失函数呈下降趋势,准确率不断上升,且未出现过拟合的现象。测试集的最高精度为98.15%,损失函数的最低值为0.138 4。
图7 准确率与损失函数曲线Fig.7 Accuracy and loss function curves
为进一步体现CBAM 的优越性,采用传统CNN、DT、ANN、RF作为对比算法。其中,CNN采用CBAM-CNN 模型中CNN 的参数和结构。ANN、DT和RF 的参数和实现过程参考了文献[7-10]中的相关设置。采用测试集样本作为训练数据,不同模型的性能对比结果如表4所示。
表4 不同模型性能对比Tab.4 Comparison of performance among different models%
由表4可知,CBAM-CNN模型相较与其他方法拥有更好的模式识别能力,总体准确率达到98.15%,对于不稳定样本的预测准确率为98.67%;传统CNN的测试精度平均为96.61%,低于CBAM-CNN 的98.15%,因此可以证明CBAM的引入有助于提高CNN模型的分类能力;ANN 结构简单,处理大型数据的能力较差,容易出现过拟合的问题,对SVS 状态的识别能力较差;DT 与RF 均属于浅层机器学习模型,训练所用时间少,但在处理高维数据和模式识别的能力上其性能远不如CNN。由此可见,CBAMCNN模型具有良好的特征提取能力,能以更高的精度对系统暂态电压的稳定情况进行判断。
3.3 样本量对模型性能的影响
训练样本的数量会影响模型的准确性和训练时间,采用改变训练集样本比例的方法(测试集样本没有变化)来研究训练样本数量对模型性能的影响。训练集的比例被设定为20%、40%、60%、80%和100%。模型的其他参数保持不变,其最终结果如图8所示。
图8 不同比例训练集的模型性能Fig.8 Model performance at different proportions of training set
由图8可以看出,当训练样本的数量为原始训练集的80%时,准确率已经到达了97.01%(Acc>97%),达到了模型对电压稳定评估预测精度的要求,但耗时要比训练集比例为100%时低很多。如果训练样本的数量减少,模型的预测精度就会下降。
3.4 耗时对比
比较CBAM-CNN 与传统CNN 模型在训练及在线应用阶段的时间消耗,以验证本文所提模型的时效性,其结果如图9所示。
图9 耗时对比结果Fig.9 Result of comparison of time consumption
由图9可以看出,常规CNN模型训练迭代50次需要826.74 s,CBAM-CNN 模型用时983.12 s,时间增加了18.9%;在线应用阶段,常规CNN 模型用时0.126 4 s,CBAM-CNN模型用时0.137 6 s,与CNN相比只增加了0.011 2 s(在线应用阶段耗时为测试所有测试集样本所消耗的时间)。由于模型的训练过程是离线进行的,所以这个阶段花费时间较长。然而,在在线应用阶段,需要在较短的时间内确定系统SVS 的评估结果,基于耗时的比较,这个要求可以得到满足。因此,可以认为CBAM-CNN模型在提高精度的同时,并没有明显增加耗时。
3.5 特征可视化
为了更直观地观察CBAM-CNN 模型分类的效果,使用t-SNE算法,通过计算低维空间中样本点之间的相对距离来尽可能地还原高维空间中样本点的相似度,模型的分类效果如图10所示。
图10 特征提取效果Fig.10 Feature extraction effect
由图10 中可以看出,杂乱无章的原始数据在经过模型训练后特征分布有很大改善,失稳样本与稳定样本的界线变得明显,仅有个别样本是重叠在一起的。因此,可以说明CBAM-CNN具有强大的特征提取能力,能够完成SVS性的预测任务。
3.6 参数的选择
观察窗口长度是影响模型性能的一个重要因素,不同时间窗口长度的测试集效果如表5 所示。经过测试,选择故障发生后的2 s 时间段作为观察窗口,其他超参数的研究与观察窗口类似。采用Adam 优化器,相对平衡学习率设定为0.001、Dropout为0.5、网络共迭代50次。
表5 观测窗口的选择Tab.5 Selection of observation window
3.7 鲁棒性分析
在实际应用中,尽管PMU通常是可靠和准确的,但也有可能出现数据丢失、数据不准确、坏数据及噪声干扰的情况。本文针对数据丢失和噪声干扰两种情况进行实验,验证所提模型具有良好的鲁棒性。
3.7.1 数据丢失分析
由于所提出的方法是由数据驱动的,输入数据质量会影响其准确性和早期性,当数据丢失严重时,模型可能无法对系统状态进行准确的评估。为验证所提模型在部分数据丢失时仍能给出正确的系统暂态电压评估结果,构建5种不同的数据丢失场景,每种场景均生成相应的测试集,模型准确率测试结果如表6所示。
表6 数据丢失测试Tab.6 Data loss test
由表6 可知,丢失的母线数据越多,模型性能越差,这主要是由于数据丢失导致所构建的非线性映射关系不够准确,进而影响了模型的评估结果;模型在有3条母线数据丢失的情况下,对系统电压状态评估的准确率仍能达到97.06%(Acc>97%),说明所提模型对数据丢失具有良好的鲁棒性。
3.7.2 噪声干扰分析
为验证所建模型的抗噪能力,加入信噪比为10、20、30、40、50 dB 的高斯噪声进行测试,测试结果如图11所示。
图11 加入噪声干扰时的模型评估性能Fig.11 Evaluation performance of model when noise is added
由图11 可以看出,加入噪声干扰后的所有模型性能均有所下降,模型性能随着噪声水平的升高而降低。深度学习模型较传统机器学习模型的抗噪声能力更强。其中,CBAM-CNN 模型在10 dB 噪声的干扰下,准确率仍能达到97.41%,说明该模型的抗噪表现良好,鲁棒性强。
3.8 拓扑变换的影响
为了验证本文模型对不同拓扑结构的适应性,实验中考虑IEEE 39 总线系统的N-1 拓扑结构,生成2 个新的数据集D1和D2。D1样本的生成环境为16~24 和4~14 号线断开;D2的生成环境为发电机终端的功率分布发生重大变化,其他设置与D0相同。2个数据集均生成4 500个样本,训练集和测试集的比例保持不变。
将2 个数据集用于传统CNN 模型和其他机器学习模型中。CNN、ANN 模型中有全连接层,可以引入微调技术,但其他2 种算法不适宜,最终结果如图12所示。
图12 N-1 拓扑样本的评估结果Fig.12 Evaluation results of N-1 topology sample
由图12中可以看出,CBAM-CNN模型的性能最好,其他传统模型的准确率明显低于该模型;RF、DT的预测精度相对较低,不能适应电力系统拓扑结构的变化,其参数在重新训练时将被完全重置;在D0到D2这3个训练任务中,CNN的准确率分别为96.61%、94.26%和93.12%,低于CBAM-CNN模型的98.15%、97.83%和97.35%。因此,CBAM-CNN 模型可以适应电力系统拓扑结构变化,具有良好的泛化性。
3.9 IEEE 300 节点系统
为说明所提方法在大系统中的有效性,将CBAM-CNN 应用于IEEE 300 节点系统中。IEEE 300 总线系统由300 条总线、69 台发电机、166 个负载和411 条传输线组成,数据集生成方案如表7所示。数据集共包含6 560 个稳定样本和3 640 个不稳定样本,每一个样本的输入数据维度为U∈R200×300,P∈R200×166,Q∈R200×166,输出结果为0或1;其他配置和测试方法与IEEE 39 节点系统相同。所用模型的结构在第1节的表1中给出。
表7 IEEE 300 节点系统样本生成方案Tab.7 Sample generation scheme for IEEE 300-bus system
训练集与测试集的比例仍为8∶2。用测试集数据对5种模型性能进行测试,测试结果如表8所示。
表8 IEEE 300 节点系统上不同模型的测试结果Tab.8 Test results of different models on IEEE 300-bus system%
由表8 可以看出,系统规模的扩大会一定程度上降低模型的性能,这是因为电力系统是一个复杂的非线性系统,尽管对模型做了改进,仍会出现漏判的情况;CBAM-CNN 模型的预测精度为98.04%,高于其他模型的精度。在IEEE 39总线系统中测试的精度为98.15%时,测试的2个系统之间的准确度差异不大,这得益于CBAM强大的提取特征能力。
4 结 论
本文提出一种基于CBAM-CNN 的SVS 评估方法。该方法采用数据驱动原理,挖掘电网故障后母线电压、有功功率、无功功率与暂态电压稳定的映射关系,及时给出稳定状态。最后在IEEE 39 节点和IEEE 300节点系统上进行了算例分析,实验结论如下。
(1)CBAM-CNN 具有强大的特征提取能力,它将基于注意力的特征细化应用于通道和空间两个独立的模块,自动调整输入数据中内容信息和位置信息的权重,通过多层卷积和池化操作,捕捉电力系统数据中的空间和时间相关性,并在保证较小时间损耗的同时实现了可观的性能提升。
(2)在模型在线更新阶段,利用CBAM 对新数据集提取特征,加快模型的更新速度。微调技术和CBAM 的结合可以有效解决系统拓扑结构变化时模型性能下降的问题。
(3)所提模型在数据丢失和噪声影响下仍能保持良好的评估性能,鲁棒性较强。且在系统运行条件发生大规模变化时不会出现明显的性能下降,拥有良好的泛化能力。