面向暂态电压稳定评估的卷积神经网络输入特征构建方法
2022-01-11杨文佳
朱 林,张 健,陈 达,2,苗 璐,龙 霏,杨文佳
(1. 华南理工大学电力学院,广东省广州市 510640;2. 国网江苏省电力有限公司,江苏省南京市 210024;3. 广东电网有限责任公司电力调度控制中心,广东省广州市 510660)
0 引言
在当今电力系统交直流互联的发展模式下[1-3],交直流之间的相互作用使得系统的暂态过程变得更加复杂,其中暂态电压稳定问题日趋突出,对交直流系统的安全稳定运行提出了更加严峻的挑战。
用于电力系统暂态电压稳定评估的方法包括时域仿真法、直接法和机器学习法等[4-6]。时域仿真法在研究中被普遍采用,但受对象建模详细程度的影响较大,同时对计算仿真能力也有一定的要求;直接法是时域仿真法的重要补充,需要构造目标系统的能量函数,有着计算速度快、可以在线应用等特点;随着人工智能、大数据理论的发展成熟,机器学习方法也逐步在交直流电力系统安全稳定评估中获得应用[6-11]。
文献[7]根据同步相量测量单元(PMU)实测数据构建形态相似距离特征,采用决策树算法完成电压暂态稳定性的在线评估,该方法可为分类结果提供良好的可解释性;文献[8]基于传统电压稳定指标分解及响应数据构建了36 维的卷积神经网络(convolutional neural network,CNN)输入量,但特征选取中未加入对直流系统特性、新能源出力等方面的考虑;文献[9]以故障前系统稳态量为输入特征,以神经网络模型作为评估模型,但其忽略了故障特征将导致模型丢失大量影响暂态电压稳定的关键信息。文献[10]以电压时序作为暂态电压评估模型的特征输入,引入时间序列shapelet 方法,从故障后量测得到的动态序列中进行时序特征提取,但不易满足在线评估快速性的要求。文献[11]利用CNN实现了暂态电压稳定的评估,对选取的各输入特征必要性进行了解释,并采用粒子群算法来优化CNN模型的超参数,在稳定评估中得到了较好的结果,但在输入特征集构建的合理性和有效性上缺乏深入的系统性探讨。
由上述分析可知,以CNN 为代表的深度学习算法已应用于电力系统暂态稳定评估中。凭借其较好的准确性和快速性,CNN 在暂态电压稳定评估问题上表现良好,其稳定分类评估效果的优劣在很大程度上依赖于输入特征量[12]。但现有研究更多关心的是CNN 模型的建立与超参数选取,而忽略了输入特征提取这一重要的前端工作。目前,普遍的做法是根据主观经验选取特征变量,但仍缺少输入特征选择的理论支撑。实际电网规模庞大且元件数量众多,对所有的线路和机组进行特征提取必然导致CNN 输入特征的维度过高,这种方案下的模型训练和评估应用不仅费时耗力、效率不高,而且在输入特征的构成上亦缺乏可解释性。本文认为,尽管可以机械地通过提高训练次数或扩大训练样本来提升CNN 模型精度,但围绕研究对象的特点,选择最为合适和有效的输入特征才是更为明智的技术选择——确保信息不丢失、不冗余,为学习结果提供可解释性,在模型的精度与效率方面均具有显著的提升效果。
综上所述,本文提出一种面向交直流系统暂态电压稳定评估的CNN 输入特征构建方法。首先,利用双阶段分区方案来降低输入特征量的维度和冗余度;然后,系统化探究CNN 输入特征的构建方式,确定了面向暂态电压稳定评估CNN 模型的完整输入特征,提出了输入特征的相应评价指标与有效性验证流程;最后,采用实际电网数据验证了所提方法的有效性。
1 双阶段分区方案
将电力系统所有节点的全部信息都纳入暂态电压稳定评估中必然耗时费力。事实上,电力系统受扰后同一区域内节点的暂态电压特性相似,不同区的特征还存在冗余特点,不需要全部纳入暂态电压稳定评估分析所需的特征集中。若能将大规模系统划分为若干个区域,选择各区域内具有代表性的节点来构建合理的信息特征集,这将有助于对失稳范围的界定,高效地实现整个大系统的暂态电压稳定评估。
合理的分区结果能良好地表征各分区内的暂态电压特性[13]。考虑到应用CNN 进行暂态电压稳定评估,关键在于根据不同区域的特点提取特定的输入信息。因此,对电力系统进行合理的分区是输入特征构建中需要优先考虑的约束条件,可以减少输入特征量的维度和信息冗余度,降低CNN 模型的训练难度,从而有效缩短计算时间,提升电力系统暂态电压稳定评估的整体效率。
本文提出一种基于系统结构和暂态电压特征的双阶段分区方案。先由系统拓扑关系和地理位置约束给出初始的分区结果,再依托分区节点暂态电压特征相似性对初始分区进一步聚类,得到降低输入特征维度和信息冗余度后的最佳分区方案,为后续的输入特征构建奠定基础。
1.1 基于系统拓扑的初始分区
基于电网的拓扑关系,优先根据实际地理位置,将待研究系统分为N个初始分区,提炼分区节点的暂态电压稳定裕度η,筛选出各分区中的代表节点。
本文统筹兼顾了最低母线电压、低于暂态电压阈值的持续时间以及故障后母线电压的恢复水平,尝试从2 个维度来表征分区节点暂态电压稳定裕度η,即电压最低值与阈值之间的差值,以及电压低于阈值的持续时间与允许最大持续时间之间的差值。
式中:Vmin为切除故障后最低暂态母线电压;Vth为暂态电压阈值;Tth为低于阈值的允许持续时间;T为母线暂态电压低于电压阈值的持续时间;Vs为故障后的稳态电压值;kv和kt分别为电压和时间的权重系数,通常认为两者权重相等。
通过式(1)可以表达:η值越小,则节点暂态电压稳定裕度越小,在暂态电压失稳的情况下,η值为-1。
然后,将初始分区中各节点进行整合,用于描述分区整体的暂态电压特性,对分区所属的全部m个节点,取n个不同场景下的暂态电压稳定裕度,整理成如式(2)所示的矩阵形式。
由式(2),依次取第i(i=1,2,…,m)个节点在第k(k=1,2,…,n)个场景下的稳定裕度值ηik,加和后可得到该节点在n个场景下的综合暂态电压稳定裕度,并记为Mi(i=1,2,…,m),选用中位数Mi对应的节点作为分区代表节点。
1.2 基于暂态电压相似性的分区聚类
依托节点暂态电压的相似性,在第2 阶段对第1阶段的分区结果进一步聚类,从而完成对系统的合理分区。由式(2),取每一行可得到对应节点的暂态电压稳定裕度向量。为不失一般性,对于节点i和j,可分别获得相应的暂态电压稳定裕度向量[ηi1,ηi2,…,ηin]和[ηj1,ηj2,…,ηjn]。
节点i与节点j的暂态电压相似性可以通过节点暂态电压稳定裕度向量对应的欧氏距离Dij来量度,即
欧氏距离Dij越大,代表节点i和j的“距离”越远,则节点i和j的暂态电压相似度越低,反之亦然。因此,可以基于式(3)获得子分区内以及不同子分区间的WARD 距离,从而描述代表节点的暂态电压相似程度。
设子分区Sa的内部WARD 距离为da:
式中:a=1,2,…,A,其中A为现有子分区数量;p和q为子分区Sa中的节点。
设子分区Si和子分区Sj之间的WARD 距离为lij,有
若将分区Si和Sj合并生成新分区Sk,则新分区Sk内部WARD 距离dk变成:
同时,还需要更新这一新分区Sk与其他分区(以分区Sl为例)之间的WARD 距离,有
获得全部子分区的内部WARD 距离后,得到其中的最大值dmax为:
利用dmax来构造标准化增量指标Δd,如下式所示:
在第2 阶段,将以dmax和Δd为指标来综合衡量分区效果,期望两者同时取最小值,以表征分区内各节点暂态电压特性相似度较高,且对应的分区数量少,从而确定最佳分区方案。
2 电压暂态稳定评估的输入特征构建
通过第1 章的双阶段分区降低了输入特征的维度和冗余度,接下来需要为CNN 电压暂态稳定评估模型的输入特征进行优选与构造。现有输入特征的选取主要存在2 个方面问题:一方面,在构建输入特征时大多根据运行经验主观选取变量;另一方面,以往的研究未能充分提取故障特征中含有的大量信息,导致影响暂态电压稳定性的因素缺失,从而影响其评估表现。
针对上述问题,本文从电源-网络-负荷3 个维度切入,探讨影响系统暂态电压特性的各类要素,考虑系统级和元件级的稳态特征量和故障信息,并以此为依据完成CNN 评估模型的输入特征构建。
2.1 关键影响因素分析
1)电源。伴随着电力工业的快速发展,电压稳定问题日益凸显。电力系统的暂态电压失稳往往发生在高负荷水平下,且普遍认为与无功功率平衡、发电机出力限制、有载调压变压器动态性能和负荷的动态特性关系密切。
电源在电压稳定性问题中的角色与作用不容忽视。通常,同步电源具有较好的抗扰性,在暂态过程中发挥着重要的支撑作用,系统的暂态电压失稳会更多地集中体现在负荷节点上[14]。但是,新能源的大规模接入会直接影响系统的抗扰能力——通常认为,会使系统惯量减小,系统频率波动更为明显,而且降低了系统动态无功储备,导致在电压支撑能力上的急剧下降。尤其是风机及其控制与系统运行特性密切相关,当风电并网功率逐渐增加时,系统逐步呈现出暂态电压失稳模式[15]。
2)网络。电力系统中运行参数的改变可能导致系统平衡点不存在,从而引起系统失稳。在电压稳定分析中,可以利用PV曲线,探讨网络输送功率的改变与临界失稳电压之间的关系。在这一过程中,将集中体现系统大扰动后的网络输送能力到临界拐点间的“距离”,从而量化电压稳定裕度。
考虑直流系统接入时,直流系统的控制策略对整个系统的动态影响显著。特别是在故障切除后的恢复期,一旦直流系统的功率恢复过快,会导致从交流系统吸收大量的无功功率,从而加剧故障恢复期间的无功不平衡,可能引起系统的暂态电压失稳。
3)负荷。与系统暂态电压特性关系最为密切的是感应电动机负荷。故障发生引起母线电压跌落,低电压下的感应电动机将趋于堵转并吸收无功功率,这将加剧母线电压的跌落,形成电压跌落的正反馈,从而引发区域性的无功需求激增,使得无功不平衡进一步恶化,最终导致系统暂态电压失稳。
此外,也有研究将故障发生位置、故障持续时间、有功输送能力等视为影响暂态电压稳定的重要因素[16-17]。
经过上述梳理,本文将影响电力系统暂态电压稳定的关键因素归纳为同步电源、新能源机组(风机)、输电线路、有功和无功负荷、节点电压水平、直流换流阀触发角等。在这一认识的基础上,兼顾系统级与元件级的稳态特征和故障特征信息,来实现完整的输入特征构建。
2.2 输入特征构建
2.2.1 稳态特征
本文将稳态特征划分为系统级特征和元件级特征2 类[18]。前者对应通过计算得出的统计指标,反映多个元件构成系统中的运行状态,而后者是特定元件的信息特征,可以选取分区内代表节点及其附近元件的稳态量。
综合选取同步电源、风机、输电线路、有功和无功负荷、母线电压以及直流功率,将其归类到系统级和元件级特征,从而构成了输入特征集的稳态特征部分。通过2.1 节分析可知,这些特征能充分反映系统当前的运行情况,同时也与故障后的系统暂态电压稳定性有着潜在关联。
2.2.2 故障特征
除去上述的稳态特征,影响系统暂态稳定性的还有故障特征信息,需要在特征构建中重点处理。
考虑故障条件下电力系统节点电压变化的一般性规律,当故障点与评估节点之间电气距离越近时,系统扰动对评估节点暂态电压稳定的威胁越大。因此,可引入故障点与评估节点之间的电气距离,连同故障切除时间一起选为故障特征。这里采用文献[19]的思路,把线路故障点视为广义节点,定义线路故障点与评估节点之间的广义电气距离Def为:
式中:Des为故障线路始端与评估节点的电气距离;Der为故障线路末端与评估节点的电气距离;p为故障发生点距线路首端的距离与线路全长的百分比。
在预想事故集中预设有k条可能发生故障的线路,进行N-1 故障扫描,对上述k条线路进行状态编码。当线路受故障影响退出运行时记为0,而线路不受故障影响正常工作记为1。这样可获得特定故障下的线路k维0-1 状态序列,连同故障点与评估节点之间的电气距离、故障切除时间,共计k+2 维特征作为故障特征部分。
综上,可得到完整的输入特征,如表1 所示。
表1 完整的输入特征Table 1 Complete input features
3 基于输入特征的CNN 暂态电压评估
3.1 CNN 模型
CNN 作为目前主流的深度学习模型,在电力系统中获得了良好应用。面向暂态电压稳定评估的需求,将前文所构建的输入特征作为CNN 模型输入,通过对暂态电压稳定评估的准确率来说明所构建输入特征的合理性和有效性。
CNN 模型由输入层、卷积层、池化层、全连接层和输出层组成。本文的输入层输入为一维且长度为l+k+2 的序列数据,采用ReLU 函数作为激活函数。CNN 模型的超参数通过仿真结果获得,限于篇幅这里不再给出具体过程,最终案例分析中CNN 模型的最优参数设置如表2 所示。
表2 CNN 模型结构与超参数Table 2 Hyper-parameter and structure of CNN model
3.2 暂态电压预测与评价指标
沿用笔者在文献[20]中将稳定性分类结果和可信度的四元评估作为模型输出的思路,CNN 预测结果可用下式表示:
式中:y为分类模型函数;C为稳定判别结果,C=0时表示失稳,C=1 时表示稳定;P为判定结果所对应的概率。
在模型评价指标方面,除引入传统的准确率ACC之外[21],还纳入了漏警率LA和误警率FA,即
式中:T和F分别为预测正确和预测错误的样本数量;下标s 和us 分别表示预测为稳定和预测为失稳的样本。
3.3 输入特征的合理性验证
最后,还需要就CNN 输入特征进行合理性和有效性的验证。考虑面向暂态电压评估的需求,归纳总结出如图1 所示的完整的暂态电压评估流程及输入特征合理性验证流程。其中,在验证阶段上应涵盖:1)对交直流大系统的适用性验证;2)与不同输入特征集的对比验证;3)输入特征数量验证;4)输入特征量排列方式对比验证。
图1 暂态电压稳定评估及输入特征验证流程图Fig.1 Flow chart of assessment for transient voltagestability and verification for input features
4 算例分析
算例采用南方电网主网的某等值运行方式数据。具体包括565 个500 kV 节点、等值电源134 台(其中等值同步电源121 台),500 kV 交流线路688 条,直流线路11 回,并采用综合负荷(50%恒功率负荷和50%感应电动机)[22]。
4.1 双阶段分区
在PSD-BPA 中,通过不同的负荷水平、故障位置以及故障切除时间的排列组合来模拟实际运行场景。根据实际运行情况,制定以下的参数变化范围:①负荷在基准水平90%~110%的范围内,以5%为步长波动;②考虑三相永久性短路故障,故障发生在500 kV 线路上,且分别出现在距线路首端0%、10%、…、90% 的位置;③故障分别持续0.1、0.2、0.3 s 后清除。对上述参数进行排列组合,合计获得103 200 个场景,计算该方式中565 个节点的暂态电压稳定裕度矩阵η。
4.1.1 第1 阶段分区
依托拓扑关系与地理位置,可以得到侧重地理位置所属的系统初始分区方案。图2 所示为第1 阶段的分区结果。
图2 南方电网的初始分区结果Fig.2 Initial partition result of China southern power grid
在这一阶段,全系统被划分为35 个初始分区。接下来,需要选出各分区的代表节点。对节点暂态电压稳定裕度矩阵η对应的行元素加和,并进行从大到小排列,取中位数节点为该分区代表节点。因此,共可获得35 个代表节点。
4.1.2 第2 阶段分区
在第2 阶段,对代表节点的暂态电压相似性进行聚类以获得最终的分区方案。根据式(3)可以计算得到2 个代表节点之间的暂态电压相似性,以热度图的形式展示节点之间的相似程度,如图3 所示。图中:蓝色越深代表2 个节点之间的暂态电压特性相似性越高,反之红色越深则相似性越低。
图3 暂态电压相似度热度图Fig.3 Heat graph of transient voltage similarity
从图3 可以发现,区域A1、A2、A3为蓝色较深区域,主要分布于热度图的对角线上。热度图可较直观地观察相似度的分布规律,但无法精确量化分区结果,还需要对上述暂态电压相似度通过凝聚层次聚类法进行量化聚类。
以系统最大分区内部距离dmax和标准化增量指标Δd作为确定最佳分区数和评判分区效果好坏的评判依据。表3 展示了随着聚合程度的改变,参数dmax和Δd的变化情况。图4 所示为表3 中dmax和Δd对应分区数的曲线图。其中,最大分区内部距离dmax已进行标准化处理[23]。
表3 最大分区内部距离和标准化增量指标变化情况Table 3 Changes in the maximum internal distance of partition and standardized incremental index
图4 最大分区内部距离及标准化增量指标曲线图Fig.4 Curves of the maximum internal distance of partition and standardized incremental index
观察图4(a)可知,当分区数小于4 时,曲线出现明显“拐点”,代表继续合并分区后,所得分区内部距离较大。再结合表3,当调整分区数由4 变为3 时,标准化增量指标和最大分区内部距离均显著增大,这意味着继续合并分区将进一步异化分区的电压特性,不利于进行系统整体的暂态电压特性评估。因此,4 个分区方案更为合理,此时分区内部距离较小,各节点暂态电压特性相似度较高,相应分区方案如图5 所示。
图5 南方电网的最终分区结果Fig.5 Final partition result of China Southern Power Grid
对比本文所提分区方法与传统的单阶段分区方法和文献[4]方法。单阶段分区方法直接对系统全部节点进行聚类分区;文献[4]方法则以暂态信息量作为分区衡量指标。继续以dmax作为分区优劣的评判标准,对比结果如表4 所示。从dmax可以看出,本文所提的双阶段分区方法在各个分区数下均明显小于另外2 种对比方法,这表明所得到的最终分区方案能够较好地体现出分区内各节点的暂态电压特性相近,判别出分区与分区之间的差异。
表4 分区方法结果对比Table 4 Comparison of partition results by different methods
4.2 输入特征有效性验证
4.2.1 样本生成
确定节点2(SD-HLZ)、节点13(LP-HLZ)、节点22(YR-HLZ)和节点29(DH)分别为分区1~4 的代表节点,采用本文提出的稳态特征选取原则,通过仿真实验确定各分区最优稳态特征数量,即当分区1~4 稳态特征量为53、43、39 和36 时,CNN 评估模型能够较好地兼具准确性和快速性。
利用PSD-BPA 软件进行暂态仿真,在各分区中分别随机选择200、77、124 和70 个故障。同时,选择故障切除时刻为故障后0.1~0.3 s 之间均匀的5 个时刻。在4 个分区的代表节点分别生成了50 000、19 250、31 000 和17 500 个样本,其中未发生暂态电压失稳的样本数分别为28 792、12 266、18 496 和9 468 个。将各分区样本以8∶1∶1 的比例随机分成训练集、验证集和测试集。
4.2.2 交直流系统的适用性验证
验证本文所构建的输入特征的适应性与有效性,这里先考察输入特征集中的直流特征。以分区1 为例,设置了3 个交流故障场景,在这3 个场景中出现换相失败的直流线路数量均不同[19]。与不含直流特征且其他特征完全一致的传统输入特征方案进行暂态电压稳定评估对比。表5 所示为分区1 在本文输入特征和传统输入特征下的暂态电压评估结果。
表5 交直流系统的适用性分析结果Table 5 Applicability analysis results of AC/DC systems
通过表5 可知,在故障场景1(崇文—宝安联络线宝安侧三永故障)和故障场景2(北郊—罗洞联络线北郊侧三永故障)中采用上述2 种输入特征均能得到相同的正确结论。通过时域仿真发现,在故障场景3(增城—北郊联络线增城侧三永故障)中天广直流与楚穗直流均发生换相失败。采用本文输入特征可以得到正确结论,表明CNN 评估模型可挖掘到该故障下的失稳关联信息,正确评估暂态电压稳定特性,而采用传统特征却得到了错误结论。相关结果表明,本文所提输入特征能更好地适应于交直流系统的暂态电压稳定评估,有更好的场景适应性。
4.2.3 与常见输入特征对比验证
将本文构建的输入特征与3 种常见的输入特征进行对比,来验证本文构建输入特征的有效性。其中,特征集1 即本文构建的输入特征;特征集2 为不考虑代表节点分区内元件级稳态特征的输入特征;特征集3 为不考虑系统级稳态特征的输入特征;特征集4 为不考虑电气距离特征的输入特征。采用准确率、漏警率和误警率3 项指标来考核CNN 模型的评估结果,如表6 所示。
由表6 可以看出,本文构建的输入特征在各分区的评估中表现优异,具有最高的准确率ACC,同时漏警率LA和误警率FA也显著低于其他3 种传统特征集下的值,且在全部分区中表现一致。这个案例说明了本文方法能够良好地适应运行方式和预想故障的变化,构建的特征集有效、准确。
表6 输入特征效果对比Table 6 Comparison of input feature effects
4.2.4 输入特征数量对比验证
当输入特征数量太少时,会导致评估模型丢失从而影响评估结果的关键信息;当输入数量过多时,输入信息冗余,对模型准确性提升有限且增加了模型预测时间,会影响评估效率。评估节点及其临近区域内元件级的稳态特征数量对最终预测结果的影响尤为明显,因此,还需要确定最优的输入特征数量。以分区1 为例,通过实验确定最优稳态特征数量,依然采用准确率ACC、漏警率LA和误警率FA这3 项指标来考核CNN 模型的评估结果,如表7所示。
表7 不同数量输入特征的评估结果Table 7 Assessment results with different numbers of input features
由表7 可知,当输入的稳态特征数量较少时,会导致关键信息缺失,从而导致CNN 模型评估结果的准确性下降;而当输入的稳态特征数量过多时,模型准确率仅有小幅度提升,但误警率FA和预测时间也相应上升。误警率的上升意味着特征信息冗余,而提升后的预测时间甚至超过了传统的人工神经网络(ANN)、粒子群优化的最小二乘支持向量机(PSOLSSVM)算法的模型预测时间[8]。因此,输入特征的数量不宜极端地过多或过少,应兼顾模型评估的准确性和评估效率。
4.2.5 输入特征排列方式对比验证
依然以分区1 为例,验证输入特征排列方式对评估准确性的影响。表8 所示为不同排列方式下模型的评估结果。其中,排列方式1 以节点优先,按节点编号顺序依次排列各节点特征量;排列方式2 以特征变量优先,按特征量类型依次排列;排列方式3为特征量的随机排列。
从表8 可以看出,排列方式1 下CNN 模型的准确率ACC、漏警率LA和误警率FA均优于排列方式2和排列方式3 下的值。排列方式3 的低准确率也直观地表明了按照特定规则排列输入特征十分必要。选用排列方式1,将不同节点的同一特征量连续排列,形成多个不同的特征量区域能够使得CNN 模型更有效地提取关键特征,从而提高模型的泛化能力,增强模型的适应性。
表8 不同排列方式下的输入特征评估结果Table 8 Assessment results of input features with different arrangements
5 结语
面向机器学习在交直流系统暂态电压稳定评估中的应用需求,本文提出了一种适用于CNN 的输入特征构建方法。通过双阶段分区降低输入特征的维度和冗余度,兼顾稳态特征量和多维度故障信息构建了输入特征集,并通过实际电网数据检验了所提输入特征集的有效性与准确性。
在人工智能技术应用于电力系统暂态稳定问题的技术背景下,进一步挖掘潜在的相关特征,提升研究结果的可解释性,更好地适应组成元件不断丰富、网架结构特征不断调整与组网形式不断变化的电网,是下一步研究的方向。