基于双向长短时记忆网络和卷积神经网络的电力系统暂态稳定评估
2020-04-22李向伟刘思言高昆仑
李向伟, 刘思言, 高昆仑*
(1.华北电力大学电气与电子工程学院,北京 102206; 2.全球能源互联网研究院,北京 102209)
随着电力系统的复杂度日益提升,给系统安全带来严峻考验,也对电网在线暂态稳定评估(transient stability assessment, TSA)的快速性和精确性提出了更高要求[1-3]。传统的时域仿真法[4]和直接法[5-7]分别受限于其计算速度慢和建模困难,使得两种方法不能同时满足快速性和精确性要求。近年来,广域测量系统和机器学习方法的快速发展为问题的解决提供了新思路[8-13]。
机器学习方法不需要建立复杂的物理模型,而是通过合适的输入输出量,即可建立一个对应的非线性映射,自学习能力强;对于训练完成的模型,将测试样本输入即可立即进行分类,评估速度快,因此成为暂态稳定评估的热点方法[8-13]。
以往研究取得了较好的评估效果,但同时也有很大局限。一是所选特征的构造多以所有发电机的功角、转速等电气量数据为基础,而这些特征的计算难度相对较大或采集所需时间较长[14],同时,还因现有条件下相量测量单温(PMU)不能全面覆盖而使得特征量的构造更加困难;二是传统研究均在纯净数据条件下进行评估,而机器学习模型由于其非线表达能力有限,在处理复杂问题时数据挖掘能力不强[15],进而限制了其在复杂条件下的评估准确性。
近年来,机器学习中的深度学习方法发展迅猛,它通过灵活多变的结构、多样的训练策略及不同的权值共享方式使其相对于机器学习模型能够提取到更有用的特征,进而挖掘数据的潜在规律[16],在图像、自然语言处理等领域取得较大成功[17]。
为了克服传统方法的缺点,进一步提高模型评估的准确性,本文考虑到暂态过程的时间变化特点以及深度学习在处理复杂问题上的优势,将深度学习中常用来处理时间序列问题的双向长短时记忆网络[18](bidirectional long short term memory network, BiLSTM)引入并和利用轻量梯度提升机[19](light gradient boosting machine, LGBM)改进的卷积神经网络(improved convolutional neural networks, ICNN)在TSA问题中进行模型融合。此外在考虑了PMU不能全面覆盖以及数据传输量不宜过大的场景上,提出在PMU最优布点上进行特征构建的方法,在此基础上构建了“全阶段”时间序列特征,所选数据易于计算采集,同时又能在应用较少输入量的条件下保证模型评估的准确率。
1 基于BiLSTM-ICNN的暂态稳定评估模型设计
1.1 双向长短时记忆网络
双向长短时记忆网络由连接着一个输出层的前后两向LSTM构成,如图1所示,其总输出为前后向输出之和。
图1 双向长短时记忆网络模型结构示意图Fig.1 The model structure diagram of bidirectional long short term memory network
BiLSTM能综合时间序列两个方向的信息,主要用于多变量时间序列分类任务。每向LSTM计算方法相同,均由输入层、输出层和隐藏层构成,隐藏层每一个记忆单元都拥有图2所示结构。
图2 记忆单元结构示意图Fig.2 The structure diagram of memory cell
记忆单元的3个门接收当前状态xt、上一时刻的输出ht-1以及历史状态信息ct-1作为输入,随后,每一个门通过对不同来源的输入进行运算来决定对历史信息和当前信息的记忆程度。具体过程如下:首先,输入门和遗忘门通过非线性函数对数据进行变换,分别输出it和ft,具体公式如下所示:
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
(1)
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
(2)
随后,将ft与历史状态信息ct-1相乘,并和与经控制激活函数相乘后的遗忘门的输出叠加构成当前单元的状态ct:
ct=ftct-1+itσ1(Wxcxt+Whcht-1+bc)
(3)
最后,再将当前状态信息ct与输出门的控制激活值相乘构成本单元的输出:
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)
(4)
ht=otσ1(ct)
(5)
式中:Wxc、Wxi、Wxf、Wxo为连接输入信号xt的权重矩阵;Whc、Wih、Whf、Who为连接隐含层输出信号ht的权重矩阵;Wci、Wcf、Wco为连接神经元输出矢量ct和门函数的对角矩阵;bi、bc、bf、bo为偏置向量;σ和σ1为sigmoid和tanh函数;ft和it分别为遗忘门和输入门的输出;xt、ht-1及ct-1分别为历史状态信息、上一时刻的输出和历史状态信息。
1.2 改进的卷积神经网络
卷积神经网络通过卷积和池化操作能够自动提取到使模型易于分类的高阶特征,随后送入全连接层进行分类。然而由于全连接层表达能力有限,因此其往往并不能作为最优分类器来执行任务。针对此问题首次提出利用LGBM对其进行替换。LGBM是微软在2017年提出的改进的梯度提升决策树[20](gradient boosting decision tree, GBDT)模型,和GBDT一样是一种集成分类器模型,每个子分类器为分类回归树。LGBM在GBDT的基础上除了吸收了集成模型具有较高准确率的优点,又通过改进直方图算法[19]极大地加快了分类速度,降低了内存的使用率,提高了模型的泛化性能。
1.3 BiLSTM-ICNN模型结构设计
设计了一种基于BiLSTM-ICNN的模型,结构如图3所示。考虑到TSA问题的时间序列数据较长,首先利用能够存储长期记忆并能综合前后两个方向信息的双向长短时记忆网络对初始化处理后的电网的时间序列数据进行特征抽象,数据抽象后的电气量维度变换为k,时间序列维度不变;随后,利用一维卷积神经网络对BiLSTM抽象后的数据进行进一步的特征提取。一维卷积神经网络一方面能通过窗口大于1的卷积核的卷积操作进一步抽取特征的前后时间序列信息,另一方面,相比传统神经网络,CNN能够通过权值共享方式加速模型的训练以及通过最大池化操作保留最重要的特征;卷积神经网络的最后一次池化操作后,将特征数据变换成为一维向量,考虑到集成模型在分类能力上优于单一模型,因此将最后一次池化后的一维特征数据输入到轻量梯度提升机中来进行分类任务。
图3 本文TSA模型结构示意图Fig.3 The TSA model structure diagram of this paper
为了防止深度学习出现过拟合,通过正则化方法来增强模型的泛化性和稳定性。利用L2-范数对各层的权值矩阵进行约束[21],使模型学习到更小的权值,降低模型复杂度,让数据拟合方式更恰当。此外,采用批归一化技术[22](batch normalization)以及Dropout[23]策略进一步防止过拟合现象。Dropout策略是对网络训练期间的优化,体现在网络训练时按一定概率随机丢弃部分神经网络单元,即每次均训练不同的网络,因而使得网络不依赖于某些局部特征而去学习更加鲁棒的特征,同时文献[24]指出Dropout具有数据增强功能;批归一化技术于2015年由谷歌提出,设计在激活函数之前,主要操作是将神经元的输出进行类似归一化的操作,减小输出数据分布的变化,进而充分利用激活函数[22]。
2 暂态稳定评估过程
2.1 在最优PMU配置基础上的时间序列特征
电力系统在扰动发生后各电气量将会随时间的变化而变化,构造能反映系统暂态动态过程的特征是暂态稳定能够进行有效评估的前提。
传统TSA问题的特征构建往往是在PMU全面覆盖的基础上进行的,主要包括基于“三段式”特征[8-10, 13]及基于受扰后轨迹特征[11-12]的构建方法。从PMU配置的实际出发,吸收两种方法的优点,并克服其缺点,构建了在最优PMU配置基础上的“全阶段”时间序列特征。
由于对系统进行状态监测为PMU主要功能之一[25],因此以系统的可监测性为前提,采用0~1整数规划方法进行PMU最优布点。在此最优布点基础上,根据所用数据易于计算采集且能充分反映系统动态变化的原则进行初始电气量选择。由于PMU可直接量测其布点的母线电压和与布点母线相连的线路的电流,进而量测PMU布点所连线路的功率,而与发电机母线直接相连线路的有功功率能反映发电机出力变化,对暂态稳定具有重要意义,因此选择该类线路有功功率作为特征;除此之外,电压作为电力系统里最基本的电气量,一方面能够通过PMU直接进行采集计算,另一方面,由于电压轨迹是系统故障后的直接时域响应,可作为系统受扰程度和稳定性质的重要表征,因此再选取布点母线的电压幅值和相角作为特征。最终选取了最优节点的上述三类特征从故障发生前2周波至故障切除后3周波的全时间序列作为输入数据。
2.2 构造稳定判据
基于深度学习的暂态稳定评估最终要给出系统在扰动下稳定与否,因此是一个二分类问题,根据暂态稳定指标(transient stability index, TSI)对样本稳定与否进行标注。TSI的计算如下:
(6)
式(6)中:Δδmax为发生扰动后4 s末任意两台发电机功角差最大值。对于每个样本,如果TSI为正,则系统是稳定的,样本标签标注为1;如果TSI为负,系统是不稳定的,样本标签标注为0。
2.3 建立评估指标
由于电力系统对于稳定样本判定为失稳和失稳样本判定为稳定的代价不同,前者将失稳样本错判为稳定,导致运行人员在系统即将失稳前不采取任何控制措施,将给系统造成严重破坏,而后者将稳定样本误判为失稳,带来的影响要小得多,因此为了检验模型的综合评价性能除采用准确率(accuracy, Acc)外,还引入召回率(recall, Rec)作为评估指标,以更好地评估模型的实用性。召回率计算公式如下:
(7)
式(7)中:Tus表示失稳样本被正确分类的样本数;Fs表示“失稳样本误判为稳定”的样本数。
2.4 离线训练和在线评估
基于BiLSTM-ICNN的评估方法可在离线阶段通过离线数据对模型进行训练,保存一个具有较好泛化性能的模型,以便在发生故障时进行快速在线评估。可通过对典型运行方式下的测试系统设置故障,得到各种典型工况和典型故障下的时域仿真样本集,并通过训练得到能够适应不同场景和工况下的评估模型。在扰动发生时,即可通过PMU获取实时量测数据并利用训练好的TSA模型进行在线稳定评估。
3 实例验证分析
3.1 样本生成及初始数据采集
采用TSA问题中众多专家学者[8-13]常用的系统频率为60 Hz的新英格兰10机39节点系统对所提方法进行验证(图4)。应用PSS/E仿真软件,发电机模型采用六阶模型,负荷为恒阻抗模型。分别设置了80%~120%的五种负荷水平,在不同线路的10%、35%、50%、65%、90%处设置永久性三相短路故障,保护装置动作时间为故障发生后0.2~0.6 s,数据采样间隔为0.008 3 s。仿真共得到样本10 200条,其中稳定样本7 714条,失稳样本2 486条,稳定/失稳样本比例为3∶1。PMU最优布点采用整数规划方法,最终布点结果为母线:2、6、9、10、13、14、17、19、22、23、25、29、34。
图4 IEEE39节点系统Fig.4 IEEE39 node system
由于故障切除时间不是一个固定常数,因此按2.1节所选的序列长度会因不同的故障切除时间而不同。由于基于深度学习的模型能够识别出不对特征做出贡献的0值序列,因此以最长故障切除时刻为基准对不足序列进行补零,使得最终数据的特征矩阵大小相等。考虑到实际采样条件下由于数据采集过程中会产生噪声和异常值,因此对干净数据集添加10 dB的高斯噪声和1%的异常值(用0值表示),此类数据以下简称噪声数据。
3.2 模型在不同条件下的评估性能
将样本集随机按8∶1∶1比例划分为训练集/验证集/测试集,BiLSTM-ICNN模型的超参数根据问题实际及参数寻优确定,BiLSTM神经元个数为64;CNN卷积层共有2层,每一个卷积层均设计具有64个窗口大小为3的卷积核;LGBM叶子数为50,最大树深度限制为6;采用Adam[26]优化算法对学习率进行自适应调整,初始学习率0.001。将所提模型与传统机器学习算法人工神经网络(artificial neural network, ANN)、决策树(decision tree, DT)及支持向量机(support vector machine, SVM)和传统深度学习算法CNN、LSTM进行对比。其中ANN和CNN的激活函数、正则化策略和优化算法与所提模型保持一致,6种模型的结构及参数均进行寻优,最终确定ANN结构为[500,200,50,1];CNN采用四次卷积加池化操作,4层卷积核分别为[32,32,64,64],CNN利用全连接层进行分类;LSTM结构同本文模型的BiLSTM中的前向长短时记忆网络,并利用全连接层进行分类;4种神经网络模型的迭代次数均设计为50。DT采用CART树,SVM选用线性核函数。
3.2.1 模型在干净数据条件下的评估性能
将不考虑噪声和异常值条件下的数据分别输入6种模型中进行暂态稳定评估,结果如表1所示。
表1 干净数据条件下的评估结果Table 1 Assessment results of clean data
由表1可知,干净数据集下本文模型具有最高的评估性能,准确率和召回率分别达到98.54%和97.19%,对比另外两种深度学习模型,体现了融合模型能够利用各自优势对时间序列进行更好地处理。对比三种深度学习模型与三种机器学习模型可知,机器学习模型的准确率虽然都处于90%以上,但从召回率指标可以看出三种机器学习模型在样本比例不均的情况下更倾向于分类为比例较高样本;ANN相较于另外两种模型而言性能较高,但因其结构不能较好地利用时间序列数据,因此其准确率和召回率仍不如三种深度学习模型。
3.2.2 模型在噪声条件下的评估性能
在干净数据集中添加1%的异常值和10 dB的高斯噪声数据以验证模型的抗噪性能。将数据分别输入6种模型,结果如表2所示。
表2 噪声条件下的暂态稳定评估结果Table 2 Assessment results of noisy data
由表2可知本文所提算法的评估性能依然较其他算法有着很大优势,具有较好的稳定性,同时另外两种深度学习模型在含有异常值和10 dB噪声数据下也保持着较机器学习更优越的抗噪性能。这是由于深度学习在有着强大的自动特征提取能力外还通过Dropout、批归一化操作保持了较高的泛化性能,因此不易陷入过拟合和局部最优,同时本文模型的LGBM结构所采用的改进直方图算法也在一定程度上提高了模型的泛化性。ANN也采用了和深度学习一样的正则化方法,因而其评估性能好于另外两种机器学习方法,但相对于深度学习模型,表现依然不尽如人意。
3.2.3 模型在PMU不同布点下的评估性能
为了测试在不同布点条件下的模型评估性能,将最优配置方案与方案a(在所有发电机母线以及部分重要母线进行布点)和方案b(随机布点)在噪声集上进行对比,两种方案PMU布点数与3.1节一致,选用布点如表3所示。
三种不同布点方案下的模型评估结果如表4所示。
表3 方案a、b的PMU布点位置Table 3 The PMU placement of plan a and b
表4 三种布点方案下的评估结果Table 4 The assessment results of three different plans
结果表明相较于基于PMU最优配置方案,在方案a、方案b下各模型准确率和召回率均有所下降,且随机方案普遍下降较大,这是因为PMU最优布点方案满足系统可观测要求,具有较高的代表性,所选布点大多为所连线路较多的重要母线,因此具有更高的优越性。同时,三种深度学习模型在另外两种布点上仍然具有相对较高的准确率和召回率,机器学习模型依旧倾向于分类为高比例样本,因此体现了深度学习模型具有较高的鲁棒性,且本文方法同样保持着最优越的评估性能。
3.2.4 模型在PMU全布点下的评估性能
采用所有母线的电压幅值、相角和所有与发电机母线直连线路的有功功率三类电气量的时间序列数据作为输入,在噪声集中评估结果如表5所示。
表5 PMU全布点方案下的评估结果Table 5 The assessment results of PMU full placement
PMU全布点下的性能指标普遍有所上升,但由于现有条件下一方面PMU价格昂贵无法全面覆盖,另一方面由于数据传输量巨大也会造成通信延时,因此使得其应用受限。虽然本文模型在最优PMU配置条件下,准确率和召回率分别降低了0.39%和1.20%,但仍然保持在一个较高的水平,且将数据量压缩到了近1/3,因此具有较好的实用性。
4 结论
首次在电力系统暂态稳定问题中提出一种基于BiLSTM-ICNN的评估方法,并在PMU最优布点基础上构建了全阶段时序特征以适应其不能全面覆盖的现实场景,通过在新英格兰10机39节点系统上进行实验,得到如下结论。
(1)相比传统机器学习和传统深度学习方法,所提模型能够有效利用暂态过程的时序特征,评估准确率及召回率较高。
(2)对于现实场景中存在噪声以及PMU不能全面覆盖的限制,模型依然具有较好的评估性能,体现了方法的稳定性和鲁棒性。
(3)方法利用故障发生前2周波至故障切除后3周波的数据即可迅速对系统进行判稳,满足快速性的要求。
深度学习方法在电力系统暂态稳定问题中具有较好的应用前景,未来可研究所提方法在加入单相故障、两相故障以及复故障的场景下如何进行应用,同时利用深度学习方法进行暂态稳定控制也是未来的研究方向。