基于双向长短期记忆网络的高压输电线路短路故障识别方法
2021-05-29金乐
金 乐
(呼和浩特供电局,呼和浩特 010020)
0 引言
高压输电线路是供电系统的重要组成部分。为了确保可靠供电,要求高压输电线路必须安全可靠运行。系统发生故障时,需准确辨别故障类型,快速排除故障,恢复正常供电[1-3]。在高压输电线路故障中短路故障占绝大部分,输电线路因短路故障引起过高的短路电流时,会引发强烈的热效应,若短路故障持续时间较长,很容易破坏线路、电气设备等的绝缘性[4]。同时,输电线路短路故障还会导致系统电压下降,电能质量降低。所以如何准确辨别短路故障类型,并有效消除短路故障,是目前电网发展一个重要问题[5-7]。
高压输电线路短路故障类型识别本质上是一种故障选相,即根据获取的短路故障信息,判断哪些相发生相间短路或接地短路,以此识别短路故障类型[8]。当输电线路发生短路故障时,该故障相电流升高而电压下降,据此通常选择低电压和相电流构造的选相元件完成保护。然而前者的应用场合比较有限,主要适合在较短线路的送电端和较小电源的受电端,因此一般当作辅助的选相元件。高压输电线路采用分裂导线实现远距离传输,由于传输容量较大,线路中均配有补偿装置,导致在短路故障发生后其暂态过程较为复杂,有无穷多个频率不同且衰减的非周期分量包含在其中,具有大量的故障信息。通常先利用算法对收集的暂态信息进行分析处理得到所需要特征量,再采用适当的分类机制对故障的特征量进行分类,达到输电线路短路故障辨识的目的[9-12]。文献[13]对包含在故障电流分量中的暂态量进行提取,以每相暂态电流能量大小关系作为识别短路故障类型的依据。文献[14]基于暂态电流行波的变化规律与时频特征,利用小波分解进行多层分解,提出了一种短路故障检测与辨识的方法。
目前被广泛应用的辨识方法为机器学习方法,主要包括支持向量机、小波包及小波分析等[9-11]。与机器学习相比,深度学习是新的研究方向,可拟合更为复杂的非线性函数,处理高维非线性数据样本,它对原始数据集的学习比机器学习更为充分,其概念源于神经网络的研究[12]。递归神经网络(Re⁃current Neural Network,RNN)是一种擅长对序列进行分析的神经网络,序列长度象征其网络深度[15]。文献[16]基于非结构化的数据利用RNN进行输变电系统的故障检测,而且研究了网络参数对检测结果的影响。长短时记忆神经网络(Long Short-Term Memory,LSTM)是一种RNN的改进变体,更擅长处理和预测时间序列事件。文献[14]在利用经验模态分解提取特征参数后,采用LSTM预测旋转机械状态。文献[17]通过利用LSTM算法基于移动传感器所采集的三维数据对人类的活动进行识别。文献[18-19]均采用双向长短期记忆网络(Bidirectional Long-Short Memory,BiLSTM)算法对文本进行关键字提取,且都具有较高的提取精度。但都存在诸如对超参数优化不足、数据量较少、需预先提取特征参量等不足。
本文对BiLSTM的模型结构及原理进行研究,提出基于BiLSTM的输电线路短路故障辨识方法,采用信息细节最为丰富的原始数据作为网络训练输入,实现了准确辨识高压输电线路短路故障,且辨识过程中不受过渡电阻、短路故障发生位置、相角差等参数的影响。
1 BiLSTM模型结构
1.1 深度学习
传统的机器学习,如支持向量机、遗传算法等,网络层少,其特征非线性映射往往为单层,无法实现复杂的非线性函数拟合,不能充分学习数据特征。而深度学习隐含层的数量高达成百上千个,深度学习使用深层次非线性映射,对复杂数据分布进行充分学习,将隐藏在高维空间中的特征映射至低维空间[20-23]。深度学习模型见图1,由输入层、多个隐含层及输出层构成。数据信息由输入层经多层隐含层进行映射学习,并由输出层输出学习结果。
图1 深度学习模型
1.2 RNN原理
RNN是一个拥有反馈环、可循环的神经网络模型,能把当前时刻学习到的信息保存一段时间,并传递给下一时刻使用。RNN擅长处理时间序列问题,在其网络层间同时包含前馈连接与反馈连接,前馈连接可充分学习和利用历史信息。递归神经网络模型结构如图2所示。
图2 RNN单元展开
由图2可知,RNN的每个步骤都在执行同样的工作,但其输入不同。通过这种训练方式,极大限度减少网络中要学习的参数,同时可大大缩短训练时间。
1.3 LSTM
LSTM是一种特殊的递归神经网络结构。RNN与LSTM网络隐含层结构如图3所示。传统RNN的隐含层只含h状态,擅长学习短期的时间序列,而LSTM则是利用记忆单元来对RNN隐含层进行改良,在RNN的模型上增加了状态C(细胞状态),可实现数据信息的长期保存。
图3 RNN与LSTM网络隐含层结构
状态C拥有3种特殊结构:遗忘门、输入门和输出门,类似于3个开关,递归调整LSTM中隐含层数据的输入与输出,完成信息的长期保存。遗忘门是决定数据是否长期保存的关键,通过一定的概率来决定保留上一状态C中信息的多少。输入门将当前时刻即时状态中的信息传递给长期状态C。输出门决定是否将长期状态中的信息作为当前时刻输出的信息。遗忘门与输入门共同作用于状态C来实现数据信息的更新,并通过输出门输出,即当前时刻的样本在隐含层的输出。通过这种方式,LSTM可对输入信息实现较长时间的记忆。LSTM长期控制结构如图4所示。
LSTM的门结构为选择性结构,通过含激活函数的隐含层取(0,1)之间的任意数值。门结构决定将上一时刻中的哪些信息传递给下一时刻,输出值为1代表将在上一时刻数据中学习到的信息全部传递给下一时刻,输出值为0代表在上一时刻数据中学习到的信息都不传输给下一时刻,其隐含层结构如图5所示。其中,细胞状态Ct是LSTM的核心结构,是实现长期记忆的重要环节,可在一条水平线上完成对数据样本信息的传递。
1.4 BiLSTM
由于LSTM只能读取一个方向的序列数据,没有考虑到属性后信息的影响,Graves等提出了BiL⁃STM,并将其应用于语音识别。BiLSTM的基本思想是对每个训练序列分别从正向和反向两个方向同时进行训练,而且两者都连接到相同的输出层。通过这种特殊的网络结构,可以为输出层提供每个时间序列点的上下文完整信息。
图5 LSTM隐藏单元结构
图6为BiLSTM模型在时间上的展开,正向LSTM依次接受第t-1个时刻到第t+2个时刻的输入xt-1到xt+2,依次计算前向隐含状态ht-1,ht,…,ht+2,其输出量为kt-1,…,kt+2。反向的LSTM接受第t-1时刻到第t+2个时刻的输入xt+2到xt-1,并相应的计算出反向隐含状态ht+2,ht,…,ht-1,这样就得到了每个时刻正向和反向的双向特征。
图6 BiLSTM模型
2 基于BiLSTM短路故障辨识模型
当需依据故障电流时间序列实现某一时刻高压输电线路短路故障辨识时,只有将其前后时刻的运行状态信息有效地结合利用,才能准确识别短路故障类型。因此考虑到双向长短期记忆网络的特性与优点,本文构建了基于双向长短期记忆网络的高压输电线路短路故障辨识模型。模型整体结构如图7所示。
图7 BiLSTM故障辨模型整体结构
在利用BiLSTM辨识短路故障类型过程中,首先将经过预处理后用于训练的多种工况下输电线路双端短路电流时间序列X={x1,x2,…,xn}传入网络输入层,从向左和向右两个方向通过网络层对输入的数据进行训练学习,其中I层LSTM向右传播历史信息,r层LSTM向左传播未来信息。向左或向右单方向的训练过程与LSTM的训练过程相同,即在其网络层之间同样是既有正向传播又有反向传播。网络模型训练过程中,由正向传播可获得该阶段的代价函数,再经过反向传播误差,不断对网络模型的参数进行更新,当迭代次数达到设定值时训练停止,最后将测试样本输入到训练好的模型中,进行故障辨识。
2.1 正向传播
(1)遗忘门先读取上一时刻短路故障电流的隐含层输出信息ht-1和当前时刻输入故障电流xt-1,本模型中隐含层包括100个按前后时刻连接的同构LSTM细胞,再输出一个数值。当ft=0时细胞状态Ct-1会全部忘记上一故障电流样本的信息,ft=1时细胞状态Ct-1会全部保留上一故障电流样本的信息:
(2)输入门输入该时刻的故障电流信息,主要分为两部分,第一部分利用隐含层sigmoid激活函数,输出为it;第二部分使用隐含层tanh激活函数,输出为at:
(3)遗忘门与输入门同时作用于细胞状态Ct,主要由两部分组成,第一部分为前一时刻细胞状态Ct-1与遗忘门输出ft的乘积,第二部分为输入门it与at的乘积:
(4)隐含层由两部分组成,其状态的更新决定信息的输出。第一部分是Ot,由上一时刻短路故障电流的隐藏状态ht-1和本时刻故障电流数据xt以及隐含层激活函数sigmoid获得,其定义为:;第二部分ht由当前时刻隐含层细胞状态Ct和隐含层tanh激活函数构成,其定义为:。具体如公式(5)和公式(6)所示:
2.2 反向传播
BiLSTM反向传播与RNN类似,BiLSTM训练网络的目标是使预测的向量尽可能接近目标向量。设定损失函数最小为优化目标,通过适应性动量估计算法(Adaptive Moment Estimation,Adam)不断更新权重来获取隐含层的网络,使网络误差不断减小,从而实现网络的优化。减小网络反向传播误差一个重要环节就是完成模型中所有参数基于损失函数偏导数的计算,通过反向计算误差项,计算出对应的各权重的梯度,再利用梯度下降法对参数不断进行更新,直至满足要求。Adam也是一种基于梯度下降的方法,其每次进行参数迭代时的步长均在确定范围内,不会由于梯度过大而造成学习步长过大,参数值比较稳定,且该算法比较容易实现,具有很高的计算效率和较低的内存需求,与其他方法相比更加优越。BiLSTM网络的目标函数采用均方差(Mean Squared Error,MSE),其计算公式如下:
式中:yreal,i,yperdict,i分别为当前实际值与预测值。
3 仿真分析
3.1 基于RTDS的输电线路仿真模型
为了方便设置高压输电线路不同位置的短路故障点,基于实时数字仿真器(Real Time Digital Simulator,RTDS)搭建500 kV高压输电线路模型时,选择利用两条输电线路模型串联的方法,在线路中间设置故障,并在线路两侧各设置一个电流互感器,以获得故障时线路两端的电流暂态量,输电线路仿真模型示意图如图8所示。
3.2 数据样本集采取
由于BiLSTM算法为深度学习算法,需要庞大的数据作为网络训练样本集,因此在模型中对多种不同工况下的输电线路短路故障进行仿真,通过排列组合对所设置的参数进行遍历,共有种,即5500种。参数遍历如表1所示。
表1 模型参数遍历
在模型中获取输电线路两端的电流采样数据,并选取故障发生前一个周波到故障发生后一个周波的数据作为辨识输电线短路故障类型时的训练样本与测试样本。模型中线路长为100 km,短路故障起始时刻为0.05 s,短路持续时间0.05 s,采样频率为1200 Hz,系统频率为50 Hz。在RTDS的Run⁃time运行模块中利用Plot得到仿真波形,如图9—图12所示为典型故障波形。
首先通过Plot将提取的各类所需的波形保为.mpb格式,然后通过Multiplot模块对该波形文件进行分析并生成表格,Multiplot模块为对RTDS的仿真结果进行处理与分析的模块,最后在表格中截取出故障发生前一个周波到故障发生后一个周波的数据作为样本集。
3.3 基于BiLSTM的短路故障辨识仿真测试分析
在MatlabR2018a环境下设置参数,设置网络输入层(inputsize)为6层,隐含层神经元(numHid⁃denUnits)为100个,网络输出层(numclasses)为10层即10种类型,网络迭代次数(MaxEpochs)为100次,一次进入模型训练的数据量(miniBatchsize)为27,训练集为4739个.cell文件,测试集1610个.cell文件,学习率起始值(InitialLearnRate)为0.01,按照步长0.01依次增加学习率,终止值为0.1。通过多次试验发现,随着初始学习率的增加,测试的准确率不断降低。本文将初始学习率设定为0.01,此时短路故障辨识准确率较高且稳定。
对于不同初始学习率下网络的训练过程,因设定的初始学习率较多,选择3个有代表性的训练波形进行展示,如图13—图15所示。由图可以看出,虽然随着初始学习率的不断增加,BiLSTM的训练寻优速度也随之加快,但图15显示,系统的稳定性也在逐渐下降,网络在较小的训练次数内无法收敛。图13显示在迭代3次左右后,训练模型的准确率开始收敛,训练到54次时准确率急速降低,随后又迅速上升。训练54次后其准确率明显下降的原因是模型的迭代次数过多,在深层网络中,误差梯度不断更新积累,形成更大的梯度,导致网络权重的大幅更新,使网络变得不稳定,形成NaN值。网络层之间的梯度重复相乘导致梯度爆炸。BiLSTM的神经元降至0,训练暂停,之后网络模型再一次开始训练。本文将模型中的迭代次数调整为10次重新训练,其训练过程如图14所示。由图16可知,在调整迭代次数为10次后,避免了梯度爆炸的出现,减少了训练时间,而测试的准确率仍为100%。
图8 输电线路仿真模型示意图
图9 L1相接地短路故障电流波形
图10 L1、L2相接地短路故障电流波形
图11 L2、L3相接地短路故障电流波形
图12 三相短路故障电流波形
经多次试验发现,虽然网络的训练样本与测试样本是采集于故障位置、负荷电流、系统阻抗、过渡电阻等参数均不同的高压输电线路短路故障模型,但BiLSTM仍可以准确辨别输电线路短路故障类型,且准确率可达100%。说明BiLSTM在进行高压输电线路短路故障辨识时拥有极强的学习能力与泛化能力,同时具有极高的准确率。
4 结语
图13 初始学习率为0.01的模型训练过程波形
图14 初始学习率为0.05的模型训练过程波形
图15 初始学习率为0.07的模型训练过程波形
本文对高压输电线路短路特点进行了分析,以构建基于暂态量的输电线路故障诊断方案作为研究目标,利用深度学习算法BiLSTM实现了输电线路的故障识别。结果表明,所采用的输电线路短路故障辨识方法可行,辨识率极高。
图16 初始学习率0.01,迭代次数为10的网络模型训练过程波形