基于置信网络的直流输电线路暂态信号识别方法
2019-07-10姚长元罗国敏
姚长元,罗国敏
(1.国网山东省电力公司聊城供电公司,山东 聊城 252000;2.北京交通大学 电气工程学院,北京 100044)
0 引言
高压直流输电具有传输容量大、送电距离远等优点,在输电领域中扮演着重要的角色,广泛应用于远距离、大功率输电和非同步电网互联等场景[1-3]。行波保护作为主保护,以电压或电流变化率为动作判据[4-7],虽然其计算原理简单,但可靠性易受雷电、噪声等因素的影响,如云广特高压直流系统曾因雷击引起“8.19”和“6.5”误动事件。为改善保护性能,提高暂态信号识别精度势在必行。
传统信号识别方法有:采用傅里叶变换、小波变换[7-10]等工具在频域、时频域等空间分析信号差异;直接利用数据序列的幅值、变化率等统计特征,或引进能量、熵的概念定义新的特征;构造幅值、比值等形式的分类判据。整个研究中包括电路分析、空间选取、特征定义等步骤,需要丰富的信号处理技术和专业知识;且大部分环节基于等效简化,不利于从原始数据中挖掘对分类目标有力的特征信息;为降低雷击、噪声等因素的影响,分类阈值的实际整定计算困难,方法的泛化性能较差。
深度置信网络是最早被提出的深度学习模型之一。它由RBM(受限玻尔兹曼机)特征学习层和Softmax 分类层构成,在图像识别[11]、语音识别[12]等领域取得了突破性进展。这种以原始数据为输入、直接输出分类目标的端对端数据处理方式,是暂态信号识别方法研究的另一个方向。与传统方法研究相比,不仅简化了数据处理环节,而且实现了特征提取和分类的联合调整,有利于从原始数据中挖掘信号的固有特征,提高方法的泛化性能。
本文针对高压直流输电线路常见的暂态信号:单极接地故障、雷击干扰和雷击故障,提出了一种基于置信网络的暂态信号识别方法。该方法以暂态电流的线模分量为输入,利用置信网络实现故障特征自提取和分类,在满足低采样频率(10 kHz)和短时间窗(3 ms)的实际需求下,具有较高的识别精度和泛化性能。
1 HVDC 和暂态信号
1.1 HVDC 概况
HVDC(高压直流输电)技术以其运行方式灵活、可控等特点,在远距离电能传输、非同步电网互联、分布式能源并网等领域得到了广泛应用[1-3]。
一个典型的双端点对点VSC-HVDC(电压源换向器高压直流输电)系统的基本结构如图1 所示。系统采用了单极对称式接线,两条架空输电线路运行在幅值相同、极性相反的直流电压下。为了确保系统的稳定运行,VSC1 和VSC2 换流站采用一端控制母线电压,另一端控制传输功率的方式。
图1 典型两端VSC-HVDC 系统结构
架空线路由于输电距离远、架设高度高、走廊环境恶劣等原因,成为输电系统中故障率较高的元件之一[13]。单极接地故障、雷击故障和雷击干扰是发生频率较高的三类暂态信号。与交流系统相比,直流系统因电流无过零点、建弧率高,对继电保护快速性等有更高的要求,再加上天气等外界因素的影响,使得在短时间内被准确识别的难度较大。 提高3 类常见暂态信号的识别精度,有助于改善保护性能,提高系统可靠性。
1.2 暂态信号
1.2.1 单极接地故障
单极接地短路是高压直流输电线路经常发生的瞬时故障之一,通常是由于外力破坏、 污秽、树枝等环境因素造成的。
在基于两电平电压源型换流器的VSC-HVDC系统中,故障暂态可以分为电容放电和交流馈流两个阶段[14]。故障初期,当故障产生的行波到达换流站,直流母线电压的支撑电容迅速放电,该放电过程导致直流系统母线电压大幅下降和故障电流迅速上升。当母线电压衰减到低于交流相电压时,系统进入交流馈流阶段,此时,换流阀各个桥臂上的二极管以不控整流方式换向导通,整个过程逐渐趋于稳态。
单极接地故障时,测量装置M 记录的暂态电流响应,可以视为在故障点处附加电压源E 的结果,如式(1)所示。其仿真结果如图2 所示。
式中:ES表示故障点处压降,其值取决于过渡电阻R 大小。当R 较小时,对应的ES越大。
图2 单极接地故障暂态电流仿真波形
1.2.2 雷击暂态
雷电冲击实际上是一种云与地之间电荷放电的自然现象[15]。大多数引起放电的雷云中聚集大量负电荷,在雷电分析中通常视为一个负极性脉冲。这一特点也使得工作在直流电压下的架空输电线路相比交流更容易遭受雷击,尤其是工作在正极电压的线路。此外,其上升时间和下降时间很短,是暂态保护主要的高频干扰源。
雷击输电线路时,可视为在雷击点直接注入雷电流,双指数波与实际雷电波形最为接近,如式(2)所示:
式中:I0表示雷电流幅值;τ1和τ2分别表示波形上升和下降系数。
当雷电流幅值较大,使得线路与杆塔之间的电压大于绝缘子的闪络电压,特别当绝缘子局部受损或发生沿面闪络时,容易引起绝缘击穿,进而在很短的时间内发展成为稳定电弧,输电线路通过杆塔发生了单极接地故障,该现象称为雷击故障[15]。此时,线路绝缘受到严重破坏,系统无法正常运行,保护应该快速动作以避免较大影响。
当雷电流较小时,即不足以引起绝缘子闪络时,源自于雷击点的脉冲波向线路两端传播,经过母线等不连续点时发生折反射,暂态能量逐渐衰减至零,该现象称为雷电干扰[15]。此时,由于暂态电流相对较小、持续时间较短,不会破坏线路的绝缘,系统可以持续运行,保护不应该动作。
雷击暂态电流的仿真结果如图3 所示。
图3 雷击暂态电流仿真波形
与图2 相比,雷击暂态电流的时域波形振荡明显,这是因为雷电流含有丰富的高频分量。
由图3 可知,雷击故障的暂态电流衰减速度较快,而雷击干扰的暂态电流以稳态工作值为基准而缓慢地振荡衰减。这是因为雷击故障时线路上的暂态能量能够通过故障接地点流入了大地。
图3(a)中雷击故障电流初期变化规律和雷击干扰高度相似,但后期的变化特点又与单极接地故障相一致。这是因为雷电流引起绝缘子闪络和稳定电弧的建立需要一定但很短的时间,在此阶段系统并未故障;而一旦建立稳定电弧,系统便运行在单极接地的故障状态。
单极接地故障、雷击故障和雷击干扰三类信号的暂态变化明显不同,但这是基于长时间尺度的观测结果。而高压直流输电线路保护中,继电保护的动作时间必须小于几十毫秒,除去硬件装置和其他保护模块的动作执行时间,在几毫秒内实现暂态信号准确识别的任务十分艰巨。
2 置信网络
本文从无监督学习网络特征自提取和分类相结合的角度,提出了基于置信网络的暂态信号识别方法,实现端到端的暂态信号可靠识别,如图4 所示。
图4 基于置信网络的暂态信号识别方法
2.1 RBM
RBM 是置信网络的基本构成单元,主要用来学习样本数据的分布,进行无监督的特征自提取[11,16-17]。
如图5 所示,RBM 是由显层v 和隐层h 构成、对称连接的随机神经网络模型。所有的显层和隐层之间相互连接,双向连接权重为w,显层和隐层的偏置分别为a 和b。显层v 为数据输入层,隐层h 为特征层。起初RBM 的神经单元为二值变量,即v∈{0,1}V,h∈{0,1}H。当处理连续数据的输入问题时,显层由具有独立高斯噪声的线性单元构成,由此构成的RBM 又被称为GBRBM[16-17]。暂态信号为连续变量,故文中所提及的RBM 均为GB-RBM。
图5 RBM 的结构
对于一组状态(v,h),RBM 作为一个系统所具有的能量E。由能量函数定义了关于显层状态v 和隐层状态h 的联合概率分布。通过对所有隐层状态h 求和,可以得出模型关于显层状态v 的边缘概率分布,如式(3)—(6)所示:
式(3)—(6)中:vi和hj分别表示显层单元i 和隐层单元j 的状态值,且vi∈R,hj∈{0,1};σi是显层单元vi的标准方差;θ={w,b,a}是模型参数;wij是显层单元i 和隐层单元j 之间的权重;bj和ai分别是其偏置;V 和H 分别是显层和隐层单元的个数;(·)data表示样本数据分布的期望;(·)model是模型确定的分布期望。
为使RBM 所表示的数据分布尽可能逼近真实的样本分布,即最大化p(v;θ),采用随机梯度下降算法作用于训练样本的负对数似然概率函数,得到关于模型参数θ 的梯度,如式(6)所示。采用CD 算法进行计算,最终权重参数θ 得以更新[16-17]。
2.2 分类模型及训练
为利用RBM 网络提取的特征进行分类,需要在最终的特征层上添加一个Softmax 分类输出层。Softmax 分类器的输出类别是唯一的,适用于相互排斥的分类问题。 本文最终确定使用1 个RBM 和Softmax 构成的置信网络,如图4 所示。
置信网络的训练分为预训练和微调[17]2 个步骤。首先按照RBM 自身的学习规则依次进行训练,该过程不需要样本标签的参与,故称为无监督的预训练。然后添加分类层,采用后向传播算法以减小标签误差,对整个网络进行辨别式微调,该过程需要样本标签的参与,故称为有监督微调。
3 识别方法
本文提出一种基于置信网络的直流输电线路暂态信号识别方法,关键步骤及应用流程的如图6 所示。关键步骤主要包括以下几部分:
(1)数据获取
利用多个系统的历史数据信息,采用暂态发生时故障极单端电流量。
(2)数据预处理
源于不同系统的原始数据其采样频率和时间窗长度应保持一致。利用Karenbauer 相模变换矩阵对双极电流进行解耦,见式(7)。因线模分量较地模分量更稳定,波速度随频率和线路走廊地理环境的变化小,故采用线模分量。然后将线模分量数据进行min-max 归一化,作为网络的输入。
式中:i+和i-分别为正极电流和负极电流;i1和i0分别为电流的线模参量和地模分量。
(3)制作样本
为了评估网络的分类性能,防止模型训练过拟合。将样本集按照一定的比例随机分为训练集和测试集。
(4)模型调试
图6 信号识别方法关键步骤及应用流程
在网络结构中,输入层单元个数等于样本维数,输出层单元个数等于类别数,隐含层单元个数需要以综合识别率为指标进行选定。 除此之外,学习率、批量个数和动量因子等参数的设置也在一定程度上影响网络性能,但是通常该类参数取推荐值或经过适当微调即可达到较好的效果。总之,通过调试训练,使网络模型在训练样本和测试样本下都具有较高的识别精度。
(5)模型应用
训练好的网络即可作为继电保护装置中逻辑判断模块的辅助判据,以提高对未知信号的识别精度。
4 仿真验证
为了验证所提方法在多系统、低采样频率、短时间窗下的有效性,本文进行了仿真验证。
4.1 系统配置
考虑到在相同电压等级的不同系统中,通常采用几种典型的导线规格,并且输电线路的架设高度、绝缘能力等参数相近,主要在额定容量和输电距离上存在较大差异。本章在PSCAD软件上搭建了4 个±500 kV 系统,均采用如图1 所示的双端点对点拓扑结构。各系统的参数配置如表1所示。改变各类暂态信号的参数配置获取不同场景下的仿真数据,具体参数设置如表2 所示。
4.2 数据处理
采用3 ms 时间窗和10 kHz 采样频率下暂态电流信号的线模分量,经max-min 归一化后构成样本集。按1∶1 的比例将样本集随机分成训练集和测试集。具体的样本采集和分配如表3 所示。
4.3 模型调试
在预训练和微调阶段,设置小批量参数为类别数3,学习率为0.01,预训练的迭代次数为500,微调阶段的迭代次数为300。本文重复10 次将样本集按照1∶1 的比例随机划分为训练集和测试集,计算10 次实验的平均误差率,以此作为网络结构调整的依据。输入层单元个数等于样本维数30, 输出层单元个数等于类别数3。隐含层结点数对平均误差率的影响如图7 所示。由图7 可知,在训练集和测试集下,h1=30 时稳态平均误差率最小,且训练样本下最小值可达2.57%,测试样本下可达3.60%。由此确定隐含层的节点数为30,则模型采用“30-30-3”的结构。
表1 各系统的主要配置参数
表2 暂态信号仿真参数设置
表3 样本采集和分配
4.4 识别结果
采用上述网络结构进行10 次随机实验,统计结果如表4 所示。
由表4 可知,单极接地故障和雷击干扰的平均识别率较高,雷击故障的平均识别率较低。在训练集和测试集,单极接地故障的识别率均为100%;雷击干扰的平均识别率分别为98.50%和98.00%;雷击故障的平均识别率分别为93.80%和91.20%。
统计结果表明,绝大多数的雷击故障被误判为雷击干扰。这主要是因为在暂态初期极短的时间窗内,雷击故障呈现出的特征与雷击干扰相似度较高,不同系统的运行参数存在差异,增加了二者的识别难度。
图7 隐含层节点调试
表4 样本集的识别结果
本文所提方法的综合平均识别率,在训练集和测试集下分别可达97.43%和96.40%,能够对不同系统下的暂态信号进行有效的识别。
5 结语
本文分析了直流输电线路常见3 种暂态信号的发展机理, 提出了以原始数据为输入, 通过RBM 特征提取和softmax 分类与一体的置信网络,实现对单极故障接地、雷击故障和雷击干扰的信号识别。 该方法能够满足低采样频率(10 kHz)、短时间窗(3 ms)的实际需求,避免了复杂的人工特征提取环节和实际应用中阈值整定困难等问题,同时适应性强、识别率高,具有良好的应用前景。