适于深层次CNN的配电网过电压数据集建立方法
2022-05-05贾俊青吕超刘丁华徐浩
贾俊青 ,吕超,刘丁华,徐浩
(1.内蒙古电力科学研究院,内蒙古 呼和浩特 010020;2.内蒙古工业大学电力学院,内蒙古 呼和浩特 010321)
电网安全可靠运行对于国民经济和社会发展具有重要的支撑作用。伴随着我国坚强智能电网的高速建设与发展,主网的可靠性已得到大幅提升,制约电网可靠性的主要矛盾已由主网过渡到配电网。据统计[1],配电网过电压事故约占整个电力系统过电压事故的70%~80%。为了有效抑制配网过电压,必须要快速准确识别过电压类型。
过电压识别一般包括特征提取和模式识别两个步骤。在特征提取方面,按照特征提取所用信号维度不同,可分为一维信号识别方法和多维信号识别方法。一维信号识别方法是指利用电网电压、电流随时间变化的一维波形曲线识别过电压类型[2],多维信号识别方法是指对一维信号经数学变换为二维图像或三维及以上的多维信号,常用的方法有:小波变换[3]、经验模态分解[4]、S变换[5]、AD变换[1]等。文献[6]提取时域过电压信号的过电压持续时间、电压上升时间等8个参数作为特征量,利用Fisher判别分析法,计算判别式的值来区别内部和外部过电压。文献[7]对过电压信号离散小波变换后的时频矩阵进行奇异值分解,然后将分解后的结果输入支持向量机进行过电压类型的识别,该方法可识别15种不同类型的过电压。文献[8]对过电压时域信号进行S变换,然后提取出S变换后的信号方差、信号强度和S矩阵每列最大值的差分值等3个特征量,利用支持向量机来识别包括铁磁谐振过电压在内的4种不同类型的过电压。文献[9-10]都采用原子分解做为特征提取方法。与采用正交基函数的小波变换和S变换不同,原子分解采用过完备冗余时频原子,克服了固定基函数表达信号的局限性。
面向过电压的模式识别方法包括支持向量机[11]、神经网络[12]、模糊逻辑[3]、深度学习[13]等,虽然基于浅层学习的方法已经取得了令人满意的识别率,但是由于此方法对特征维数的限制,其在信号分解后还需要选取与其构造区分度较高的低维特征,这不仅增加了该识别方法的主观性和复杂性,同时也可能造成某些信息的丢失。在2006年Hinton等人提出了深度学习的概念与基本理论,其通过组合低层特征形成更加抽象的高层表示属性类别或者类别特征,以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解散数据,被广泛地用于图像识别与音频检测等领域[14]。文献[15]通过桥威廉姆斯分布对电力系统常见的7种过电压信号进行时频分解,构造可表达过电压信号时频能量特征的二维矩阵,并且利用改进后的、带5个隐层的卷积神经网络进行过电压分类识别,结果表明识别率较高,并且避免了人工提取特征的局限性和复杂性。文献[16]对配电网10 kV母线三相过电压信号进行双树复小波变换(dual tree complex wavelet transform,DTCWT),再通过奇异值分解将数据降维,将奇异值分解的特征输入深度信念网络(deep belief network,DBN)进行分类,结果表明,该方法特征提取的能力强且识别准确率较高。
相较于隐层层数少于10层的卷积神经网络,隐层层数多于20层的诸如GoogleNet,VGG-16等深层次卷积神经网络(convolutional neural network,CNN)识别率更高[17-18],但其也需要更多的数据样本进行训练。为了在配电网过电压识别中应用深层次CNN,需要研究适用于深层次CNN的数据集产生方法。
为了确保训练得到的深度神经网络模型具备足够的可靠性和分类性能,训练数据和测试数据必须满足以下两个基本的假设:1)训练数据集和测试数据集在相同的特征空间,并满足独立同分布条件;2)训练数据集的规模必须足够大,从而使得神经网络能够学习到有效的、与类别相关的特征。但在配网过电压识别中,上述两个假设条件都不能满足,因为国内外尚无公开的、规模足够大的配电网过电压数据集。虽然网络上已经公开了一些大型通用数据集,如COCOImage-Net,CIFAR等,但这些数据集都是动植物、风景等图片,其分布与配网过电压完全不同,所以上述数据集不能用于配网过电压神经网络训练。此外如前所述,由于国内配网过电压监测装置安装数量有限,国内没有公开的大型配网过电压通用数据集,但深层次的CNN模型需要大规模的数据,为了解决配电网过电压数据集数量不足的问题,首先利用电磁暂态仿真软件EMTPworks构建配电网过电压仿真模型,通过JavaScript编写仿真脚本,使其能够自动改变边界条件(故障初相角、过渡电阻、线路长度等),产生数以万计的过电压数据,而后根据过电压特征标注过电压信号,最后将仿真产生的电压一维信号通过连续小波变换处理,变换为二维时频信号,将二维信号利用CNN网络对数据集进行识别验证。
1 仿真模型的构建及过电压数据生成
1.1 仿真模型的构建
依据内蒙古某市某变电站实际的一次接线和基本数据,建立如图1所示的配电网示意图。仿真中电源模型采用50 Hz工频交流110 kV无限大电源,出口处阻抗决定了电源最大短路容量,其值可以根据已知的110 kV母线的短路容量以及短路电流参数,经计算得到。主变压器变比为110/10 kV,容量为31.5 MV·A,接线方式为Y/△-11,K1~K7为断路器,使用理想时控开关模拟断路器。1~5分别为出线的故障点。母线上挂有电容器组,出线上挂有电磁式电压互感器(potential transformer,PT),其中总出线数为5条,分别由电缆线路和架空线路组成,架空线路与电缆线路研究短路时只需要工频下的正序、零序参数,所以架空线和电缆都采用Bergeron的分布参数模型,其中为了获取更多过电压仿真数据,第5条出线的电缆和架空线路的长度可变,具体出线参数如表1所示。
图1 配电网仿真示意图Fig.1 Simulation schematic of distribution network
表1 仿真模型线路参数Tab.1 Line parameters of simulation model
1.2 配电网内部过电压低维数据的生成方法
生成的数据主要来源于配电网中较为常见的合闸空载线路过电压、投电容器过电压、间歇性弧光接地过电压以及铁磁谐振过电压(分频、基频)5种类型的过电压。
合闸是电力系统常见的一种操作,其通常分成两种情况:正常(计划性)合闸和自动重合闸。合闸空载线路过电压是由上述两种合闸操作形成的系统电压暂时性升高故障。在仿真过程中通过设置时控开关的时间参数来模拟断路器的闭合。在电容器合闸时,电容器两端的电压由两部分组成,即工频部分和高频部分,工频部分就是稳态电压,高频部分为暂态电压。投电容器组过电压的仿真方法与空载合闸类似,都是通过设置时控开关的闭合时间来模拟投电容器的操作。中性点不接地的配电网系统中,当发生一相短路接地故障时,经常出现电弧,由于系统中存在电容和电感,此时可能引起线路某一部分的振荡,当电流振荡零点或工频零点时,电弧可能暂时熄灭,之后事故相电压升高后,电弧则可能发生重燃的现象,这种现象则是间歇性弧光接地过电压。因产生弧光接地过电压的根本原因不稳定,仿真由并列的开断时间间隔20 ms的时控开关和较小的接地电阻组成,以此来模拟间歇性电弧。
在中性点不接地的配电网系统中,10 kV母线上仍然广泛采用传统的电磁式电压互感器(PT)。在系统发生故障或者断路器操作而引起的电磁能量的暂态转换中,PT的非线性励磁电感工作到饱和状态,感抗变小,若PT的励磁电感与系统的对地电容参数(主要出线的对地电容)匹配形成非线性谐振回路时,假设系统单相PT在线电压下的励磁感抗为XLe,系统的对地电容的容抗为XC0,有下式:
当电源电动势和阻抗参数落在某一曲线范围内时,就将产生相应频率的谐振现象,进而产生铁磁谐振过电压,由于铁磁谐振与系统的电网结构、运行方式以及设备特性参数有关,因而会导致系统出现高频、基频、分频谐振。在配电网中常见的铁磁谐振过电压为基频、分频铁磁谐振过电压,在仿真中以单相短路接地故障消失作为“激发”条件产生谐振过电压,通过改变出线线路的对地电容数值大小,分别构造不同频率的铁磁谐振过电压。
为了增加CNN训练和测试数据集的数量,通过EMTPworks自带的JavaScript功能创建上述仿真模型的脚本,根据不同的过电压故障需要改变的边界条件设置不同的参数迭代精度,可以获得上万条过电压数据,具体程序流程图如图2所示。充分考虑线路长度、故障位置、故障初相角、过渡电阻等诸多因素带来的影响,仿真时具体的可变参数如表2所示。
图2 过电压数据构建流程图Fig.2 Flow chart of overvoltage data construction
表2 过电压仿真样本实验条件Tab.2 Experimental conditions of overvoltage simulation samples
表2中,线路长度的变化均是改变5#出线的长度,铁磁谐振改变的线路长度依次对应分频、基频铁磁谐振过电压。测量的电压均为母线电压。
2 配电网过电压高维数据的生成及标注方法
2.1 基于CWT的高维数据构造方法
以卷积神经网络(CNN)为代表的深度神经网络可以直接处理二维图像数据,上述仿真所产生的的数据均为一维的时域信号,并不能直接用于后续的数据训练。系统在发生过电压故障时,其电压的波形是频率是随着时间改变的非平稳信号,因此选择连续小波变换(continuous wavelet transform,CWT)构造时频图用于CNN的识别训练[19]。
小波变换针对不同的频率可以选择不同的时窗,比如在过电压信号震荡剧烈、频率较高时选择较窄的时窗,在震荡较缓、频率较低的时候选择较宽时窗,已知信号h(t)的连续小波变换定义为
式中:α为尺度因子;τ为平移因子;θ(t)为母小波函数,满足
缩放因子越大时窗越宽,越小时窗越窄。尺度函数与函数的频率成反比的关系,大尺度表示信号的低频,小尺度表示信号的高频。
图3为间歇性弧光接地时母线A相的电压波形,仿真的采样频率为106Hz,共106个数据点。对电压信号进行连续小波变换,小波系数与尺寸、时间联立作图可以得到尺度-时间-小波系数图,因尺度和频率是成反比的关系,将尺度变换成频率就能得到频率-时间-小波系数图,如图4所示。
图3 间歇性弧光接地母线C相过电压值Fig.3 Phase C overvoltage of intermittent arc grounding bus
图4 间歇性弧光母线C相过电压时频图Fig.4 Time-frequency diagram of intermittent arc bus phase C overvoltage
假设尺度为α,采样频率为F,小波中心频率为FC,则α对应的实际频率Fα为
显然,根据奈奎斯特定理,为了使小波尺度图的频率范围是(0~Fα/2),尺度范围应该是(2FC~+∞)。对图4包含106个数据点的电压信号进行小波尺度的分解,尺度大小为256,由下式可以看出,为了使转换后的频率序列是一等差的序列,尺度序列必须取以下形式:
接着把尺度序列按照1:1:256取为等差序列,将得到的尺度-时间-小波系数利用连续小波变换得到256行106列的小波变换系数矩阵,再把尺度α序列转化为等差频率序列,纵坐标是信号的频率序列,横坐标是时间序列,以尺度和频率共同对应的小波变换系数c为系数,完成了尺度到频率的转化。因小波变换是线性变换,所以电压幅值升高体现在颜色上,为了使小波时频图的颜色在CNN识别中是有意义的特征,要对小波变换后的时频矩阵进行归一化处理。将矩阵取中的每个元素取模,使复数矩阵变为实数矩阵,在通过下式将矩阵归一化:
式中:A为未归一化的小波时频矩阵;x'为归一化后的时频矩阵矩阵;x为小波时频矩阵的任一元素。
经过上述步骤对图3经连续小波变换后得到二维时频图如图4所示。很明显,信号在20 ms的时候系统发生故障,C相母线电压幅值与振荡频率增大,并且每隔20 ms电弧重燃,电压幅值依次增大。对应的时频信号通过图4所示,可以看出,在20 ms时刻信号频率增高且每隔20 ms信号颜色依次变深。综上所述,通过连续小波变换得出的二维信号可以体现原有一维信号的特征。
2.2 过电压数据标注方法
在JavaScript生成的大量过电压数据集里面(数据波形如图5所示),因为是参数自动迭代生成,在大量的数据波形中会有一些波形是无效的,需要对数据进行标注。通过下面两种特征对波形进行标注:1)过电压持续的时间;2)过电压的幅值。具体标注步骤如下:
图5 配电网过电压波形及其时频图Fig.5 Waveforms and time-frequency diagrams of distribution network overvoltage
1)将所有时频图像保存在JPEGImages内;
2)按照表3给出的特征对图像进行标注,并保存到Annotations内;
表3 过电压标注特征Tab.3 Overvoltage labeling features
3)每个图片和标注得到的XML文件,JPEGImages文件夹里面的任意训练图片,Annotations里面的一个XML文件命名一致。
3 基于CNN的过电压数据识别有效性验证
为了验证数据的有效性,采用文献[1]所述的CNN网络,具体结构为输入层-卷积层1-池化层1-卷积层2-池化层2-全连接层-输出层。其中CNN的输入层是像素大小为45×45的二维彩色过电压时频图像,第一个卷积层卷积核大小为4×4,步长为1,采用非线性ReLU激活函数。第二个卷积层卷积核大小为6×6。两个池化层均为最大值池化层,池化因子为2。每次输入的训练样本数为3,全连接层使用具有动量的随机梯度下降(SGMD)训练网络,初始学习率为0.01。最大训练轮数为40,每一轮的训练都是一个完整的训练周期。
由于文献[1]的配电网过电压数据集个数为2 742个,而本文训练样本数为16 272个,因此将数据集分为6组,每组2 742个样本带入网络进行训练。通过指定验证数据和验证频率,监控训练过程中的网络准确度,并且每一轮都会打乱数据。用于训练和测试样本的比率为8:2。本研究的计算机操作系统为Windows 10 Home Basic,64位,处理器为2.4-GHz Intel®CoreTM i5-9300U,内存8.00 GB。GPU为NVIDIA GeForce GTX 1650。
每组的验证准确率如表4所示。6组数据平均识别时间为106 s,平均准确率为97.79%,准确率高,因此可以证明上述方法构造的数据集有效。
表4 CNN数据集验证准确率Tab.4 CNN data set verification accuracy
4 结论
在配电网过电压识别中使用深层次神经网络,需要大量样本数据。为此提出一种基于EMTPworks的JavaScript模块,通过改变线路长度、故障位置、故障初相角、过渡电阻构造电压数据的方法,该方法产生的数量远远大于已有的配电网过电压数据集,在数据预处理过程中,基于CWT构造了高维度的过电压时频信号,经分析可知,时频信号能完整地体现出过电压的时频特征。利用有效性实验对数据集进行了验证,结果表明该数据集可用于CNN的识别训练且准确率高。