基于自编码神经网络的电网故障预测算法
2023-02-09严宇平萧展辉
严宇平,萧展辉
(广东电网有限责任公司 数字化部,广州 510000)
由于我国输电线路距离长、分布范围广,导致电力设备面临着多种气候因素与地理环境的影响[1].调查研究表明,我国电网故障的主要诱发因素包括电力设备因素、人为因素和自然因素等[2-3].随着各种仪器仪表技术的进步,利用采集到的气象与电网运行数据来预测电网故障,提升电力系统运维检修和运行调度能力,对减小电网故障率具有重要的工程实际应用价值[4].
为了提升电网故障的预测能力,国内外学者针对各种影响因素展开了相应的研究.王磊等[5]使用气象数据来预测山火蔓延趋势,并构建森林火灾的处置态势图,实现电网森林火灾的预警;Li等[6]利用电网在线运行数据、外部环境数据和历史故障数据,使用模糊理论构建了电力系统运行评估的专家系统.近年来,深度神经网络[7]在图像、语音等信号处理任务中得到了快速发展,在分类与检测等任务中显著提升了识别精度[8-9].Adem等[10]结合神经网络和粗糙集理论来预测电网故障;Mei等[11-13]使用自适应网络与线路数据作为特征,采用鲁棒性和泛化能力更强的支持向量机来得到电网故障预测的最终结果.上述工作侧重于使用电网设备信息来预测电网故障,但未考虑到气象因素的影响.
本文从电网气象防灾与减灾的角度来研究电网故障预测问题.以气象数据和电网运维数据为基础,使用深度自编码网络来学习气象与电网故障之间的关系,并构建电网故障预测模型.案例分析结果表明,所提出的方法能够全面地建立气象与电网故障之间的映射关系,并能准确预判电网在给定气象条件下是否会发生故障.
1 深度自编码网络
深度自编码网络是一种特殊的神经网络堆叠形式,其通过重建无标签的输入数据来提取特征.假设输入数据集为{x(1),x(2),…,x(n)},x(i)∈Rn,深度自编码网络使用反向传播算法进行无监督训练,目标是使网络输出与输入近似相同,即y(i)≈x(i).
图1为一个包含3层神经元的自编码网络.该网络第1层相当于编码器,可将输入映射为低维特征表示;第2层为特征变换层,可得到多样化的特征表示;第3层为解码层,从特征表示重建输入数据.该网络的目标是学习一个近似恒等函数,使得y(i)≈x(i).该网络的编解码过程可以表示为
图1 3层自编码网络
h=fe(x)=S(Wex+be)
(1)
ht=ft(x)=S(Wth+bt)
(2)
y=fd(x)=S(Wdht+bd)
(3)
式中:fe、ft、fd分别为编码层、特征变换层与解码层;S()为Sigmoid激活函数;W为卷积操作权重;b为偏置.
为了保证网络输出y与输入x尽可能相似,深度自编码网络通过最小化重建误差L(x,y)来优化网络参数,L(x,y)表示为
(4)
2 基于自编码网络的电网故障预测
本文使用无监督预训练的自编码网络提取电力设备因素、人为因素和气象因素数据来预测电网故障.由于网络输入数据种类多样,首先需要根据其特点进行归一化处理;其次使用无标签的数据预训练深度自编码网络来提取输入数据特征并挖掘数据间的关联关系;最终基于预训练好的深度自编码网络来构建多尺度电网故障预测网络,使用自编码网络提取出的特征作为全连接网络的输入,从而建立气象数据到电网故障的映射.
2.1 数据采集与预处理
本文综合考虑电力设备因素、人为因素和气象因素与电网故障间的关系,使用这3类数据进行电网故障预测.本文所采集的具体数据类型如表1所示.
表1 电网故障输入数据
由表1可以看出,本文使用10种气象数据,各数据的采集周期为5 min.其中,温度与湿度主要影响电网设备的绝缘性能,风力因素则可能导致电网线路刮断、杆塔倾倒等故障.同时,根据各气象数据的产生条件可以将其分为连续数据与离散数据,如降水量、风力、温度与相对湿度等为连续数据;雷击和山火数据则根据其是否发生分别使用0/1进行标识,类型为离散数据.
电力设备因素数据包括不受外界条件影响的静态数据与电力系统运行时会变化的动态数据.本文选用静态数据中的线路电压等级来衡量线路绝缘情况与设备运行情况;选用线路电压、电流和频率3个动态数据来衡量线路运行状态.
由于不同数据类型差异较大,因此本文对采集的数据进行归一化处理,计算表达式为
(5)
式中:z=[z1,z2,…,zi]为气象数据向量;z′为归一化后的数据;zmin、zmax为气象数据的最小值与最大值.
2.2 自编码网络
考虑到本文使用数据种类多,输入数据难以挖掘不同数据间的关联特征,文中先使用无标签的气象数据预训练自编码网络来提取输入数据所包含的特征,并挖掘不同数据间的关联特征.
图2为本文提出的多层自编码网络.该网络使用两个编码层对输入数据进行特征提取与降维;一个特征变换层对特征进行变换,以提取更深层的特征映射;两个解码层将特征反变换为原信号的分辨率.各网络层由全连接层与Sigmoid激活层组成.由表1可知,本文网络使用了16种输入数据.自编码网络的各层参数如表2所示.表2中,(16,8)表示输入神经元的数量为16,输出神经元的数量为8.
图2 深度自编码网络
表2 网络参数设置
自编码网络的目标是通过重建输入信号来提取多尺度的特征,因此本文使用式(4)给出的误差函数来训练自编码网络.考虑到电网数据具有区域性强与时变性强的特点,同时数据样本受采集过程的影响较大,容易出现误差,从而降低网络的性能,本文基于去噪自编码网络的思想,通过对输入信号增加噪声扰动来提升网络的泛化能力与鲁棒性.
2.3 电网故障预测网络
预训练的自编码网络只能提取出输入数据内部的特征,得到不同数据间的内部关系,而无法预测电网故障类型.本节在自编码网络的基础上构建了电网故障预测网络,建立了各影响因素与电网故障间的映射.
图3为本文构建的电网故障预测网络.该网络首先使用自编码网络提取电力数据的中间特征;其次串接各中间特征表示得到多尺度特征;最终使用一个全连接层与Softmax分类器得到电网故障类型及相应的概率.
图3 电网故障预测网络
电网故障预测网络的输入为表1中的16种电网数据,输出为发生短路、断线、塔杆倒塌、淹水故障和正常运行5种常见电网运行状态.故障预测网络的编解码层使用预训练的自编码网络对权重进行初始化,全连接层使用分类损失进行训练.
3 算例验证
本文以某地电网数据作为研究对象,通过关联匹配电网设备信息与气象数据得到电网故障预测数据集.该地区电网覆盖面积广阔,包含不同气象条件,如山火、雷击和飓风等.本文共采集到500组数据,使用其中的400组作为训练集,剩下的100组作为测试集进行仿真测试.数据集进行初始化处理后作为自编码网络与故障预测网络的输入,并分别使用ADAM优化器优化迭代10 000次.网络使用Pytorch深度学习框架实现,初始学习率为0.1,每2 000次迭代学习率衰减0.1.文中使用精确度参数来判断网络的性能;使用正确率P、F-value和G-mean来验证所提出算法的有效性,各参数定义表达式分别为
(6)
(7)
(8)
(9)
式中:TP为正类被预测为正类的概率;FP为负类被预测为正类的概率;FN为正类被预测为负类的概率;TN为负类被预测为负类的概率.
3.1 故障预测结果分析
本文从5种运行状态中选出概率最高的运行状态作为电网故障预测结果.图4为使用本文算法测试两组不同场景采集数据得到的预测结果.从图4a可以看出,在给定电网运行数据条件下,发生断线、短路、塔杆倒塌、淹水故障和正常运行的概率分别为85.2%、1.64%、1.57%、0.15%和11.44%,即在当前电网运行条件下发生断线故障的概率最高,因此,故障预测网络的输出结果为断线故障.对比实际检测结果可知,该组数据是在架空线路断线情况下监测的,表明网络预测结果与实际情况相符.同样,根据图4b结果可以看出,在给定电网运行数据条件下,发生断线、短路、塔杆倒塌、淹水故障和正常运行事件的概率分别为17.63%、45.78%、10.55%、13.47%和12.57%,即在该组数据下发生短路的故障最高,故障预测网络的输出为短路故障.对比实际检测结果可以发现,该组数据是在发生瞬时单相接地故障条件下采集的,网络预测结果符合实际检测结果.
图4 不同数据下故障预测网络输出结果
3.2 算法比较
为了验证所提出算法的有效性,将该算法与传统自编码网络、贝叶斯分类器和支持向量机等分类算法进行比较,且所有算法使用相同的训练数据和测试数据.实验结果如表3所示,从表3中可以看出,文中算法的正确率、F-value和G-mean参数明显优于其他算法.表明所提出的算法能提取出更有效的特征,提高电网故障预测的正确率.本算法相比于传统的基于自编码网络的电网故障预测结果有较大的提升,表明使用多尺度的特征表示可以提升网络的预测精度.
表3 不同算法结果比较
3.3 影响因素与分析
本算法综合考虑了电力设备因素、人为因素和气象因素与电网故障间的关系.为了评估这些因素对电网故障预测精度的影响,文中测试了使用不同影响因素数据及其不同组合时电网故障预测网络的精度,结果如图5所示.从图5中可以看出,随着输入数据种类的增加,电网故障预测网络的精度逐渐上升,表明输入数据的种类对网络的精度具有较大的影响.从图5也可以看出,气象因素相对于电力设备因素与人为因素对网络预测精度具有更大的影响.
图5 不同影响因素组合时电网预测精度
4 结 论
本文从电网气象防灾与减灾的角度研究了电网故障预测的问题,提出了一种基于自编码神经网络的电网故障预测算法.与不同算法的比较结果表明,所提出多尺度的特征表示算法可以提升自编码网络的预测精度.分析不同因素对电网故障的影响可知,气象因素相对于电力设备因素与人为因素对网络预测精度的影响更大.