电力通信网络智能运维故障诊断系统研究
2024-03-14张梦凡史普鑫孟繁林
张梦凡,史普鑫,孟繁林,张 贲,耿 琳
(国家电网华北电力调控分中心,北京 100053)
0 引言
近年来,电力网络的规模逐渐增加,为我国各地区经济发展提供了优质的电力保障。信息通信的发展与电网的智能化程度密切相关[1]。电力通信网络是电力系统智能化的重要组成部分。通信网络的环境复杂、业务众多、服务质量需求多样化,对电力通信网络的可靠性和安全性提出了挑战[2]。
在国内外电力通信网络研究中,基于快速傅里叶变换 (fast Fourier transform,FFT)的概率神经网络故障诊断模型[3]方法建立了电力信息网络模型,研究了通信网络与电网各自运行的进程和业务数据的交互,分析了网络拓扑模型的相似性。但该方法没有考虑到电网不同的运行方式,以及二次设备动作对网络故障的影响。基于深度学习的网络故障诊断系统[4]采用蒙特卡洛模拟方法,对通信网络链路的有效性和耦合网络的可靠性进行分析,提高了通信误码链路的有效性。但该方法忽略了通信网络与电力网之间的耦合程度,只考虑了单侧网络节点的重要程度。输气网络故障对供气安全的影响[5]方法通过构建级联故障的网络物理系统模型,分析了输电网络和信息物理耦合网络在不同拓扑组合下的可靠性,完成了通信网络的故障定位。但该方法未考虑多属性决策对节点重要度的影响,对复杂网络拓扑特征的识别不全面。
本文针对电力通信网络设计了智能运维故障诊断系统,以保证电力通信网络的高灵活性和可靠性,并确保电力系统中生产控制业务、信息管理业务、电力调度和控制等业务的正常运行。
1 智能运维故障诊断系统设计
智能运维故障诊断系统对网络中的网络节点进行故障诊断,使网络节点不会受到攻击或感染恶意程序,以保障通信网络中关键的业务类信息流正常传输,从而提升网络资源利用率。这将为重点业务提供保障,以确保电力通信网络的高效运行[6]。
系统整体架构设计如图1所示。
图1 系统整体架构设计
系统通过对电力通信网络节点进行监测和预警,确保通信网络正常运行。在分析网络节点故障的过程中,系统需对故障点进行定位,以提出合理的智能运维方案,从而完成网络节点故障的排除。系统的故障诊断模型中融合了智能化算法,借助计算机高效的计算能力提高了网络故障检测与诊断的效率。系统通过数据挖掘技术获取数据之间的内在联系,并在复杂的网络结构中进行精确的自动化检测和诊断[7]。
系统基于Apache Hadoop开源框架进行设计、开发,通过整合大量的服务器资源完成海量网络数据的存储和处理。多个服务器之间相互保存多个备份。在对通信网络节点监测数据的统计和分析中,系统使用Hadoop生态交互卷(Hadoop interactive volumes in ecology,HIVE)数据分析和处理工具,并提供相应语言进行数据查询。HIVE的计算引擎将结构化查询语言(structured query language,SQL)语句转化为可执行的并行计算框架的计算任务[8]。
系统进行故障诊断前,使用卷积自编码器提取通信网络节点状态特征,对原始特征进行变换,并提取出非冗余的特征向量,从而为处理高维特征空间提供强大支持[9]。通过模型的运算变换得到节点监测数据映射的新特征集合,可以提高特征数据获取的准确性,从而在为通信网络故障诊断提供支持的同时缓解了系统数据的存储压力。系统前端界面使用了蚂蚁数据可视化工具。该工具可将数据统计分析结果、数据计算结果、节点状态和故障诊断结果通过图形和图表的形式表现出来。数据库中单个数据项以图元素的形式进行表达。结构化的通信网络参数数据模型指导大量图元素汇集成数据图像,使系统用户能够理解不同维度的数据表达,从而完成更加复杂和高级的运维方案分析。
2 关键技术分析
2.1 扩频调制技术的网络感知模块设计
为实时感知当前电力通信网络中网络节点的状态、协助系统完成网络监测和故障诊断,本文设计了网络感知模块,以采集网络节点的网络参数。网络感知模块采用了扩频调制技术,可以根据发送节点和接收节点间的距离和功率限制条件选择合适的数据速率,从而完成网络性能的优化。
感知网络结构如图2所示。
图2 感知网络结构
感知网络结构包括了网络感知模块、感知网关、网络服务器和应用服务器等。网络感知模块与感知网关通过网状拓扑结构连接。网络感知模块以STM32F103ZET6作为微控制单元。网络感知模块内部的射频收发器使用SX1278芯片[10],支持远距离无线电(long range radio,LoRa)、高斯频移键控(Gauss frequency shift keying,GFSK)、频移键控(frequency-shift keying,FSK)、最小频移键控(minimum-frequency shift keying,MSK)等多种调制方式。电压在100 mW内波动输出功率为20 dBm。网络感知模块的硬件结构如图3所示。
图3 网络感知模块的硬件结构示意图
图3中,射频通信模块由射频收发器和其他外围电路组成。射频通信电路中使用了Hi2115芯片,支持约束型应用协议(contrained application protocol,CoAP)和用户数据板协议(user datagram protocol,UDP)/传输控制协议(transmission control protocol,TCP),通过Modbus协议实现串口到网络的双向数据传输[11]。模块硬件板卡预留的8路数据采集接口和RS-485总线接口能够兼容多种网络传感器,极大地提高了模块的传感器驱动能力[12]。为降低电力通信网络中噪声信号对模块感知精度的影响,在硬件设计中考虑到抗干扰的设计,加入隔离电路以实现双向隔离和光电隔离。隔离电路如图4所示。
图4 隔离电路
图4中:双向隔离芯片选择ADUM1250;光电隔离器使用LTV816STAI芯片。在网络感知模块的两端使用光耦和隔离电源进行电气隔离,可以消除某些采集通道噪声对模块的影响[13]。通过双向隔离芯片隔离模块中外部信号和内部信号,可以确保外部信号不和主控单元直接相连,使处理器更稳定。这将保证感知模块的采集网络参数的精度不受影响,使模块具有较强的抗干扰能力,并且模块内部之间不会受到彼此的干扰。
2.2 生成对抗网络的网络故障诊断方法
当前,电力通信网络的应用场景较为复杂,通信网络向异构化和密集化方向发展,对网络故障检测和诊断提出更高的要求。本文将生成对抗网络(generative adversarial networks,GAN)的思想引入网络故障检测与诊断领域。本文基于GAN构建故障诊断模型,通过少量带有标签的数据集获取大量数据集用于故障诊断模型的训练[14-15],并利用生成器和判别器分别对网络参数样本进行生成和分类。基于GAN的网络故障诊断过程如图5所示。
图5 基于GAN的网络故障诊断过程
图5中的GAN包括了2个模型,分别是生成模型和判别模型。生成模型接收1个服从某分布的随机变量。判别模型用于区别生成的样本和真实的样本[16]。GAN中使用了多层感知器。网络的优化目标函数为:
(1)
通过式(1)可完成GAN的博弈。生成模型从真实数据中取样。判别模型根据真实数据的分布规律进行学习。
网络故障诊断模型先确定不同通信网络状态的对应特征,再对故障进行识别。不同网络状态的输入向量为S=[P1,P2,…,PN],对应的网络状态可表示为C={fc1,fc2,…,fcn}。当电力通信网络出现某个类型的故障时,故障期间的网络状态向量为:
(2)
(3)
式中:max(Pi)为收集的网络参数中出现的最大值。
通过式(3)可确保输入的网络参数值的动态范围相似。本文在故障诊断模型的GAN的判别模块中引入1个基本约束,并在超参数控制范围内对权重进行裁剪。得到的优化目标函数为:
(4)
通过式(4)可得到优化后的目标函数。预测的网络状态与真实的网络状态之间的差异可表示为:
(5)
通过式(5)可以计算实际值与预测值之间的差异。本文将预测值代入损失函数,可得:
(6)
通过式(6)可计算最终损失值。
综上所述,经过预处理的网络参数输入GAN中进行数据拟合,可得网络状态的性能指标;对模型复杂度进行权衡,可以进一步提高故障诊断模型效率。
3 试验测试
为验证本文研究的网络故障诊断方法的有效性,本文模拟真实网络进行环境的搭建。仿真的试验环境中设置了不同的网络状态类别。试验环境如图6所示。
图6 试验环境
试验环境条件如下:中央处理器(central processing unit,CPU)采用AMD2600;主频为3.40 GHz;运行内存为16 GB;显卡为GTX1070TI;显存为8 GB;操作系统为Windows 10;软件版本为Tensorflow1.14。其中:系统类型为3个小区的试验环境;小区半径为500 m;系统带宽为5 MHz;频率复用为软频率复用;基站发射功率为43 dBm;用户数量为50~100个;仿真时间为60 000 s。
试验中使用的数据为电力通信网业务数据流的统计特征数据,包含了所有可用统计特征的特征集合。试验数据集中的230个特征表示1个业务数据流。数据集的数据类型包括了Web浏览、邮件、文件传输、网络状态、数据库、多媒体等多种业务类型。
试验数据集如表1所示。
表1 试验数据集
本文在进行故障检测试验前,利用故障诊断算法模型对各网络状态下的小样本数据进行学习,并使用文献[3]系统和文献[4]系统的故障诊断模型进行对比测试。文献[3]系统模型使用了随机森林算法(以下称为“方法1”)。文献[4]系统模型使用了贝叶斯分类器(以下称为“方法2”)。本文设定各系统的故障诊断模型的训练次数为50~200次。各方法在不同特征数下的网络故障诊断准确率如表2所示。
表2 故障诊断准确率
故障诊断准确率变化曲线如图7所示。
图7 故障诊断准确率变化曲线
对比3种方法故障诊断模型在不同训练次数和特征数下的诊断准确率可知,本文方法的故障诊断模型的训练时间更短,在较少训练次数的情况下具有更好的故障诊断效果。当训练次数为50次时,本文方法的故障诊断准确率为95.2%。当训练次数增加到140次时,本文方法的故障诊断准确率增加到99.4%。当训练次数达到200次时,本文方法的故障诊断准确率最高为99.8%。
方法1和方法2在训练次数较少的情况下,模型的故障诊断效果不好,故障诊断准确率在94%以下。方法1的准确率最低为92.1%,在训练次数达98次以上时的准确率才超过95%,并且准确率最大不超过98%。方法2的准确率最低为91.3%,在训练次数达到125次时准确率超过方法1,训练次数最大时的故障诊断准确率为98.4%。
为验证本文方法在训练过程中的性能,本文将迭代次数设定为2 000次、训练时间设定为300 s,并以卷积神经网络作为对比进行测试。在训练过程中的模型损失值对比如图8所示。
图8 模型损失值对比
由图8可知,本文方法的损失函数收敛更加稳定,模型的损失值在较短时间内快速下降,模型的诊断效果逐渐稳定。当迭代次数为1 000次时,本文方法的模型损失值下降到0.1以下,表明本文方法能够较好地区分出真实样本和生成样本。当迭代次数在1 500次后,本文方法的模型损失值最低为0.03。卷积神经网络的收敛速度较慢。当迭代次数在500次时,卷积神经网络的模型损失值为0.43。当迭代次数在1 000~1 500次时,卷积神经网络的模型损失值出现明显波动,最高超过0.15。在训练过程中,卷积神经网络会产生与原始数据集不一致的数据,导致故障诊断效果不稳定。
4 结论
本文为电力通信网络设计了智能运维故障诊断系统,通过系统的故障诊断和运维有效缓解故障传播所造成的危害,从而为电力通信网络提供了更加灵活、满足多样化功能和需求的诊断策略。系统故障诊断模型中加入了GAN,先根据网络故障的小数据量信息、通过网络训练后生成大量可靠数据集,再进行模型的训练和测试,以完成故障诊断与预测。
本文提出了一些有效的解决方法,但同时也有需要改进和解决的问题。如当故障诊断模型的结构发生改变时,模型的诊断准确率可能会受到影响。后续研究还需进一步加强模型的泛化能力和稳定性。