APP下载

基于实时分布式计算平台的智能变电站设备在线监测研究

2021-12-27付柳笛周陈斌姜健琳李金梅

机械与电子 2021年12期
关键词:分布式计算监测仪器变电站

殷 伟,付柳笛,周陈斌,姜健琳,李金梅

(1.国网苏州供电公司,江苏 苏州 215000;2.上海泽鑫电力科技股份有限公司,上海 201206)

0 引言

智能变电站设备的连续在线监测会产生大量的监测数据,需要及时有效地对这些数据进行分析,以便准确了解设备的运行状态[1-2]。当前变电站部署的电磁干扰监测仪器(electro-magnetic interference,EMI)[3]由多个通道组成,选定的传感器可以从这些通道连接到设备。在通道中增加一个传感器会成比例地增加分析所需的数据输出、存储和处理时间。EMI测量值包括频域和时域。在频域中,仪器通过频率扫描,将关键频率与故障相关现象相关联;在时域中,选定点频率的时间分辨信号揭示了故障相关现象所产生信号的瞬态性质。尤其是在时域信号中,每秒可以捕获数千个点,这些监视数据量随着时间的推移,将呈指数型增长。要提高这些设备的数据分析能力,同时保持其连续在线监测的状态,需要投入很大的成本来改善底层计算硬件。

为了满足对变电站设备的连续在线监测和对监测到的大量数据进行分析处理,实现设备自动化智能故障诊断,开发了一个基于实时分布式计算的平台用于智能变电站设备在线监测。该系统将计算平台与现有的固定监测基础设施无缝集成,以扩展监测设备的自动化决策能力。为验证该平台,将一个大型变电站的一系列EMI监测设备跟分布式计算平台集成起来,结果证明该系统能够提供有效的数据存储和分析处理能力。

1 EMI诊断

1.1 设备在线监测

监测仪器捕获的电磁干扰监测数据,是通过一个固定在变压器中性点接地周围的射频电流互感器(radio frequency current transformer,RFCT)获得的。RFCT的测量带宽高达200 MHz,是一种无源探测装置,不需要在系统中插入额外的信号,因此这是在线状态监测的首选方法。电磁干扰诊断需要测量宽频带内的频率,本文考虑了监测仪器设置的50 kHz~20 MHz范围内的EMI频率。测量遵循CISPR-16:1999电磁干扰数据收集国际标准。该标准规定了EMI接收器的规格,从而确保了一系列EMI接收器捕获的所有测量值的一致性[4]。

1.2 变电站数据安全传输

由于变电站内有很多基础设施,数据安全传输非常重要,且存在许多安全标准,其中电磁干扰监测过程必须符合这些标准。数据安全传输对于远程计算尤其重要,因为捕获的数据必须路由到异地,这使得数据易受中间人(man-in-the-middle,MITM)攻击,即在2个系统之间通信时截获信息。变电站和计算平台之间的身份验证机制将有助于保护数据,并降低数据截获和操纵的风险。IEEE 1686标准提供了智能电子设备(intelligent electronic devices,IED)安全合规性的框架[5],标准的第5.4节IED网络安全特性概述了符合要求所需的加密技术,特别是安全隧道功能,因为进出现场的数据必须由虚拟专用网(virtual private network,VPN)提供。国家标准与技术研究所(national institute of standards and technology,NIST)的计算机安全部门,管理并促进美国政府机构数据和通信保护所需的加密标准和技术[6]。IEEE 1686与NIST在密码特性遵从性方面保持一致。NIST称传输层安全/安全套接字层(transport layer security/secure socket layer,TLS/SSL)VPN可提供对公司资源的安全远程访问[7],使用这个VPN,所有的流量都会通过兼容的加密功能进行加密。为了满足当前的NIST和IEEE 1686标准,已经实施并部署了使用数字证书和高级加密标准(advanced encryption standard,AES)256位密码块链(cipher block chaining,CBC)模式的TLS/SSL VPN,用于变电站和计算平台之间的远程通信。

2 分布式计算

2.1 分布式计算模式

分布式计算服务通常遵循以下3种模式之一[8],即基础设施即服务(infrastructure as a service,IaaS)、软件即服务(software as a service,SaaS)和平台即服务(platform as a service,PaaS)。IaaS为客户提供了高水平管理,从提供硬件和存储到建立通信网络功能,极大程度上满足了客户需求。SaaS基于对Web服务器的纯API调用工作,客户端不必管理软件产品或底层基础设施。IaaS提供了对PaaS基础设施的灵活管理,供应商可以配置、更新及维护硬件、存储和操作系统。此平台的部署可以在内部进行配置和调整,以满足客户需求,具体取决于要监控的设备数量。因此,本文建议将PaaS模型用于变电站设备运行状态监测,允许客户端访问一系列分析和存储服务,而无需维护终端。这将极大程度上降低变电站的运营成本,同时为将来扩展到多个设备或变电站提供一个高度可扩展的平台。

2.2 分布式计算平台

分布式计算平台为客户提供了一个完全托管的服务平台,其中每个服务都是云服务,所有内容都通过Internet连接进行处理、存储和管理,这非常适合于具有永久固定Internet连接且没有带宽或数据限制的客户端。分布式计算平台还为客户端提供了将客户的整个硬件和软件基础设施迁移到分布式系统中的能力。但数据连接和数据限制的波动性,对完全托管的分布式计算平台提出了挑战。由于现有变电站已有固定的基础设施用于设备监测,无需对这些设备进行更高级别的数据采集和监测,这些设备将自动执行更高级别的数据采集。因此,基于分布式计算平台的监测方法的任务是为现有的监测设备提供更多的智能分析,以便对新出现的故障及其分类做出更准确的预测,让连续在线监测所捕获数据可视化,使监测数据更有意义。

分布式计算平台是一种现场云服务平台,为客户提供了更高级别的网络安全和网络数据流控制,无需担心蜂窝互联网连接的带宽或数据限制。云服务请求的延迟也有所减少,特别是在大数据查询和处理方面。对于许多无法接入互联网的变电站(如蜂窝式变电站),分布式计算平台是一个有效的解决方案,由于提供了更高的数据安全性,可以访问互联网的客户也可能倾向于接受此服务。然而,在处理和存储可扩展性以及平台维护方面,分布式计算平台服务也有一定的限制性。目前,垂直可扩展性是提高数据存储和处理能力的唯一途径,软件组件的更新必须在现场提供,而不能远程提供。但因为分布式计算平台能显著提高其设备状态监测的分析能力,变电站权衡下还是愿意采用这种方法。

分布式计算平台通过允许监控设备继续执行EMI监测并获取本地数据,有效地扩展了变电站监控基础设施的能力。本文采用了PaaS分布式计算平台,以增强变电站运行状态监测所需的智能分析能力。

当前分布式计算平台内的数据流动如图1所示,显示了从现场监控和通过VPN进行场外通信到用于分布式存储、分析处理和可视化的分布式计算的每个阶段。分布式计算平台包含的3个节点是64位8核Intel core i7-2600 CPU,运行速度为3.40 GHz,内存为16 GB,运行Ubuntu 16.04 64位操作系统。

图1 分布式计算平台部署

3 数据分析平台

利用开源技术并在变电站设备上部署数据分析平台方案,能降低变电站大数据分析的成本,不需要过高的启动成本。本节概述了拟议分析平台的每个组件,查看所使用的开源技术及数据分析在整个模型中的位置。此外,讨论了在EMI频率测量中增加自动化智能和决策的拟议算法,以显示这些算法如何适合作为数据分析的一部分,来用于EMI状态监测。

3.1 数据分析设备

由于EMI状态监测仪器目前是已部署现场监测网络的一部分,因此注意不要干扰现有EMI监测仪器的内部过程。在本研究中,在监测设备上进行试验和测试得到的所有数据的复杂分析均在Raspberry Pi 3 B型[9]上进行,以有效地反映已部署监测设备的处理和存储能力[3]。

3.2 数据采集

如图1所示,现场监测仪器将是固定变电站网络基础设施的一部分,连接至RFCT,用于设备的EMI状态监测。有效的数据采集和获取过程对于收集这些监测仪器产生的大量数据至关重要[10]。数据分析平台必须能够在仪器捕获数据进行预处理和存储时获取数据。为了促进这一过程,使用Apache NiFi,作为创建从监测仪器到非关系数据存储平台的数据流的手段。NiFi是一种高度可配置且通用的工具,可处理来自一系列状态监测仪器的连续数据流。GetFile和PutFile 处理器节点允许获取最近创建的频率扫描,并将其移动到一个目录中进行预处理和存储,这些节点通过从数据源复制1次数据然后删除该文件来确保不会发生数据重复。该过程确保仪器能够持续释放内部存储器,这是连续在线监测的必要程序。ExecuteStreamCommand处理器通过对数据库的API调用,以及用于解析[11]的内置元素树库函数调用python脚本来解析和存储数据。在此阶段执行的预处理通过解析由工具创建传入的XML文件并将其转换为JSON(Java脚本对象表示法),实现了更有效的数据存储。JSON提供的键值表示法在面向文档的数据库中存储和查询数据时具有优势。

3.3 数据存储

由于连续在线监测系统将产生大量监测数据,必须采用有效的数据存储平台,分析平台不仅在数据保留方面要具有持久性,还在读写操作速度方面要有更高的性能,以提高查询性能。这给传统关系数据库管理系统(relational database management systems,RDBMS)带来了挑战,如结构化数据类型(即行/列存储方法)、存储系统的纵向可扩展性和模式的灵活性等限制,在处理非结构化或半非结构化数据时,SQL数据库中明显存在这些问题。此外,这些限制将导致系统中的数据高延迟,尤其是当数据量和速度较高时。非关系或NoSQL(不仅仅是SQL)数据库旨在通过提供未定义的模式以及低成本设备硬件上的水平可伸缩性来克服这些限制[12]。当数据存储或处理性能成为一个问题时,这有助于降低企业的成本。数据复制是许多NoSQL数据库提供的另一个重要功能,这有助于通过在多个服务器实例中分发数据来构建数据的一致性和安全性。这些因素有助于设计和开发分布式高级存储体系结构,该体系结构将作为一个集中的存储库,用于长期收集所有监控数据。

为了提高查询效率和数据库事务处理速度,采用了面向NoSQL文档的数据存储平台MongoDB[13],MongoDB由二进制JSON(BSON)无模式文档的键值集组成。没有定义的数据库模式使其成为各种数据类型的灵活存储平台,非常适合EMI监测数据。MongoDB具有动态查询功能,允许查询键和值以及检索和整合操作,是处理非常大数据集的一个好选择。MongoDB关键特性是可伸缩性、模式灵活性、数据复制、索引和整合操作,以实现高效快速的查询。

对于数据存储部署,建议在MongoDB中使用复制。复制允许跨多个服务器执行相同数据的实例,从而确保所有捕获数据的持久存档。其工作原理是分配1个主服务器和多个辅助服务器,其中包含主服务器上当前保存内容的副本;如果主服务器崩溃,辅助服务器可以选择新的主服务器,这有助于保持服务的连续性和数据的保留。连接的副本集节点包含所有捕获数据的持久、最新数据集,尽管它们在地理上是分开的。如图1所示,站点A和站点B之间发送的数据以及站点B和变变电站之间发送的数据通过TLS/SSL VPN隧道进行安全保护,如前所述,配置符合IEEE 1686,用于IED捕获数据的场外通信。MongoDB的实现是分布式计算和数据混合存储部署的完美配合。因此,面向文档的NoSQL数据库MongoDB是实现混合数据分析平台的数据存储平台。

3.4 数据分析

混合数据分析平台使用高级编程语言Python作为数据分析的科学计算框架,通常称为SciPy堆栈。Python提供了一系列库,支持数据的结构化、操作和统计计算。Python分析计算框架的开源特性和行业范围的实现是数据分析平台部署的理想选择。MongoDB还使用基于Python的API[11]进行数据存储和查询,这将无缝地弥合数据存储和分析之间的差距。

利用数据分析平台的计算能力,本研究旨在实现EMI频率扫描中准确检测故障条件所需的自动化水平。这反过来会产生时域分辨率结果,仪器可在这些确定的位置进行扫描,并将扫描结果发送到合适的AI框架[14],以进行准确的故障分类。最终为全自动在线状态监控流程铺平道路,以监控多个全球连接的设备,而无需持续的人机交互和决策。

为此,已经实现了一种智能峰值检测算法,并利用数据分析平台的分析框架,该算法使用Numpy(数值Python)库用Python编写。识别EMI扫描中的重要候选频率具有挑战性,因为从EMI仪器捕获的频率数据本质上是非线性和非平稳的。峰值检测算法必须能够区分由于出现故障条件引起的信号变化和窄带干扰的变化。去除大部分窄带干扰有助于将频带保持在频率扫描范围内,以判断故障是否发生。由于经验模式分解(empirical mode decomposition,EMD)具有数据驱动和自适应信号分解功能,能使用每个分解迭代作为其信号基础,因此,采用EMD来实现峰值检测[15]。EMD可确保维持信号的原始结构,同时将信号分解为其最短周期分量或振荡模式,称为固有模式函数(intrinsic mode functions,IMFs)。对于输入信号,X(t)可以分解为n个IMFs,用ci表示,残差用rn,如式(1)所示。

(1)

经过筛选的IMFs的后半部分保持了输入信号的原始结构,没有太多的窄带干扰。通过取这些IMFs的后半部分之和,得到了信号的低通表示。将其直接输入峰值检测算法,以捕获EMI扫描内潜在故障位置的那些频率峰值。

使用讨论的方法捕获的峰值频率如图2所示。这些峰值频率显示为信号主要频带分量的一部分,因此表明出现了故障。该方法实现了稳健的EMI频率识别过程,可用于进一步的时间分辨分析和分类[16]。所采用的智能分析包括对时间序列应用高阶统计量以获得双谱分析,这些数据被发送到深度残差神经网络进行故障分类。这是在Python中开发的,利用Keras神经网络库和Tensor Flow后端来处理数据流。

图2 峰值检测结果

3.5 数据可视化

数据可视化是提供的嵌入式智能的一个重要组成部分,因为它可以直接帮助定位设备内的故障并观察随着时间推移故障的发展。Matplotlib是Python的可视化库,它可以生成广泛的出版物标准视觉和图形,适用于设备诊断。该库用于绘制和突出显示EMI扫描上的峰值频率,如图2所示,也用于更图形化的可视化,如随时间变化的EMI频率扫描趋势,这也是由于利用了MongoDB的查询性能和速度以及Python的数据分析能力的结果。

利用分布式计算能力的提高,可以对价值数周的EMI数据进行趋势分析,可以在整个EMI扫描中分辨出高振幅区域。这些高振幅区域可在热图可视化中显示,有助于验证峰值检测算法捕获的峰值频率,也有助于显示故障位置随时间的变化。这种变化可能是由于对设备进行维护或故障条件恶化造成的。

在图2中确定的高振幅频率可在2周的时间内进行趋势分析,以查看仪器内可能的故障位置。现场监测设备在2周内收集的超过250次的EMI扫描结果,结果表明,在0.44 MHz和2.88 MHz频率下,高强度振幅在整个时间段内是一致的。该EMI数据趋势有助于提供故障自动智能分析和验证,以确定每次扫描中捕获的峰值频率。所提供的可视化和分析水平突出了分布式计算在EMI诊断过程中的优势,尤其是在处理大量连续监测数据时。

4 结果分析与讨论

4.1 数据获取

EMI数据趋势扫描为测试MongoDB的数据访问、整合和查询性能提供了一个理想的场景。首先作为本地查询进行测试,用于希望使用分布式计算平台的客户端;然后作为远程查询,通过VPN进行测试,用于分布式计算和数据分析。在2周的时间内,RFCT总共捕获了253次EMI扫描,总共获得126 753个频率和振幅点。用于获取此数据的MongoDB整合查询的执行时间在本地为0.33 s,在VPN连接上为4.16 s。这些结果表明了NoSQL方法在实际应用中的优势,并有望在数月和数年内收集更大的EMI状态监测数据集。

4.2 数据自动分析

通过基于实时分布式计算平台的峰值检测算法在0.44 MHz和2.88 MHz下识别出的峰值频率被发送用于时域分辨率测量,并发送给开发的深度学习算法[17]进行故障分类。图3和图4中显示了2种频率下的时域分辨,通过分析发现,在这2种频率下的故障都被归类为局部放电(partial discharge,PD),这是一种与变电站二次设备的绝缘退化相关的故障。这些频率的成功识别再次凸显了拟议数据分析平台所带来的自动化分析能力增强的好处。

图3 0.44 MHz时的时域分辨率

图4 2.88 MHz的时域分辨率

5 结束语

本文提出在变电站部署一个基于分布式计算和混合数据分析平台,实现变电站的设备状态监测设备中数据智能分析、存储和可视化等功能。通过开源技术进行数据采集、存储和分析,不需要增加每个监控设备的处理能力,减少了变电站连续在线监测的大数据处理分析的成本。数据分析平台满足了IED内变电站场外通信的相关安全标准,并在数据获取方面具有良好效果,即使是通过蜂窝连接,也能快速获取实时数据。开发的分析技术使数据分析平台能够为故障识别和分类提供更高级别的自动化分析,为可扩展的数据分析平台铺平了道路。因此,基于实时分布式计算平台可以为在多个全球范围内连接的变电站中的连续在线设备,实现自动运行状态监控。

猜你喜欢

分布式计算监测仪器变电站
看广东
关于变电站五防闭锁装置的探讨
对建筑工程中基坑工程监测方法的论述
一种低功耗地下水位监测仪器的设计与实现
超高压变电站运行管理模式探讨
基于云计算的移动学习平台设计与实现
云计算中MapReduce分布式并行处理框架的研究与搭建
220kV户外变电站接地网的实用设计
面向异构分布式计算环境的并行任务调度优化方法
变电站,城市中“无害”的邻居