变电站远动机在线监测及远程运维技术
2018-09-20邹根华金学成陈明亮姚诸香吉跃瑾卢才云毛建维
邹根华,金学成,陈明亮,姚诸香,吉跃瑾,卢才云,毛建维
(1.国网江西省电力公司,江西 南昌 330077;2.国网江西省电力公司赣州供电分公司,江西 赣州 341000;3.南京南瑞继保工程技术有限公司,江苏 南京 211102)
0 引 言
随着智能电网和“三集五大”体系建设的深入开展,变电站均已实现无人值守,电网调控一体化运行对电网运行实时数据和变电站集中监控数据等自动化基础数据的完整、及时性、准确性和远动通信的可靠性提出了越来越高的要求,这些数据均由变电站远动通信工作站(以下简称“远动机”)上送调度主站。作为联接调度主站与变电站的关键环节,远动机运行的稳定性和可靠性直接决定着自动化基础数据质量。随着调度主站系统硬件冗余技术的推广应用和备用调度体系建设的不断推进,远动机面对的主站数量越来越多,承担的数据传输业务也越来越多,大大增加了远动机的故障率。而目前对于远动机的运行状态没有任何主动监视和管控手段,只能通过其上送的变电站监控数据间接判断。一旦远动通信出现问题,只能依靠运维检修人员奔赴现场分析和处理,不仅耗费人力物力,而且耽误事故处理时间,造成变电站监控数据长时间中断,极可能对电网安全运行及事故处理造成影响,带来一定的经济损失。另一方面,由于对于实时数据及时性的要求,要求尽快恢复数据通信,造成故障现场很难保留,不利于故障原因分析。
目前,国内外对远动通信状态的监视多集中在远动通道状态和通信质量的间接监视,比如对通道误码率、通道中断情况的监视。文献[1]当一台远动机故障、死机或者掉电时,由另一台远动机上送到主站,实现远方对远动机的运行状态监视。文献[2]通过GPRS数据传输自动或手动监视远动机通道通信状态或检测自动化远动装置的运行状态。而对于远动机本身运行状态的监视工作开展较少,远动机故障远程分析和处理的技术手段更是十分缺乏。另一方面,远动机的配置工作目前必须在站内就地更新,缺乏远程维护手段。文献[3]说明了通过服务端和客户端进行远动装置的装置复位、文件传输和参数配置的交互图。文献[4]开发了RTU远程维护系统,实现远方对RTU进行冷启动、热启动、远方数据下装、报文监视和数据获取等。
本文研究实现了对远动机细粒度运行状态的监视,从而发现远动机局部故障情况;研究实现了远动机远程复位控制,及时处理紧急故障;研究实现了远动机参数维护,提高日常运维效率。
1 远动机在线监测及远程运维技术总体架构
子站端远动机实现自身状态收集、控制命令执行和下发参数配置修改等功能。主站实现远动机状态监控、运行状态分析、运行维护和历史统计功能。
主站采用104通道与子站端远动机通信,此通道与EMS系统通道相互独立,互不影响,通过104虚点号方式采集站端远动的运行状态,包括缓存区满、进程僵死、各个调度通道的通信状态等,通过下发复位命令实现远程重启远动机。主站作为客户端主动建立与子站远动的连接,并统一维护所有站端远动连接,实现主备集群、通道负载均衡和自动切换等功能,能够满足用户横向可扩展性和高可用性方面的要求。总体架构如图1所示。
图1 远动机在线监测及远程控制总体架构图
2 远动机状态实时监测和告警技术
早期国内主流的远动机厂家一般采用VxWorks操作系统,对远动机自身状态的监视主要包括主备机的通信状态、对时信号异常和时钟跳变。目前多数厂家的远动机是基于Linux操作系统,也有的用工控机。通过调用远动机操作系统的相关系统函数可以监视远动机运行中系统相关信息,实现对远动机本身资源利用情况(CPU利用率、内存占用率、缓存占用率等)、进程运行情况、通道状态等信息实时采集和监视。同时远动机可以主动获取与站控层设备的通信状态以及与各级调度的通信状态,从而实现远动机对外通信状态的监视。这些监视的数据通过常规规约上送到主站,主站对站端上送的模拟量/状态量进行合理性检查、数据过滤、限值检查、跳变检查、人工设定告警等级和告警条件从而实现对远动机异常和故障(CPU利用率过高、内存利用率过高、缓存区满、进程僵死、与间隔层通信异常、主备机切换、死机等)进行自动告警。图2为运动机自身状态前置监视界面。
图2 运动机自身状态前置监视界面
3 远动机故障诊断技术
变电站报文分析数据作为变电站一个重要的故障分析手段在传统方式下是无法上送到主站侧的。如果需要诊断变电站二次设备的故障,必须人工从变电站里获得报文分析数据。
文献[5-6]介绍了变电站的告警分类、推理模型和推理规则,文献[7]介绍了基于时序因果网路的故障诊断方法,文献[8-9]介绍基于时序模糊Petri网的故障诊断方法,上述文献都从不同的角度介绍了电力系统的故障诊断技术。本论文研究变电站内的报文分析数据通过远动机上送到远动机在线监视及远程控制平台的“过路召唤”技术,利用远动机作为中转,将远动机内部的诊断信息上送到主站。同时利用实时监视的远动通信状态信息、告警信息,以及远程召唤的报文、配置文件、日志文件等,通过基于业务的依赖关系和规则的分析功能推理,实现故障远程快速定位,并在系统平台上进行展示和分析。
业务系统就是用户日常使用的各类维持生产的应用系统,是用户直接接触或操作的层面。电力相关的业务系统包括EMS系统、保信系统、电量系统和气象系统等。业务的依赖关系是一种逻辑的依赖关系或者动态的依赖关系,跟功能模块、应用场景等相关。图3为业务的依赖关系图。
图3 业务依赖关系图
图4 推理规则库示意图
推理规则是指将日常处理故障中积累的经验用形式化语言固化并存储在知识库中,规则按照类别组织,比如按照采集的运行数据类别制订规则,或者按照各种事件的类别制订规则,规则由因子的逻辑运算实现,规则的最底层用类似计算公式的形式实现,复杂的规则可以通过因子的复杂运算得到,部分因子是数据库某些域值或者常量,部分因子属于复杂因子,不能用数据库中的某些域值来表达,复杂因子通过封装成插件的形式供调用。如EMS主站系统检查是否有“人工置数”操作事件,内部逻辑必须到操作记录表中查找是否有“人工置数”的操作记录,同时必须满足一定时间、同一设备的约束条件,这么复杂的规则只能通过封装。图4为远动机故障诊断推理规则库示意图。
4 远动机远程运维技术
传统对远动机的运维方法有两种:一种是使用远动机面板上功能键实现对远动机基本参数设定,如对上IP/端口,重启链路/进程等,这种方法只能实现最基本的维护操作,一些高级功能则无法完成;另一种则是使用调试工作站或变电站后台系统连接到远动机的控制口,使用专用的调试工具/组态软件完成远动机的修改,这种方法虽然可以对远动机进行所有的维护操作,但是使用专用的调试工作站和工具完成,不能够完成远端运维。
本文研究开发的运维系统则接入多个变电站的远动通信装置,并利用分布式技术使得平台具备多冗余、负载均衡和一主多备等特点。同时在不破坏二次安防策略的情况下利用已有的通信方式完成运维数据的上传下载。
4.1 运维采用模块化设计思想
运维平台采用模块化设计思想,实现远动运维数据采集与分析处理的分离,运维数据分析处理与综合应用的分离,综合应用与展现的分离,系统总体逻辑架构分为平台层和应用层两部分,如图5所示。
图5 运维平台系统逻辑架构
4.2 在规约扩展方面
在规约扩展方面,采用基于IEC104远动通信规约。利用远动规约进行文件/远动参数传输。IEC104远动通信规约虽然对链路/进程控制有规定,但是运维平台还需要对远动机本身进行控制。采用IEC104的扩展ASDU方式,扩展运维平台对远动通信装置直接操作。
4.3 在装置运维方面
将装置可识别的命令装入到ASDU中,远动机接受到该报文直接按照报文中的内容进行维护操作,如重启某一Linux进程等。图6为通过运维平台进行的维护流程。
图6 通过运维平台进行的维护流程
4.4 在文件传输方面
在文件传输方面有两种方案:一种是扩展104文件传输方案;一种是采用通用服务协议文件传输方案。扩展104文件传输方案中扩展类型为116的ASDU,实现文件目录读取,文件传输等功能,使得远动机可以识别带有路径的文件名,从而避免标准IEC104传输文件中只能用序号标识文件的不方便性。扩展104文件传输方案、通用服务协议文件传输方案分别如表1、表2所示。
表1 扩展104文件传输方案
表2 通用服务传输协议传输方案
4.5 常规/智能远动机维护流程简化技术
传统的远动机维护都是使用专用的调试软件或组态工具进行修改或设定,不同厂家的远动机的维护流程也不尽相同。但是从最终用户的角度来看,远动机的主要功能则是远动测点的增加、修改和删除,所有远动机的维护目的大部分也局限于此。因此,简化当前的维护操作对电网中所有远动机进行远程维护是必要的。
本文提出远动机通用的维护流程:
(1)链路/进程重启;
(2)远动测点增加、修改或删除操作;
(3)远动机运行参数修改;
(4)其他维护操作。
比如重启远动机,主站仅需发送重启命令。至于是直接的还是间接,通过什么方式到达远动机,远动机怎么执行,用户不关心,主站可以通过发送执行命令或者通过规约进行远动机的重启。增加、删除或修改测点可以通过远程进行维护,然后远程下装,再远程重启远动机。图7为重启远动机规约报文。
图7 重启报文监视界面
5 统计与展示
如图8所示,远动机在线监测与远程运维平台实现数据的历史存储、统计分析与报表展示。综合展示KPI指标,某个KPI出现异常时,第一时间告知运行人员,同时可自动触发相关分析模块,辅助调度、运行人员通过统一的调度操控台及时进行异常处理,使异常指标尽快恢复正常。远动KPI监视公式如下。
(1)
式中:K为厂站远动KPI指标;∑t为值班通道通讯时间之和;T为厂站投运总时间;∑s为厂站通信日平均中断次数。
图8 远动KPI监视曲线图
6 结束语
本文阐述了远动机在线监视及远程运维的总体思路,详细阐述了远动机自身状态实时监视和告警技术,在此基础上利用远动通信状态信息、告警信息,以及远程召唤的报文、配置文件、日志文件等,实现故障远程快速定位,缩短故障处理时间,保证电网安全运行。同时,提出的模块化运维技术能够有效节省运维检修部门的人力物力成本,大大提高工作效率。