应对疫情防控构建调度自动化智能运维管控体系的实践与探索
2021-09-26邓春荣
邓春荣
摘要:基于疫情防控需要,深入分析了调度自动化运维管理遇到的人工巡视效率低、缺乏自动化设备状态感知手段及状态检修机制、机房设备各系统彼此孤立等深层次问题。针对存在的问题和构建自动化智能运维管控体系的必要性,介绍了由国网龙岩供电公司研发的二次设备在线智能管控运维平台的功能,并从提高故障处置效率、提升系统运行稳定性、优化疫情期间值班管控措施等方面,总结了二次管控平台的应用成效。
关键词:疫情防控;调度自动化;智能运维;二次设备在线智能管控运维平台
0 引言
自国内发生新型冠状病毒肺炎疫情以来,国网公司全员进入“防疫情、保供电”的“战时状态”。电力调度是保证电网安全稳定运行、对外可靠供电、各类电力生产工作有序进行的核心专业之一[1-3],调度自动化作为电力调度的后台支撑技术,对电网的安全运行起着不可或缺的作用[4-6]。
1 调度自动化运维的现状
传统的调度自动化运维方式存在以下几个方面的问题:
(1)系统及设备巡视要耗费大量的时间及人力,在人力资源日趋紧张的形势下,一旦受疫情影响,人员被隔离,将导致系统运维面临被动接管的局面。
(2)缺乏现场设备状态感知手段,传统的监视功能都是针对特定对象,监视范围较小、内容简单,系统相互独立、展示方式单一,无法对二次设备进行全面的在线监视。
(3)机房设备各系统彼此孤立,无法全面掌握整个系统的实时运行状态,缺乏对设备状态的跟踪评价技术,无法对二次设备的运行健康状态及时做出预警、预判及在线评价。
2 调度自动化智能运维管控的必要性
构建调度自动化智能运维管控体系,不仅可以缓解调度自动化系统的运行压力,还能提高运维水平,促进电力系统安全、稳定运行,同时还能节约人力成本,优化资源配置。
2.1 提升运维管理成效
传统的运维管理模式下,当设备或系统存在告警时,由于人员技能水平参差不齐,存在对重要的系统缺陷疏于监控的可能[7-8],运维质量难以保障。
2.2 节约人力、优化资源配置
智能运维管控可以基于调度自动化实现少人或无人值班,在疫情防控时可以保障人和系统的双重安全。同时在日常工作中,可以降低运维成本,使系统运维管理工作可见、可管、可控,进而将运维人员从烦琐的、例行重复的工作中解脱出来,做更有价值的主动性运维工作,为企业创造更多价值。
3 二次设备在线智能管控运维平台的实践应用
本文所述“二次设备在线智能管控运维平台”(以下简称“二次管控平台”)依托省地调控云平台,运用分布式、虚拟化、广域消息总线等技术,按照远方分布采集,集中监视的原则,接入包括省、地调的主站软硬件信息、网络设备信息、动力环境信息以及变电站端的二次设备运行信息,实现了省地一体二次设备的统一管理和自动化系统的可视化监视与智能运维。
3.1 二次管控平台的功能
3.1.1 设备状态全景监视
涵盖主站系统硬件、网络设备、数据库及业务系统软件关键进程、关键业务数据、机房温/湿度、门禁、水浸、精密空调、UPS电源等,具备全面感知二次系统及设备运行状态,分布采集,高效处理,智能诊断分析等功能。
3.1.2 设备故障快速定位
通过二次设备业务路径图与告警信息的关联性融合,基于二次设备的业务逻辑,分析发生故障时二次设备的运行状态,快速定位故障点及影响范围,生成故障隔离策略,实现调控系统故障的快速定位。
3.1.3 设备状态运行趋势分析
实时获取合并单元、智能终端、保护装置、安全自动装置、交换机及二次回路的状态及异常信息,及时分析二次设备的隐性缺陷和家族性缺陷,形成准确、完善的二次设备状态评价分析数据,并对数据进行分析挖掘,建立涵盖二次设备装备水平、动作行为、健康水平等关键指标的运行统计分析。
3.2 防疫期间二次管控平台的应用成效
3.2.1 提高故障处置效率
传统的故障处置,一般是在运维人员到达现场后,通过现场查找分析来诊断故障,这种缺陷处理方式效率较低。而依托二次管控平台,可以采集反映自身健康状况的装置信息,实现板卡级、模块级的装置硬件故障诊断;解析远动装置、站控层、过程层的遥控报文,实现遥控全过程跟踪和故障定位;比对一次设备同源采集和双AD数据,实现二次设备采样判断和保护隐性故障预警;采集二次装置、交换机等设备的光纤接口监测信息,准确定位现场设备硬件异常和二次回路故障;通过远程诊断来实现快速明确故障点、故障类型及影响范围,进而指导运维人员携带相应备品备件,提高现场检修维护效率。
查找历史缺陷处理记录,对比10起类似故障缺陷采用传统故障处理方式和应用二次管控平台后的平均处理时长,结果为二次管控平台使用前每起故障缺陷平均处理时长为150 min(单纯故障处理的时间,已减去路途、开票许可的时间),应用二次管控平台后,每起故障缺陷平均处理时长为80 min。由此可见,应用二次管控平台可以明显缩短故障处理时长,提高故障处理效率。
3.2.2 有效应对疫情与提升系统稳定性
利用二次管控平台全景监视、全局防控、集中决策的技术优势,通过自动化设备状态在线趋势分析,能够提前预警二次设备异常状态,实现自动化运行的“先知先觉”。另外,通过灵活设定告警阈值,结合自动化设备状态趋势分析,可以推动自动化运维从被动处置向主动指挥提升。二次管控平台投运后,国网龙巖供电公司充分发挥二次管控平台的优势,安排节前进行系统完整性巡检,以及时发现存在隐患的设备或者部件,并及时更换,防患于未然。