基于订阅的遥测数据采集方式在动环监控系统中的应用
2023-01-31傅杰
傅 杰
(中国移动通信集团福建有限公司网管中心,福建 福州 350108)
0 引 言
近年来,通信行业动力电源设备运行维护目标已经逐步从单纯的“设备运维”转型为“效益运营”。如何实现动环设备精细化管理、提升维护效率、优化运营效能以及支撑业务发展,已经成为新基建背景下动环运维的新方向[1]。通过对电源设备实时运行状态进行趋势分析,使其运行于最优状态,已经成为动环运维提质增效的必然途径。
随着动环监控系统集中化程度不断提高,动环监控遥测性能数据量大幅增加,其采样周期较长、无法兼顾效率与完整性、底层动环监控单元(Field Supervision Unit,FSU)性能不足等问题日益凸显,导致大量动环监控数据无法及时、完整地上传至网管平台,限制了动环运营的进一步发展[2]。为了解决这一问题,本文将介绍一种采用数据订阅功能建立的动环监控接口模式。采用此模式,动环监控系统既满足对全量设备的运行趋势分析,也能满足实时监控管理的需要。
1 传统动环监控遥测接口
1.1 传统移动通信动环遥测数据接口
传统的移动通信动环监控系统采用C接口作为集中监控中心(Central Supervision Center,CSC)与第三方网管系统之间的标准化接口。C接口具备两种遥测数据传输模式,分别是全量定时采集与“一问一答”单点采集模式。采用定时采集模式时,监控系统对全网全量数据进行轮询,上传周期标准为4 h,无法满足实际运维设备响应速度的需要[3]。采用单点采集模式时,可以对用户选定的单台设备进行快速数据采集,自设备侧上送至移动集团统一平台呈现,时延不应超过30 s。但此模式仅针对单台选定设备生效,无法同时管理全网设备的数据。
传统的C接口遥测数据流程如图1所示。
图1 传统的C接口遥测数据流程
1.2 改良的动环遥测接口
为了提升可用性,自2017年起,笔者对全量轮询采集模型进行分级分类管理。对于直流电压、电流、温度等直接影响业务的遥测数据,均要求以5~15 min的采样周期上传;对于次要的或变化较稳定的数据,例如电源模块数量等,则以日粒度上传。通过此方式改良了传统的遥测接口,上传数据量减少83%,采样周期由4 h缩短为5~15 min,为实现性能监控奠定坚实基础。改良的动环遥测采样周期如表1所示。
表1 改良的动环遥测采样周期
2 基于订阅功能的接口实现方式
随着“双碳战略”的提出,提质增效成为动环运营转型的新目标,改良接口的15 min采样周期无法为空调人工智能(Artificial Intelligence,AI)节能、蓄电池组自动放电等精细化工作提供安全可靠的运行环境。传统的遥测数据单点采集模式更适用于已发生故障告警或已预约的场景,对设备运行状态劣化、遥测信号丢失等无故障信号场景缺乏管控能力[4]。为了解决此问题,笔者开始采用数据订阅功能,实现监控数据的高速、全量上传。
数据订阅功能是由第三方网管系统与动环监控CSC提前约定数据的内容、范围、格式,而不关注数据的传输方式。只要数据发生变化,即可上传至第三方网管,以此实现对数据内容的快速响应。选择可支撑高吞吐量的Kafka接口,取代原有C接口,以此优化海量数据传输能力,并支持分布式部署,确保系统高效、可靠、易扩展。
新增FSU变动上报规则,FSU判断监控数据发生变动即触发信号存储动作,并向CSC上报监控点信息。采用此方式,可以压缩上报数据规模,减少数据处理量。为了确保重要性能数据的完整性,在CSC上同步开发了FSU状态稽核与重启功能。通过确认心跳包、CPU占用率、内存占用率以及硬盘占用率等参数,确保FSU工作处于正常状态。利用改良数据接口对订阅数据进行稽核,避免特殊场景下(如大面积停电、灾害性天气等)单次大量数据推送可能导致的数据丢失问题[5]。
基于订阅模式的实时数据流程如图2所示。
图2 基于订阅模式的实时数据流程
遥测数据通过Kafka接口直接推送至第三方网管,去除了传统数据流程中缓存服务器Redis、C接口对接这两个环节,极大地提升了推送效率,实测全网全量数据上报周期不超过20 s。此外,采用订阅模式可以根据协议自由选择订阅范围,加上CSC改造后的自动数据稽核功能,不但满足了运营转型的精细化管控需求,而且确保了对全网设备安全运行的实时监控要求。
3 应用案例简介
根据《通信电源、空调维护管理规定》要求,每年需要消耗大量的时间和人力完成在网蓄电池组的放电测试和数据稽核与分析工作。基于本文提出的遥测数据接口,可以建立蓄电池自动放电测试与稽核工具。
首先,通过预设的放电计划,选择目标站点电源与电池。在测试监控系统运行正常后,远程遥调浮充电压至48 V,依靠负载自动放电。其次,放电过程中,依靠遥测数据的快速上传实时计算电池放出电量,并严密监控蓄电池组放电测试过程,避免突发停电或电池突然衰减,影响站点安全运行。同时,依靠遥测数据抓取标准放电作业时的蓄电池组电压变化情况进行自动分析,快速给出测试结论。最后,放电结束后,调整开关电源输出至均充电压,并验证蓄电池组已处于正常充电状态。严密监视电池充电过程电压与环境温度变化,直至电池充满后,调整开关电源输出至浮充电压,至此蓄电池组测试完毕。汇聚机房远程放电作业报告如图3所示。
图3 汇聚机房远程放电作业报告
此系统上线6个月以来,应用效果良好,累计完成5 170组蓄电池远程放电作业,发现644组蓄电池容量问题,为确保蓄电池应急供电可靠性发挥了重要作用,大幅提升了全网动力运维效率和设备用电安全。
4 结 论
基于订阅的动环监控遥测量采集模式为通信行业动环监控接口提供了一个新的实现方案,弥补了传统C接口协议无法兼顾全量数据与实时性的缺点,使动力运维人员可以实时获取机房动力设备运行状况,及时调整设备运行状态,并对高负荷动力设备进行扩容调整,提升动力运维工作效率。随着遥测数据的不断深化使用与研究,可以应用订阅模式逐步满足数据中心冷冻水AI调优、机房空调节能、削峰填谷智能储电等精细化管理需求,未来订阅模式将进一步推动动环专业完成运营管理转型,支撑业务发展。