集中监控管理平台在云计算中心的应用
2021-08-27崔丽丽唐学斌魏焕君
崔丽丽,唐学斌,魏焕君
(1.河钢集团唐钢技术中心,河北唐山 063016;2.河钢集团唐钢信息科技分公司,河北唐山 063016)
0 引言
河钢集团唐钢云计算中心是对公司冷源、空调、通风、自然冷却、连续制冷、柴发、供回油路、集中加湿、变压器、动力配电、IT 配电、UPS、蓄电池、防雷、电梯、新排风、水管等所有机房供辅设备和温度、湿度、氢气浓度等现场环境进行监控、检测、信息共享、相互协调和联动的集中监控管理平台,其作用是完成能效分析和信息发布,并实现与安防系统、消防系统的集成与联动。
1 集中监控管理平台系统组成及实现目标
1.1 集中监控管理平台系统组成
集中监控管理平台由动环监控、自控、蓄电池监控、安防和信息发布系统组成。
1.2 集中监控管理平台实现目标
集中监控管理对弱电系统中的安防系统、空调系统、新风系统、自然冷却系统、连续制冷系统、应急柴发系统、供回油系统、温度监测、湿度监测、漏水检测、集中加湿系统、高压供电监控系统、IT 配电系统、动力配电系统、UPS 系统、蓄电池系统、防雷系统、氢气浓度、微正压、能效分析等系统以及相互关联的系统与设备进行统一监测、管理和控制,从而实现高度统一的信息共享、相互协调和联动功能,并建立起整个云计算中心集成监控管理平台的监控和管理界面,从该界面上可获取全面的系统信息,实现信息资源的优化管理和共享[1]。
2 系统架构
集中监控管理平台采用模块化“分布式”结构设计,满足全天24 h 不间断运行[2]。实现集中监控、统一数据处理、统一告警及本地化数据存储;数据中心机房环境监控系统基于TCP/IP,完全实现各机房集中或分散监控[3]。可同时支持B/S、C/S 两种方式访问,管理人员可通过内网、外网进行监控或管理。平台系统架构如图1 所示。
图1 集中管控平台系统架构
系统可分为4 个层级,分别是:现场采集层、现场监控层、统一管理层和远程管理层。
2.1 现场采集层
由各种I/O 采控模块、传感器组成,通过RS485 方式采集数据中心IDC(Internet Data Center,互联网数据中心)机房的供电、制冷、消防等系统和IDC 机房环境参数中的温湿度等实时数据,并传到所在区域计算机机房内的本地嵌入式服务器中。
2.2 现场监控层
由服务器和串口服务器组成,分别负责收集与处理现场设备采集的数据。
2.3 统一管理层
由集中管理平台和相关硬件服务器及报警系统组成。集中管理平台是集中管控系统的大脑,是它的管理和调度中心,并将采集到的实时数据进行收集并根据相关规则进行处理,储存在中心管理服务器中(使用双机热备方式进行冗余,并同时支持P/C、B/S),同时采取全备份模式储存在数据库中,为系统的稳定运行提供可靠的数据支撑。
2.4 远程管理层
集中管控系统便于管理人员的使用,同时支持B/S 和C/S架构对数据的访问。整个系统基于模块化实施,对数据中心的本地系统没有影响,同时管理及运维人员可以在系统管理员赋予相关权限的情况下,对IDC 机房的部分设备进行远程管理。
3 集中管控平台主要功能及技术
3.1 动环监控系统
IDC 机房集中管控平台使用先进的网络数据技术对相关的实时数据和监控设备进行集中管控。IDC 机房集中管控平台由数据采集层、监控中心和系统管理服务器组成,其主要功能如下:
3.1.1 现场设备采集层
通过网线及信号线直接连接各种被监控设备,采集现场设备的实时数据,并通过RS485 方式上传到监控服务器。电源及监测设备的监控情况见表1,配电设备监控情况见表2。
表1 电源及监测设备的监控情况
表2 配电设备监控情况
3.1.2 监控服务器
将采集的IDC 数据中心的实时数据进行存储、处理,并根据用户需要发送远程控制设备的指令,实现对IDC 机房设备的远程控制。嵌入式服务器具有两个网口,在网络上实现双路上联,当任何一个服务器网口或上联线路故障时,环境监视系统监控的数据采集、处理能持续进行。
3.1.3 系统管理服务器
用于管理及运维人员对IDC 机房各种设备工作状态的了解及管控,通过系统管理服务器的监控界面可以直接对IDC 机房的相应设备进行远程控制,并且整个系统的服务器硬件采用双机热备冗余方式,以保证系统的稳定运行。
3.2 自控系统
自控系统包含制冷及风系统、排风控制系统,由上位管理主机、系统软件、现场直接数字控制器、传感器、执行器等部件构成,具备显示、控制及自动记录受控机电设备运行状态、故障报警、起停控制、控制参数修改等功能,实现空调、新风、排风远程联网与集中监控功能。
3.2.1 监视功能
系统采用全中文图形操作应用软件,此应用软件含有工艺流程图、监控点表及数据中心平面布置图,以动态图形的模式显示设备的运行状态,便于管理及运维人员对数据中心的所有状态进行实施监控。
3.2.2 控制功能
能在中央控制器通过对图形的操作或预先编制的控制程序实现对现场设备的控制,通过选择操作可进行运行方式的设定,可通过菜单查看和修改参数。
3.2.3 报警功能
当监控的设备出现故障、监控的参数超出用户设定参数时产生报警信息,报警信息以对话框的形式在系统界面中弹出,涉及到的严重故障信息同时转化为声光报警,所有报警的相关信息都保存在数据库中,并可以调出历史数据分析图,供运维人员查询分析。
3.3 蓄电池监控系统
(1)对IDC 机房UPS 设备电池充放电状态、电池电压电流、电池内阻及温度进行实时监控。
(2)显示电池组充放电状态,产生事件报警并记录异常情况;同时监控模块配置外部通信接口实现远程通信。
(3)远程监测蓄电池组各单体的参数,可查询历史参数,并对蓄电池组的各种故障进行报警。
3.4 安防系统
平台通过TCP/IT 标准协议集成了第三方安防系统。安防系统包括视频系统和门禁系统,其中视频系统通过调用视频并支持回放功能并以地图形式标注摄像头地点,使技术人员快速定位目标处。门禁系统同样采用地图形式标注防火门地点,通过调用第三方门禁实现远程开关功能。
4 结语
集中管控平台在河钢唐钢云计算中心投用后运行良好,并且多次发现设备问题。漏水报警4 次,蓄电池电压、内阻异常有效报警3 次,机房温湿度异常多次,空调报警5 次等。通过集中管控平台的报警,及时了解到设备的异常情况,及时对故障点进行处理,防止事故的发生,尤其是蓄电池电压、内阻异常的有效报警,避免了火灾事故的发生。下一步,准备利用该平台运行数据对设备进行分析,提高设备利用率、降低中心PUE(评价数据中心能源效率的指标)值,以达到降本增效的目的。