基于物联网的气象云数据中心动环监控系统的设计与实现
2021-10-29赵冰王旭叶钒刘骥超王双双
◆赵冰 王旭 叶钒 刘骥超 王双双
基于物联网的气象云数据中心动环监控系统的设计与实现
◆赵冰1,2王旭1,2通讯作者叶钒1,2刘骥超1,2王双双1,2
(1.海南省气象信息中心 海南 570203;2.海南省南海气象防灾减灾重点实验室 海南 570203)
随着计算机技术的发展,越来越多的应用系统依靠计算设备的计算能力,气象部门的数据量不断增加,数据中心的建设规模越来越庞大,设备也越来越多,机房管理变得越来越重要。传统机房由管理人员使用手工记录温度、湿度、动力等方式来监控,不能有效地满足信息化发展的需求,也不能及时高质量地排除故障。针对目前机房管理落后的现象,依托海南气象云数据中心机房,本文提出利用物联网技术开发气象云数据中心动环监控系统,实现对机房环境系统、动力系统、安防系统和消防系统等的实时监控,并通过多种手段实现设备故障实时报警。该系统的建立,将大大减轻机房管理人员负担,实现机房无人或者少人值守,提高系统保障质量,降低保障成本,为机房管理人员提供安全、可靠、实时的设备监控管理平台,实现机房的科学管理。
数据中心;机房;物联网;动环;监控
随着信息化建设的高速发展,气象数据量不断增加,历史气象数据总量达到PB级,数据中心的设施建设规模越来越大,设备密度越来越高,管理者对数据中心的监控系统要求也越来越高。
然而,海南气象机房管理只停留在对动力、环境、安保等传统的监控层面,内容单一、页面简单、层次复杂,管理人员无法实时的监控到机房环境状态,也无法及时的发现异常,无法满足管理者对数据中心“集中监控、统一管理”需求[1-6]。建设以各类监控系统为数据来源,能够全面展示机房各方面运行状态的综合运维管理平台变得尤为必要。
本文利用物联网技术设计并构建了海南气象云数据中心动环监控系统。该系统对不同类型的设备实现集中监控,包括对机房环境系统(温湿度监测、机房精密空调、非精密空调、漏水检测、烟雾检测等)、机房动力系统(包括ATS、配电柜和UPS等)、安防系统(门禁、红外、消防等)和视频系统的监控,具有完善的监测和控制功能。该系统融合了机房的管理措施,对发生的各种事件都可以结合机房的具体情况给出处理信息,以提示值班人员进行操作;该系统支持WEB浏览器,支持智能化实时语音电话报警,可实时记录各类事件,清楚处理各事件间的关系,有效提高了维护人员的工作效率,极大减轻了机房维护人员的负担,实现机房可靠的科学管理。
1 相关技术
物联网,即万物相连的网络,就是指通过射频技术、传感设备、红外感应器等各种设备和技术,把包含各种信息的物体,通过互联网的接入,实现对物品和过程的识别和管理,其目的就是实现全球物品信息的互联互通和共享[15-16]。借助于物联网,可以很容易地建立起人与物之间的泛在连接,能够实时的获取和交换设备信息、人员行为信息和角色信息等。随着物联网技术的出现,物联网的概念被广泛应用在机房监控中,对机房动力、环境、和设备等运行进行全方位的实时运行监测。
本文将物联网技术引入机房动环监控管理,通过传感设备来实时获取机房环境、电力、安防等信息,管理人员不需要守着机房,节约人力资源,提高机房管理效率。
2 系统设计
2.1 系统总体设计
海南气象云数据中心动环监控系统设计采用三层结构:设备采集层、传输层、管理层。采集层包括采集模块、控制模块、协议转换器、传感器等。采集模块用于快速采集各传感器[7]及各设备的输出信号;控制模块执行监控中心及现场采集中心发出的控制命令;协议转换器用于将提供智能接口的设备接口转换为监控系统所需的RS485/RS232 接口,从而实现对设备的监控;传感器将现场检测信号转换为模拟量采集模块、数字量采集模块等设备所需的信号。传输层包括网络设备,负责将采集到的信息传输给系统管理主机。管理层包括系统应用服务器和数据库服务器等,完成动环监控管理的所有功能,可通过电话、短信猫、音箱等设备实现监控系统的不同报警提示[8-11]。根据气象云数据中心机房的建筑构造特点,采集层分成三个区域分别是数据中心、UPS电池室和配电室,每个区域通过交换机连接到监控系统中心服务器。系统总体结构拓扑图如图1所示。
图1 系统总体结构拓扑图
2.2 系统功能设计
系统功能包括服务端功能和客户端功能,系统支持WEB页面浏览,系统功能框架如图2所示。
服务端功能包括:服务端配置、添加设备、配置阈值参数、配置报警参数等功能。在服务端通过采集箱及设备通信接口获取设备的各项运行指标信息,并上传到中心端服务器,将收集到的信息与设置的正常阈值对比得出设备是否异常,包括温湿度是否过高、空调是否正常、UPS是否正常等。如有设备异常,则通过短信、微信、语音等方式向管理人员进行报警。
图2 系统功能框架
客户端功能包括:机房环境监测、动力监测、报警管理、数据查询、报表统计等功能。用户可以通过客户端或者WEB页面实时查看机房的各项指标运行状态,包括温湿度、动力、安防状况和视频监控信息等。另外可以根据不同的报警级别设置不同的通知,实现机房监测的管理需求。
根据系统功能设计,整体的监控流程图如图3所示。
图3 系统监控流程图
3 系统实现
3.1 系统开发环境
系统前端采集设备通信和用户访问均使用HTTP协议,可以满足各类型的用户操作系统。系统构建在J2EE的中心服务器上,采用SQL Server 2008 R2 Express数据库进行存储,采用B/S架构处理用户人机界面请求,采用C/S架构处理监测数据采集和告警。采用apache-tomcat 提供稳定的客户端连接和Web访问。
3.2 服务端功能实现
服务端功能包含服务端配置、添加设备、配置阈值参数、配置报警参数等四大模块。服务端页面见图4。
图4 服务端页面
(1)服务端配置
服务端配置重点是配置好数据库信息,设置传感器采集数据上传方式,管理用户登录后会默认推送数据库数据到客户端。只要服务端没有停止运行,客户端就能实时查看到各设备信息和报警信息等。对应采集层的三个机房区域数据中心、UPS电池室和配电室,分别配置对应的机房编码,并能选择相应的显示菜单。
(2)添加设备
添加设备的流程首先是配置通讯。设备通讯方式分为串口服务器、SNMP、COM和OPC四种通讯,一般用得比较多的是串口服务器和COM口通讯。本文的设备通讯方式均采用串口服务器通讯,需要注意的是串口服务器定义生成的通讯事件ID是根据流水号生成的,新项目添加时会自动生成流水号,旧项目可能需要手动添加流水号,流水号不可重复。其次是添加设备,设备模板分为普通设备和门禁设备,可根据设备的类型来选择相应的设备模板进行添加。
(3)配置阈值参数
此项主要是对设备报警条件进行配置,常用配置字段有:报警上限值、上限解除值、报警下限值、下限解除值、报警最大值、最大解除值、报警最小值、最小解除值、波动限值、幅度、保存间隔等。用户可根据实际要求来配置阈值参数,设定设备报警条件。
(4)配置报警参数
配置报警参数包括配置告警的报警次数、间隔时间、解除延迟、确认次数、关联时段、关联报警组、报警联动、解除拨打电话、发短信、发邮件等,按照需求设定哪类报警发生时通知哪些人员组,支持关联多个组。
3.3 客户端功能实现
客户端功能包含机房环境监测、动力监测、报警管理、数据查询、报表统计等五大模块,客户端如图5所示。
图5 客户端首页
(1)机房环境监测
机房环境监测包括温湿度监测、漏水监测、安防监测、视频监测和空调监测。
安装在机房天花板和机柜内部的温湿度传感器[12]将采集到的机房环境、机柜和冷通道的温湿度数值,通过WEB 页面以电子地图的方式直观地展示出来,设备管理人员可第一时间了解机柜是否有温湿度异常。漏水监测采用漏水检测绳对机房内易产生漏水的地方比如精密空调附件进行实时监控,漏水感应线检测到有漏水痕迹时就会触发漏水控制主机产生报警,并给出漏水的距离。安防监测包括门禁系统管理和消防监控两部分。门禁系统管理提供门禁控制,能实现人脸识别、指纹、密码、双门及多门联锁功能,也可以设置不同级别机房管理人员的操作权限。消防监控系统主要利用消防控制箱给出的报警信号,通过开关量数据采集模块,将消防控制器上的干接点变化信号送到监控主机,实时监测机房内的火灾情况,并及时告警,从而实现机房无人值守也能实时监控消防的工作运行状态。动环监控系统完全集成视频监控,实现一体化监控,可直接在WEB页面实时查看视频监控画面,并对视频监控进行管理。空调监测主要监测精密空调的工作状态和各项参数指标状态。主要是通过精密空调的接口来获取相关信息,当温湿度出现超标时,可不依赖后台系统就可以实现联动空调的启停,同时通过对空调的启停状态进行检测,当检测到空调的启停失效则给出相应的报警。
(2)机房动力监测
机房动力监测包括配电柜、UPS和电池组监测。
该机房的电源是在低压变配电房通过市电及油机自动切换后引入总输入输出配电柜,1路为动力及照明等供电,1路为UPS供电。配电柜监测主要采用两个电量仪来采集这两个回路的电量状态[13],可以监测到三相相电压、三相线电压、电流、功率因数、有功功率、无功功率、视在功率等参数并展示出来。
UPS的通讯协议接口可以提供UPS当前的供电状态、告警信息、和当前运行参数。动环监控系统通过协议转换模块连接通信接口来获取监测数据。可以实时监测到UPS的输入输出三相相电压、输入输出三相线电压、输入输出相电流、有功功率、负载率和报警状态等参数。一旦监测到有部件故障或异常时,系统页面会弹出提示并报警。
该UPS采用160只电池串联而成,动环监控系统对每一只电池安装传感器模块来实现电池的电压、电流、温度、内阻等参数的实时监视。当蓄电池相关参数,如蓄电池的单体电压、单体内阻、单体温度以及蓄电池组的总电压、单组电池充放电流等参数超过设置的阈值时,系统会输出报警信息。
(3)报警管理
报警管理包括报警等级管理、阈值设置和报警用户设置三大功能。系统具有报警级别管理功能,可区分多级报警,当系统出现报警时,可根据不同监控对象报警事件而划分不同的报警等级,包括一般报警、主要报警、次要报警、严重报警和紧急报警;阈值设置可以根据用户需求调节监控设备的报警上限值和下限值;报警用户设置可以把不同人员放在不同的用户组,这样不同的报警等级就可以设置发给不同的用户组。
(4)数据查询
数据查询包括历史记录、报警记录和操作记录。历史记录可以查询到所有安装传感器的设备所采集的数据,包括通过通信接口获取的设备的数据;系统对所有操作者进行的系统操作均作详细的操作记录,包括操作人名称、所操作的设备、操作内容、操作时间及操作者登录、退出系统的时间等信息,操作记录可以以流水号形式进行记录以便日后查询,操作过程的记录让该系统具有更高的安全性。
(5)报表统计
报表统计包括报表配置、报表查看和报警统计三部分功能。报表配置可以选择添加某项设备来配置报表,比如可以单独选择温/湿度或者某台空调来做报表;报表查看可以根据报表配置选择的报表类型来生成所选时间的报表;报警统计可以看到等级报警统计表、设备报警统计表和日期统计表等,可根据需要进行查询并导出。
4 关键技术与实现
4.1 数据库设计
良好的数据库设计能给系统带来安全稳定的运行,同时可以面向第三方提供简单明了的数据接口。
系统数据库表包括设备参数表、事件参数表、设备参数历史数据表、门禁进出表。设备参数表中每个设备参数都有唯一的参数ID,每个设备都是由一系列参数组成;事件参数表中每个报警事件参数都有唯一的事件ID,每个设备可定义0个到多个事件ID,通过读取事件参数表可获取事件的当前状态,是正常还是报警;每个设备都有一个表用于存储该设备的历史数据,表名由两部分组成“hisdata”+“设备ID”,假如温湿度的设备ID为K2001,则对应的历史数据库表名为hisdata_K2001;门禁进出表储存门禁的各种动作和进出时间。
4.2 网络通讯协议的转换
机房内的有些设备,比如UPS和精密空调可以通过通讯协议与接口来现实设备各个工作参数的实时监控,根据这些设备厂家提供的通讯协议,采用RS485 或RS232 作为物理接口接入系统服务器,并经过服务端的协议解析来实现信息的采集。UPS 型号不同,通讯协议也不同,例如OVERTOP UPS采用MODBUS 协议[14],用二进制来表示数据。协议帧分为RTU传输模式和ASCII传输模式,RTU格式字节包含:1 起始位,8 数据位,无校验位,2 位停止位,总共 11 位。1 起始位,87数据位,无校验位,2 位停止位,总共 10位。
5 结束语
海南气象云数据中心动力环境监控系统的建设,实现了机房环境、动力设备、消防系统、视频监控等设备的统一监控,并能对出现的异常情况进行实时报警。该系统通过传感器采集数据和智能设备接口协议转换传输数据,实现整个数据中心的全面监控,不但加强机房设备安稳运行,保障机房安全,还减轻机房管理人员负担,降低维护成本,实现了机房无人值守,极大提高了机房管理效率,推动机房管理的智能化、科学化。
[1]李浩. 浅论动力环境集中监控系统的发展和演进[C].通信电源新技术论坛2011通信电源学术研讨会论文集. 2011.
[2]肖奇良.动力环境监控系统的发展及前景分析[J].计算机光盘软件与应,2012(14):95-96.
[3]帅明,杨得耀,敖令攀,等. 机房动力环境监控系统研究综述[J]. 软件导刊,2015(3):4-7.
[4]唐立新,刘新锋,徐新艳. 机房动力环境监控系统应用研究[J]. 信息技术与信息化,2009(3):81-82.
[5]史英军. 机房动力环境监控系统[J]. 电气化铁道,2004(6):40-43.
[6]何霞,张庆.动力设备和环境集中监控系统的应用[J].电信工程技术与标准化,2006,(3):64-67.
[7]Rajesh Luharuka.A Microcontroller-Based Data Loggers forphysiological sensing.IEEE instrumentation and measurement Technologyconference,Anchorage,AK,USA[J],2004,21-23.
[8]李华松,张进铎,马迅飞,等. 集中式机房智能环境监控系统的设计与实现 [J]. 信息技术与信息化,2017(5):43-47.
[9]倪昀炜. 大数据时代动环集中运维管理浅析[J]. 信息技术,2015(11):144-146,151.
[10]任帅. 动环集中运维管理平台应用探析[J]. 通信电源技术,2020,37(3):64-67.
[11]JUN XUE,GAOFENG PAN,XINGYUAN XU. Design of EnvironmentMonitoring System for Equipment Room based on Web. Proceedings ofthe 2014 International Conference on Remote Sensing and WirelessCommunications,2014.
[12]N.M.S. HASSAN,M.M.K. KHAN,M.G. RASUL. Temperature Monitoringand CFD Analysis of Data Centre. Procedia Engineering,2013,Vol.56,pp.551-559.
[13]HAYK SHOUKOURIAN, TORSTEN WILDE, AXEL AUWETER, et al.Monitoring Power Data: a First Step towards a Unified EnergyEfficiency Evaluation Toolset for HPC Data Centers. EnvironmentalModelling and Software,2013:36-38.
[14]胡文翔,蔡政,郭伟玮,等. 面向RS- 485控制网络的Modbus协议扩展及应用[J]. 自动化仪表,2013,34(4):59-61,65.
[15]陈海明,崔莉,谢开斌. 物联网体系结构与实现方法的比较研究[J].计算机学报,2013,3(01):168-188.
[16]Morabito G. The Internet of Things:A survey[J]. Computer Networks,2010,54(2010):2787-2805.
国家科技支撑计划课题(2013BAK05B03);国家自然科学基金(41365004);海南省自然科学基金(2017CXTD014)