数据中心机房环境综合监控系统方案设计
2011-08-08孟庆祝北京国安电气总公司北京100080
孟庆祝 (北京国安电气总公司,北京 100080)
数据中心机房环境综合监控系统的建立是确保数据中心设备在良好的机房环境(供配电系统、UPS系统、精密空调系统、消防系统、安保系统等)下稳定运行的基础条件,实现机房环境设备的严密监测和统一监控,提高整个信息网络系统稳定运行的可靠性,实现数据中心机房的科学管理。
以北京某电力公司数据中心机房为例,机房环境综合监控系统主要是对机房设备(如供配电系统、UPS电源、精密空调、消防系统、视频监控、门禁系统等)的运行状态、温度、湿度、洁净度、供电的电压、电流、频率、配电系统的开关状态、漏水检测等进行实时监控并记录历史数据。可以随时随地的监控机房的任何一台设备,获取所需的实时和历史信息,进行高效的全局事件管理。使数据中心真正成为满足各种微机电子设备和工作人员对温度、湿度、洁净度、电磁场强度、噪声干扰、安全、防漏、电源质量、振动、防雷和接地等要求的IDC数据机房。
1 系统简介
北京某电力公司数据中心机房位于该公司办公楼内,建筑面积约为574m2。该数据中心机房环境综合监控系统主要监控的对象包括:精密空调、UPS、电量检测、温湿度监测、漏水检测、门禁、闭路监控、消防监测等,实现7×24×365的全面集中监控和管理。
系统是一个以信息流监控为核心的综合应用平台,采用组态方式、中间构件和模块化结构,实现对各类信息流(包括各种实时采集数据、视频流、语音流等)的实时监控和管理;同时,在信息流监控系统内通过定义策略,完成对各种数据间相关性的定制,实现各子系统内或子系统间的联动功能,将功能各异的设备及子系统有机地组合成一个既相互关连又统一协调的整体,实现各设备及子系统的优化运行;通过Internet/Intranet技术集成监控信息流,提供对设备及子系统的管理职能,监视其实时信息,控制其工作状态、报告各种异常状况,确保所有设备及子系统的安全、可靠、高效运行。
2 系统结构
系统采用树状结构,按照各监控单元的监控职能和相似特点,本子系统分为如下功能模组:
1) UPS设备组(UPS);
2) 空调及通风设备组(精密空调);
3) 供配电设备组(包括电量仪、配电开关状态);
4) 环境监控设备组(包括温湿度、漏水监测);
5) 安防设备组(消防、门禁、视频)。
图1 系统结构图
整个系统架构图如图1所示。
3 系统方案设计
图2 配电柜监控
3.1 配电柜监控
进线柜在运行中有很多重要的参数,例如电压、电流、功率(有功、无功、视在)、功率因数、频率电度(有功、无功)。通常的做法是采用在配电柜上安装仪表,由人工监视,柜内的自动空气断路器、过流保护的工作状态以及总开关的状态也是由人工在现场监视。现在,进线柜的供电参数通过智能电量仪表把市电的运行状态以数据的形式传输给监控系统,对其进行监视,使现场达到无人值守的目的。
根据实际情况,具体配置及功能如下:
配置8台智能电量检测仪,实时监视机房1路市电的三相电压、电流、频率、功率因数、有功功率、无功功率。系统管理员和操作员可以通过历史曲线图看到每天的电压、频率、有功、无功的最大值、最小值、当前值及电压、电流峰值,从而能清楚地知道三相电压、电流是否均衡。
系统一旦报警,会自动切换到相应的开关画面,颜色随即由绿色变成了红色,系统自动播放多媒体语音报警。同时,若设置了电话自动拨号功能,系统将会自动拨打所设置的电话号码,并可通过发送手机短信通知有关人员进行处理。
3.2 UPS电源监控
对UPS的监控,实际上是对UPS的内部整流器、逆变器、电池、旁路、负载等各部件的运行状态进行实时监控,一旦有部件发生故障,系统会以各种方式报警。此外,还实时监视UPS的各种电压、电流、频率、功率等参数,并有直观的图形界面显示。
采用的UPS带有智能通讯接口(RS485或RS232),通过手牵手的总线方式将多台UPS的监控数据直接接入现场监控服务器统一进行监测。
系统可全面诊断UPS状况,监视UPS的各种参数。一旦UPS报警,将自动切换到相关画面。越限的参数将变色,并伴随有报警声音,有相应的专家处理提示。并可根据用户需求设置电话、语音、手机短信等方式通知有关人员。对于重要的参数,可作曲线记录,查询一年内某些测点的曲线(如电压、电流),并可显示选定某天的最大值、最小值,使管理人员对UPS的状况有全面的了解。
具体而言,可监控整流器、逆变器、电池、旁路、负载等五部分的运行状态与参数。根据机房实际情况,本系统需实现如下几方面功能:适时监控输入、输出电压、输出电流、输出频率、整流器状态、逆变器状态、电池状态、旁路状态、负载状态等部分的工作状态及参数。
3.3 精密空调监控
精密空调自带有智能通讯接口(RS485或RS232),可以全面监控空调的运行参数。同时,可通过监控系统直接设定空调机的各种参数,如温度的设定。
系统一旦有报警,将自动切换到相关画面。越限的参数将变色,并伴随有报警声音和相应的专家处理提示。对重要参数,可作曲线记录,用户可通过曲线记录直观地看到空调机组的运行品质。这样,空调机组即使有微小的故障,也可以通过系统检测出来,及时采取相应的措施,防止空调机组进一步损坏。
对严重故障的报警,可根据用户需求加设电话语音报警。
本机房监控系统可实时监控世界各厂家的精密智能空调,实时监视空调各部件(压缩机状态、风机状态、加热器状态、抽湿器状态、加湿器状态、滤网等)的运行状态与参数,并可远程修改设置与开关空调。
据机房实际情况,系统在这一部分需达到如下监控功能:压缩机状态、风机状态、加湿器状态、去湿器状态、加热器状态、空调的温度、湿度值、远程控制空调的开机和停机、远程设置空调的温度与湿度。
图3 精密空调监控
3.4 温湿度检测系统
图4 温湿度监控
在机房中,有大量的服务器等精密设备,设备对温、湿度等运行环境的要求非常严格,所以应加装温湿度传感器,以实时检测机房和重要设备区域内的温、湿度。在本项目中,在机房设计安装了32个温湿度一体化传感器,将检测到的温湿度值实时传送到当地的机房监控及安全监管平台服务器中,并在界面上以图形化形式直观地表现出来。一旦温、湿度值越限,系统将自动弹出报警框并触发语音报警,提示管理员通过调节空调温、湿度值为机房设备提供最佳运行环境。并且还可以将一段时间内机房里的温、湿度值通过历史曲线直观地表现出来,以方便管理人员进行查看。
温、湿度传感器还可与空调系统实现联动,当机房的温度越限时,系统可联动设定空调目标温度及启动空调进行工作等联动动作。
对于线缆的温度,采用线缆温湿度传感器对机房内24条电缆进行实时的温度监测,当温度超过设置的阀值时,系统将以短信或电话的方式通知机房管理人员,及时查看并进行处理。
3.5 漏水检测监控
由于机房内使用的空调设备较多,且漏水水源一般在机房地板下,为了方便用户今后的维护,采用漏水检测系统。其工作原理为:采用耐腐蚀、强度高的感应线缆与控制器及其他附件,将有水源的地方围起来,一旦有泄漏液体碰到感应绳,感应绳通过控制器将信号输到监控系统,并通过相应的报警方式及时通知有关人员采取相应措施排除故障。
系统本身包括:漏水控制器、漏水感应绳及其他辅助设备,系统可检测感应线上任何点的漏水位置并有语音报警。感应线缆为特种橡胶制成,抗腐蚀、抗酸碱。系统功能完善,对感应线有断线报警功能。系统还可检测机房洁净度,当感应上的尘埃集结到一定厚度,系统会报警提示管理人员派人清洗感应线。
图5 漏水检测监控
3.6 消防监测
在机房内加装烟感探头,直接接入机房监控系统,实现对机房烟雾火灾的早期预防,及时处理。同时系统支持与CCTV、门禁系统的联动,可以实现在消防报警时相关位置的门自动开启、自动弹出实时视频画面等。
图6 消防监测
3.7 新排风机监控
由于新排风机属于非智能设备,一般都是通过开关电源来进行开关机的控制,实现监控功能时必须通过一些报警采集模块和开关控制模块。在本系统中,设计使用开关量采集和开关量转换模块对新风机和排风机的运行状态进行监控;使用开关量控制模块和开关装置,实现对新风机电源的开路与闭路操作,达到控制新风机启停的效果。
3.8 闭路电视监控管理
图7 闭路电视监控管理
本系统采用的硬盘录像机支持MPEG-4或H.264压缩格式。所有视频文件采用MPEG-4或H.264格式压缩后通过流媒体格式进行传输,保证监控、录像、回放、传输能同步进行。一般来说,单路视频传输在25帧/s时,其占用带宽应小于300K。系统允许用户根据网络状况随时更改视频数据的传输参数,如帧数、分辨率等。
2) 视频存储
录像方式:每台摄像机的硬盘录像方式可灵活设置,包括无间断实时录像、预设时间段录像、报警预录像、移动侦测录像以及联动触发等多种方式。每路25帧/s,分辨率为352×288,连续录像24h占用存储空间为2G。录像方式可以根据要求进行调整,例如白天实时录像,晚上动态监测或报警联动录像。另外,当硬盘存满时系统可自动从头覆盖,循环录像。
3) 图像控制
可灵活调节视频图像的亮度、对比度、饱和度、色调等,设置画面质量和压缩比;支持任意时刻图像的抓拍和存储。
4) 视频查询
(1) 录像资料的检索:系统提供录像资料检索通道,在监控管理平台上可进行录像资料的检索回放,且可根据录像的类型(定时录像、触发录像、抓拍等)、通道和录像时间等多种条件进行组合检索。
(2) 录像资料的回放控制:可利用拖拽功能选择任意时间点的回放,同时回放速度可调(至少具备四种速度 :-2、2、4、8 速),回放时不影响系统正常录像。
(3) 快速查询:系统应支持快速查询功能,管理界面上设置快速查询通道,当管理人员输入摄像机名称等唯一性信息时,系统可自动切换到该摄像机实时监控画面,并提供该摄像机录像资料查询功能。
5) 断电保护
系统具有断电保护功能,当发生意外断电时,系统自动保存断电时刻以前的录像数据。
3.9 门禁综合管理
图8 门禁综合管理
系统设计的门禁系统是一个可以脱机独立运行的系统,机房监控管理平台出现任何问题都不会影响门禁系统的使用。门禁控制器自身还带有后备电池,可以确保在停电后不会丢失任何刷卡信息和权限管理信息。在系统管理界面上可遥控所有门禁电锁的开关,当非法进入发生时,可通过授权(4级以上用户)对部分门禁进行封锁;另外,系统提供图形化动态逻辑组态功能,以图形化界面方式实现逻辑定义,从而更方便的实现联动功能。
4 结束语
数据中心机房环境综合监控系统,软/硬件均采用模块化结构设计,适应发展需要,充分保证了系统在扩容、升级时系统可无间断安全运行;提供了安全舒适的工作环境同时提高了机房管理工作的效率;节省了机房运行管理费用,达到了短期投资长期受益的目的,在很大程度上起到了节能降耗的作用,推动了“绿色”、“节能”数据中心的发展。
[1] 路宗雷,李 涛. 数据中心机房综合监控系统解决方案[J].智能建筑与城市信息,2010(8):8-11.