APP下载

计算机机房运行物理环境自动监控系统设计与实现

2012-06-01呼伦贝尔市人才流动人事考试中心李全忠

电子世界 2012年3期
关键词:计算机机房机房报警

呼伦贝尔市人才流动人事考试中心 李全忠

计算机机房运行物理环境自动监控系统设计与实现

呼伦贝尔市人才流动人事考试中心 李全忠

计算机机房是保证信息系统可靠运行非常重要的一个环节,它的必须保证能为放置于其中的各种设备提供一个安全可靠的物理环境,动力供应。这些物理环境的保证都是通过计算机机房的各种辅助设备的安全可靠运行实现的。本文较详细说明了实现计算机机房安全运行物理环境自动监控系统的设计与实现的原理,并且在了呼伦贝尔市劳动保障数据机房得到了成功的应用。

计算机机房;物理环境;安全运行;自动监控

1.前言

计算机机房是为用于电子信息处理、存储、交换完成信息处理过程的各类电子信息设备提供运行环境的场所。对电力、温湿度、新风等特理环境参数有着极其严格的要求,必须依据《国家电子信息系统机房设计规范》要求的相应计算机机房等级提供符合标准的运行环境物理参数。一旦机房环境的辅助设备出现故障,将会使电力、温湿度、新风等参数偏离正常值,直接影响计算机系统的正常运行,对数据传输、存储的可靠性构成威胁。如事故严重又不能及时处理,就可能损坏硬件设备,造成严重后果。需要实时交换的数据机房,管理更为重要,一旦系统故障,造成的经济损失是不可估量的。目前国内普遍缺乏机房环境设备的专业管理人员,在许多地方的机房不得不安排软件人员或者不太熟悉机房设备员值班维护,这对机房的安全运行无疑又是一个不利因素。

因此,随着工控技术的发展和管理水平的提高,实现机房动力环境集中监控管理是一个必然的趋势。计算机机房物理环境的集中监控系统,就是为解决机房设备的统一监控,实现机房的无人职守,减轻计算机机房维护人员负担,提高了计算机机房动力环境及物理环境的可靠性,保证事故的及时发现、准确定位,同时对系统设备的历史日志进行记录和管理,为设备的日后维护提供重要的参考,因而机房物理环境自动监控系统对机房的科学管理有特殊的意义。

本文阐述的机房物理环境自动监控系统可对配电系统、UPS、柴油发电机、蓄电池组、开关电源、空调、漏水、消防、保安等设备做统一的集中监控,另外在技术条件许可的前提下,可以根据用户的要求定制监控任务,对机房的上下限温度、湿度、供电参数进行实时采集。

2.设计思想

整个机房安全运行自动监控系统遵循系统工程原理进行设计,综合运用分布处理架构、Client/Server组织形式、数据管理技术、多媒体的表现方法、工控领域的模块化组态设计技术、人工智能计算机辅助决策技术,采用先进的软、硬件设备,进行系统集成,保证系统在可靠性、实时性、开放性、易用性等方面满足设备及环境监控的需要,总体设计依据以下基本的原则:可靠、稳定、实用、功能完整、操作简便、安全性、系统开放性、具有扩展性、网络化功能。

原则1:可靠性

系统硬件以专业的工业监控产品为主,包括主机、采集模块都要有严格的质量保证,确保性能的可靠性,MFB>20万小时。

原则2:实用性

在系统功能上力求实用,在保证功能完整的基础上来丰富画面的灵活性和人性化。

原则3:功能完整

在系统功能上,尽量要利用现有成熟技术,确保系统的功能完整,如在原有声光报警的方式上,增加利用电话语音技术而开发的电话语音报警系统,利用多媒体语音系统开发的现场语音报警系统系统;历史记录查询功能,所有历史曲线、报警记录均可查询,数据记录时间根据硬盘容量可存储数年;故障处理技术支持文件,以便在故障发生时管理人员能够迅速作出1个判断,为减轻损害尽可能节约宝贵时间;提升机房动力环境设备安全管理水平、提高管理效率,建立人员全面负责跨科目负责,能够全面监测机房。

原则4:操作简便

结合实际使用的需求组成集中监控系统,将所有功能操作简便化,使用户只需填写“YES”“NO”或“1、2、3….”即可完成大部分管理功能。

原则5:安全性

在所有涉及登录和修改系统参数、系统报警与否、启动和关闭监控系统等操作均需要密码才可执行,而且根据管理权限可以设置不同的管理级别。

原则6:系统的开放性

系统采用COM技术,配有设备自动连接向导,支持多种现场总线、PLC、智能仪表、采集板、智能模块、变频器等;全面支持OPC标准,可与任何支持该接口的硬件完美通讯;内嵌SQL Server系统,支持开放式数据接口(ODBC),自由管理各种标准的数据库,除COM外还提供动态数据交换(DDE),很方便用户利用PC机丰富的软件资源扩充系统的功能。

原则7:具有扩展性

通对智能和非智能设备通过通讯或加装硬件的方式很容易实现系统的扩容,而且对不同种设备、不同的厂家轻易实现集成和后期集成,包括机房的保安监控系统、门禁监控系统、供配电系统、UPS系统、柴油机系统、有源谐波滤波系统、精密空调系统、温湿度检测系统、漏水检测系统、消防报警系统等。

原则8:网络化

提供基于广域网和局域网的B/S/S模式的网络化监控,参数浏览及监控功能。

3.系统组成

系统由远程用户计算机、环境监控主机(服务器)、计算机网络、智能模块、远程模块、协议转换模块、信号处理模块、多设备驱动卡及智能设备等组成。(详见图1)

3.1 系统结构

现场结构主要采用RS485工业监控总线为主要传输模式,采用TCP/IP与串行协议混合集成的为补传输方式,系统整体采用开放式结构,支持各种传输网络,三层客户机/服务器(Client/Server)体系结构,“三层”是将应用功能分为表示层、功能层和数据层3部分。客户终端(网络端Client)与服务器(现场端Server)之间的通信方式为符合TCP/IP标准的自定义数据包。

3.2 监控主机

图1 计算机机房特理环境自动监控系统结构图

监控主机是本地系统的监控中心,在WIN2000运行在环境下。根据用户需要可监控低压配电系统、UPS电源系统、空调系统、环境系统等运行状态及环境系统状态,以数据的形式进入各自的RS485总线后,接入监控主机的设备驱动板。

要求监控主机365*24小时工作,监控主机系统必须可靠,应采用专业工控机为监控主机,如果系统要求更可靠,可以采用双机热备方式。由端口数据处理量不大,因此对监控主机的配置要求不高但是必须稳定。

3.3 数据采集模块、监控输出模块、传感器模块、协议转换模块

数据采集模块用于采集监控模拟量、开关量等信号,将信号传输给监控主机。数据采集包括模拟量采集模块(模拟量采集单元Q-7000C),智能开关量采集模块(数据采集模块Q-7000D),监控输出模块包括开关量及模拟量监控输出模块(数据转换单元Q-7000C)。数据采集与监控模块一般采用RS485通讯接口,可以远传。传感器模块用于采集现场环境数据,为系统处理提供依据,协议转换模块为智能设备及仪表提供接入系统的标准接口。

3.4 监控客户机

客户机(也可称为网络分机),用于机房管理员实时读取、查阅监控的数据。通过TCP/IP与主机建立通讯,传输途径不限。设备一般可以是普通电脑、工控机、或移动访问,其实质为安装了访问软件的PC电脑。

4.监控系统详细设计

以系统组成结构图为主线,按监控的设备(详见表1)依次对各部分进行详细分解设计。由于本文以实现对各终端设备的集中监控为主,所以重点阐述自主监控服务器开始到终端的监控,对于局域网及广域部分不做说明。

表1 监控明细表

表2

表3 专用空调监控系统内容及配置表

4.1 配电系统监控

4.1.1 市电运行监控

通过在总输入柜加装2台德国西门子全参数电量监测仪,可以对市电3相电压、电流、功率、频率、电度等常规电量进行监测,通过对市电运行参数的实时监测,可以准确记录并且保存,对于电压波动、停电、缺相、失压等异常情况记录、打印、并通知相关管理人员。

4.1.2 开关状态监控

监视UPS输入柜、输出柜内主开关和支路开关状态。对于机房内重要的配电开关,因为每路开关都分别负担着重要设备的供电,一旦开关跳闸,会造成很大的影响,实时监测有利于异常情况准确定位、及时处理,远程报警。

实现方式是通过配电柜开关的辅助接点引信号至开关量采集模块,即“0、1”状态量采集模块,然后由监控主机集中采集监控,实现的要点是各空开必须留有余量点,以备监控开关量模块使用。

4.2 柴油发电机监控

柴油发电机作为机房备用电的一个重要组成部分,其日常维护完好与否直接关系着主机房后备电力的应急供应,油机必须始终处于待机状态。而其位置一般远离机房,所以其工作状态必须通过远程实现实时监控。以防止柴油机故障或蓄电池耗尽的紧急情况油机造成发电机不能启动,对其监控十分必要。

实现方式是通过中大型的柴油发电机按标准工控协议提供的远程监控编程接口,按照其约定的数据通迅方式将油机电压、电流、频率、功率、引擎温度、水温、蓄电池状态等重要特性进行实时监测,周时可以通过编制按钮远程起停油机。

4.3 UPS监控

对UPS的运行参数和状态进行实时监控,实现方式是通过对UPS主机的通迅接口加装协议转换器,在监控机上按UPS约定的通迅方式进行通讯软件的开发,将每组UPS的整流器、逆变器、电池、旁路、负载等五部分的运行状态与参数通过网络传至监控中心,集中监控,异常的远程报警。显示采取图表及流程图方式(提取的参数见表2)。

4.4 空调监控

通过空调的智能接口实现对ALTUS精密机房智能空调的实时监控,监控空调各部件(压缩机、风机、加热器、加湿器、去湿器、滤网等)的运行状态与参数,并可远程修改设置与开关空调。

对于ATLAS空调一般通过监控系统可以获得如下数据及报警(参见表3)

4.5 泄漏水监控

对于面积大的机房,必须有漏水报警系统。水敏探头易布置在机房地板下易出水点周围,确保一旦漏水报警的可靠性,检测方式有多种,可以根据使用环境的不同自由选择。

本设计中采用法国TTK线缆式漏水检测系统。系统本身包括:漏水监控器、漏水感应线及其他辅助设备,系统可检测感应线上任何点的漏水位置并有语音报警。感应线缆为特种橡胶制成,抗腐蚀,抗酸碱。系统功能完善,对感应线有断线报警功能。系统还可检测机房洁净度,当感应线上的尘埃集结到一定厚度,系统会报警提示管理人员清洗感应线缆。当任意点漏水发生时,水流经过感应线缆,在极短的时间内(40S)之内发生告警。同时,集中监控系统通过数字变量模块采集报警信息,计算机房集中监控系统准确的将报警信息弹出同时电话报警,以便及时消除隐患,避免巨大损失。

4.6 温湿度监控

对于面积较大的机房,由于气流及设备分布的影响,温湿度值会有较大的区别,根据主机房实际面积,按照平均分布的原则设置温度、湿度探测器最后以总线方式汇总至集中监控系统,以确保主机房温湿度监控的准确度。同时,不要遗忘在UPS配电间、柴油发电间温湿度一体化传感器。通过RS485总线将实时的各探头所在位置的温度,传回集中监控系统,当超过设定值自动进行本地和远程电话同时报警。

4.7 新风机系统

利用厂家提供的基于标准工控协议,根据其规定的通迅控制方法,实现对新风机的远程起停控制、运行参数获取、故障报警信息的集中获取。

4.8 消防报警系统

消防报警系统是一套完整的系统,按国家消防有关规定,基于消防系统的特殊性,必须独立运行。所以在集中监控系统中对消防系统只是作为一个补充,即在系统原有配置不动,只从报警监控器将开关信号引入监控主机,搭载整体监控系统报警平台,配合消防系统实现远程的记录和电话报警。

5.机房物理环境自动监控系统设计时应注意的问题

5.1 集中监控系统不要承担消防系统联动控制功能

按照计算机房和消防系统设计的有关规范要求,计算机机房的空调、新风、排风系统应与自动消防系统具备系统联动功能。基于消防系统的特殊性、可靠性要求,这种联动必须由消防自动控制系统自身实现。所以在设计机房物理环境自动监控系统时,切不可基于集中监控系统实现新风、空调、排风系统的联动,只能对报警信号采集,同时实现辅助报功能。

5.2 集中监控系统设计实施时必须根据实际情况灵活组态

由于每个机房的场地、辅助设备不尽相同,所以在进行集中监控系统设计首先要依据计算机的机房的规范确定其等级,了解计算机机房的设计及辅助设备选型,进行实地现场考察。同设备厂商进行接洽,了解设备的接口标准、控制协议做好系统组态的前期准备。尽可能将设备厂家提供的故障报错原因、故障处理措施,在告警发生时详尽描述弹出,以便值班人员能够得到即时的技术支持。

5.3 必须保证高可靠性

集中监控系统所有使用的协议转换器、电缆、开关量模块、监控主机等全部硬件设备选择品牌时一定要慎重,基本要求平均无故障时间要大于20万小时。对于要求特别高的A级机房,为了确保集中监控系统可靠性,还应采取Watch Dog等防死机技术,关键的监控主机、转换模块应采取冗余方式构建。

5.4 在资金条件允许的情况下易支持多种远程处理方式

基于电话语音告警CTI技术。采用电话CALL CETER技术、数字语音转换技术,对各种设备的报警及专家处理提示采用语音系统。报警产生时,系统会自动拨打所设置的号码(手机、BB机自动留言、电话),采用语音通知有关人员,并将告警做报表记录,并且可以回拨到监控主机查询报警及电话通知情况。

采取C/S/S模式的实现基于WEB发布方式远程监视机房运行情况,当发电话报警时管理可以通互联网或是专网终端进行报警信息的查询,以便及时采取合适的处置措施。

在安全管理方面,要通过划分、配置操作权限,实现系统安全管理,并且以次做管理人员操作日志,确保系统运行安全。

6.结束语

机房安全运行自动监控系统的投入对劳动保障数据中心机房的安全管理有了极大的提高,对劳动保障数据系统可靠的运行和管理提供了可靠的保障,实现了计算机机房无人职守。

[1]李华.MCS-51系列单片机实用接口技术[M].北京:北京航天航空大学出版社,1993.

[2]何立民.单片机应用技术选编<1>[M].北京:北京航天航空大学出版社,1993.

李全忠(1974—),男,内蒙古扎兰屯人,大学本科,电子工程师,呼伦贝尔市劳动保障数据中心副主任,研究方向:工业自动化控制应用,政务信息系统规划、设计、实施建设。

猜你喜欢

计算机机房机房报警
计算机机房的管理与维护研究
计算机机房管理和维护的重要性及措施研究
LKD2-HS型列控中心驱采不一致报警处理
2015款奔驰E180车安全气囊报警
计算机机房的雷电防护
N通信公司机房节能技改实践
某IDC机房结构设计
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
死于密室的租住者