APP下载

浅析大型分布式数据中心的集中监控管理方案

2017-04-15张政

数字技术与应用 2016年12期
关键词:集中大型数据中心

张政

摘要:在当前企事业单位对信息化建设投入不断加大的背景下,不论是信息化程度深入发展导致的本地数据中心更加庞大,还是基于容灾备份或业务系统自身分布式部署需求引起的异地多中心发展趋势。都对信息化系统运维管理人员造成不同程度的困扰。针对这种情况,本文对大型数据中心内部各模块的集中监控和异地分布式数据中心之间的集中监控管理进行了探讨。

关键词:大型 分布式 数据中心 集中 监控管理

中图分类号:TP388.8 文献标识码:A 文章编号:1007-9416(2016)12-0114-01

现阶段各企事业单位往往已对信息化高度重视,信息化建设的投入也不断增加,在增强核心竞争力、有效降低成本、提高工作效率的同时信息化系统也变得愈加庞大,这种变化可以归纳为内部和外部两方面的增长。

内部增长体现在信息化系统横向和纵向扩展,横向扩展主要是指新建的专业信息化系统,如某单位已有一套人力资源管理系统,因为效果良好计划再上一套财务管理系统;纵向扩展则是对已有信息化系统功能模块的不断扩充,如已有的人力资源管理系统有组织规划、招聘管理、培训管理等模块,计划二期继续扩展自助平台和报表平台等功能。外部增长主要体现在异地多数据中心的需求,如某些核心信息化系统无法接受数据丢失或业务中断,就需要根据业务的重要程度建立不同级别的两点或多点分布式异地容灾系统;再如某些企事业单位组织机构分布广泛,除总部外的分支机构设立在其他地市甚至其他省市,需要使用多点部署的分布式信息化系统。

信息化系统的这类变化必然导致作为其载体的数据中心也不断向大型化、复杂化转变,从本地单中心到异地分布式中心不断扩张。这样不但增加了企事业单位维护的成本,还加大了维护人员的管理难度,如何能够对这类大型分布式数据中心进行有效的集中化监控管理就成为企事业单位亟待解决的问题。

1 大型数据中心内部集中监控管理

一般而言,单一大型数据中心内部主要可以分为机房环境、供配电系统、网络设备、服务器硬件、虚拟化系统、存储系统、操作系统、中间件和数据库模块。针对不同的模块有不同的对接方式来实现数据采集,通过设立一个集中监控主机来实现数据中心内部不同模块的统一监控。

1.1 机房环境

机房环境主要包括温湿度、精密空调、空调防水和视频监控等,温湿度和空调防水通过监控探头直接数据收集并记录历史数据;精密空调通过RS485卡利用modbus协议收集数据并对空调温湿度设定、多级集群运行模式调整、远程开关机等进行操作;视频监控可通过摄像探头直接进行图像采集,也可利用专用视频录像机对图像数据进行分级存储并对摄像云台进行各项参数调整。

1.2 供配电系统

机房供配电系统主要包括UPS、电池、输入输出配电柜等,整个系统的数据采集可以通过对UPS的通信来完成,UPS对外接口通常有RS232接口、AS400接口、SNMP接口和USB接口,通过接口提供的SNMP、UPS-link等协议能够实现对供配电系统历史状况进行记录,分析UPS、电池、各路供电线路电流电压状态,并对UPS设备进行远程配置。

1.3 网络设备

数据中心网络设备主要包含路由器、交换机、防火墙、入侵检测、流量控制、负载均衡等设备,通常这类设备都支持SNMP,通过SNMP可以统一进行资源使用率、端口状态、设备配置等方面的监控,对中心整体网络拓扑、设备互联状态、配置属性、实时告警、历史告警、设备实体关系等进行展示。

1.4 服务器硬件

因操作系统功能的不断强大,服务器硬件的监控在日常运维管理中经常会被忽视,但不可否认的是服务器硬件监控还是有一些无法替代的作用。如x86平台利用IPMI标准接入服务器硬件,可以对服务器内部主板温度、风扇转速、本地硬盘RAID状态进行监控,便于提前预判问题,同时还可以展现控制台界面,对服务器设备进行冷启动等远程操作。

1.5 虚拟化系统

随着虚拟化技术在数据中心内部的广泛使用,针对虚拟化系统的运维管理也变得愈加重要。市场上主流的虚拟化系统都有相应的监控API提供,利用这些接口可以开发不同类别的监控功能,集中监控虚拟主机和虚拟机的健康状况和性能,有效规划容量,合理为虚拟设备分配资源。

1.6 存储系统

使用SNMP、Cli、SNIA's、SMI-S和厂商指定规则自动发现存储设备、监控诸如RAID、磁带库、磁带驱动器、光纤交换机等存储设备。显示设备及其互连拓扑图,显示链路名、源和目标用不同颜色表示设备并对互连的状态和流量利用趋势深入分析,帮助管理人员定位存储系统性能瓶颈。

1.7 操作系统

目前对操作系统的监控已经较为成熟,不论是Windows、Linux还是AIX、HP-UX等UNIX系统都支持非常完备监控方式,如Agent、SNMP等方式。SNMP方式的优势在于不用在監控的操作系统系统商额外安装代理程序,不会对业务系统产生影响,对主机资源的占用也较低。通过SNMP方式同样能对CPU、磁盘使内存使用量、使用率,网卡连接、流量,特定进程状态等进行监测,并可对相应指标设定相应阀值及时报警。

1.8 中间件

中间件主要包括交易中间件(TPM)、应用服务器(WAS)、消息中间件(MOM)、数据访问中间件(UDA)、安全中间件等。主流的Java中间件主要通过JMX技术进行监控,实现请求数量、请求状态、响应时间、部署应用状态等参数实时监控和历史数据分析。

1.9 数据库

数据库主要通过建立只读用户,通过查询系统表相应字段,对数据库的用户连接数、执行等待时间、表空间、死锁、查询命中率、缓冲池等多种数据库性能参数进行监控告警,并自动记录导致异常运行或资源消耗很大的SQL语句以便开发人员对优化升级应用程序。

2 分布式数据中心之间的集中监控管理

分布式数据中心的集中监控管理的工作主要体现在监控数据的传输整合上,而数据的传输取决与分布式数据中心之间的连接方式。如果中心之间采用的是专线连接则可以让各数据中心内部的集中监控主机通过普通的路由交换协议传输数据;如果中心之间是通过公网连接则需要在内部的集中监控主机之外设置边缘服务器,放置于防火墙构建的DMZ,专用于中心之间的数据传输。如果需在公网传输的数据安全等级较高,还可以考虑在传输和接收之间进行加解密操作。

基础的大型分布式数据中心集中监控,可以选择一个有人职守数据中心作为集中监控主中心,设置主中心内的集中监控主机为整体集成监控主机,除收集本中心内各模块的监控数据外,还用于接受其他中心监控主机传来的数据进行统一管理;也可在监控主中心内独立设置集成监控主机,只接收本中心和其他中心集中监控主机传来的数据进行统一管理,形成集中监控至集成监控的两级数据收集模式。若集中监控对于企事业单位的重要程度较高,还可选择多个有条件的数据中心设立多个集成监控主机,分别收集,集中管理,处理结果根据重要程度在各集成监控主机之间进行同步或异步的数据复制。

3 结语

随着企事业单位信息化建设的不断深入,承载信息化系统的数据中心规模也不断增长,本文所讨论的集中监控管理方案既能将大型数据中心内部涉及的大多数模块进行集中监控处理,又能对各数据中心的数据进行集成监控管理。这种方式有利于数据中心运维管理人员提前发现预判隐患,及时定位处理故障,同时还能存储历史数据用于后期的分析学习,降低了运维管理人员工作强度,大幅提高工作效率,能够为企事业单位节约数据中心整体维护成本,同时为后期扩展至基于移动终端的集中监控管理奠定基础。

参考文献

[1]李锡红,吴建德,何湘宁.UPS监控技术综述[J].通信电源技术,2003,02:18-20.

[2]薛斌,房敬敬,刘昊.机房精密空调环境监控模块设计与实现[J].软件研发与应用,2015,11:27-32.

[3]张佚.IPMI技术在服務器管理中的应用[J].上江苏通信,2009,12:55-57

[4]吴一鸣,田永涛.南宁供电局J2EE应用服务中间件监控系统的设计与实现[J].电信科学,2013,11:131-133.

[5]戴声,肖建明,王波.大规模数据中心监控数据并发处理[J].计算机与数字工程,2014,12:157-162.

猜你喜欢

集中大型数据中心
酒泉云计算大数据中心
民航绿色云数据中心PUE控制
大型商用空调新产品开发过程的分析
大型施工企业财务一体化探讨
相对集中行政处罚权制度探析
浅析完善党内民主集中制
民主集中制运行过程中存在的问题
基于云计算的交通运输数据中心实现与应用
Overlay Network技术在云计算数据中心中的应用