APP下载

基于IPMI的数据中心带外管理设计与实现

2017-04-13管建超

软件导刊 2017年3期
关键词:日志功耗数据中心

李 明,刘 军,马 永,管建超

(国网安徽省电力公司 信息通信分公司,安徽 合肥 230061)

基于IPMI的数据中心带外管理设计与实现

李 明,刘 军,马 永,管建超

(国网安徽省电力公司 信息通信分公司,安徽 合肥 230061)

随着IT技术的快速发展,数据中心规模逐渐扩大,体系结构越来越复杂,在给人们带来便利的同时,也给运维管理增加了难度。为了保证系统稳定运行以及故障及时修复,高效维护数据中心,设计并实现了基于IPMI的数据中心带外管理系统。该系统实行统一平台管理,模拟实际机房状态并实现远程管理数据中心,能够实时监控各硬件运行状态,实现系统资源管理、功耗管理以及远程控制等功能。该系统具有良好的可靠性、可用性、可扩展性、易用性和可管理性,从而达到高效运维管理的目的。

带外管理;IPMI;数据中心

0 引言

本文从数据中心设备的现状出发,进行带外管理系统的设计与实现。当前,企业信息化中各种服务器的统一管理是一个需要迫切解决的问题。由于业务系统和设备数量不断整合与增加,各应用系统的运行维护、系统安全保障、硬件设备性能及指标监测等工作量和复杂度不断加大,完全依靠手工方式无法实时监测,且容易出错[1]。此外,远程登录管理方式在网络故障或者没有开机情况下无法实现[2]。目前,越来越重视数据中心的高密度、低功耗、易管理等特性,且数据中心设备分布在多个区域,因此需要建设一套集中监控管理平台,实现IT基础架构的整体监控与管理自动化、IT设备功耗定制,实现节约化管理,以便最大限度保证信息系统不间断为业务开展提供信息化服务。

1 基本理论

1.1 IPMI简介

IPMI[3](Intelligent Platform Management Interface)是一种开放标准的硬件管理接口规格,该标准是由Intel、HP、NEC、DELL和SuperMicro等公司发起制定,定义了通过嵌入式管理子系统进行通信的特定方法。IPMI信息通过基板管理控制器(Baseboard Management Controller,BMC)进行交流,在不依赖操作系统的情况下,实现对服务器硬件运行状态的监控,如风扇转速、机箱内部温度、各CPU温度、电压和CMOS电池容量、电源开关状态、底盘状态等。这种方式具有两个主要优点:首先,此配置允许进行带外服务器管理;其次,操作系统不必负担传输系统状态数据的任务。目前大部分厂家的服务器,如IBM、HP以及国内华为、浪潮等众多的品牌服务器都支持IPMI协议。

1.2 带外管理

带外管理[4]是指通过独立于业务数据之外的专用管理通道对机房网络设备、服务器设备以及电源系统等进行集中化管理。带外管理的核心理念在于只传输管理数据、统计信息、控制信息等,将网管数据与业务数据分离,两者完全独立互不影响,可以提高网管的效率与可靠性,也有利于提高网管数据的安全性。企业网络上会传输各种业务数据,如果业务网络出现问题,通过该网络排除故障。而且这种方式可以通过远程KVM对远端服务器进行BIOS级控制。这种管理方式能够减少运营成本、提高运营效率、减少宕机时间、提高服务质量。

2 设计与实现

2.1 总体设计

借助3D展示技术,为运维人员提供集中监控和展示平台,实现数据实时推送,提供基于web的可视化设计,将IT环境下的网络、系统、业务、机房等进行多维度展现,并能够提供宏观态势层面的多维分析、决策辅助,极大提升用户体验,对数据中心基础设施实现集中式管理。

本文设计的带外管理系统采用B/S架构,通过远程访问被管理服务器的BMC芯片,对服务器的各项物理指标进行数据采集,再传送给管理平台,并执行来自管理平台的各种控制指令。整体架构设计如图1所示。

图1 整体架构设计

2.2 主要功能设计

带外管理监测的主要功能模块包括电源管理、远程控制、功耗管理以及日志管理等,如图2所示。

图2 BMC功能控制模块结构

从图2中可以看出,服务器监控均通过BMC这个中间桥梁来实现。基本原理是以IPMI协议为基础,远端通过LAN口发送控制命令给BMC,由BMC获取信息后再反馈给请求者。

(1)电源管理模块。电源管理[5]能获取当前电源状态,可以进行开机、关机和重启操作。如直接切断服务器电源立刻关机会导致系统异常断电。安全关机模式是在BMC受到命令后,再发送一个ACPI信号给服务器的操作系统,操作系统收到信息后,再执行自动关机操作。

(2)远程控制模块。BMC通过底层硬件接口对服务器VGA接口进行采集,并使用相应的视频压缩方法对图像进行压缩以便在网络上进行传输,压缩后的数据传输至负责网络发送的模块;网络发送模块通过网络传输协议,将压缩后的数据传输到远程客户端应用层进行处理,同时还需要处理、接收客户端应用程序传输过来的鼠标、键盘响应数据。此外,还有诸如用户认证、数据加密等模块[6]。

除可以操作服务器本身外,还需对其外围设备进行控制,包括对服务器的温度、电压、风扇转速等安全阈值区间的设定,具有定位功能LED灯的开关操作等。

(3)功耗管理模块。功耗管理模块[7]首先通过LAN发送釆集数据请求服务,请求命令通过LAN传输到BMC,BMC根据具体响应将传感器各类具体信息更新至SDR中,同时将SDR中最新信息通过BMC传输到Serial串口,通过串口重定向技术将数据信息传输到LAN接口,最终通过UDP报文方式发送至功耗管理模块,对其进行数据解析和转换并将信息存储到数据库中。将服务器主板上各类传感器采集到的动态能耗数据存储到BMC的SDR中,这些数据是时刻动态变化的,需要周期性进行采集才能达到实时监测服务器的目的。

(4)日志管理模块。服务器的SEL存储着系统事件和系统配置信息,SEL中每条记录都有唯一的ID,ID号从0000h到FFFFh,通过ID号就可以对日志进行检索,提取对应的信息。日志管理模块[8]首先向BMC发送请求,BMC根据要求获取SEL上的记录,BMC将记录以UDP报文的形式发送到日志管理模块,最后将日志记录解析后存放到数据库中。

除了服务器本身的日志外,同时还提供认证、授权、访问控制日志,实现管理员权限的精细化管控。对管理员的操作进行审计,方便管理和事后追查。

2.3 带外管理软件实现

为保证系统的可移植性,本系统采用java语言开发,采用模块化设计,IPMI与BMC之间的交互和各个功能模块都提供统一的API接口,以便后期功能扩展。为了保证较少的系统资源占用,同时也为了简化系统结构,集中监控系统采用轻量化数据库Mysql作为数据库。最终实现的管理系统如图3所示,系统全方位展示数据中心的状态,比如3D展示机房,可以清楚了解新机器的上下架问题,以及机房空间位置等,同时系统还列出维护数据中心需要的日志、功耗、温度等信息。该系统与其它监控软件相比,具有如下几个特点:

图3 监控管理软件界面

(1)提高IT服务运作的效率,降低IT服务运作的成本,实现网络及系统管理工具与管理制度的有效衔接。

(2)通过实时监控减轻维护人员的工作量,将原来分立的系统管理模式变为集中管理模式。

(3)能进行事件/日志的集中统一收集、分析、处理和告警,对信息系统进行全方位监视和管理,快速定位故障,有效预测、预防、隔离、诊断和解决故障。

(4)自主开发有利于实现信息系统的“自主可控、安全可信、高效可用”。

该系统在设备定制化项目中得到应用,目前系统正常运行,在数据中心日常维护中起到很好的效果。虽然系统在功能和性能上满足了维护的需求,但还需要优化管理策略,比如功耗管理策略是预先设定的,不够智能化,需要研究功耗自动管理算法,而且还需扩展系统的功能,比如容量告警、报表统计等。使得系统更加智能化、更好地实现统一管理数据中心的目的。

3 结语

随着云计算、大数据的普及和国家“互联网+”战略的提出,电力系统的信息化进程也在不断推进,数据中心的基础设施和应用资源得到迅速增长。需要及时高效监控和管理资源的可用性,保证服务的可靠性。

本文研究设计了基于IPMI的带外管理系统,使得数据中心服务器集中统一管理,为数据中心维护提供了有效帮助。系统能在不间断运行的情况下及时发现并排除系统潜在的安全隐患,具有良好的通用性和可扩展性,能方便地扩充新功能,当设备硬件变化时能对数据中心灵活的进行集中监控和管理,降低了中心的维护成本。带外管理使得运维人员不必进入机房进行现场管理,这样大大提高了运维的效率和数据中心的安全性。

[1] 张毅,陈良,庞剑.多集群计算环境故障监控管理系统[J].计算机工程与科学,2013,35(11):54-61.

[2] 陈婉.云计算环境下虚拟化数据中心融合技术[J].软件导刊,2016,15 (4):166-168.

[3] 张冰洁.基于IPMI的智能平台管理系统设计[D].广州:中山大学,2014.

[4] 郑明玲,蒋句平,袁远,等.一种面向大规模计算机的监控管理系统[J].湖南大学学报:自然科学版,2015,42(4):107-113.

[5] 刘龙.智能服务器电源管理平台技术研究与实现[D].北京:北京邮电大学,2011.

[6] 车路,张焕远,夏亚东.基于开源软件的云监控平台设计与实现[J].计算技术与自动化,2015,34(1):136-140.

[7] 李宁.数据中心能耗数据采集方法研究与实现[D].北京:北京邮电大学,2013.

[8] 张国强,董绍彤,于涛.一种高安全云管理平台的设计与实现[J].电脑知识与技术,2014,10(24):5628-5631.

(责任编辑:陈福时)

李明 (1971-),男,安徽巢湖人,国网安徽省电力公司信息通信分公司高级工程师,研究方向为信息化规划建设运维管理;刘军(1978-)男,湖北孝感人,国网安徽省电力公司信息通信分公司高级工程师,研究方向为信息系统运维管理;马永(1989-),男,安徽宿州人,国网安徽省电力公司信息通信分公司助理工程师,研究方向为电力信息化建设运维;管建超(1978-),男,安徽合肥人,国网安徽省电力公司信息通信分公司高级工程师,研究方向为电力信息化。

10.11907/rjdk.162410

TP319

A

1672-7800(2017)003-0074-03

猜你喜欢

日志功耗数据中心
酒泉云计算大数据中心
基于任务映射的暗硅芯片功耗预算方法
一名老党员的工作日志
扶贫日志
民航绿色云数据中心PUE控制
游学日志
数字电路功耗的分析及优化
IGBT模型优化及其在Buck变换器中的功耗分析
基于云计算的交通运输数据中心实现与应用
Overlay Network技术在云计算数据中心中的应用