APP下载

浅谈民航企业数据中心运行维护管理

2022-06-10李晨辉

中国新通信 2022年9期
关键词:布线机房数据中心

摘要:民航企业数据中心是承载各类信息系统的载体,数据中心基础环境安全稳定运行是民航企业日常生产运行的基础也是民航企业信息化建设和发展的基础,保障数据中心基础环境安全稳定运行至关重要。本文简单分析和描述了民航企业数据中心基础环境运行维护管理的特点、目标并探讨了相关管理方法。

关键词:民航企业数据中心;数据中心基础环境运行维护管理;设备设施管理;数据中心新技术应用

一、背景

民航企业数据中心主要为民航企业信息化建设与发展提供各类IT设备安装部署的环境,数据中心部署的IT系统一般包括生产运行类系统比如系统运行控制系统(SOC系统)、航班地面运营指挥系统(FGOS系统),商务营销类系统比如电子商务系统、企业管理系统及云计算、网络安全、系统存储等IT基础系统。民航企业数据中心将这些先进专业的软硬件系统集中到一起,通过合理配置UPS系统、空调系统、机柜空间等基础环境,采集、分析和处理各类数据信息,从而为民航企业的各业务工作提供信息化支持。

二、数据中心运行维护管理的基础与核心价值

数据中心的管理主要包括以下几方面内容:第一,对于分散部署在各地的数据中心要有统一的管控。第二,保障数据中心长期安全稳定运行,满足民航企业各信息系统对于高可靠运行环境的要求;第三,数据中心应适应民航企业信息系统设备的灵活部署,为上层IT架构提供永不断供的基础环境资源。第四,进行数据中心的持续优化与提升,提供具有高性价比的数据中心基础资源。这四方面内容可细化为14个具体的管理项,通过对每个管理项的研究管理与实践,全面加强对民航企业数据中心的运行维护管理能力及水平。

三、数据中心的统一管控

鉴于民航企业数据中心分散布局的特点,为保证各数据中心安全稳定运行以及数据中心设计、建设、运维的一致性,需要由一支专业的团队对企业各数据中心进行统一的管控,具体可以从人员组织、标准规范、及管理工具三个方面着手进行管理。

(一)人员组织

为做好企业数据中心的管理,需要成立一支专业的数据中心运行维护团队,负责数据中心的架构规划,编制数据中心技术标准及管理规范;负责数据中心基础设备、设施的运行保障;负责数据中心全生命周期的设计、建设与改造;组织数据中心容量管理;组织数据中心投资及预算管理;负责为企业培养输送数据中心人才。

(二)发布统一技术标准及管理规范

为规范企业数据中心设计、建设、改造,以及后续运行维护管理,保障数据中心安全、稳定、高效运行,需要制定发布统一的数据中心建设标准及数据中心运行管理规范。制定数据中心建设标准主要围绕数据中心设计、建设、改造过程中的各项技术指标及各相关子系统的具体要求,在符合国家相关的法律法规及相关行业标准的同时统筹兼顾民航企业自有数据中心的基础资源及特点。建设标准可根据数据中心的重要性级别及影响范围对各数据中心进行分类,不同级别的数据中心根据实际情况制定分级的具体建设标准。除了制定数据中心建设标准,为了规范数据中心生产运行及管理,还需要一套数据中心运行管理规范。数据中心运行管理规范建议包括:数据中心门禁管理、人员进出管理、设备进出管理、监控管理、日常值班要求、各类工作表单等内容。

(三)平台工具的支持

为实现数据中心的整体管控,及时掌握各个数据中心的运行状态,应建立一套覆盖企业各个数据中心的基础设施管理系统。数据中心基础设施管理系统至少要包括机房基础设施环境数据的监控、数据中心设备资产管理,容量管理等,并可通过统计自动生成各类监控数据报表、资产统计报表、事件问题报表等,还可以通过电话、短信、邮件、声光报警等方式进行信息的通知与发布。用好数据中心基础设施管理系统的重点是做好基础数据的录入,而难点是基础数据的更新,要不断通过对数据中心管理及运行维护人员的监督管理形成系统应用的习惯。

四、保障数据中心长期安全稳定运行

保障数据中心长期安全稳定运行是民航企业信息化发展的基础,也是民航企业日益赖以进行正常生产与运行的基础,因此公司数据中心的安全稳定运行至关重要。保障好数据中心长期安全稳定运行可从数据中心的前期规划设计、施工建设,设备设施管理,机房现场运行维护,安防与监控管理,应急管理及供应商管理等几个方面进行管理。

(一)数据中心的规划设计与施工建设

数据中心的可靠性主要是通过前期的规划设计和施工建设实现的。數据中心的使用部门要通过需求分析确定数据中心的设计建设等级,并根据数据中心建设等级,向数据中心设计单位提出尽量具体的技术要求。为保障数据中心高质量建设,数据中心后期运行维护团队人员可在施工阶段密切跟踪施工情况,重点设备设施安装调试可进行现场旁站。

(二)设备设施管理

数据中心设备、设施一般主要包括变压器、柴油发电机组、高低压配电柜、UPS系统、空调系统、综合布线、照明系统、消防系统等。做好设备、设施的管理首先要做好管理分工,明确好管理职责。

1.设备、设施运行维护人员分级管理。针对UPS系统、空调系统,柴油发电机组、低压配电、消防系统、照明系统的运行维护管理,一般情况下可采用分级运行维护管理,具体可以分三个等级管理。第一级运行维护管理为7*24小时值守人员,其主要职责为根据数据中心运行管理规范进行日常巡检、设备监控以及信息传递。第二级运行维护管理人员为UPS系统、空调系统等相关专业子系统的专业技术人员。第三级运行维护管理人员一般为设备、设施原厂的技术工程师,其负责本厂设备、设施的深度检测维修及返厂维修。

2.备品备件管理。数据中心基础设备、设施的备品备件管理是数据中心安全稳定运行的重要保障,也是数据中心应急维修的前提,备品备件管理至关重要。建议根据数据中心基础设备设施的运行特点梳理出容易出现故障的备品备件目录,设立存放备品备件的专用库房,确保出现硬件故障时能通过更换备品备件使设备快速恢复运行。

(三)机房现场运行维护

机房现场运行维护内容主要包括机房分区管理、综合布线管理、标识标签管理、设备上下架管理等内容。数据中心结构和布局需要有整体的设计理念,要考虑实际使用情况也需要考虑操作管理的便利。机房分区以安全性、使用便利性和可维护性为主要区分原则,机房进出口应单独设置,做到人流、物流、维修流和参观流分开布置,尽量避免交叉。综合布线管理包括强电布线及弱电综合布线。强电布线要与弱电综合布线分开铺设。强电布线一般可采用配电列头柜或专用配电母线。数据中心的标识标签主要应用于硬件设备和综合布线的管理。标识标签管理可提高對硬件设备和综合布线的高效管理及灵活运用,并对系统的使用调度和故障的快速查找定位提供便利与支持。

(四)安防与监控管理

民航企业的重要数据中心需要部署7x24机房安保人员;机房安保人员需要对进出机房的人员、设备、工具、配件及进出机房的证件、手续进行严格的检查。数据中心环境监控功能一般通过数据中心基础设施管理系统加以实现。数据中心信息管理系统至少要包括机房温湿度、UPS系统、UPS电池、空调系统、门禁系统、配电柜电量仪等机房动力环境数据的实时监控、统计、报表、通知报警,数据中心设备资产动态管理,数据中心的配电、空调系统、设备安装空间等内容的容量管理等内容。

(五)应急管理

应急管理是数据中心安全稳定运行的有力保障之一。数据中心应急预案一般包括:人员组织、应急的启用与关闭、应急处理流程、应急恢复流程等内容。应急处理流程应尽量做到覆盖全面,流程清晰。应急演练是应急管理的重要组成部分,民航企业需制定详细的年度演练计划,演练力求真实有效,部分重大应急演练建议多部门、多专业统一联动。

(六)供应商管理

数据中心的安全稳定运行离不开各类供应商的支持,作为民航企业,在数据中心运行维护方面往往并不专业,为保障数据中心的日常运行需要各类供应商的支持,对于一些自身数据中心运行维护团队力量不足的民航企业,还需要聘请数据中心设备、设施的运行维护服务团队。在供应商的选择时,要制定好供应商选择标准,注重供应商提供服务的能力与资质,并做好供应商合同管理和服务过程管理与评价。

五、做好数据中心的产能管理

数据中心的产能资源包括机房及机柜空间、承重、电力、制冷、综合布线等内容。民航企业数据中心的产能管理是为适应企业信息系统设备的灵活部署,综合成本因素,为上层IT架构提供永不断供的基础环境资源。数据中心的产能管理主要体现在产能保障、容量优化和IT设备部署三个方面。

(一)产能保障

首先,制定详细的数据中心容量管理计划,并进行定期更新。做到尽早了解服务器、存储、网络等IT设备进机房的近期上线计划及中远期规划。如果需求部门不能及时地提供IT设备上线计划,数据中心运行管理工程师可以通过科学的容量预测手段,构建容量评估模型,对使用需求及数据中心基础环境容量进行分析与预测。其次,根据容量管理计划,配置合适的机房基础环境资源。在进行数据中心资源配置时,可根据空间、电力、制冷、综合布线等方面性能,为计划外的IT设备上线预留一定的容量资源。

(二)容量优化

容量优化是数据中心容量管理的重要内容。为提高数据中心容量利用率需要进行有效的容量优化。首先,建议对数据中心进行专业分区。建议综合考虑机房及机柜空间、承重、电力、制冷、综合布线等资源的规划,将数据中心划分为常规服务器区、网络区、存储区、小型机区等专业区域。比如在存储区及小型机区要配置更多的配电及制冷资源,在网络区及存储区配置更多的光纤网络综合布线资源。其次,尽量减少数据中心的碎片化容量。建议有条件的数据中心可通过容量管理系统(模块)实时掌握详细容量信息及碎片化容量资源的分布情况。

(三)IT设备部署

数据中心IT设备上线部署应满足标准化、灵活性、高可维护性等基本原则。IT设备上线部署应规范、整齐、美观,保证IT设备充足的安装空间,满足一定的灵活性、可维护性及系统监控要求。

六、数据中心持续优化提升与运营管理

数据中心的可持续运营始终受到成本和业务需求的双重约束,需要通过科学合理的运行维护管理做好数据中心的持续优化与提升;同时还要做好成本管控、节能减排,密切跟踪应用新技术,为民航企业提供安全稳定的具有高性价比的数据中心基础资源。

(一)数据中心成本管理

随着民航企业信息化建设与发展,数据中心规模越来越大,基础环境系统复杂,运营成本高涨。通过对数据中心设备、设施的优化管理,可以提升效率降低维护成本。很多数据中心在建成之初使用率并不高,首先建议通过整合IT设备上线资源分批启用机房模块,在不影响整体数据中心冗余配置级别的前提下,把IT设备集中在有限的几个机房中,关闭闲置配电、暖通设备。第二,提升数据中心UPS、空调等基础环境设备、设施的使用率。通过数据中心环境监控系统,梳理各个基础环境设备、设施的运行状态,对于使用效率低下的设备制定有针对性的措施。第三,提升数据中心的IT设备的使用效率,如通过云计算及虚拟化等技术实现以最小的软件代价,将所有硬件资源都利用起来,达到降低成本的目的。

(二)数据中心的绿色节能

数据中心的绿色节能管理是数据中心运营管理的重要组成部分。数据中心绿色节能管理目的有三个:一是通过选用绿色环保的数据中心设备设施、装饰装修材料,保障人员身体安全与健康;二是通过提高能源效率,减低能源成本;三是降低二氧化碳排放量,为社会可持续发展作贡献。解决方案如下:

1.数据中心室内环境污染控制及装饰装修材料选择应严格按照现行国家标准《民用建筑工程室内环境污染控制》GB50325的有关规定执行,设备设施、线缆、装修选材应选用绿色环保材料,保障在数据中心内工作的人员身体安全与健康。

2.在设计阶段尽量减小数据中心楼体与室外大气接触的外表面积A(m2)与其所包围的体积V(m3)的比值(形体系数),以降低能耗指标。

3.暖通系统约占整个数据中心能耗的30-45%。降低暖通系统的能耗是提高数据中心能源利用效率的最直接和最有效措施。解决方案如下:(1)应根据数据中心的规模选择与之匹配的暖通系统类型。一般来说,对于IT负荷小于1000KW的小型数据中心,推荐采用风冷直接蒸发式精密空调系统;对于制冷负荷在1000KW至3000KW的中型型数据中心,建议综合考虑数据中心屋面承重、冷媒配管安装距离等建筑特点选用风冷直接蒸发式的精密空调系统或风冷冷冻水空调系统;对于制冷负荷在3000KW以上的大型数据中心,建议采用水冷冷冻水空调系统。(2)优化暖通系统的温湿度设置。如数据中心采用冷冻水型精密空调系统,可通过提高冷冻水供水温度的方法节能降低PUE,一般来说冷冻水供水温度不宜超过27℃。如数据中心采用直接蒸发式精密空调的系统,可适当调高空调系统的出风温度,保障机柜进风口温度不超过27℃。(3)封闭机柜间冷通道或者热通道。根据数据中心实際情况可采用封闭机柜间的冷通道或热通道,封堵泄露,密封地板孔洞,提升地板下静压箱的静压,机柜内部安装盲板的方式降低PUE。

(三)数据中心新技术应用

做好民航企业数据中心基础环境运行维护,要注重相关新技术与知识,跟踪数据中心行业发展趋势与应用。目前数据中心行业新技术及发展趋势包括自然冷却技术、智能运维等。如数据中心智能运维机器人可参与到数据中心的日常巡检中,以减轻人工巡检的压力。智能运维机器人可长时间不间断地在数据中心巡逻,并能够主动收集室内环境影像、温湿度、设备指示灯异常,极早期烟感探测,报警声音,远程语音提示,自动报警等功能。合理化部署并应用智能运维机器人可大幅提升巡检的可靠性和规范性,降低人工劳动强度、提高巡检质量、降低运行维护成本。

作者单位:李晨辉     国航信息管理部

参  考  文  献

[1]数据中心设计规范 GB50174-2017 中国计划出版社S/N155182.0147,2017年10月第一版.

[2]程应军.从建筑的角度打造节能云数据中心.TechTarget中国,2012.02.20 .

猜你喜欢

布线机房数据中心
酒泉云计算大数据中心
摆脱繁琐布线,重定义家庭影院 Klipsch Reference Wireless 5.1
面向目标的主动绕障PCB布线算法
电子布线系统在工程中的应用
民航绿色云数据中心PUE控制
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
一种考虑拥挤度的布线模型及其算法
基于云计算的交通运输数据中心实现与应用