关于某机房改造工程的实施思考
2011-08-15太极计算机股份有限公司王海红
文|太极计算机股份有限公司 王海红
近年来,随着经济大环境的不断发展,相关行业数据中心机房的规模也在同步增长,机房改造的需求也越来越普遍。本文就结合某机房改造工程展开讨论,不妥之处,还请指正。
工程背景:某机房因部分业务迁移、部分业务扩容,需要对原机房进行在线改造。原机房存在问题有:布线混乱,可维护性极差;空调气流组织混乱,机房内局部热点突出;设备布局混乱,利用率低;配电系统存在明显故障点,无法进行在线维护等。
1 现场条件及需求整理
本阶段主要完成对现有条件、用户需求的整理,为设计、规划奠定基础。
(1)现有机房场地条件排查。主要核实地面承重、室内净高、原有配电进线容量、回路数、运行方式、原新风设计、原空调系统、UPS、电池等重型设备的布置、原线缆路由等。特别提醒地面承重必须复核,避免后期规划时设备布置超重,否则需要加固;原有配电容量必须复核,如需增容需要及时报批;线缆路由必须核实清楚,否则对在线改造影响极大,特别是原线缆迁移、利旧。本工程所有终端布线(含桌面语音、数据)均利旧。
(2)现有机房业务设备排查。此环节必须把每台在用设备逐台统计,包括用电量、发热量、电源规格、电源端口及数量、单机重量、占用高度等,以便把设备根据需要调整到每台机柜。同时,要对布线结构进行复核,包括语音及数据,以便对配线架、布线柜进行合理规划、布置。此部分内容整理完成后必须和用户复核确认,要求尽量详细。
(3)现阶段业务设备的规划。在现有机房业务设备排查的基础上,明确哪些设备保留、哪些设备迁移出机房;同时,要明确施工界面,特别是不在本工程范围内的施工都得明确,为后期的工程实施奠定基础。由于机房工程是个整体,特别是在机房的在线改造上,需要把整个工程因素都考虑进去,否则会对在线改造造成致命影响。本工程存在三个外部关键节点:一是电信接入及设备的移位及恢复;二是内部语音交换的移位及恢复;三是在用业务的计划停机及恢复。此部分内容整理完成后必须和用户复核确认,要求尽量详细;牵涉多方单位或部门的内容,最好有多方的备忘录。
(4)远期业务设备规划。这个环节要落实两个方面的内容:其一明确规划;其二未明确的远期预留。明确的规划主要指根据业务发展对业务设备能列出明确清单,施工方必须逐台统计并装入机柜内。对于未明确的远期预留,可以根据用户提供的规划,按机柜为单位进行用电量及发热量预留;布线的预留可以仅考虑骨干预留,此部分内容,需要用户为主导,避免盲目预留、造成浪费。
(5)机房等级的明确。这是设计的最基点,机房的等级必须结合行业规范、用户实际、现场条件,不要盲目追求高等级、高配置。机房等级只是设计的基点,可以继续细化,甚至可以按专业细化、按区域细化。本工程的等级标准参考A级。如:因现场没有条件配置油机,故市电按2路独立电源考虑,不考虑油机,即按B级标准;但是UPS按2N配置,达到A级要求。
2 原有机房运行情况调查及分析
主要目的:通过调查,列出在用机房存在的问题,对症下药,避免改造时出现同样的问题。情况调查主要了解的内容有:
(1)场地条件,如供电容量、UPS、空调、有无局部热点、是否有负压现象、洁净度、温湿度状态、有无漏水等;运行状态:实际运行负荷、UPS负载率、空调的用备、空调的四季运行工况、有无运行故障及故障原因、有无临时改造及改造的原因及效果、维护周期及维护范围、合理建议等。
(2)业务需求:主要了解场地设施是否满足现有业务设备的配置、有无针对性要求、有无相关工程建议或需求。
(3)通过调查,发现本工程的问题有:机柜布置未采用冷热通道;局部热点突出;空调配置没有冗余;气流组织混乱;多次临时改造,造成布局、布置混乱,可维护性极差;配电系统分级过多、配置散乱,未统筹考虑,存在明显单点故障;配电系统未针对负荷类型做差异化的优化配置;原空调的室外机选型偏小,造成高温季节频繁报警等。
3 工程设计
通过以上环节的准备,可以进行改造的工程设计,工程设计要完成的主要图纸有:
(1)现场条件图:即原有机房的现状。一定要完全将相关设备布置、线缆路由、场地要素等信息完全在图纸上显示,同时要明确标示出哪些要迁移、哪些要保留。其实,这就是把此前的大部分工作成果图纸化,为后面的设计、改造、实施做好准备。特别要注意,一定要把相关信息图纸化,因为有的设计师对现场考察、调查很充分,也整理出了明晰的文字记录,但就是没有把这些信息再次进行加工反映到图纸上,其实,不管是什么工程,最终的施工文档就是施工图纸。在本工程中,我们把此图也归类到现场条件图纸中。当然,如果原来有竣工图纸,此工作就相对简单些;如果没有,就必须自行绘制,特别是存在多次临时改造的工程,把所有问题都归结到现场处理的做法是很危险的,有时是致命的。例如:用户要求所有桌面端线缆利旧,那么在后期设计中就要核对线缆路由、重新布局对长度的影响。
(2)改造的工程施工图:其实就是本次工程的施工图。施工图要把现有条件、现阶段及远期规划结合起来形成最终的图纸。有的人习惯于把远期规划用“待定”两字一笔带过,作为完整的工程设计,一定要把设计要素交代清楚,特别是所谓的“预留”,一定要在图纸中注明“预留的依据、预留的结果”,特别是要在所有专业中都有体现。举个简单的例子:电气专业有了预留,空调专业也必须有预留。即在所有的设计内容中(包括预留),都要进行完整的各专业的资料互提,确保整个工程的一致性、各专业之间的匹配。
本次工程的大致思路是:设备按类进行逻辑分区(如电信接入区、内部交换区、数据布线柜区、语音布线柜区、公共设施区、专营业务区、配电及UPS区、电池区、空调区等);强弱电全部上走线、无吊顶;空调上送风下(侧)回风,按N+1方式配置;市电双路本地互投、机房内IT设备UPS按2N、双母线配置;核心业务桌面终端采用独立UPS 单电源方式供电等。
4 在线改造的衔接设计
此部分内容其实是实施方案的一部分,主要目的是为了实现“在线改造”而做的辅助设计,是为实现最终设计而进行的临时性补充设计。但是,它不能简单归结到实施方案里,因为此部分内容在图纸里、实施方案里还是相对独立的,我们定义为衔接设计,主要是因为在整个工程实施里,它仅仅是过渡措施,存在建设、拆除、恢复三个过程,且会发生实质性的物资消耗。特别是利旧部分,在此部分内容里要体现出来;同时,此部分内容也要体现全专业的匹配,确保“在线”的功能性。
本工程主要考虑的难点有:
装修系统的衔接设计:临时划定使用区、后期实施区、临时使用区的恢复。临时使用区:为了方便其余大部分区域的场地建设,同时要保证在用设备、系统的正常使用而设立的相对独立的临时区域。后期实施区:是可以较独立且无需过多考虑在线需求的区域。临时使用区的恢复:在后期实施区完成且具备投运条件后对临时使用区的恢复。整个分区要方便实施及恢复,保证“无尘”实施的要求,实现配电、空调等专业的配合。
配电系统的衔接设计:怎样在有限的计划停电时间里完成配电系统的正常实施?简单讲,分为三个方面:首先是针对临时使用区的改造,把在用的设备、系统的配电进行临时改造,配置独立的、临时的配电系统;此环节的目的有两个,一是确保在后期改造期间此部分系统可正常工作;二是不影响后期改造的实施。务必强调“独立”的含义不仅是系统上,也要同时考虑物理区间的临时独立。其次是后期实施区的正常建设,此部分要包含临时使用区的正常配电。最后是临时使用区的配电恢复,即实现临时和正常的切换。特别注意此部分的配电,务必包含IT设备配电和空调系统的配电等。
空调系统的衔接设计:和配电系统一样,也需要和装修进行匹配衔接,此部分内容也是“在线”改造的重要环节。
其他系统的衔接设计:如消防报警、消防灭火、安防、门禁、环境监控等。由于是衔接设计,有些系统可以尽量简化甚至采用临时措施取代。
5 实施方案
关于实施方案,和其他工程一样,主要是完成人力、物力的有效组织,确保施工质量、进度、成本控制等。和其他工程的区别在于要重点考虑“在线”改造的工程需要及实施。下面就“在线”改造谈几点注意事项。
第一施工原则:由易到难、先简后繁;确保重点在线业务的安全运营。本工程把语音和数据分开实施,且分区域实施,按先语音后数据、先小区后大区、大区拆化为多个小区的方案进行实施。
第二列出难点、重点,关注无尘化、在线的特点。本工程的重点是确保关键业务的运营,采用先建后移的模式。先建指的是确保机房内核心设备正常运行起来;后移指的是待已建完成且正常运行后分批次对后端线缆完成迁移。无尘化的措施主要体现为边拆边清、边建边清、加工外移、无尘工艺等。
第三重点关注在线改造中新建和利旧的关系。有的人会简单的提出全部利旧,能否实现?因为牵涉在用设备,所以要谨慎分析。一般情况下,划归到临时使用区的物资很难实现在线改造的利旧,务必仔细考虑,建议从备用角度去考虑物资的利旧。如地板利旧,除非地板可以在正常的施工工序中按期到位,否则就无法实现;其他如空调、UPS、机柜等,都存在这个问题。从备用角度考虑,可以把临时使用区的物资作为正常区域的备用物资。
第四外包或工程范围外所涉及的工程衔接。如:电信接入、交换、IT设施等,均不在场地设施范畴,但都和在线改造的需求息息相关,所以要在施工计划里统一体现。
第五关于隐蔽工程及验收。由于是在线改造,人们往往忽视此环节,希望尽快完工并尽快投运。和其他工程一样,隐检和验收务必重点关注。为了确保工期,所有的验收、检查环节都必须详细的列入施工计划里,避免影响工期。