数据中心“运维前置”对设计的影响
2021-03-31钱龙,王超,李喆
钱 龙, 王 超, 李 喆
(中国建筑设计研究院有限公司,北京 100044)
0 引言
2020年3月,中央政治局常务委员会明确提出“加快推进国家规划已明确的重大工程和基础设施建设,加快5G网络、数据中心等新型基础设施建设进度”,自此,社会各界围绕“新基建”的建设类型、如何建设等问题展开了热烈的讨论。作为“新基建”重要组成部分的数据中心,也迎来了新的发展契机。我国数据中心行业,伴随着IT技术的发展以及GB 50174-2008《电子信息机房设计规范》到 GB 50174-2017 《数据中心机房设计规范》建设标准的变革,已走过近20年的发展历程。对于数据中心基础设施的理解也从开始的“机房”走到了如今承载各行业信息系统的基础设施保障。
如今,建设方业主已普遍意识到,若要建设一个一流数据中心,需要关注基础设施建设的全生命周期过程,其中包含“分析与规划、设计与构建、实施与验证、运维与管理”四个阶段[1],如何做好前三个阶段工作,进而降低运维管理难度、提升运维管理的效率,是每一个业主亟需解决的痛点问题。
1 运维阶段的前置
伴随数据中心市场行业近年来的发展,分析规划、设计构建、实施验证这三个阶段已经发展相对成熟,运维管理阶段已明显成为“木桶的短板”,尤其对于互联网数据中心(IDC)而言更是新的价值增长点。由此,成熟的IDC厂商在发展过程中开始培养自己的运维管理团队,这些运维团队更贴近自身的机电系统,更加了解系统内产品的性能,并对设计建造过程中遗留下的问题体会更为深刻。运维团队在不断的遇到问题、解决问题的过程中,获得了宝贵的实践经验,从此,运维团队从技术理论到现场实际经验都慢慢趋于成熟。
随着国内数据中心市场的不断完善进步,数据中心建设方法论以及各项评价指标日趋完善,IDC厂商身份也逐步发生变化,即从由专业技术驱动的数据中心建设公司,转变成以“服务等级协议(SLA)”驱动的服务型公司。这种“以终为始”或者说“结果导向”的转变,大大提升了运维管理团队在建设的全生命周期中的地位。IDC厂商也有意识地让运维管理团队逐渐开始参与建设的前三个阶段,让运维管理团队将其运行经验融入到设计建造过程,以尽量减少未来交付或运行时的不便及隐患。由此可以看出,运维管理团队的“前置”过程,既是数据中心建设行业日益成熟的客观要求,也是技术发展带来的必然结果。
2 设计与运维之间不同的着眼点
IDC的业主们已逐渐认识到,让一支成熟的运维管理团队参与到规划设计当中是十分必要的事情,但随之而来的则是对规划设计团队提出的全新要求。主要体现在我国设计院体系自建立以来,设计团队在做规划设计时首先立足对全专业建设规范的满足,然后着眼于系统框架的搭建以及全专业整体性的稳定,对IDC行业来讲是更加注重系统的“可靠性”。而运维管理团队更多着眼于对各产品技术参数的深入挖掘以及系统运行之后管理维护的便利性、压榨系统潜力,即更加注重系统的“可用性”与“经济性”。故而,在设计阶段,运维管理团队往往会与设计团队在技术上展开较为激烈的讨论,主要集中于以下几方面。
(1)技术选择:先进性VS成熟性
得益于近年数据中心基础设施建设的大发展,国内乃至世界上许多知名设备厂商都将数据中心行业列为发展重点,不断开拓技术边界,并研发了新型的设备产品。在接受厂商对新技术、新产品的宣贯及推广之后,运维管理团队希望将这些新的技术理念融入到设计图纸之中,故而运维管理团队向设计团队提出最多的问题是,是否可以采用某项技术,以降低能耗,并提升运维效率。
在我国建设行业,设计团队一直扮演着技术权威的角色,同样也肩负着“设计终身负责制”的重要责任。因此,设计团队在技术的选择上首先会偏向于经过时间沉淀,并获得良好反馈的成熟技术或产品;而且,设计团队对技术的考量往往是多维度的,某一个专业的技术使用是需要全专业来配合的,所以在新技术的选择上也会更为慎重;此外,设计团队往往肩负着为业主提供高性价比方案的任务,当设计团队考量新技术时,也会考虑到新技术的经济效益,当新技术、新产品承诺在节能降耗方面有重大突破时,其初始投入或维护成本一般也是极高的。
(2)设计深度:反应结果VS深度规定
不只是数据中心建设领域,我国的工程建设领域发展至今,设计团队听到的最多质疑应该就是“设计深度不够”,造成质疑的因素有很多,限于篇幅笔者在这里只针对数据中心运维管理角度做一些简单的分析。
首先,数据中心建设行业作为工程建设领域的新兴方向,其从业人员行业来源不一,许多运维管理团队人员并无工程行业背景,虽然在某些专业系统经验较为丰富,但欠缺对工程建设行业框架的认识。造成了运维管理团队在参与设计规划阶段时认为,设计文件应该能够充分反映工程最终的结果,这才是施工图的真正含义所在。另一方面,正是由于数据中心建设领域从业人员行业背景不一,纵向比较建设各阶段参与方,设计团队的背景无疑是最值得信赖的,因此运维管理团队乃至业主更希望以设计团队为技术抓手,可以在技术上统筹各个阶段的参与方,从而对设计图纸的精细度也提出了更高的要求。
对于设计团队来说,图纸深度问题其实从未成为过困扰,根源在于我国建设工程五方责任主体框架形成以来,设计团队在执行建设部颁布的《建筑工程设计文件编制深度规定》基础上,各设计院都已基本形成了特点鲜明的设计传承及做图习惯。因此设计团队在面对运维管理团队或业主对于图纸深度的要求时,会有更为体系化、专业化的看法,但由于缺乏对设计文件乃至工程建设理解的共同基础,故而往往造成沟通不畅、互相推诿等现象。
3 从运维角度看设计存在的问题
虽然在技术选择与图纸深度等问题上,设计团队与运维管理团队各执一词,但运维管理团队的运行经验还是有诸多可借鉴之处,经过与运维管理团队、业主的沟通,笔者总结了一些项目上出现过的问题,供设计团队参考。
(1)工艺规划
无论新建或改造类数据中心,在初期工艺规划阶段,首先需考虑建筑、结构的条件是否满足要求(例如建筑的层高、轴距、防火分区、荷载、周边环境等),对于先天条件不好的改造类项目来说,往往意味着是否需要付出代价采用其他工艺技术来解决这些问题(例如需要降低架空地板高度或更好的气流组织、减少冷热通道间距或采用非标型号机柜以达到机柜数量要求、减少电池层数、采取消声降噪措施等)。
对于IDC机房,拆包区、备品备件间往往是应该重点考虑设置的,尤其对于一栋楼内多个客户的情况,需考虑设置多个备品备件间,而这些功能房间,设计团队有时会因为机柜数量要求而忽略掉。
走廊的宽度应根据项目情况结合运维能力、运维习惯设置,在满足新防排烟规范情况下,设计团队会考虑为满足机柜数量而将走廊做的过窄,但宽度过窄不利于管线的排布及运维人员的检修。
(2)机电系统
电气系统和空调系统是数据中心基础设施建设的核心,其建设费用一般会占据数据中心基础设施建设投资70%以上。因此,在数据中心近些年发展过程中,业主及运维管理团队对于机电系统的设计要求也不断提高。当运维管理团队参与到设计阶段中时,不仅希望设计团队能够提供“高可用性”的设计方案,并希望能够提供各设备详细的操作步骤,以作为运维管理团队制定标准操作程序(SOP)、标准维护程序(MOP)、应急操作流程(EOP)的基础。不止如此,国内数据中心常用认证机构Uptime Institute也开始要求在设计阶段充分考虑运维操作流程(在某项目做Uptime设计认证时曾遇到的审核意见是“希望提供SOP、MOP、EOP等运维管理文件”),以保证机电系统运行逻辑的合理性。
此外,运维管理团队要求的“高可用性”要求设计团队的专业设计师需具有丰富的数据中心现场经验以及对产品的深刻认识。例如对于电气系统而言,在一些实际项目案例中曾遇到,设计团队有时为满足布置需求,选择了300mm宽列头柜,但该尺寸列头柜难以在线维护也无法再做增容,从而提升了运维管理难度;或者对于某些无人值守机房,IT主进线断路器带有瞬时失压脱扣功能,当电网电压出现波动且欠缺自动重合闸功能时,则会造成在无人知晓情况下UPS长时间放电,最终给用户带来不必要的损失。
(3)智能化运维管理平台
业主及运维管理团队已充分认识到,一个好的智能化运维管理平台可大大减少运维人员的工作量,从而大幅度降低运维人员成本。按照正常的建设流程,等到智能化集成商进场时,数据中心整体建设已接近尾声,由于整体工期的受限,集成商难有时间对业主及运维管理团队的需求逐一深化落地,以致大部分项目上智能化管理平台集成度不高、使用不便。鉴于此,运维管理团队在介入设计阶段时,就会要求设计团队在设计阶段就考虑未来智能化管理平台的搭建,包括BMS系统点位表的细化、主要设备接口的协议、图形界面的显示内容乃至操作流程的逻辑都需纳入到图纸范围或者招标技术文件之中,而这些显然对设计团队的技术能力及服务能力提出了很高的要求。
4 结束语
目前来看,运维管理团队在整个建设生命周期中的“前置”已是大势所趋,这从客观上对设计方提出了新的要求,在实际项目中,由于双方着眼点及责任的不同,往往会伴随着反复的沟通甚至是博弈的过程。此外,运维前置与设计、后期分阶段的施工安装有着密切的联系,需要设计、运维、施工、管理等几个部门协调一致,怎么能保障数据中心后期的正常运行、运维团队的使用方便,协同努力是至关重要的。