“麦当劳”式数据中心建设实践
2009-02-24霍光
霍光
中小型数据中心麻雀虽小,五脏俱全,建设复杂度几乎接近于大型数据中心。中小型数据中心用户要么面对与建设大型数据中心一样的漫长工期,要么就只好选择降低标准,却埋下了诸多隐患,以机柜群组为模块的快餐式数据中心也许能解决这一难题。
某家企业需要建一个面积为50平方米的小型机房,却发现建设过程异常复杂,单是前期设计就反复修改了多次。最终敲定设计时,两三个月已经过去了,而到机房最终建好,可能需要花费半年甚至更长时间。实际上,建设一个50平方米的小型机房,与建设几百平方米甚至上千平方米的数据中心相比,虽然规模小了很多,但要考虑的问题并没有减少。
“要改变这一现状有两个关键,预订制化和模块化。”世纪互联工程技术服务有限公司(BANYANO)副总裁沈卫东说。在加入世纪互联之前,他曾长期从事国内数据中心基础设施的技术应用和市场研究工作,并于2008年2月牵头成立了中科仙络信息化节能技术研究所数据中心新技术体验中心暨信息化节能实验室(现更名为BANYANO数据中心新技术体验中心暨信息化节能实验室)。沈卫东认为,传统的机房建设方式在不断发展的用户需求面前已经显出疲态,机房建设领域需要一个新的变革。
从餐馆到麦当劳
“我多少年来一直在想,能否改变现有的机房建设模式。”沈卫东在接受记者采访时表示,一直困扰中小数据中心建设的问题,就是缺乏一种更加容易的、适应中小数据中心建设的模式。
“建设一个面积为几百平方米的机房,花费七八个月时间,用户觉得还可以接受。但是,建设一个50平方米的机房,也要投入七八个月时间,用户就觉得难以接受了。于是用户更多地选择了降低标准。”沈卫东举例说。另一方面,由于中小机房建设规模较小,一些大厂商往往不愿投入过多精力,并且用户付出的成本也较高;而承接中小机房建设的供应商往往本身设计实力有限,也限制了中小机房的建设水平。“过去几年我走访过很多中小型机房,几乎没有一次验收通过的。” 沈卫东说。
实施过程中,用户也面临着几个问题。首先,就是供应商过多,不同的供应商同时进场,给设备的安装调试带来很大麻烦,同时,供应商的设备并未根据现场的实际情况来设置,很多工作都要在现场进行,现场工程师的安装水平参差不齐使得实际的安装效果也不能保证。“就像顾客遇到一个好的厨师,就能吃到一盘好菜;但遇到手艺差的厨师,饭菜的水平就难以保证了”。
如果以就餐来比喻中小机房的用户,实际上他们需要的并不是多丰盛的饭菜,而是要填饱肚子。他们要求的是卫生条件(可靠性)合格、就餐时间(实施时间)短。而麦当劳具备的统一的流程,标准化的有限选项刚好适合了他们的这种需求。在这方面,被施耐德收购的APC公司曾经做出很好的尝试。现在, APC的InfraStruXure(英飞集成系统)就是一个采用标准化的系统结构、使用标准化的预装配组件的完整的数据中心电力基础设施构建体系。
从这一点出发,沈卫东归纳出了建设中小机房的一套思路:“先要有一套菜单体系,用户可以根据自己的需求来选择具体模块,组合成最终方案。同时,要有一套标准化的产品体系,可以快速地将用户的选择提供给用户。实际上,就是将建设工程产品化。”这一方面,国外正在兴起的集装箱数据中心提供了借鉴。
将数据中心装入集装箱
2008年,一种新的机房建设模式开始在国外兴起,那就是集装箱式机房。2008年9月,微软耗资5.5亿美元在德克萨斯州新建的数据中心就采用了这一模式。之前,微软在芝加哥等地已经进行了类似的尝试。
集装箱机房的概念最早由Sun在2006年提出,将服务器、存储以及配套的制冷设备等产品规划进一个集装箱当中,客户只要插上电源就可以使用。集装箱机房可以达到传统数据中心很难达到的高密度。2008年7月,惠普推出了集装箱解决方案Performance Optimized Data Center(POD)。惠普可扩展计算和基础架构部门主管Steve Cumings表示,POD的每平方英尺大约需要1800W,而一般数据中心的这一数字仅为250W。
集装箱机房还具有很好的可扩展性,并能大幅度节省建设成本和时间。用户不必建立一个配置完善的建筑物来存放它,而仅需要一块平整的空地,当需要扩容时,只需要再增加一个新的集装箱即可。同时,它已经由供应商配置完毕,用户可以即插即用,整个建设周期可以被缩短到2~3个月。
但是,集装箱式机房也受到了一些质疑。IBM全球技术服务副总裁Steve Sams曾表示:“虽然IBM是模块化数据中心的坚定支持者,但我们对基于集装箱式数据中心的支持则有一定的保留。”质疑者认为,在集装箱的模式下,用户受到很多限制,设备的更换也受到限制,用户要面对丧失灵活性的问题。
将机柜群组模块产品化
传统的建设方式需要改进,而集装箱机房又过于激进。世纪互联正在探索一条更为适合中小机房建设的道路。“争取把尽量多的工作从施工现场转移到工厂,利用工厂成熟的质量管理和检测检验设施来控制施工质量,尽量使现场的实施工作仅仅是简单连接,从而最大限度地降低设备在施工现场安装的技术难度和工作量,减少现场环境、工作条件、人员技术水平的离散性带来的工程质量的离散性。”沈卫东表示,这就是世纪互联目前提倡的“施工标准”或“工程产品化”。
从这一思路出发,世纪互联针对机房的模块化和标准化进行了一系列研究。在模块的大小方面,沈卫东认为,针对中小型数据中心,惠普POD模式中的机柜群组或集装箱就显得有些“过大”。因此,世纪互联目前已经将机柜群组锁定为两排机柜所组成的一个冷通道封闭系统。
“我们研究了空气调节子系统和监控子系统,发现传统的机房级送风、全机房监控的模式存在很多问题。”沈卫东表示,传统的集中配冷方式已经过时了。但是,如果针对一个机柜进行制冷,又会遇到冗余度不够的问题,当制冷设备损坏或失效时,对应的机柜就无法正常工作。
世纪互联目前的机柜群组采用了冷热空气隔离技术,两排面对面的机柜组成了一个冷通道隔离系统,空调产生的冷空气注入机柜通道,被服务器吸入后,从服务器后方排出系统。这样的封闭系统有效地解决了传统模式下送风方式中空气的不规则流动造成的局部热点问题。同时,一个群组内的几台空调机又起到了互为冗余的作用,提高了系统可用性。
监控子系统方面,每一个群组中,世纪互联都设计了具体到每个机柜的监控系统,每个机柜温度、功耗等工作状况都将被显示在列头控制柜上的显示屏中。整个群组可以根据具体情况来关闭或打开一定数量的空调,以实现对节省能源的部分自动化。不过,目前的空调机缺乏统一的控制接口,如果将来增加这一接口,就能实现更高程度的自动化。
在提高密度方面,世纪互联的机房群组模式也具备优秀的表现。据沈文东介绍,在世纪互联的设计下,机柜的功率密度较传统方式可提高3倍,一个占地十几平方米的机柜群组就可以达到普通50平方米机房的效果。有趣的是,在世纪互联的设计中,机架、空调和供电都采用了不同颜色来区分。其中,机架被设计成鲜明的黄色。沈卫东介绍道,在机房建设标准中涉及照度的指标,由于黄色的反射率比黑色高许多,机架设计成黄色可以提高照度,减少照明所需的功耗。