APP下载

数据中心PUE值剖析案例研究

2012-07-17娄洁良

通信电源技术 2012年5期
关键词:包房机架工作效率

娄洁良

(中国电信上海公司信息网络部,上海200085)

0 引 言

绿色节能是数据中心的发展趋势,为了衡量数据中心的能源有效利用率,2007年2月非赢利的第三方机构绿色网格组织(GREEN GRID)提出了PUE(Power Usage Effectiveness)值的概念,并在业界予以推广。

PUE值被定义为:PUE=数据中心总功率/IT总功率。这是一个大于1的数值,因为数据中心总功率一方面包含了IT设备正常运行消耗的功率,另一方面还包含了为支持IT设备的正常运行,机房所配置的基础设施消耗的功率。PUE越低,意味着数据中心的节能效果越好。

从这个定义看,PUE的提出基于下列思路:IT设备的节能问题由设备厂商来解决。作为数据中心的建设和运营方,主要考虑机房基础设施层面的节能问题,即在不改变IT设备情况下,提高电能使用效率。

尽管从PUE的定义看,功率是某一时间点的概念,即PUE值只是某一特定工况下的能效指标,但业界普遍采用一段时间内的总电量和IT设备的耗电量之比来计算PUE值,可以近似等同于动态PUE值的算术平均,不失为一种务实可操作的方法。

1 对数据中心PUE值的剖析案例

上海地区某大型高等级数据中心(IDC)投产于2009年,建成后客户托管的服务器数量不断增加,但通过检测,其每月的平均PUE值一直徘徊在2.0以上,在同等规模的数据中心中相对偏高。为查明原因,在3月份笔者每天对数据中心各用电设备进行用电量测量,通过缩小用电量测量颗粒度,划小核算单元方法对大楼的耗电量构成进行分析,从而得出了若干结论和启示。

1.1 数据中心机房及基础设施状况

(1)数据中心主楼共四层,地下一层为变电所、油机房及消防钢瓶间,一层为UPS室,二层三层共四个数据机房,其中南北两侧各两个,每个机房面积均在1100 m2左右。两个北侧机房为常规机架布局,机架按“面对面,背靠备”方式排列;两个南侧机房均为VIP包房布局,机架按大客户要求安装在各自包房内,包房间相互隔离。

(2)对北侧机房供电的为12台400 kVA UPS,组成6个系统;对南侧机房供电的为16台300 kVA UPS,组成8个系统。

(3)四个机房内用于制冷的均为分体式风冷空调,每个北侧机房设置16台,每个南侧机房设置22台,每个机房均采用架空地板下送风方式。

1.2 PUE值的测试与统计

通过一个月的测试,统计汇总得到用电数据如表1所示。

通过对表1数据的分析,可以计算出数据中心3月份的平均PUE值为2.031,而大楼内电能损耗的构成及各耗能主体对大楼PUE值的贡献,如表2所示。

表1 3月份大楼各用电设备耗电量统计表

表2 3月份大楼电能损耗构成及耗能主体对PUE值贡献统计表

通过对表1和表2数据的分析,可以得出如下结论:

(1)除去IT设备用电,空调用电和UPS损耗在数据中心的电能构成中占比居前,两者之和占总能耗的44.88%,对PUE值的贡献已达0.912,难怪该数据中心的PUE值一直高于2.0。

(2)忽略机房前级的变配电系统损耗,以南侧及北侧机房为单元分别计算机房级的PUE值,可以得到:北侧机房的PUE值为1.726,其中空调对PUE值的贡献为0.594;南侧机房的PUE值为2.476,其中空调对PUE值的贡献为1.2。所以,正是由于南侧机房空调的高耗能,推高了南侧机房的PUE值,也因为南侧机房的高PUE值,推高了整个数据中心的PUE值。

(3)3月份为北侧机房供电的UPS设备平均工作效率为88.3%,为南侧机房供电的UPS设备平均工作效率为78.3%,都低于甚至远低于众多UPS设备厂家宣传的90%以上的数值。

(4)3月份变压器的平均工作效率为98.5%,应在正常的波动范围之内。数据中心内供电线路损耗、机房照明用电及公用区域用电也都在正常的波动范围之内。

1.3 高PUE值形成的原因

为了进一步查明推高数据中心PUE值的关键因素,笔者通过机房的实地调查,证实了南侧机房空调能耗大及UPS效率低的原因。

(1)南侧机房规划时因VIP客户有个性化的平面布局要求,采用包房方式,同时为了能回风通畅,包房间以通透的隔栅分隔。但由于不同包房间机架排列疏密各异,从机房整体看,机架排列未能形成冷热通道,往往一包房机架排出的热量为相邻包房机架吸入。从机架的种类看,既有数据中心运营者提供的机架,也有客户自带的机架,不同的机架进风方式各异,前进风下进风并存。正是上述两个原因造成了机房内气流组织紊乱,空调须将整个机房环境温度降下来才能冷却IT设备,从而大大增加了空调的能耗。另一方面,查验南侧机房的几十台空调,也未实行组网群控的运行功能。由于机房面积大,气流组织复杂,必然会在空调间产生竞争运行,增加冗余机组不必要的运行时间。

(2)从UPS负载率来看,为北侧机房供电的UPS设备负载率基本维持在单机容量的30%左右,而为南侧机房供电的UPS设备负载率极低,8套UPS的负载率及对应的工作效率如表3所示。

表3 为南侧机房供电的UPS负载率及效率统计表

从测得的数据看,UPS工作效率与其负载率有很大的关联度,特别是在轻载即负载低于10%时,工作效率明显降低。

2 从案例中得到的启示

从此次对数据中心PUE值剖析的案例中,得到以下启示:

(1)上海地区大型的数据中心,当采用集中设置的水冷冷水机组空调系统时,正常情况下春季的PUE值一般都在1.70以下。而案例中的数据中心,由于采用了风冷专用空调机组制冷,尽管北侧机房采用了地板下送风方式,机架间也形成了冷热通道,气流组织较为通畅,但PUE值仍达到了1.726,此值计算时还未将变配电的损耗及公用区域用电等计算在内。由此也印证了在机房面积达到数千平方米以上规模时,采用集中冷源的冷水空调系统要比分体式风冷空调节能。

(2)南北机房的PUE值相差悬殊,与机房内空调的送回风气流组织是否合理有很大关系。对比两机房的机架排列方式,可以看出,采用机架“面对面,背靠背”排列,有利于将冷热气流隔离,将冷量准确地送至IT设备,从而提高制冷的有效性和空调的能效比。

(3)出于对安全供电的考虑,在高等级数据中心内,UPS冗余度都比较大,另外数据中心IDC业务发展也总会经历负载逐步上升的过程,所以,UPS设备经常会处于轻载运行状态。从现有的行业规范看,YD/T1095-2008《通信用不间断电源要求》规定UPS设备满载时效率要达到90%以上,半载时效率要达到88%以上,但未对轻载时的效率作出规定。考虑到数据中心的运营现状,数据中心的建设者在UPS设备采购时更要关注其轻载时的效率。在本案例中,仅UPS设备自身的损耗在一个月内就达到了17万度,同时为了对其降温,还将花费相近数量的电费用于空调制冷。所以,提高UPS的效率对降低数据中心的运营费用有很大的影响。

(4)该数据中心IDC机架的销售部门在销售包房资源时主要以包房面积及包房内最大用电量进行定价,但由于各种原因,未能准确预测客户进驻时包房内服务器用电达到最大值的时间,而建设部门在建设时为南侧机房供电的UPS系统按机房的终期容量配置,结果造成在较长时间内按满容量配置的UPS处于轻载状态。在此种情况下,有必要在规划初期对UPS供电系统进行模块化设置,当负载逐渐增大时,适时增加UPS供电系统模块,即可满足需求。另外,随着模块化UPS技术的成熟,在配置UPS设备时,可选用模块化UPS,其中的功率模块可随负载的增减进行配置或启停。通过上述两种方式,既可降低一次性的建设投资,又可提高UPS的工作效率,从而减少运营费用。

(5)在对机房进行实地调查的同时,维护人员也在三月上旬开始对机房采取了一系列整改措施,主要是:根据负载的变化调整南侧机房空调开启的台数及位置;关闭空置的下进风机柜下部的挡风板;在前进风机柜未安装设备的空余处安装挡风板。从表4的测试数据看,上述措施有一定的效果。虽然由于南侧机房总体条件未发生变化,PUE值下降不明显,但足以证明,注重细节是推进节能减排工作的要素之一。

表4 不同时期大楼PUE值统计表

(6)有必要为数据中心建设其配套的能耗监测系统,以便随时掌握数据中心内的能耗分布。电量的采集颗粒度大小应能满足对数据中心能耗构成的准确分析,以指导数据中心节能措施的实施重点,并可评估节能技术的有效性和实用性。考虑到供电系统在数据中心投产后就无法停电,也就无法在其带电线路上或带电设备上安装计量电表及相应的互感器,所以能耗监测系统应与数据中心同步建设同步投产,以尽早发挥其效能。

3 结束语

PUE值作为衡量数据中心能源有效利用率的指标,有其现实的指导意义。数据中心的建设者和运营者,有必要对其进行深入的跟踪和分析,研究其下降的原因或过高的因素,来指导采取数据中心基础设施层面的节能措施,从而有效地提高能源利用率,降低运营成本。

猜你喜欢

包房机架工作效率
酒店长包房:老曲还需“新唱”
酒店长包房:老曲还需“新唱”
流程优化在提高神经外科手术室工作效率中的应用
别忽略它的存在!“意大利新一代架皇”BAS Accordeon(雅歌顿)XL4 2.0发烧机架
提高森林资源监测工作效率和实用性的探索
冷轧轧机动态变规格控制及应用研究
最多支持36块显卡 德国水冷品牌AlphaCool推出矿机机架
给足噱头 饱享口福
提高工作效率必须改掉的7种习惯
超大型环件轴向轧制组合机架受力分析