基于数据包络分析方法的数据中心能效评价
2015-05-03余长庚刘桂雄洪晓斌
余长庚,刘桂雄,洪晓斌
(华南理工大学机械与汽车工程学院,广东 广州 510640)
0 引 言
在大数据趋势驱动下,数据中心耗电量大幅上升,根据美国环保部(2007)的《服务器和数据中心能效机遇》报告,预计到2011年数据中心耗电量会超过 1000亿kW·h[1];2011年,我国数据中心总耗电量达700亿kW·h,约占全国用电量1.5%[2]。因此,数据中心能耗越来越受到国家政府、相关组织的密切关注[3-6],制定的数据中心能效相关标准、法规均被要求对其进行测试与监控[4]。美国环保部、能源部(2010)共同发起了 “国家数据中心能效信息项目”,而且ASHRAE、The Green Grid等8个数据中心专业协会召开了数据中心能效评价标准会议,确定数据中心能效标准的三大原则[5]。
国内数据中心能耗检测工作组(2012)编制的《数据中心能耗检测标准及实施细则》中,明确把电能利用率作为测量指标[6];工业和信息化部(2012)发布的《数据中心能效评测指南》[7],定义电能利用效率等多个关键能效评价指标。因此,数据中心能效评价研究在国内外都备受关注,必须采用多个指标综合来描述数据中心能耗,选用合适的多变量综合评价模型。
图1 数据中心机房能效评价指标模型
本文将数据包络分析方法 (data envelopment analysis,DEA)引入到数据中心的能效评价中,讨论DEA方法在数据中心能效评价的可行性,建立数据中心能效DEA评价模型与能效评价指标体系,并且在具体数据中心进行实例验证。
1 数据中心能效评价指标选择
图1为数据中心机房的能效评价指标模型,评价指标包括数据中心能源利用率、碳使用效率、能源生产效率等。
基于数据中心能耗构成,IT设备能耗PIT、制冷系统能耗Pcooling及其他方面能耗PQ(如照明、电源等)等直接影响PUE[8],而其他方面能耗PQ对数据中心来说基本是固定值。假设制冷系统的制冷量全部被IT设备利用,设制冷系统的能效比为1/k,则有:
可以看出,PUE值为能源利用率的综合指标,没有涉及性能、开销、绿色环保程度。
2 基于DEA方法的数据中心能效评价
DEA方法由美国运筹学家Charnes等(1978)提出,是一种用于评价相同类型对象有效性的非参数技术分析方法[9-11],它以相对效率为基础,把单指标投入/单指标产出的工程效率概念发展到多指标投入/多指标产出的决策单元(decision making units,DMU),是一种相对有效性评价方法。
DEA方法具有多输入/多输出有效性综合评价,不需要输出与输入之间的函数关系及决策单元相对有效性评价的特征,与数据中心能效评价所具有特征一致,可将数据中心看成是DEA模型的决策单元DMU,利用DEA评价模型求解数据中心的相对效率,进而通过相对效率排序得到数据中心能效情况。
设有 n 个数据中心机房 DMUk(k=1,2,…,n),DMUk的输入、输出指标分别为 xik≥0(i=1,2,…,m)和 yjk≥0(j=1,2,…,s),νi(i=1,2,…,m)表示第 i种输入的权,wj(j=1,2,…,s)代表第 j种输出的权。 根据工程能效概念,对每一个决策单元DMUk相对效率定义为加权平均输出与加权评价输入的比率,即:
为有效减少输入、输出指标主观赋权重对相对效率值的影响,文献[9]提出优化模型,以第k0个决策单元的相对效率为目标、以所有决策单元的相对效率为约束,所构建模型为
为从理论及实际意义上作深入分析,令λk表示相对于决策单元k0重新构造有效决策单元组合时,第k个决策单元的输入、输出指标的组合比例,θ表示该决策单元k0投入相对于产出的有效性系数,可建立如下对偶模型:
该模型最优解为λk、θ,θ反映决策单元相对效率。
数据包络分析DEA模型引入数据中心能效评价时,应正确选取与数据中心能效相关的输入、输出评价指标,选取的输入、输出指标应充分反映评价目标、分析者和管理者所关心的指标;对数据中心运行情况了解后,根据数据中心能效评价指标模型,将设备能耗种类和数量、机房建筑面积、运行有效负载等作为DEA模型的输入评价指标,可将数据中心PUE、DCeP等指标构成DEA模型的典型输出评价指标。实际使用时,根据DEA模型要求,对输入、输出的评价指标进行统一处理。
3 评价实例
本文选取4个不同地区的数据中心机房Center数据作为评价实例,此通信机房使用同种电力能源供电,其CUE指标值不考虑,收集数据为机房建筑面积S、服务器数目N1、服务器耗电量Ps、交换机耗电量Pw、基础设施耗电量Pc和传输数据量Ld等。
表1、表2分别为评价数据中心机房能效基本数据表和符合DEA模型的输入与输出项目表。根据DEA 模型对数据的要求,将 Ps、Pw、Pc等与 S、N1等有关量转化为与“效率因素”有关的量,从而形成符合DEA模型输入与输出的项目,总耗电量Ptotal=Ps+Pw+Pc;单位面积耗电量 M1=Ptotal/S(kW·h/m2);单位服务器耗电量M2=Ps/N1(kW·h/U);单位耗电量的传输DCeP=Ld/Pw(T/(kW·h))。
表1 评价数据中心机房能效基本数据
表2 符合DEA模型的输入与输出项目表
将输入、输出指标代入DEA模型,利用Matlab辅助完成数据计算,求出相对效率η,其计算结果如表3所示。通过比较数据中心机房能效的相对效率η,η值越高,则机房能效越好。
表3 相对效率η计算结果
由表3可以看出:1)Center-B的η=1,表明其能效相对最高;Center-C的η=0.7664,表明其能效最低;2)4个机房能效由高到低的排序为:Center-B、Center-A、Center-D、Center-C;3) 对通信机房来说,若简单以PUE指标来评价数据中心机房的能效,不考虑数据的传输量,则评价是不全面的。
4 结束语
1)基于DEA方法的能效评价方法具有较好科学性。评价时由样本数据确定生产前沿面,将决策单元与数据生产前沿面比较,排序相对效率,从而得到数据中心能效情况;因此能效评价过程中,输入和输出元素权重由数据产生,不是事先给定的权重系数,从而不受主观因素影响。
2)提出基于DEA模型方法的数据中心能效评价,其评价指标主要包括数据中心能源利用率PUE/DCiE、碳使用效率CUE、能源生产效率DCeP等,克服了数据中心机房PUE单一指标参数不可克服的局限性。
3)基于DEA的评价方法,可以推广到其他多因素的性能测试与评价方法中。
[1]U.S.Energy Information Admin.Annual Energy Review 2011[R].DOE/EIA-0384)(2011).Washington D C,2011:3-4.
[2]左向中.绿色云计算能效测评方法研究[J].中国测试,2013,39(2):43-46.
[3]刘桂雄,朱海兵,何若泉,等.电梯能效实时记录仪及系统研制[J].中国测试,2012,38(6):43-46.
[4]刘桂雄,叶季衡,肖若,等.冷却塔热力性能在线监测装置及系统研制[J].中国测试,2013,39(4):64-68.
[5]Data center industry leaders reach agreement on guiding principles for energy efficiency metrics[EB/OL].(2010-02-01)[2013-07-01].http:www.energystar.gov/ia/parners/prod_development/downloads/DataCenters_AgreementGuidingPrinciples.pdf.
[6]中国数据中心能耗检测工作组.数据中心能耗检测规范及实施细则[R].2012.
[7]云计算发展与政策论坛.数据中心能效测评指南(V1.0)[R].2012.
[8]朱明武.机房监控系统用户自定制技术研究与实现[D].广州:华南理工大学,2013.
[9]Charnes A,Cooper W W,Rhodes E.Measuring the efficiency of decision making units[J].European Journal of Operation Research,1978,2(6):429-444.
[10]Forsund F R,Sarafoglou N.On the origins of data envelopment analysis[J].Journal of Productivity Analysis,2002(17):207-224.
[11]Forsund F R,Sarafoglou N.The tale of two research communities:The diffusion of research on productive efficiency[J].International Journal of Production Economics,2005(98):17-40.