APP下载

基于数据挖掘方法的数据中心能耗与空调系统关键参数量化关系研究*

2021-06-23清华大学生态规划与绿色建筑教育部重点实验室生态规划与绿色建筑教育部重点实验室清华大学中国新型城镇化研究院清华大学生态规划与绿色建筑教育部重点实验室林波荣

暖通空调 2021年6期
关键词:冷水机组冷却塔能耗

清华大学 生态规划与绿色建筑教育部重点实验室 王 曼 生态规划与绿色建筑教育部重点实验室 清华大学中国新型城镇化研究院 黄 莉 清华大学 生态规划与绿色建筑教育部重点实验室 李 书 周 浩 林波荣

0 引言

2013年以来,中国互联网数据中心(IDC)产业进入高速发展阶段。伴随着IDC产业的迅速发展,国内数据中心的建设量和耗电量呈现逐年增加的态势,仅2016年一年,数据中心的耗电量就相当于三峡水电站一年的发电量[1]。因此,数据中心已成为全国的能耗大户之一,对其进行节能研究对我国节能降耗具有重要意义。

欧洲和北美地区开展数据中心节能研究起步较早。欧洲绿色网格组织提出的电能利用效率PUE(power usage effectiveness)指标是目前评价数据中心能效的最权威指标,PUE越接近1,则数据中心的能效越高。基于PUE指标,绿色网格组织和美国环境保护署分别提出了各自的能效分级[2]。为促进欧洲数据中心的节能降耗,欧盟行为准则设立了数据中心能效项目,收集了欧洲数据中心的能耗情况。经统计分析,截至2016年,加入该项目的268个欧洲数据中心PUE普遍分布在1.6~2.0范围内,其次为1.4~1.6。根据绿色网格的标准,普遍处于平均水平和高效水平之间。且其PUE平均值总体呈下降趋势,由2009年的1.87下降至2016年的1.64,欧洲数据中心能效有明显提升[3]。与欧美相比,国内目前尚未有详细完整的数据中心PUE数据调研情况。现有文献显示,国内数据中心的PUE大部分处于2.2~3.0及更高水平[4],与欧美还存在很大差距,国内数据中心节能潜力巨大。

目前,对于数据中心空调系统的节能研究主要集中在数据中心冷源或末端性能的开发或局部改造上,缺乏对数据中心的系统性优化。耿海波等人对昆明市某数据中心进行了封闭冷通道和新风自然冷却节能改造[5];冯潇潇提出了一种以间接蒸发冷却塔代替传统冷却塔的数据中心机房冷却系统[6]。研究方法也以模拟为主:Patankar使用CFD模拟方法研究了数据中心架空地板形式的末端气流组织[7];Fakhim等人对数据中心房间内各个机架处的温度进行了测试并在此基础上验证了温度场的模拟结果[8]。基于数据中心运维数据的节能研究相对较少,如美国劳伦斯伯克利实验室对22个运行中的数据中心进行了测试,分析了其空调系统形式,并对节能数据中心的设计提出了建议[9]。由于数据中心能耗数据量的庞大和各参数之间的相互耦合关系,使得从其中抽象出合理的数学模型并根据已有的工程经验公式对其能耗情况进行预测优化非常困难。传统研究方法在数据中心能耗研究问题上适用性不强。

数据挖掘是数据库知识发现的一个步骤,一般指从大量数据中通过算法搜索隐藏于其中的信息的过程。基于数据中心运行能耗和空调系统数据特性,引入数据挖掘方法对其进行研究可有效解决海量数据知识发现困难和参数耦合问题。

目前引入数据挖掘方法对数据中心能耗进行研究尚处于起步阶段。Gao建立了数据中心能耗管理的神经网络模型,实现了PUE预测误差仅为4%的精准预测,在此基础上进一步实现了PUE值的降低[10]。Li等人基于数据中心冷却系统的人为设定模型,提出了一种冷却系统端到端控制算法CCA,可实现11%的数据中心节能率[11]。但在文献[10]中,由于研究者暖通空调背景知识不足,在研究参数的选取上存在诸如同时出现空气湿球温度和空气比焓并列的参数耦合情况;文献[11]在研究方法上将数据中心各区域描述为单点热源,存在简化过度等问题,训练模型选用的参数也较少。因此,数据挖掘在数据中心节能控制中的应用还很不充分。

国内学者对于数据挖掘技术在建筑节能领域也进行了一定探索,如利用C4.5决策树分析寒冷地区居住建筑供暖能耗与建筑围护结构特性、供暖系统形式与房间位置的相关性[12];探索有监督和无监督2种模式下的深度学习算法在教育建筑冷负荷预测中的表现[13];利用随机森林对VRF系统进行故障诊断等[14]。但数据挖掘技术尚未应用在国内数据中心的空调系统节能研究中。

为对数据中心空调系统进行节能优化控制,使用Lasso回归和人工筛选2种方式筛选了进行数据中心能耗预测模型训练的参数。基于以上2种方法筛选的参数,使用XGBoost算法对北京某数据中心能耗和空调系统数据进行数据挖掘,实现了对该数据中心的PUE预测及空调系统对PUE的定量化影响相关性排序,以XGBoost的精确度检验数据挖掘方法是否适用于数据机房PUE预测参数筛选,为进一步实现数据中心节能优化控制提供依据。

1 研究方法

本文技术路线如图1所示。首先对数据中心空调系统运行现状进行调研,实现对数据中心运维情况的了解和研究数据的采集。进而对采集到的数据进行分析,进行基本的数据清洗。在此基础上进行数据挖掘研究,并对数据挖掘结果进行分析。

图1 研究技术路线

1.1 现状调研

现状调研主要通过实地调研进行,选取具备典型国内数据中心空调形式的北京某大型数据中心进行研究,采集其运行能耗及空调系统数据。

本文研究对象为北京汇天云端产业园14号楼数据中心机房,占地面积3 711 m2,总建筑面积20 271 m2,共10层。地下1层为动力设备层,布置冷水机房、2个变配电室和蓄冷罐间;地上6层为IT设备层,1层设置会议室、若干办公室、中控室和展示机房;其余楼层均为IT机柜机房。机房区总冷负荷12 083 kW,其中建筑负荷1 099 kW,IT负荷10 984 kW,设计冷水供/回水温度12 ℃/18 ℃。前室、新风系统总冷负荷1 298 kW。

数据主要来自数据中心监控系统自动记录的运行数据,在运维人员协助下获得了研究对象于2019年1月9日00:00至4月10日15:00的运行数据,共计31 299 878条,记录时间包含全年内的冬季和部分过渡季,系统自动记录时间间隔约为10 min,由于传感器自身原因略有时间误差,以下将基于这些数据进行能耗数据挖掘研究。由于数据中心未进行相关气象数据监测,考虑到研究对象距离北京首都国际机场较近,本次研究所使用的气象数据来源于网上下载的北京首都国际机场气象数据监测记录,记录时间间隔为30 min。

1.2 数据分析

基于采集到的数据中心能耗及空调系统数据,进行初步的数据清洗,筛选出进行数据挖掘的相关参数,排除冗余数据干扰。同时,完成不同参数的时间节点校对,使得其时间节点统一。在此基础上,对得到的各个参数进行描述性分析,了解数据的特点,从而对其适用的数据挖掘方法进行筛选。

本次共收集数据31 299 878条,每条数据有效信息仅包含时间戳和某一参数值2项。经过对数据进行研判,数据中包含大量与此次研究相关性不高的供配电系统参数,予以剔除。另因本次研究着眼于系统全局参数,尚未深入进行到对于各个设备和末端具体工况的分析,故在数据量中占比很高的各个设备的运行参数此次未进行相关挖掘。共筛选出604 186条数据中心全局控制数据用于研究。将以上各个参数处理后的结果进行汇总,使得单个时间戳可以对应多个参数在该时间点的运行参数后,共得到13 193个时间节点的数据,其中由于2019年1月18日至2月17日及3月份部分时间制冷装置的运行启停状态记录缺失,剔除坏值后,最终共得到7 593个有效时间记录点数据。时间跨度为2019年1月9日00:00至17日00:30、2月18日14:30至3月7日17:30、3月12日14:10至4月10日14:50,包含部分冬季和部分过渡季。每条时间记录点包含参数有:1) 室外气象参数(室外湿球温度);2) 功率类参数(IT设备有功功率、总有功功率、UPS功率、UPS功率损耗、动力功率、空调功率、其他功率);3) 空调系统参数(送风温度、回风温度、冷水温度、冷水泵运行台数、冷水机组运行台数、回风湿度、机房精密空调(CRAC)水阀开度、送回风温差、CRAC蒸发扇速度)。数据筛选及后续的数据挖掘过程均基于Python 3.7进行。

1.3 算法选择

基于数据清洗后的数据特点的分析,对比分析合适的计算机筛选参数的算法。用确定的计算机算法和人工筛选2种方法进行数据中心能耗预测的空调参数筛选工作,以2种方法得到的空调系统参数为输入参数,以PUE为输出参数,使用XGBoost算法训练数据中心能耗预测模型。

XGBoost是一套提升树可扩展的机器学习系统,其原理是基于多个弱分类决策树联合决策,在各数据挖掘大赛中有良好表现[15],性能甚至超过了一度应用广泛的神经网络算法。由于数据中心空调系统的复杂性,上述得到的空调系统参数可能存在共线关系。引入数据挖掘算法进行特征提取旨在通过算法排除耦合性较高的参数,选取有代表性的独立性参数,同时得到输入参数对PUE影响的相关性排序。为此,经文献调研初步选取了3种算法:岭回归、逻辑回归和Lasso回归。3种算法的特性比较见表1。

表1 适用回归方法对比[16]

逻辑回归算法由于一般应用于因变量仅有1或0(是或否)2种情况,所以常用来处理分类问题,不适用于连续值的拟合计算。岭回归和Lasso回归都可处理多元共线性变量对单变量的拟合问题,但岭回归仅会将无关项的相关系数降到较小值,无法彻底消除共线性和排除影响较小的参数。Lasso回归方法是一种压缩估计,它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些回归系数,即强制系数绝对值之和小于某个固定值。通过这种方法可将与因变量关系不大的自变量剔除,实现计算机自动筛选,局限性较小,可将无关项的相关系数压缩为0,从而突出较大影响参数。综合以上目标和算法特点,引入Lasso回归进行特征筛选。

1.4 结果分析

通过比较基于以上2种参数筛选方法得到的XGBoost数据中心能耗预测模型精度,检验计算机方法在数据中心能耗预测参数筛选中的可靠性。通过对计算机参数筛选方法中输出的空调系统参数对能耗的相关性排序及XGBoost算法生成的相关性排序进行比较,对比存在差异的原因,为进一步的研究工作提供参考。

2 研究结果

2.1 数据采集

由于数据中心已有数据记录系统的限制,未能全部采集所需参数,预期与实际得到的参数统计对比见表2。

2.2 数据分析

2.2.1数据清洗

实时PUE为总功率与IT功率之比,由PUE定义可知,功率项会对PUE预测产生很大影响,初步数据挖掘也印证了如上观点,故为排除多余功率项对PUE预测的干扰,体现空调系统参数对PUE的影响,后续数据挖掘中电力系统参数仅保留IT功率和实时PUE。由于该数据中心系统较为复杂,涉及设备众多,本文中的研究尚不涉及各台设备的具体工况,而着眼于整个系统,因此,各台设备的相关参数未作为模型训练选用参数。为了实现用一个参数体现更多信息的目的,在送风温度、回风温度和送回风温差3个耦合参数中选取送回风温差,室外气象参数选择湿球温度进行数据挖掘,最终得到进行数据挖掘的参数列项,见表3。

表2 所需参数与取得参数的对比

表3 数据挖掘参数列项

2.2.2描述性分析

对数据进行描述性分析,了解数据的整体情况,借助Python 3.7最终可得到各个参数的描述性分析结果,见表4。

表4 数据挖掘参数描述性统计

同时,各参数的概率密度分布如图2所示。由图2可见,部分变量不服从正态分布,故传统进行相关性分析的皮尔逊(Pearson)系数法不适用。

图2 输入参数概率密度分布曲线

2.3 数据挖掘

经过Lasso回归运算,表3中涉及的输入参数的Lasso回归系数如表5所示。经过Lasso回归筛选后,仅有5项参数被保留下来。以系数进行比较,5项参数对PUE的影响相关性排序为:回风相对湿度>CRAC水阀开度>冷水机组运行台数>室外湿球温度>IT设备功率。结合专业知识,人工选择特征参数见表6。

表5 Lasso回归得到的各参数回归系数

表6 人工筛选XGBoost训练参数

2.4 数据中心能耗预测模型训练

仅保留Lasso回归得到的5项参数,使用XGBoost进行PUE训练,最终可得预测方差为0.000 891 97,相对误差为0.015 08,方差和相对误差越小代表模型预测精度越高。预测PUE与实测PUE的对比如图3所示,XGBoost算法得到的参与模型训练的5项参数的特征重要性如图4所示。XGBoost是基于多个决策树联合决策的算法,其重要性分数衡量了特征在决策树构建中的价值。被用来构建决策树的某个属性越多,它的重要性就相对越高。图4中f0~f4分别代表室外湿球温度、IT设备功率、冷水机组运行台数、回风相对湿度、CRAC水阀开度,即XGBoost算法中得到的上述5项参数对PUE的影响相关性排序为:CRAC水阀开度>回风相对湿度>IT设备功率>室外湿球温度>冷水机组运行台数。对比Lasso系数得到的相关性排序,二者存在较大差异,且冷水机组运行台数在XGBoost训练中的权重相较其他4项参数占比很小,Lasso算法特征筛选结果未达到预期。

图3 Lasso算法5项参数预测PUE与实测PUE对比

图4 Lasso算法确定的5项参数在XGBoost 中输出的特征重要度

选用如上所述的人工筛选的输入参数在XGBoost进行PUE训练,最终可得预测方差为0.000 654 89,相对误差为0.012 94。人工参数筛选方法的预测PUE与实测PUE的对比如图5所示,XGBoost算法得到的参与模型训练的6项参数的特征重要度如图6所示,其中f0~f5分别代表室外湿球温度、IT设备功率、送回风温差、冷水机组运行台数、回风相对湿度、CRAC水阀开度,即XGBoost算法中得到的上述6项参数对PUE的影响相关性排序为:CRAC水阀开度>回风相对湿度>送回风温差>室外湿球温度>IT设备功率>冷水机组运行台数。

图5 人工筛选6项参数PUE预测值与实测值对比

图6 人工筛选6项参数在XGBoost中输出的特征重要度

2.5 对比分析

Lasso回归算法与其对应的XGBoost算法得到的输入参数对PUE的影响排序存在差异的原因可能是算法自身的差异。Lasso回归得到的系数仍然是基于线性回归逻辑生成的,XGBoost算法则是基于多个决策树联合决策形成的非线性模型。且此次使用Python自带的Lasso回归算法包为Lasso回归系列中最基础的版本,其默认每个维度上的特征权重都有相同的正则化系数,算法自身也存在局限性。寻找更具有代表性的输入参数筛选算法很有必要。

与完全使用Lasso算法得到的5项参数训练的XGBoost算法相比,人工筛选的6项参数训练得到的模型方差更小,精确度更高。但对比Lasso算法得到的5项参数和人工筛选得到的6项参数列项,可见2种筛选方法得到的输入参数非常类似,差别仅存在于送回风温差一项。因此,Lasso回归得到的XGBoost模型输入参数仍具有一定的参考意义,在后续研究中输入参数较多难以进行人工筛选的情况下,使用Lasso回归可为输入参数的确定提供参考,结合专业背景知识进行判别可得到较理想的预测模型训练参数。

2.6 数据挖掘结果与估算方法对比

实时PUE定义为数据中心总功率与IT功率之比,如式(1)所示:

(1)

式中Pt为数据中心总功率,包含IT功率PIT、照明系统功率PL、UPS供配电系统功率PUPS和空调系统功率PAC。

PL在一定时间内变化不大,PIT在服务器访问量基本不变的情况下变化极小,PUPS与PIT相关性较高,PIT基本不变时其也保持基本不变,故这3项在一定时间内可作为常量进行处理。设

(2)

(3)

则式(1)可转化为

PUE=1+α+βPAC

(4)

PAC包含制冷站能耗、输配系统能耗和末端系统能耗,制冷站能耗又包含冷却塔能耗∑P′CL、冷却水泵能耗∑P′CT和冷水机组能耗∑P′C,输配系统能耗主要包含冷水泵能耗∑P′CW,末端系统能耗包含机房精密空调能耗∑P′CRAC、除湿机或加湿机能耗∑P′H、新风机能耗∑P′MAU。故式(4)可转化为

PUE=1+α+β(∑P′CL+∑P′C+∑P′CT+

∑P′CW+∑P′CRAC+∑P′MAU+∑P′H)

(5)

冷水机组能耗、除湿机或加湿机能耗、新风机能耗可根据设备COP进行计算,冷却塔能耗、水泵能耗和精密空调能耗可根据风机和水泵的相似率进行计算。结合项目情况,同类型的多组设备采用完全相同的配置,且各个机组间相互独立。设数据中心室内显热负荷为Q,新风冷负荷为q,室内湿负荷为W,新风湿负荷为w,则式(5)可转化为

(6)

式中PCL为冷却塔额定能耗;VCLi为第i台冷却塔的实际流量;VCLr为冷却塔的额定流量;Qi为第i台冷水机组承担的显热负荷;COPC为冷水机组的额定COP;PCT为冷却水泵的额定能耗;VCTi为第i台冷却水泵的实际流量;VCTr为冷却水泵的额定流量;PCW为冷水泵额定能耗;VCWi为第i台冷水泵的实际流量;VCWr为冷水泵的额定流量;PCRAC为机房精密空调的额定能耗;VCRACi为第i台机房精密空调的实际送风量;VCRACr为机房精密空调的额定送风量;qi为第i台新风机的新风冷负荷;wi为第i台新风机的新风湿负荷;Wi为第i台除湿机或加湿机所承担的湿负荷;COPH为除湿机或加湿机的额定COP。

由于设备额定功率和额定流量为定值,故冷却塔能耗、水泵能耗和精密空调能耗主要受其实际流量影响。而实际流量与各设备的供回水、送回风温度密切相关,设某设备能耗与其额定流量的三次幂之比为一常数,单台冷却塔和冷却水泵所承担的热负荷为Q′i,单台冷却塔单位质量流量空气的全热交换量为ri,则式(6)可以进一步转化为

(7)

式中γCL为冷却塔能耗与其额定流量的三次幂之比;γCT为冷却水泵能耗与其额定流量的三次幂之比;TCTr为冷却水回水温度;TCTs为冷却水供水温度;γCW为冷水泵能耗与其额定流量的三次幂之比;TCWr为冷水回水温度;TCWs为冷水供水温度;γCRAC为机房精密空调风扇能耗与其额定送风量的三次幂之比;Tar为机房精密空调回风温度;Tas为机房精密空调送风温度。

仅从式(6)、(7)的结果来看,PUE所受的影响因素较多。在本研究对象中,为实现室内温湿度的精密控制,采用温湿度独立控制方式,末端CRAC数量和湿膜加湿器数量要远多于冷水机组、冷却塔和水泵数量,故在XGBoost模型训练过程中,与CRAC较为相关的CRAC水阀开度、送回风温差及与加湿器较为相关的回风湿度这3个参数在XGBoost模型训练中对PUE的影响相关性较高。在与制冷站相关的其他3个参数中,室外湿球温度将极大地影响冷却塔自然冷却的效果,即会影响其单位质量流量空气的全热交换量,室外湿球温度越低,则冷却塔所需空气流量越小,冷却塔风机能耗越小;同时,室外湿球温度越低,自然冷却可以制得的冷水的温度越低,冷水机组的出力越小。而IT功率在数据采集时间段内波动较小,冷水机组运行台数在一定时间内基本保持不变,且为一离散值,对连续值的PUE影响不明显,故这2项在XGBoost得出的PUE影响因素相关性排序中占比最小。

因此,数据挖掘得出的PUE影响因素相关性排序与式(6)、(7)相一致,数据挖掘结果具有可信度。且由于式(6)、(7)涉及参数较多,单纯使用传统的敏感性分析方法很难得到较为准确的PUE影响因素相关性大小,故可在进一步研究中引入更多的空调系统参数,使用数据挖掘方法分析其对PUE的影响程度。

3 结论

1) 基于对数据的描述性分析可见,数据中心的运维实测数据并非都遵循正态分布,不适宜采用传统的皮尔逊系数法探究其与PUE的相关性关系。

2) Lasso回归和XGBoost模型训练得到的输入参数对于PUE的相关性排序不一致,这可能是由于2种算法的原理不同及Lasso回归自身的局限性造成的。

3) 人工筛选的6项参数在XGBoost中进行训练后,得到的PUE预测模型方差仅为0.000 654 89,与实测PUE吻合度较好,使用XGBoost算法对数据中心PUE进行预测较为可行。

4) Lasso回归确定的5项输入参数在XGBoost中的训练精确度不及人工筛选的6项参数高,但二者基本一致,Lasso回归在参数较多时仍可作为排除参数共线性、确定独立变量的有效手段。在下一步的研究工作中,可搜寻更可靠的输入参数筛选方法替代Lasso回归,从而实现输入参数的高效筛选,进而提高数据挖掘结果的准确性。由于当前我国数据中心基础数据相对不全,本研究所用数据尚不能涵盖全年特性。未来还可在进一步完善数据源的基础上,采用更多数据中心全年的更多数据,沿用上述方法分析,为完善基于数据挖掘方法优化数据中心运行节能控制策略提供参考。

猜你喜欢

冷水机组冷却塔能耗
基于物联网的冷水机组节能与安全分析
中央空调系统冷水机组优化控制策略研究
120t转炉降低工序能耗生产实践
冷却塔若干设计问题总结
能耗双控下,涨价潮再度来袭!
基于工程案例探析鼓风式冷却塔在地铁工程中的应用
探讨如何设计零能耗住宅
冷却塔性能研究与升级改造
环保节水型冷却塔的探究
多台冷水机组联合运行优化控制策略