集群控制在数据中心风冷空调中的应用
2021-12-02上海互联网应急中心高福义姚钦锋吴潇婷南京佳力图机房环境技术有限公司李远见吴亭柯
上海互联网应急中心 高福义 姚钦锋 鄢 然 王 慧 吴潇婷南京佳力图机房环境技术有限公司 李远见 吴亭柯 朱 帅
0 引言
风冷直膨型精密空调是目前数据中心机房应用最成熟也最广泛的制冷方式,具有系统简单、运维方便、故障率低、灵活配置等多种优势。
现行数据中心制冷设计之初都有冗余配置,在使用过程中IT负载却远未达到设计标准,加之运维管理水平不高,机房过量制冷、气流旁通、气流再循环等情况十分常见。气流旁通是指从IT设备旁通的冷气流直接返回空调,造成散热气流浪费,空调进出口温差降低,制冷效率变差;气流再循环是指被加热的空气没有返回空调回风口,而是重新进入机柜内部形成再循环气流,导致设备入口温度升高,设备可用性降低。此外,一般机房内的风冷直膨型精密空调多采用独立制冷的模式,不同区域由不同空调制冷,彼此之间互为独立且缺乏通信,常出现一部分空调在冷却除湿、另一部分空调却在加热加湿的情况。粗放的管理方式、不合理的运行机制,这些都严重影响了空调的制冷效率,造成资源的大量浪费。
本文以一个独立机房区域为研究对象,从机房制冷系统性整体出发,借助CFD仿真手段,以空调集群控制为突破口,通过优化气流组织,降低风机工作时长,降低压缩机启停频率,探索出了一种适用于传统风冷直膨型精密空调机房的高效运行方法。
1 M区能耗分析
1.1 M区简介
M区机房为屏蔽机房,面积约320 m2,高架地板至天花板3 m、至底部0.4 m。机房内设有4条隔离冷通道,内装100套单台设计功率7 kW的机柜,配置10台额定制冷量为90 kW的风冷精密空调,采用格栅地板风口地下送风方式,开孔率大于40%,机房上部是无组织回风,机房布置如图1所示。
图1 M区机房平面图
1.2 空调设备
M区共计10台ME系列空调(K01~K10),每台空调额定制冷量90 kW,送风量23 200 m3/h,7列机柜(A、B、C、D、E、F、G)和4个冷通道(A列、BC列、DE列和FG列)。如图2所示,每台空调只有1个回风温度传感器,位于空调上部回风口处。
图2 M区机房立体图
1.3 M区主要设施能耗统计
为了方便测算空调实际负载,以及最终冷量的区域控制,根据空调位置和送风情况,将机房热源分为10个区域,表1列出了各区域机柜功率情况。从表1可以看出,虽然IT设施设计功率为700 kW,但实际功率只有328.9 kW,负载率只有47.0%。总体来看,存在制冷量过量的情况。
2 集群控制准备
表1 M区机柜功率分布情况
2.1 探测器布设与分区
除去配电柜、无源机柜和低功率机柜,每个机柜热回风顶部布设1个温度探头,按照空调送风路径,大致划分为10个区域,区域划分参考表1。每个分区内有温度采集模块,每个模块下连8个温度探头、上连PLC控制器,PLC控制器输出端与10台空调控制主板通过继电器相连。每个模块向上输出8个探头温度数据及其平均值,共计9个数据。集群控制探测器布设如图3所示。
图3 集群控制探测器布设
2.2 控制原理
PLC控制器以温度采集模块的平均值为主要参考依据,工作模式如下:首先进行一次判定,当采集到的平均值高于设定值时,控制器会向对应区域的空调发送供电信号,否则发送断电或不供电信号。被供电的空调机组通电后,风机自动开启,加速该区域空气流动,同时进行二次判定,若回风侧温度高于设定值,则开启压缩机进行制冷,若回风侧温度低于或等于设定值,则只开启风机。集群控制判定机制如图4所示。
图4 集群控制判定机制
由于一次判定主要参考数据是温度模块平均值,为避免出现热区奇点的安全隐患,还设置了安全机制,即当某奇点(8个点中的1个)温度值高于平均值一定范围(安全区间)后,即便平均值没有达到设定值,控制器依然会向对应区域空调发送供电信号,随后由空调机组进行送风和二次判定。
3 集群控制调试
调试实施前,借助CFD仿真软件对现行机房气流组织进行了模拟,针对模拟发现的问题,对冷通道存在的气流旁通、泄漏情况进行了封堵优化。对10台空调的风量进行了测试,经测算风量供给远大于需求。对此过程不做重点描述。
3.1 安全性测试
为了保证集群控制系统平稳运行,对群控运行安全性及稳定性做如下测试。
1) 模拟PLC控制器断电产生的影响。经过多次反复验证,PLC控制器断电后,原本开机的空调并未受到任何影响,其他空调全部自动开启。
2) 模拟机房切电、消防断电产生的影响。经过消防测试验证,在接收到消防断电信号后,空调机组和PLC控制器均会断电。在恢复送电后,PLC控制器重启,由于设有延迟等待时间,在等待时间内,PLC控制器不下发任何控制指令,空调机组将按照通电自启设置全部打开,延迟等待时间结束后,PLC控制器将根据现场状况进行控制。
3) 集群控制温度稳定性测试。在热源侧温度下降后,集群控制系统空调压缩机停机正常;在平均温度上升后,空调开启正常。整体测试期间,机房环境没有温度跃变情况,机房环境温度变化稳定。
3.2 边界条件的选择
3.2.1测试前准备
1) 调整风量。
为避免空调停机后机房风量不足的情况发生,将10台空调额定风量调整为100%,保证机房整体风量充足。
2) 空调回风温度设定。
对各空调的回风温度设定值进行统一调整,将工作温度设置为22 ℃,加减载温度回差设置为2 ℃,即空调工作温度区间为20~24 ℃。
3) 安全限值。
本文所有测试均以热通道温度30 ℃为温度上限,通过超限启动温差值变化来确保热通道温度在安全限值内。在此基础上开展了如图5所示的3轮测试。
图5 集群控制边界限值测试
3.2.2第1轮测试
集群控制温度设定为24 ℃。空调本身工作设定值是22 ℃,加减载温度回差设置为2 ℃,超限启动温差为6 ℃。观测结果:空调全部开启,控制器没有发出控制指令。
将加减载温度回差调整为1 ℃,其他参数不变。观测结果:空调停机数为1~2台,但压缩机启停频繁;温度采集模块平均温度在23~26 ℃区间波动。
2.2.3第2轮测试
集群控制温度设定为25 ℃,加减载温度回差设置为2 ℃,超限启动温差为5 ℃。观测结果:空调停机数稳定在2台,温度采集模块平均温度在24~27 ℃区间波动。
将加减载温度回差调整为1 ℃,其他参数不变。观测结果:空调停机数为2~3台,温度采集模块平均温度在25~28 ℃间波动。
3.2.4第3轮测试
集群控制温度设定为26 ℃,加减载温度回差设置为2 ℃,超限启动温差为4 ℃。观测结果:空调停机数稳定在3台,温度采集模块平均温度在26~28 ℃区间波动。
将加减载温度回差调整为1 ℃,其他参数不变。观测结果:空调停机数稳定在4台,温度采集模块平均温度在27~30 ℃区间波动。
该轮测试,热通道温度已接近安全限值,故不再继续进行下探测试。
3.2.5奇点的处理
虽然将安全限值设置为30 ℃,但经过前几轮测试,发现部分位置存在奇点情况,通过采取以下3类措施缓解这个情况。
1) 优化气流组织。
调整送风地板开孔率,避免出现过量送风或送风不足情况;合理设置气流组织路径,采用新型封堵盲板[2]对机柜侧边布线及封堵进行了优化,减少或避免气流旁通。
2) 加强供冷。
将奇点所在位置对应的空调设定温度调低,适当降低奇点区域的空调送风温度来加强冷量供应。
3) 舍弃。
部分奇点温度虽然高于30 ℃,但跟踪观察没有持续升高的现象,允许该情况出现。
4 集群控制效果
4.1 节能效果
表2为第3轮测试条件下14 d的空调能耗数据,在此期间IT设施能耗基本不变。第6日起,将空调全部打开,第12日起开始恢复集群控制。
取前5日(即第1~5日)和后2日(即第13、14日)数据作为开启空调集群控制时的每日能耗,其平均值为3 346.1 kW·h。取中间5日(即第7~11日)数据作为关闭空调集群控制时的每日能耗,集群控制平均值为3 877.8 kW·h。集群控制节能率为(3 877.8-3 346.1) kW·h÷3 346.1 kW·h×100%=15.9%。
表2 M区14 d空调耗电量 kW·h
4.2 节能分析
第4.1节分析了第3轮条件下14 d中M区能耗曲线,为更充分论证M区实际节能情况,选择了N区与M区能耗进行类比。N区与M区情况较为相似,均采用相同空调制冷机组,IT负载也较接近。图6为M区和N区1月1日至7月25日的能耗曲线图,可以明显看出两区能耗趋势非常相似。根据M区调试情况,将曲线分为3个阶段(1月1日至3月28日,3月29日至5月1日,5月2日至7月25日)。其中第1阶段为M区采用传统控制方式运行阶段,第2阶段为M区开启集群控制调试阶段,第3阶段为M区开启集群控制的稳定阶段,N区整个过程均采用传统的机组全开模式运行。使用MATLAB对M区节能效果进行分析。
图6 M区和N区能耗曲线
从图6可以看出,3月28日M区能耗为阶段顶峰,3月29日开始进行群控测试后能耗出现明显下滑。
1) 第1阶段。
对第1阶段(1月1日至3月28日)数据进行了比较拟合,如图7所示。发现在N区上移863 kW·h(平均值差)后,M区和N区在该阶段能耗基本相同。图8显示了N区能耗曲线上移863 kW·h(平均值差)后与M区的能耗曲线对比。上移后N区能耗超过了M区。
图7 N区能耗上移863 kW·h(平均值差)第1阶段曲线
图8 N区能耗上移863 kW·h(平均值差)曲线
2) 第2阶段。
第2阶段3月29日开始,至5月1日,为群控调试阶段。图9为此阶段M区和N区能耗曲线图。4.1节表2中的第1日即为4月11日,4月11—15日开启群控,4月16日开始退出群控,4月22日开始重启群控。可以明显看出,退出群控期间,M区能耗有大幅回升。
图9 M区和N区第2阶段空调能耗曲线
3) 第3阶段。
图10为第3阶段(5月2日至7月25日)能耗曲线图,可以发现两区域能耗曲线高度相似,此部分M区能耗高于N区,平均差值为167 kW·h。图11为N区能耗上移167 kW·h(平均值差)曲线图。
图10 M区和N区空调能耗第3阶段曲线
图11 N区空调能耗上移167 kW·h(平均值差)第3阶段曲线
按第3阶段M区能耗平均值(3 607 kW·h)估算,其节能率约为:(863-167) kW·h÷[3 607+(863-167)] kW·h×100%=16.2%。据此估算,M区空调年可节约超过25万kW·h的电能。
实际上,由于M区能耗整体高于N区(约为N区的1.2倍),按照比例来看,M区实际节能效果可能要更好。
4.3 系统稳定性
本测试对控制系统的稳定性进行了测试。在第12日10:00开启集群控制后,对集群控制情况进行统计。在经历了5 h调整稳定后,集群控制开关机台数稳定在关闭4台的状态。待稳定后,又持续观察了7天,统计结果如表3所示。
5 结论
本文所述的方法,在采用风冷直膨型精密空调的机房中具有普遍适用性,它改善了原有机房空调独立制冷所带来的各种低效的状况,采用系统性集群控制的方式,实现了机房节能高效运行。
表3 集群控制自动调节情况
1) 通过数据分析表明,在本文测试环境下,开启空调集群控制至少可实现节能16.2%的效果。
2) 本文所述的集群控制系统稳定性较高,5 h就可以实现集群控制环境的稳定,并且可以保持长期稳定运行。
3) 本文所进行的测试,对环境的安全边界作了明确规定,随着信息系统设备性能的提升,机房允许的热湿环境空间变大,节能效率将会进一步提高。