探索存量数据中心空调系统基于AI应用的最佳工作方式
2023-01-31穆婷婷
穆婷婷
(国家计算机网络应急技术处理协调中心重庆分中心,重庆 401120)
0 引 言
随着信息技术与人们的生产生活交汇融合,互联网快速普及,以虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、扩展现实(eXtended Reality,XR)为代表的技术快速发展,在此基础上发展形成的元宇宙将是下一个算力消耗大户。元宇宙接入人们的各种器官,如实现脑机互联,将新增海量的算力和存储需求,而这一切的变迁依赖于数据中心的大规模发展。
数据中心是信息基础设施中的能耗大户,国家能源局数据显示,2020年我国数据中心耗电量突破2 000亿kW·h,创历史新高,能耗占全国总用电量的2.7%。随着数据中心的进一步发展,加速能源消耗和相应的碳排放,从而对节能减排产生不利影响。在追求数据中心收益最大化的同时,也要实现能源消耗和碳排放的最小化,达到数据中心与节能减排的双赢。
通过与数据中心多维度运行参数结合(负载率、环境温度、机架温度、供回水水温及温差等),挖掘节能降耗价值点,就如何低成本、精细化降低数据中心空调系统能耗、降低运营成本以及构建绿色运营的数据中心进行研究,并提出相关解决思路[1]。
1 数据中心能耗分析与控制
目前,全国数据中心所处的气候区域主要有夏热冬冷区域、夏热冬暖区域、温和区域、寒冷区域以及严寒区域,本文主要对夏热冬冷区域的数据中心进行分析。对前期建设的中国西南地区某数据中心电源使用效率(Power Usage Effectiveness,PUE)进行研究分析,2021年PUE为1.40。为了挖掘节能价值点,进一步对该数据中心的能耗进行分析[2]。
数据中心能耗由两部分组成,分别是互联网技术(Internet Technology,IT)设备能耗、数据中心基础保障设施能耗。其中,基础保障设施耗能包括供配电系统能耗、不间断电源系统能耗、空调制冷系统能耗、机房照明及其他设施能耗等。空调制冷系统由冷机、水泵、冷却塔风机以及机房末端空调等设备组成[3]。
通过对设备的能耗进行统计,得出数据中心各系统的能耗占比如图1所示。
图1 数据中心能耗组成
由图1可知,空调系统占比为19%,精准管控空调制冷系统运行模式亟待解决。
数据中心通常采用板式换热器串联冷水机组的制冷方式,以西南地区某数据中心为例,冷冻水温度设置为15~21 ℃,楼宇自控(Building Automation,BA)系统控制空调系统工作,有3种工作模式。一是自然冷源制冷,即在冬季或气温较低的季节单独开启板式换热器制冷,全年工作时长约2 500 h;二是联合制冷,即在过渡季节开启板式换热器+冷水机组的工作模式,采用板式换热器对冷冻水进行预冷后再由冷水机组制冷,全年工作时长约1 000 h;三是冷水机组机械制冷,即在外界温度较高的季节开启冷机机械制冷。BA系统控制空调系统工作,根据冷机运行电流百分比调整运行冷机数量,低于40%时减载,高于80%时加载[4]。此外,根据季节变化调整冷却水温度,夏季为32 ℃,冬季为18~20 ℃,春季、秋季为23~25 ℃。BA群控系统节能管控模式如图2所示。
图2 BA群控系统节能管控
BA系统控制未应用人工智能(Artificial Intelligenc,AI),运行方式存在以下问题。首先,未最大程度地应用自然冷源。南方地区环境湿球温度波动大,而制冷模式受环境湿球温度的影响,存在一天中部分时间可开启自然冷源制冷,但部分时间需开启冷机进行联合制冷,此运行工况导致自然冷源应用时间缩短且在自然冷源制冷和联合制冷之间频繁切换,影响数据中心制冷系统的运行稳定性。其次,BA系统不能控制冷机运行在最佳能效区间。冷机运行数量根据电流百分比管控,负荷比在60%~70%为冷机最佳能效区间,BA系统无法控制冷机运行在该区间。最后,联合制冷模式下部分自然冷源制冷效能较低。采用联合制冷存在冷机负荷较低问题,且冷机未运行在高效区域,部分自然冷源制冷成为低效能制冷,并未有效降低能耗。
前期数据中心建设以低温冷冻水模式工作,根据制冷系统原理,冷冻水水温过低进一步导致冷机能耗增加。人工调整空调系统工作模式存在以下不足:一是未精细化管控空调系统,人工管控时间较长,无法颗粒化调整各项参数;二是人工参与无法准确跟踪参数的多样性变化,存在滞后效益,导致自然冷源的应用时间缩短[5]。
综合以上分析,导致数据中心能耗偏高的问题包括BA控制盲点、冷冻水水温过低、供配电环节较多。根据能耗组成分析,对数据中心能耗影响最大的问题为BA控制盲点和冷冻水温度过低。
2 存量数据中心空调系统基于AI应用方案
AI系统通过充分利用现有测点的相关数据,对空调系统各设备统筹管理,包括冷冻水输送及末端控制优化、冷却水输送与散热、主机智能化管控、连续性自然冷源利用、蓄冷罐调容以及冷冻水供水温度调整等。AI应用管控模式如图3所示。
图3 AI应用管控
2.1 冷冻水输送及末端控制优化
冷冻水输送及末端控制优化分为两部分,即基于负荷预测的智能模糊预期控制策略和基于送回风、供回水温度独立控制的水阀与风机调节方法。
基于负荷预测的智能模糊预期控制策略通过实时海量采集末端机房热负荷,并针对一天内的热负荷变化进行趋势研究和特性总结。根据现在实际的热负荷结合变化曲线,对下一时间段的热负荷进行预测,将预测值与预测时间段实际值进行比对,实现AI深度学习,从而提升热负荷预测的准确性。
基于送回风、供回水温度独立控制的水阀与风机调节方法则根据送回风温度调整风机转速,同时采集机柜内、冷通道、热通道的温度,在保障机柜内服务器运行正常的情况下,不断优化风机转速的控制方式。根据冷冻水供回水温度调整末端空调冷冻水阀开度,确保供回水温差恒定,实现末端空调系统与空调主机系统运行方式匹配、末端机房热负荷与恒温差下水流量匹配、冷机系统与水泵负载率相匹配。
2.2 冷却水输送与散热
实时跟踪外界湿球温度的变化情况,监测冷机运行参数,动态调整冷却水出水温度,确保冷却水处于最佳供水温度。同时根据冷机冷却水进出水温差调整冷却水流量,确保冷机、水泵处于最佳能效区间。
2.3 主机智能化管控
采集末端热负荷、冷机能耗,跟踪冷机能效曲线,通过调整水系统参数(水流量、供回水温度、供回水温差等),利用AI控制冷机在最佳能效区间范围内运行。
2.4 连续性自然冷却利用
通过预测外界环境变化情况动态调整蓄冷罐工作模式、冷冻水系统运行参数以及冷却水系统运行参数等,持续性利用自然冷源,无需启用冷机制冷,减少数据中心制冷模式的频繁切换,降低对冷机的损害。基于数据中心运行参数挖掘节能降耗价值点,探索在气候变化、昼夜温差波动场景下持续、高效、安全应用自然冷源,实现数据中心空调系统结合自然冷源应用的智慧运维、智能运维。利用新模型支撑数据中心空调系统节能运维,降低数据中心空调系统能耗。
2.5 蓄冷罐调容
通过调整蓄冷罐的工作模式调整制冷系统负荷,从而改进冷机运行能效比或持续性应用自然冷源。在数据中心运行初期,热负荷较低,冷机运行负荷低。根据冷机能效曲线,负荷较低的情况下主机能效比较差。晚上外界环境温度较低、电费较低,开启冷机制冷,同时对蓄冷罐充冷;白天则开启蓄冷罐放冷,减少冷机运行时间。此外,可以根据电网峰谷特性实现电网需求侧调容。
在冷机运行阶段,可以根据冷机的能效曲线,通过蓄冷罐的充放冷调优冷机负荷比。当冷机负荷较低时,可开启蓄冷罐充冷,提升冷机负荷;当冷机负荷较高时,开启蓄冷罐放冷,降低冷机负荷。通过蓄冷罐工作模式的变化,实现制冷系统负荷调容,确保冷机运行处于或接近最佳能效区间。
当开启板换制冷时,气温变化导致环境湿球波动较大,一天中部分时间可开启自然冷源制冷,但部分时间需开启冷机进行制冷,通过蓄冷罐的放冷代替冷机机械制冷,从而持续利用自然冷源。根据对水冷空调系统用电结构的研究,冷机机械制冷用电量占水冷空调系统用电量的3/5,水泵、冷却塔及附属电动阀等用电量占水冷空调系统用电量的2/5。基于此,通过减少冷机机械制冷时间并使用板式换热器制冷,可以有效降低空调用电量。
2.6 冷冻水供水温度调整
在确保末端机房温度正常的情况下,调整冷冻水温度,并实时统计空调系统能耗,根据不同冷冻水供水温度下的模型进行AI深度学习,找出最佳冷冻水供水温度。通过负荷预测、水温管控、水流量管控、冷机能效曲线跟踪、空调设备能耗分析以及AI学习等环节,结合数据中心空调系统运行特性,设计空调系统基于AI应用的最佳工作机制。在中国西南某数据中心实际应用后,空调系统自然冷源制冷时长由2 500 h延长至3 300 h,全年PUE降至1.35,数据中心能耗下降明显。
3 结 论
综上所述,存量数据中心结合AI应用可以有效管控数据中心空调系统用电量,降低数据中心的运营成本。以构建健康、良性的发展模型为主线,积极响应国家“双碳”战略部署,综合平衡、灵活调优,从而实现数据中心空调系统基于AI的最佳应用。