大型数据中心制冷系统绿色节能技术研究
2023-03-25侯嘉HOUJia朱振华ZHUZhenhua
侯嘉HOU Jia;朱振华ZHU Zhen-hua
(四川旷谷信息工程有限公司,成都 610000)
0 引言
随着全球进入数字经济时代,数据呈现爆炸式增长,我国已将数据中心建设作为新基建战略七大领域之一,是国家未来信息化建设与发展的重要方向。大型数据中心是耗能大户,在“碳达峰、碳中和”,“东数西算”等政策背景下,绿色节能成为大型数据中心建设的主旋律,近年来国家相关部委颁布多项政策文件,推动大型数据中心建设不断提升能源利用效率、降低PUE。
制冷系统能耗通常占大型数据中心总能耗的30%左右,是数据中心基础设施最主要的耗能系统。因此,数据中心制冷系统节能降耗技术应用空间最大、成效最快且节约运营成本最多,应用大型数据中心制冷系统绿色节能技术可以有效降低数据中心的能耗,优化PUE 值,提升节能技术水平。本文主要针对大型数据中心制冷系统节能,从制冷系统间接蒸发冷却技术、液冷技术以及AI 节能技术三个方面进行研究和分析。
1 间接蒸发冷却技术
1.1 技术原理 蒸发冷却技术是利用空气与水的直接接触,通过两者间的水蒸气分压力差以及温差,利用水的蒸发吸热进行制冷,其本身以水作为制冷剂,按照被处理空气与水的接触方式不同,一般可分为直接蒸发冷却与间接蒸发冷却两种方式。
间接蒸发冷却是指通过非直接接触式换热器,将直接蒸发冷却得到的湿空气的冷量传递给机房循环空气,实现空气等湿降温的过程。在此过程中,二次空气经处理后其干球温度和湿球温度都下降,而含湿量不变,对送风气流实现减焓等湿降温过程。
1.2 系统构成 间接蒸发冷却系统由喷淋装置、换热芯体、室内风机、室外风机、机械制冷补充装置、控制系统等组成。(图1)
图1 间接蒸发冷却系统构成图
数据中心内部的待处理空气通过板式换热装置,首先利用室外空气对待处理空气进行冷却,同时喷淋系统喷淋水利用室外空气的热量,在板式换热装置中蒸发,利用蒸发吸热,来降低待处理空气温度,使其最大程度地冷却机房内部循环空气。整个处理过程,室内空气是一个闭式循环系统,而室外空气是一个开系统。室外空气并不进入数据中心内部,从而避免室外空气中水分、污染物进入数据中心。由于处理空气不与水直接接触,其含湿量不变,实现空气的等湿降温。
1.3 运行模式
根据室外新风温湿度和负载情况,系统分别运行在三种工作模式,实现按需制冷,最大程度利用自然冷源。(图2)
图2 间接蒸发冷却系统运行模式示意图
①干模式,采用自然冷却。在冬季室外温度低的情况下,室外空气温度低足够在换热器内冷却服务器机房回风。经过换热器后,吸收热量的室外空气由风机墙排放到室外。冷却后的机房回风,经过室内侧风机墙被送入服务器机房。
②喷淋模式,采用蒸发冷却。春秋季室外温度较低的情况下,因为室外空气温度不够低,需要开启水泵通过高压微雾喷淋进行绝热蒸发制冷的来补充制冷量。
③混合制冷模式,采用机械补冷。夏季室外温度较高,仅依靠自然冷却无法满足制冷需求的情况下,通过循环喷水带走部分热量,不足部分开启变频压缩制冷系统补充冷量。
1.4 节能效果及适用环境区域分析
间接蒸发冷却系统与传统水冷冷冻水系统主要对比如表1。
表1 间接蒸发冷却系统与传统水冷系统对比表
间接蒸发冷却通过水的蒸发吸热来制冷,只有当所使用的空气具有较大的干湿球温度差的情况下,才可能有良好的制冷效果。因此,间接蒸发冷却系统十分适合新疆、甘肃、内蒙古等夏季室外干湿球温度相差较大的地区,与一般常规机械制冷方式相比,采用间接蒸发冷却在西北寒冷干燥地区可更加节能约75%~85%,在华南炎热潮湿地区通常可节能20%~30%,在西南、华中、华东等中等湿度地区可达到40%左右,总体来说能够大幅降低大型数据中心空调制冷系统能耗。
2 液冷技术
2.1 技术原理 随着数据中心高密度设备的快速发展,服务器级的冷却开始出现并被使用。液冷技术使用液体取代空气作为冷媒,与IT 设备发热元器件进行热交换并带走热量。由于液体比空气的比热容高,散热速度也远远快过空气,因此液冷的制冷效率远高于风冷,相对于传统的风冷制冷方具有以下明显优势:①液体冷媒导热量是同体积空气的近3000 倍。②液体冷媒导热效率更快,超过空气的25 倍。③同等散热水平时,采用液冷相比风冷方式噪音降低20-35 分贝。④相比风冷系统节省电量约30%~40%,采用液冷服务器配套基础设施解决方案的数据中心年均PUE 值可降低至1.2 以下。
2.2 液冷技术实现方式 按照液体与发热器件的接触方式,液冷技术实现方式主要分为冷板式(间接接触)、喷淋式和全浸没式(直接接触)。
①冷板式液冷。将液冷冷板固定在服务器电源模块、CPU 等主要发热元器件上,依靠流经冷板的冷却液进行散热,冷板的液体不接触被冷却器件,中间采用导热板传热,安全性高。冷板液冷解决了IT 设施主要发热元器件的散热问题,其他发热量小的器件还得依靠风冷,所以采用冷板式液冷的服务器也称为气液双通道服务器。
②喷淋式液冷。喷淋式液冷技术主要根据发热体位置和发热量大小不同在服务器机箱顶部储液并开孔,通过冷却液对发热器件进行喷淋,通过直接接触实现极高的冷却效率。冷却液在喷淋过程中会有少量飘逸和蒸发现象,雾滴和气体沿机箱孔洞缝隙散发到机箱外面对机房环境清洁度下降或对其他IT 设备造成影响。
③浸没式液冷。将IT 设备发热元器件直接浸没在冷却液中,依靠液体的流动循环带走设备运行产生的热量。由于发热元器件与冷却液直接接触,浸没式液冷散热效率更高,相对于冷板式液冷,噪音更低,适用于更高热密度应用场景。
目前国内外设备厂商主要以冷板式液冷服务器产品为主,喷淋式和浸没式液冷服务器产品较少,以少量验证性应用为主。但是另一方面,采用液冷服务器在有效降低PUE 的同时也将大幅增加IT 设施投资成本。
2.3 冷却液研究 液冷常用的冷却液有水、矿物油和氟化液。其中水是一种优秀的散热媒介,价格低廉无污染,有良好的比热容,但由于水并非绝缘体,只能应用于非直接接触的冷板式液冷技术。矿物油是冷却液通常选择之一,具有绝缘性强、无味无毒不易挥发且价格相对低廉的特点,但是矿物油粘性较高比较容易残留,特定条件下有燃烧的风险。氟化液由于具有绝缘且不燃的惰性特点,是目前应用中最理想最广泛的浸没式冷却液,但价格较为昂贵。
3 AI 节能技术
3.1 技术概述 传统大型数据中心制冷系统通常采用群控系统实现冷水机组及末端空调的运行控制,在节能运行方面往往存在冷水系统与负载系统缺少精确联动调节,无法基于环境参数和负载率实时调优的问题。针对数据中心制冷系统,在传统群控系统基础上构建AI 节能控制平台,部署AI 深度学习算法,通过软硬件深度耦合,实时采集制冷系统运行参数,基于AI 节能技术进行综合分析,进而生成和下发最优节能运行策略,通过对制冷机组和末端精密空调的AI 智能控制,确保大型数据中心低能耗高性能运行。
3.2 技术实现 AI 节能技术主要通过数据采集、数据治理、模型训练、推理运算和控制策略下发五个步骤实现制冷系统AI 能效优化。(图3)
图3 AI 节能技术架构示意图
①数据采集:大型数据中心AI 控制系统将制冷系统各项基础设施进行统一管理,周期性将采集到的大量制冷系统数据上传到AI 数据采集和推理平台,提供运算基础。AI 算法通过大型数据中心提供的海量数据进行训练,不断迭代优化升级。
②数据治理:训练平台对采集到的大量数据进行特征参数自动识别,并根据各项参数的业务特性进行聚合分析,提取出影响能效指标的主要特征值参数(如室外温湿度、冷机数量、冷冻水供回水温度等)。
③模型训练:首先针对数据中心PUE 模型进行训练,通过建立PUE 值与室外环境、IT 负荷、制冷系统控制参数之间的因果关系,利用神经网络算法对PUE 值进行拟合,将提取到的特征参数输入到深度神经网络中进行自适应学习。然后进行数据中心控制策略优化模型训练,构建基于强化学习的能耗最小化策略模型,根据历史数据生成潜在控制策略,并结合控制策略约束条件利用数字孪生技术对策略进行评价,最终完成对控制策略优化模型的训练。
④推理运算:以PUE 模型为约束条件,利用实时采集数据高效识别出能效最优的制冷控制参数组合(如提高水温、增加冷水机组运行数量等)。
⑤控制策略下发:将控制参数下发到群控系统,通过数据中心运维专业工程师确认控制参数的合理性,并进一步通过制冷系统群控系统执行控制动作。控制参数经过AI 系统、运维工程师、群控系统三重优化及确认,确保数据中心安全稳定运行。
3.3 应用效果分析 近年来国内部分头部IDC 企业已逐步采用AI 节能技术对大型数据中心制冷空调系统进行优化控制升级,节能降耗应用效果明显。华为等业界厂商也推出了较为的成熟的iCooling AI 能效优化技术整体解决方案。通过AI 节能技术,可以在不改变数据中心制冷系统模式和产品配置基础上,对制冷全链路进行智能管理。
根据行业数据,数据中心采用AI 节能技术通常在水冷冷冻水系统基础上能够降低PUE 值8%~15%;在风冷冷冻水系统基础上能够降低PUE 值5%~10%;在间接蒸发冷却系统基础上能够有效降低PUE 值3%~5%,实现数据中心从“制冷”到“智冷”的进化。
4 结语
综上所述,大型数据中心基础设施是数字化和信息化建设的重要基础支撑,对数据中心的建设和运营水平起到决定性作用。本文主要针对大型数据中心制冷系统相关节能技术,从间接蒸发冷却技术、液冷技术以及AI 节能技术三个方面进行研究分析,各项技术在节能减排、绿色运营、降本增效等方面具有显著优势,有利于实现大型数据中心安全、可靠和高效的运行,推动大型数据中心基础设施技术水平的提升。