基于AI技术的机房节能改造
2021-08-29孙海峰陆翰涛
孙海峰 黄 赟 陆翰涛 杨 波
1.中国移动通信集团上海有限公司
2.南京群顶科技有限公司
0 引言
近年来,中国移动面对气候变化、机房体量的增加,能耗和环境问题越发严峻。自2007年推出“绿色行动计划”以来,中国移动每年编制《中国移动“绿色行动计划”年度重点工作要求》,旨在运用新技术、新理念实现智能化的绿色节能目标。
随着5G的上线,公司的能耗问题愈发严重。据统计,2019年中国移动的总耗电量超过250亿kWh,2011-2019年中国移动总耗电量年均增长率约为8.9%,新的设备、基站导致巨大的耗电量仍在快速上升。而其中数据中心的耗电量占比很大,我国的数据中心为7.4万个,占全球的23%。其中能耗类型分为IT和空调用电,而在空调能耗的处理上,传统、物理的节能方式已经接近瓶颈,成效越来越微弱。
对于此节能现状,需要根据大数据和新技术给出新的节能方式,在探索新型节能模式的过程中,开始进行各站点的AI节能试点工作,现已经初具成效。
1 环境现状
上海移动某机房楼,共8层,其中机房数量为12个,2~7楼每层分东、西方向两个机房,东、西机房内部互通。全楼末端空调数量为95台,制冷系统为全风冷式,采用风道上送风的方式。机房布局见图1-1。
图1-1 机房布局
新的动环系统正在建设并逐步替换旧的动环系统,同时部分空调设备也在换新,机楼的能耗平台数据采集暂时中断,在节能改造完成后恢复数据采集。
2 技术实现
2.1 AI节能技术
传统的空调系统,受到机房环境、气流传导系统等多方面因素的影响,以往的节能手段已经到达瓶颈,再投入大量资金进行收效甚微的改造与节能理念相背驰,而此时进行AI节能技术试点,旨在利用该技术的优势将整个机房制冷系统、环境都纳入考量,智能感知环境因素,自动调节系统的运行状况,对机房进行精准的制冷控制,按需分配资源,最终形成系统智能化的闭环学习和优化迭代,从而达到节能的最终目的[1]。
2.2 技术目的
空调原本策略是根据回风/送风温度来控制运行情况,依据设定好的温度和温度阈值来决定是否需要开启压缩机,一旦空调的回风温度达到了开启压缩机的条件时会开启压缩机降低出风温度。机房CFD仿真图见图2-1。
图2-1 机房CFD仿真图
在对机房进行CFD软件模拟后显示[2],机房内的温度有部分区域出现过低(蓝色较深)或者过高的情况,这种情况说明在以往的运行模式下空调根据环境来调整自身运行情况的控制方法尚有缺陷,无法根据机房自身情况来按需分配资源,无法实现兼顾各项因素的智能化调控。因此,需要对机房进行改造,建立更高效节能的运作模式。改造之后通过算法动态调节空调的运行参数,使空调运行在良好的或最优的工况下,避免不必要的能耗。
2.3 实现方法
1)采集机房历史数据,将机房内部环境纳入计算,建立全新的温度场模型,根据得到的数据进行冷热区域的划分,作为后续空调运行的依据。
2)根据IT、空调用电量和损耗的对比,结合机房内温度场数据建立机房热平衡模型并进行智能预测,获得空调的优化控制参数。
3)对接动环和能耗系统的应用程序编程接口,实现对空调、温感和电量数据的自动采集,并且通过动环下发空调控制指令。
4)通过加设节能一体机实现机房环境监测和末端空调的自动控制闭环,以及预测模型的智能学习和优化迭代,并且实现策略的制订和下发。系统部署见图2-2。
图2-2 系统部署
3 具体实现
3.1 设备安装
在机房的指定位置将节能一体机上架(图3-1)、加电、网络接入、程序调试和采控端口联调等工作,对于部分通过网关直接采集和控制的情况,根据现场安装协议转换网关设备。
图3-1 节能一体机安装
节能一体机安装需要申请机架位、电源和网络接入端子、IP地址及相关端口白名单,并且根据现场内控要求进行设备安全加固。
现场根据机房构造布局架设温感探测器(图3-2),温感数据直接采集至节能一体机。
图3-2 温感探测器
3.2 数据采集
1)网络接入要求:节能一体机需要与动环系统和能耗平台分别打通网络和相关端口,动环系统和能耗平台需要开放应用程序编程接口;
2)现场电表数据采集满足机房节能实施要求;
3)温感要求:能耗分析所需的温感探头由节能厂商统一安装,数据直接采集至节能一体机,温感探测器数量和位置满足机房节能实施要求;
4)空调采集和控制点位要求见表3-1。
表3-1
空调工况采集采样频率控制指令制冷输出风机输出压缩机进风温度回风温度设定温度1分钟一次制冷输出风机输出压缩机设定温度
4 节能评估
4.1 节能调控
本项目中,部署了一台负责数据采集、下发指令的一体机,但要做到智能化的节能效果还需要符合机房环境的节能策略,同时节能一体机将自动执行智能预测的指令,根据采集的数据实时制订符合运行模式的指令。
4.1.1 策略流程逻辑
1)策略生成模块根据当前机房状态与温湿度数据,生成新的调控策略(制冷设备开启/休眠/参数调节);
2)将近期温度数据、新的调控策略输入温度预测模型,预测在新的策略下机房各个温感设备的温度变化;策略流程逻辑见图4-1。
图4-1 策略流程逻辑
3)基于预测的温度判断新的策略是否会发生温度异常告警,如果会触发告警则对策略进行微调(不休眠空调、调节其它未休眠空调的参数);如果不会触发告警,则策略下发执行;
4)实时获取新的温湿度数据,观察机房温度;
5)定时触发生成新的调控策略,生成的新调控策略按照前三步的步骤重新执行优化机房能耗。
4.1.2 温度预测
温度预测模型能够预测机房内温感在不同的空调配置参数下短期内的温度变化趋势,提前调整运行状态保持节能状态。
其价值主要在于以下两点:
1)预测温感温度在未来10 min内在当前空调配置参数下温度的变化趋势;基于该预测结果,判断该温感温度相对于原温度是过高还是过低,有一定差值则需要对空调进行相关的策略调整。
2)新策略温度影响预测,基于新生成的策略参数以及近期温感历史温度预测在新的空调配置参数下未来10 min的温度变化趋势,从而评估温感温度在新的策略下是否会触发温度告警等,最终达到评估新策略的效益目的。
为保证策略调整不会给机房环境温度带来告警风险,方案采取了以下限制措施:
1)最优目标温度设置为25.5℃(低于告警温度27℃,并可按需修改);
2)制订策略时设置每次休眠制冷设备不超过1台;
3)策略每次需要唤醒制冷设备不设置上限;
4)策略生成后,采取温度效益预测,将温度保持在可控状态;
5)实时观测温度变化情况及时调整策略;
6)支持配置仅生成策略,不执行策略,在环境情况较复杂时,可以随时人工对策略的风险进行评估分析后再决定策略执行与否。
4.1.3 时序预测
节能一体机采集历史空调参数、温感温度数据,而温感之间由于空调空间布局的原因具有一定程度的相关性,所以使用RNN类网络算法对历史数据进行训练构建多指标预测模型,并使用预测模型对每个温感未来一段时间的温度变化进行智能预测。
1)算法输入:当前空调参数配置、温感编号、过去60 min的温度值;
2)算法输出:在当前空调配置参数下,各个温感未来10 min的温度值。
算法选型:DeepAR(RNN+Embedding)(基于循环神经网络深度学习的时序预测算法)
算法基本逻辑如下:对训练数据进行随机采样,以随机抽取时间点t为原始输入数据,t~t+L为输出,以t时刻产生的训练样本为例,输入为:当前时间点的相关特征,以及上一个时间点各个特征相应的长短期记忆网络、输出;模型输出为:t时刻的真实值。反复循环学习t+1~t+L时刻的样本;如此反复随机采样数据进行模型训练[3]。
4.1.4 学习迭代
在本项目中,AI的学习迭代是实现智能控制的关键点,而AI技术要实现闭环学习,要经过一套完整流程:
1)建立数据库作为基础,以往的空调监控数据可作为合适的材料,方便AI依此进行初步的判断;
2)进行大量训练,采集实时数据进行策略制订,并按照其准确性来修正未来的策略制订逻辑;
3)建立测试数据库,同样可以使用以往的空调监控数据(不与基础数据库数据相重复)来作为测试材料;
4)根据测试材料进行策略的制订,与原数据进行对比,有一定重合或低于原数值可视为测试成功[4]。
同时节能一体机设计了策略保护机制,即设备会自动保存空调被控制前的设置参数,当空调运行状况出现异常时,可以选择退回到之前时间点的设置参数,恢复空调原本的运行状态,避免了AI由于空调异常而下发错误指令。
4.2 节能数据
通常以节电量和节电率来衡量数据中心节能的质量和效果。节电量和节电率的计算根据节能实施前后的电量(实施前为基准值T0,实施后为对比值T1)进行对比计算。
T0:测量周期(节能实施前)的用电数据。T0中IT设备的用电量为PIT-0 kWh,精密空调的用电量为Pcooling-0 kWh,机房能耗合计为PT0。
T1:测量周期(节能实施后)的用电数据。T1中IT设备的用电量为PIT-1 kWh,精密空调的用电量为Pcooling-1 kWh,机房能耗合计为PT1。
部分电能数据见表4-1。
表4-1 部分电能数据
根据监控系统提取的用电数据进行计算,4月下旬15天的电量为3 009.38 kWh,而安装后5月下旬15天的电量为3 001.55kWh,该数据显示,进行改造后,机房空调在气温不断上升的情况下,能耗依然减少。其中4月下旬的平均气温为19.0℃,5月下旬平均气温为25.6℃,而天气气温对空调能耗的影响基本可视作线性关系[5],比率在24%/15℃左右,等效比率即为10.5%,即同温度下半个月节省能耗可达315.16 kWh,用电量为:
3 009.38-315.16=2 694.22 kWh。
表4-1和表4-2显示,相比未安装之前的能耗情况,安装后的AI节能运行模式下的运行情况迅速进入了稳定状态,并且能耗更小,蓝色部分为节能部分。由此说明AI技术根据机房内冷热量的具体需求,实时对空调系统的运行状态进行调整,使整个系统的工况保持在最优状态,实现了智能化的按需运行模式,达到了节能减排的改造目的。
表4-2 电量对比
5 安全机制
节能一体机采用旁挂方式接入动环网络,设备的南北向物理或逻辑结构均无串联的其他生产设备,在出现紧急情况时可直接关停,及时终止采控程序对空调设备的影响。关停节点的措施主要包括:
1)停止采控服务进程(远程)
2)关闭一体机操作系统(远程)
3)断开一体机网络连接线(现场)、关闭网络交换机接入端口(远程)
4)关闭一体机电源(现场)
除此之外,当FSU本身发生故障时,平台会第一时间发送告警工单,维护人员会接收到FSU的设备故障消息,此时需人工介入对FSU故障恢复;而当一体机本身发生故障时,与之相连的FSU会发出通信中断告警,同样人工介入进行修复。在此两种情况下,一体机都会停止对空调的所有指令控制,直到故障修复[6]。自设置该功能后,经过安装后一段时间的运行,尚未启用过安全机制,初步证实一体机的稳定性,有待继续观察其运行工况。
6 总结
本项目针对机房空调能耗高、制冷不均匀的情况进行了勘查和分析,采用AI节能技术校验并指导节能技改工作。具体完成工作如下:
1)对机房进行了现场分析,为了更有效地降低能耗,采用了AI节能技术对机房进行改造。
2)安装一台能够实时采集空调温感数据、制定下发指令的节能一体机。
3)正常情况下由一体机自动采集分析数据对未来一段时间的策略制订,并且将一体机设置为在遇特殊情况时可结合现场情况人工干预策略。
4)在动环监控系统中得到一段时间的数据后,分析得出用电量明显下降,且气温较高的5月份用电量尚小于气温较低的4月份,通过气温与制冷效率的斜率计算证明了AI技术节省能耗的成效。
5)针对机房中各种紧急情况进行了相应的设置,确保在特殊状况下不会影响空调本身的正常运行。