冷暖张北:数智时代,算力增长和能耗降低如何兼得?
2022-12-29吴晓波苏建勋梁红玉
2021年11月11日凌晨,张北的冬夜星垂平野,寂静无声。
此刻,中国一年一度的商业狂欢盛宴——“双十一”购物节正在上演。一个坐在家里刷淘宝的消费者,也许从未听说过张北,但只要他连接上网络,便享受着来自张北的远程实时服务。
张北是连接华北平原和内蒙古高原的要塞,是距离北京最近的高原地区。风无半日静,地无三尺平。河北省张北县境内,10米高度以上,年平均风速达6.2米/秒,全县优质风能资源达350万千瓦以上。
千百年来,西伯利亚的寒风吹过六朝古长城,而今它除了带动着张北成群的风力涡轮发电机,还驱动着数字经济时代的新型基础设施——互联网数据中心(IDC)。
数字经济时代,生产关系各要素有了新变化,数据成为新的生产要素,算法是新的生产关系,而算力就是新型生产力。承载这一切的数据中心,毫不夸张地说,就是数字经济时代基础设施中的基石。
能源危机降临数智时代
2021年9月底,从东北三省到江浙、两广,不同地区之间的限电细则指向了同一个现实:一场全球性的能源危机到来了。2021年下半年,世界各国交错上演电荒、油荒、气荒,恐慌情绪随着不断创新高的能源价格和越发紧缺的库存蔓延,更随着北半球冬天脚步的临近而愈演愈烈。
据国际能源署调查,直到2018年,全球化石能源发电比例仍高达64%,而可再生能源发电占比仅为26%,核电占比为10%。面对温室效应、能源枯竭等生存危机,在被倒逼着朝低碳时代狂奔的路上,人类对“高能耗”越来越敏感。
消耗巨大电力转化成算力的数据中心,首先引起了人们的注意。2021年5月,国家发展改革委创新和高技术发展司数据显示,数据中心年用电量已占全社会用电的2%左右。数据中心由此被列入高能耗大户。《2020全球计算力指数评估报告》显示,计算力指数平均每提高1个百分点,数字经济和GDP(国内生产总值)将分别增长3.3‰和1.8‰。因而,算力就像一个杠杆,具有放大数字经济效益的作用。得益于此,数字经济的增长速度是非数字经济的3.5倍,数字经济的投资回报率更是非数字经济的6.7倍。
但是,数据中心行业高能耗和高产出高效率之间的矛盾该如何解决?
“年植400万棵树”的散热黑科技
随着万物互联及万物智能时代的开启,目前全球算力规模正以每年超过50%的速度增长。到2025年,整体规模将达到3300EFlops(每秒浮点运算速度)。
算力、算力、算力……各行各业,各种新技术,各种终端,以及我们所处的数字时代,无时无刻不在追逐算力。而建立绿色数据中心,同时满足高算力密度与低碳运营,将成为刚需和趋势。
目前来看,降低电力消耗的过程中最关键的环节是降低PUE(数据中心总能耗/IT设备能耗)。PUE是国际通用的数据中心能源效率指标,这个数值越接近1,说明能效水平越高。2021年11月,在中国数据中心工作组(CDCC)第九届数据中心标准峰会上发布的《2021年中国数据中心市场报告》显示,2021年度全国数据中心平均PUE为1.49。
数据中心的能耗由IT设备、制冷系统、供配电系统、照明系统及其他设施产生。其中,制冷系统在整个数据中心的电能消耗中占比最大。由于IT设备等设施工作时的功耗无法改变,从技术角度看,从制冷系统着手改进,成为降低数据中心PUE的关键。依靠风冷、湖冷等制冷技术,阿里云在河北张北、广东河源、内蒙古乌兰察布等地的五大超级数据中心,全年平均PUE小于1.3。
用液冷来替代风冷给数据中心散热,是近几年业内公认的重大创新举措。液冷技术是指将高比热容的绝缘液体作为传输介质的传热冷却技术,通过冷却液的外部循环将热量带走。相比空气,液体的比热容更高,是空气比热容的一两千倍,而且比需要“看天吃饭”的风冷更可控。
2015年,阿里云开始探索液冷技术的应用实践,2016年首次发布浸没式液冷系统。2017年,阿里巴巴建立起互联网行业全球首个浸没式液冷服务器集群,随后在阿里云张北数据中心进行规模化部署。
根据阿里云基础设施数据中心总经理高山渊的解释,如果用风冷技术,一个标准机柜里做到30千瓦的散热能力已经是极限,而浸没式液冷可以轻松做到120千瓦,经过技术改进还能做到200~300千瓦。在实际应用中,浸没式液冷技术适用于AI、超算这类高密度的计算场景。
与传统风冷技术相比,液冷系统可节省30%~50%的电量,机房整体能效提升30%。而阿里云目前实现了数据中心100%无机械制冷,张北数据中心的年PUE已经低于1.2,最低时可达到1.09,属全球最低。这相当于每年节约标煤8万吨,或种植了400万棵树。初步估算,如果全国的数据中心都采用液冷技术,一年可节省电量相当于三峡电站2020年全年发电量的2/3。
“煮蛋”是业界对数据中心能耗变化最津津乐道的比喻:2005年,阿里10笔电商交易消耗的能源可以煮熟4个鸡蛋;2015年能煮熟1个鸡蛋;2016年启用最新的液冷技术后,仅能煮熟1个鹌鹑蛋了。未来消耗的热量可能连鹌鹑蛋都煮不熟了。从4个鸡蛋到1个鹌鹑蛋,背后是数万名工程师十余年对IT系统极致高性能和高效率的不懈追求。
2020年,阿里云在浙江杭州的云计算仁和数据中心部署了全球规模最大的浸没式液冷数据中心,并联合开放数据中心委员会(ODCC)向全社会开放“浸没式液冷数据中心技术规范”,也即技术开源,着力引领和推动整个行业的技术升级迭代。
张北高原上的“熄灯数据中心”
数据中心里每分每秒都充斥着冷与热的矛盾。在这两者之间找到平衡,是数据中心的技术工程师们永不停息的战斗。
张北的冬季,气温可达到零下三十多摄氏度,在这样的低温天气里,数据中心的部分设备如果不能保温,就会影响设备运行的稳定性,并且损耗设备的使用寿命。但要给设备保温供热,又会产生额外的能耗。
于是,阿里云设计了一个余热回收系统,把各种设备运行产生的热量收集起来,除了满足张北数据中心IT设备保温和办公区、生活区的供热,多余的热量还直接输送给周边地区的机构,减少了该地区传统供热方式所产生的碳排放。
2020年,张北数据中心成为行业内首个碳普惠试点项目,同时获评“2020年度国家绿色数据中心”。2021年9月,作为首批全国绿色电力交易主体,阿里云数据中心率先交易1亿千瓦时绿色电力,成为国内互联网行业最大的绿色电力交易主体。“双十一”期间,阿里云张北数据中心使用绿电近3000万千瓦时,减排二氧化碳2.6万吨。
经过一系列智能化运营的努力,张北数据中心已经基本成为“熄灯数据中心”。平时,除了有少部分工作人员在办公区值守,偌大的建筑空间绝大部分区域都处于“熄灯”状态,在一个全黑的环境里,只有各种设备微弱的指示灯闪烁着。
5年前,张北数据中心所在地块还是一片荒地,旷野上只有北风呼啸的声音。而今,这里已经是一座成熟的产业园区,并且用最低的PUE跑着这片土地上最繁忙的数据,为云上的世界提供支撑。
新一轮科技和产业变革正席卷全球。“数字中国”的建设,正在从量的增长向质的提升转变。如果时代是一列永不回头的列车,那么算力正逐渐成为驱动列车前进的核心动力。绿色算力,已成为保证这列列车高速且稳定行驶的必然选择。
(摘自中信出版集团《云上的中国2:科技创新与产业未来》)