APP下载

人工智能:耗电又耗水的能源黑洞?

2024-06-04南之瑉

海外文摘 2024年6期
关键词:消耗数据中心人工智能

南之瑉

| 建立“可持续人工智能”的标准 |

2022年11月,开放人工智能公司发布聊天生成式预训练转换器(ChatGPT),短短两个月内便拥有了1亿活跃用户。随后,各大科技公司竞相推出越来越先进的“生成式人工智能”,其影响力据信能与互联网的诞生、电力的普及、工业革命的出现以及火的发现相提并论。然而,很多人不了解的是,人工智能技术的爆炸式发展耗费了大量电能和淡水,留下了巨大的碳足迹,而且这些数字仍在不断增加。

科技公司正试图将人工智能嵌入到从简历写作到肾脏移植、从狗粮选择到气候建模的一切事物中,强调人工智能可以通过多种方式帮助人类减少环境足迹。但如今,一些立法者、监管机构和国际组织希望确保人工智能带来的益处不会被其不断攀升的环境成本所抵消。

“下一代人工智能工具的发展不能以牺牲地球健康为代价。”2024年初,马萨诸塞州参议员提出一项法案,要求美国政府评估人工智能当前的环境足迹,并为将来公开人工智能对环境的影响制定标准化制度。欧洲议会通过的《人工智能法案》要求“高风险人工智能系统”报告其整个生命周期内的能源消耗、资源使用情况和其他影响,该法规将于2025年生效。国际标准化组织表示将在2024年晚些时候发布“可持续人工智能”的标准。

| 秘而不宣的碳排放量 |

训练人工智能的过程需要消耗大量电力。一个突出的现象是,人工智能技术的高速发展正在意外地推高煤炭股。谁用电,就会产生二氧化碳。美国研究员艾玛·斯特鲁贝尔提出了一个大致的规律:训练一个先进的语言模型所产生的二氧化碳当量大约相当于五辆汽车的终生排放量,或者说,大约是一个人一生中排放量的2/3。据谷歌和加州大学伯克利分校的研究人員估计,开放人工智能公司的GPT-3模型训练过程中排放的二氧化碳当量高达552吨,需要1287兆瓦时的电能,相当于320个四口之家一年的能源消耗。据估计,《稳定扩散》首版图像生成器的训练产生了15吨二氧化碳当量,我们不清楚这样的训练还需要进行多少次。像GPT-3这样的大型语言模型在添加新功能时不需要从头开始重新训练,而是在现有基础上进行升级——而完成到GPT-3.5或GPT-4的版本升级需要多少训练,是企业严守的秘密。

目前,我们也不知道,请求人工智能帮忙做家庭作业或生成一张宇航员骑马的图片将如何影响碳排放或淡水库存。加州大学河滨分校电气和计算机工程副教授任绍磊表示,在缺乏标准和法规的情况下,科技公司可以随意选择性公开其人工智能的影响。过去十年,任绍磊一直在研究人工智能的水资源消耗。通过对微软冷却系统年用水量的计算,他估计,与GPT-3进行一系列问答(大约10到50次回复)会消耗半升淡水,消耗量因地区而异,体量更大的人工智能可能消耗更多。然而,对于相关信息,各大科技公司大都秘而不宣。

亚马逊在北弗吉尼亚州郊区的一个数据中心

碳排放也一样。2022年,研究人工智能影响的十位知名学者在一篇会议论文中写道:“对于人工智能导致的温室气体排放量,现今的数据科学家们缺乏便捷可靠的衡量方法。”论文合著者之一、西雅图艾伦人工智能研究所的科学家杰西·多吉表示,自这篇论文发表以来,人工智能应用程序和用户数目已经激增,但公众对这些环境数据仍然一无所知。

| 数据中心的惊人耗电量 |

此外,多吉强调道:“能为你写一首诗或草拟一封电子邮件的模型非常大。对于人工智能来说,要拥有优秀的能力,尺寸至关重要。”大型人工智能需要快速进行大量计算,通常需要在专用图形处理器(GPU)上运行,这些处理器最初是为在计算机屏幕上渲染图形而设计的,具有强大的计算能力,相比其他芯片而言更加节能,而且在大型云数据中心上运行时效率很高。云数据中心通常由大量服务器组成,它们配备了高性能的处理器、内存和存储设备,以满足数据处理和存储的需求。数据中心规模越大,效率往往就越高。近年来,人工智能能源效率的大幅提升,多得益于不断增加的超大规模数据中心,这些中心拥有更多的计算机,可以根据需求快速扩展能力。一个典型的云数据中心占地近1万平方米,而超大规模数据中心可以达到10万至20万平方米。

全球云数据中心的数量估计在9000至11000个之间,而且还有更多的正在建设中。国际能源署预计,到2026年,数据中心的总耗电量将是2022年的两倍,达到1000太瓦时,大致相当于日本当前的年度总用电量。

数据中心耗电量极大。

一个问题是,这些统计数据涵盖数据中心的所有活动,除人工智能外,亚马逊的在线商店界面、苹果电视的视频播放服务、数百万用户的电子邮件存储、比特币“挖矿”等任务也都在数据中心内部完成。

至于人工智能实际占用了数据中心能耗的多大比例,大多数运营数据中心的科技公司选择保持沉默。谷歌是个例外。该公司表示,“机器学习”——人工智能的基础技术——占其数据中心总能耗的比例略低于15%。

| 人工智能复杂的环境影响 |

另一个复杂的问题是,与“挖掘”比特币或在线购物不同,人工智能还可以用来减少人类对环境的负面影响。人工智能可以改进气候模型,找到更高效的数字技术制造方法,减少运输过程中的浪费,从而减少碳排放和用水量。例如,有统计发现,由人工智能驱动的智能家居可以让家庭二氧化碳排放量减少多达40%。而谷歌最近的一个项目发现,人工智能可以快速处理大气数据,指导飞行员选择飞行路线,从而产生最少的尾迹。

据估计,在商业航空对全球变暖的影响中,有超过1/3由飞机尾迹产生。加州大学伯克利分校计算机科学荣誉退休教授兼谷歌研究员大卫·帕特森说:“如果航空行业能够全面利用人工智能带来的技术突破,那么由此减少的二氧化碳排放量将会超过2020年所有人工智能产生的二氧化碳总量。”

帕特森预测道,由于人工智能软件和硬件能源使用效率的提高,人工智能的碳足迹将很快达到峰值并开始降低。这种效率提高表现在:自2019年以来,人工智能的体量不断增加,其占谷歌数据中心能源使用的比例却一直保持在低于15%的水平。根据国际能源署的数据,尽管全球互联网流量自2010年以来增长了20多倍,但数据中心和网络所消耗的电力份额增加得要少得多。

然而,关于效率提升的数据并不能说服一些怀疑论者。他们提到一个被称为“杰文斯悖论”的社会现象:长期来看,降低资源成本有时会增加资源消耗。这是一种反弹效应,就像拓宽了高速公路后,车速变得更快,燃料消耗变少,但随后路上汽车数量增多,燃料总消耗反而比以前更多了。同样,如果人工智能让家庭供暖效率提高了40%,那么根據一位批评者的说法,人们可能会在一天中的更多时间里让室内温度保持更高。

多吉解释道,人工智能是所有事物的加速器。在艾伦研究所,人工智能帮助开发了更好的程序去模拟气候、追踪濒危物种和抑制过度捕捞。但是,从全球来看,人工智能也为许多可能加速气候变化的应用提供了支持,从而引发了一个核心的伦理问题:我们追求的是什么样的人工智能?

| 与当地人竞争淡水的数据中心 |

如果说全球电力消耗感觉有点抽象,那么数据中心的水消耗是一个更具体、更具地域性的问题,特别是在干旱地区。冷却数据中心精密电子设备所使用的水不能含有细菌和杂质,以免导致设备故障。换言之,数据中心通常会与人们竞争饮用、烹饪和洗涤的水。

有数据显示,2022年,谷歌的数据中心用于冷却的淡水量约为200亿升,比2021年增加了20%。同一时期,微软的用水量则增加了34%。谷歌的数据中心托管了包括巴德聊天机器人在内的多个生成式人工智能服务。微软的服务器则托管了ChatGPT以及GPT-3和GPT-4,它们都由开放人工智能公司开发,微软是该公司的主要投资者。

建成或扩建的数据中心越来越多,住在附近的民众想了解它们的用水量信息却非常困难。例如,谷歌在俄勒冈州达尔斯市运营着三个数据中心,并计划再建两个。2022年,市政府提起了一项诉讼,旨在免除谷歌向农民、环保人士和美洲原住民部落说明其用水状况的义务,而这些群体担心数据中心的水消耗会影响当地农业发展和动植物生态。该市在2023年初撤销了此项诉讼,随后公开的记录显示,谷歌现有的三个数据中心使用了该市超过1/4的供水。近两年间,智利和乌拉圭爆发了抗议活动,反对谷歌建造大量消耗饮用水的新数据中心。爱尔兰政府也拒绝了微软和亚马逊建设数据中心的请求,担心这可能会给国家电网带来压力甚至导致断电。目前,爱尔兰已有11%的电力需求流向了数据中心,如果照这个速度发展,到2030年,这一比例将上升到33%。

多吉指出,未来的某一天,人工智能也许能够或者依法必须向用户告知他们每次使用人工智能服务所造成的环境负担。此外,我们还可以考虑为人工智能模型引入能效等级系统,让消费者能够像选购家电一般比较其能源效率。而现在,个人用户并没有多少权利去了解这些信息,更不用说作出什么改变了。

编辑:周丹丹

猜你喜欢

消耗数据中心人工智能
如此消耗卡路里
玉钢烧结降低固体燃料消耗实践
酒泉云计算大数据中心
降低钢铁料消耗的生产实践
我们消耗很多能源
2019:人工智能
人工智能与就业
民航绿色云数据中心PUE控制
数读人工智能
下一幕,人工智能!