“东数西算”背景下数据中心碳减排效益分析
2023-10-12周瑜张炜乐段婉婷
周瑜,张炜乐,段婉婷
内蒙古大学经济管理学院,内蒙古 呼和浩特 010021
0 引言
(1)算力的发展背景
近年来,随着5G、工业互联网、数字孪生等新一代信息技术的快速发展,传统产业逐渐与数字化相融合,数字经济也逐渐成为改变全球竞争格局的重要力量。发展数字经济是在当今时代浪潮下的战略选择,而算力作为数字经济发展的强引擎、数字经济时代的核心竞争力,近年来人们对它的需求呈急速增长态势,积累数据资源、提升算力水平、做大做强算力产业,已经成为许多国家的共同目标。在这样的背景之下,2020年12月23日,国家发展改革委、工信部等部委在《关于加快构建全国一体化大数据中心协同创新体系的指导意见》中提出“推动算力资源服务化”,对算力资源的需求结构进行优化。2022年,我国正式启动“东数西算”工程[1],构建全国一体化算力网络。
作为承接算力的关键基础设施,数据中心近年来也如雨后春笋般涌现在全国各地。图1显示了2017—2022年我国数据中心的机架规模及其变化,从中可以看出,近6年来数据中心机架规模年增速基本维持在30%左右,算力发展水平飞速提高。
图1 2017—2022年我国数据中心机架规模及变化
从数据中心的布局来看,当前我国的数据中心主要集中在长三角、粤港澳大湾区和京津冀等较为发达的地区,算力需求也集中在这些地区。截至2021年年底,北京及周边、上海及周边的数据中心机架数量在全国分别占比第一、第二,但是受到土地资源、能耗指标等因素的制约,这些地区的数据中心无法满足日益增长的算力需求。而西部地区对算力、存储能力的需求较小,数据中心的布局较为分散,且整体利用率偏低[2],出现了算力资源过剩的情况。这就造成了当前数据中心算力资源在地理位置上的分布不均衡的局面,同时也使数据中心对数字经济的实际价值未能完全体现。
(2)发展的能耗问题
与数据中心规模的高速扩张并行的是各类能源消耗的急速增长,由于我国电力的主要来源为燃料的火电,巨量的电能消耗对应着大量的二氧化碳排放。2021年数据中心耗电量已经超过了2 000亿千瓦时,占到全社会用电量的2.6%,碳排放量则占到全国的1.14%。据估计,我国的数据中心在2030年将消耗400亿千瓦时的电力,占全国用电量的4%。此外,数据中心的高碳排放量问题也愈发地受到重视,在这样的背景下,数字经济的发展受到了数据中心能耗问题的约束,而解决该问题就成了数字经济稳步发展的头等大事。为此,国家提出要进行“东数西算”工程,通过在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8个地区建设算力枢纽节点,打造数据中心集群,把算力资源集中化、规模化。通过把东部地区待处理的计算任务合理分配到西部地区进行处理,打通东西部地区算力资源的通道,做到算力资源的共享、流通。
“东数西算”工程可有效提高我国算力资源的利用率[3]。相较于东部地区,西部地区的数据中心凭借着自然资源禀赋在节能减排上具有很大的潜力。一方面是西部地区丰富的可再生能源。可再生能源作为能源转型的核心,具有高效、清洁、低碳、环保等特点,从“东数西算”工程的4个西部算力节点来看,贵州地区有丰富的水电资源,其他3个地区则有丰富的风电资源[4]。将该资源充分应用在数据中心之上,既能降低能耗与碳排放量,又能对西部地区清洁能源产业的发展起到激励作用。另一方面是西部地区的气候因素。西部地区的气候较为凉爽,平均温度较低,数据中心在很多时间仅依靠自然冷风便能起到降温的效果,节约了制冷设备上的能耗,起到了节能降碳的作用。
(3)工作负载的转移
数据中心的工作负载在时空上具有灵活性[5]。在空间维度上,数据中心的工作任务可以通过光纤网络从一个数据中心转移到另一个数据中心进行处理。在时间维度上,数据中心需要处理的工作负载具有较大的随机性和不确定性[6],但是只要在该工作任务的截止日期之前完成即可,除去那些时效性要求较高的工作任务,其他非实时任务可以适当地进行延迟处理。在“东数西算”工程中,时效性要求较高的工作任务主要安排在当地数据中心进行处理,而那些对时效性要求不高的工作任务,则可以通过光纤网络转移到西部地区的数据中心进行处理。
由于高计算请求,数据中心每天都在消耗着巨大的能量,同时也造成了大量的碳排放,节能减排成为制约数据中心发展的主要障碍之一。学者们经过研究发现,可以利用数据中心在工作负载上的灵活性这一特点,通过负载转移[7]来降低能耗与碳排放量。Sajid等人[8]基于数据中心的地理分布对能耗成本优化问题进行了研究,并提出了一种基于区块链的分散式工作负载分布和管理模型;通过引入基于区块链的安全工作负载调度方法,考虑了电价和工作负载到达过程的时空差异,提出了地理分布式数据中心能源成本优化问题的基本方法。Guo等人[9]提出数据中心具有空间转移能源消耗的能力,可以通过将数据中心的工作负载转移至低电价地区来降低能耗成本。Ammari等人[10]认为数据中心负载转移过程可以通过使用萤火虫算法来实现,在保证服务可靠性的前提下进行调度。
上述学者都证明了数据中心的工作负载转移是可行的,但是他们只关注了负载转移在能耗成本上的效益,对其在节能减排效益上未做深入研究。部分学者[11-13]的研究更深一步,对数据中心的负载转移在节能减排上的潜力进行了挖掘,提出数据中心的负载转移可以与可再生能源相结合,达到节能减排的目的。可再生能源的生成受到光照、风力等因素的影响,因此具有不稳定性,同时数据中心因需要持续的能源供给,故而可再生能源无法直接应用在数据中心。Kwon[11]将可再生能源与数据中心的储能系统相结合,在保证服务质量的前提下降低了数据中心的电网用电。Peng等人[12]通过将数据中心的电力来源在电网能源、UPS系统和可再生能源之间进行切换,将数据中心峰值负载时期的工作转移至可再生能源产出时期进行处理,降低了数据中心的碳排放量。Goiri等人[13]构建了名为GreenSlot的工作调度器,通过预测不久后可再生能源的产出量来进行工作负载的调度,提高清洁能源的使用率。
随着地理分布式数据中心的出现,学者们的目光逐渐投向了处在不同地理位置的数据中心之间的负载转移。Bird等人[14]对分布式数据中心的应用进行了分析,认为可以通过构建一个小型的数据中心网络,将多个数据中心纳入其中,根据各地可再生能源的产出情况来进行工作负载的转移。Thimmel等人[15]也提出,由于可再生能源具有间歇性特性且不宜进行转移,每年的弃风弃光量极大,因此可以把数据中心作为媒介,通过转移工作负载来提高可再生能源的利用率,同时对于数据中心来说也能起到节能降碳的作用。Niu等人[16]对工作任务的负载情况进行了分析预测,通过负载转移将工作负载与可再生能源在时间上进行匹配,优化了调度过程带来的效益。Zheng等人[17]分析了数据中心的负载迁移在可再生能源利用和温室气体排放方面的潜力,通过模拟数据中心的工作负载从化石能源利用率高的PJM地区转移到可再生能源利用率高的CAISO地区,认为数据中心在减少碳排放量方面具有很大的潜力。
数据中心在地理位置之间的负载转移,不仅可以通过应用可再生能源来达到降低能耗与碳排放量的目的,气候条件也是一项很重要的影响因素。数据中心的核心设备——服务器在运行时会产生大量的热量,而其自身温度过高会影响其自身的性能,因此需要对应的降温措施。当前大多数数据中心采用的是空调制冷的方式,而空调等制冷设备又是高能耗设备,据分析,数据中心的用电占比中,制冷设备最高可达30%[18],仅次于服务器的功耗。虽然目前已有许多诸如液冷[19]等低能耗降温措施,但是这些技术因自身条件的限制未得到广泛使用,制冷设备的高能耗依旧是影响数据中心发展的一个重要问题。数据中心的工作负载转移至气候凉爽、温度低的地区[20],在一定的时间内可以通过自然冷却来给服务器降温,有效地降低空调等制冷系统的能耗。Deymi-Dashtebayaz等人[21]对伊朗的10个不同气候条件下的城市里的数据中心进行了研究,证明了相同配置下数据中心的能耗会因为气候条件的不同而不同。Cho等人[22]认为处于气候凉爽地区的数据中心具有节能潜力,可以使用自由冷却技术来充分利用自然风等因素降低数据中心的能耗。Liu等人[23]认为处于不同气候条件下的数据中心的节能潜力不同,并通过改变自由冷却技术的参数得到了数据中心的最大节能效益。上述研究说明,数据中心可以通过将工作负载转移至气候适宜的地区来降低制冷设备的能耗,从而降低数据中心的总体能耗与碳排放量。
以上研究说明了数据中心可以通过工作负载的转移来提高清洁能源的利用率或利用自然冷源,从而降低数据中心的能耗并减少碳排放量。在“东数西算”背景下,数据中心的负载转移由可再生能源利用率较小的东部数据中心转移到可再生能源利用率较大的西部数据中心,并且是由不宜使用自然冷源的地区转移至适宜使用自然冷源的地区。关于清洁能源的应用大多数学者考虑的是将清洁能源与工作负载在时间上的匹配,为了应对可再生能源产生的间歇性特点,将工作负载转移到可再生能源产出的时间段上,提高可再生能源的利用率。关于自然冷源的应用,现有研究也都集中在同一地区在使用自然冷源前后的能耗变化,并未对不同地区的数据中心使用自然冷源前后的能耗变化进行研究。上述研究对本文具有参考意义,但却无法应用在“东数西算”的背景之下,并且鲜有研究将清洁能源和自然冷源相结合进行分析。本文则将两个因素相结合,并考虑了工作负载传输过程新建传输管道的额外碳排放量,使用了碳排放因子法[24]对“东数西算”工程中负载转移过程的碳排放效益进行分析,并以“东数西算”工程的八大节点为研究对象进行算例分析,通过分析结果为算力承接点提供发展建议。
1 碳排放量核算方法
当前国际上关于碳排放量的核算方法并未形成一致的意见,应用较为广泛的方法主要有实测法、物料平衡法和排放因子法等。本文使用排放因子法来进行碳排放量的计算,该方法是由IPCC(政府间气候变化专门委员会)提出的,又叫碳排放系数法。
1.1 考虑可再生能源
东部地区与西部地区的发电结构中各发电类型的发电量占比并不相同。相较于东部地区,西部地区的发电结构中可再生能源发电量占比较高。假设在东西部地区的发电结构由火力发电和可再生能源发电两者构成,仅考虑发电结构中各发电类型发电量占比的不同,相同的数据中心在处理相同的工作负载时,消耗的电力是相同的。故西部数据中心在接收来自东部数据中心的工作负载的过程中减少的碳排放量可表达为:
其中,Ei为数据中心在处理工作负载时消耗的电力,Cf为火力发电的碳排放因子,Cr为可再生能源发电的碳排放因子,m是东部地区发电结构中的火力发电占比,n是西部地区发电结构中的火力发电占比。
1.2 考虑气候因素
数据中心的能耗有很大一部分来自冷却系统,冷却系统耗电量是衡量数据中心能耗利用率的一项重要因素。在西部地区,由于气候较为凉爽,服务器产生的热量有相当一部分可以通过自然冷却消散,因此冷却系统消耗的能量会相对减少,从而降低数据中心的电能使用效率(PUE)[25],提高数据中心的电能使用效率。
本节共列举两种方法用来计算冷却设备在不同地区消耗的能源,但在模型构建和算例分析时仅考虑第一个方法。
方法1:PUE是评价数据中心能源效率的基本和有效的指标之一,是数据中心消耗的所有能源与IT负载消耗的能源的比值。PUE值越接近1,表示一个数据中心的绿色化程度越高。当PUE值超过1时,则表示数据中心需要额外电力开销以支持IT负载。因此,PUE的值越高,数据中心的整体效率越低。
数据中心电能使用效率的计算式如下:
其中,EA为数据中心的总能耗,EIT为数据中心IT设备的能耗。
由于气候因素,东西部地区冷却系统的用电量不同,东部地区与西部地区相同规格的数据中心PUE值也不同。令
其中,PUEe代表东部地区数据中心的PUE值,PUEw代表西部地区数据中心的PUE值,Ee代表东部地区数据中心的能耗,Ew代表西部地区数据中心的能耗,代表东部地区数据中心的IT负载,代表西部地区数据中心的IT负载。
东部数据中心与西部数据中心在处理相同的工作负载时,IT设备消耗的能源是相同的,将两式结合可得:
西部地区与东部地区数据中心耗电比等于两地数据中心PUE之比。式(5)表示数据中心在东部地区处理一定的工作负载消耗能源为Ee时,将该工作负载转移至西部数据中心消耗的能源为(其中
将可再生能源的因素加入进行考虑:
得到数据中心在负载转移过程中由可再生能源和气候因素造成的碳排放量的变化量:
其中,Ce代表东部数据造成的碳排放量,We代表西部数据中心造成的碳排放量。
方法2:有机构估算称,即使按照工业平均电价每千瓦时0.5元来计算,数据中心所在地气温每降低1℃,10万台服务器的标准数据中心机房每天可节约9.6万元。据此可推算:数据中心所在地气温每降低1℃,一台服务器每天可节约0.96元,节省电力1.92千瓦时。在负载转移的过程中,一台服务器在一年内因东西部地区气候温度的不同而节约的电力为:
其中,Te表示东部数据中心在一年内每天平均温度的累加值,Tw表示西部数据中心在一年内每天平均温度的累加值。
其中,Va,b表示服务器数量为N1的数据中心a和b因温度差距而造成的碳排放量差值。
1.3 考虑传输过程
数据中心之间负载的转移,不可避免地需要搭建光纤线路,在此过程中会造成额外的碳排放。此过程中的碳排放来源主要有两点:铺设管道和砖砌手孔。生命周期评估方法[26]是电子工业中的一种重要的评价方法,可用于量化相关电子产品的碳排放。考虑到工作负载的传输过程,本文主要计算相关设备制造、运输阶段造成的生命周期碳排放。
(1)制造阶段
该部分主要考虑的是搭建传输通道需要的原材料在制造过程中造成的碳排放。长距离的光纤搭建普遍使用的是地埋式,使用的管道为PVC工程塑料。PVC在生产过程中主要是有两方面的碳排放:一方面是在生产过程中因化学反应造成的直接碳排放,另一方面是在生产过程中消耗能源造成的间接碳排放。
则东部数据中心与西部数据中心之间因使用PVC管道而造成的额外碳排放量为:
其中,Cpvc代表的是生产1米PVC管道造成的碳排放量,是东部与西部数据中心之间的距离,单位为米。
长途铺设管道的过程中需要搭建人(手)孔来保证管道的安全,按照规定长途管道手孔设置间隔不应超过1 km。
建造一个砖砌手孔的碳排放量为:
其中,i代表的是材料种类,Ci代表的是各种材料的碳排放因子,Mi代表的是各种材料的质量。
故传输过程中相关材料的制造造成的额外碳排放量为:
其中,CEm是制造阶段的碳排放量,Vp是生产PVC管道造成的碳排放量,Vh是建造一个砖砌手孔造成的碳排放量,S是砖砌手孔的数量。
(2)运输阶段
道路运输是相关设备的最主要运输方式,工作负载迁移需要的设备从生产地转移到施工处,运输过程则需要消耗相应的燃料能源,造成额外的碳排放。根据道路运输的碳排放系数、材料消耗量和运输距离,计算运输阶段的碳排放量,如下式所示:
其中,CEt为运输阶段的碳排放量,j为材料类型,qj为j的量,dj为j的生产地点到基站的距离,fj为j的运输车辆的碳排放系数。
(3)传输过程的总碳排放
在工作负载迁移的过程中造成的总碳排放量根据生命周期评估法计算如下:
1.4 碳排放量总变化值
在考虑可再生能源的使用、气候因素、传输过程3个因素的情况下,数据中心进行负载迁移造成的碳排放量的变化值为:
2 算例分析
2.1 参数设置
(1)发电结构及PUE值
“东数西算”工程各个节点的火力发电占比,本文采用的数据是来自国家统计局统计的2021年全国各个地区的发电结构数据,其中京津冀枢纽考虑的是张家口集群所处的河北省的发电结构,长三角枢纽考虑的是芜湖集群所处的安徽省的发电结构,具体信息见表1。本文假设东部地区数据中心的PUE值均为1.5,西部数据中心的PUE值均为1.3。
表1 2021年各地区发电结构
(2)传输通道建设
尚建选等人[27]经过计算得出PVC在生产过程中造成的总碳排放量为7.4 tCO2e/t PVC。PVC塑料管道的密度为1.34 g/cm3,目前常用的PVC管道的规格为外径110 mm,内径100 mm,通过计算可得规格为110 mm×100 mm、长度为1 m的PVC管道的质量为22.09 g,碳排放量为0.1635 kg。故铺设长度为1 m的PVC管道所消耗原材料造成的碳排放量为0.1635 kg。
砖砌手孔的材料清单见表2。结合各类材料的碳排放因子,经计算可知一个规格为90 cm×120 cm的砖砌手孔的碳排放量为678 kg,在实际生活中,砖砌手孔之间的间隔不得超过1 km。本文以1 km为间隔计算砖砌手孔的数量。
表2 砖砌手孔的材料清单(90 cm×120 cm)
根据《建筑碳排放计算标准》可知,在进行建材运输阶段碳排放量计算时,混凝土的默认运输距离值应为40 km,其他建材的默认运输距离值应为500 km。各类运输方式的碳排放因子见表3。
表3 各类运输方式的碳排放因子
2.2 结果分析
从表4的计算结果来看,在仅考虑可再生能源的应用和气候因素的情况下,数据中心将一定量的工作负载从京津冀地区转移至内蒙古地区时,该工作负载在京津冀地区每消耗1 kw·h的电力,在进行转移处理后就能减少0.2166 kg的碳排放量。通过对比东部三大数据节点分别向西部四大计算节点进行负载转移的碳排放减少量可知,东部地区的数据中心向甘肃省的数据中心集群进行转移时单位降碳量最高,内蒙古地区其次,之后则是贵州和宁夏。甘肃省单位降碳量最高主要是因为该地区近年来依托于丰厚的自然条件大力发展可再生能源生产技术,在2021年甘肃省的发电结构中,风力发电占比达到了16.08%,水力发电占比则为19.05%。
表4 不同转移路径下的单位降碳量
汇总以上提到的参数设置,通过计算可得数据中心在进行负载转移时所需搭建传输过程的单位碳排放量为1 557.5 kgCO2e/km。
为了更加明确地分析数据中心通过负载转移造成的碳排放变化量,将以上内容进行结合分析。在Zheng等人[17]的研究中,一个有40 000台服务器且功率为10 MW的数据中心在一周内的总能耗为2 190 577 kW·h。本文以如此规格的数据中心进行研究。研究结果见表5,第二列表示案例数据中心在一周内减少的碳排放量,第三列则是按照传输通道使用寿命为50年进行计算得出在一周内的碳排放量。
表5 不同负载转移路径下的碳排放量变化情况
从上述分析结果来看,相较于因为可再生能源和气候因素而降低的碳排放量,因为搭建传输通道而增加的碳排放量是极低的,在“东数西算”的背景下进行数据中心负载转移对于节能降碳来说起到了正向促进作用。
2.3 灵敏度分析
灵敏度分析是模型参数不确定性分析的一部分,它主要分析模型参数在取值范围内发生少量变化而导致模型输出结果的变化。本节以可再生能源利用率、算力承接点PUE值为自变量,以碳减排效益为因变量,完成负载转移过程的灵敏度分析。其他参数保持不变,具体设置如下:数据中心在处理工作负载时消耗的电力为1 kW·h,东部地区火力发电占比为85%,火力发电碳排放因子为0.81 kgCO2e/(kW·h),可再生能源碳排放因子为0,东部地区数据中心PUE值为1.5。
西部地区PUE值对于碳减排效益来说有重要影响。PUE指的是一个数据中心的电能使用效率,它越小越好,且最低值为1。PUE可用来衡量一个数据中心中非IT设备的用电量,西部地区凭借着凉爽的天气可降低制冷系统的用电量,从而降低数据中心的PUE值,并同时减少碳排放量。在保持其他参数不变的条件下,分析西部地区的数据中心PUE值对碳减排效益的影响,结果如图2所示。
图2 碳减排效益随西部地区PUE值的变化
由图2可知,西部地区数据中心PUE值与碳减排效益呈反比关系,PUE值每降低10%,碳减排效益就能提升3.24%,PUE值最低为1,此时的碳减排效益为0.365 kgCO2e/(kW·h)。
可再生能源的比例对于碳减排效益来说有着重要影响。西部地区数据中心对可再生能源的消纳程度更大,意味着减少的碳排放量越多。在保持其他条件不变的条件下,分析西部地区可再生能源的比例对碳减排效益的影响,结果如图3所示。
图3 碳减排效益随西部地区可再生能源比例的变化
由图3可知,西部地区可再生能源比例与碳减排效益呈正比,可再生能源比例每增加10%,碳减排效益就能提升7.37%。可再生能源比例最高为100%,此时的碳减排效益为0.6885 kgCO2e/(kW·h)。
3 结论与建议
本文针对“东数西算”背景下数据中心的负载转移带来的减排问题,在考虑可再生能源和气候条件的基础上构建了碳排放量核算模型,并使用生命周期评估方法充分考虑了数据传输过程所需搭建传输通道造成的额外碳排放。研究结果如下。①不同地区用电结构中可再生能源的比例和气候条件的不同会对数据中心的碳排放造成影响,在保持数据中心IT设备能耗不变的条件下,可再生能源比例的提高以及电能使用效率的降低都会对碳排放量的降低起到促进作用。不同的工作负载转移路径下有不同的单位降碳量,最高碳减排转移路径主要取决于负载接收方用电结构中的可再生能源比例和PUE值,例如,算例分析中在PUE相同的情况下,甘肃地区得益于丰厚的自然条件和先进的可再生能源生产技术,其碳减排能力位于4个地区的最高水平。②相较于数据中心因工作负载转移所减少的碳排放量,传输过程中的额外碳排放量可以忽略不计,也就是说“东数西算”工程具有显著且正向的碳减排效益。③以算力承接点的可再生能源利用率和PUE值为自变量对碳减排模型进行了灵敏度分析,通过提高数据中心的电能使用效率,碳减排效益最高可为0.365 kgCO2e/(kW·h),且当数据中心的电力完全由可再生能源提供时,碳减排效益为0.6885 kgCO2e/(kW·h)。
本文的研究结果已经证明,依托于算力承接方丰富的自然资源禀赋,负载转移过程会带来正向的碳减排效益。结合本文的研究结果以及“东数西算”工程的实施路径,提出以下建议。①提高电能使用效率。作为评判数据中心能效关键的指标之一,PUE值一直备受重视,数据中心应选址在平均温度较低的地区,通过使用自然冷却技术为服务器制冷创造有利条件,从而降低制冷系统的能耗,提高数据中心的电能使用效率。②发展可再生能源。数据中心的未来发展方向一定是绿色的、节能的,而可再生能源将会是该过程的关键因素,数据中心消纳可再生能源具有广阔的市场,且发展可再生能源有利于促进生态环境和社会经济的可持续发展。研发更高效、更经济可靠的可再生能源发电技术,加大可再生能源的开发力度,加深可再生能源的消纳程度,对解决数据中心的能耗问题有重要的作用,同时在储能技术上的突破可以减少“弃光弃电”现象的发生,发展出数据中心和可再生能源有机结合的绿色新格局。③建立协作发展机制。西部地区可通过土地价格、电力成本、自然资源禀赋和相关政策来吸引数据中心项目落地,同时促进东部地区的工作负载向西部进行转移,深挖西部地区的算力资源,通过推动数据要素在东西部跨域的流动,带动东部地区的互联网企业将自身的产业链环节延伸至西部地区,进而带动西部地区相关产业的发展,促进东西部地区的协同联动,实现资源的优势互补。④完善基础设施建设。在大力发展数据中心的同时,其配套基础设施诸如电站与电网的建设也要并肩前进,避免出现服务器“等电”的现象。同时东西部地区之间也要完善跨省网络连通,为客户提供更好更快的网络带宽服务。