“东数西算”工程算力保障研究
2024-04-26黄朝椿罗以洪孙金良
黄朝椿 罗以洪 孙金良
(贵州省社会科学院,贵州 贵阳 550002)
一、引言
随着新一代信息技术的飞速发展,数据成为关键生产要素[1],已渗透到人们生活的方方面面,成为驱动经济增长、推动社会进步的重要动力。习近平总书记指出:“充分发挥海量数据和丰富应用场景优势,促进数字技术和实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济”[2]。算力作为数字经济时代的关键生产力要素,已经成为挖掘数据要素价值,推动数字经济发展的核心支撑力和驱动力,是各国战略竞争中高度重视的新焦点[3],已成为国与国之间竞争的核心竞争力[4]。
2021年5月,国家发展改革委等四部门联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》提出:“统筹围绕国家重大区域发展战略,根据能源结构、产业布局、市场发展、气候环境等,在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点和数据中心集群”[5],并于2021年11月至2022年2月陆续复函同意在宁夏、内蒙古、甘肃、贵州、粤港澳大湾区、成渝、长三角、京津冀等8地启动建设国家算力枢纽节点,并规划了中卫、和林格尔、庆阳、贵安、韶关、天府、重庆、长三角生态绿色一体化发展示范区(以下简称长三角)、芜湖、张家口等10个国家数据中心集群,标志着国家级超级工程“东数西算”工程正式全面启动。
“东数西算”工程旨在充分发挥东、西部地区比较优势,对全国算力资源进行有效配置,以实现东、西部算力资源协同发展和数据要素跨区域流动,形成优势互补、高质量发展的算力经济发展格局。算力经济的发展离不开稳定、可持续的算力供给,稳定、可持续的算力供给又需要高效的算力保障。因此,测算十大数据中心集群的算力保障能力,充分发挥其比较优势,已成为一个非常值得研究的问题。
二、文献综述
近年来,关于算力相关方面的研究方兴未艾。在算力理论方面,刘宇航等提出了计算概念谱系,认为算力是应用程序所能实际获得的计算能力[6]。吕廷杰和刘峰探讨了分布式形态下算力网络的可研究和落地方向,认为分布式算力网络有望成为未来十年最值得期待的信息基础设施变革之一[7]。陈晓红等通过剖析算力服务发展过程中存在的问题,提出了算力服务体系建设的总体架构、重点战略和发展路径[8]。在算力测算相关方面,主要是通过选取相关指标,构建评价指标体系,测算算力相关指数,如全球计算力指数、算力发展指数、算力综合指数、算力服务发展指数等。2021年2月,浪潮信息联合IDC发布《2020全球计算力指数评估报告》,该报告从计算能力、计算效率、应用水平和基础设施支持四个维度选取19个二级指标构建全球计算力指数评估模型,对全球重点国家计算力水平进行评估,得出“计算力是数字经济时代的核心生产力,计算力与经济增长密切相关,计算力指数平均每提高一个点,数字经济和GDP将分别增长3.3‰和1.8‰”[9]。同年9月,中国信通院发布《中国算力发展指数白皮书》,从算力规模、算力环境、算力应用三个维度选取7个二级指标、8个三级指标构建中国算力发展指标体系,对我国各省市的算力发展水平进行评价与分析[10]。2022年7月,中国信通院等在中国算力大会上联合发布《中国综合算力指数(2022)》,从算力、存力、运力、环境四个维度选取8个二级指标32个三级指标构建中国综合算力指标体系,并对我国各省市的综合算力水平进行评价与分析[11]。2023年7月,中国信通院发布《中国算力服务发展报告》,从资源服务化、应用赋能、产业发展、服务体验四个维度选取11个二级指标、22个三级指标构建中国算力服务发展指标体系,对我国各省市的算力服务水平进行评价与分析[12]。截至目前,浪潮信息、中国信通院等机构每年都会对构建的指标体系进行更新完善,并对外发布新的测算与评价结果。
尽管目前关于算力测算的相关研究成果颇丰,但依然存在丰富拓展的空间。在研究内容上,目前的研究主要体现在算力水平、算力发展、算力服务等方面,很少涉及算力保障方面。算力经济归根结底是能源经济,算力的发展离不开能源的有效供给。据统计,算力中心耗电量巨大,电力成本占总成本的60%-70%,1PFLOPS算力每天要耗电大约2400kWh,每年仅电费成本就达76.2万元(1)中国工信新闻网,5G基站和算力产品是运营商的两只“电老虎”https://www.cnii.com.cn/rmydb/202308/t20230803_492458.html。。“东数西算”工程之所以被提出,主要是基于东部发达地区旺盛算力需求下严峻的能源供给压力,拟通过规划算力产业布局,充分利用西部地区良好的生态环境、丰富的自然资源以及突出的能源优势,为东部发达地区的算力提供稳定、持续、高效的算力保障,同时也可以进一步深化东西部协作,构建东西部协同发展新格局。鉴于此,本文将从算力的定义出发,提出算力保障及其定义,并基于该定义从算力水平、基础条件、公共服务、自然环境、发展生态五个维度,选取19个二级指标构建算力保障指标体系,使用熵权-TOPSIS法对中国十大数据中心集群的算力保障水平进行测算、评价与分析,以期丰富该领域的理论和实证研究,并为研究算力提供了新的视角,亦为国家相关部门及各相关省市制定相关政策提供决策参考。
三、算力保障评价体系构建
(一)指标选择
《中国算力白皮书(2022年)》认为:算力是数据中心的服务器通过对数据进行处理后实现结果输出的一种能力[13]。至于算力保障,可从两方面考虑,一方面是保障数据能够被处理的能力,另一方面是对数据处理过程及结果输出提供保障的能力。因此,本文将算力保障定义为保障数据能被处理并对数据处理过程及结果输出提供保障的能力。基于该定义,本文将从算力水平、基础条件、公共服务、自然环境、发展生态五个维度选取指标。
1.算力水平。算力水平是数据中心的服务器处理数据并实现结果输出的能力水平,可用算力规模、上架率、PUE、数据中心规模、国家级超算中心数量等来衡量。算力规模是指数据中心或计算系统所具备的计算能力大小,是衡量一个国家或地区算力水平的重要标准,一般情况下,算力规模越大,算力水平越高。上架率是指数据中心实际使用机架数与总机架数的比值,上架率的高低反映了数据中心设备利用情况和运营效率。PUE是数据中心消耗的所有能源与IT负载消耗的能源的比值,是用来评价数据中心能源效率的指标。PUE值越低,表示数据中心能效水平越高。超算中心是算力枢纽保障基地的重要组成部分,是配备超级计算机的数据中心,具有强大的计算能力,能处理复杂、大规模的计算任务,代表着顶级的算力。
2.基础条件。基础条件是保障数据中心正常运行的内在条件,可用省际出口带宽、机架规模、数据中心网络时延测量。省际出口带宽是指一个省份与其他省份以及国际互联网之间互联互通的网络带宽。由于算力需要高速、稳定的网络连接来支撑,省际出口带宽的扩大,能够保障海量数据顺畅传输,提升了地区的网络通达性和算力效率,使得更多数据能够顺畅地传输和交换,促进云计算、大数据、人工智能等产业快速发展。数据中心机架规模是衡量数据中心能力的重要指标之一,数据中心内部所配备的机架,主要用于承载服务器、存储设备等IT基础设施,机架规模的大小直接关系到数据中心的计算能力和存储容量。数据中心网络时延是指在数据中心内部,数据从源服务器传输到目标服务器所需的时间。网络时延越低,数据传输速度就越快,算力效率也就越高。
3.公共服务。公共服务是为数据中心算力提供服务保障的能力,可用电价、人均发电量、土地价格、土地使用税来衡量。电价对算力具有关键性影响,算力需要消耗大量的电,电费成本占数据中心经营总成本的60%左右,因此,各数据中心的竞争往往是电价的竞争。人均发电量反映区域内发电能力对群众生活与生产的保障力度,人均发电量越高,对群众生活的保障能力越强,越有能力和条件对数据中心进行供电。土地价格与土地使用税是指用于建设和运营数据中心等算力设施的土地的价格和使用税,一般情况下,土地价格或土地使用税越低,算力成本越低,算力保障水平越高。
4.自然环境。自然环境是数据中心算力保障的外在条件,可用气温离差、空气质量、距离来衡量。数据中心的理想温度一般在20℃到25℃之间,在这个温度范围内,设备的散热效果最好。当温度高于这个范围,就需要通过水冷、通风、空调等其他手段降温。数据机房的电子通信设备对其场所的空气质量尤其敏感,若灰尘、腐蚀性气体浓度长期超标,会影响设备使用寿命,严重的会导致宕机事故。距离是指算力需求方与算力数据中心的距离,算力需求方距离算力数据中心越远,数据中心网络时延越长,经济成本越高。
5.发展生态。发展生态是数据中心算力保障的软基础,可用环境安全、发展年数、政策力度和人才储备来衡量。环境安全主要指数据中心免受外部自然环境破坏的能力,可用地质灾害发生数量来衡量,地质灾难包括地震、滑坡、泥石流等,地质灾害越少越能保证算力基础设施的稳定运行。地区算力保障发展年数越长,地方政府的算力发展意识就越强,共识就越高,推动有关工作的力度就越大。政策力度是数据中心集群所在省份历年印发的算力经济、数据经济、数字经济、人工智能相关的政策文件数量,它直接体现各地对算力产业发展的重视程度与保障力度。人才储备反映数据中心集群的发展潜力与内生动力程度,一般情况下,人才储备越充足,研发能力越强,算力保障能力也越强。
(二)指标体系建立
基于我国“东数西算”工程十大数据中心集群算力保障情况,在对企业和政府相关部门充分调研基础上,综合中国信通院等研究机构对算力测度及相关指标体系研究,基于指标数据的可获得性及来源权威性,选取19个二级指标,从算力水平、基础条件、公共服务、自然环境、发展生态五个一级指标维度,全面客观地评价我国“东数西算”工程十大数据中心集群的算力保障水平(见表1)。在确定二级指标数据时,本文尽可能地将总量指标转为比例指标、结构指标和强度指标等形式,以减少因度量造成的误差[14]。
表1 算力保障指标体系、计算口径及权重
表2 算力保障指数描述性统计
(三)数据来源及解释说明
本文选取2022年全国“东数西算”工程十大数据中心集群为研究样本,对其算力保障能力进行量化评估,其中,长三角生态绿色一体化发展示范区数据中心集群的数据用苏州的数据来替代。本文各指标数据主要来源于《中国统计年鉴》、中国信通院、各地方政府官网、相关政策文件、网络公开数据综合整理等。
1.算力水平数据。算力规模用算力规模指数表示,数据来源于《2023中国算力发展指数白皮书》,上架率用实际使用机架/机架数来表示,数据来源于网络公开数据整理;PUE为数据中心总能耗与IT设备耗电量的比值,数据来源于网络公开数据整理;数据中心规模用数据中心数量来表示,数据来源于网络公开数据整理;国家级超算中心用国家级超算中心来表示,数据来源于网络公开数据整理。
2.基础条件数据。省际出口带宽数据来源于《2022年通信业年度统计数据》;机架规模用机架数来表示,数据来源于网络公开数据整理;数据中心网络时延数据来源于网络公开数据整理。
3.公共服务数据。电价统一采用两部制35千伏电度电价表示,数据来源于北极星售电网;人均发电量为发电量/人口数,发电量数据来源于北极星售电网,人口数数据来源于《中国统计年鉴》;土地价格用工业用地平均地价表示,数据来源于网络公开数据整理;土地使用税用工业用地土地使用税表示,数据来源于网络公开数据整理。
4.自然环境数据。气温离差为全年每月最高气温与最适温度(22℃)离差平均数,数据来源于天气网官网数据整理;空气质量用空气质量指数表示,数据来源于《全国城市空气质量报告》及各城市生态环境局官网数据整理;距离用距离主要大城市的平均距离表示,数据来源于ArcGIS测算整理。
5.发展生态数据。环境安全用近10年地质灾害总数/省(市)面积表示,近十年地质灾害总数数据来源于国家统计局官网,各/省(市)面积数据来源于全国行政区划信息查询平台官网;发展年数用现在-数据中心建设开始年份表示,数据来源于网络公开数据整理;政策力度用政府出台的算力相关政策数量表示,数据来源于网络公开数据整理;人才储备用规模以上工业企业R&D全时当量表示,数据来源于《中国统计年鉴》。
(四)评价方法
1.评价方法选择
算力保障指标体系作为多维度、多指标的综合评价指标体系,需要选取多指标综合评价方法将多项指标合成单一指数进行考察。将多项指标综合成算力保障综合指数,核心在于对各项指标进行赋权,进而使用加权函数法获得算力保障各级指数和综合指数[15]。赋权方法主要分为主观赋权法和客观赋权法,主观赋权法主要有层次分析法、效用值法、均权法等,客观赋权法有熵权法、主成分分析法等。本文将采用客观赋权法—熵权法对算力保障指标体系的各级指标进行赋权,然后利用TOPSIS法对算力保障指数及分指数进行量化排序。与主观赋权法相比,熵权法是根据各指标的变异程度,利用信息熵计算出各指标的熵权,再通过熵权对各指标的权重进行修正,客观地确定每个指标的权重大小,这样可以避免主观赋权法的人为因素,得出的权重更客观、科学[16]。
2.熵权法确定指标权重
(1)标准化处理。
(1)
(2)
其中,xij表示i集群j指标的原始值,Xij表示标准化后的指标值,maxxij和minxij分别表示xij的最大值与最小值,i=1,2,...,n;j=1,2,...,m。
(2)计算指标比重Pij。
(3)
(3)计算指标信息熵Ej。
(4)
(4)计算效用值Dj。
Dj=1-Ej
(5)
(5)计算权重系数Wj。
(6)
其中,Wj为二级指标的权重系数,一级指标权重系数等于所属二级指标权重系数之和。
3.TOPSIS法确定算力保障指数
(1)构建加权矩阵。
Yij=Wj·Xij
(7)
(2)计算与正、负理想解距离D+、D-。
(8)
(9)
(3)计算与理想解的贴近程度相近接近度C。
(10)
其中,Ci代表算力保障指数得分,0≤Ci≤1,Ci越大,代表i集群距离正理想解越近,距离负理想解越远,则i集群的算力保障能力越优。
四、算力保障能力评价分析
利用熵权法,测算出5个一级指标、19个二级指标的指标权重(见表1),在此基础上,利用TOPSIS法测算出“东数西算”工程十大数据中心集群的算力保障指数(见图1)及分指数(见图2-6)。
图1 十大集群算力保障指数
图2 十大集群算力水平分指数
(一)算力保障指数
从整体上看,十大集群的算力保障能力均有待提升,算力保障指数普遍偏低,均低于60,分布于四个梯队。贵安、中卫、和林格尔和庆阳的算力保障能力总体较高,位于第一梯队,算力保障指数达到55以上,张家口、韶关、长三角位于第二梯队,算力保障指数达到50以上,天府单独位于第三梯队,算力保障指数达到40以上,而重庆和芜湖位于第四梯队,算力保障指数为30以上。西部集群的算力保障指数普遍高于东部集群,这主要得益于西部地区得天独厚的自然环境和质优价廉的公共服务,这些因素为数据中心的高效稳定运行提供了有力保障。同时,这种优势为西部地区“东数西算”工程保障能力的发展提供了强有力的支撑。西部集群之间的差距相对较小,各集群均具有独特的优势。“东数西算”工程为西部地区提供了一个发挥其比较优势的机会,为推动“东数西算”工程战略的有效实施,东、西部集群可以通过相互协作,充分发挥各自优势,实现优势互补和互利共赢。
从算力保障指数描述性统计分析,就平均值而言,十大集群算力保障指数平均值为49.76,西部集群算力保障指数平均值为56.13,高出平均水平6.37,东部集群算力保障指数平均值为45.51,比平均水平低了4.25,与西部集群存在一个梯队的差距;就标准差而言,十大集群算力保障指数标准差为7.55,西部集群算力保障指数标准差为1.00,各集群之间差距较小,发展较为均衡,东部集群平均算力保障指数为6.91,均衡性相对较差。由此可见,西部集群算力保障能力较强,且发展较为均衡,而东部集群算力保障能力较弱,且发展不均衡,导致十大集群算力保障发展不均衡。
(二)算力水平分指数
从算力水平分指数总体来看,韶关的算力水平位于领先地位,算力水平分指数达到60以上,单独位于第一梯队。中卫、重庆、长三角位于第二梯度,算力水平分指数为40以上,与韶关差距较大,具有较大的提升空间。天府、张家口、贵安位于第三梯队,算力水平分指数为30以上,庆阳、和林格尔位于第四梯队,算力水平指数为20以上,芜湖位于第五梯队,算力水平指数仅达到10以上(见图2)。
在算力水平二级指标中,指标权重排名依次为PUE、国家级超算中心、上架率、数据中心规模、算力规模。韶关具有2个国家级超算中心,算力规模和数据中心规模在十大集群中都处于领先水平,其算力水平分指数自然处于遥遥领先位置,而芜湖没有国家级超算中心,PUE值大,算力规模小,导致其算力水平分指数极其低。PUE方面,排名前五的为重庆、中卫、韶关、贵安、张家口,其数值均不高于1.3,其中重庆和中卫甚至不高于1.2;国家级超算中心方面,十大集群中共有6个,其中韶关和长三角各2个,张家口和天府各1个,其他集群0个;上架率方面,排名前五的是中卫、重庆、天府、庆阳、贵安,数值均达到60%以上,其中中卫上架率更是高达85%,遥遥领先于其他集群;数据中心规模方面,排名前四的是天府、韶关、长三角、芜湖,数据中心数量均不低于100个,其中天府和韶关均达到300个以上;算力规模方面,排名前三的是韶关、长三角、张家口,其中,韶关的算力规模指数高达70以上,而排名第二的长三角仅达到50以上。
从算力水平分指数描述性统计分析(见表3),就平均值而言,十大集群算力保障指数平均值为37.93,西部集群算力保障指数平均值为32.17,比平均水平低了5.76,东部集群算力保障指数平均值为41.77,高出平均水平3.84,高出西部集群一个梯度;就标准差而言,十大集群算力水平分指数标准差为14.22,西部集群算力保障指数标准差为11.04,东部集群平均算力保障指数为15.71,无论是从整体还是从分部来看,算力水平都发展不均衡。由此可见,西部集群算力水平相较于东部整体偏低,且发展都不均衡。
表3 算力水平分指数描述性统计
(三)基础条件分指数
十大集群的基础条件相对较好,基础条件分指数普遍较高(见图3)。其中,天府、长三角位于第一梯队,基础条件分指数达到70以上,韶关、庆阳、贵安、张家口位于第二梯队,基础条件分指数达到60以上,重庆、中卫、和林格尔位于第三梯队,基础条件分指数达到50以上,芜湖位于第四梯队,基础条件分指数仅达到10以上,与其他九大集群存在较大的差距。
图3 十大集群基础条件分指数
基础条件的二级指标中,指标权重排名依次为数据中心网络时延、省际出口带宽、机架规模。天府的数据中心网络时延最小,长三角的机架规模最大,皆具有明显的基础条件优势,而芜湖的数据中心网络时延最大,省际出口带宽和机架规模也不具备优势,导致其基础条件分指数偏小。数据中心网络时延方面,排名前三的是天府、庆阳和中卫,其数据均低于20ms;省际出口带宽方面,韶关、长三角省际出口带宽超过100Tbps,位列前二,天府、张家口省际出口带宽超过70Tbps,位于三、四名,中卫省际出口带宽仅超过10Tbps,排在最后一名。机架规模方面,排名前三的是长三角、和林格尔和天府,机架数量均超过15万架,其中,长三角机架数量高达35万架,远高于第二名的15万架。
从基础条件分指数描述性统计分析(见表4),就平均值而言,东部集群和西部集群的基础条件分指数平均值差距不大;就中位数而言,东部集群基础条件分指数中位数为64.61,而西部集群基础条件分指数中位数为59.74,比西部集群低了4.83;就标准差而言,西部集群基础条件分指数标准差为4.32,而东部基础条件分指数标准差为24.13,远远大于西部集群。由此可见,整体而言,东部集群基础条件略好于西部,但东部集群内部发展较不均衡,两极分化较为严重,而西部集群发展相对较为均衡。
表4 基础条件分指数描述性统计
(四)公共服务分指数
西部集群的公共服务能力明显高于东部集群(见图4)。其中,庆阳、中卫与和林格尔排名前三,公共服务分指数在70左右,位于第一梯度;芜湖、韶关、贵安、天府的公共服务分指数在50左右,位于第二梯队,与第一梯度有较大的差距;张家口、长三角、重庆的公共服务指数在20以上,位于第三梯度,与前两梯队存在明显的梯度差距。
图4 十大集群公共服务分指数
公共服务二级指标中,指标权重排名依次为土地价格、电价、土地使用税、人均发电量,庆阳、中卫、和林格尔的土地价格和电价均较低,其在公共服务方面则存在明显的竞争优势。土地价格方面,中卫、和林格尔、芜湖、庆阳、贵安的工业用地平均地价均不超过300元/平方米,其中中卫不超过100元/平方米,和林格尔和芜湖不超过200元/平方米;电价方面,中卫、和林格尔、庆阳排名前三,其电度电价分别为0.4元/kWh、0.42元/kWh、0.44元/kWh,韶关、天府、张家口位于4-6名,电度电价分别为0.55元/kWh、0.56元/kWh、0.58元/kWh,与前三存在较大的差距;土地使用税方面,十大集群的工业用地土地使用税平均价格差距不大,西部的集群略微低于东部集群;人均发电量方面,中卫和和林格尔排名前二,人均发电量均超过2.5万kWh/人年,庆阳排在第三,人均发电量不到1万kWh/人年,与前两位存在明显差距。
从公共服务分指数描述性统计分析(见表5),就平均值而言,十大集群公共服务分指数平均值为48.64,西部集群公共服务分指数平均值为65.82,高出平均水平17.18,东部集群公共服务分指数平均值为37.19,比平均水平低了9.45,与西部集群存在两个梯度的巨大差距;就标准差而言,十大集群公共服务分指数标准差为19.00,西部集群公共服务分指数标准差为11.82,东部集群平均算力保障指数为13.12,无论是从整体还是从分部来看,公共服务水平发展都不均衡。由此可见,西部集群的公共服务水平高出东部集群两个梯度,但无论是东部集群还是西部集群,公共服务均衡性都较差。
表5 公共服务分指数描述性统计
(五)自然环境分指数
如图5所示,贵安的自然环境处于领先水平,自然环境分指数高达70以上,单独位于第一梯队;庆阳和张家口自然环境分指数为60以上,位于第二梯队;和林格尔自然环境分指数为50以上,单独位于第三梯度,长三角、韶关、芜湖的自然环境分指数为40以上,位于第四梯队;中卫、重庆、天府的自然环境指数为30以上,位于第五梯队。
图5 十大集群自然环境分指数
自然环境二级指标中,指标权重排名依次为气温离差、空气质量、距离,贵安、庆阳、张家口的气温离差和空气质量均较优,即使距离较远,但由于距离权重较低,其自然环境分指数也较高。气温离差方面,庆阳和贵安排名前二,全年每月最高气温与最适温度离差平均数均不超过2℃,和林格尔、张家口紧随其后,全年每月最高气温与最适温度离差平均数均不超过3℃,韶关表现最差,全年每月最高气温与最适温度离差平均数为5.5℃;空气质量方面,排名前三的分别为韶关、贵安、张家口,其空气质量指数分别为2.50、2.53、2.55,庆阳排在第四,其空气质量指数为3.2,与前三有明显的差距;距离方面,东部集群占优,排名前五的分别是芜湖、长三角、重庆、韶关、庆阳,距离主要大城市的平均距离均不超过1000公里。
从自然环境分指数描述性统计分析(见表6),就平均值而言,十大集群自然环境分指数平均值为49.04,西部集群自然环境分指数平均值为57.06,高出平均水平8.02,东部集群自然环境分指数平均值为43.69,比平均水平低了5.35,与西部集群存在一个梯队的差距;就标准差而言,十大集群、西部集群、东部集群自然环境分指数标准差分别为13.99、15.42、11.13,均衡性均相对较差,西部集群的均衡性相对更差。由此可见,西部集群自然环境条件相对于东部集群表现较好,但就均衡性而言,都比较差,而西部集群均衡性更差。
表6 自然环境分指数描述性统计
(六)发展生态分指数
十大集群的发展生态存在明显的梯度差距(见图6),和林格尔、长三角、中卫、贵安、张家口生态发展分指数均达到60以上,表现较好,位于第一梯队;庆阳和芜湖生态发展分指数为30以上,位于第二梯队,与第一梯队存在显著差距;韶关和天府生态发展分指数为20以上,位于第三梯队;重庆生态发展分指数为10以上,单独位于第四梯队。
生态发展二级指标中,指标权重排名依次为环境安全、发展年数、政策力度、人才储备,和林格尔、张家口、中卫地质灾害较少,发展年份长,即使其人才储备不足,但由于人才储备权重较低,其发展生态指数也较高;长三角人才储备足,地质灾害少,其发展生态指数也较高;而重庆、四川、安徽、广东地质灾害频繁,导致其发展生态指数偏低。环境安全方面,排名前五的是和林格尔、张家口、长三角、中卫、贵安,近10年单位面积地质灾害数均不超过50次/万平方千米,其中和林格尔不超过1次/万平方千米,张家口不超过10次/万平方千米,长三角和中卫不超过20次/万平方千米;发展年数方面,各集群的差距不大,其中,数据中心建设最早的是和林格尔,内蒙古自治区政府与中国电信集团于2011年签署战略协议,在呼和浩特市和林格尔县建设北方最大的云计算基地——中国电信云计算信息园;政策力度方面,出台相关文件最多的是贵安,已出台文件高达40份以上,具备比较完善的政策保障体系,其他各集群出台的相关文件一般为几份到20几份不等,与贵安存在明显的差距;人才储备方面,韶关、长三角排名前二,所在省规模以上工业企业R&D全时当量分别为709119人年、612676人年,芜湖排名第三,所在省规模以上工业企业R&D全时当量为170421人年,与前两名存在巨大差距。
从发展生态分指数描述性统计分析(见表7),就平均值而言,十大集群发展生态分指数平均值为46.93,西部集群发展生态分指数平均值为58.95,高出平均水平12.02,东部集群发展生态分指数平均值为38.92,比平均水平低了8.01,与西部集群存在两个梯队的差距;就标准差而言,十大集群、西部集群、东部集群自然环境分指数标准差分别为21.13、16.53、21.16,均衡性均相对较差,东部集群的均衡性相对更差。由此可见,西部集群算力发展生态较好,但就均衡性而言,都比较差,但东部集群均衡性更差。
表7 发展生态分指数描述性统计
五、研究结论及政策建议
(一)研究结论
本文通过对“东数西算”工程战略布局的研究,提出了算力保障,构建了包括算力水平、基础条件、公共服务、自然环境、发展生态五个一级指标,下辖19个二级指标的算力保障指标体系,并用熵权-TOPSIS法对全国十大数据中心集群的算力保障能力进行了测算、评价与分析,得出以下结论:
从算力保障指数看:①十大集群的算力保障能力均有待提升,算力保障指数普遍偏低,分布于四个梯队。贵安、中卫、和林格尔和庆阳的算力保障能力相对较高,位于第一梯队,张家口、韶关、长三角位于第二梯队,天府单独位于第三梯队,重庆和芜湖位于第四梯队。②得益于得天独厚的自然环境和质优价廉的公共服务,西部集群算力保障能力整体较强,且发展较为均衡,而东部集群算力保障能力较弱,且发展不均衡。
从算力保障分指数看:①各个集群在算力保障分指数上都有独特的优势,整体而言,东部集群在算力水平方面强于西部集群,在基础条件方面略优于西部集群,而在公共服务、自然环境、发展生态三个方面与西部集群存在巨大差距。②在发展均衡性方面,十大集群的整体均衡性较差,除西部集群在基础条件均衡性较好外,东、西部集群在其他方面的均衡性也均较差,而东部集群的均衡性更差。
(二)政策建议
1.统筹规划,避免同质化低水平竞争
东、中部许多省份和地区从自身经济发展、财政税收、数据安全、网络时延等利益出发,出现各自为政、盲目跟风、重复建设、同质化竞争等现象,可能最终会导致能源利用率下降、资金浪费、算力碎片化、算力资源浪费[17]等问题,有悖于国家“东数西算”工程战略布局。因此,从国家层面统筹规划势在必行。一是加大数据中心监管力度,限制东、中部地区低效率数据中心批建。二是出台税收优惠、补贴等支持性政策,鼓励东、中部地区算力需求企业将后台加工、离线分析、存储备份等对网络时延要求不高的业务交由西部数据中心处理。三是谋划用电配额制方案,对超过配额部分实行“惩罚性”阶梯售价,倒逼地方政府执行“东数西算”工程战略布局。
2.通力协作,构建算力发展新格局
东、中部地区应加大省内数据中心建设监管力度,坚决取缔低效率数据中心,引导其走高效、清洁、集约、循环的绿色发展道路,以满足工业互联网、金融证券、灾害预警、远程医疗、视频通话、人工智能推理等网络时延要求较高业务的算力需求。而对于后台加工、离线分析、存储备份等网络时延要求不高的业务,可与西部距离较近的省份加强对接,签署算力战略合作协议,推动数据中心向西大规模布局。通过东、西部算力协作,一方面既可以满足东部旺盛的算力需求,又能缓解其紧张的能源供给压力,还可以降低东部算力需求企业的运营成本。另一方面也能推动西部地区产业结构优化和转型升级,使西部地区有更多机会参与到东部地区的产业链中,实现资源优势互补,促进区域经济协调发展。
3.同心协力,降低企业用电成本
目前,电价成为限制数据中心发展的最大瓶颈。据统计,当电价为0.35元/kWh时,数据中心才能勉强维持正常运营,而在目前公示的官方电价中,十大集群中最低是宁夏中卫的0.4元/kWh,最高的是安徽芜湖0.63元/kWh,平均电价是0.56元/kWh,与0.35元/kWh的目标电价相差甚远。根据华为公司提供的数据,通算1e每年需耗电10亿kWh以上,电费每降低0.01元可节省成本1000万元以上。因此,降低算力企业用电价格刻不容缓。一是加大力度开发太阳能、风能等低成本绿色能源,创新高效储能技术,谋划算力用电专网专线,建立完善、可靠、低成本的算力用电供给体系。二是国家、地方政府、电网公司、算力企业等多方协作,根据各集群的现实情况,谋划企业用电补贴问题,制定出国家满意、地方政府可承受、电网公司可接受、企业有盈利的行之有效的电费补贴方案。