角逐3万亿算力产业“关键一环”,多方加速布局算力调度
2023-12-11张申宇
张申宇
中国算力产业正处于快速发展的黄金阶段。据工业和信息化部发布的数据,2022年中国算力核心产业规模达到1.8万亿元,根据《中国算力产业发展白皮书》的数据显示,中国算力产业规模持续扩大,增速居全球前列。预计到2023年,中国算力产业规模将超过3万亿元,年均增速将超过30%。算力正加速向政务、工业、交通、医疗等各行业各领域渗透。
截至2023年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197EFLOPS,位居全球第二。算力总规模近五年年均增速近30%,存力总规模超过1080EB。
但在快速发展的同时也面临诸多问题,这其中,如何实现快速高效的算力调度首当其冲。
10月8日,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合印发了《算力基础设施高质量发展行动计划》(以下简称《行動计划》),明确了未来三年算力基础设施发展的具体目标,并从计算力、运载力、存储力以及应用赋能四个方面提出了到2025年发展量化指标,引导算力基础设施高质量发展。
《行动计划》中提出,探索算力协同调度机制。推动以云服务方式整合算力资源,充分发挥云计算资源弹性调度优势。鼓励各方探索打造多层次算力调度架构体系,建设可满足各类创新主体开展多元异构算力调度、应用、研发、验证的平台环境。依托国家新型互联网交换中心、骨干直联点等设施,促进多方算力互联互通。
一个好的算力调度系统,是通过合理分配和使用计算资源,提高数据处理的效率,不仅可以提高数据处理的速度,还可以节省企业的运营成本,是中国算力产业实现高质量发展过程中的“关键一环”。
算力调度平台让算力像水电一样“易用”
钛媒体注意到,上述《行动计划》提出的发展方向也是“东数西算”战略的核心目标之一。尤其是今年以来,生成式AI应用场景的大规模落地的背景下,训练大模型需要海量的数据及算力,而这些用于训练大模型的算力又需要消耗大量的电力资源,在青云科技总裁林源看来,AI应用属于“成本敏感型”应用场景。拥有低廉、绿色电力西部地区,是大模型训练的“沃土”,西部训练,东部应用,这将是未来的大趋势。
无独有偶,在国际化、全球化的背景下,企业对于全球化业务部署在不同区域的算力需求也越来越高,算力调度的重要性也愈发明显,中企通信数据科学及创新总监詹东东对钛媒体表示:“尤其对于云计算和边缘计算协同的算力架构而言,最重要的是对算力的调度能力,对算力的需求很多时侯会分布在不同的区域,如何协同好,这也是我们很多客户正在思考的问题。”
可以想见,未来,算力一定是分散的,在全球范围内,都有算力分布,企业也会在不同区域都有算力的需求,只不过这些算力的用途有所区别。
结合算力未来的发展趋势,如何快速、高效的调度“算力”,将成为中国算力产业是否能够实现高质量发展的关键,而如何让算力资源像水、电一样简单易取用,也是目前算力产业亟待解决的问题之一。
其实从2021年开始,无论是企业侧,还是地方政府主管部门,都在积极建立自己的算力调度平台,帮助企业以更低的成本,使用更优质的算力资源。
重庆市推出“明月湖·π算力矩阵行动”,力图打造西部首个行业跨云、跨网、跨算力的共享计划,让企业和创新主体像使用水电一样便捷地使用算力。
据了解,该计划落地后,用户可以通过算力互联互通和调度平台便捷地找到全国各地可用的算力资源,并具备根据算力价格、网络性能等策略选择,快速接入和申请使用意向资源,实现一点接入、即取即用的能力。
同样是今年,深圳市以政策为引导,在今年5月印发的《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》中就明确提出,建设城市级算力统筹调度平台。实现“算力一网化、统筹一体化、调度一站式”,深圳市可统筹的公共智能算力及相关网络带宽保持国内领先水平,加快启动建设鹏城云脑Ⅲ项目。
与此同时,该《行动方案》还提出打造大湾区智能算力枢纽。加快实施“智能算力网络关键技术体系研究及验证”项目,积极有序集聚政府、企业、科研机构、高校等智能算力资源,与周边城市加强智能算力合作,谋划共建粤港澳大湾区智能算力统筹调度平台。建设企业级智能算力平台。联合香港企业、科研机构、高校,打造深港人工智能算力赋能中心。
上海市在上海经信委发布的关于印发《上海市推进算力资源统一调度指导意见》的通知中提出,到2023年底,依托本市人工智能公共算力服务平台,接入并调度4个以上算力基础设施,可调度智能算力达到1000PFLOPS(FP16)以上。
与此同时,2023年6月,上海市通信管理局则是在发布的《新型数据中心“算力浦江”行动计划2023年度重点任务》中提出,完善丰富了差异化上架率、算力调度SRv6使用占比等新型指标;推动了算力网络与网络基础设施、5G虚拟专网和应用场景融合创新;强化了全国、区域算力调度直连和协同联动.......
三大运营商仍是“主力军”
工信部数据显示,截至今年6月底,全国在用数据中心机架总规模超过760万台标准机架,算力总规模达到197EFLOPS,存力总规模超过1080EB。
现阶段,中国算力产业参与者众多,有运营商、IDC企业、企业自建数据中心等,也因此造成市场份额较分散,但综合来看,三大电信运营商仍是算力产业发展主力军。
据公开数据显示,截至2023年2月,中国移动算力规模超8.0EFLOPS,累计投产云服务器超过76万台,边缘节点超千个,目前超大型数据中心布局已覆盖9个数据中心集群(共 10 个),预计年底前完成全覆盖,对外可用IDC机架达到46.7万架;中国电信目前拥有700多个数据中心,新建天翼云服务器8.1万台,截至 2022 年年底,算力规模达3.8EFLOPS,同比增长81%,在全国范围内拥有超过700座数据中心,47万架机柜;中国联通IDC机架较2022年底增加1.9万架,总数达32.9万架。
除了引领中国算力基础设施建设以外,三大运营商在算力网络建设,算网融合方面也是“排头兵”。
中国移动在2021年就提出了算力网络建设,以“算”为中心的网络,将算力看成数字经济的核心生产力。
“以算为中心,网为根据”是现阶段中国移动对算力网络的定义。针对当下算力产业发展趋势,结合“以算为中心”,中国移动提出了“四个融通”:一是,跨地域物理融通。实现全国各地的数据中心、智算中心的全互联;二是,跨层次的逻辑融通。实现云网边端一体化融会贯通;三是,实现异构计算的融通;四是,跨主体融通。打造算力网络,真正将算力“服务化”。
中国联通主要聚焦在“算网创新”方面,计划实现超大规模的算力供给。布局全面承接国家“东数西算”工程的“5+4+31+X”新型数據中心体系,建成数据中心880个,机架规模超过40万架,推动联通云“一市一池”覆盖200多个城市。
除此之外,中国联通还大力推进算网融合发展,构建算力网络,推动数字经济的发展。基于3.0基础的网络,从算力供给、输送、算力调度到算网一体化的“5﹢4﹢31﹢X”的布局,构建服务覆盖全国云网边一体化的多层次算力网络。
中国电信则是联合中国信通院,在今年6月初共同发布了国内首个实现多元异构算力调度的全国性平台——“全国一体化算力算网调度平台(1.0版)”。据悉,该平台汇聚通用算力、智能算力、高性能算力、边缘算力等多元算力资源,针对通用、智算、超算等不同客户的不同需求,设计异构资源池调度引擎,实现不同厂商的异构资源池的算力动态感知与作业智能分发调度。
中国信通院云计算与大数据研究所副所长李洁在算网调度平台发布会上表示,此次发布的算网调度平台将综合集成网络情况+综合算力+算力调度“三位一体”内容,为推动中国算力算网调度发展奠定基础。
多主体建设多张“网”,全国“算力一张网”为时尚早
除了相关主管部门高度重视,以及三大运营商着力布局外,算力调度平台也成为众多互联网企业,尤其是云厂商们积极布局的发展方向。
在云服务提供商方面,青云科技基于智算、超算项目推出了AI算力调度平台,与济南超算合作,在HPC和AI智算领域推出了更贴近终端用户,供科研和学生使用的平台。
华为云则是在国家有关部门的指导下,依托鹏城实验室的研发能力,推出了“中国算力网”China Computing Network,C Net),并提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。其中,一期工程将建设智算网络,实现算力、数据、生态的三大汇聚,以此激活人工智能与各产业的共融共生。
优刻得方面,依托国家新型互联网交换中心、骨干直联点等设施,推动以云服务的方式将算力资源进行充分整合,积极探索、建设多元异构算力协同调度体系。同时,钛媒体注意到,优刻得还在西部—乌兰察布,以及东部—上海青浦,拥有自建的数据中心,并在全球25个地域,拥有32个可用区,依托软件定义网络等技术手段,推动算力智能调度。
在其他互联网及ICT服务商方面,中企通信作为中信成员企业和中国ICT领域的“国家队”,始终积极践行国家战略,紧贴大局政策,协同中信集团、中信国际电讯以及中信国际电讯CPC在智赋“一带一路”方面形成了覆盖全球的优质资源,打造了全球一体化运营平台,提升全球化服务能力,大力支持中国“引进来”和“走出去”。同时,依托中企云时代?SmartCLOUD算法平台,构建云网融合架构,以及智能算网大脑,充分整合了“云网智安”等ICT服务资源,满足用户对算力服务的需求。
除了中企通信外,同样拥有“国家队”背景的曙光智算,在2021年就开始了智算网络的建设,并推出首个全国一体化计算服务平台。据公开信息显示,目前该平台已接入全国众多计算中心,聚合算力、存储、网络等系列资源,形成从端到端全栈算力生产,到应用支持服务的统一平台,为全国用户提供算力服务。
而在算力产业的“火爆”之下,一些传统行业也“跨界”入局,布局算力调度的相关产品。以东方材料为例,作为传统制造业中的翘楚,东方材料今年8月成立了全资子公司东方超算,于今年9月26日,发布了“东方超算全国一体化超级算力调度平台”,并联合全国首批13家数据中心共同打造了“全国一体化超级算力集群”。将以算网协同为基础,整合海量算力资源,构建场景、业务与算力的智能通道,帮助用户高效地获取、管理和利用算力,为各种计算任务提供强大的算力支持。
可以说,各方看到算力调度的前景和重要性,开始加速以各参与企业为中心进行算力网络建设,这将构建全国”算力一张网“的基础,但同时也面临由于市场因素无法达成完全协同的客观现实。
中国算力网络建设正步入快车道,这需要政策引导以及企业积极布局,缺一不可。从全局看,构建全国“算力一张网”,大致可以分为三个建设阶段:第一阶段,拉通“算”“网”,实现“网能调算,算能拉网”;第二阶段,搭建算网大脑,实现统一管理、统一调度;第三阶段,达到完全的“算网融合”,最终实现“算”“网”从协议和架构层面全面的融会贯通。
最终,算力调度将从现阶段的各个调度平台“各自为战”,进化为实现异构、多元算力的完全统一、融合,并将步入“算力即服务”的时代。