APP下载

算力网络部署方案分析

2022-07-07王丽莉

电信科学 2022年6期
关键词:算力路由时延

王丽莉

工程与应用

算力网络部署方案分析

王丽莉

(中国移动通信集团海南有限公司,海南 海口 570100)

国家对算力网络的部署提出了更高要求,电信运营商加速落实算网融合工作。为解决计算和网络相互协同、调度问题,在对算力网络相关标准研究的基础上,总结了算力网络研究进展,分析了算力网络业务需求,结合电信运营商现网实际,从算力储备、传输网络、网络路由、协同调度4个方面,提出了算力网络可持续性建设部署方案,为算力网络建设初期提供参考。

算力网络;路由;调度;优化

0 引言

2020年4月,国家层面首次提出“算力基础设施”概念。2021年5月,国家发展和改革委员会、中共中央网络安全和信息化委员会办公室、工业和信息化部、国家能源局四部委联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》[1],明确提出布局建设全国一体化算力网络国家枢纽节点,发展数据中心集群,引导数据中心向集约化、规模化、绿色化发展。国家枢纽节点之间进一步打通网络传输通道,加快实施“东数西算”工程,提升跨区域算力调度水平。通信行业积极推动算力网络发展,中国移动分别于2019年、2020年发布《算力感知网络技术白皮书》,并于2011年11月正式发布《中国移动算力网络白皮书》[2],系统阐释了算力网络的产生背景、核心理念、应用场景、发展路径和技术创新。中国联通发布了算力网络架构和技术体系演进报告[3],积极推动网络从“云网融合”向“算网一体”演进。

总体上,产业界对于算力网络的体系架构和逻辑功能已达成基本共识,体系架构划分为算网基础设施层、编排管理层和运营服务层。基础设施层基于全光网络实现了云−边−端算力高速互联,满足数据无损、高效传输需求;编排管理层是算力网络的调度中枢,通过灵活组合算网原子能力,向下实现算网资源的统一智能调度管理,向上支撑算网多样化服务;运营服务层是算网服务能力提供平台,为用户提供算网产品。

围绕以上3个层面,对算力网络开展算网基础设施关键技术、编排管理关键技术和算网安全等研究工作。在基础设施关键技术方面,文献[4-7]探讨了算力网络关键技术,云计算、边缘计算和算力网络的融合,面向6G的算力网络分层结构和控制技术;在编排管理关键技术方面,文献[8-9]探讨了算力网络的集中式、分布式和混合式3种架构方案,提出算力网络要统筹考虑算力需求满足和网络改造成本;面向海量边缘设备,文献[10-11]研究了基于云原生的边缘资源统一纳管、算力分配算法和调度机制;基于IPv6/SRv6等路由协议可编程特性,文献[12-15]研究了面向多层次异构算网资源的算力资源标识、算力路由技术;在算网安全方面,文献[16-17]探讨了算网安全参考架构、梳理了算网安全支撑技术,基于区块链等新技术研究了算网信任评估与保障方案。

目前,在算力网络的架构规划及业务需求逐步清晰的背景下,通信行业已进入算网建设的初步阶段,基于电信运营商现网实际,如何做好算力网络初期规划部署是算力网络可持续建设与运营的关键。当前国家层面侧重于打造“硬核算力”、布局建设算力枢纽节点和数据中心集群。通信行业亟须重点关注解决“储算力、优网络”问题,即加大“边缘算力”部署以增加算力储备,优化“网络”能力促进现网平滑升级,合理科学规划建设算网智能调度平台,提升算力与网络资源协同调度能力。本文从当前算力网络典型业务需求分析出发,结合现网实际情况,从算力储备、网络连接、网络路由、协同调度4个方面,深度探讨算力网络优化方案,为算力网络初期部署提供参考建议。

1 算力网络业务需求

2021年7月,国际电信联盟电信标准局通过了算力网络框架与架构标准[18],提出算力网络的两大类应用场景。第一类是以边缘计算为代表的低时延应用场景,边缘算力节点要具备低时延、高算力和网络路由能力,网络能力是算力节点不可缺少的能力,支持计算任务分类调度,将注重算力需求的AI训练任务部署在中心节点,将特征提取、模式匹配和对象识别等计算任务动态加载至合适的边缘节点,云边协同满足低时延业务需求;第二类是以移动直播为代表的高移动性场景,直播用户跨区域移动的情况下,算力网络要根据用户位置和算力资源分布情况为直播业务实时调度近距离的算力资源,移动直播场景如图1所示,旅行直播用户Y具有实时高清视频、图像和语音的业务需求,在城市A移动到城市B的过程中,算力网络根据用户位置变化和算力资源分布先后调度算力节点/资源池N1、N2,确保用户体验一致性。

此外,以“东数西算”为典型的跨域协同场景,要求算网枢纽节点间网络超低时延;行业数智化生产场景(如视觉质检、智能安监),要求边缘计算和终端执行实时闭环,云−边−端算力节点协同要求更高;大型互联网服务提供者(Internet service provider,ISP)业务优化场景,要求应用的不同服务按实时性调度到边缘云和中心云;低时延、高移动性、多节点协同、安全计算等业务需求场景,要求同步规划算网基础设施安全能力,算力节点进一步下沉至用户侧,加快传输网络向全光底座升级和构建算网资源统一调度能力。

2 算力网络优化方案

2.1 加速算力储备建设

算力包括基础算力、智能算力、超级算力 3类,其中超级算力由国家统筹布局,电信运营算力储备包括基础算力、智能算力。在基础算力储备方面,建议电信运营商在算网建设初期,重点关注国家顶层设计涉及的八大核心枢纽区域和 10个数据中心集群,响应国家产业政策引导,转变以业务需求为中心的互联网数据中心建设思路,主动做强、做大核心枢纽区域数据中心的基础算力,满足上架率、电能利用效率等指标要求,同时面向数据中心东西向流量,构建低时延、确定性的数据中心高速互联网络,支撑区域内、跨区域算力资源协同发展的基础设施建设。

目前,国内智能算力中心由阿里、腾讯、华为、商汤等技术创新企业主导,面向商业市场提供算力服务,同时将AI应用能力溢出提供人工智能云服务。2020年年底国家信息中心信息化和产业发展部发布了《智能计算中心规划建设指南》,建议采用政府主导、企业承建、联合运营的政企合作建设运营的框架。智能算力融合了大数据、人工智能技术,是提供“连接+计算+能力”服务的关键,建议电信运营商积极开展智算中心的能力储备,主动与政府、创新企业联合,结合区域业务发展特征趋势,发挥以“网”促“智”优势,谋划好智算中心建设。此外,为满足低时延、高移动性的应用场景要求,电信运营商要加快云计算、内容分发网络、大数据等多种业态融合,加速部署省−市−县三级算力节点,重点要以边缘计算为视角,加快边缘计算接入网、边缘计算内部网和边缘计算互联网络建设,建设优化拉通中心云、各级边缘云的云间互联专网,“以网强算”发展算力网络。

2.2 优化网络连接能力

算力网络部署初期要实现网随算动,网络基础设施要以算力高效互联为目标完成升级演进。算力节点间互联示意图如图2所示,国家级八大枢纽算力节点间,通过一干传输网络建立枢纽节点之间的“大容量”直联网络;省级算力、地市算力以及县域边缘算力节点间,通过省内传输干线网络互联构建低时延的枢纽内超快访问能力。

2.2.1 传输系统方案建议

目前,国内各大电信运营商均已建成规模庞大的基础网络,软件定义网络技术加快部署应用,面向多样化业务提供差异化、智能化通道。高品质算力网络要能快速感知应用及算力,实现对算力的动态调度,最终将任务路由到合适的计算节点,提供算力智能调度和确定性连接服务。因此,超宽、灵活的全光网基础设施底座是算力网络部署的基石,全光网提供极简、极低时延架构,最大限度消除距离限制。

在技术层面,以近两年规模化应用的光传送网络(optical transport network,OTN)、切片分组网络(slicing packet network,SPN)两种传输系统组网方案为例,OTN的光交叉连接(optical cross-connect,OXC)技术在省际、省内骨干传送网中逐步推广应用,相比传统的光交换技术,OXC采用立交桥式的全光交换和全光调度架构,实现业务一跳直达,既降低了网络传输时延,又减少了对其他路径资源的占用,这种“高架”直达网络,适用于高级别算力节点间调度。为支撑政企品质专线发展,目前三大电信运营商均已建设超过200个覆盖全国核心城市的政企OTN,普遍具备超高安全、超大带宽、超高可靠、超低时延、灵活弹性等优点。

SPN的灵活以太网(flexible ethernet,FlexE)技术也已在城域骨干传送网全面应用,主要承载有切片需求的5G业务。FlexE切片实现了多业务的硬性隔离,例如,信令、数据业务由不同切片隔离承载,数据切片突发拥塞不影响信令切片。FlexE切片带宽可以动态弹性调整,不影响已经承载的业务。此外,FlexE交叉通道可实现端口突发拥塞情况下,业务亚秒级抖动转发。SPN支持边缘计算算力切片示意图如图3所示,针对5G基站的无线接入、视频监控设备的有线接入场景,SPN面向不同业务分别提供切片服务,保障业务可靠性。

综上所述,在部署算力节点间的传输网络时,要综合考虑时延、带宽、投资效益等因素,面向不同层级选择合适的技术解决方案。不同层级算力节点对应的传输技术方案见表1,在县级及以上算力节点间,优选基于OXC的OTN,园区等现场边缘算力节点间,选择SPN+FlexE技术,保障低时延。此外,建议电信运营商融合应用多种技术栈,引入全光网运力地图技术、光业务单元(optical service unit,OSU)带宽调整技术,利用OSU弹性硬管道、2 MB~100 GB无极调速特性,基于业务感知实现“灵活入算”,城市光网实现“一跳入算”;采用主备灾三路由,应用光电协同的自动交换光网络技术,实现99.999%的超高可靠性。

图3 SPN支持边缘计算算力切片示意图

表1 不同层级算力节点对应的传输技术方案

2.2.2 传输光缆方案建议

在部署算力节点互联网络时,电信运营商要充分考虑传输网络升级演进复杂度,在光缆网络层面要做到提前储备、持续完善骨干路由建设。一方面,光信号在光缆中的传输时延(约每200 km传输时延为1 ms)远超过设备转发时延(单设备约数十微秒,FlexE交换低至数微秒);另一方面,光缆管道租赁建设涉及众多协调问题,骨干光缆建设周期通常以2年为周期计算,远大于设备工程周期。

对于中心算力节点间可靠直达的光缆路由建设,以长三角地区算力网络国家枢纽节点为例,长三角生态绿色一体化发展示范区数据中心集群、芜湖数据中心集群应充分利用高铁、高速网络,优化、完善跨区、跨市间的直达光缆路由建设,提高光缆可靠性、降低传输时延。

对于省内为算力网络组网建设的骨干层光缆,建议采用科学合理的光缆建设优先级评估方法,保障高优先级光缆建设。为确保客观性,应充分考虑内、外部因素,合理评估不同层级光缆网络建设次序。骨干光缆建设优先级评定见表2,评定光缆建设优先级时,统筹考虑纤芯扩容、多环共臂、过江储备等内部动因,也要考虑租用协调等外部不利因素,最终确定不同段落光缆的建设优先级,为后续建设计划提供参考依据。

2.3 优化网络路由能力

“十四五”规划期间,电信运营商肩负着千兆宽带建设任务,面向大众和企业提供网络能力。目前电信运营商的边缘算力已逐步下沉至县域,各省基本形成覆盖省−市−县的三级算力资源网络,在家庭、个人终端等社会算力未引入算力网络之前,针对云边算力节点,建议初期可采用集中式的算网控制面架构,实现基于差异化调度策略的算力资源路由功能。以某视频直播用户在城市C的县C1区域发起算力资源请求为例,县C1用户周边相关算力资源池的网络时延、计算及存储资源情况见表3。

具体步骤如下。

步骤1 基础信息收集。控制器收集网络拓扑信息、路由状态信息,生成基础网络拓扑和基础路由表。控制器收集算力节点上报的算力资源信息,包括计算资源总量/剩余数量、存储资源总量/剩余数量等。

步骤2 制定算力资源调度策略。根据不同的业务请求,制定并应用差异化的算力资源调度策略。基于时延敏感业务的资源池调度策略如图4所示,针对时延敏感型业务,可调度的算力资源池按照时延从低到高排序,结合资源池的利用率和空余资源情况,优选低时延的算力节点。

步骤3 生成优化后的算力路由表。基于现有网络路由表基础信息,引入调度后的算力节点信息,生成新的算力路由表。算力路由表见表4,至少包括业务源IP地址、目的资源池IP地址、下一跳接口、时延、请求使用的计算存储资源信息。

随着手机、计算机等泛在终端成为算力末梢节点,算力网络要实时感知网络、计算、存储等多维度资源及其服务状态。前期工作研究了计算优先网络(compute first networking,CFN)协议,通过在边界网关协议报文中扩展字段携带算力相关信息,实现算力节点信息的全网通告扩散。目前IPv6可延展至从城域网、骨干网再至接入网、数据中心等各个网络层级,并且通过SRv6可实现云、网、端全向拉通。在SRv6网络中,各个网络切片由不同的路由分段和对应的路由分段标识集合组成。建议引入并试点应用基于SRv6的算力路由技术,无须调整现有的地址规划和路由规划,在网络入口生成“网络+算力”的新型路由表,可实现用户计算需求和算网资源的最优匹配。

表3 县C1用户周边相关算力资源池的网络时延、计算及存储资源情况

图4 基于时延敏感业务的资源池调度策略

表4 算力路由表

此外,面向安全服务,基于中心云、边缘云已部署的应用级别安全防护能力(如Web应用防护系统、防火墙、全流量分析),可利用SRv6的服务功能链技术,通过网络将各类安全能力串接起来,为用户提供云化的安全增值服务。

2.4 规划算网协同调度能力

算力网络业务近期主要聚焦在云网融合产品,基于技术要素分析,将远期算力网络业务演进方向,聚焦入云、多云多地协同、终端算力协同、云边协同、云−边−端协同五大类核心业务及网络连接类业务,其中网络连接类业务未来将逐渐和其他业务融合,形成算力网络全融合产品。编排管理层作为算力网络的调度中枢,其建设应是一个渐进迭代过程,当前电信行业要做好算网智慧调度中心架构规划研究工作。结合电信行业云网融合发展方向,建议算网调度中心初期主要面向云网协同,拉通云与网领域的生产运营系统,实现云网资源和业务的统一编排调度;中后期逐步增强对端侧算力、社会算力的编排管理,引入AI、意图引擎、数字孪生等技术,演进为面向“云、网、安、边、数、智、端、链”的算网统一调度管理中心。在架构上,算网智慧调度中心向上支撑算网运营层,向下对接云网控制器,算网统一编排管理示意图如图5所示,建议初期规划重点关注“感知、编排、融智、开放”四大功能,具体如下。

图5 算网统一编排管理示意图

(1)算网资源感知平台功能

算网资源感知平台主要面向底层的算力、网络、存储等资源,对其进行统一纳管,包括裸金属、虚拟机、容器等算力资源。通过对底层算力资源的抽象,实现算力、网络和数据的统一标识、度量和管理,以及根据编排结果向云网控制器下发控制指令。

(2)算网跨域编排中心功能

算网跨域编排中心将资源感知调度层的能力以服务化方式提供注册、使用、管理。针对算网业务需求,对算力、网络、数据等资源或原子服务能力开展业务设计、流程编排和资源编排,实现算网业务的一体化编排以及业务全生命周期管理。

(3)算网融智平台功能

算网融智平台引入大数据、AI等技术,基于算网全局视角,对全域资源进行智能感知、智能设计、智能调优,增强算网融合类业务服务能力。

(4)算网能力开放平台功能

算网能力开放平台面向算网运营层提供原子化服务能力,统一呈现算力网络服务目录、资源视图、运营视图等;响应、解析算网运营层下达的业务需求,根据具体业务需求分发业务。

在部署方案上,建议算网智慧调度中心面向业务采用“两级部署,一级管理”模式,一级中心负责跨区算力网络、全国性社会算力资源的统一管理、调度和编排,二级中心负责区域内、省级算力的统一管理、调度和编排,两级中心在逻辑上集中,对外提供统一化、标准化服务。随着5G切片、云专线等业务逐步迈向集中化规划、受理、开通,逐步增加一级中心直接管理,强化一级中心,保留极少量区域内或省内个性化业务由二级中心管理,最终全面演进至一级中心高度、高效集中管理模式。在技术上采用云原生、微服务的分布式架构部署方式,满足智慧调度中心的弹性部署需求。

3 结束语

当前算力网络规划建设进入关键期,通过总结研究与算力网络相关的工作进展,在分析算力网络主要业务需求场景的基础上,结合电信运营商当前网络能力差距,按照国家顶层设计框架、产业政策牵引,围绕加速算力储备建设、优化网络连接能力、优化网络路由能力、规划算网协调调度能力4个方面,分析了算力网络初期阶段的网络建设部署思路,为近期开展算力网络相关工作部署提供参考。后续随着各类商业模式的逐步明确,进一步深入开展对满足特定业务场景的算网一体承载方案研究。

[1] 国家发展和改革委员会, 中共中央网络安全和信息化委员办公室,工业和信息化部, 等. 全国一体化大数据中心协同创新体系算力枢纽实施方案[R]. 2021.

National Development and Reform Commission, office of central cyberspace Affairs Commission, Ministry of Industry and Information Technology of the Reoples Republic of China, et al. Implementation plan for computing hub of collaborative innovation system of national integrated big data center[R]. 2021.

[2] 中国移动. 算力网络白皮书[R]. 2021.

China Mobile Communications Group Co., Ltd.. White paper of computing power network[R]. 2021.

[3] 中国联通. 中国联通算力网络白皮书[R]. 2019.

China Unicom. White paper of China Unicom computing power network[R]. 2019.

[4] 姚惠娟, 陆璐, 段晓东. 算力感知网络架构与关键技术[J]. 中兴通讯技术, 2021, 27(3): 7-11.

YAO H J, LU L, DUAN X D. Architecture and key technologies for computing-aware networking[J]. ZTE Technology Journal, 2021, 27(3): 7-11.

[5] 蒋林涛. 云计算、边缘计算和算力网络[J]. 信息通信技术, 2020, 14(4): 4-8.

JIANG L T. Cloud computing, edge computing and computing power network[J]. Information and Communications Technologies, 2020, 14(4): 4-8.

[6] 何涛, 曹畅, 唐雄燕, 等. 面向6G需求的算力网络技术[J]. 移动通信, 2020, 44(6): 131-135.

HE T, CAO C, TANG X Y, et al. Research on computing power network technology for 6G requirements[J]. Mobile Communications, 2020, 44(6): 131-135.

[7] 雷波, 陈运清. 边缘计算与算力网络: 5G+AI时代的新型算力平台与网络连接[J]. 中国信息化, 2020(12): 113.

LEI B, CHEN Y Q. Edge computing and computing power network: a new computing power platform and network connection in 5G+AIera[J]. Zhongguo Xinxihua, 2020(12): 113.

[8] 黄光平, 罗鉴, 周建锋. 算力网络架构与场景分析[J]. 信息通信技术, 2020, 14(4): 16-22.

HUANG G P, LUO J, ZHOU J F. Analysis of computation network architecture and according scenarios[J]. Information and Communications Technologies, 2020, 14(4): 16-22.

[9] 段晓东, 姚惠娟, 付月霞, 等. 面向算网一体化演进的算力网络技术[J]. 电信科学, 2021, 37(10): 76-85.

DUAN X D, YAO H J, FU Y X, et al. Computing force network technologies for computing and network integration evolution[J]. Telecommunications Science, 2021, 37(10): 76-85.

[10] 李铭轩, 曹畅, 唐雄燕, 等. 面向算力网络的边缘资源调度解决方案研究[J]. 数据与计算发展前沿, 2020, 2(4): 80-91.

LI M X, CAO C, TANG X Y, et al. Research on edge resource scheduling solutions for computing power network[J]. Frontiers of Data & Computing, 2020, 2(4): 80-91.

[11] 狄筝, 曹一凡, 仇超, 等. 新型算力网络架构及其应用案例分析[J].计算机应用, 2022:1-7.

DI Z, CAO Y F, QIU C, et al. New computing power network architecture and its application case analysis[J]. Journal of Computer Application, 2022: 1-7.

[12] 张帅, 曹畅, 唐雄燕. 基于SRv6的算力网络技术体系研究[J]. 中兴通讯技术, 2022, 28(1): 11-15.

ZHANG S, CAO C, TANG X Y. Computing power network technology architecture based on SRv6[J]. ZTE Technology Journal, 2022, 28(1): 11-15.

[13] 黄光平, 史伟强, 谭斌. 基于SRv6的算力网络资源和服务编排调度[J]. 中兴通讯技术, 2021, 27(3): 23-28.

HUANG G P, SHI W Q, TAN B. Computing power network resources based on SRv6 and its service arrangement and scheduling[J]. ZTE Technology Journal, 2021, 27(3): 23-28.

[14] 李铭轩, 常培, 崔童, 等. 面向FaaS的算网异构资源调度技术[J]. 信息通信技术, 2021, 15(4): 44-49, 58.

LI M X, CHANG P, CUI T, et al. FaaS-oriented computing network heterogeneous resource scheduling technology[J]. Information and Communications Technologies, 2021, 15(4): 44-49, 58.

[15] 孙钰坤, 张兴, 雷波. 边缘算力网络中智能算力感知路由分配策略研究[J]. 无线电通信技术, 2022, 48(1): 60-67.

SUN Y K, ZHANG X, LEI B. Study on intelligent computing aware route allocation policy in edge computing-aware networks[J]. Radio Communications Technology, 2022, 48(1): 60-67.

[16] 邱勤, 徐天妮, 于乐, 等. 算力网络安全架构与数据安全治理技术[J]. 信息安全研究, 2022, 8(4): 340-350.

QIU Q, XU T N, YU L, et al. Computing force network security architecture and data security governance technology[J]. Journalof Information Security Research, 2022, 8(4): 340-350.

[17] 温瑶, 陆晶晶, 卢华, 等. 融合区块链的算力网络信任评估与保障方案研究[J]. 南京邮电大学学报(自然科学版), 2021, 41(4): 99-106.

WEN Y, LU J J, LU H, et al. Blockchain-based trust evaluation and guarantee scheme for computing power network[J]. Journal of Nanjing University of Posts and Telecommunications (Natural Science Edition), 2021, 41(4): 99-106.

[18] ITU-T. Computing power network-framework and architecture:Y.2501[S]. 2021.

Construction scheme analysis of computing force network

WANG Lili

China Mobile Group Hainan Co., Ltd., Haikou570100, China

The government puts forward higher requirements for the deployment of computing force network (CFN), so the telecom operators accelerate the implementation of computing network integration. Aiming to solve the problems of computing and network coordination and scheduling, based on the study of standards related to CFN, the research progress of CFN was summarized, the business requirements of CFN were analyzed, combined with the current reality of telecom operators, the deployment scheme of sustainable construction of CFN was put forward, which concerned with computing power reserve, transmission network, network routing and intelligent scheduling, it provides a reference for the early stage of CFN construction.

computing force network, routing, scheduling, optimization

TN914

A

10.11959/j.issn.1000−0801.2022134

2022−03−02;

2022−06−08

王丽莉(1976− ),女,中国移动通信集团海南有限公司副总经理,主要从事通信新技术研究、通信网络规划优化等方面的工作。

猜你喜欢

算力路由时延
算力盗用:一种新型财产侵害*
中科曙光:联合发布全国首个“一体化算力交易调度平台”
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
算力网络场景需求及算网融合调度机制探讨
5G承载网部署满足uRLLC业务时延要求的研究
铁路数据网路由汇聚引发的路由迭代问题研究
一种基于虚拟分扇的簇间多跳路由算法
基于GCC-nearest时延估计的室内声源定位
路由重分发时需要考虑的问题
空基Ad Hoc路由协议研究