智联计算网络技术发展研究
2024-01-19李丹胡宇翔潘恒张建辉邬江兴
李丹,胡宇翔,潘恒,张建辉,邬江兴,
(1. 中国人民解放军战略支援部队信息工程大学信息技术研究所,郑州 450002;2. 中国科学院计算技术研究所,北京 100190;3. 嵩山实验室,郑州 450018)
一、前言
当前,随着信息技术的迅速发展与普及应用,社会空间、物理空间和信息空间深度融合发展的时代正在开启[1]。除传统计算设备(“机”)和新兴物联设备(“物”)外,“人”作为一种新的重要元素的参与,也将共同构成极其复杂且动态多变的三元空间环境。“万物互联、智慧内生、安全可控、跨越时空”的社会空间、物理空间和信息空间正融合发展,“算 - 网 - 存”深度融合、“空 - 天 - 地”广泛连接、“人 - 机 - 物”自然交互,已成为信息网络核心特征,并产生了融合泛在互联的诸多新模式和新场景。
全球综合数据资料库Statista发布的数据显示,2019年全球联网的物联网终端数量已达百亿,超过了非物联网终端的数量,2025年预计将突破250亿,未来千亿规模已然可期,上述趋势对于网络的随需接入和数据处理能力提出了更高要求[2]。同时,元宇宙作为新兴的概念,具有可定义的数字分身、多模感知的沉浸感、超低延迟、多维多样性虚拟世界、随时随地的接入、完整的经济体系、完整的文明体系等典型特征,既需要灵活适配的网络连接,又需要大量数据和算力支撑。网络、算力、数据融合的大潮已经来临,信息网络作为新型基础设施的属性日益突显,正从提供网络连接的浅层次工具产品转向“人 - 机 - 物”泛在互联赋能平台[3]。算网融合技术的发展与演进已经成为重要的国家战略和发展契机,亟需提出我国自主创新的智联计算技术体系和发展规划。
本文围绕我国智联计算网络技术的发展战略开展研究。首先对现有信息网络技术面临的主要挑战进行分析研判,总结网络与计算融合的发展趋势和代表性技术;其次提出我国自主创新的智联计算网络的核心思想、运行逻辑、目标愿景和社会效益;最后从关键技术布局和示范应用两个方面给出智联计算网络的发展路线,并提出发展建议。
二、现有网络技术面临的挑战
随着“算 - 网 - 数”的深度融合,算力需求、网络资源、数据类别随时间和空间不断变化,如何实现数据计算的最优网络能力匹配,满足网络与计算融合的云、边、端协同调度与控制需求,已成为未来信息通信基础网络发展的关键问题。“人 - 机 -物”泛在互联赋能平台对信息网络提出了更加专业、高效、安全的要求,使得现有信息网络技术面临着诸多挑战[4]。源于消费互联网时代的现有网络技术无法满足数字经济时代各种垂直行业对高性能、高效能、高安全、高可用、个性化应用等服务的需求[5]。网络能力的缺失,导致基于大数据和智能计算的业务应用“无数可算、算后无用、算不可信”,需要对网络技术架构、运行机制和服务模式等进行深入思考和不断探索。
(一)信息网络转向“以获取数据价值为中心”
传统信息网络的核心能力是数据传输,然而随着网络数据的爆炸式增长,对信息网络的要求从“怎么获得数据”向“怎么获取数据价值”转变。据统计,2020年全球设备产生了600 ZB的数据,但其中只有10%是关键数据,其余90%都是临时无效数据[6]。数据量的不断膨胀远远超过网络带宽的增长速度,原来终端采集、网络传送、云中心存储、集中计算的大数据处理方式,遇到了难以逾越的鸿沟,信息网络无法提供当前大数据计算范式所需的传递能力,需要具备大规模数据约简、计算模型分布式运行等全新维度能力。
(二)信息网络需要具备“人 - 机 - 物”量化服务能力
在消费互联网阶段,互联网采用传输控制协议 /网际互联协议(TCP/IP)技术提供“尽力而为”服务,只能依靠基于体验质量(QoE)的用户主观感受来进行评价。在“人 - 机 - 物”三元融合下,机 - 机通信、物 - 物通信等应用持续发展,信息网络不但要支持增强现实 / 虚拟现实(AR/VR)、在线游戏、网络直播等各类消费型业务,而且还要支持工业制造[7]、无人驾驶[8]、远程医疗[9]等各种生产型业务,实现万亿级各类终端的泛在互联、指令下发等,在海量数据收集、处理、分发和利用基础上提供各式各样的智能服务等。这些应用场景需要信息网络具备可预期、可规划、可验证的确定性及可量化的服务能力。
(三)信息网络需要具备多元化柔性互联能力
未来,在信息网络的“人 - 机 - 物”泛在联接中,场景个性化、差异化特性明显,传统面向确定的业务模型构建固定网络结构不再适用,必须要重新设计网络架构、控制协议和管理机制,设计面向多样化、不确定业务模型的智能网络结构,需要信息网络支持灵活、动态的多样化协议处理能力和业务应用计算能力,需要具备面向应用构建多元化柔性互联结构,支持多样化、智能化应用,提高网络控制和管理的灵活性,增强对网络新技术、新协议的支持能力,充分满足不断演进的业务需求[10]。
(四)信息网络需要具备内生安全属性
“人 - 机 - 物”泛在互联和深度融合使得信息网络成为连接真实世界与虚拟世界的唯一桥梁,其功能不仅受物理或逻辑性随机失效事件影响,而且受基于系统软硬件漏洞的网络空间攻击行为影响。支持“人 - 机 - 物”泛在互联的信息网络能否保证其功能 / 性能成为最大的困惑与疑问,亟需革新网络安全与功能安全技术手段,改变传统的“封门补漏、亡羊补牢”被动式防御模式,从外挂到内生、从被动到主动,保障“人 - 机 - 物”泛在互联平台具有一体化的网络安全与功能安全属性,打造“构造决定安全”的信息网络空间内生安全新环境[11]。
三、计算与网络深度融合发展趋势
数字时代,算力先行。算力是支撑数字经济发展的坚实基础、驱动国民经济高质量发展的重要引擎。在算网融合成为必然趋势的背景下,国家“十四五”重点研发计划已将计算、存储、智能与网络技术融合列入待重点突破的技术领域。国内外研究机构为促进算力与网络的融合演进发展进行了积极的探索,相继提出了边缘计算、分散计算、在网计算、算力网络等新型技术架构。近年来,各国抓紧布局算网融合相关战略(见表1),使得融合异构计算、多层次、多颗粒的算网设施成为大国竞争的重要方面。
表1 国内外算网融合研究现状
(一)边缘计算
边缘计算是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务[12]。边缘计算的应用程序在边缘侧发起,能够产生更快的网络服务响应,满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求[13]。边缘计算的发展前景广阔,被称为“人工智能的最后一千米”,制造业、公用事业、能源和交通运输行业将率先采用边缘计算。但边缘计算仍在发展阶段,面临许多问题需要解决,如框架选用、协议规范、终端标识、通信延迟等。随着产业的发展,边缘计算将逐步从产业共识走向应用。
(二)分散计算
美国国防部高级研究计划局(DARPA)于2017年6月针对时延敏感的战场场景启动了“分散计算”项目,旨在利用已遍布全球各地的计算资源,包括智能手机、平板电脑、联网汽车、物联网终端等全球计算资源提供服务,彻底消除中心化,实现计算资源的分散化[14]。分散计算是一种将所有具有计算能力的设备连接到一个网络有机体的计算范式,每个计算节点以协作和共享的方式为用户提供服务[20]。分散计算核心技术包括分散的任务感知计算算法、可编程节点和协议栈、分散计算的跨层方法等,利用网络中的空闲计算资源,绕过了局部计算能力的限制,是一种很有前途的新计算范式,旨在提供可扩展且强大的计算网络,有望在物联网的应用上发挥巨大优势。
(三)在网计算
在传统超算集群中,网络仅用于计算节点之间互联,当多个计算节点同时参与通信时,将导致通信步骤增多、通信效率低下等问题。面向大规模高算力需求的分布式应用,在网计算使用网络设备进行近数据计算,可以在高速转发过程中完成应用数据处理,缩短数据传输路径,进而缩短计算任务的完成时间,是解决分布式应用通信瓶颈问题的重要技术[21]。2020年10月,在全国高性能计算学术年会上,中国科学技术大学与华为技术有限公司联合发布了基于高性能消息传递库(Open MPI)的在网计算联合创新成果,可以提升单位能效算力、算力的确定性供给等网络核心指标。通过在网计算可以最大化实现数据无障碍流动,有效提升算力能效比,实现整网全生命周期自动化及智能运维。
(四)算力网络
算力网络是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施[19]。算力网络利用云网融合、软件定义网络以及网络功能虚拟化等新型网络技术,将边缘计算节点、云计算节点以及各类网络资源深度融合在一起,组成新一代信息基础设施,减少边缘计算节点的管控复杂度,为客户提供包含计算、存储和连接的整体算力服务[22,23]。2020年召开的“面向2030的新型网络”主题论坛指出,算力网络是“2030网络”最关键的特征之一,促进了产业界着手研究网络和计算的融合,逐渐形成未来十年算力网络的共同愿景。
四、智联计算网络技术的核心架构与目标效益
网络与计算、智能的深度融合已经成为新型网络研究的重要方向,然而相关理念和技术仍在发展初期,现有研究主要在应用层进行计算任务部署,使得计算任务调度、网络互联处于“脱节”状态。亟需拓展思路,在数据计算高效处理、服务能力可量化提供、高安全与高可用同时保障等方面探索网络与计算的深度融合。为此,本文提出我国自主创新的智联计算网络技术,实现数据传递的高效性、网络服务的聚敛性、智能计算的协同性等,提供多元、智慧、高效、稳定的“算 - 网 - 数”一体服务,为数字经济建设和发展提供新型信息基础支撑。
(一)核心架构与运行逻辑
仅以信息或数据的端到端传送为目标的网络基线技术和服务,已远远不能满足包含云计算、边缘计算和分布式计算在内的一系列新兴服务的需要。智联计算网络技术以网络技术体系与支撑环境分离的多模态网络发展范式[24]为指导思想,灵活定义涵盖“数据、信息、知识、智慧”诸环节的感知处理控制链,面向多样化应用提供“联接+计算+数据”服务,使得网络具备自感知、自学习和自优化能力,提供多元、智慧、高效、稳定的“算 - 网 - 数”协同服务。
智联计算网络的核心架构,是扩展网络的能力维度,增加计算、存储和智慧能力空间,实现网络计算存储协同处理,将信息网络发展成为提供“算 - 网 - 数”多元网络服务的新型信息基础设施,成为“人 - 机 - 物”泛在互联赋能平台。智联计算网络面向数据产生和使用最多的网络边缘,在现有网络已完成缓存下沉的基础上,进一步把计算下沉到接入汇聚节点,协同调度各种计算、传输和存储资源,实现应用驱动部署分级计算模型、计算任务调度数据归集传送以及数据在网络中的高效计算或处理。
智联计算网络技术支持计算任务的分级部署,通过计算和传输资源的一体化调度,实现数据在传输过程中的随路按需计算,其运行逻辑如图1所示。计算任务被分级部署在各级网络节点(分级部署),通过计算和传输资源的一体化调度(协同调度),实现数据在传输过程中的随路按需计算(逐级计算),既能显著提升服务效率,又能有效约简网络流量。
1. 分级部署
以计算任务的具体需求为驱动,依托统一的算力度量体系和能力模板,将网络中的计算业务构建为计算服务需求模型,对网络节点的不同计算类型进行抽象描述,形成算力服务能力模型,分析算力服务能力与计算服务需求的对应关系,生成满足计算业务的逐级计算服务响应策略。
2. 协作调度
面向数据平面池化的异构资源,网络节点定时将计算和传输资源进行感知与通告,包括位置、服务能力、剩余资源等信息,控制平面汇总分布式的资源感知信息,构建全网资源感知视图,按需协同调度计算和传输资源,支持区域 / 全域计算、传输资源与需求的实时适配。
3. 逐级计算
根据计算任务的具体需求和网络设备的计算能力,基于全网资源感知视图,将计算服务需求模型中的每个任务合理映射到传输路径上具备相应计算能力的网络节点,网络节点在传输数据的同时提供相应的计算服务,通过随路计算完成服务响应,实现计算模型与网内分布式算力的拟合适配。
智联计算网络的优势体现在3个方面。①智联计算网络可以根据各类业务计算处理时延的不同要求,在网络接入、汇聚、核心等不同部分设置差异化的计算资源进行逐级计算,在实现数据及时处理的同时有效约简网络流量。②通过在网络接入、汇聚等边缘部分引入全维可定义数据交换能力,实现以交换为中心的边缘计算智联,通过丰富的智联连接和数据交互,实现智能涌现。③智联计算网络通过计算模型按需、就近数据源的分级部署,可有效支持分布式机器学习、新型人工智能模型的高效部署和运行,提高数据处理的效率。
(二)发展目标与预期效益
1. 对接国家战略需求
建设泛在智联的数字基础设施体系被列为《“十四五”国家信息化规划》(2021年)首项重大任务[25],将为经济社会数字化转型和供给侧结构性改革提供关键支撑和创新动能;“东数西算”工程通过构建数据中心、云计算、大数据一体化的新型算力网络体系,优化数据中心建设和网络规划布局,促进东西部协同联动。智联计算网络以承接国家战略任务为导向,建立具有自主知识产权的智联计算网络核心技术体系,为我国新型数字基础设施体系建设提供新途径和新方法,努力提升我国对网络空间的国际话语权和规则制定权,同时也可为“东数西算”等国家重大战略工程高效实现算力调度、优化资源配置提供技术支撑。
2. 支撑网络技术创新
新型算网融合业务层出不穷,对底层网络设备的传输、存储和计算能力不断提出新的挑战,而传统网络基础结构单一、功能封闭,网络服务能力和计算业务需求之间长期存在“代沟”[26]。智联计算网络技术面向算网融合的技术发展趋势,打造全维可定义的基础功能平台,实现网元设备、协议控制、网络资源、节点能力、网络接口、转发控制、承载方式等要素的全方位开放;在网络层实现对多样化路由和异构算力执行的一体化协同控制,动态自主调度算网资源,以多样应用为核心驱动力实现网络运行、功能编排等自适应的承载,实现对用户的精准及个性化按需服务。智联计算网络技术的创新发展,将为我国算网融合技术创新和产业升级提供新理论、新方法,加速相关技术和产品的落地应用。
3. 赋能数字经济发展
《“十四五”数字经济发展规划》(2022年)提出了智能化综合性新型信息基础设施建设目标[27],智联计算网络技术将“网、云、数、智、安、边、端、链”等深度融合,研究成果有助于加快构建算力、算法、数据、应用资源协同的全国一体化大数据中心体系,促进数据中心朝适度集聚、集约、绿色方向发展。智联计算网络形成的研究成果可有力支撑工业制造、无人驾驶、远程医疗等各种生产型业务,实现万亿级各类终端的泛在互联、指令下发等,能够在海量数据收集、处理、分发和利用基础上提供各式各样的智能服务。智联计算网络具备了全空间 / 全时段互联、高可靠 / 低时延传输、“算 - 网 - 云”一体融合和智能安全保障能力,满足各类垂直行业不断提升的服务质量、管理控制以及安全性等方面的需求,推动相关行业数字经济转型。
五、智联计算网络关键技术与应用场景
(一)智联计算网络关键技术布局
智联计算网络面向“人 - 网 - 物”泛在互联的行业垂直应用场景,将数据驱动的智能计算融入网络之中,形成由多样化协议支撑、“网 - 算 - 存”一体化控制、服务功能智能编排、内生安全构造组成的关键技术。
1. 多样化协议支撑
随着经济、政治、生产、教育、医疗等新兴网络应用场景不断涌现,应保证各种应用场景下的海量异构终端能够安全接入网络进行通信。而各种类型终端的通信往往需要多样化的网络协议支撑,传统网络技术面向单一场景、覆盖单一业务的服务模式需要极大的建设成本和运维成本投入。因此,为了在复杂场景多业务部署情况下实现功能聚合、统一的高效管理,需要构建全维可定义的网络数据平面,为多类型异构网络终端提供多样化的网络协议支撑。
智联计算网络技术具备灵活、动态的多样化协议处理和计算能力,部署轻量级智联计算网元前端设备,解决协议不兼容、功能逻辑不一致等问题,支持各类型应用业务和终端的“即插即用”“共同部署”。数据平面提供通用或专用的应用程序接口,同时将大规模定制服务基于行业场景进行封装,将智能终端、边缘设备及云计算服务器等实体进行灵活接入,通过物联网及智联计算网络的深度融合,实现对行业应用服务场景异构海量数据的实时处理。智联计算网络通过可定义的协议支撑能力,可以适应多种接入标准与技术的要求,支撑多样化的设备连接和服务需求。智联计算网络具备网络感知能力,可以主动地感知各类接入终端,感知网络状态和用户需求等,再依据网络当前的系统资源智能地配置网络资源,按需提供服务。
2. “网 - 算 - 存”一体化控制
随着网络需求越来越多样化和个性化,物联网、车联网、工业互联网、虚拟现实网络、天地一体化网络等发展带来的新业务形态不断涌现,这一系列新型应用不仅需要网络具备高传输速率,而且需要高速缓存和计算能力。传统的研究工作将网络、存储和计算三大资源分别进行管理、控制和优化,导致资源之间互相掣肘,无法实现最优化的服务质量。因此,将网络、存储和计算的控制和管理集成到一起,才能最大程度地支撑新兴应用对“算 - 网 - 存”的联合需求。
智联计算网络支持数据处理过程中的存储计算与转发的一体操作,支持分级量化计算,优化处理海量内容的可靠传输以及高质量服务保证与网络基础设施所能提供的存储、计算和传输能力之间的关系。在智联计算网络数据层采用存储计算与转发一体协同技术,支持加速处理的软硬件协同处理,控制和调度物理资源以优化应用性能和系统性能。同时,智联计算网络能够协同调度各种“网 - 算 - 存”资源,通过应用驱动部署分级计算模型,计算任务调度数据归集传送,实现数据在网络的高效存储计算与转发。智联计算网络将通信纳入计算资源体系,突破计算的网络连接瓶颈,实现数据的按算归集、分级智能处理。智联计算网元设备同时具有“计算+连接”能力,实现计算调度与网络连接的精准、一致匹配。
3. 服务功能智能编排
随着大数据、云计算、人工智能等技术的发展,新业务、新应用和新场景带来了新需求,包含更高的用户体验、更低的业务时延、更高的数据速率、更精准的用户服务及“空天地海”一体化覆盖的演进。传统网络架构体系结构僵化,难以提供面向精细化服务质量保障需求的网络支撑能力,亟需推动网络架构朝着更智能、更高效的方向发展,支持面向业务需求的服务功能编排能力。
智联计算网络以多样应用为核心驱动力增强网络感知能力,包括对用户行为、意图及业务的感知、分析及按需部署,实现网络运行、功能编排等自适应的承载,从覆盖范围、性能指标、业务场景等角度,动态自主调度网络资源,实现对用户的精准及个性化按需服务。将用户网络业务需求进行抽象化建模,依据业务基本参数与效益期望等指标对用户发起的业务进行详细规划,并依赖业务与服务之间的拟合关系实现业务需求到智慧化服务策略的映射,采用服务动态编排与业务自适应承载等机制,形成智慧化网络服务策略,并根据当前网络状态对已有决策进行迭代优化更新。按需服务的智联计算网络可以无缝切换服务方式及内容,降低应用响应时延,简化应用的部署流程,实现高适应性和灵活敏捷的弹性网络。
4. 内生安全构造
网络规模快速膨胀及各种网络要素的巨复杂特性,使得网络经常会受到各类不确定的未知威胁或扰动,如链路 / 节点故障、系统后门 / 漏洞等,从而导致其性能降低甚至功能丧失。网络安全直接受制于其内在功能和结构要素,从附加式的安全补丁向网络内生安全能力的转变是智联计算网络实现稳态服务的必然要求。
智联计算网络技术支持基于零信任的网络和服务访问安全控制结构和技术功能,利用技术自身架构、功能和运行机制等带来内源性安全增益。以内生防御的网络构造机制应对网络中的软硬件设计过程中不可避免的安全漏洞及系统后门等安全威胁,无论是已知风险还是未知威胁导致的确定或不确定性扰动效果,都能通过网络构造或者转换机制将其变换为概率可控的可靠性问题,并且借助成熟的可靠理论和方法统一解决。智联计算网络具备广义鲁棒控制构造的内生安全属性,在不依赖任何先验知识和附加安全措施的情况下,不仅能够有效抑制目标对象内部传统的不确定扰动影响,也能在安全漏洞等人为扰动下维持系统服务功能和性能的鲁棒性,从而很大程度上抵消网络元素广义鲁棒控制功能缺位对互联网服务品质造成的负面影响,具有“高可靠、高可信、高可用”三位一体的广义鲁棒控制属性。
(二)智联计算网络示范应用
随着物联网、车联网、VR/AR的蓬勃发展,互联网不断涌现新的业务形态,也不断产生出越来越多样化和个性化的网络需求。同时,伴随着互联网与工业、能源、交通、医疗等传统领域的深度融合,网络的实时性、服务能力、服务等级等也面临一系列新的挑战。面对计算与网络融合的发展趋势,本研究选取了智慧园区网络、垂直行业网络、数据中心网络三大典型算网融合应用场景,分析智联计算网络技术在上述场景中的应用效果。
1. 智慧园区网络场景
智慧园区作为一种信息化服务网络平台,网络是建设智慧园区的基础。园区内相关资源和人员通过互联网、移动通信等信息技术实现有效的整合与衔接,促进园区内人、物间的协调发展[28]。
图2所示为智联计算网络智慧园区应用模式。智联计算网络技术支持多样化边缘网络协议按需定制,实现园区网络柔性互联,有效提高园区资源配置效率,降低园区运营成本。通过部署轻量级智联计算网元前端设备,解决协议不兼容、功能逻辑不一致等问题,支持园区内各类检测业务和终端的“即插即用”“共网部署”。在靠近业务现场的“边缘”实施网内计算、存储等处理操作,减少园区内业务处理时延,节省网络带宽,实现实时高效和低能耗及简化部署。智联计算网络支持园区网络各类型终端的接入可控,基于零信任和边界安全架构实施网络安全隐私保护,满足园区对网络信息服务质量和能力的要求。
2. 垂直行业网络场景
新型行业应用场景如沉浸式城市空间服务、精准医疗、智能工业物联网、智能电网等全新业务将广泛深入应用,进一步实现社会治理精准化、公共服务高效化、居民生活多样化。其中,智能电网在电网信息化加速发展的浪潮中已成为国家抢占未来低碳经济制高点的重要战略措施[29]。
图3所示为智联计算网络智能电网应用模式。将智联计算网络技术引入到智能电网中,利用其计算与网络按需定义、逐级计算、分级部署、多样化业务的整合和调度等特性对网络、存储及计算资源按需灵活部署,提升面向智能电网场景的计算效率及用户响应速度等性能。利用存储计算与转发一体协同调度,使边缘设备具备数据采集、处理、现场控制三大能力,将大大约简通过网络骨干部分上传的流量,避免数据上传下达所产生的时延弊端,提升网络处理能力。通过多样化异构终端灵活接入技术,提供通用或专用的应用程序接口,同时将大规模定制服务基于行业场景进行封装,将智能电网终端、边缘设备及云计算服务器等实体进行灵活接入,通过物联网及智联计算网络的深度融合,实现对智能电网场景中的异构海量数据的实时处理、同时提供分布式感知及控制能力,实现对网络的智能化配置、态势预测及安全控制。
图3 智联计算网络智能电网应用模式
3. 数据中心网络场景
随着云计算数据中心的快速发展,云计算应用对数据中心网络延迟和带宽提出了越来越严格的要求,减小延迟,缓解拥塞就成为关键问题。数据规约是数据中心网络最为常见的应用之一,然而传统数据中心网络节点只能完成数据交换功能,所有的规约计算都要在服务器上执行,如图4所示。对于AllReduce等复杂的集合运算而言[30],网络中需要传输大量的数据,这将增加延时和消耗更多的中央处理器(CPU)周期,并且显著降低应用的可扩展性。
图4 智联计算网络数据规约应用模式
将智联计算网络技术引入到数据中心网络中,赋予交换节点计算和存储的能力,将数据规约卸载到交换节点,服务器将数据发送给交换节点,交换节点在网络中执行数据规约操作,再将规约结果返回给服务器。无论系统大小如何,网络延时都可以保持在很低且可预测的状态,不仅可以降低数据规约计算的整体延时,而且可以大幅降低网络中传输数据的规模,有效缓解网络拥塞。
分布式机器学习逐渐成为数据中心的主要应用之一[31],当前分布式机器学习系统一般采用参数服务器的方式实现数据并行,多个工作节点将训练结果发送到参数服务器,由参数服务器完成各个工作节点的参数聚合后再将结果广播给各个节点。在这种多对一的通信模式下,参数服务器的输入链路往往成为整个系统的性能瓶颈。在智联计算数据中心网络场景下,充分利用智联计算网元节点“网 -算 - 存”一体的优势,将参数服务器的功能卸载到智联计算网元平台,利用交换节点高吞吐率来加速参数更新,对于增强学习等需要进行大量参数迭代的应用可以起到显著的加速效果。
六、智联计算网络技术发展建议
(一)深入创新智联计算网络技术体系
在算网融合成为必然趋势的背景下,亟需构建我国自主创新的智联计算网络技术体系,从多样化协议支撑、“网 - 算 - 存”一体化控制、服务功能智能编排、网络内生安全等方面加强技术创新。通过网络与计算融合设计,由多样化的技术体系支撑多元化的应用需求,为我国算网融合技术创新提供可能的新理论和新方法,满足网络与经济社会各领域深度融合趋势下高效率、高质量、高可靠的算网融合发展需求。
(二)广泛部署智联计算网络示范应用
建设泛在智联的数字基础设施体系,依托国家重大战略和行动计划,在数据产生和计算需求最为丰富的智能园区网、垂直行业网、数据中心网等场景中布局典型示范应用专项,为智联计算网络提供技术验证和应用试点,以点带面推动智联计算网络技术的再创新和再发展,为数字经济建设和发展提供新型信息基础设施支撑。
(三)加速推动智联计算网络产品落地
以构建自主可控的智联计算网络国产化产业生态为目标,发挥行业主管部门的主导作用,建立财税政策和激励制度,充分调动市场需求牵引和产业拉动。重点支持新材料、新架构、新工艺和异质集成等重大原创方向的探索突破,全面覆盖传输、存储、交换、计算、加密等一系列网络通信核心元器件和自主可控的基础软件,构筑国产化智联计算网络设备生产线,加速产品落地和规模化应用。
利益冲突声明
本文作者在此声明彼此之间不存在任何利益冲突或财务冲突。
Received date:November 7, 2023;Revised date:November 29, 2023
Corresponding author:Li Dan is an associate research fellow from the Institute of Information Technology,PLA Strategic Support Force Information Engineering University. His major research fields include future network architecture and routing switching technology. E-mail:pkulidan@foxmail.com
Funding project:National Key R&D Program of China (2022YFB2901 304); Chinese Academy of Engineering project “Research on the National Cyber Development Strategy Guided by the New Development Concept”(2022-HYZD-02); Program of Songshan Laboratory (Included in the management of Major Science and Technology Program of Henan Province)(221100210900-03)