一种基于域名解析机制的算力网络实现方案
2021-11-11赵倩颖邢文娟雷波蒋林涛
赵倩颖,邢文娟,雷波,蒋林涛
(1.中国电信股份有限公司研究院,北京 102209;2.中国信息通信研究院,北京 100191)
1 引言
随着人工智能(AI)、物联网等新型技术的迅速发展,以及虚拟现实(VR)/增强现实(AR)、云游戏等新型业务的不断涌现,信息数据呈爆炸式增长。IDC《未来算力推动企业迈向数字化2.0》白皮书报告,预计2024年全球数据总量将达到142.6 ZB。对各类数字化应用的支撑以及对海量数据进行处理,都需要大量的算力资源[1]。新型业务催生了边缘计算的诞生,未来算力节点将出现泛在化的特性,云—边—端多级泛在算力将逐步落地部署并成为典型的算力基础架构,“随时随地,无限算力”成为新兴的业务诉求[2]。随之而来的是网络流量模型的变化,流量模型从集中式(云—网—端)演进到分布式(云—网—边—端)。从用户视角来看,不同位置的资源并不是平等关系,需要综合考虑用户到资源距离的不同(即网络空间距离)、网络状况的好坏、资源报价不同等多方面因素选择最优资源。如何将算力、存储等资源与网络结合,更好地为用户提供最合适的资源服务,成为一个非常重要的研究点,算力网络应运而生[3]。
算力网络通过无处不在的网络连接,整合多级算力、存储等资源孤岛,结合网络信息(如带宽、时延等)与不同类型的用户需求,为用户提供最佳的资源分配方案,进而实现整网资源的最优化使用。算力网络可提高云、边、端多级算力协同工作效率及整网资源利用率,保证服务灵活动态部署和用户体验的一致性,用户无须关心各类基础资源的位置和部署状态,由网络协同调度各类资源。算力网络作为资源分配与网络连接的一体化解决方案,将成为未来网络技术体系的重要组成部分[4]。
2 算力网络技术路线
算力网络目前在技术路线上可以分为集中式、分布式和混合式3种。
(1)集中式
集中式的算力网络实现方案通过算力网络平台统一收集全网的算力资源、网络资源以及其他资源信息,用户将业务需求发送给该平台,由平台利用全局视角进行最优化的资源选择与分配。典型的集中式方案如SDN集中控制器+NFV编排管理体系方案等。
算力网络平台需要收集各类资源信息进行相应的抽象与计算,将算力分配策略发送给用户和算力资源池,最终通过调度网络建立相应的传送通道。因此,算力网络平台需要集成原有的网络管理控制单元、业务与资源编排单元实现算网资源的集中管控。从某种意义上,也可以认为是集成了算网信息与算网策略的新型网络编排调度系统。
集中式方案实现简单,网络控制单元的研发有较成熟的基础。算力网络平台处理能力、可靠性及可扩展性依赖于运营系统对全网资源的管控能力。
(2)分布式
为了在业务状态频繁变化时对算力资源进行精细的监控和分配,参照分布式路由协议提出了算力网络分布式技术路线。分布式方案通过扩展BGP、IGP等路由协议,将当前的资源信息作为路由信息发布到网络,让网络设备参与算力和网络等资源信息的分发与收集,再由网络将计算任务报文路由到相应的计算节点,并利用IP报文扩展字段获取业务需求信息[5]。该方案的实现需要对原有路由协议进行扩展并在原有的网络设备中扩展资源信息分发与收集的功能。
分布式方案可扩展性好,需要对现有网络设备进行改造,技术成熟度、标准化程度依赖于网络设备的更新。对于大规模网络的支持能力有待进一步验证。
(3)混合式
混合式方案旨在融合上述两种方案的优势,将集中式方案中算力及网络信息收集的能力下放给算力网络设备,从而减轻算力网络平台的复杂程度。在该方案中,对于算力、网络等本身具有分布式属性的资源信息,通过扩展路由协议的方式进行分发收集,关于资源选择、路径决策、用户需求分析以及交易等功能的实现则依赖于集中式的算力网络平台。
因此混合式方案对于大规模网络支持能力较好,但对路由节点以及控制器之间的协同配合要求高,方案成熟周期较长,需要展开大量研究及实践。
鉴于上述3种算力网络技术路线的核心思想,本文提出了一种基于域名解析机制的算力网络实施方案。该方案使用URL语言将算力、存储等资源划分成标准化单元并进行统一标识,并根据不同的业务需求进行分配。用户通过域名解析服务器将分配到的URL标识映射成算力资源节点所对应网络位置信息,并通过算力网关建立与资源池的网络连接,从而调用相应的算力、存储等资源为用户使用。该方案为算力网络技术的实现提供了一种新的思路,具有通用性强、易使用、易扩展等特点。
3 基于域名解析技术的算力网络方案
3.1 域名解析机制方案架构
基于域名解析机制的算力网络方案主要包含以下六大功能模块,如图1所示。
图1 基于域名解析机制的算力网络方案架构
• 算力用户:指利用算力网络寻找相应的资源或者服务的使用方。通常包括需要使用基础资源的应用开发平台,需要使用服务资源的终端用户。
• 算力资源:指利用算力网络向其他用户提供资源或服务的供应者,算力网络提供者所提供的算力资源呈多级化、泛在化的特点。算力资源池可以是小微型的边缘计算节点,也可以是大中型的云计算节点或者城域计算节点、超算中心等。
• 算力网关:算力网关可以是物理设备,也可以是虚拟设备,用于算网信息和算力用户请求的收集和转发。
• 网络5.0资源模块:用户管理数据通信网网络资源,一般在网管中设置管理,并在节点中实施,以确保可扩展性。
• 算力资源管理平台:管理算力资源的平台,与算力网关、网络5.0资源模块,进行交互;接受算力用户的算力资源请求,并发送给算力用户满足需求的资源标识。包括算力用户管理模块、算力资源管理模块以及资源选择和调度模块。
• 算力域名映射平台:用于将算力资源的域名(标识的第一个字段为节点的域名)映射成该算力节点的网络地址。
3.2 算力标识
算力资源信息的标识是算力网络方案实现的前提。在域名解析方案中,算力的标识需要具有可读、可分类、可扩展等特性。为了便于算力资源信息的管理,该方案使用URL语言将算力、存储等资源划分成标准化单元并进行统一标识。对某一算力资源具体的编码规则为:算力单元名/算力类别/算力属性1/算力属性2/算力属性3/…,其中,算力单元名为该算力单元的具体名称,并且具有唯一性,如天翼云N;算力类别即算力的种类或算力的单位,根据目前常见的算力分类方法,可以将算力类别分为:等效核、MIps、函数;算力属性可以包括算力域、服务器以及可以提供的算力数量。算力标识示例如图2所示。
图2 算力标识示例
URL:tianyicloudN/Core/az1/s1/5表示天翼云N资源是可以提供5个等效核算力,位于算力域az1服务器1。
3.3 资源信息收集流程
在域名解析方案中,资源信息的收集依靠集 中式方法,由算力资源主动将池化后的算力标识信息上报给算力资源管理模块,再由算力资源管理模块按照资源类型进行分类,生成资源列表。具体实现流程如图3所示。
首先,算力资源及算力用户在算力资源管理模块和算力用户管理模块进行可信认证。在确定算力资源和算力用户可信的前提下,网络5.0资源模块为算力资源及用户建立到网络边缘的安全连接,从而确保算力资源及算力用户的可信安全。其次,算力资源在算力资源管理模块进行注册,并向域名解析平台发送资源域名和其对应的网络地址。最后,算力资源管理模块将已注册的算力资源按照类别进行分类,算力资源的网络信息将通过网络5.0资源模块与算力资源管理平台实时同步。
3.4 算力资源申请及分配流程
算力资源申请及分配流程分为以下4步,如图4所示。
图4 资源申请及分配流程
第一步,算力用户向管理模块发送算力申请。用户申请算力资源的格式为:算力类型/服务等级/算力资源数量,算力用户管理模块向资源选择调度模块发送算力资源请求。资源选择调度模块从算力资源管理模块获取资源信息。
第二步,资源选择调度模块根据算力用户请求以及资源信息,分配最佳资源给算力用户,并与网络5.0资源模块确认路径信息,更新相应资源表项。
第三步,算力用户管理模块根据资源选择结果向算力用户发送算力节点标识URL。算力用户将算力节点标识的第一个字段(算力资源域名),发给算力域名映射平台,经过算力域名映射平台解析,获得该算力节点的网络地址。
第四步,算力用户通过算力域名解析平台返回的网络地址经算力网关和网络5.0与分配的算力资源建立确定性连接。
4 关键技术
4.1 域名解析技术
网络上的计算机通过IP地址进行定位,使用具体的网络空间IP地址可以定位到对应的主机。由于IP地址难于记忆,便出现了替代IP地址的域名。通过域名并不能直接访问某台主机或服务,需要经过一个从域名转换到IP地址的解析过程,这个过程就是域名解析[6]。在算力网络方案中使用域名解析技术,可以实现算力域名到算力资源网络地址的转换,采用该方案可以保证算力资源的易读性而且在网络地址发生变化时不影响算力域名。
4.2 算力度量技术
算力度量技术是实现算力网络的前提,为算力的感知、管控、服务提供基础和标准。算力度量,顾名思义是算力的量化,即使用某个单位衡量计算资源的大小。算力的度量包括两方面:一是量化异构的算力资源,二是对业务算力需求的量化。算力的度量与电力等其他资源不同,它的度量方式更加复杂,其原因包括:由于算力资源的异构性,算力资源尚未有统一的单位;其次,同种计算能力在不同的场景下性能不同,不能仅依靠某个场景该类算力资源的性能判断算力资源的大小;业务场景复杂,单个场景所需的计算资源种类存在多样性,需求量化复杂。因此,试图将所有算力资源单位进行统一面临很大困难。近期在算力度量方向,可以根据特性场景及资源类型进行归类,力求寻找简化、通用的算力度量与建模方案为算力网络服务奠定基础[7]。
4.3 算力交易
算力交易技术包含对业务需求的实时智能感知及分析,以及根据业务需求为其匹配最佳资源,实现算力使用者和算力提供者之间的资源交换。除此之外,算力交易还包括:算力计费即通过综合考虑资源的建设成本、维护成本、稀缺性、竞合关系指定合理价格,并依据算力、网络等资源的占用情况生成算力消费者的支付账单以及算力供应商的收入账单;可信交易即确保算力供应商服务资源的可靠性,以及借助区块链等新型技术实现交易的真实有效可溯源;交易视图生成即如何以每个算力消费者为中心,生成可供其选择最佳资源组合的视图,视图中应包含可供选择资源组合的算力、存储、网络等信息。
4.4 算力编排技术
算力编排技术指将用户的业务需求转化为算力资源需求,通过统一整合全网的算力、网络以及其他资源信息,根据用户的资源需求以全局视角进行最优化的资源选择与分配策略。进一步地,根据算力编排模块输出,对不同位置、不同归属、不同结构等算力资源进行算力调度,按需进行资源切换。
5 结束语
在网络和计算深度融合的大趋势下,网络演进的核心需求需要网络和计算相互感知、高效协同,算力网络将实现泛在计算互联,实现云、网、边高效协同[8]。在此基础上,本文探索了一种基于域名解析机制的算力网络方案,为各种算力资源分配统一的标识,根据不同的用户需求为用户匹配对应的资源,并证实了此方案的可用性及有效性。未来6G时代,随着业务需求与商业模式的不断发展,计算资源与网络资源将会进一步融合,算力网络将迎来更大的发展空间。