6G智慧内生:技术挑战、架构和关键特征
2021-08-03刘光毅邓娟郑青碧李刚孙欣黄宇红
刘光毅,邓娟,郑青碧,李刚,孙欣,黄宇红
(中国移动通信研究院,北京 100053)
0 引言
人工智能技术的发展已走过了64年的历程,其与移动通信网络的深度融合发展始于第五代移动通信网络(5G),人工智能不仅促进了5G网络自身的智能化发展,其与5G也被业界作为通用技术组合应用于各行各业中,赋能垂直行业的发展。
面向2030年,“数字孪生”和“智能泛在”将成为社会发展的目标愿景[1]。未来6G网络的作用之一就是创造一个“智慧泛在”的世界,基于无处不在的大数据,将AI的能力赋予各个领域的应用。为了支持该愿景的实现,6G网络提出了“智慧内生”的基本特征构想,即6G网络将在设计之初就考虑与人工智能技术融合的理念,将AI和大数据的应用融入网络的基因当中,形成一个端到端的体系架构,根据不同的应用场景需求,按需提供AI能力和服务。同时,6G网络还将通过内生的AI功能、协议和信令流程,实现AI能力的全面渗透,驱动智慧网络向前演进,实现“网络无所不达,算力无处不在,智能无所不及”。
本文聚焦6G网络架构的关键特征“内生智慧”,首先探讨了内生智慧的需求,分析了6G实现“内生智慧”所面临的技术挑战,总结了当前各行业组织对AI功能架构的研究进展和欠缺之处,提出了6G内生智慧的端到端功能部署架构,以及内生智慧的三大技术特征,并对后续研究方向进行了展望。
1 智慧内生需求
近年来,人工智能技术作为一种IT技术取得了长足的进步。作为一种工具,它可以很好地帮助运营商提高网络的运维效率,以及服务的效率和能力。移动通信网络通常由数百万个基站、路由器、核心网元等基础设施设备,以及数十亿用户组成。海量数据在网络中产生,包括各网元的运行数据、通信过程中产生的信令数据、事件报告以及用户在网络中移动的相关信息。如果在这些数据上加上标签信息,将为网络运维的自动化、智能化带来不可估量的价值。从5G时代开始,运营商开始研究基于大数据和人工智能的5G网络智能化,如海量多输入多输出(MIMO)权重优化、网络异常分析、用户体验分析与优化等[2]。同时,3GPP也开始研究无线网络中的大数据采集[3]、网络运维的自动化和智能化[4],以及人工智能在无线资源调度中的应用[5]。5G网络智能化的研究可被划分为应用和需求研究(包括5G+AI场景和需求、5G业务场景和需求以及应用和网络资源的智能映射)、无线接入技术智能化(如基于AI的Massive MIMO设计、无线资源调度、定位技术、移动性管理、信号检测、信道估计等)、网络智能化(如基于联邦学习的MEC架构、智能网络切片、多RAT协作、智能网络规划、智能节能等)。
目前,移动通信网络的智能化工作尚处于初始阶段:大量的工作集中在需求的发掘和对解决方案的探索上,而成熟的网络智能化应用非常少。同时,由于5G网络架构在设计时并没有考虑到对AI的支持,现有的场景驱动的网络智能化面临诸多挑战。首先,数据的获取非常困难,数据质量难以保证。因为在先前的网络架构和协议设计中没有预定义数据收集的接口,而当前基于实现的数据收集服务器/设备,例如深度包检测或数据探测无法及时提供足够的数据。基于网管的数据收集也存在数据种类较少,采集周期较长(15min)、异厂商数据格式、命名、计算方式不统一,南向网管数据难以开放的问题。同时,由于数据在设备内部采集的不稳定性、传输链路有损,网管设备存储空间有限,标签难获得,获取的数据常存在缺失、串行、无标签或标签错误等质量问题,在AI模型训练之前,需要花费大量的时间和人力成本对数据进行预处理。其次,AI模型的应用效果缺乏有效的验证和保障手段。当前智能模型的训练和迭代优化均在线下完成,智能模型上线后的效果缺乏直接的验证手段,大多是通过智能化应用相关的网络性能评估指标进行间接判断,实时性差且缺乏直接关联性;当模型上线后,网络性能指标低于预期时,仅能通过“回退”机制来避免AI模型的负面影响,存在滞后性。第三,AI在5G网络中的应用是逐案处理的,其中数据采集、算法优化和处理被打补丁到相应的网元或外挂处理单元作为新的网元添加到网络中。对于不同的人工智能用例,可能需要对网络进行不同的修改,这给网络的管理和运营带来了困难。最后,针对移动通信网络特征的AI算法研发和创新尚处于起步阶段,AI技术与通信技术是以叠加方式融合的松耦合模式。所有这些因素决定了人工智能的性能和效率远远低于预期。
未来6G网络的作用之一是基于无处不在的大数据,将AI的能力赋予各个领域的应用,创造一个“智能泛在”的世界。6G应在5G基础上全面支持整个世界的数字化,并通过内生AI的网络架构设计,实现智慧的泛在可得、全面赋能万事万物[1]。为了实现“智慧泛在”的愿景,未来6G网络需要拥有内生智能。6G网络架构的内生智慧将使AI能力在网络中无处不在、无孔不入,并像人体的大脑和神经网络一样,以分布式或集中的方式按需提供AI能力。同时,通过智能平台,6G网络可以将外部AI能力引入网络,提供新服务、新能力,将外部数据引入网络,进一步提高数据处理效率。此外,网络内的分析数据和人工智能能力也可以开放给第三方,通过智能平台为其提供所需的各类智能服务。
2 智慧内生技术挑战
2.1 AI工作流
当前,AI在各行各业的应用都存在类似的工作流程和技术挑战。6G网络的内生智能需要为这些挑战提供内生的解决方案,由此既能为“AI for Network”的网络智能化应用提供统一的技术框架,也能随时随地为垂直行业提供工作流所需的各类AI能力和工具,创造新的商业价值。
对智能化应用研发团队进行了走访和调查[6],提炼出一套通用的AI工作流,如图1所示。本文对其中每个环节所需达到的性能、存在的挑战和现有解决方案[7-12]进行了提炼总结,并对6G网络需提供的内生AI能力进行了展望。
图1 通用的机器学习工作流
为了使智能化应用获得较好的效果,AI工作流中各环节都需要达到相应的功能和性能要求。首先,数据管理方面涉及数据采集、预处理、数据分析和数据增广。面向智能化应用的数据需具备与问题领域的相关性、样本空间的完整性、数据集内部样本分布平衡性及数据本身的准确性。其次,模型学习阶段包括模型选择、模型训练和超参优化。这一阶段产生的智能模型,其性能应可评估,评估指标包括传统的ML指标,例如分类准确度、ROC和均方误差,以及考虑模型部署系统和环境的指标。模型需具有稳健性,即模型在运行时遇到的输入与训练数据中存在的输入不同的情况下,也能保持良好的性能。模型需具有可重用性,即模型或模型组件在其预期之外的系统中应用也具有重用的能力。模型需具有可解释性:即模型可以产生支持对其输出或所作决策进行分析的依据。AI工作流中的模型验证阶段包括需求编码、形式验证和基于测试的验证。这一阶段中所要达到的目标包括:
(1)模型验证的综合、全面性需涵盖:1)与模型的预期用途相关的所有要求和操作条件;2)AI工作流前几个阶段的所有需求(例如,训练数据的完整性和模型的稳健性)。
(2)在上下文相关性方面,模型验证应与将使用模型的系统的上下文相关联。
(3)在可理解性方面,验证结果应能被使用验证结果的人员所理解,验证结果的使用场景可能涉及数据准备、模型开发、系统开发和监管批准等诸多环节。
最后,模型部署阶段包括模型集成、模型监控和模型更新。模型在部署后需要适合特定系统上下文中的预期用途,且应较易更新。考虑AI模型推理的输出存在一定的错误概率,系统需具备一定的容错性。
相关行业为满足上述要求而面临的主要技术挑战及解决方案,如表1所示。
表1 各通信行业应用人工智能技术的主要技术挑战与解决方案[7-12]
为了解决上述挑战,6G网络在设计之初就必须考虑内生AI的理念,将AI和大数据的应用融入网络的基因当中,形成一个端到端的体系架构,根据不同的应用场景需求,按需提供AI能力和服务。同时,6G网络中的算力将从外延走向内生,超越5G的边缘计算,最终实现网络与计算的深度融合。基于此形成的基础设施,才能为AI提供无处不在的算力,从而实现无所不及的泛在智能[1]。
具体而言,在数据管理方面,6G网络的内生智能需要解决数据结构与格式的规范化问题,提供包括仿真在内的多种数据增广技术手段,提供支持整个数据管理流程的自动、高效的数据处理和分析工具,以及提供专家经验和领域知识的导入或交互接口。在模型学习方面,建立一套模型的描述机制及模型的元数据库,建立环境相似性的度量机制以支持迁移学习,构建基于环境上下文动态优化的、综合性能与效率的模型评估技术体系,提供模型的局部或全局的可解释性方法或接口,提供模型导入和重用的机制与接口,提供分布式模型训练框架,以及基于上下文的自动化调参技术。为了有效地验证模型,6G网络需提供生成测试数据和测试场景的仿真环境,提供导入模型验证指标及测试用例的通用接口,提供从模型验证结果反馈到AI工作流各环节的闭环优化流程,提供对外接口对模型进行形式验证。最后,为支持模型的部署和推理,需建立分布式实时协作推理框架,提供适配底层硬件的模型优化工具,建立数据与模型的监控技术体系,对模型推理结果的应用效果进行预判,以及持续的模型在线更新机制及相关接口。
2.2 云网络AIaaS
当前,面向行业本地应用的智能化标准架构很少见,大多数采用“上云”的模式,企业租用云服务提供商的算力和存储,使用云平台提供的各类AI工作流工具。在目前的云端AI模式下,海量的设备数据通过5G等无线通信系统,跨越多个网络技术领域,传输到云端。这种方式是低效的,并且会给数据安全和隐私带来相当大的风险。另外,智能服务的实时性和高可靠性的保证成本很高。如果仅限于云端AI模式,6G无法实现智能无处不在的愿景[13]。
与单纯的集中式云数据中心不同,6G网络将是端到端的云原生网络,这有助于实现业务快速部署、功能软件版本快速迭代、资源(例如无线电频谱、计算和存储)的动态共享、网络自动化和智能化。在云原生网络中,各类AI功能和工具将被服务化,以AI as a Service(AIaaS)的方式被网络内部功能调用或提供给第三方使用。其面临的技术挑战与云服务供应商有所不同:首先,与集中式云平台不同,云原生网络中的资源分布呈现出分层级,多维度(通信、存储、计算)、规格异构,分布式与集中式相结合的形态。这就给AI功能服务之间的通信、资源分配和编排带来了挑战。其次,由于AI功能服务与网络功能服务均存在于云网络中,且两者之间有所交互。如何在多云的架构下,为他们设计统一的技术框架,使得该框架既能支持AI全生命周期中各功能的运转,也能支持不同网络功能间的各类交互,还能支持AI功能服务与网络功能服务间的信息交互,这也是一个巨大的挑战。
相比云服务提供商,传统运营商的优势之一在于既可利用广泛的边缘基础设施为垂直行业提供低时延云服务,保证对时延敏感的智能化应用的性能,同时也能利用部署在传输网和核心网内的多层级不同规格的云服务中心网络为客户提供不同QoS等级的AI服务,满足垂直行业的多样化需求。这需要运营商建立起一套评价和保障网络提供的AI服务质量的技术体系,同时需重点研究如何设计、建模和对外开放这些AI服务,以满足边缘智能化应用的低时延需求。
由于AI服务和网络功能服务将共生于6G云网络中,对于以数据驱动的网络功能服务,在其设计之初即应考虑与AI服务的高效交互及联动,将AI作为一项重要的设计原则。反之,在AI功能的设计、AI服务的拆解和组合上,也需考虑如何以统一的方式与不同的网络功能服务进行交互以获取或配置数据,并解决不同数据源的数据格式兼容性问题,如何在AI服务之间交互不同格式的数据、信息以及智能,业界针对数据驱动的物联网业务建立的开源框架如EdgeXFoundry、MUSA、BigClouT等提供了很好的技术参考[12]。
在端到端的云网络中,编排器起着至关重要的作用。当AI服务内生于云网络后,编排器不仅需要负责AI服务本身的动态发现、动态拆解、组合和重定位,更需联合考虑网络功能服务和AI功能服务,为满足其各自的服务质量需求,联合进行资源的分配、编排,AI与网络功能服务的解耦或组合等,以同时支持“AI for Network”和“Network for AI”的应用场景[13]。
3 AI架构研究现状
人工智能在通信领域应用的研究工作始于2017年[14]。2017年2月,3GPP服务和系统第二工作组SA2开始研究5G核心网的智能化网元:网络数据分析功能NWDAF(Network Data Analytics Function)[4]。同月,欧洲电信标准化协会ETSI成立了体验式网络智能ENI(Experiential Network Intelligence)工作组,专门研究体验式感知网络管理架构、用例、术语等[15]。2017年6月,中国通信标准化协会CCSA启动了人工智能在电信网络中的应用课题研究[16]。2018年6月,3GPP无线接入网第三工作组RAN3开始研究无线侧的数据采集机制[17]。电信管理论坛TMForum(Telecom Management Forum)也开始了与人工智能相关的研究工作。2018年10月,3GPP SA5开始人工智能研究,定义了一个新的管理面功能:管理数据分析功能MDAF[18]。2019年6月,国际电信联盟电信标准分局第13研究组ITU-T SG13启动机器学习用例的研究[19]。同月,全球移动通讯系统协会GSMA开始了智能自治网络案例的白皮书制定工作[20]。2020年6月,3GPP SA5开始启动网络自动化分级课题的研究[21]。2020年7月R16正式冻结后,3GPP RAN3 SA5针对新的R17版本继续推进人工智能相关的ENDC、NWDAF、MDAS等标准化课题的研究。
3GPP中对于AI功能架构的研究主要集中在网络功能层面引入的NWDAF和管理层面引入的MDAS上。NWDAF是数据分析网元,根据网络数据自动感知和分析网络,参与网络规划、建设、运维、网络优化和运营的全生命周期,使网络易于维护和运行。3GPP在R16阶段定义了NWDAF的基本框架,R17定义了NWDAF功能的拆解、数据采集优化、多实例部署时NWDAF实例间的协调,并未对AI数据集或训练模型进行标准化。虽然通过NWDAF有效提升了网络性能,但这种AI功能打补丁的集成方式暴露了一些问题:一是海量测量上报导致的数据安全问题和过高的信令开销;另一个是低延迟的挑战,因为所有数据都必须上传到中央分析单元进行处理,即NWDAF,而它可能部署在远离数据源的地方。在管理面的MDAS的设计上,也存在类似的问题,MDAS对管理域数据进行分析,支持RAN或CN域内的数据分析或跨域的数据分析,并支持与NWDAF的接口和交互,但其本质还是一个中央分析处理单元。
2018年1月,ITU面向未来网络(包括5G)成立了FGML5G(Focus Group on Machine Learning for Future Networks including 5G),旨在帮助ITU-T研究组和研究实体在未来网络中采用可互操作的 ML overlay,包括架构、接口、协议、安全和信息保护。截止2020年7月,FG ML5G输出并向ITU-T第13研究组提交了关于用例、架构框架、智能级别、数据处理、机器学习(ML)功能编排器、服务框架等的十项技术规范。其中一半的规范已经变成了ITU标准。FG ML5G提出了一套针对机器学习ML的管理子系统,其核心功能包括ML意图的解释器和ML功能的编排器(MLFO)[22];针对机器学习生命周期内不同阶段所需功能,提出了跨多域、多云、不同层级的多层级ML工作流,由MLFO进行统一编排[23];针对动态网络环境下,ML模型应用效果存在风险的问题,提出了应用“沙盒”对ML工作流或ML模型进行预验证和迭代优化[24]。不足之处在于对ML意图的定义尚不完善,混淆了ML意图和手段,且部分意图指标运营商很难明确给出;在数据处理框架部分,缺乏新数据源数据模型的自动生成和注册机制,以及数据模型的闭环优化机制;在沙盒框架部分,缺乏对仿真环境的管理机制,包括仿真准确度的度量及闭环优化、仿真环境与真实网络间的数据交互、仿真环境配置的自优化等;在编排器部分,未考虑ML与NF的联合编排等。
ETSI于2017年定义了ENI系统,作为一个独立的人工智能引擎为网络运维、网络保障、设备管理、业务编排与管理等应用提供智能化的服务[15]。ENI系统是一个将数据分析功能集成到闭环管理和编排过程的系统,重点定义了和网络自治相关的功能,ENI引擎内部的接口以及面向其他网络功能的对外接口。如通过数据处理和正则化对原始数据进行清洗和特征分类,将ENI产生的策略或者指令进行翻译,输出服务对象能够理解的语言。
综上可见,目前移动通信系统与人工智能融合的研究主要集中在利用人工智能技术使能网络自动化,提升现有通信系统的性能,改善通信服务的用户体验。标准组织中的大部分工作集中在讨论智能化应用场景案例、所需采集的数据、功能实体间的接口和数据分析输出内容上。对于AI全生命周期工作流在网络中的功能架构及与网络功能的融合编排方面讨论较少。
自2019年以来,国内企业和高校面向无线AI开展了大量的研究,致力于解决无线AI在架构、模型、数据、算法等方面面临的诸多挑战。从这些研究来看,内生AI的智能无线网络通信系统应该由四个部分组成:智能化数据感知模块,能够自动感知收集各个网元的数据;智能化建模模块,可以减少人工的干预且网络能够自动地建模训练,实现网络自主学习能力;智能化AI网络架构模块,采用分布式的AI服务器架构,各个网络节点可以作为AI训练/执行的一部分,根据本地收集的数据集,通过大量相关联的设备共同构建一个通用模型;智能化监控模块,采用传统AI+专家经验方法,解决AI模型本身无法做出正确的决策或做出错误决策造成的成本很高的问题,或者采用强化学习算法,改进决策策略来适应外部环境。但国内的研究目前还没有讨论架构的具体实现方式等。
2020年12月,由中国通信学会主办、中国移动研究院联合承办的以“从Cloud AI到Network AI:打造6G网络架构”为主题的研讨会在成都召开,研讨会发布了来自运营商、设备商、互联网服务商、高校等18家单位共同签署的6G Network AI论坛倡议书,成立了6GANA(6G Alliance of Network AI)论坛。6GANA定位为全球性论坛,专注于6G网络AI相关技术、标准化、监管和产业的持续探索和推广。它旨在通过整个生态系统的联合研究,包括ICT(如芯片制造商、网络基础设施供应商、移动网络运营商)、垂直行业、人工智能服务提供商、人工智能解决方案提供商、人工智能学术界和其他利益相关者,形成业界共识,推动AI能够成为6G网络全新的能力与服务。
6GANA的首要目标是保证6G网络对AI业务的最佳适应性,保证6G标准和规范充分考虑AI领域的应用和特点。6GANA将引导垂直行业使用基于高性能无线通信技术的人工智能服务,帮助各行业受益于6G网络赋能的人工智能计算能力、开放的人工智能算法和安全的人工智能数据生态系统。通过将整个生态系统拉到一起,它将建立一种共同的语言和相互信任。6GANA还可以作为行业论坛,充分考虑6G网络架构中的特定行业需求[13]。
为促进内生AI与6G通信网络的深度融合,6GANA提出产业界需在如下三个技术方向上达成共识:支持内生AI的6G网络功能和协议,支持内生AI的6G网络架构,支持内生AI的6G网络自治框架。前两个技术方向对底层网络架构进行改造,最后一个涉及在新架构中构建AIaaS,实现6G网络上AI应用的使用、开发、部署、维护和监控。
4 6G内生智慧架构
4.1 功能架构
基于6G网络“三层四面”的逻辑架构设计[25],我们提出一种6G网络内生AI功能架构的设想。6G网络架构的内生智能将使AI能力在网络中无处不在、无孔不入,并像人体的大脑和神经网络一样,以分布式或集中的方式按需提供AI能力。同时,通过智能平台,6G将外部AI能力引入网络,提供新服务、新能力,将外部数据引入网络,进一步提高数据处理效率。此外,网络内的分析数据和人工智能能力也可以暴露给第三方,通过智能平台为其提供服务和所需的支持,如图2所示。
图2 6G网络内生AI功能架构
在数据面上,内生AI架构涉及到的功能模块如图3所示。既需要全局的数据采集、存储和处理,也需要进行本地数据的收集和处理。因为在很多应用场景下,出于数据隐私的考虑,客户并不希望自己的数据被上传到公共网络中,需要网络在本地提供处理和存储这些数据的能力,因此需要一种分布式和集中式相结合的数据管理架构。训练数据管理提供模型训练所需的训练样本,根据模型性能要求对训练数据进行定制和预处理。
图3 数据面功能模块
如图4所示,在智能面上,人工智能模型的管理包括模型的选择、生成、存储、更新、转移和删除。管理的模型包括网络资源层、网络功能层和服务应用层的各种模型,用于优化这些层级的相关实体。RAN域、TN域、CN域、UE等各个域也需要集中智能与分布式AI能力相结合。全局集中的AI平台可以对外部和内部数据模型进行全局处理,并根据特定用例的要求编排智能能力,然后将结果分发到特定子域的AI平台执行。对于本地的AI能力,需要尽可能靠近用户部署,提供实时的AI能力支持,包括模型和算法等。知识仓库对人工智能模型的应用结果进行汇总和抽象,提取规则或关系模式以及外部导入的专家经验。
图4 智能面功能模块
作为人工智能的三大支柱之一,计算能力至关重要。随着通信、计算、存储的融合,计算能力也是我们需要进行管理的。从网络部署的角度,必须考虑其经济性,综合考虑如何利用这种分布式、集中的计算能力,我们还需要考虑终端和网络之间计算能力负载分担的方法。
综合上述功能设计,完整的内生AI架构设计如图5所示。该架构提出如下创新理念:首先,为支持6G网络的自优化和自演进,AI用例将不再由网络管理或优化团队提出,而是由网络通过AI用例生成器或外部通过API导入。第二,网络提供对AI服务的性能评估和保障,这是通过QoAIS(Quality of AI Services)解释器和评估器完成的。人工智能用例的性能需求由解释器导出,转化为人工智能工作流程中对模型、算法、计算能力、数据和工作模块的具体需求。然后由编排器聚合网络能力,并由硬件资源支持,以满足人工智能用例的上述要求。当然,AI超脑也可以将一些需要全局协调的编排结果交付给各个子域执行,从而保证智能化应用得到全局支持。第三,该架构为本地用例提供了类似的框架,以支持实时用例。由于是端到端的架构,因此编排时也考虑了终端的AI能力,支持终端的智能应用。最后,AI模型、数据和知识可以重复使用并共享给第三方。同时,内生AI架构中的各项功能和服务也可开放给第三方,提供所需的智能。
图5 完整的内生AI架构
4.2 技术特征
除了上述功能架构的设计外,我们总结提炼出6G网络内生AI的三大技术特征,以应对AI全生命周期工作流和云网络AIaaS带来的技术挑战。
第一项技术特征是基于QoAIS的AI全生命周期服务编排,这项特征在功能架构中已有所体现。为了满足网络本身和各行业对智能化服务质量的不同需求,6G网络需构建一套AI服务的质量评估和保障体系,并基于AI服务的目标性能,对其生命周期内的功能服务、相关数据和模型、以及所需资源进行编排。为支持该技术特征,需进一步研究AI用例的自生成技术、QoAIS的解析和评估技术、数据/模型/资源的API设计、自动模型搜索和构建技术(如AutoML)、在线学习的数据处理、模型训练推理和自更新的流程编排等。
第二项技术特征是内生AI计算与通信的深度融合。这一特征是运营商区别于云服务提供商和其他任何AI服务供应商的关键所在。这种融合既包括将AI用在提升网络运维智能化和网络性能的“AI for Network”场景,也包括为保障AI服务的性能,网络架构、协议和功能所做出的改变,即“Network for AI”场景,同时还包括为提升整网资源效率、降低成本,而对AI功能和网络功能做出的联合优化。在这一方向上,当前已有较多关键技术在研究中,如基于数据分割或模型分割的分布式模型训练[26-27]、分布式实时协作推理[28]、基于联邦学习的空口传输和资源调度优化[29]、AI模型信源与信道联合编码、二阶模型训练算法降低空口训练开销[30]等。
第三项技术特征是内生AI与数字孪生的融合。6G网络架构的特征之一是数字孪生网络[31]。2030年以后的社会将是数字孪生社会,数字孪生技术也可以应用于6G网络,实现全数字化。通过数字孪生,每个网络实体和用户的服务都可以通过实时信息采集实现数字化。实时状态监测、轨迹预测和对可能出现的故障和服务掉线的预测性干预将成为可能,从而提高整个网络的运行效率以及服务效率;还可以提前验证网络新特性部署的效果,加快新特性的改进和优化,实现新功能的快速自动引入,从而实现网络的自我进化[1]。内生AI架构可利用数字孪生网络提供的仿真功能生成模型训练所需的样本数据,提高输入样本空间的完整性,也可在孪生网络中对AI工作流或AI模型的效果进行预验证和优化,避免AI功能的启用对真实网络带来性能的损伤。反过来,数字孪生网络也可利用内生AI架构解决其自身的构建问题,比如通过收集网络功能的相关数据训练出可模拟该功能的AI模型,作为其孪生体、通过GAN生成的数据构建孪生体,从而降低数据传输对网络资源的消耗。
5 后续研究
本文初步提出了6G内生AI功能部署架构及其主要技术特征,后续仍需从如下方向开展进一步研究工作:
首先,在内生AI的需求方面,需进一步研究统一的内生AI需求用例和服务质量的表征方案、闭环保障架构和技术体系,具体包括内生AI需求用例的表征方案、语言、接口;研究内生AI需求用例的自生成和管理技术体系。
其次,在AI服务质量闭环保障及统一编排管理方面,需基于端-边-云的多层次网络架构,进一步研究AI工作流编排、网络资源编排的技术框架。具体包括QoAIS的解析、评估和保障技术体系;高效的通信-计算-存储多元异构资源的协同调度机制;数据、模型、功能和工作流的域内和跨域的编排管理。
最后,在内生AI基础网络架构方面,需进一步研究并完善内生AI整体技术框架,进一步研究内生AI和数字孪生网络的融合架构,包括基础网络架构及功能模块、接口和流程。
6 结束语
本文聚焦6G网络架构的关键特征“内生智能”,从5G网络智能化和6G“智能泛在”愿景两方面出发探讨了内生智能的需求,分析了AI生命周期工作流(包括数据管理、模型学习、模型验证和模型部署)和云网络AIaaS存在的技术挑战,包括AI服务质量的评估和保障体系、AI功能服务和网络功能服务的设计以及联合编排,总结了当前各行业组织(包括3GPP、ETSI、ITU、TMForum等)对AI功能架构的研究进展和欠缺之处,提出了6G内生AI端到端功能部署架构及其在6G网络“三层四面”逻辑框架上的功能映射关系,提出了内生AI的三大技术特征:基于QoAIS的AI全生命周期服务编排、内生AI计算与通信的深度融合、内生AI与数字孪生的融合,以及支持上述特征的关键技术。最后,从内生AI的需求、AI服务质量闭环保障和基础网络架构方面对后续研究方向进行了展望。