APP下载

网络智能化标准、开源与产业研究

2021-11-11邓灵莉顾宁伦袁向阳余立冯俊兰邓超杨志强张同须吴荣宇张新鹏

电信科学 2021年10期
关键词:闭环运维架构

邓灵莉,顾宁伦,袁向阳,余立,冯俊兰, 邓超,杨志强,张同须,吴荣宇,张新鹏

(1. 中国移动通信有限公司研究院,北京 100053; 2. 中国移动通信集团有限公司,北京 100032; 3. 中国移动通信集团河南有限公司,河南 郑州 450008)

1 引言

1.1 网络智能化基本定义

网络智能化是AI技术与通信网络的硬件、软件、系统、流程等的深度融合,利用AI技术助力通信网络流程智能化,降本、增效、提质,促进技术体系变革,使能业务敏捷创新。其需求动机主要来源于以下3个方面。

(1)管理优化需求:运营商现有生产网络层级多、网元多、厂商多、版本多,而现有投诉处理、故障管理等运营运维流程依赖工单流转与人工操作,效率有待提升、经验难以固化和复制推广。

(2)网络演进需求:基础设施虚拟化和网元软件化在实现资源弹性和动态调度等新特性的同时,也给分层解耦的转型网络带来了更多的管理层次和厂商组合,加之5G网络的复杂配置和能效管理,进一步加剧了网络管理的复杂度。

(3)业务拓展需求:随着个人用户市场的饱和,作为被寄予厚望的潜在增长点,新型智能服务和行业应用对网络服务从时延到可靠性、带宽及连通性等各方面均提出了更为严苛的个性化需求。

自动驾驶网络[1]提出通过简化网络架构、封装自治域和提供业务/网络操作控制闭环,实现用户体验最优化、管理操作自动化和资源效率最大化,为网络智能化明晰了目标架构和实现路径。

自动驾驶网络概念最早于2019年5月TM Forum举办的数字转型峰会期间,由中国移动等公司主导发布的《自动驾驶网络白皮书》[1]首次提出,旨在为未来网络管理提供参考架构和管理框架。一方面为垂直行业的客户定义全自动零等待、零接触、零故障(Zero-X)的创新网络和ICT服务;另一方面为服务运营商的规划、服务/营销、运营和管理,提供具备自我配置、自我修复、自我优化和自我演变(Self-X)能力的电信网络基础设施。

1.2 网络智能化技术体系分层架构

如图1所示,自动驾驶网络定义了三层四闭环的分层架构[1],一方面底层网络资源被划分成包含网络设备及其管控系统的自治域,域内的网络功能复杂性被封装为一组网络服务,同时域内网络功能运维管理本身实现高度自动化;另一方面以自治域为基础,形成分别对应资源操作、服务操作和业务操作的3个层次,层内提供自动闭环,层间通过意图接口交互,使上层服务调用独立于下层实现。

图1 自动驾驶网络/网络智能化的分层架构

• 资源运营层:在每个自治域中,通过控制网络资源操作交互的资源闭环实现网络资源和能力调度自动化。

• 业务运营层:通过面向业务操作,并与网络资源操作交互的业务闭环,实现跨自治域的网络规划、设计、开通、配置、保障和优化自动化。

• 商务运营层:通过实现业务域业务操作之间交互的商务闭环,为客户和合作伙伴提供自动驾驶网络服务的商务支持和运营自动化。

• 用户闭环:通过与上述3层中其他3个闭环的交互实现用户服务,是触发对应商务/业务/资源闭环的主线程。

1.3 网络智能化分级框架

由于通信网络管控、维护和运营的场景多样性和业务丰富性,作为网络智能化的终极目标,为实现自动驾驶网络,涉及多层次、跨领域的复杂协作,难以一蹴而就,需要在具备行业共识的分级标准和评测体系指导下,分阶段发展演进。

与之对应,根据自动驾驶网络分级框架[1],网络智能化能力逐步提高包含特定场景的功能要求以及覆盖场景范围两个维度的要求,具体包括以下几个级别。

• 级别0——手工运维:系统仅提供辅助监控功能,所有动态任务都必须手动执行。在此级别中,Zero-X不适用。

• 级别1——辅助运维:系统根据预先配置执行某个重复的子任务,以提高执行效率。在此级别中,Zero-X仅适用于个别情况。

• 级别2——部分自治/初级智能化:在某些外部环境下,系统基于人工智能模型为某些单元启用闭环监控运维自动化(自动闭环)。在此级别中,Zero-X仅可用于单个自治域内场景,但不能适用于跨域网络服务。

• 级别3——有条件自治/中级智能化:基于级别2的能力,系统可实时感知环境变化,并在特定网络域中,自动实现自身优化调整以适应外部环境,从而实现基于意图的闭环管理(认知闭环)。在此级别中,Zero-X可用于特定的跨域网络服务和自治域内场景。

• 级别4——高度自治/高级智能化:基于级别3的能力,在更复杂的跨域环境中,系统支持基于服务和客户体验驱动的预测、分析和决策(主动闭环)。在此级别中,Zero-X可用于特定网络服务的端到端全生命周期操作。

• 级别5——完全自治/完全智能化:系统拥有覆盖全生命周期、跨域、跨服务的自动闭环能力。在此级别中,Zero-X可用于任何网络服务的端到端全生命周期操作,这是电信网络演进的目标。

1.4 网络智能化技术体系

如图2所示,自动驾驶网络对电信运营商的网络管理体系提出了空间和时间两个维度的需求。一方面,自动驾驶网络的分层分域闭环自治架构和跨层业务驱动交互要求运营商网络管理体系在空间维度实现功能增强(“加法”)和接口简化(“减法”);另一方面,自动驾驶网络对AI技术的引入和网络管理本身复杂度,要求运营商网络管理体系在时间维度实现持续迭代和逐步提升(“螺旋上升”)。

图2 网络智能化体系架构

从功能增强角度来看,首先,在网络管理域、各专业网络域和基础设施域固化人工经验形成静态规则,引入自动闭环;其次,从用户闭环驱动角度来看,扩展已有原始数据采集体系,实现覆盖各专业网络KPI感知、端到端业务感知和用户体验感知的网络感知体系;最后,分别在各层次自动闭环的感知、分析和决策环节,系统性地引入大数据和AI技术,实现超越人工经验的意图驱动认知闭环。

从接口简化角度来看,首先,使用规则简化各层管理接口;其次,根据运营商策略统一治理网络数据/知识的接入、汇聚、存储和分发;最后,进一步通过意图封装管理接口,实现上层意图到下层规则的自动转换,并提供达成情况反馈。

从持续迭代角度来看,考虑到现代AI技术数据驱动的特性,结合自动驾驶网络客户/业务驱动的目标,嵌入在各个管理层次/自治域中的AI算法/知识/规则,需要持续监测、演进和迭代才能跟随网络/业务/用户的动态发展保持“活力”,为此,网络管理体系需要建设面向算法模型、微服务、网元/网管的DevOps机制,为各层认知闭环的持续迭代提供数据、训练、封装和发布服务。

2 网络智能化产业现状

2.1 产业组织布局

建设网络智能化能力、提升网络自动驾驶水平,助力运营商实现数字化转型,已成为全球业界共识。如图3所示,标准组织、行业组织、开源组织纷纷布局、抢占先机,覆盖了网络智能化技术体系的各个领域。

图3 网络智能化产业组织工作布局

2.1.1 通信技术领域

TM Forum自2019年启动自动驾驶网络项目至今,已经发布2篇白皮书[1-2]和4项规范标准,定义了目标愿景和工作规划[3](即将滚动更新)、商业需求[4]和技术架构[5]。

ETSIISG ZSM正在讨论在其针对跨域端到端网络运维管理层次的ZSM框架中如何引入闭环自动化,并针对数据驱动的机器学习和AI算法进行优化[6]。

自4G面世以来,3GPP已开始通过引入无线专业的自组织网络(SON)控制闭环和路测最小化(MDT)数据采集增强机制,实现移动网络的部分自动化。面向5G,除了在无线工作组RAN和网管工作组SA5继续完善增强SON/MDT[7-9]之外,3GPP的核心网架构工作组SA2和网管工作组SA5还分别引入了针对核心自治域与服务运维层次的本地智能分析逻辑功能NWDA[10-12]和MDA[13],以及闭环SLS保证机制[14-16]和意图驱动管理IDM接口[17-18]。

2017年,ITU-TSG13建立了包括 5G(FG-ML5G)在内的面向未来网络的机器学习的焦点小组,并先后发布了面向未来网络的机器学习[19]和数据处理框架推荐标准[20]。

2019年,O-RAN联盟参照3GPP的5G RAN网络架构发布了无线智能管控架构[21],以及在其中应用AI/ML技术的指南[22]。其中包含对应于服务运维域的非实时无线智能控制器non-RTRIC[23]和对应于无线自治域的近实时无线智能控制器near-RTRIC[24],以及对应于基础设施域的虚拟化白盒网元管理系统[25-26]。目前,O-RAN联盟正在制定和完善无线自治域北向意图接口标准A1AP[27]和基础设施域北向规则接口标准E2AP[28]。

IETF早在2014年便正式成立了自主网络(autonomic network)工作组ANIMA,并于2015年发布了对应于传输自治域IP网络的自主网络概念定义[29]和需求分析[30]。基于IETF开发的YANG数据建模语言[31]和网络配置协议[32-33],网络管理模型工作组NETMOD和网络管理研究组NMRG正在分别进行自主网络北向规则接口标准[34]和意图接口管理需求[35]的研发工作。

负责OpenFlow系列协议标准制定的ONF,于2015年4月在控制器北向接口项目组成立意图驱动网络(IBN)研究课题,并于2016年10月发布基于其SDN功能架构[36]与北向接口实现IBN的参考指南[37]。

ETSI ISG NFV已将MANO自动化作为近期主要工作目标之一,为此开展了针对虚拟基础设施层自动闭环的规则策略[38]和意图框架[39],以及面向VNF持续迭代CI/CD测试标准[40-41]的研发工作。

2.1.2 通用智能领域

ETSI ISG ENI定义了网络AI应用的类别[42],即将发布用于增强网络智能的通用功能架构[43],及其与已有网络管理体系的映射[44]。

2004年W3C发布由Web本体工作组(WebOnt)制定的Web本体语言推荐标准OWL[45],通过定义类以及类的属性将领域知识形式化:形式化定义个体并说明它们之间的属性;并在OWL允许的层次上,对类和个体进行推理。

2017年脸书、微软等公司联合推出开放的神经网络交换ONNX标准[46],通过标准化神经网络计算图(模型文件)的表示格式,推动各类神经网络开发框架的互通互用与优化共享。

2017年和2018年相继成立的Linux网络基金会和Linux人工智能与数据基金会,分别提供了开放网络自动化平台ONAP[47]、开源SDN控制器OpenDaylight[48]、网络大数据与 AI工具集PNDA[49],以及模型集市Acumos[50]、边端模型优化与推理框架Adlik[51]等一系列面向网络智能化的通用自动化平台与智能化工具。

2019年,微众银行发布联邦学习开源框架FATE[52],作为联邦学习全球首个工业级开源框架,FATE为实现机器学习、深度学习、迁移学习提供跨域联邦学习方案与交互信息管理。2020年IEEE正式批准首个联邦学习框架标准[53],为互不信任或因为监管要求需要隔离的不同管理层/自治域之间进行协作学习提供参考标准。

2.1.3 分级评测领域

2019年基于自动驾驶汽车分级框架和认知闭环(执行、感知、分析、决策、意图体验)的网络智能化分级框架被TM Forum的《自动驾驶网络白皮书》[1]采纳发布后引起业界广泛关注。

3GPP[54-55]、TM Forum[5]、ITU-T[56]随后分别启动了针对网元管控运维层次以及服务与运营层次的智能化分级研究课题、推荐标准与行业标准项目。

2020年,GTI的eMBB课题组[57]启动网络智能化专项并应用分级框架对网络智能化应用进行初步评估。

2.2 产业组织协作

由于网络智能化的目标架构涉及网络管理体系各领域的横向拉通和各层次的纵向联动,而相关领域各个标准组织规范研发和开源社区参考实现之间缺乏有效协同机制,为此多个行业组织正在积极布局争夺网络智能化的产业引导话语权。

2020年9月,TM Forum开始组织针对自动驾驶网络的跨组织协作专题研讨会议,计划从推动基本概念、术语、框架(包括自动驾驶网络的定义、闭环、分级、自治域、认知闭环等)的共识入手,加强专注于各网络自治域内部的行业组织间的深入协作,共同开展关键技术、接口标准、示范应用以及测评规范的开发。

ITU-T负责下一代网络标准的SG13研究组,继2017年建立FG ML5G焦点小组并发布面向未来网络的机器学习功能框架[19]、智能分级评估框架[56]和数据处理框架[20]之后,又于2020年11月建立FGAN自动驾驶网络焦点组,计划开展针对标准和开源的产业引导工作。

2020年12月,NGMN启动网络自动化与自治项目,计划在网络自动化平台基础上,进一步开展网络智能化需求调研,并从运营商角度出发为促进相关标准与开源的开放产业合作提供建议。2021年1月,经董事会批准,NGMN正式成立针对软件化网络的端到端运营模式研究专项工作组,计划就软件化网络的持续集成和持续迭代等运营管理转型进行引导。

2020年9月至2021年1月期间,Linux网络基金会组织了针对网络智能化需求场景、研发策略与应用部署的公开调研[58],并在旗下测评认证委员会(CVC)讨论,与TM Forum、O-RAN、3GPP和IETF等标准组织协作,规划开展针对智能网络服务和网络AI算法的评测工具研发与实验环境构建。

2.3 产业进展调研

根据最新调研分析[58],如图4所示,业界的网络智能化转型总体尚处于起步阶段:一方面,从网络自动驾驶级别角度观察,大部分运营商在人工运维、辅助自动化、初级智能化、中级智能化、高级智能化与完全智能化6个级别中处于初级智能化级别;另一方面,从应用研发阶段角度观察,业界公司在尚未启动、概念验证、分散试点、规模商用与长远计划5个研发阶段中大部分处于概念验证和分散试点阶段,尚未进入规模商用成熟期。

图4 网络智能化产业调研分析:总体进展

领先运营商和厂商普遍采用统一平台进行网络智能化应用的引入与协同。如图5(a)所示,研发应用阶段越高,选择平台策略的公司占比越高;进入规模商用阶段后的所有公司均采用统一平台。在平台的功能规划方面,AI算法是所有公司的首要需求,其次是提供数据接入能力与业务应用,最后是提供统一研发部署与受信任的AI能力。

与此同时,运营商普遍倾向自研。如图5(b)和图5(c)所示,超过一半的运营商自研网络智能化平台,超过三分之二的运营商自研网络智能化应用。其中,直接服务于客户和管理一线的运维、保障、优化等是业界普遍最为关心的应用类场景,而智能网元、能效管理、应用优化3类应用场景,由于受本身技术难度大、标准化程度低、不受掌控等客观条件影响,排名普遍偏后。

图5 网络智能化产业调研分析:研发策略

3 差距分析与协作建议

如前文所述,网络智能化已成为通信行业关注热点:各标准组织和开源社区的已有工作布局覆盖了网络智能化技术体系的所有管理层次和各个专业领域,并开展了多样的跨组织协作。与此同时,运营商生产环境下的相关实践仍处于起步阶段,并由于缺乏明确的产业引导而面临诸多挑战,这主要体现在统一行动路线、构建愿景共识和孵化产业生态3个方面。

3.1 统一行动路线

现有分级框架虽从覆盖场景角度提出了网络自动化和智能化能力提升的分阶段建设路径,但未对网络智能化实践中如何避免各场景烟囱式开发、拉通现网各专业各厂商能力差异并提升和维持网络智能化水平提供明确的可操作建议。

一方面,面向现网运营的高层(业务运营域与商务运营域)能力建设需要解除对底层(网络自治域和基础设施域)的能力依赖和实现绑定。为此,需要持续推动基础网络数据采集和管理控制的能力开放与接口标准化。

另一方面,面向网络演进长期发展,考虑到网络基础设施的云化转型,高层(业务运营域与商务运营域)的未来能力建设重点,将从关注网络设备本身运行状态或局部网络KPI,扩展到面向业务的体验感知能力与智能保障机制建设,需要着重加强推进网络感知域体系建设。

此外,如何为网络自动化智能化水平的快速提升与长期演进做好顶层设计,实现上述两方面工作的统筹协调,一方面,确保短期攻关技术积累能最大程度地为长期能力建设与优化迭代所复用,另一方面,面向端到端业务目标形成覆盖异构网络基础设施的敏捷开通、统一管理和运维保障体系。为此,需要着重推进与网络基础设施解耦可复用的通用智能域体系建设。

3.2 构建愿景共识

目前,针对网络自治域与基础设施域的自动闭环、本地AI及KPI感知功能增强如何与通用智能域AI平台提供的数据、训练、封装和部署服务对接,缺乏明确的产业共识与可参照的标准规范;各领域的规则、意图、知识和模型交互接口规范由各标准组织分头制定缺乏协同,存在架构冗余与接口不一致的情况。

上述现象的根本原因在于传统通信行业标准协作以网元和网络为核心,以专业领域作为分工依据。各标准组织之间松散耦合的协作模式,难以为需要跨层跨域进行统一规划建设的网络感知域与通用智能域建立体系化规范。为此,需要引导产业各方建立面向全程全网自动化和智能化能力体系建设的跨组织协作平台。

3.3 孵化产业生态

持续提升网络智能化能力,涉及网络运维责任逐渐从人转移给软件系统,系统决策依据从可解释的经验扩展到难以直观理解的人工智能算法模型,并非单纯技术实现问题。

AI核心本质上是一个数学和计算的问题,现有工作更多的是将其他领域AI技术直接应用在通信网络问题上做一定尝试,而对网络所需的核心智能化能力的数学问题抽象不够。同时由于缺乏反映通信网络的公开数据集、实验环境、知识库等研发AI算法的基础,因而缺少面向网络智能化的核心算法和理论。

根据LFN的产业调研数据分析[58],实验环境、数据集、人才储备是当前业界主体初级智能化水平和未来持续提升长期面临的共性挑战;相对领先的运营商和数字服务提供商还普遍面临网元标准化、数据标准化的挑战,也需要提前规划、做好储备、优化应对。从厂商角度看,网元标准化与研发环境是当前面临的共性挑战,“不信任完全网络智能化控制”是进行长期产品规划时主要担心的问题。

因此,更需要产业协力构建服务于网络智能化技术大规模研发、测试、认证、迭代的准现网环境,为共性能力研发沉淀、算力部署验证、数据原料加工提取提供有反馈的试验平台。

4 结束语

据Tractica/Ovum研究和预测,到2025年,全球电信业对AI的软件、硬件和服务的投资将达到367亿美元,网络/IT运营监控和管理将成为电信业最大的AI应用,占据电信业AI支出的61%。

伴随着中国社会与经济的数字化转型,中国运营商的网络智能化实践也在加速。中国移动成立九天特区并率先提出“2025年建设L4级别的自动驾驶网络”的发展目标[59]、中国电信提出“云改数转”的云网发展运营规划[60]、中国联通进行了围绕AI赋能网络的组织架构调整并发布自动驾驶白皮书[61]。

可以预见,中国作为全球网络规模最大、客户数量最多的地域之一,能充分展现网络智能化降本、增效、提质的规模效应;具备全球最复杂的网络架构、最丰富网络服务运维场景,拥有多年积累的大量人工运维管理经验,可检验和凸显网络智能化应用效果;在国家政策引导和相关企业的不懈努力下,积累了丰富的产、学、研联合创新经验,将成为带动全球网络智能化产业整体转型的核心力量。

面向未来,我们期待以中国企业为代表的新型数字服务提供商等产业各方,继续发挥其在国际标准、开源社区和产业协作中的影响力,结合自身网络运营体系改革、运维自动化能力提升的应用需求,与内部人工智能平台算法/能力/应用研发积累的经验,为通信网络运营商、网络设备供应商、网管系统集成商、第三方科研机构和解决方案提供商的网络智能化联合创新和应用实践,搭建产业协作的开放创新平台。

猜你喜欢

闭环运维架构
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
WebGIS架构下的地理信息系统构建研究
单周期控制下双输入Buck变换器闭环系统设计
双闭环模糊控制在石化废水处理中的研究
基于ITIL的运维管理创新实践浅析
一种基于FPGA+ARM架构的μPMU实现