APP下载

SDN协同控制器的智能内生技术研究与实现

2022-01-17张乐吴艳芹张珂毛东峰姜松胡华伟

电信科学 2021年12期
关键词:云网内生切片

张乐,吴艳芹,张珂,毛东峰,姜松,胡华伟

SDN协同控制器的智能内生技术研究与实现

张乐1,吴艳芹1,张珂1,毛东峰2,姜松2,胡华伟3

(1. 中国电信股份有限公司研究院,北京 102209;2. 中国电信集团有限公司,北京 100045; 3. 中国电信股份有限公司福建分公司,福建 福州 350001)

面对业务多样化、数据海量化、云网一体化等新需求新挑战,云网运营的思路和方式都在发生着变革,SDN控制器作为新一代云网运营系统的核心能力,与人工智能技术深度融合,研究意图解析、云网智能感知、保障、优化与自动执行的全流程闭环自治能力关键技术与应用实践,形成SDN控制器的智能内生能力。首先,阐明了SDN控制器智能内生研发的背景与意义;其次,说明了智能内生的能力架构及核心能力分布,逐步形成全流程闭环的云网自治;最后,聚焦5G切片、SRv6新业务新技术的场景用例,进一步解析了在智能感知、自主保障、自动优化等方面的重点技术及应用效果。通过关键能力研发、实施验证及技术标准化,SDN控制器智能内生技术逐步成熟,赋能云网智慧运营。

智能;自治;SDN控制器

1 引言

随着云网融合一体化需求日益增加,云网一体化的网络运营面临数据海量、业务多样、网络复杂的现状与挑战。

· 数据海量有待挖掘:随着网络规模进一步扩大,具有一定通信、存储和计算能力的智能终端和网元节点数目剧增,未来网络运营向数据化转型方向发展,传统基于统计分析的数据处理方法效率低下,不能有效分析和挖掘业务、网络及运维的数据价值。

· 业务多样灵活编排:云网融合业务需求多样、垂直行业对业务的按需配置、灵活编排需求旺盛,如何根据不同业务需求进行网络资源管理与编排,提升网络可重构性以实现对灵活、按需、高质量的业务支撑,依然是一个运营商的难题。

· 网络复杂需要智控:为了充分赋能云网,进行敏捷组网部署和智能化、自动化运维,需要针对差异化网络模型设计具有普适性的解决方案。由此对组网管理优化和故障处理速度提出了更高的要求。

软件定义网络(software defined network,SDN)已经在运营商中得到广泛应用,利用SDN的简单化、快速部署与维护、灵活扩展、开放智能等技术特性以应对这些挑战。SDN控制器作为SDN的操作系统,不仅实现对海量业务、网络、运维数据的采集控制、开通编排,还需要通过大数据与人工智能技术,实现业务可按需编排、业务和网络状态可动态感知与保障、网络能力可调整优化的智能内生能力。

随愿自治能力是SDN控制器智能内生的综合体现,通过对SDN控制器智能内生能力架构的设计、关键引擎研发及应用,以客户为中心,充分挖掘数据价值,构建面向跨域、跨厂商、跨专业的业务与网络的智能运营能力,这也是运营商在云网随愿自治领域的积极探索与实践。

2 SDN协同控制器的智能内生能力架构

智能内生在SDN控制器功能架构中位置如图1所示,智能内生功能纵向贯穿SDN控制器各能力层,引入AI模型管理和沙箱训练,AI融合智能运营,形成面向业务的感知分析、面向网络的分析优化、面向流量的预测调优等核心智能引擎,成为SDN控制器的智能大脑。

SDN控制器智能内生能力架构由感知分析、动态保障、自适应优化3层功能、18个细分能力组成,SDN控制器智能内生功能视图如图2所示。

· 感知分析能力:云网融合业务端到端感知分析,实现业务意图解析与感知评测。以5G切片专线业务为例,建立5G切片业务感知分析功能,对业务感知进行实时监测,针对感知质差形成优化策略。

· 动态保障能力:对用户业务的服务等级协议(service level agreemet,SLA)保障情况进行监测,研发确定性SLA保障模型,实现业务质量劣化预警,建立由感知驱动的、面向云网业务SLA动态保障能力。

· 自适应优化能力:通过对云网感知质差进行定界定段、流量动态预测、网络性能预测等功能,生成云网路径优化、带宽调整及网络性能优化策略,在SDN控制器内部驱动端到端业务智能编排,云网自动化调整、优化、调度。

图1 智能内生在SDN控制器功能架构中位置

图2 SDN控制器智能内生功能视图

3 SDN协同控制器智能内生关键技术应用

3.1 自感知:5G 切片感知分析能力

5G是SDN控制器应用的主战场,为更好地满足垂直行业多样化、定制化、敏捷化的业务需求,构建5G切片感知分析模型,通过对5G切片业务感知智能监测、感知分析、质差快速定界、感知闭环优化等关键技术研发,实现SDN协同控制器智能感知能力。

3.1.1 切片业务感知分析关键技术

(1)切片业务感知评价

从业务场景、切片性能以及网络质量3个维度对5G切片业务感知质量进行评价,其中业务场景层面从切片特定业务角度评价用户感知质量,切片性能层面和网络质量层面则从网络角度评价给用户提供的服务能力。

业务场景分析对5G切片主流业务,包括网页浏览业务、视频业务、即时通信业务、游戏业务的关键指标以及通用时延指标进行评价分析。各类业务场景的关键指标具体如下。

· 网页浏览业务:页面打开时延、页面首屏时延、HTTP下载速率。

· 视频业务:视频下载速率、视频卡顿频率、速率码率比。

· 即时通信业务:消息发送成功率。

· 游戏业务:TCP建立时延。

· 通用时延指标:上行往返时延(round-trip time,RTT)、下行RTT。

切片性能分析包括抖动、丢包、速率、时延。

网络质量分析分别从网络侧和接入侧评价网络的服务能力,典型关键指标如下。

· 网络侧:传输控制协议(transmission control protocol,TCP)重传率。

· 接入侧:CQI(channel quality indicator)优良比、5G下切4G/3G比例、E-RAB(evolved radio access bearer)掉线率。

5G切片业务感知质量以感知优良率来衡量,计算式为:

(2)切片业务感知问题定界、定段、定位

结合5G切片业务特性,从服务提供商(service provider,SP)、核心网、IP化的无线电接入网(IP radio access network,IPRAN)、终端、无线网5个维度确定端到端感知质差环节,同时结合各专业网管性能告警、互联网数据中心(internet data center,IDC)资源分布等多类数据,准确分析定位切片业务感知异常原因,5G切片业务感知质差定界定段流程如图3所示。

3.1.2 应用实施

5G切片感知监测分析引擎采集切片业务、性能、告警、故障等类型数据,进行过滤清洗和结构化存储,数据结构采用缓冲存储器(Cache)层→操作型数据存储(operational data stort,ODS)层→数据仓库(data warehouse,DW)层→数据集市(data mart,DM)层架构,如图4所示。数据采集模块定时将数据采集至分布式采集库,即按照一定的时间粒度(如秒),建立目录并上传到分布式文件系统中,以支持系统的实时或非实时采集场景的需求。在Cache层中,汇聚整合模块读取维度表(小区资源表、服务质量保障表等)、采集模块采集的各系统数据,关联汇总计算,生成的数据加载到ODS层,此处为小时颗粒度。ODS按照业务、城市等维度计算出各类感知指标,存储至DW层。在DW层中,按照应用功能层的需求汇总计算出相应的指标存储至DM层,最终在DM层向应用功能层提供数据服务,完成系统前端的展示。

3.1.3 应用成效

目前中国电信已完成基于4G移动互联网业务感知监测分析、5G切片感知监测分析的SDN控制器智能内生能力建设,全国31省市均已在核心网侧部署DPI探针采集业务数据,覆盖全网400多个地市,日均处理数据量超800 TB。该系统监测分析能力覆盖所有4G、5G用户,业务类型涵盖网页浏览、视频播放、即时通信、手机游戏等主流toB、toC应用。系统针对质差问题快速定界定段预定位,实现监控、派单、闭环全流程自动化,完成面向KQI、端到端、闭环的多专业融合网络优化流程重构。系统基于大数据技术开展移动感知数据分析与运营,在无线资源规划与精准投放、客户服务支撑、精细化市场营销等方面发挥了重要支撑作用。

图3 5G切片业务感知质差定界定段流程

图4 5G切片感知监测分析系统数据结构

3.2 自保障:SRv6业务质量智能评估

近几年对业务流进行测量的随流检测被动测量方式成为热点,这种带内随流检测技术已经在设备层面得到实现,但基于随流检测结果的端到端业务故障定位尚未有成熟技术。通过研发基于随流检测的SRv6业务质量智能评估、客户SLA智能评估、SRv6路径拥塞智能评估等关键技术,解决因客户业务流量激增,导致线路拥塞或中断、SLA指标劣化的问题,实现SDN控制器针对SRv6业务的智能保障能力。

SRv6业务质量保障方案架构如图5所示,针对客户设备到客户业务中心之间的线路数据进行采集,包括配置数据和性能数据,数据清洗后存储到数据库中,对配置了随流检测的VPN业务电路进行随流检测业务质量评估,对全网电路分别进行SLA性能指标评估和路径拥塞分析。最后将分析结果输出到SRv6路径调整和优化模块中,对问题路径进行进一步调整和优化。

SRv6业务质量智能评估,是SDN控制器智能内生在智能保障方面的创新实践,在实际应用中,主要包括以下几方面的能力。

(1)基于随流检测的VPN业务质量智能评估

· 端到端业务质量智能评估:根据随流检测上报的性能数据和设备数据利用基于AI技术构建的端到端质量智能评估模型评估端到端业务质量,检测业务状态。

图5 SRv6业务质量保障方案架构

· 分段质量评估:检测到业务质差或故障时,进一步结合逐跳检测数据和设备数据基于分段质量智能评估模型评估分段业务质量,检测业务分段状态。

· 质差问题定界定段:对于质量差或故障的段落,基于智能质差定位模型确定具体质差或故障发生的链路和端口,再确定定位质差或故障发生的区域,以便于确定业务质量优化执行责任区域。

(2)客户SLA越限智能评估

客户SLA性能指标主要包括时延、丢包率、带宽利用率,利用AI技术构建路径性能评估模型计算路径端到端时延、丢包率和带宽利用率,与客户SLA指标值进行对比,结合时间、空间特征差异化判断SLA是否越限,并根据客户业务特征,动态调整触发预警通知时间点,通知路径调整优化模块,以便进行路径调整或优化。

(3)路径拥塞智能评估

基于路径的流量、性能、承载业务类型、时间等众多指标建立了路径拥塞智能检测模型,可以智能挖掘路径不同情况下的指标空间分布特征,针对不同分布的特征数据应用不同模型策略进行拥塞路径检测判定,并进一步结合关键指标评估路径拥塞情况。最终根据客户业务需求及时触发路径拥塞预警,通知路径调整优化模块,以便进行路径调整或优化。

3.3 自优化:SRv6路径智能调整与优化

目前,针对业务质量劣化或故障,SDN控制器研发动态流量预测与智能路径调优能力,对路径流量进行预测,生成相应的路径动态带宽调整策略,增强主动运维能力,实现业务智能敏捷提供。

中国电信提出并实施的SRv6的路径调整与优化流程如图6所示,基于动态流量区间预测,输出路径调整优化策略,针对流量拥塞预测,输出最佳路径评估策略,再进行带宽调整和路径计算,进一步下发到网络设备层,触发方案执行。

IP业务流是双向的,需要分别对上下行流量区间进行预测,基于预测的流量区间进行带宽调整,并应用到网络运维系统。路径调整方案主要包括以下技术创新与实践。

· 特征全面性考虑。传统的流量预测模型通常从时间序列模型出发,只考虑了流量特征以及时间特征。网络流量影响因素包含多种,如带宽、时延、丢包率等,同时包括用户个性化使用的时空等多种特征,基于多种指标多特征进行模型训练进而能有效提升预测结果的准确率。

图6 SRV6的路径调整与优化流程

· 模型融合研究应用。目前多数流量预测模型仍然使用单一模型进行训练和实现,存在效率低、准确率不稳定等短板。模型编排过程中研究了多模型融合的方式,可根据具体场景和需求进行模型融合策略的制定和选取。

· 流量区间预测研究应用。历史同期流量预测的偏差程度可以在一定程度上反映当前预测偏差程度,进而实现流量区间的预测。

· 动态带宽调整策略的研究应用。根据历史用户需求及网络流量特点,对基于流量区间预测的结果制定相应的动态带宽调整策略进行了研究,如针对重点客户保证带宽高于流量区间的上限。执行过程中可以基于系统的反馈信息,对带宽调整策略进行进一步优化调整。

路径优化方案中最佳路径评估策略提供了备选路径的选取规则,对业务原始主路径的业务质量进行跟踪和状态预测,若发生流量拥塞则需要对其中主要业务进行路径更换,若发生中断,则需要对路径中承载的所有业务进行路径更换。主要包括以下技术创新与实践。

· 主路径监测技术。主路径业务质量实时监测功能和预测监测技术从中断、拥塞两个维度对路径状态进行预判,预测为中断状态的路径,将当前承载的所有业务流量叠加到备选路径中,预测为中拥塞状态的路径,将当前承载的主要业务流量叠加到备选路径中,进行下一步备选路径的评估和推荐。

· 备选路径评估技术。预测所需叠加流量值,即原始主路径的流量预测,叠加流量的过程中判断备选路径与原始主路径传输的数据报文协议类型是否相同,类型不同的需要基于备选报文协议类型生成新的所叠加流量值,对叠加流量后的备选路径性能进行预测,评估备选路径质量。

· 备选路径推荐技术。推荐路径需满足用户的SLA要求以及个性化需求,基于备选路径评估后的结果,按最短距离、最短时延等方案进行组合排序。在满足用户SLA要求前提下,根据客户个性化需求推荐最佳备选路径。

4 结束语

随愿自治是SDN控制器智能内生的发展目标,当前在自治领域国际标准、国内标准已逐步建立和丰富自治分级、智能化运营管理系统设计、技术架构、场景用例等方面的标准布局。在电信管理论坛(Telecom Management Forum,TMF),由中国电信联合多家国内外运营商和厂商完成AIOps系列标准;在ITU-T,由中国电信主导提出“基于AI增强的电信运维架构”(AITOM);在欧洲电信标准化协会(European Telecommunications Standards Institute,ETSI),提出《基于意愿感知的网络自治标准》。在中国通信标准化协会(China Communications Standards Association,CCSA),中国电信、中国移动、中国联通、北京邮电大学等联合推进“电信运营管理智能化系统参考架构”、《信息通信网运营管理智能化水平通用分级技术要求》标准项目立项。

随愿自治首先要实现产业共识和有效实践的分级指标和代际演进评估模型,运营商和产业合作伙伴根据网络及其业务的智能化演进需求,从意图解析、运营级自治和网络级自治3个层面,逐步形成自感知、自保障、自优化全流程的闭环自治代际评估模型,指导和推进SDN控制器为核心的新一代云网运营系统的能力建设,识别短板,分阶段演进,汇集产业力量,共同推进云网自治的发展。

未来,随着SDN控制器与人工智能技术结合更加紧密、行业标准逐步成熟,SDN控制器智能内生将得到更快速更广泛的应用部署,满足复杂多样业务需求、提升网络自治水平。

[1] 孙建, 张梅琴, 张顺颐, 等. 一种IP网络下基于业务流QoS监测的故障定位方法: CN102404137A[P]. 2012.

SUN J, ZHANG M Q, ZHANG S Y, et al. A fault location method based on service flow QoS monitoring in IP network: CN102404137A[P]. 2012.

[2] LOPEZ-MARTIN M, CARRO B, SANCHEZ-ESGUEVILLAS A. Neural network architecture based on gradient boosting for IoT traffic prediction[J]. Future Generation Computer Systems, 2019, 100: 656-673.

[3] AIBIN M. Traffic prediction based on machine learning for elastic optical networks[J]. Optical Switching and Networking, 2018, 30: 33-39.

[4] 张迪, 黄琛灿, 肖冬. 一种流量预测方法和装置: CN107171848B[P]. 2020.

ZHANG D, HUANG C C, XIAO D. A flow prediction method and device: CN107171848B[P]. 2020.

[5] 蒋文栋. 一种段路由策略的路径选择方法及装置: CN112532518A[P]. 2021.

JIANG W D. A path selection method and device of segment routing strategy: CN112532518A[P]. 2021.

[6] 陈思光, 窦浩铭, 王堃, 等. 基于负载均衡与QoE度量值的SDN网络路径选择方法: CN110290065B[P]. 2021.

CHEN S G, DOU H M, WANG K, et al. SDN network path selection method based on load balancing and QoE metric values: CN110290065B[P]. 2021.

[7] 河东晴子. 网络路径选择方法以及通信系统: CN101588618[P]. 2009.

HEDONG Q Z. Network path selection method and communication system CN101588618 [P]. 2009.

[8] 李福亮, 范广宇, 王兴伟, 等. 基于意图的网络研究综述[J]. 软件学报, 2020, 31(8): 2574-2587.

LI F L, FAN G Y, WANG X W, et al. State-of-the-art survey of intent-based Networking Chinese full text[J]. Journal of Software, 2020, 31(8): 2574-2587.

[9] 张彤, 任奕璟, 闫实, 等. 人工智能驱动的6G网络:智慧内生[J]. 电信科学, 2020, 36(9): 14-22.

ZHANG T, REN Y J, YAN S, et al. Artificial intelligence driven 6G networks: endogenous intelligence Chinese Full Text[J]. Telecommunications Science, 2020, 36(9): 14-22.

[10] 索士强, 王映民. 未来6G网络内生智能的探讨与分析[J]. 移动通信, 2020, 44(6): 126-130.

SUO S Q, WANG Y M. Discussion and analysis on the native intelligence for the future 6G Network Chinese full text[J]. Mobile Communications, 2020, 44(6): 126-130.

Research and implementation of intelligent endogenous technology for SDN cooperative controller

ZHANG Le1, WU Yanqin1, ZHANG Ke1, MAO Dongfeng2, JIANG Song2, HU Huawei3

1. Research Institute of China Telecom Co., Ltd., Beijing 102209, China 2. China Telecom Co., Ltd., Beijing 100045, China 3. Fujian Branch of China Telecom Co., Ltd., Fuzhou 350001, China

In the face of new demands and challenges such as business diversification, data quantification and cloud network integration, the ideas and methods of cloud network operation are changing. As the core capability of the new generation of cloud network operation system, SDN controller was deeply integrated with artificial intelligence technology. The key technologies and application practices of full-process closed-loop autonomy capability including intention analysis, cloud network intelligence perception, guarantee, optimization and automatic execution were studied to form intelligent endogenous capability of SDN controller. Firstly, the SDN controller intelligent endogenous development background and significance were clarified. And then, the ability of intelligent endogenous architecture and distribution of core competence were illustrated, which gradually form the whole process of the closed loop cloud network autonomy. Finally, focusing on 5G slice, SRv6 scene of new technology new business use cases, the intelligent perception, independent guarantee, automatic optimization of the key aspects of technology, and the effect of implementation and application were resolved. Through capability architecture design, key capability research and development, implementation verification and layout in standardization, the internal intelligence of SDN controller would gradually mature and enable smart operation of cloud network.

intelligent, autonomy, SDN controller

TP393

A

10.11959/j.issn.1000−0801.2021275

2021−10−20;

2021−12−10

张乐(1981− ),女,中国电信股份有限公司研究院高级工程师,主要研究方向为云网融合、网络自治、智能化运营管理等。

吴艳芹(1978− ),女,中国电信股份有限公司研究院高级工程师,主要研究方向为信息通信网运营管理、客户体验质量管理、大数据及人工智能在信息通信网运营管理中的应用等。

张珂(1980− ),男,中国电信股份有限公司研究院高级工程师,主要研究方向为网络智能运维、客户体验管理、5G切片管理、SDN编排控制等。

毛东峰(1973− ),男,博士,中国电信集团有限公司云网运营部(大数据和AI中心)副总经理,主要研究方向为网络运行维护管理及云网融合。

姜松(1978− ),男,中国电信集团有限公司高级工程师、云网运营部(大数据和AI中心)应用运行处副处长,主要研究方向为网络运行维护管理及云网融合。

胡华伟(1979− ),男,中国电信股份有限公司福建分公司高级工程师,主要研究方向为电信网络智能运营及云网协同智能调度、机器学习在网络告警判断应用等。

猜你喜欢

云网内生切片
下期要目
新型云网融合编排与调度系统架构与分析
植物内生菌在植物病害中的生物防治
航天云网科技发展有限责任公司
内生微生物和其在作物管理中的潜在应用
“党建+”激活乡村发展内生动力
授人以渔 激活脱贫内生动力
基于SDN与NFV的网络切片架构
肾穿刺组织冷冻切片技术的改进方法
冰冻切片、快速石蜡切片在中枢神经系统肿瘤诊断中的应用价值比较