基于智能运营平台的核心网数字化运营实践与思考
2022-02-20高功应马田丰尼松涛中国联合网络通信集团有限公司北京00033中讯邮电咨询设计院有限公司郑州分公司河南郑州450007
高功应,马田丰,李 蓉,尼松涛(.中国联合网络通信集团有限公司,北京 00033;.中讯邮电咨询设计院有限公司郑州分公司,河南郑州,450007)
0 前言
随着5G 系统协同发展以及虚拟化、切片、MEC 等新技术引入,核心网网络运维和优化难度明显增加,特别是5GC 核心网具有分层解耦、设备节点众多等特点,性能、告警、感知等各类问题总量增加且定位困难。核心网专业一方面得益于属于上层网络,网元及网管集中化程度较高,网络质量指标问题点较少,便于数据采集工作的开展;另一方面,核心网业务流程和网元类别复杂,关键KPI 指标繁多,不利于场景聚焦,而且根因分析涉及多专业协调,不利于智能运维快速反应要求。
传统人工方式难以满足网络保障SLA 要求,需要引入一系列自动化平台和智能化手段,以实现水平跨域、垂直跨层的端到端智能分析,提供智能化故障预防预测功能,提高运维效率,最终实现可视、可控、可评测的数字化运营目标。
1 核心网数字化运营背景及目标
1.1 核心网运营平台现状
中国联通全国核心网网管支撑系统总体架构分为“集团+大区”2 级架构,如图1 所示,供集团、大区和省级3 级使用。集团级网管由OSS 2.0 和一级NFVO构成,2类系统之间形成主备关系。
图1 核心网网管支撑系统架构图
集团一级NFVO 为核心网一级网管平台,为集团5GC 及其他核心网子域提供管理维护手段,实现全网核心网一点可视和支撑数字化运营;为大区提供一点接入全网能力,实现跨大区的指标分析及问题定位能力。目前集团一级NFVO 平台在实现5GC 统一纳管、资源可视的基础上,已开展vIMS 大区化、集中IMS、固网IMS、骨干核心网、切片/专网/MEC 等统一纳管,如图2所示。
图2 核心网一级NFVO功能架构图
大区级网管层面由厂家OMC/NFVO+、反拉终端(OSS 2.0)和大区综合监控系统形成主备,大区核心网综合网管系统满足大区/省分公司日常实际生产维护工作以及面向切片/专网/MEC自动化运营支撑需求。
1.2 核心网运营痛点
全新的网络形态和网络规模给5G 网络运维工作带来了极大的挑战。随着管理对象日益增多,网络可能产生的故障大幅增加,人工监控手段已无法满足运维需求。核心网专业主要有以下几方面问题。
a)客服投诉痛点:网络信息向前台推送能力弱,缺乏用户签约状态数据前台查询能力;用户感知投诉问题定位困难,解决周期长等。
b)网络维护痛点:对云化网络设备跨域跨层关联、数据关联能力,故障提前预警能力,网络质差指标根因定位分析能力等需求迫切。
c)规划建设痛点:网络容量负荷自动预警能力不足。
d)行业客户痛点:5G 专网、切片和MEC 业务开通相对独立,不具备快速开通和同开同停能力,不能满足客户自服务和业务指标可视化等需求。
1.3 核心网数字化运营目标
核心网数字化转型的一个重要目标是依托数字化平台工具能力提升,打造自动化和智能化的融合核心网,面向规、建、维、营全流程,提升网络自动化、智能化能力,提升网络效率。在网络规划方面,实现数据实时分析、规划自动化;在建设方面,实现网络自动编排、快速扩缩容、自动化配置、自动测试等;在维护方面,实现故障自动定位与自愈、智能监控、故障预防预测等;在优化方面,实现业务质量实时监测和网络自动调优。
2 核心网智能运营平台构建及应用
2.1 总体思路
平台工具是实现数字化运营的核心竞争力,核心网数字化运营支撑平台需满足可视、可控、可评、智能决策的功能目标,实现云网业协同和CT/IT 融合目标,打造支撑生产作业、通信保障、安全生产和5GC 大区化运营的集约化云网运营体系,实现集约化项目全生命周期管理的规建维营一体,实现TCO 效能最优,如图3所示。
图3 数字化运营总体思路
核心网智能运营平台将以信息化的手段提升规、建、维、优全流程数据分析及应用,通过AI 赋能、数据赋能,实现智能化全过程运营。
2.2 智能化平台构建
结合数字化运营需求以及目前平台现状,核心网智能化运营平台可采用分层架构打造,如图4所示。
数据获取层为上层应用统一提供数据采集能力,统一不同主设备厂家指标规范及KPI/KQI 筛选规则;核心能力层提供AI 感知分析能力、编排配置能力、自动规建优化能力以及统一能力开发接口;智能应用层面向智能规建、智能运维、智能运营的不同场景,提供落地的应用实现。
2.2.1 一级NFVO系统
运营商通过打造全国集中的一级NFVO 系统(见图5),提升智能化能力;通过采集云核心网5GC 2C/2B/vIMS/EPC/CS 等多域网元的硬件/虚层/业务三层的CM/PM/告警数据统一纳管和关联,实现多种智能化网管增强能力和数字化运营目标,包括迭代优化网络周报/月报专题数据统计整理、工程建设数据/项目采购信息/经营分析用户及终端数据常态化统一汇总分析及呈现、5G 2B 及物联网用户信息查询、网元局数据核查/网络自动巡检/网络容量预警及KPI 质差根因定位等。
图5 集团一级NFVO网络架构图
2.2.2 自动拨测系统
全网部署自动拨测系统,提升测试效率,降低人力和终端成本消耗,自动化拨测比例达到70%以上。
利用仿真拨测平台实现测试即服务的TaaS 能力,仿真UE+NR 对接全网AMF/UPF,如图6 所示,针对初始注册(SUCI)成功率、Service Request成功率、Xn切换成功率、5G/4G 切换成功率等12 项信令面指标,Web/视频/FTP 上传下载/EPSFB 语音等5 项用户面业务进行仿真测试,实现周期性业务拨测监控、设备升级扩容拨测、开网全国漫游测试等场景不同程度的自动化。
图6 自动化拨测系统业务架构图
2.2.3 优化及预警系统
运营商按大区部署核心网优化和故障预警增强功能,提升满足投诉处理、用户保障、故障预警、故障关联分析、5G核心网指标分析等需求的能力。
在核心网优化增强方面,通过采集CHR 数据,支持用户业务流程还原、问题根因分析,实现用户级问题的快速处理,辅助运维人员快速闭环用户投诉问题,保障VIP 用户体验;基于关键指标、业务失败次数统计,结合CHR 数据关联分析,实现问题根因分析和故障对象分析,辅助运维人员及时发现网络问题,评估和分析业务质量,优化网络指标。
在故障预警增强方面,引入故障主动探测功能,对5GC 网元关键业务流程进行实时仿真探测,根据网元业务流程,识别前后端网元故障引起的网络故障和容灾风险;结合实时关键KPI 指标、网元状态、网络仿真探测结果实现网元故障定界,按等级实现故障预警,辅助维护人员容灾倒换决策;容灾倒换过程中,实时监控用户数变化和关键业务指标,辅助判断倒换发生后业务恢复情况,实现容灾恢复过程的可视可管。
2.2.4 VoLTE端到端优化系统
运营商按大区部署VoLTE 端到端分析系统,实现语音业务跨域端到端关联分析,支撑解决网络语音问题,提升网络服务质量。
基于5GC/IMS 大区化架构,部署VoLTE 端到端系统,通过无线、核心网、IMS多域数据的关联,进行端到端全流程评估VoLTE/EPS Fallback 业务,实现问题发现、问题原因定界、问题优化解决的闭环处理,如图7所示,支撑业务质量评估、专项优化、客服投诉、运营支撑等应用。
图7 网络优化及故障处理流程图
2.3 典型应用场景分析
以核心网质差根因分析场景为例,平台工具自动采集性能、xDR、CHR等数据,通过大数据关联分析,并结合数据模型AI学习,实时发现劣化指标以及预测指标发展趋势,综合端到端信令分析和呼叫日志分析等分析能力,深入分析指标异常原因进行根因分析和定界定位,固化设备、终端、业务等多因素专家经验算法库,将问题和解决方案直接派单到一线维护人员,实现工单闭环管控。总体流程如图8所示。其中的关键指标来源如表1所示。
表1 关键指标来源表
图8 质差分析流程
系统从5GC、IMS 专业网管或NFVO 获取相关KPI的性能统计数据。关键要求如下。
a)统计数据时间粒度:专业网管性能数据统计粒度为5 min。
b)数据及时性:延迟时间不得超过5 min,例如20:00—20:05生成数据,系统提取时间不超过20:10。
c)原始数据齐全:尝试、成功次数,各类原因失败次数等原始统计项均需上报,以便对各统计项进行波动分析,更有针对性发现问题。
d)测量对象最小原则:网管上有关KPI 指标的测量对象齐全,并且细分统计到支持的最小粒度(例如TAC),以便进行精准定位。
假设预警时间为M0,当前KPI 指标数据为P0,运营商网络质量KPI考核标准为J1。通过测算网络质量历史运行情况中的环比指标P1 和同比指标测算P2,以及指标预警阈值算法MAX(J1,P1,P2),确定阈值。其中P1算法和P2算法如下。
P1=average(Pn),Pn=上一监控时级周期时点内每小时P数据(监控时级周期可调整)。若监控周期时点为一天24 h,M0 为18:00,则Pn为前日18:00 至当日18:00的P数据;若监控周期时点为一天12 h(08:00—20:00),M0 为18:00,则Pn为前日18:00 至前日20:00,以及当日08:00至当日18:00的P数据。
P2=average(Pn),Pn=上一监控日级周期内每天M0 时的P数据(监控日级周期可调整)。若监控日级周期为一周,M0 为18:00,则Pn为当日所在之前一周内18:00的P数据。
指标经验库如表2所示。
表2 指标经验库表
通过实时跟踪5GC 和IMS 域的关键性能KPI,发现质差指标,通过匹配专家经验和省分案例库的丰富信息,定位根因,整合解决方案,高效指导网络优化工作的开展,提升用户感知体验。
3 核心网数字化运营工作展望
核心网专业应继续依托智能化运营平台及工具手段,提升网络自动化、智能化能力,将网络智能化水平从现有的L1/2提升至L3/4,并逐步实现完全自治。
a)从网络规划方面,基于现有一级NFVO 增加云核心网数字化运营场景分析功能。
b)在建设方面,基于现有自动拨测系统继续迭代丰富拨测场景,完善平台自动化拨测能力。
c)在维护方面,基于现有一级NFVO 增加MEC、5G 专网、5G 切片、固网IMS 等性能及资源纳管范围以及集中监控分析、用户数据查询、数据配置核查等重点功能,基于现有故障预警系统继续增强和完善故障预警功能。
d)在网络优化方面,继续增强核心网优化系统功能,并基于VoLTE 端到端分析系统进行漫游等专项功能的增强迭代及VoNR 功能的演进,为5G 语音业务提供端到端关联分析手段,引领现网5G 语音的智能优化,助推中国联通5G数字化运维转型。
依托自动化平台手段,通过聚焦分析场景,核心网数字化运营工作应同时提升对市场、用户、一线的支撑能力。
a)面向市场,主动匹配业务发展需求,提前部署网络容量。
b)面向用户,紧密跟踪语音+数据体验感知,不断优化网络质量。
c)面向一线,简化运营流程,提高运营效率,逐步完善业务自动化开通/调整和自服务能力灵活性。
同时,针对目前“业务赶着建设跑、数据全靠手填表、出现故障四处找”现状,提供“敏捷交付、智能分析、故障预警、快速定位”的运营服务,为市场、用户、一线人员提供全方位的运营支撑能力,推动形成统一标准化的数字化运营场景、流程规范制度,并制定运营指标,以工单闭环驱动,深化运营效果。
4 结束语
核心网数字化转型是一个系统的、长期的、不断积累的、不断打破认知壁垒的、CT 和IT 深入融合的过程。本文主要介绍了通过智能化工具平台提升数字化运营能力的主要实践,智能化工具平台是数字化转型的重要方面,但还需要结合完善的运营体系、规范的运营制度等,方能较好地实现数字化转型。