APP下载

基于大数据+AI的5G网络运营与保障

2022-02-20李张铮洪林梦涵张雪平中国联通福州分公司福建福州350001

邮电设计技术 2022年1期
关键词:建模特征算法

陈 锋,连 慧,李张铮,洪林梦涵,张雪平(中国联通福州分公司,福建福州 350001)

1 概述

中国经济正处于新基建时代,移动通信日益改变大众工作生活方式,当前层出不穷的虚拟现实、增强现实、超高清视频等超大带宽移动互联网应用对移动宽带网速提出越来越高的要求[1],5G 网络应运而生。在目前5G 网络大规模部署背景下,要拉动5G 业务收入增长,运营商面临着两大首要问题:哪部分存量3G/4G 用户是潜在5G 用户和这些潜在5G 用户的常驻区域的网络质量。发展最可能成为5G 用户的传统用户和保障最容易出问题的覆盖地点,是5G网络端网协同优化的重中之重。传统营销方式精准度低,无法快速实现5G 用户规模化;5G 用户位置信息准确度不高,无法针对性进行5G 网络部署,目前用户终端上报的MR信息中,支持A-GPS 功能终端占比低,大多数MRO 数据的用户位置信息缺失;传统网络感知分析手段有限,无法实现用户级评估;5G 站点规划工作量大、人员水平有限的问题导致站址规划效果不佳。如何在提升5G 用户营销成功率的同时保障5G 用户级网络感知,提升5G站点规划效能,是运营商亟待解决的问题。

2 基于大数据+AI的5G网络运营与保障背景

基于传统方式的5G 网络运营无法对哪些用户是5G 用户、这些用户使用的网络位置在哪、该位置的用户网络感知如何等进行系统性分析,导致5G网络运营耗时耗力。主要表现在如下4个方面。

a)移动网络传统用户营销方法存在诸多短板,比如营销策略模糊、目标用户存在盲目性、营销成效与人员水平相关等,严重影响5G 用户营销效率,同时也造成5G 网络用户保障的盲点。因此需要建立用户特征模型,实现潜在5G用户精准挖掘。

b)用户级网络感知保障面临复杂多变的无线环境,不同的地点存在不同的网络质量,要对用户进行精细化保障就必须知道MR 发生的真实位置,这样才能保证用户的网络质量问题可在地理空间上进行回溯,但是目前支持A-GPS 功能终端占比低,大多数MRO 数据的用户位置信息缺失。需要建立AI 位置预测模型,预测无经纬度的5G用户位置信息。

c)传统站点规划主要通过路测或者用户投诉发现无线网络覆盖问题,目前主流分析方法为人工分析、排查收集到的质差数据,判断弱覆盖类型、弱覆盖原因并预估解决方案,分析人员的主观判断在这个过程中起主要作用,容易出现误判且消耗大量人力;另外采用仿真手段,通过设定基站类型和网络参数输入选址仿真软件,输出基站建设位置,此方案成本较高且与实际网络环境存在偏差。需要在5G 用户弱覆盖位置信息进行聚类,有效指导5G规划。

d)传统网络感知保障仅限于小区级的KPI/KQI指标,无法对用户级无线环境质量进行保障,这就导致无线网络多数覆盖面上指标好,少数点上无线质量差的表里不一现象,无法发现实际存在的问题点,即精细化用户级感知保障缺失,给运营商网络口碑造成巨大压力。需要实现MR 数据与SEQ 数据的关联,同时依靠地理可视化工具,直观呈现用户级网络感知,提升网络优化效率。

3 基于大数据+AI的5G网络运营与保障方案

3.1 项目核心功能模块及创新点

本项目围绕Who、Where 和How,即5G 用户是谁、5G用户在哪、5G用户网络感知如何这3个核心问题来开展研究,包含5G 用户画像、5G 用户位置预测、5G 智能规划和5G网络感知保障四大核心模块。

a)5G 用户画像:要识别5G 用户是谁主要解决如何找到5G 用户的问题,传统运营商在制定5G 用户营销策略时往往是一刀切,没有考虑用户个体差异性,5G用户发展效率低效果差,本项目针对这一短板利用机器学习分类算法,建立用户特征模型,实现潜在5G用户精准挖掘,提升营销效率节省成本。

b)MR 用户位置预测:要知道5G 用户在哪主要是获取用户位置信息,目前5G 用户主要是NSA 用户,用户同时附着于4G 和5G 网络上,可以利用4G MR 获取用户位置信息,但仅有A-GPS 终端能实现位置信息获取。目前A-GPS 终端占比低,导致用户位置信息获取不完整。针对这个问题项目采用MRO 多维数据进行AI建模,预测无经纬度的5G用户位置。

c)5G 网络感知保障:在知道用户是谁用户在哪后,就需要了解这些5G 用户的网络体验如何,传统的优化手段通过SEQ 与MR 平台进行分析,但2 个平台缺乏关联性,比如对于单用户速率慢问题,根据SEQ无法了解到当时用户位置的无线环境情况,根因定位困难,针对该问题,本项目组开发工具自动关联SEQ与MR用户数据,实现5G用户级感知监控。

d)5G 智能规划:基于5G 用户的位置信息和感知就可以在5G建网初期进行更精准的站址规划与部署,但传统规划方法更多采用人工审核,找出规划站点过程中面临工作量大、人员水平参差不齐的问题,导致站址规划效果不佳,项目利用机器学习算法对5G用户覆盖差的位置进行智能聚类,输出5G网络覆盖亟待加强的区域,指导5G规划。

本项目主要创新点如下。

a)5G 用户画像:使用出账数据、上网行为、感知指标等维度数据对多种机器学习算法进行评估,选择最优的GBDT 算法进行潜在5G 用户建模,输出潜在5G用户清单。

b)5G 用户位置预测:结合MR 数据的电平、质量、网络工参的小区经纬度、方位角、覆盖类型等多维度数据对多种机器学习算法进行模型选择,最后通过随机森林算法学习带经纬度标签的用户级MR 特征数据,同时针对全网统一建模存在的定位误差不均衡问题,建立差异化潜在5G 用户位置预测模型,输出潜在5G用户经纬度数据。

c)5G 智能规划:分不同场景基于DBSCAN 聚类分析对潜在5G 用户位置进行聚类发现无线环境差的地点,指导5G智能规划。

d)5G 网络感知保障:融合时空维度无线网络质量数据和用户经纬度信息,可视化呈现监控5G用户网络感知,提升5G网络口碑。

图1给出了基于大数据+AI的5G网络运营与保障项目框架。

图1 基于大数据+AI的5G网络运营与保障项目框架

3.2 项目具体实现算法与应用

对每个上述核心功能模块,本项目严格按照机器学习建模的标准流程,从数据源获取、数据集拆分、数据预处理、特征工程、模型选择和超参数调优等步骤进行模型开发[2],最终实现基于大数据+AI 的5G 网络运营与保障。

3.2.1 基于AI算法的5G用户智能预测

本项目通过梯度提升GBDT 机器学习算法学习5G 用户正负样本历史上的B 域出账数据和O 域网络数据,建立5G 用户分类预测模型,预测出传统移动网络用户是否是潜在5G用户。该模型可在5G用户营销支撑、5G网络感知保障等网优日常工作中起到积极作用。

a)数据准备。收集5G 用户和非5G 用户在历史3G/4G 网络上的字段数据作为样本,这些原始字段包含B 域的用户基础信息和用户消费信息、O 域的用户上网行为和用户网络感知KQI指标(见表1)。

表1 5G用户正负样本原始字段

b)数据预处理。主要是对原始数据的缺失值或异常字符进行校正替换,高维度类别特征进行降维处理,类别特征不平衡字段进行重新归并。

c)特征工程。对样本数据分别采用特征构造、特征抽取和特征选择进行处理,举例如下:

(a)特征构造。通过设置标杆时间将原始字段的“入网时间”转换成在网月数。

(b)特征抽取。使用PCA 算法对KQI 数据进行降维,使用降维后的PCA 分量与标签做相关性分析,保留最相关的分量作为最终特征进行模型训练。

(c)特征选择。采用相关系数法进行特征筛选,为了避免部分特征间的相关性过高,导致多重共线性,影响模型效果,删除相关性高的特征。

d)模型选择与优化。使用多种机器学习模型进行交叉验证打分,选择分数最高的GBDT 模型进行建模训练(见图2)。

图2 基于交叉验证的分类模型选择

选定模型后利用随机搜索算法来调整GBDT 算法的超参数,最终搜索得到最佳超参数组合。在测试集上进行评估,分类正确率acurracy 为0.858,召回率为0.732。对比二分类随机判别50%的正确性,本模型有较好的预测性能。

3.2.2 基于MR的AI智能用户位置定位算法

受限于终端不具备A-GPS 功能,目前MRO 携带位置信息的MR 数据占比较低,如何利用AI 手段学习已有的带位置信息的MR 数据来预测不带位置信息的MR 样本成为网络优化智能化的重要方向。本项目使用自主采集解析的MRO 多维用户MR 数据,尝试多种AI 算法对MR 样本进行训练,最终确定使用随机森林算法分地域差异化建模,取得了较好的预测效果[3]。

a)数据准备:利用前面自主开发的MRO 采集解析工具对当日1 h的福州联通全网MRO 数据进行采集解析,得到11个维度的MR数据,结合小区工参中经纬度、区县、方位角和覆盖类型,共生成16个维度的训练集数据(见表2),同样采集次日同时段的全网MRO 数据作为测试集数据。

表2 16个维度的MR训练数据

b)数据预处理。基数(cardinality)指的是类别特征所有可能的不同值的数量,在高基数的类别特征面前,直接使用Label Encoding 和One-Hot Encoding 的数据预处理的方法往往得不到令人满意的结果。本项目的MR.LteScCgi、MR.LteScPci 和MR.LteNcPci 3 个类别特征可以发现存在高基数问题,因此对所述的高基数特征采用特征Hash 编码的方式映射到低维空间,使用API为:sklearn.feature_extraction.FeatureHasher。

c)模型选择:分别使用基于多目标回归的线性回归、XGBoost、GBDT、Ridge 和随机森林算法进行5 折交叉验证模型选择(见图3),发现随机森林算法得分最高(见图4),因此使用随机森林算法进行建模。

图3 交叉验证模型选择代码

图4 交叉验证模型选择得分

d)测试集测试结果分析:预测结果分区县来看,存在非常明显的地域差异,其中福州城区台江、鼓楼、仓山和晋安好于全网平均水平,台江最好,误差仅140 m;偏远区县闽清和永泰误差最大,误差达到1 km以上(见图5)。不同区域的基站和人群的分布不一,全网建立一个通用的且符合预期精度的模型不具备实践性和可操作性。

图5 基于全网统一模型的平均预测距离误差

e)算法优化:鉴于上述缺陷,调优的主要思路是选取一个大小合适的区域进行建模和训练,将算法选型和模型参数优化好之后,再在其他区域进行推广建模,建立差异化的位置定位算法模型。本项目对福州联通13 个区(县)MR 分别进行差异化建模,取次日五城区同时段MR 数据作为测试集进行测试,福州五城区的差异化建模测试效果如表3 所示,与统一建模相比,预测精度有较大提升。

3.2.3 基于DBSCAN算法的5G智能规划

对于庞大复杂的5G无线网络,网络覆盖问题层出不穷,现有无线覆盖分析的局限性日趋明显,如何尽可能减少人工路测成本和分析成本、提高分析判断准确性成为重中之重[4]。本项目提出的基于DBSCAN 算法的5G 智能规划在用户MR 位置可以预测的基础上,利用密度聚类算法定位问题,高效挖掘MR 弱覆盖区域。对福州联通某区域用户MR 采样点进行筛选,定义服务小区RSRP 小于-110 dBm 的采样点为弱覆盖点,共筛选出弱覆盖采样点3 500个[5]。

对这些弱覆盖点开展第一轮粗粒度的参数搜索,先设定DBSCAN 参数最少样本个数以10为步长,从10变化到100,半径始终200 m,经过DBSCAN 聚类得到的10 种弱覆盖簇(见图6)。从计算结果可以发现,最少样本个数为30 时,轮廓系数值最高0.368 5。第2 轮开展细粒度的参数搜索,设置最小样本个数以30为中心,步长为1,从25 变化到34,半径始终200 m,使用聚类算法分析当最少样本个数为25 时轮廓系数最高为0.388 7。此时聚类数量为26 个,即该区域发现26 个弱覆盖场景,需要规划建设。

图6 福州联通某区域弱覆盖DBSCAN聚类结果

3.2.4 基于用户级MR的5G网络感知保障

传统网优平台仅有天级小区MR 指标,无法针对用户投诉信息进行回溯。本项目将用户SEQ 数据与MR 信息进行关联,利用基站ID、用户S1AP ID 和问题发生时间回溯用户当时特定地点的无线网络环境,分析解决用户网络感知问题[6]。此外,在用户级感知保障的基础上扩展实现区域级保障,将用户级MR 汇总到相应区域,渲染出全区的MR 感知分布图,应用于区域级网络优化。

3.3 项目应用情况

本项目的落地实施为某市联通5G 市场营销和网络运营带来了巨大效益。在5G用户画像应用方面,某市联通2020年9月实际新增5G终端用户11 311户,其中存量用户5 276户,5 276户中预测出的用户有2 981户,命中率56.5%。2020 年11 月份的5G 用户预测已向市场部门完成第2 次用户推送,累计推送用户4.9万。在5G 智能优化方面,基于精细化MR 的5G 用户感知获取模块落地后,用户级保障共分析4G/5G 用户321 人,其中发现问题63 个,解决42 个,闭环率67%;区域级保障共发现172 个问题,解决117 个,闭环率68%。问题平均解决时间由原来3 天/人降低到当前0.5 天/人,极大提升了问题解决效率。通过基于DBSCAN 聚类分析网络质量模块,发现4G/5G 现网MR 弱覆盖地点97 处,对于这些问题借助5G 站点开通过程中的5G 网络优化来解决,同时解决4G 底层网覆盖问题;第1期已解决42个问题点,第2期计划完成剩余45个问题点。

4 总结

推进全面数字化转型是贯彻国家新基建发展战略的具体行动,站在数字化转型的新关口,福州联通充分利用运营商大数据优势,结合现有的AI 应用能力,针对5G 用户是谁、5G 用户在哪、5G 用户网络感知如何这3个核心问题来开展基于大数据+AI的5G网络运营与保障研究,取得了一系列创新成果,对加快福州地区5G 新基建发展、加快5G 应用、引领科技创新、助推产业升级意义重大。

猜你喜欢

建模特征算法
离散型随机变量的分布列与数字特征
哪种算法简便
基于FLUENT的下击暴流三维风场建模
《符号建模论》评介
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
求距求值方程建模
Travellng thg World Full—time for Rree
抓特征解方程组
不忠诚的四个特征
进位加法的两种算法