机器学习算法在业务卡顿根因分析中的应用
2019-02-14鲁志强
徐 青,宋 琪,鲁志强
(中国联通四川省分公司,成都 201806)
1 引言
业务卡顿率是重要的端到端评判指标之一。在无线侧,如何将抽象的卡顿率映射到常用无线KPI是难点。通过深入分析发现基站下行时延指标与卡顿率相关性最强,时延越大卡顿率越高。本文重点阐述以基站下行时延为优化目标,使用决策树算法,找出影响该时延的基础指标并量化其重要度,判定合理门限,指导一线网络优化并取得了良好效果。
2 决策树算法与模型评估
决策树是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。主函数本质上是个递归函数,该函数主要功能是根据某种规则生长出决策树的各个分支节点,并根据终止条件结束算法。数据输入为分类的数据集和类别标签。划分过程:①依据信息增益进行特征选取和分裂,得到最优的划分特征,并创建特征的划分节点。②按照该特征的每个取值划分数据集为若干部分。③根据划分子函数的计算结果构建出新的节点,作为树生长出的新分支。④检验是否符合递归终止条件。⑤将划分的新节点包含的数据集和类别标签作为输入,递归执行上述步骤。
模型评价指标:精度Accuracy、查准率Precision、召回率Recall、F 值。
3 针对单小区的分析
3.1 特征选取
根据优化经验,选取部分基础KPI作为特征输入,如下行平均PRB利用率、上行平均PRB利用率、CQI等。
3.2 模型参数调整
自变量:多项KPI指标(特征输入)。
因变量:基站下行时延,判定门限100ms。
数据量:739条(记录来自单小区)。
通过多轮参数仿真,发现参数Criterion=’entropy’,max_depth=4,class_weight=none,仿真效果最佳。
3.3 输出
结果显示下行PRB利用率重要性68%,CQI+offset重要性15.75%,这样就直接为优化指出了方向:首先要采取措施降低下行负荷,其次优化下行无线质量。
图1 决策树图
3.4 无线优化后结果
根据分析结果,对该小区实施了针对性的优化(调整业务均衡参数,将业务分担到第2载波,降低PRB利用率;调整第一小区的方向角避免和第二小区相互干扰,增加小区最大发射功率的同时降低参考信号功率),效果良好,基站下行时延由60ms下降到30ms,卡顿率明显降低。
3.5 批量小区分析和优化
使用相同的方法,进一步选取了卡顿率较高的10个小区进行分析和优化,总体取得了良好的效果。
表1 选取卡顿率较高的10个小区进行分析和优化
4 针对全网的分析
自变量:KPI指标(4项),样本判定门限100ms。
因变量:基站下行时延。
数据量:100万条(记录来自全网所有小区)。
不论模型参数如何调整,训练集和测试集的R值和F值都很低,说明整网没有普适的模型,也说明每个小区都有不一样的参数、覆盖环境、用户分布等,需要各自建立模型。
5 结束语
基站下行时延指标可以作为日常优化中卡顿率的替代指标(仅限无线原因导致的卡顿),用决策树算法可以量化分析影响基站下行时延指标的原因,输出重要度用于指导无线优化;可以筛选出准确度较高的辨别规则门限值。整网不能作为一个统一对象进行分析,没有普适模型,需要对每个小区进行精准分析。