基于机器学习lightgbm算法的运营商基站退服预测研究
2020-09-06龙克树杨鑫杨靖
龙克树 杨鑫 杨靖
摘要:文章研究目的是将机器学习的前沿技术应用于通信行业的基站退服预测模型当中,大幅提高预测精度,降低人工维护成本。本文首先介绍了运营商基站当前的维护现状及预测退服的必要性,然后对lightgbm算法进行了介绍,最后以告警类型、数量、时间等作为模型基础进行退服预测,具有较高的实用价值。
关键词:机器学习;基站;退服预测
随着人民生活水平不断提高,通信行业的高速发展,各运营商为提升服务质量不断加快自身基站建设,服务体验确实得到了优化,但带来的设备故障维护成本也随着增加,特别是与基站退服方面相关的监控设备型号众多、告警类别繁杂、告警次数频繁,维护人员无法在海量的告警数据中获取有效价值信息。
(一)运营商基站退服告警现状
目前各大运营商均拥有基站跨域设备监控系统,系统每日产生海量告警数据,基站设备告警和故障维护以简单的“阈值线”判断为依据,以工单派发、人为核实作为主要形式,因各类告警频繁、无序、关系复杂等原因,维护人员无法在故障真正来临前进行维护、勘察。
(二)运营商基站退服预测重要性
基站告警数据的分析、管理、应用是维护工作質量提升的参考依据,如能充分挖掘海量历史告警数据的关联关系,通过机器学习模型构建、特征分析、模型训练等流程判断出即将发生如“小区不可用告警”或“网元链接中断”等核心故障现象。
基站退服预测问题实际可转化基于时序数据的二分类问题,机器学习中有众多分类、关联分析算法,如决策树C4.5、Apriori、FP-growth、Lightgbm等。
本研究采用的是LightGBM算法,它是一种基于Histogram(直方图)的决策树算法,是对GBDT(GradientBoostingDecisionTree,梯度提升决策树)的高效实现,采用损失函数的负梯度作为当前决策树的残差近似值,用于拟合新决策树,算法通过采用基于梯度的单边采样、互斥特征捆绑等方式大幅提高了算法精度,加快了训练速度,同时还降低了训练时所需存储,是目前机器学习领域最为主流的算法之一。
(一)基站数据预处理
为提高模型训练精准度及训练速度,需要对原始基站告警数据进行数据观察和预处理,具体过程包括数据最大值、最小值、中位数、均值等进行查看,数据去重、填充、排序等特殊处理,原始数据仅包括告警开始时间、基站名称、类型三个字段。
(二)模型特征工程
在模型训练开始之前,需先进行特征工程构建,研究通过告警时间、基站告警类型、基站告警数量、告警关系等维度构建模型特征。
告警时间维度包括:告警发生的年、月、日、时、分、秒、上午、中午、下午、晚上、是否周末、月上旬、月中旬、月下旬等;
基站告警类型包括:RRU类、传输类、电源类、基站设备类、时钟源类、数据配置类、天馈类等;
基站告警数量包括:距离目标日前1-N天的告警次数、故障次数、告警天数、故障天数、单日平均告警次数、异常类告警数、射频类告警数、BBU告警数、RHUB告警数等。
(三)预测模型构建
本研究使用的当前机器学习当中的LightGBM算法对样本数据的基站退服情况进行预测分析,模型构建过程包括数据核查、预处理,创建特征,训练集、验证集、测试集构建,模型训练,网格搜索参数调优等,图4.1是模型构建流程图,如下:
(四)模型评估及参数调优
LightGBM可通过指定部分超参数来优化预测效果及训练速度,具体包括控制参数、核心参数、度量参数等。
当模型参数取值如表4.1所示时,经过5次交叉验证,模型训练集的对数损失率是18.45%,auc达到85.65%;校验集的对数损失率是18.45%,校验集auc达到85.78%,模型准确率达到92.38%,模型精确度取到最大值0.8231,即此模型可在一定条件下有效预测基站退服。
上述研究表明模型通过基站告警发生的时间、类型、数量、告警间关联关系等维度数据预测未来某一时段基站发生退服的概率值,让广大员工从海量、无效的告警中得到最有价值的信息,提高了维护效率,实现用户的无故障感知使用,切实提升品牌服务质量,降低潜在用户投诉风险。
参考文献:
[1]石少民.数据挖掘在移动基站退服故障预测中的研究[D].新疆大学,2019.
[2]杜丽英.基于决策树的C4.5算法[J].轻工科技,2013,29(10):59+117.
[3]阮超凡.移动基站告警数据处理分析系统的设计与实现[D].大连理工大学,2016.
[4]邢红梅,陈欣,王慧.基于LightGBM模型的文本分类研究[J].内蒙古工业大学学报(自然科学版),2020,39(01):52-59.
龙克树,男,中国移动通信集团贵州有限公司,工程师;杨鑫,男,中国亚信科技有限公司,工程师;杨靖,女,中国移动通信集团贵州有限公司,工程师。