面向移动运维数据的基站退服故障预测研究
2019-03-27
(新疆大学机械工程学院 新疆 乌鲁木齐 830046)
一、引言
基站退服是基站系统最为严重的故障,引起基站退服的原因有天馈故障、传输故障、载频故障等。基站退服将不能为信号覆盖区域提供无线服务。传统的故障监控模式通常采用事中监测和事后分析方式,此模式在预测故障方面不足。故而,通过数据挖掘算法可以达到故障事前预警,将网络监控数据转化为运维数据价值,进而使基站退服的故障预警有可行性。
针对以上问题提出了基于移动运维数据的基站退服故障预测方法。首先对运维数据进行清洗、特征筛选,然后进行网元分类、指标降维,对主成分分析聚类,最后建立回归方程进行故障预测,并验证了退服预警模型的准确性。
二、基站退服故障预警模型
(一)数据处理
1.退服关联告警概率统计
以某市移动两个月性能指标数据为例,约45万个性能数据,数据来源为基站、传输和动环三个方面,包含退服、报警及状态类型,时间粒度为15分钟。取退服故障发生前4小时内的数据,当出现报错、状态变化等信息之后到出现退服的30-60分钟之内。
2.数据清洗
以该市45万个性能数据为例,其中基站数量为5119个、基站设备性能指标维度455个[1]。对全量均值化指标数据计算相关矩阵,按照工作和休息时间段进行协方差[2]的均质化处理,协方差矩阵的第(i,j)项(第(i,j)项是一个协方差被定义为如下形式:
cov(X,Y)=E[(X-μi)(Y-μj)]
(1)
其中是以n个随机变量组成的列向量,并且是的期望值,即=(μi=E(Xi))。协方差矩阵的第(i,j)项。
3.特征筛选
根据相关系数判别标准选择相关系数大于0.6的性能指标,将全量455个基站设备性能指标集降至62个。进一步去除相关性不大的性能指标后,基站设备性能指标集降至21个。
4.数据分类
在研究指标间的相关性时利用kendall相关系数,可分析连续、属性和混合等三种方法来分析指标间的相关性。
kendall相关系数可有下式计算:
(1)
其中表示,中拥有一致性的元素对数;表示,中不一致性的元素对数。为元素个。通过相关系数计算得到每个基站性能的相关指标,将每个基站的相关指标利用各个指标的频率特征经初查个基站的设备性能相关指标。
5.基站性能指标聚类
对基站设备的21个性能指标集进行聚类分析,聚类分析利用均值漂移算法[3](mean shift)对基站性能指标进行聚类。算法如下:假设每个基站指标可观测设备性能指标维度为d,指标个数为n,记第个性能指标为,=1.2.3…,则对于第个基站,其mean shift向量的基本形式为:
(2)
其中,指的是一个半径为的高维球区域,其定义为:
Sh(x)={y|(y-x)T(y-x)≤h2}
(3)
根据基站的位置、业务量等因素,基站可分为重要A基站、重要B基站、普通A站、普通B站等。
(二)性能指标的降维原理
根据网元分类结果以第1簇为例对基站进行分类以及降维[4]。具体方法如下,设某类基站共有n个基站,每个基站共有个可观测的设备性能指标,本文通过样本相关全区间对设备性能指标做降维工作,记为第个基站的观测向量。
xi=(x1,x2,…xim)
(4)
得的相关矩阵,具体表示如下
(5)
由|R-λEm|=0得R的个特征值及对应的特征向量。当≥80%时,将标准化后的基站设备性能指标变量转换为主要成分,得其中(k=1.2…)(i=1.2…n),其中,X1为第一主成分,X2为第二主成分,依次类推,Xq为第q个主要成分。对个主要成分进行加权求,从而得到最终指标组合。
(三)性能指标的主要成分与故障的量化模型
线性回归模型满足自变量与因变量要有线性关系。可以计算相关系数从而可以对降维后的基站性能指标中主要成分和基站退服次数关联分析。经过关联分析后,设最低相关系数的绝对值为0.11,大于最低相关系数的主要成分表达式,这表明主要成分与基站退服次数有一定的关联。
回归方程[5]建立如下:记(表示第个基站的第个主要成分)记为第个基站是发生退服故障所做的记录,则拟建立。
zi=β1yi1+β1yi1+…β1yi1+β0+εi
(14)
i=(1…n)的线性回归模型。进而对x1=(xi1…xim)T进行阈值的分析,达到对基站发生故障退服的预测。
三、结论
以基站退服故障数据为基础,将故障与告警数据关联起来,对数据进行清洗、特征筛选,指标选取聚类并降维,最终得到客观且有价值的数据。经过降维后的数据降低了故障数据之间的相关性,这就为基站故障预测提供更加有价值的数据。依托线性回归方程建立的预测模型简洁明了且计算高效。该预测模型充分发挥了具有时间属性的有效数据,为维修人员通讯设备的检查优先顺序提供了价值参考,为今后故障排查作出科学客观的指导。