(2017年度“华苏杯”获奖论文三等奖)基于大数据的无线网络健康指数评估体系
2018-05-21于洋张进谷俊江
于洋 张进 谷俊江
中国联合网络通信集团有限公司江苏分公司
0 引言
在当前移动通讯网络,一方面随着用户的增长、应用的丰富以及运营商之间日趋激烈的竞争,用户对网络性能有了更高要求,迫使运营商对网络的优化也提出了更高要求。另一方面,终端与应用的快速发展,用户也提供给了运营商丰富的物理层的测量信息和信令信息,结合应用层的用户位置、使用行为等信息与后台网管数据,从终端至网络核心的每一点变化都成为了可被记录和分析的数据。
大数据的收集存储、分析预测技术的发展,使得这些数据所反馈的大量信息被保留后,可以用于对无线网络进行分析,为网络优化提供更为有效的判断依据。通过对这些数据的分析、预测,使得决策更为精准,释放更多数据的隐藏价值,不仅为网络优化,也为建设维护、营销推广提供了强有力的支撑。
在大数据时代,全面详实的数据需求取代了传统的随机粗放样式,而随着数据样式的改变,分析方式也由因果关系更多的提升为相关性分析。
江苏联通应用大数据处理技术,将多个维度的数据源统合分析,按不同要素组合成指标元,形成了对网络全方位评价的体检式健康评估,最后再基于评估得出的健康指数指导地市的规建维优,取得了良好的效果。
1 研究背景
(1)全局数据代替采样数据,应对日趋复杂与成本高涨的网络
目前,移动通讯网络快速发展,用户规模爆发式增长,运营商一方面面临着网络发展滞后的压力,另一方面也面临着多网运营与规模增长带来的成本提升的压力。多网并存还导致互操作优化困难,网络复杂度大大提高的问题。运营商很难实现与网络增长和复杂度提升比例相同的网络优运维费用增加。
同时,统计学已经证明,采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量增加的关系不大,即当随机性采样趋近全面后,单纯样本数量的增加已经无助于随机性的显著提高,采样分析的精确性趋于稳定。样本数量继续增加达到某个值后,从这个数据来源得到的信息会越来越少。
在大数据技术成熟前,随机采样是一条捷径,是在不可收集和分析全部数据情况下的唯一选择,它本身存在许多固有的缺陷,它的准确性依赖于采样的绝对随机性,但是实现采样的随机性非常困难,一旦采样过程中存在任何偏见,分析结果就会相差甚远。
随着大数据技术的发展,引入数据处理支撑系统,自动化、全业务、全场景的进行大数据批量处理,实现采样数据的全局性和处理的高效性和及时性,有效地利用现有网络数据提升优化工作效率和准确性成为运营商的迫切需要。
(2)宏观指标体系滞后,缺乏指导性的相关分析
目前的4G网络质量评价体系从语音网评估体系演变而来,比较注重接入性能、保持性能等,并不能反映用户在使用过程中的速率、接入时延、视频卡顿等感知,已不适应数据业务快速发展的需要,不能全面反映客户体验。
传统网络优化分析非常注重数据之间的因果关系,大量网络问题分析仅限于寻求线性关系而忽略了小区之间、用户之间或是指标之间的相关关系。
由于理论水平未能达到实际应用的要求,大多数科研人员只能借助国外编写的一些仿真软件(如Adams、RecurDyn等软件)来解决设计、分析中的问题,而软件的使用需要具备一定的理论基础,欲达到熟练、深入的应用程度,则需要较高的理论水平。另外,借助仿真软件并不能解决所有实际应用中的问题,有时需要自行编写程序,如将程序写入不能安装大型软件的微芯片,这种情况对理论的要求更高。再者,从自主知识产权、国家科研知识储备以及教育系统学科建设等角度来看,掌握及传授此部分理论知识是必须的。
相关关系的核心是量化2个事物之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。
传统的KPI、KQI指标体系,从每个用户的信令侧进行数据统计,虽然能够发现端到端的感知指标,但是无法精确的定位网络的问题、无法明确的指导现场优化人员提出解决方案。因此需要一个指标体系,基于各指标关联,设置分析矩阵,既能反映端到端的用户感知,又能从设备的性能出发,指导现场的维护与优化工作。
(3)微观上缺乏精确数据支撑规建维优
在当下2G、3G、4G多网并存、4G终端制式复杂的环境下,智能终端应用场景日益复杂,现有传统的用户感知评估手段都采用从网络看终端的方式进行评估,采用KPI的方式描述用户感知。但在现网中,尤其是在数据业务中,现有手段评估用户感知有一定的片面性,指标与用户真实感知存在钝化的情况,评估结果更多是从智能终端、应用软件、网络管道单方面提出问题,已不能满足智能终端的各种应用场景。况且,现有的方式,还存在无法获取用户位置,无法获取投诉点网络环境,导致投诉处理困难等问题。
为真实反映用户感知,需要突破现有的用户感知评估体系,重新建立多纬度、以用户为起点、从用户的角度看网络的全新的用户感知评估体系,以用户的真实感知牵引网络优化的方向。
加之4G网络已商用,由于网络处于快速发展时期,亟需通过高效的测试方式来及时发现网络问题并加以完善,尽快提高4G网络的运营能力。
对于以上问题,需要开发一套成熟的基于智能终端的感知数据测试分析系统,具备业务测试、感知诊断和数据监测采集功能,高效处理信息数据,深入分析感知异常,追溯终端业务过程,利用定位技术全景呈现数据地图,全面、真实、直观反映终端在网使用感知。同时,系统的应用,可大幅减少测试设备的投入,提高测试效率的同时,缩短测试周期;减少测试、网优、客服人员投入,简化处理流程,以强力有效的实用性,协助网优运维人员快速解决网络异常事件,进而提高运营商对终端用户的服务质量,保证用户满意度。
2 系统架构原理
2.1 网络健康指数构成
网络健康指数由KPI+指标体系与话统、MR、众筹等多维度数据源组成,KPI+评估从全网指标情况和TOPN指标情况、差小区占比分别评分;全网指标情况评分总分为100,TOPN指标情况总分为5分,为扣分项,差小区占比总分为5分,为扣分项;全网指标情况评分采用绝对评分机制,TOPN指标情况和差小区占比采用相对评分机制,地市内厂家系数按话务量比值确定。性能好且较为基础的指标项分数权值低;差距大、性能差、对感知影响较大的指标项权值大,重点突出短板指标;并根据需要手工指定各地市差距较小的优门限,大于该门限的地市得分均为满分,避免硬性机械的将各地市均较好的指标项进行考核。
如图1所示,考察指标项分为6类,每类设定类系数。每类下分详细指标项,每个指标项设定指标项系数。系数的设定需要根据网络的实际情况进行滚动修正。
图1 评分权重体系图
全网指标情况评分采用绝对评分机制,即考察指标项大于对应门限时,可以得到相应的分数;全网指标的门限设定分为优、良、中、差四等,取对应指标项的全省平均值为良门限,全省动态平均为良门限,上浮20%为优,下浮20%为中,下浮40%为差。
TOPN指标情况和差小区占比评分采用相对评分机制,即每个指标项对应指标按地市排名,排第一名的得0分,排最后一名得1分;中间各地市按级差计算实际得分。TOPN指标情况和差小区占比评分的目的是为了突出和强化地市对TOPN质差小区的处理,因此采用扣分机制。
基于公平公正的原则,评估时不考虑地市的网络规模,仅对TOP差小区进行评估和分析,建议TOP差小区数量为20个,TOP差小区的选择时需要考虑小区的实际话务量,如果话务量过低(低于全网指标平均值的20%),则不纳入TOPN评估。以月维度进行评估,每月滚动TOP20进行分析。为江苏省13个地市的网络整体指标评估得分如图2所示。
图2 江苏省地市整体指标评估图
2.2 数据挖掘方法
借助先进的大数据分析系统,可以实现海量的网管指标、MR和众筹测试报告的数据挖掘,在网络优化中起到关键性的作用。数据挖掘在网络优化中的主要作用是分析与统计。网络优化需要的所有数据一般来自于终端上报的采集数据。数据挖掘技术可以根据这些数据直接找出影响网络正常运行的根因。
将数据挖掘技术应用到网络优化中去,网络优化工作人员就可以利用此前人工难以处理利用的纷繁芜杂的大量数据。其次,可以为专业的优化人员提供准确的信息,让他们能及时发现网络中存在的问题,并且及时的进行优化。另外,技术人员也可以凭以往优化的经验找出表面问题之外的深层次问题。
数据挖掘基础架构主要分为数据的采集、存取、处理、统计分析、数据挖掘、模型预测、结果呈现。如图3所示。
其中数据挖掘主要有以下四种方法:
1)关联分析:分析用户感知问题原因,寻找和发现网络中某项关键指标或问题的相关可能因素及其相互影响关系。如用户感知与覆盖,干扰,切换,容量以及时间等因素的关系;
2)趋势预测:预测业务量及网络容量,根据宝贵的历史数据资料,采用统计和建模的方法得到业务量或指标变化的趋势。提前对未来可能发生的潜在问题进行预测与应对;
图3 大数据分析的技术实现架构图
3)偏差检测:发现业务性能异常波动,业务的指标有着随机波动的特性,采用偏差检测科学的判断哪些是正常性的随机浮动哪些是异常的业务问题;
4)聚类分析:定位网络问题点,将庞大的网络中的各种事件/网元根据相似性进行汇聚分类。例如,对网络中的所有小区根据各类指标进行分类,科学高效的定位坏小区。
覆盖问题数据处理流程如图4所示,主要有问题判定、条件集、数据集、分析集、深度分析5个步骤。
图4 覆盖问题数据处理流程示意图
3 总结
江苏联通使用大数据处理工具,创新应用众筹测试,结合MR、信令跟踪、话统数据、DT、CQT等传统数据,建立了基于网络健康指数的评估方法,梳理问题点26700个,通过统一调配优化力量,重点问题由集中优化团队重点分析,指导地市大力推进优化工作,截止2017年5月底闭环26212个,闭环率98.2%;异常覆盖占比31.1%降至21.5%,KPI+各地市得分均值由83.2提升至87.8,网络质量提升明显,通过众筹APP与客服回访验证,用户感知提升明显,对联通品牌认可度也大幅增加。