LTE用户网络浏览感知KQI与无线侧KPI关联分析
2018-01-29黄金福
黄金福
摘要:文章主要针对中国电信LTE用户网页浏览感知KQI和无线侧KPI之间进行相关性分析,得到二者之间的关联,以达到后期通过优化对应KPI能快速提升KQ[的目的。
关键词:LTE;用户感知;KQI;KPI
随着移动互联网业务迅猛发展,传统的关键绩效指标(Key Performance Indicators,KRD无法精确反映用户真实业务感知的问题日益凸显。部分空口、终端、结构化编程(Structured Programming,SP)、核心侧等问题均可引发用户感知问题,却无法通过网络KPI和路测获取,成为网络痛点。运营商各自针对移动互联网主流业务搭建了评估体系,为每项业务设计了多个反映用户不同方面的业务感知关键质量指标(Key Quality Indicators,KQI),建立了一整套基于大数据分析的移动互联网用户感知评估体系[1]。
本文主要对中国电信KQI感知指标网页浏览指标和KPI指标之间进行关联分析,尝试得到二者之间的线性关系,以达到后期对KQI感知指标快速分析、通过优化对应的关键KPI指标快速提升KQI。
1KQI和KPI筛选提取
KQI聚焦于终端用户关注的业务层面,用户使用网络的业务体验指标,而KPI主要是运营商关注的网络层面水平。
本次关联分析中,KQI指标选取网页浏览业务的网页首包时延。网页首包时延是指终端用户发起浏览请求到请求服务器回复第一个Http200ok报文所经历的时间,反映的是从终端侧和目标服务器侧之间的网络响应水平。
本次KQI和KPI关联分析的KPI仅为无线侦1JKPI指标,相关KPI指标数量很多,可归为覆盖、容量、干扰、保持性和完整性五大类。本文重点针对覆盖、容量、干扰进行分析(见表1)。
2分析数据源获取
本次用户感知KQI与KPI的分析数据源主要有两个,VMAX及移动感知APP统计话单
数据提取主要基于中兴通信VMAX大数据分析系统,为了提高KQI和KPI的汇聚效果,本次筛选采用传输控制协议(Transmission Control Protocol,TCP)有线建链时延和TCP无线建链时延,统计福州地区所有小区的TCP时延,将TCP有线建链时延大于80ms的小区筛除掉。按照选定的KQI和KPI,分别统计这些小区的网页首包时延,无线侧KPI指标,统计时间为5月某一周數据,得到选定时间内选定区域的KQI和KPI的数据表。
考虑到KQI与KPI都是一个统计值,且影响用户感知的因素非常多,除了无线侧影响外,传输、核心网、服务器等均会对感知带来影响,所以也提取了电信的移动感知APP上报的话单级别的数据进行统计,统计时间段为5月份可扩展标记语言(extensible Markup Language,XML)话单记录。
3关联分析过程
采用机器学习的分析思路,对各元素之间的数据关系进行最大程度的拟合,对采集到的数据进行分组,一部分作为拟合数据源,一部分作为评估数据,通过机器学习数据源得到估计函数,使用评估数据对估计函数进行误差分析,通过算法调优减小误差,如果误差在可接受范围内,则认为评估是有效的,即得到了准确的数据关系。
KQI和KPI数据提取完成后,进行了数据的初步预处理,将一些明显异常的噪声点筛选出来,一些NULL值的数据,网页首包时延明显低于正常值的异常点进行筛选,得到的待归一化的数据。根据采样点的数据分布情况,采用线性函数转换方法进行归一化,归一化公式为:
同一类别指标由于是相互关联的,内部采用加权处理,
配置的权重如表2所示。
采用通用的线性模型把特征x配上对应的权重彡之后相加,最大程度接近目标y(x),通过机器学习大量的数据,训练得出数据关系,采用测试数据进行测试,在误差可接受的情况下,认为得出的关系可靠。本文采用岭回归的回归方法,岭回归是一种专用于共线性数据分析的有偏估计方法[34],与一般的线性模型比较,优势在于岭回归预测出来的图线的方差比较小,振幅略小。
本文采用Python编程语言实现数据清洗、归一化、机器学习和误差分析部分,选取训练样本数21988,检验样本数4398,3项指标覆盖、容量、干扰分别为x2,x3,目标
首包时延为y(x)外通过岭回归机器学习法得到:
针对该学习结果,采用如下误差函数进行评估:
得到误差为0.04,所以可以认为该结果是可靠的;从权重的重要性上看,覆盖、容量和干扰中,容量对首包时延影响最大,其次是干扰。
4网页打开时延与关键KPI关联性分析结果
覆盖、容量和干扰中,容量对首包时延影响最大,其次是干扰。网页浏览KQI与关键覆盖KPI指标(RSRP,信号与干扰加噪声比(Signalto Interferenceplus NoiseRatio,SINR))呈正相关。
(1)网页打开时延随着RSRP的恶化也呈现变差趋势,当RSRP小于-104dBm时,首包时延将超过1.2s,首屏时延将超过3s,且后面的首屏恶化趋势将更加陡峭、明显。(2)网页打开时延随着RSRP的向好也呈现向好趋势,当RSRP大于-86dBm时,首屏时延、首包时延变化波动己很小,己趋于稳定,首包时延在1s左右,而首屏时延在2.5s左右。(3)网页打开时延随着SINR的向好也呈现向好趋势,当SINR低于7dB左右时,首屏时延、首包时延恶化趋势比较明显。
5结语
经过以上分析,网页打开时延与关键覆盖KPI指标正相关,当RSRP低于-104dBm时,网页打开时延恶化明显,当RSRP大于-86dBm时候,网页打开时延趋于稳定;SINR值低于7dB时,网页打开时延恶化趋势较为明显。因此,当LET的RSRP优于-104,SINR值优于7dB时,将会大大提升用户的网页浏览感知,可以作为对重要区域或VIP客户的优化参考目标。
[参考文献]
[1]陈森,陈超,张小勇,等基于大数据分析的移动互联网用户感知评估系统[J].电信科学,2015(4):148-155.
[2]CHENS,CHENC,ZHANGXY,etal. Evaluation system of mobile internet use rexperience based on big dataanalysis[J].Telecommunications Science,2015(5):7.
[3]米歇尔.机器学习[M].曾华军,张银奎,译北京:机械工ik出版社,2003.
[4]哈林顿.机器学习实战[M].李锐,译北京:人民邮电出版社,2017.endprint