APP下载

基于海量数据的VoLTE用户语音感知系统研究

2018-08-03朱伟艾怀丽张桂荣赵志扬张晶梅明涛

江苏通信 2018年2期
关键词:通话语音终端

朱伟 艾怀丽 张桂荣 赵志扬 张晶 梅明涛

中国移动通信集团江苏有限公司

1 引言

随着移动推行“四轮驱动”融合发展战略,4G发展一直保持行业领先,2016年4G用户数和4G渗透率达到新高,2017年的目标是4G用户突破6.3亿,VoLTE用户突破1.5亿。VoLTE语音逐步成为用户通话的最基本选择。高质量的语音、更快速的接通给用户带来更好的体验的同时,对网络质量的要求也越来越高。差的VoLTE语音感知往往会引起用户投诉,一线的优化压力日趋增长。

图1 移动用户数及4G用户占比图

针对江苏多个重点城市VIP投诉详单抽样分析,语音质量类问题是影响用户感知的主要问题,占VoLTE投诉的70%+;其中4G弱覆盖、干扰等仍是影响用户感知的主要因素。

目前每天南京的VoLTE高清语音质量通话次数大约35万,未来五年随着VoLTE业务的建设和深入发展,VoLTE高清语音将成为主流,预计增长20倍到700+万通话/天,若VoLTE语音质量问题占投诉的70%,一旦等用户规模成倍增长,而VoLTE语音质量问题无法得到有效解决和闭环,等比20倍的投诉量增加将是灾难性的。

图2 VoLTE问题占比图

而目前结合现网优化经验,传统的KPI指标在网络性能较差的情况下能够反映网络问题,但是在网络质量提升到一定水平后根据KPI指标就很难真实的反映用户体验好坏,往往会出现传统KPI指标非常好的情况下用户体验并不好;更进一步的KQI指标有一定改善,但是从VIP投诉分析来看,还是存在MOS值满足要求,用户体验不好的情况。因此,针对传统KPI指标无法及时发现VoLTE语音质差并及时解决和闭环这个难题,需要一种新的方式能够识别VoLTE语音质量导致的客户感知差的问题,并能够推动促进问题高效解决。

2 基于海量数据的VoLTE语音感知系统实现原理

传统的网管指标最小粒度是5min粒度,没有反映用户听不清的指标,且无法表征真实的用户感知,本课题提出的VoLTE语音感知研究,基于反映用户听不清的吞字指标,对话音流进行切片,以5s为粒度进行分析,对比传统网管的5min粒度指标,解决了问题点因过粗的统计而湮没在样本中的问题。

2.1 关联原理

从用户体验入手,将VoLTE语音质差小区识别出来,排除终端、用户故障的干扰,并关联已有的无线侧其他系统定位的问题,实现自动派单,提供给网优部门处理。本研究课题通过三大步实现精准的质差小区定位。

图3 VoLTE语音质差小区原理图

2.2 第一步:质差用户如何表征

在3GPP LTE中,VoLTE业务编码有AMR-NB窄带和AMR-WB宽带两种编码,两种编码速率具有不同的话音质量,所以又分别称为VoLTE标清语音(或VoLTE 12.2kbps)和VoLTE高清语音(或VoLTE 23.85kbps)。

AMR-NB和AMR-WB这2种编码具有如下特点:

每20ms产生一个语音包,包括了RTP/UDP/RLC-Security压缩头;每160ms生成一个SID语音静默包。帧长20ms;普通人讲话的语速为每分钟120至180个汉字左右(新闻联播播音员的语速280到300字)。因此,普通人大概1个字占16~25个语音包。

用户语音质量体验差总结起来有三种感受:

吞字:感觉对方说话吐字不清,或者漏字。

断续:感觉对方说话时断时续,有明显停顿感。

单通:完全无法听到对方说话。

通过海量数据的分析,发现丢包是影响语音质差的关键因素。但是,是否语音质差,不完全取决于整体的丢包数量和丢包率,而取决于在具体时段的丢包数量。

经过对海量样本以机器学习算法研究,一般情况下的表现如下:

吞字:连续20个包,丢12个包。

断续:连续50个包,丢30个包

单通:丢包率大于80%。

其中断续、单通是比吞字更加严重的情况,吞字是否发生能够在一定程度上表征用户语音质量体验。下图是吞字发生在语音频谱上的典型体现:

图4 吞字语音频谱图

吞字表征语音质差相比IPMOS的优势:

前期我们用IPMOS来评估语音质量,但是其实通过统计指标加权综合评分,并不能够完全表征用户语音质量感受,通过对从南京市抽取的2348份通话记录进行对比如下所示,并不是所有IPMOS好的场景都不发生吞字。

图5 产生吞字的IPMOS值分布图

2.3 第二步:问题快速定界

基于用户、终端、小区等因素排查

(1)终端因素排查

故障终端按照小区维度动态监控,通过语音质差小区信息关联其小时维度ToP质差用户终端型号,一旦出现终端型号集中,应判断为终端问题。

经过大数据样本统计分析,正常情况下终端故障不会大面积集中出现。如下图7所示,取南京全网1天数据,最差的终端故障率仅为2.9%,日常VoLTE语言质差并没有因终端原因引起的。

图6 快速定界手段图

图7 TOP终端故障率图

(2)用户因素排查

为了避免在异常情况下由于某些特定用户导致的问题出现,质差小区信息中关联该小区下的故障通话次数、故障通话用户数,一旦出现故障通话用户数远小于故障通话次数,则判断为用户因素,因某些异常用户导致了大量的故障通话。

经过大数据样本统计分析,正常情况下Top质差用户不足以影响Top质差小区的识别。

图8 TOP质差用户排除图

(3)切换因素识别

通过大数据识别,将一天内数以千万计的通话情况、语音质量、切换情况关联。

图9 切换关联原理图

如下所示,识别出在切换情况中出现的语音异常的场景,识别出切换导致的语音质差问题。

图10 切换中识别出的语音异常的场景图

2.4 第三步:质差用户Top小区识别

基于大数据的Kmeans聚类算法将质差用户按照小区位置进行聚类,识别出Top质差小区。

图11 质差用户Top小区图

3 依托大数据手段对语音质差小区的精准定位和处理

3.1 关联无线传统派单,多维度反映5s质差Top小区原因

通过统计分析,大概30%的小区在业务体验差的情况下,会在传统的无线监控指标上有体现。因此,通过关联传统的容量不足、覆盖、干扰等无线指标,从多个维度反映该5s质差Top小区的原因,避免了传统派单中仅针对单一指标进行优化而导致的资源浪费问题,并能大大提升一线优化问题的处理效率。

3.2 根据大数据OTT定位信息,栅格化呈现质差具体位置

由于传统网优手段的限制,若无法用传统的网络监控KPI指标识别的问题,处理难度大。通过人工拉网排查成本高效率低。

因此,针对70%语音质差识别的无法用传统保障措施发现的故障小区,需要采用新的方法来解决——这就是基于软采数据的大数据OTT定位信息,如下图所示,基于高铁小区进行专项试点显示,通过这个方法能够精准的识别出现语音质差的具体位置,以及无线相关的具体信息,能够有的放矢地指导网优人员做精准专项优化。

图12 基于大数据OTT定位信息的栅格化辅助定位图

实际数据显示,基于语音质差故障栅格化呈现的方式,精准地完成了语音质差小区的优化。

图13 质差用户Top小区处理效果图

4 结论

本文针对传统的无线网络质量保障无法提升用户体验的不足,提出了基于5s切片技术的基于大数据的VoLTE语音感知系统。从表征用户体验吞字入手,自动实现问题定界,依次分析终端、用户、切换因素,将VoLTE语音质差小区精准识别出来。并关联已有的无线侧其他系统定位的问题,依托OTT定位栅格化信息,实现自动派单,提供给一线现场网优处理。目前该系统已在南京上线,质差小区具有很高的准确性,能够较精准地完成语音质差小区的优化。该课题对于一线优化生产将带来很大帮助,具有全国推广的意义。

猜你喜欢

通话语音终端
微信上小额借款 请务必通话确认
X美术馆首届三年展:“终端〉_How Do We Begin?”
通信控制服务器(CCS)维护终端的设计与实现
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
《戊戌元日与友人通话》
GSM-R手持终端呼叫FAS失败案例分析
ABB Elastimold 10kV电缆终端及中间接头