APP下载

基于机器学习的5G用户智能投诉处理方案研究

2021-06-18钟检荣中国联通北京市分公司北京100038

邮电设计技术 2021年5期
关键词:网元数据系统数据源

曾 伟,钟检荣,张 玮,范 君(中国联通北京市分公司,北京 100038)

1 概述

5G将给社会带来全新的改变,给用户带来全新的体验。目前,5G 应用场景包括eMBB、uRLLC、mMTC 3种通信服务类型,公认的5G 未来杀手级应用包括VR/AR、自动驾驶、无人机、智能电网、无线医疗等。5G 将通过网络切片的方式,给包括人和物在内的、数量庞大的用户提供适配的多样连接。与此同时,5G将对运营商的网络运维和用户服务带来全新的挑战,而用户投诉处理将是5G 时代一大考题。面对5G 网络复杂度、业务类型、用户类型和数量的急剧增加,如何快速定位用户投诉原因,制定投诉解决方案,给用户满意答复,最终提升用户满意度,是5G 时代亟需解决的问题。

近年来,云计算、大数据、深度学习等技术的发展推动了人工智能产业的进步,人工智能在各行各业的应用遍地开花。目前主流的人工智能应用中,最主要的是机器学习和深度学习,它们专门研究计算机怎样模拟人类的学习行为获取新知识或技能,从而不断改善自身性能。机器学习主要包括监督学习、半监督学习、无监督学习、强化学习、神经网络等。本文研究了如何依托大数据系统,利用机器学习的方法,开展5G用户智能投诉处理,实现5G用户投诉处理的自动化和智能化。

2 5G用户智能投诉处理方案设计思路

2.1 总体设计思路

在整个方案中,第1 步需构建一个用户O 域与B域数据互通关联的端到端大数据系统,在该系统中,对全量的用户信令进行数据采集和数据分析。第2步是以用户为中心,在机、卡、网、感、地、时、年、价等八大维度,为网内每个用户建立用户画像,以便在用户发生投诉时进行精准快速的分析响应,并在此基础上形成问题工单。第3 步是构建机器学习智能系统,在该系统中,通过将历史工单和历史分析结果进行机器学习,完成模型训练,得到问题分析模型,之后将新的问题工单作为输入后,便能自动得到新问题的用户投诉分析结果,实现5G用户投诉处理分析的自动化和智能化。图1展示了整个方案中数据的处理流程。

图1 5G用户智能投诉处理方案流程图

2.2 端到端大数据系统

要实现5G智能投诉处理,必须对用户的呼叫业务质量进行全面的系统监控,而这需要依托先进的大数据系统,基于用户O域与B域数据的互通关联,建立基于全量用户呼叫端到端信令流程的网络质量分析体系。

2.2.1 数据源范围选取

为了构建端到端大数据系统,首先需要确定数据源的范围。为了满足端到端信令分析的需求,数据源需要包括O 域中的CS 域、EPC 域、IMS 域和RAN 域。为了后续能对用户进行画像分析,从而在用户发生投诉时精准快速响应,数据源还需要包括B域数据,主要涉及用户套餐、流量、在网时长等。端到端大数据系统数据源涉及的网元和接口如图2所示。

图2 数据源涉及的网元和接口

O域数据源主要包括:

a)CS域:电路域,主要有Iu-CS、CSFB等。

b)EPC 域:LTE 核心网,主要有S1-MME、S1-U、S11、S5/8等。

c)IMS 域:多媒体会话,主要有Gm、Mw、Mx、Mg等。

d)RAN域:无线接入网,主要有UU、X2、MR等。B域数据源主要包括:用户套餐、流量、时长、用户侧账单、用户侧详单等。

2.2.2 大数据系统构建

大数据系统构建的目的是把各数据源整合起来,提取有用信息,再进一步分析问题的原因所在。基于用户每次业务的大数据系统具备查询每个用户每次业务相关信息的功能。需要以用户业务为中心,以问题定位为目标,通过用户、时间、地点、终端、行为、网元、信号、事件等多维度回溯用户行为和网络质量,一键式全信令自动回溯,助力精准定位问题。系统的主要模块包括:

a)GIS 呈现。在该模块中,主要通过GIS 地图呈现5G用户投诉问题发生时,用户所处的地理位置和经历的服务小区。在进行人工分析时,可以清晰直观、一目了然地呈现问题,有助于问题的判断。在进行基于机器学习的自动化智能分析建模时,可以将分析结果输出到GIS 地图上,直观地比对分析结果是否符合预期,从而帮助模型的修改完善。

b)无线话单。在该模块中,涉及该5G 投诉的相关无线话单都被提取出来,每个话单中每个步骤的信令均可追溯。通过分析信令,可以判断哪个环节出现了异常,从而判断产生问题的原因。为了进行基于机器学习的智能分析,异常环节会被提取出来,并打上标签,作为智能分析的输入,帮助判断造成5G 用户投诉的原因。

c)网元告警。在该模块中,主要呈现5G 用户投诉涉及的网元告警,包括告警出现的网元编号、时间、告警名称、告警影响等信息。网络故障通常是新出问题的第一原因,而网元告警是判断网络故障的第一步。系统会根据预判条件,自动筛选出对投诉有影响的告警并呈现出来。在后续的基于机器学习的智能分析中,网元告警将作为重要的数据输入为投诉分析提供重要依据,而作为问题产生的重要原因之一也可能出现在分析结果的输出中。

d)覆盖/质量。无线信号的覆盖和质量对用户的5G网络使用体验有重要影响,覆盖差或质量差会导致接入失败、数据速率低、数据掉线等问题,是5G用户投诉的重要原因之一,因此覆盖和质量情况是5G用户投诉分析中必不可少的维度。在无线侧的用户测量报告MR 中,携带有关于当前服务小区覆盖和质量情况的信息,系统将此信息提取出来并直观地以时间为顺序呈现出来。进行基于机器学习的智能分析时,会将覆盖和质量信息进行处理并作为数据输入开展分析。

e)常驻小区。在此模块中,系统根据算法自动提取5G投诉用户的常驻小区,并呈现一段时间内各小区驻留次数。常驻小区是5G用户投诉分析的基础,一切的分析均是在常驻小区之上开展。因为用户既然发生了投诉,说明问题并不是偶尔出现,而是经常出现,严重影响了用户的体验,那么问题很可能是出现在常驻小区上。

f)网元KPI 指标。在此模块中,系统提取涉及5G用户投诉相关网元的KPI指标,并根据需要呈现。KPI指标反映了网元的健康程度,出现异常KPI 指标的网元通常存在问题,极有可能是产生用户投诉的原因。将KPI 异常的时间点与投诉时间点进行匹配,若相吻合则更说明与投诉强相关,在进行基于机器学习的自动化智能分析时,网元KPI 将作为一个重要输入数据进行评估。

这6个主要模块仅是端到端大数据系统中可视化呈现的部分,为了进行基于机器学习的5G用户投诉智能分析,还有大量其他数据存储在系统中,作为模型训练和分析的数据来源。

2.3 用户画像

在大数据系统实现用户业务端到端信令数据采集和分析的基础上,需要以用户为中心,在机、卡、网、感、地、时、年、价等八大维度(一百多个标签),为网内每个用户建立用户画像,以便在用户发生投诉时进行精准快速的分析响应(见图3)。

图3 八维用户画像示意图

用户画像主要有3 个方面的作用。第一,通过建立用户画像,对用户生成全方位的了解,在开展投诉分析时,可以有针对、有侧重地进行。例如,对于ARPU 值高的用户,由于其贡献了较多的企业收入,进行投诉处理的优先级应提至较高;对于投诉次数较多的用户,很可能其问题比较严重,如果不尽快解决,用户满意度差,离网的可能性较大,也应将投诉处理的优先级提至较高。第二,在建立用户画像后,可以根据用户在各个维度的情况提取相关信息,形成经验总结,指导后续投诉的处理。例如,根据用户终端的使用情况,匹配其投诉情况,可以总结出哪些型号的终端可能存在问题,导致非网络原因的投诉的产生,在进行投诉分析时将其作为一项重要参考。第三,也是最重要的一部分,在用户画像中,包含了用户投诉和异常事件相关信息,将这些信息进行加工处理,形成基于机器学习的5G 用户智能投诉处理分析的数据输入,利用机器学习智能系统进行分析,最终输出产生用户投诉的原因。

用户画像的建立过程主要是在O 域数据和B 域数据打通的基础上,从机、卡、网、感、地、时、年、价8个维度,根据需要设立标签,针对每个用户提取标签信息,从而形成每个用户的画像。由于用户的信息经常发生变动,尤其是感知方面的信息,随着网络和用户业务使用情况的不断变化,用户画像中的信息也需要不断更新,在开展5G用户投诉分析时才具有时效性。

2.4 机器学习

智能投诉处理的关键是用户投诉问题的定界和定位。算法构建的核心是基于用户画像的标签体系,结合历史投诉单的内容、地点以及历史问题的定位结果,利用机器学习分类算法,反复迭代得出可靠稳定的决策模型。

2.4.1 模型的建立与利用

机器学习的过程主要涉及到数据的准备、模型的选取、模型的训练、模型的利用(见图4)。在所有工作开始之前,需要梳理产生问题的原因类别,例如显性故障、隐性故障、弱覆盖、质差、拥塞、高干扰、参数设置错误等。对每种原因类别,建立一个模型,模型的输出是对是否存在该原因类别的二元判断,即“是”或“否”。最终将所有类型的判断综合起来,形成总体分析结论。下面以3种原因类别的建模和分析为例说明机器学习模型的建立与利用。

图4 机器学习模型的建立与利用

a)数据的准备。在本方案中,数据主要来自大数据系统中与5G 用户投诉相关的工单、用户画像结果、告警数据表、呼叫数据表等。将相关信息提取出来,形成n项指标,作为模型的输入,将历史工单分析结果即是否存在该种原因类别,形成标签,作为模型的输出。

b)模型的选取。机器学习的分类算法有多种,包括逻辑回归、线性判别分析、K 近邻、分类和回归树、朴素贝叶斯、支持向量机等。在这里,选取随机森林算法进行模型的建立。随机森林是通过集成学习的思想将多棵树集成的一种算法,它通过随机选取部分样本和特征构建多棵决策树,其中每棵树都是基于随机向量的一个独立集合的值产生的,最后再将多棵决策树产生的结果整合在一起。随机森林算法具有精确度高、不容易陷入过拟合、泛化能力等优点。

c)模型的训练。针对每一种原因类别,建立一个模型,开展模型训练。例如,针对“显性故障”这一原因类别,建立模型I,把数据按8∶2分成训练集、测试集2 个部分,将指标1……指标n作为输入,标签作为输出,代入随机森林模型。在完成模型训练后,开展精度评估,调整相关参数设置,提高样本数量,使得精度达到要求,即完成了模型的训练。

d)模型的利用。在收到5G 用户投诉工单后,根据待处理工单,从各个数据表中提取工单用户的前30天数据,进行相关数据处理之后,输入到机器学习智能系统中,系统将输出针对每种原因类别的二元判断,即是否存在该原因类别。最终将结果综合起来,即可形成5G用户投诉的原因分析结果。

2.4.2 与客服感知系统的结合

客服感知系统是专门用于应对用户投诉开发的系统。系统所包含的投诉应答,不仅包括网络侧问题,也包括业务、服务等方面的问题,是一个综合的投诉应答平台。基于机器学习的模型输出,作为网络侧的问题分析反馈结果,最终需要与客服感知系统结合,才能最终发挥作用,完成对5G 用户投诉的智能处理,从而提升投诉分析和处理的效率。

从机器学习智能系统中输出的分析结果,仅是对各种问题原因类别的一个二元判断,尚未形成综合结果。图5 以3 种问题原因类别为例,展示了如何将单个结果形成为综合结果,并输出至客服感知系统。

图5 机器学习综合结果输出至客服感知系统

3 实际生产应用

在实际生产中,5G 用户智能投诉分析系统与客服系统、工单系统紧密对接,日处理分析超过200单网络问题的投诉,通过系统运算,只需要1 h,并且给出的方案定位匹配率超过90%,大大提升了5G用户投诉分析和方案制定的效率,节省了人工和时间成本,成为应对5G时代用户投诉的利器。

图6 展示了使用5G 用户智能投诉分析系统的一个案例,该案例中,由于基站故障导致了用户投诉。智能系统分析出该投诉是由于名称为“朝阳东窑平房区”的基站发生射频告警产生,方案匹配率为90%。

图6 基站告警引起用户投诉分析结果

4 结束语

本文提出的基于机器学习的5G 用户智能投诉处理方案,通过构建用户O 域数据和B 域数据互通关联的大数据分析系统,将用户呼叫过程中的信令流程及网络数据进行整合。为网内每个用户建立用户画像,以便用户发生投诉时开展精准快速的分析响应。通过机器学习智能系统,建立智能分析模型,实现5G 投诉问题原因的快速定位。经过实际生产验证,方案定位匹配率超过90%,日均处理超过200 单网络问题投诉,从用户投诉处理的角度,为5G大规模商用的到来,在网络的智能化和自动化运营方面探索了一条道路。

猜你喜欢

网元数据系统数据源
图表中的交互 数据钻取还能这么用
交换机敏感计数器监控分析系统在现网中的应用
浅析运用计算机技术审计医疗机构药品加价方法
现代学徒制教学管理系统的设计
基于Excel的照片查询系统开发与应用
再谈利用邮件合并功能批量生成准考证
数据有增加 图表自适应
关于中兴公司通信设备环回方面的讨论
高危及重要客户供用电安全管理分析
CDMA核心网向EPC演进实施策略