电信大数据在投诉管理中的应用
2021-05-07
(中国移动通信集团海南有限公司,海南 海口 570100)
0 引言
随着移动互联网技术快速普及,基于用户个性化服务迅速发展,用户对于运营商的服务能力、网络质量等有了更高要求。然而,面临如此庞大的客户群体,当运营商提供的服务质量只能满足部分需求时,必然导致客户投诉。目前投诉主要分为两个方面:一是基于客户主观因素的投诉,主要由于客户过于挑剔或情感不满造成的投诉,资料显示该类投诉比例只有大约15%左右[1];二是基于网络故障的投诉,由于网络固有缺陷造成的使用困难、体验差等投诉,该类投诉比例大约在85%左右[2]。
为了提升投诉处理效率,国内外许多学者提出了基于大数据的投诉处理方案。文献[3]提出对投诉信息进行挖掘,研究出日益增长的投诉数量与低效率投诉处理之间的关系,利用大数据挖掘技术找出投诉热点。文献[4-6]中提出利用电信大数据的特点,用户数据、信令数据、路测数据等进行投诉原因、投诉热点、变化趋势等多维度分析。文献[7]通过对信令数据、DPI 数据等建立语音业务质量评估模型,提前预判客户投诉行为。文献[8]通过引入多维报表概念,建立大数据用户投诉预警、投诉信息图层呈现、投诉闭环管理。基于此,结合电信大数据的特点,重点研究客户投诉中投诉预判、投诉处理以及投诉诊断,建立一套完整的投诉处理流程。
1 基于电信大数据的投诉管理方案
本文以中国移动海南分公司搭建的大数据公共服务平台为依托,主要包括三个部分:投诉预判、投诉处理、投诉诊断,如图1所示。
1.1 事前:投诉预判
1.1.1 数据采集
本方案利用电信运营商的大数据平台,接入各类数据指标来建立历史数据库,主要包括5大类数据:网络资源数据、投诉数据、网管数据、信令数据以及用户位置数据。上述数据主来自网管平台、BOSS 系统,营业厅、APP、电话录音等,所有投诉信息以文本形式存入信息系统数据库。
图1 基于电信大数据的投诉管理方案
1.1.2 数据清洗
由于大数据平台的数据来自于不同的数据接口机,具有不同的格式、粒度、特征、来源、采集时间等,首先需要对数据进行清洗和整理,主要需要删除错误数据、无效数据以及补全缺失字段的数据。
1.1.3 聚类分析
经过数据采集和清洗后的数据细分为各个维度的基础数据,然而上述数据在某些层面上反映的是同一问题,例如RSSI 和RSRP 均可以反映覆盖方面的问题。因此,为了提高该算法效率,需要对数据库中各类数据进行相关性分析,保证各类数据的正交性。本文使用皮尔逊相关系数计算指标相关性。
1.1.4 问题分解
通过对用户投诉信息的分析,定位用户的投诉问题,从而找到与用户投诉相对应的五类后端数据:业务数据、质量数据、容量数据、感知数据以及场景分类数据。业务数据包括话务量、流量数据等;质量数据包括RSRQ、CINR 等;容量类数据包括可用信道数、服务小区能力数据等;感知数据包括上网速率、下载速率等;场景分类数据包括学校、医院、景点等。
1.1.5 指标选择
由于运营商庞大的客户群体和复杂的网络,目前存在的数学模型均不能解决所有问题。根据帕累托法则,常常80%的投诉来自于20%的指标异常,因此本系统对各类指标进行选择。利用鱼骨图对各类投诉原因进行分析,寻找出引起各类投诉的重要指标;其次,利用帕累托图对投诉原因进行排序,寻找出引起客户投诉的主要原因;最后,根据帕累托图的结果,对各类指标进行选择。
1.1.6 贝叶斯分类
经过数据整理,得到n条样本信息的集合S:
式中,IBi表示第i条投诉对应的业务类数据;IQi表示第i 条投诉对应的质量类数据;IPi表示第i条投诉对应的感知类数据;ICi表示第i条投诉对应的容量类数据;Li表示第i条投诉对应的场景类数据。Typei表示第i条投诉对应的投诉类型。
1.2 事中:投诉处理
经过投诉预判模块可以一定程度上减少用户可能的投诉,但投诉不可避免。当实际发生用户投诉时,本系统在线收集用户相关数据,使用历史数据库对投诉类型进行分析,基于贝叶斯分类算法对问题进行初步定位。根据用户投诉类型、投诉原因、投诉位置进行投诉热点分析,并在此基础上实现地理分级可视化呈现。
1.3 事后:投诉诊断
为了进一步完善电信客户的投诉管理流程,需要进行事后的投诉诊断。首先,通过大数据平台的数据整理,结合用户的回访数据,对用户特征进行画像,为的投诉预判打基础。然后,将预测失败的数据经修正后加入数据库,不断丰富历史数据库,加强贝叶斯算法自我学习能力,持续进行网络优化。
2 基于电信大数据的投诉管理系统应用
中国移动海南公司在大数据运营服务平台的基础上,搭建了电信大数据的投诉管理系统,并于2020年6月中旬投入使用。通过对历史数据库反复不断的学习,实时采集用户数据,对用户的投诉进行预判。利用贝叶斯分类算法计算单位面积下的倾向投诉量,在文中定义概率高于70%以上的投诉为客户的倾向投诉。利用历史数据库中的投诉分类和重要程度排序,对用户的倾向投诉的重要程度进行分析,并利用不同的配色进行级别渲染和地理可视化呈现,在本文中主要采用四种颜色表示其投诉的重要程度,其重要程度排序为红色>黄色>浅绿>深绿。其部分结果如图2所示。
图2 投诉预判可视化呈现
3 结束语
本系统利用电信大数据优势,提出一套运营商客户投诉的解决方案。该方案根据历史数据库进行客户投诉预判,利用实时数据寻找投诉热点并实现热点区域分级渲染。该系统上线后,可以实现高效、合理、快速的全网投诉分析。