通信运营商客户投诉与故障发生的相关性分析
2017-09-29韩廷婷
韩廷婷
摘 要:进行客户投诉问题预测,采取相应措施及时解决是提高通信运营商服务质量的重要手段之一。提出一种基于相关性分析的客户投诉预测方法。客户投诉相关因素有多种,将软硬件故障因素作为重要因素,根据通信运营商提供的客户投诉数据与故障数据,利用机器学习中的相关性分析技术,建立客户投诉与故障发生的关系模型,进而构建基于故障的投诉预测模型,对潜在的客户投诉进行预测。分析表明,故障发生与投诉存在较强的相关关系,所以该方法可提高运营商服务质量。
关键词:客户投诉预测;软硬件故障;相关性分析
DOI:10.11907/rjdk.172222
中图分类号:TP391 文献标识码:A 文章编号:1672-7800(2017)009-0161-03
Abstract:Solveing the problems of customer complaints and taking corresponding measures to solve them in a timely manner, which is an important method to improve the service quality of communication operators. This paper proposes a prediction method of correlation analysis based on customer complaints. Customer complaints related to many factors, the hardware failure factors as an important factor, according to the customer complaint data and fault data provided by communications operators ,using the correlation analysis technique in machine learning, the relationship model of customer complaints and fault are given, and then construct the fault prediction model based on the complaint, to predict potential customers complaints. The analysis shows that there is a strong correlation between the failure and the complaint, so this method can improve the service quality of operators.
Key Words:customer complaint prediction; software and hardware fault; correlation analysis
0 引言
通信運营商客户多,投诉问题量大。妥善处理客户投诉问题,可提升客户的满意度、忠诚度,进而提升运营商效益。因此,对客户投诉数据进行分析具有重要意义和价值。文献[1]采用数据挖掘中的文本分析技术,对客户投诉数据的分析方法进行了研究,提高了用户体验。文献[2]利用某运营商4个月的本地投诉数据,采用情感评分、朴素贝叶斯分类算法进行投诉的倾向性识别,预测本地投诉客户未来进行越级投诉的概率大小,为运营商提供有价值的参考。文献[3]对投诉数据进行分类、词频统计分析,得到投诉热点问题、投诉等级等信息,从而为解决投诉问题指明方向。
以上方法主要利用客户投诉数据进行分析,而在运营过程中,除了产生大量的客户投诉数据外,还有一类非常重要的数据就是故障产生的相关数据。由经验可知,客户投诉与故障发生具有较强的相关关系。关于故障数据的分析,学者也作了研究。文献[4]和文献[5]对故障进行了分析,常见的故障包括基站硬件故障、基站软件故障、天馈系统故障等。文献[6]提出了智能化诊断方法。文献[7]和文献[8]采用数据挖掘的方法对客户投诉进行预测。统计相关性分析技术可根据事物特征对事物间的关联性[9]进行分析,探讨客户投诉与故障发生之间的关联性。本文利用相关性分析技术,给出客户投诉与故障发生之间的相关系数,根据故障发生的信息对客户投诉进行预测,使运营商对客户的投诉有预判,进而提高运营商的服务质量,提升竞争力。
1 客户投诉与故障发生数据分析
对个人客户投诉工单数据进行预处理,得到主要数据项,对投诉进行类别划分。对原因数据进行关键词提取,得到投诉与故障的文本数据。投诉类别数据和故障数据都是文本数据,而相关性分析模型的输入数据为数值型数据,首先要将文本数据量化为数值型数据,然后利用相关性分析模型,对投诉与故障的相互关系进行分析。
1.1 客户投诉数据
客户投诉数据包括工单流水号、投诉主题、投诉分类和问题原因等。工单流水号中包含投诉日期和时间信息,是投诉数据的唯一标识;主题和投诉分类数据项中体现了投诉的不同类别,包括不同层级类别;投诉问题的原因很多,包括故障引起的投诉,主要数据项的样例数据如表1所列。例如,工单流水号为“ID-056-20140930-00433”的投诉主题为“服务类→客户投诉→自有业务→WLAN→校园:CMCC-EDU→业务使用→有信号但无法使用”,投诉分类为“自有业务→WLAN→校园:CMCC-EDU→业务使用→有信号但无法使用”,问题原因为“网络原因→临时故障→自动恢复”,如表1所示。
1.2 客户投诉原因数据分析
客户投诉原因有很多种,以某运营商的6 083条客户投诉数据为例,不同的客户投诉类别、该类别的投诉数量及占总投诉量的比例如表2和表3所列。表2所列为非网络故障导致的客户投诉,表3所列为网络故障导致的客户投诉。将客户投诉的原因总结为非网络和网络故障原因两大类,本文将网络故障引起的客户投诉视为故障引起的投诉。endprint
从表2可以看出,非网络故障导致的投诉问题共有845例,占总投诉数量的13.89%,所占比例不大。从表3可以看出,网络故障导致的投诉问题共有5238例,占总投诉量的86.11%,所占比例较大。将表2和表3的数据对比可知,由非故障引起的投诉所占比例很小,大部分客户的投诉与网络故障有关系,本文在此基础上分析客户的投诉与网络故障间的相关关系。
在网络故障引起的投诉中,由覆盖盲点引起的投诉占总投诉数量的1/3,所以解决基站覆盖问题是减少投诉的办法之一,但该办法客观上存在难度,应从其它方面解决客户投诉。建立投诉数据与网络故障之间的关系模型,进而给出投诉的预测模型,运营商据此妥善处理客户投诉,从而实现更优服务。
1.3 数值化处理
由于客户投诉数据和故障数据都是采用文本数据,为利用相关分析模型,需要将文本数据数值化处理。本文采用自然语言处理领域中的词向量作为表达词语的数值型特征[10-11]。首先将客户投诉数据和故障數据进行分词处理,在已有的大规模语料上对神经网络模型进行训练,得到词语对应的词向量,采用Word2Vec工具实现。
2 分析模型
客户投诉与故障发生相关性分析指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关程度,是机器学习中常用的技术。将客户投诉数据记为x,x=(x1,…,xi,…,xn),故障数据记为y,y=(y1,…,yi,…,yn),其中n为客户投诉的总数量,1≤i≤n,xi∈R,yi∈R。根据基础统计学理论,设x的数学期望为μx,y的数学期望为μy,则x和y之间的相关系数如公式(1)所示。Corr(x,y)=∑ni=1(xi-μx)(yi-μy)∑ni=1(xi-μx)2∑ni=1(yi-μy)2
(1) 该相关系数也称为皮尔逊相关系数。公式(1)中的∑ni=1(xi-μx)(yi-μy)可理解为(xi-μx)和(yi-μy)的内积。∑ni=1(xi-μx)2为(xi-μx)的2范数,∑ni=1(yi-μy)2为(yi-μy)的2范数,由公式(1)可推导出公式(2):Corr(x,y)=∑ni=1(xi-μx)(yi-μy)∑ni=1(xi-μx)2∑ni=1(yi-μy)2=
‖x-μx‖2‖y-μy‖
(2) 从公式(2)可以看出,相关系数表达了两个变量之间的相关程度,该值在0~1之间。当相关系数为1时,二者具有最强的相关关系,意味着当有故障发生时一定会有客户投诉。当运营商已知网络故障数据y时,根据相关系数,就可预测出投诉情况。
3 结语
本文以提高运营商的服务质量为目标,详细分析并阐述了通信运营商提供的客户投诉数据与故障数据,给出客户投诉数据与故障数据具有较强相关性结论。利用机器学习中的相关性分析模型,给出相关系数。实际应用中,根据故障数据和相关系数,可实现对潜在的客户投诉进行预测,提高了运营商的服务质量和竞争力。
参考文献:
[1] 唐盛涛.基于数据挖掘的运营商客户投诉分析方法研究[J].互联网天地,2016(3):53-55.
[2] 方环.文本分类在运营商客户投诉倾向性预测中的应用研究[D].广州:暨南大学,2016.
[3] 李莺.运营商投诉行为的大数据分析及应用[J].通信企业管理,2016(10):67-69.
[4] 张伟伟.VoLTE通话中的单通和断续故障分析[J].电信网技术,2015(11):78-83.
[5] 谭卫东.TD—SCDMA系统基站故障诊断与排除研究[J].硅谷,2013(6):67-68.
[6] 岳丹阳.移动通信客户投诉的智能诊断方法研究[J].中国新通信,2016(17):1-3.
[7] 魏红明.基于数据挖掘的移动通信客户投诉预测模型研究[D].衡阳:南华大学,2009.
[8] 韩雪雪.基于数据挖掘的移动通信业终端营销活动客户拆包预测研究[D].昆明:昆明理工大学,2014.
[9] 樊嵘,孟大志,徐大舜.统计相关性分析方法研究进展[J].数学建模及其应用,2014,3(1):123-126.
[10] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[M]. Computer Science, 2013.
[11] MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[J]. Advances in Neural Information Processing Systems, 2013(26):3111-3119.
(责任编辑:杜能钢)endprint