APP下载

基于文本分析的运营商潜在升级投诉客户挖掘

2022-11-23张爱华于涵陈超雨

关键词:黑猫套餐运营商

张爱华,于涵,陈超雨

(北京邮电大学 经济管理学院,北京 100876)

一、引 言

随着信息化进程的不断加深,信息传播的超时空、高爆发和强裂变的特征进一步降低了消费者“越级投诉”和“媒介曝光”的成本,互联网和信息技术的发展也为消费者带来了新型舆论维权方式。消费者的服务需求和维权意识不断增强,一旦产生矛盾和纠纷,选择向监管部门直接投诉或运用互联网等广大媒介进行曝光等“零成本”“强聚焦”的维权行为来表达诉求、维护利益的客户群体与日俱增。对于服务型企业来说,通过提高服务质量来提高客户满意度,提高客户忠诚度就显得十分重要。提升服务质量可以减少客户投诉,而进行良好的投诉管理也是提升服务质量的一部分。因此,服务型企业要提高对客户投诉的重视程度,加强客户投诉预防和管理。

现有与客户投诉和投诉升级相关的研究大多采用企业和运营商数据,这部分数据大多为结构化数据,难以进行量化处理,且大多为话务员所填,准确性难以保证。在新浪微博(以下简称“微博”)上,人们可以以文字、图片等多种形式发表言论,这种简便的评论方式使其成为用户进行投诉的一个平台。黑猫投诉是新浪旗下的一个消费者服务平台,可以快速处理消费者的各种投诉内容。该平台包含大量的客户投诉信息,能够很好地为本研究提供客观数据。

本研究基于大数据和文本分析等技术,拟识别潜在升级投诉用户,获取这部分客户的投诉内容主题,从而使运营商对这部分客户进行安抚和挽回,并根据投诉主题改善相关服务,降低运营商被升级投诉的风险,改善运营商的客户投诉管理,由此提升运营商的服务质量,提高客户对运营商的服务的满意程度和忠诚度,提升企业效益。

二、文献回顾

互联网在不断地影响服务业的发展,越来越多的企业开始以客户为中心,实践互联网思维,重视客户的意见与建议。运营商拥有庞大的客户群,其客户响应中心每天产生以文本存储的、信息量巨大的客户投诉数据,这些都是客户对运营商最迫切的改进需求和服务要求[1];因此,对客户投诉内容进行全面具体的分析对运营商而言具有极强的现实意义。20世纪70年代,国外学者率先开展了对客户投诉行为的描述和影响因素的研究,随后,国内外学者对客户投诉的界定、分类、引起原因及处理方式等多个方面展开了激烈的讨论[2]。本文对客户投诉的相关研究范畴进行了梳理,结果如表1所示。

表1 客户投诉相关研究

此外,由于客户投诉管理对运营商的作用日益凸显,学者们逐渐采用数据挖掘、人工神经网络算法、相关性分析等方法对客户投诉数据进行分析及预测。如唐盛涛[1]3基于数据挖掘提出了一个适合运营商快速分析投诉的方法。此方法能够迅速分析处理运营商各渠道的用户投诉文本数据,通过投诉数据的挖掘结果来识别用户感知、提升客户的满意度,并降低用户投诉量和投诉率。王琴等[14]通过 python 编程,在离散的文本信息中精准定位客户投诉的热点,为企业降本增效提供帮助。祝好等[15]探究了如何通过人工神经网络算法对运营商的客户投诉进行智能分类,有助于运营商实现精准管理,推进服务体系智慧运营。对于运营商的业绩和口碑而言,除普通投诉客户外,升级投诉客户往往是更重要的群体。升级投诉是指客户在主观上对企业的产品和服务强烈不满,越过企业客服部门向上级部门、行业监管部门或者消费者协会进行的投诉。

目前,国外有关升级投诉的研究尚少,Ruusuvuori等[16]对医疗服务中的投诉情况进行研究后指出,患者对之前接受的治疗的抱怨可能会升级为对其他医疗服务提供者的抱怨。Silva等[17]对公交乘客投诉的前因进行研究后指出,运营商良好的客户关怀以及客户对运营商的信任会增加客户投诉的感知价值。Lee等[18]指出,消费者在社交媒体上的投诉会迅速将问题升级为公司的危机,并探究了公司参与度和消费者的内隐心态如何影响消费者投诉。研究发现,公司及时处理消费者的投诉会带来积极结果,即负面事件发展成危机的可能性会随之降低。

国内学者对于升级投诉的分析主要集中于潜在用户识别、预测模型优化、预防管理以及案例应用等方面。苏良良等[19]对大数据平台及客服系统进行数据融合,采用Word2Vec技术对投诉文本进行转化,建立潜在升越级投诉用户识别模型,得到了高风险升越级投诉用户清单。对于升级投诉预测模型准确率低的问题,吕景楠等[20]通过因果分析、功能分析及矛盾分析,应用裁剪、矛盾矩阵等创新工具对此问题进行解决并提供了详细的解决方案。张琳[21]对电信企业的升级投诉进行分析,并提出预防管理方案。赵燕等[22]采用基元事件对升级投诉案例从基元事件、责任人、问题表现、原因分析和改进措施五个层次进行分析,并根据基元事件提出了预防措施。

国内学者在对客户投诉进行分析时所采用的数据大多为运营商数据,而运营商数据大多是话务员所填写的内容,导致这部分数据具有很强的主观性,难以保障分析结果的准确性。运营商客户的投诉内容大多为非结构化数据,因此难以按照传统的量化分析方法对这部分数据进行分析总结。考虑到客户在社交平台上能够更加自然、真诚地表达内心的不满,本文拟选取新浪微博和黑猫投诉两个平台,爬取平台上与客户投诉和升级投诉相关的文本数据并进行量化处理,采用文本分析的方法挖掘运营商的潜在升级投诉客户。本文的研究以期填补升级投诉相关的研究空白,丰富现有与客户投诉相关的研究成果,为运营商更好地防控、管理和弥补客户投诉提供新思路和新方法,有效促进运营商服务绩效的提升。

三、研究设计

(一)数据爬取和预处理

本文采用八爪鱼采集器和后羿采集器进行数据收集,选取客户在黑猫投诉上对移动运营商的投诉文本数据作为升级投诉文本数据,选取客户在中国移动微博官号动态下的投诉数据作为普通投诉文本数据,并对数据结果进行中文文本分词和去停用词的预处理。

(二)文本向量化

目前,学者们普遍利用网络语言模型(network language model,NLM)、在NLM基础上优化的Word2vec模型以及Glove模型等对文本进行特征提取和扩充[23]。Word2Vec模型能够将文本中词语转换成词向量,对于情感分析、机器问答等自然语言处理问题十分适用,因此本文也采用该模型对投诉文本进行处理。

对于预处理后的文本数据,首先,通过Word2vec模型将数据转化为向量,即数值数据;其次,再利用处理后的数据训练Word2vec模型得到每个词语相对应的向量表达,即可以根据词的词向量求取句段的向量表达,得到每条投诉的向量表达和多条投诉汇总的向量表达。

(三)文本相似度计算

文本相似度能够很好地帮助研究者探究两个文本之间的关系。Trivison[24]在1987年率先在两篇被引和引用的期刊文章中通过对术语共现的测量来度量文本相似程度。1994年,Cronin[25]提出了分级引用和文档相似度的研究。国内学者也在前人研究的基础上提出了诸如文本属性重心剖分模型、BERT_BLSTM_TCNN模型、TCUSS算法等众多新颖的文本相似度计量方法[26-29]。

考虑到Word2vec能够很好地度量词与词之间的相似性,在Word2vec得出的词向量的基础上,笔者使用向量余弦相似度来计算普通投诉文本所对应的向量和升级投诉文本所对应的向量之间的相似度。通过定义向量余弦相似度函数,利用向量余弦相似度来判断向量化后的普通投诉文本和升级投诉文本之间的相似程度。笔者认为,相似度较高的普通投诉文本对应的客户为潜在升级投诉的客户。

(四)主题分析

隐含狄利克雷分布(latent Dirichlet allocation,LDA)模型最早由Blei等[30]在2002年的神经信息处理系统大会上提出,是一般化的概率性潜在语义索引(probabilistic latent semantic analysis,PLSI),非常适用于对文本信息进行主题分析。本文亦采用LDA模型进行主题分析。由于在预处理时已经对数据进行了中文文本分词和去停用词处理,在使用LDA模型时也就更加简单和快捷。在之前的中文文本分词、去停用词、使用余弦相似度筛选后结果的基础上,本文通过python来利用LDA模型对升级投诉文本进行主题分析。

四、实证研究

(一)数据来源和预处理

选取微博和黑猫投诉平台作为数据来源库,将黑猫投诉平台上对中国移动进行投诉的文本作为升级投诉文本,将微博平台上中国移动官方账号每条微博下的投诉评论文本作为待判定的投诉文本,即可能升级的投诉文本。

本研究利用八爪鱼采集器的模板对微博上的评论进行爬取。具体做法为:首先,通过微博官网的关键词搜索界面检索“中国移动”一词,界面中即会出现“中国移动”官方账号;其次,获取“中国移动”每条微博的地址,将地址输入模板中从而获得每条微博下的评论文本。由于微博只能显示搜索条件下最新的50页评论,本文按照一小时的时间跨度,通过python自动生成了一系列网址,借助八爪鱼采集器爬取涵盖时间和评论两个层面的文本信息。对爬取到的数据结果进行人工筛选后,最终得到1 560条投诉文本,时间为2020年10月1日到2021年3月31日。

利用后羿采集器对黑猫投诉平台上的相关投诉数据进行爬取。具体做法是:进入黑猫投诉平台官网,搜索“中国移动”一词,即可出现该平台上对中国移动的投诉文本109 594条;获取相应网址后使用“后羿采集器”爬取该网页上的投诉内容,最终爬取相关投诉数据4 600条。

采集文本数据后,对获取到的数据进行中文文本分词处理,并综合百度停用词表、哈工大停用词表、四川大学智能实验室停用词库以及中文停用词库四个停用词表,对文本内容进行去停用词预处理。

(二)文本向量化

黑猫投诉文本训练word2vec模型,当min_count=1时,得到的词向量总共有3 980个,部分截图如图1所示。

图1 黑猫投诉文本训练word2vec模型得到的部分向量(min_count=1)

微博投诉文本训练word2vec模型,当min_count=1时,得到的词向量总共有6 211个,部分截图如图2所示。

图2 微博投诉文本训练word2vec模型得到的部分向量(min_count=1)

(三)文本相似度计算

余弦相似度指的是通过计算两个向量值的夹角余弦值来评估它们的相似度。根据文本向量化得到的向量,通过对微博投诉文本的向量与黑猫投诉文本向量计算余弦相似度,在1 560条微博投诉文本中,相似度在(0~0.5)的文本有1 387条,相似度在(0.5~0.6)的投诉文本有149条,相似度超过0.6的只有24条,这24条数据如图3所示。

图3 文本相似度分布情况

从预测准确度上看,其中一条相似度高于60%的普通投诉文本所对应的用户,也在黑猫投诉平台上进行了升级投诉。

综合以上分析可知,通过对与升级投诉相似度较高的24条投诉文本进行总结分析,可以得到此类投诉主要集中在以下几个方面:客户对套餐的费用、流量、短信、话费等不满意;客户对客服不满意;客户对业务办理的过程不满意以及对线下宽带安装的服务、费用以及宽带的速度不满意。通过计算普通投诉和升级投诉文本向量的余弦相似度,能够识别可能进行升级投诉的潜在客户。运营商可以通过这种方式识别潜在客户并提前对这些客户进行安抚,及时处理这部分客户的投诉内容,防止投诉升级。

(四)主题分析

为了了解客户升级投诉主要集中的主题,从而有针对性地提升服务,本文对黑猫投诉平台的投诉文本,即升级投诉文本进行LDA主题分析,结果如表2所示。

表2 黑猫投诉文本主题

可以看到,黑猫投诉文本的主题集中于合约、套餐内容、业务办理、虚假信息以及套餐的办理和退订几个方面。由此可见,升级投诉集中在合约、套餐的流量费用、业务办理、可能接受虚假信息、套餐的退订等方面。综合以上结果可知,整体预测结果的准确度较高,具有较大的现实意义。

通过对高相似度的普通投诉文本的主题进行归纳总结,同时综合黑猫投诉主题分析结果得出,客户进行升级投诉的原因主要集中在以下方面:

第一,在合约方面,合约套餐指的是客户在运营商办理优惠业务,包括优惠购机、充话费送手机或换号送会员等业务时与运营商签订的手机消费套餐。当客户办理合约制的套餐时,由于合约具有一定期限,几个月或几年不等,客户必须在期限内按照合约内容履行合约。一般来说,客户不能解除合约,否则需要赔偿违约金。如果客户想要提前解除合约,则很难通过10086投诉或者普通投诉来解决问题,他们很可能选择12315热线或者黑猫投诉平台进行投诉。

第二,在套餐内容方面,当客户对套餐内的流量、通话时间或话费内容等感到不满,或者流量超过限额却没有获得运营商的及时提醒从而导致扣费时,客户就很可能进行升级投诉。客户对自身的权益十分重视,当他们的自身权益受到损害或者面临经济损失时,会通过升级投诉来维护自己的权益。

第三,在业务办理方面,由于部分业务无法在线上办理,客户必须亲自前往线下营业厅办理,这会导致客户指责运营商的服务不到位或业务设置不合理,因浪费了时间而进行升级投诉。此外,当客户认为10086客服或者线下营业厅的工作人员服务态度不好或业务办理水平低时,同样可能进行升级投诉。

第四,在虚假信息方面,客户有时会认为运营商虚假宣传。如客户出于信任购买了5G手机并办理了5G电话卡,但由于运营商过分夸大信号覆盖范围和强度,导致客户的实际使用与宣传内容不符。如信号强度并不是很好,客户体验较差,从而引起客户的强烈不满。客户会认为受到了欺骗并且自身利益受到损害,从而进行升级投诉。

第五,在宽带办理方面,运营商均会提供线下宽带办理业务,但是如果线下宽带安装工作者的工作态度不积极、不准时或者安装的宽带信号较差时,客户可能会选择升级投诉来维护自身权益。

五、结论与讨论

(一)研究结论

本文首先对微博平台投诉数据和黑猫平台投诉数据进行中文文本分词和去停用词处理;其次,使用预处理后的数据训练Word2vec模型,得到相应的微博投诉本文和黑猫投诉文本对应的向量表达;再次,使用向量的余弦相似度表示文本相似度,得到24条与升级投诉相似度在60%以上的微博投诉文本,并总结归纳出这部分投诉主要集中在套餐的话费流量、客服的服务、线下宽带的安装、线下营业厅和线上办理业务的过程等方面。除此之外,本文还使用LDA模型对黑猫投诉文本进行主题分析,得到升级投诉的主题集中在合约、套餐内容、业务办理、虚假信息、套餐的退订等方面。

基于本文结果,首先,移动运营商在日常的运营管理中应提高对客户投诉的关注程度,重视客户对话费流量、客服服务、业务办理等方面的要求,及时安抚客户并解决客户的投诉内容,避免客户进行升级投诉从而对运营商造成更大的危害;其次,运营商应特别注意客户升级投诉的核心内容,不断优化自身套餐和合约内容,提高业务办理水平,整治虚假宣传信息以提高客户满意度,尽可能避免投诉现象的发生。

(二)局限及展望

本研究存在一定的局限性。首先,在数据的获取方面,由于微博的博文较多,本研究提取的是微博上的客户评论,忽略了原创、转发、快转等其他类型的博文内容,这是因为在某种意义上,原创更能体现客户自身的观点和情感。但是也存在持自己观点进行转发评论的客户,因此投诉文本数据在获取上可能不够全面。未来研究可利用更高级的工具爬取涵盖原创、转发、快转等各类型数据,更加全面、具体地反映客户的投诉意愿。

其次,在判定潜在升级投诉客户方法的验证方面,本文使用相似度对普通投诉是否可能上升为升级投诉进行判断。由于在微博上收集到的数据有限,无法得知客户的真实姓名和电话号码,普通投诉的客户无法与升级投诉的客户相对应。未来研究应尽可能地获取客户的信息,以便更好地关联跨平台投诉的客户,展现客户从普通投诉到升级投诉的动态过程,挖掘潜在的升级投诉客户,为运营商提高日常服务质量提供帮助。

猜你喜欢

黑猫套餐运营商
《加什么不要钱》
黑猫钓鱼 边庆祝
黑猫白猫
儿童套餐
黑猫和蓝猫
取消“漫游费”只能等运营商“良心发现”?
婚姻是一份套餐
老了也要有尊严地吃饭 你家老人需要这套餐具吗
第一章 在腐败火上烤的三大运营商
三大运营商换帅不是一个简单的巧合