APP下载

基于数据挖掘的运营商客户投诉分析方法研究

2018-10-21杨孟金陈建

名城绘 2018年12期
关键词:文本挖掘数据挖掘运营商

杨孟金 陈建

摘要:运营商对于用户的投诉理解不全面, 无法准确地从投诉数据中获取用户的痛点和需求, 运营商迫切需要一个针对用户投诉数据进行快速提取和分析的方法, 对用户的需求进行灵活和高效的响应。

关键词:数据挖掘;文本挖掘;投诉分析;运营商

1 运营商客户投诉信息处理的难点

运营商现有的投诉跟踪体系中, 用户的投诉信息和数据可从多渠道获取,如网上营业厅、掌上营业厅、呼叫中心、社交网络等,并且主要以文本形式和录音形式进行存储, 运营商的客户服务部门和客户响应中心根据每月投诉类型节点的数量, 确定投诉分析的范围,主要通过投诉工单、呼叫中心录音重听等抽样调研的方式进行分析, 分析的准确性和全面性不足;另外,投诉录音无法智能,而投诉文本记录是以中文文本的方式进行存储的, 均为非结构化信息,无法直接进行分析。

2 数据挖掘方法的思路与可行性

文本挖掘(Text Mining)是对自然语言文本中所包含的数据进行分析的一种数据挖掘方法, 文本挖掘技术本身由机器学习、语言学统计、自然语言处理等多种技术结合而成,应用在投诉分析中,可以快速、 高效地对中文文本进行自动化的处理和分析,主要思路介绍如下。

(1)投诉数据获取

从投诉数据的来源看,除了录音信息外,其他的投诉数据均为中文文本数据,网上营业厅、掌上营业厅和呼叫中心的投诉数据均存储在运营商自建信息系统的数据库中,社交网络的投诉数据可以通过 API 抓取,数据的可获得性较好。

(2)投诉数据预处理

中文文本挖掘的难点之一在于机器对中文自然语言的处理,中文语法的复杂性、多义性一直是制约中文文本挖掘技术发展的主要瓶颈之一。 随着中文自然语言处理技术的不断发展,出现了多个较为成熟的中文分词开源项目,中文分词的准确性和合理性得到了较好的保障。

(3)投诉数据处理

对经过预处理的投诉数据进行建模分析,如词 频 统 计、投 诉 聚 类 分 析、主题模型分析等一系列知识挖掘处理,自 动 化 地 处 理 投 诉 数 据 ,并 输出 结 果。

(4)基于文本挖掘的对策与建议

根据投诉数据处理结果,确定用户投诉的热点与需求,将结果快速反馈给相关部门,对问题业务进行优化,提升用户满意度和客户感知。从数据投诉分析的思路上看,现有的条件和技术已基本可以满足客户投诉分析的自动化和智能化分析要求,基于运营商现有的技术架构和投诉处理思路,本文设计了如下基于数据挖掘的客户投诉分析流程,如图 1 所示。

3 基于数据挖掘的客户投诉分析

(1)投诉数据仓库整合

从运营商现有的数据获取情况看,用户的投诉数据在多个业务系统中与官方运营的社交网络账户中均可获取,但是未经过整合。 可以通过数据接口,建立统一投诉数据仓库的方法将各业务系统中和分散在 Web 侧的投诉数据进行整合,全面监测用户投诉情况。

(2)投诉数据预处理

统一存储在投诉数据仓库中的业务数据需要进行分析前的预处理,因为各个业务数据存储的中文文本信息各有特点,存在部分干扰。

(3)投诉数据中文分词

中文文本挖掘与英文文本挖掘的重要区别在于:英文单词之间分割拥有天然优势,单词之间有空格分割,但是中文单词无法直接进行分析。 随着中文分词技术的发展,现在已经有较为成熟的中文分词工具,如中国科学院计算所的 ICTCLAS 商用分词工具、 基于 Lucene 开源项目的 IKAnalyzer 等,分词效果已经较好,支持细粒度和智能分词等多种单词切分模式。 此类分词工具可便捷地对原文本进行过滤(标点符号、语气词、数字、字母等),提供用户自定义词库和消去停用词,便于应用行业词典和投诉业务专用词典。 行业词典和投诉业务专用词典需要对数据进行分析后自行建立。

(4)投诉分析

投诉分析使用经过分词的投诉文本语料,比较常用的分析方法有词频统计、通过支持向量机进行机器识别最终实现投诉自动分类识别、利用主题模型进行文本挖掘。 比较成熟的工具有 Libsvm 工具包、 商业数据挖掘软件 SPSS Modeler 的 text mining模块、R 语言的 tm 文本挖掘工具包、Stanford 大学的 Text Mining Toolbox 工具等, 通过此类成熟的文本挖掘工具,对客户投诉问题进行合理有效的分析和分类。

(5)结果输出和策略建议

根据上述文本挖掘工具的分析, 可以快速获取用户热点投诉关键词、热 点 投 诉 主 题 等 ,帮 助投诉分析人员快速定位业务投诉的问题所在,发现服务问题与短板,将发现的问题快速反馈给相应的业务部门和系统支撑部门, 及 时 解 决 问 题,提 升 用 户 感 知,节省大量的投诉分析时间和人力成本。

4 结束语

基于数据挖掘提出了一个适合运营商进行快速投诉分析的方法,利用成熟的文本挖掘技术方法和文本挖掘工具, 开展投诉文本数据挖掘分析工作,可以对运营商各渠道的用户投诉文本数据实现快速、科学、高效的分析处理,利用对投诉数据的挖掘结果提升用户感知,提升客户满意度,降低用户投诉量和投诉率, 建立投诉分析快速响应机制,减轻运营商的投诉分析压力。

参考文献:

[1]张文彤, 钟云飞. IBM SPSS 数据分析与挖掘实战案例精粹[M].北京: 清华大学出版社, 2013.

[2]黄昌 宁, 赵海. 中文分詞十年回顾[J]. 中 文 信 息 学 报, 2007,21(3):8-19.

[3]吴其叶. 科技查新的查准度和查全度与文献检索的查全率和查准率的差异[J]. 现代情报, 2003, 23(9):8-9.

(作者单位:南京擎天科技有限公司)

猜你喜欢

文本挖掘数据挖掘运营商
一张图看三运营商政企业务
微评
数据挖掘综述
软件工程领域中的异常数据挖掘算法
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
从《远程教育》35年载文看远程教育研究趋势
基于R的医学大数据挖掘系统研究
慧眼识璞玉,妙手炼浑金
运营商们的4G时代—急需向消费者证明自己