APP下载

基于客户感知的端到端客服智能监控技术研究

2018-08-03王璞

江苏通信 2018年2期
关键词:调用成功率监控

王璞

墨尔本大学

0 引言

进入移动互联网时代,电信运营商服务的终极目标是满足客户的需求,一切不注重客户感知的产品将在激烈的竞争和飞速的发展中遭遇迅速淘汰,因此,运营商的客户服务需要加强对客户感知的细致洞察,主动为客户提供精准的服务,实现客服运营智慧化。

长期以来,运营商的客服体系存在着以下三大问题,这三大问题妨碍了客户感知的获取,也影响了客户服务质量:

(1)服务质量监测指标多基于服务提供方这一端收集的数据,而缺少基于客户感知的指标评价,业务指标客户化不足;

(2)缺失全过程指标牵引修正,出现问题多为脉冲式整改,效率较低;

(3)缺失端到端服务运营监测体系,多为分段式、局部处理,端到端运营质量保障不足。

为解决上述问题,电信运营商应立足于“客户导向”、“问题导向”、“能力导向”,构建基于客户感知的端到端服务运营智能监控体系,从而实现从被动处理到主动牵引修正、从分段管控到端到端智能监控的两个转变,提高客户服务运营和管理水平,提高客户的忠诚度和满意度,提升服务竞争力。

1 体系构建

基于客户感知的端到端服务运营监控体系,就是站在客户感知的角度,对客户服务质量进行监测。为构建该体系,需要建立多渠道、全过程、高协同、强监控的管理平台,实现对监控指标进行自动采集、汇总、监控、分析,为各级公司提供基于客户感知的端到端的服务过程管控、指标监测、数据分析。

1.1 分析业务场景

目前,运营商多以系统侧统计的数据来评价客户服务质量,在实际场景中,常常与客户实际感知的服务质量不符。并且,系统侧数据有时不能覆盖端到端服务全程,局部数据的缺失会影响问题解决的效率和质量,进而影响总体的客服质量。

以常见的场景为例,用户在线上订购流量包,某月系统侧统计线上流量包订购成功率高达99.98%,而从客户侧获知的成功率仅为90%左右。用户可通过多种渠道为手机充值,而系统侧只能采集到部分渠道充值的成功率为97.3%,而对通过其他方式进行充值的成功率没有统计数据。用户开通了流量提醒服务,用户感知的历时包含从上网结束到收到流量提醒短信全程,而运营商仅关注系统侧的局部历时。

1.2 确定监控体系

建立起基于客户感知的端到端服务运营监控体系,可运用于多个服务场景,通过对服务场景中的指标进行全过程监测以提升业务体验,体系设计如下:

(1)二级监控:集团级监控与省级监控相结合,两者各有侧重,部分集团级监控取数于省级监控,本文着重研究省级监控。

(2)四级运营:监控体系可以为集团、省、地市、区县四级提供基于客户感知的服务指标。

(3)七类场景:指标关注服务全程,指标覆盖办理开通类、充值缴费类、安装维修类、使用感知类、提醒关怀类、触点感知类、投诉处理类这7类端到端服务重点场景,初期明确流量包线上订购成功率、移动业务缴费复机及时率、流量使用提醒短信送达及时率等14项指标,体系建成后可以根据情况增删具体指标。

(4)四类操作:监控指标异常分为通知(实时干预)、提醒(指标波动)、预警(指标恶化)、督办(风险超标)这4级,对应不同操作,实现早发现、早介入、早解决。

(5)两个采集点:为确保监控指标准确性,数据至少要来源于2个数据采集点。

1.3 明确监控策略

明确每一项监控指标的定义、管控值、预警方案和统计方案。以流量包线上订购成功率指标为例:

指标定义:统计期内,在网掌厅订购流量包的订单中,线上订购时间小于等于5min的成功订单的占比;

管控值:85%,即流量包线上5min订购成功率=流量包线上5min订购成功量÷流量包线上订单总量×100% ≥ 85%;

预警方案:当日2小时成功率低于管控值,系统发送通知至具体责任人;前1日成功率低于管控值,系统发送提醒至具体责任人和省客服责任人;连续3日成功率低于管控值,系统发送预警至部门主管和客服部门主管;连续5日成功率低于管控值,系统发送督办至相关部门领导和客服部门领导。

统计方案:支持省、市统计,支持按小时、日、月、周统计,支持分订购渠道统计等。

2 技术实现

2.1系统整体功能架构

端到端运营监控体系的总体功能架构如图1所示,业务功能主要包括总体视图、指标看板、报表清单、预警监控、预警看板五大部分,并有监控中心、操作中心、日志中心、配置中心、知识库中心五个基础应用中心,数据通过分布式大数据处理平台进行采集并经过基础应用中心进行处理后,通过监控视图进行智能呈现,实现平台的业务功能。收集的数据来源主要为基础设置设备的性能告警和资源配置、软件系统的系统日志和调用信息,以及业务信息。

图1 端到端运营监控体系的总体功能架构图

2.2 关键技术应用

(1)分布式大数据流处理

为实现系统资源主动预警、故障问题精准定位、解决方案智慧推荐、处理工具便捷易用,实现IT运营质量即时掌握,需生成每个业务场景的IT服务资源树。IT服务资源树是对业务全流程横向展现和流程环节所涉及的IT系统资源拓扑展现的全视图,是一横多纵形式的资源树视图,是可以根据业务订单实例进行追踪的视图,且应用软件进行自动化生成。

因此,除被监控的14项监控指标需进行数据采集以外,还需采集大量源系统产生的数据。采集数据要慎重,不能影响生产系统,且越少越好。在此情况下,应用分布式的大数据流处理方案,用于对大量数据的采集、清理、加工和关联。

端到端运营监控体系的总体技术架构如图2所示,该体系应用分布式技术,每个节点都具有高度自治的特征,节点之间彼此可以自由连接,形成新的连接单元,提高了系统的稳定性和安全性。此外,在数据处理方面,采用大数据应用,为系统获得更为深刻、全面的洞察能力提供了技术支持。

图2 端到端运营监控体系的总体技术架构

数据处理整体系统采用Apache基金会所开发的分布式系统基础架构Hadoop,其最底部的HDFSHadoop 集群中所有存储节点上的文件。

MySQL,Hbase和Redis均为数据库,MySQL为关系型数据库,可存储小型数据;Hbase为基于列的分布式存储系统,适合于非结构化数据存储;Redis为基于内存的高性能keyvalue数据库,可以存储大型数据。

Elastic Search为基于Lucene的搜索服务器,提供了一个分布式多用户能力的全文搜索引擎,是当前流行的企业搜索引擎,当系统通过不同字段查看业务具体信息的时候将发挥作用。

MapReduce和Spark Streaming是数据处理的核心,MapReduce用于大规模数据集的并行运算,Spark Streaming可以实现高吞吐量、具备容错机制的实时流数据处理,从数据源获取数据之后,可以使用诸如map、reduce、join和window等高级函数进行复杂算法的处理。

YARN(Yet Another Resource Negotiator) 是 一 种 新 的Hadoop资源管理器,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

在集群监控与安全部分包含Zookeeper, Ambari和Kerberos三个组件。其中ZooKeeper是一个分布式应用程序协调服务软件,为分布式应用提供一致性服务。Ambari作用就是创建、管理、监视Hadoop的集群。Kerberos是一种网络认证协议,其目标是通过密钥系统应用程序提供强大的认证服务,为系统安全提供保障。

(2)数据实时采集与调用链技术

大量源系统数据连续不断地生成,数据的实时采集尤为重要,调用链技术是端到端运营监控系统中的关键技术。调用链监控的核心工作是数据的生成,即对整个调用过程的所有应用进行埋点并输出日志,应用无侵入式的pinpoint跟踪分布式应用之间的调用来提供解决方案,以帮助分析系统的总体结构和内部模块之间如何相互联系。

对于具备改造能力的源系统,先按照集团要求进行改造,直接生成服务调用链日志(调用信息、服务信息、业务信息)。传给省前置平台的kafka服务器,再通过接口机上传至集团前置平台。对于不具备改造能力的系统,将业务信息传给端到端平台,同时在平台服务器上引入端到端的采集包,采集系统内的调用链信息,由端到端系统拼接业务与调用信息,形成该平台的服务调用链日志,再整合整个场景的调用链,完成统一的服务调用链日志。

采用调用链技术,掌握数据的来源、流向及变化,提供了高质量、可追溯的实时数据,可以准确掌握一线应用部署情况。

3 结束语

该体系建成后,业务功能主要包括总体视图、指标看板、报表清单、预警监控、预警看板五大部分。管理人员可以在总体视图中看到区域的总体评价和区域重点指标日的评价,可通过指标看板查看关键数据的详细展示,可自定义查询条件进行查看各类指标报表,并通过预警监控和预警看板监测服务过程中的重点指标,发现并解决问题。

可以预见,构建基于客户感知的端到端服务运营智能监控体系,能大大改善现阶段集团在客户服务方面存在的不足,进一步提升用户需求洞察能力和渠道运营能力,从而为用户提供全流程的优质服务体验。

猜你喜欢

调用成功率监控
成功率超70%!一张冬棚赚40万~50万元,罗氏沼虾今年将有多火?
The Great Barrier Reef shows coral comeback
如何提高试管婴儿成功率
核电项目物项调用管理的应用研究
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
系统虚拟化环境下客户机系统调用信息捕获与分析①
如何提高试管婴儿成功率
PDCA循环法在多重耐药菌感染监控中的应用
研究发现:面试排第四,成功率最高等4则