APP下载

如何解决客服系统接听失败问题

2016-11-26

网络安全和信息化 2016年9期
关键词:座机空闲客服

业务系统故障往往不一定是网络或者应用单一的问题,存在一类或多类故障并存的可能。某些故障则是业务系统和网络设备工作机制冲突导致的。

问题描述

某航空公司华南客服中心,客服人员使用客服系统接电话时经常出现接听失败的现象,由于客服服务器位于北京数据中心,中间涉及的网络设备较多,一直未能定位到故障原因。

故障现象

如图1拓扑所示,每个客服人员桌面都会有一台电脑跟电话机,一天中会出现几次偶发故障,故障发生时,用电脑上的客服软件接听用户电话失败,如果及时改用座机接听则可成功,我们用科来网络回溯分析系统在华南客服中心广域网出口抓包分析:

故障规律摸索

客服人员可以用电脑和座机接听电话,电脑接听电话失败时,改用座机可以成功接听。

规律分析:电脑与座机是连接同一个hub上,座机可以成功接听电话说明网络连接正常,需要从电脑客服软件的角度分析问题。

故障发生时间段主要集中在午休后及凌晨时段,重置电脑的客服软件后也能恢复正常。

规律分析:这两个时间段的特点就是接听的电话数量比较少,很可能是空闲时间太长,电脑客服软件某些连接被中断了。

分析过程

排障思路

图1

图2

图3

图4

重现故障,使用科来网络回溯分析系统将客服电脑与北京服务器之间的通信流量进行回溯、分析,寻找故障原因。

故障重现

在深圳客服中心寻找一台客服电脑,首先验证该客服电脑、座机都能正常接听电话;然后从16:12开始闲置该客服电脑,超过半个小时候,16:48再拨打该客户座机,接听失败,故障成功重现。

IP会话分析(如图2)

客 服 电 脑 的IP为XX.XX.22.21,与北京的两台服务器有通信流量,分别是:

XX.XX.176.51,经确认为客服软件界面的服务器

XX.XX.203.155,经确认为客服软件控制插件的服务器

软件界面连接分析

从客服电脑XX.XX.22.21与服务器XX.XX.176.51通信的TCP几乎时序图可以看到(如图3),两者采用了长连接的机制,在空闲的时间,客户端每隔几秒钟就会发送一个GET的请求与服务器保持连接。

从 16:12分至 16:48分,每个6分钟客户端与服务器就跟新一次TCP连接,未曾中断过(如图4),因此软件界面一直能够正常显示。

控制插件连接分析

从客服电脑XX.XX.22.21与服务器XX.XX.203.155在16:12分至16:48期间只有3对TCP连接一直保持(如图5),如果这三对TCP连接没有采用长连接的传输机制,很可能会因为空闲太长时间而被网络中的防火墙等设备中断连接。

果然,客户端在空闲的2090秒(34分钟)的时间内没有发送任何保持连接的数据包(如图6),等到客服电脑重新发起接听电话请求的时候,客户端的请求已经无法到达服务器端,一直在发起重传的请求,最后客服人员看到请求超时的告警提示。

故障原因分析

大部分防火墙都会将空闲时间超过30分钟的TCP连接断开,而控制进程在空闲的34分钟内没有采用长连接机制保持连接,所以被防火墙中断了,再有电话接入的时候便会出现接听失败的现象。

图5

图6

解决问题建议

修改防火墙的策略:增长访问北京XX.XX.203.155的TCP连接的空闲时间。

(注:该策略实施后,偶发故障出现的次数明显下降)

优化客服控制插件程序设置,能从根本上解决问题。

价值

客户通过检测防火墙规则、长Ping网络进行检测,并未发现异常,在服务器中也未发现告警信息,难以确定问题的原因。

通过网络分析技术可以迅速还原网络中的每一个TCP会话,通过图形化界面就能够快速找到问题为程序并未进行定时保活,防火墙超时关闭会话导致,很快就帮助用户解决了困扰已久的问题。

成都科来软件有限公司

电话:400-6869-069 010-82601814

网址:www.colasoft.com.cn

论坛:www.csna.cn

猜你喜欢

座机空闲客服
语音推销
“鸟”字谜
西湾村采风
彪悍的“宠”生,不需要解释
敬业的客服
找手机
打电话
WLAN和LTE交通规则
基于广东“一张网”对内客服模式的探讨
销售能手