APP下载

中国移动集客业务质量评估与感知分析

2018-10-16李宝磊

电信工程技术与标准化 2018年10期
关键词:时延链路客户

李宝磊

(中国移动通信集团公司,北京 100032)

集客业务作为典型的多线条、长流程业务,是当前各大运营商竞争的焦点。在用户体验需求逐步提高的新形势下,传统的运维手段已不能有效获取端到端业务感知。如何从性能入手,解决运维保障难点,提升支撑效率和网络质量,成为集客业务支撑的新课题。

传统的集客质量评估主要依靠客户投诉、拨测和网管性能报表等,存在以下问题。

(1)投诉难以主动发现,严重影响用户感知:经部分省公司调研统计发现,集客业务约有一半的故障投诉无法通过告警发现,只能“事后救火”。

(2)问题定位排查难:集客业务混合组网、流程长、缺乏问题关联定位手段,对协同定位的要求较高,比较复杂。

(3)发现问题不全面:物联网、IDC等新业务新应用缺少保障手段,需要依托性能管理。部分重点客户要求对其业务进行流量、业务可用性等性能监控。

以上诸多难点造成对集客用户质量把控困难。长此以往,我们在集客领域必将被早已领先多年的竞争对手甩开,导致差距越来越大。为此我们梳理集客业务的网络架构和业务流程,对用户侧、接入侧、传输侧和网络侧分别设计制定质量评估指标体系,对重点专线开展多数据源关联和端到端质差问题定位方法研究。新的评估体系全面客观地反应系统的性能,使质量评估更加完整、及时、准确,问题得到更充分的显现。

1 集客业务网络架构和业务流程

1.1 互联网专线

互联网专线的目标客户定位于有互联网接入需求的大中型企业客户,利用中国移动CMNet城域网,为用户提供2 Mbit/s~10 Gbit/s速率的带宽独享互联网接入服务,满足用户浏览网页、收发邮件等互联网访问和应用需求。业务形态包括普通互联网专线、BGP专线、自带IP地址接入。能够独享带宽,提供带宽保障;提供多种带宽选择,满足用户各种带宽需求;为用户分配多个固定IP地址,满足用户静态IP地址需求等特点。此外,可为客户叠加网络安全业务(防DDoS攻击),尤其对于金融类客户,以及流量管理业务等增值业务。

1.2 短彩信专线

短彩信专线具体又分为短信和彩信两种子类别,由于短信和彩信两者之间组网方式上存在着明显差异,因此分开阐述。

短信业务:可以通过短信群发方式,提供企事业单位内部办公信息的传递、营销服务信息的发布、客户需求收集、意见反馈等服务。也可按照客户需求进行定制化开发,如配合企事业单位的办公管理、业务经营、生产控制的需求,自动发送定制的短信。

彩信业务:可以通过彩信群发方式,提供企事业单位内部办公信息的传递、营销服务信息的发布、客户需求收集、意见反馈等服务。也可按照客户需求进行定制化开发,如配合企事业单位的办公管理、业务经营、生产控制的需求,自动发送定制的彩信。

1.3 数据专线

数据专线业务是一种直接在传输网上提供数字信号传送的业务,是依托中国移动传输网络资源,向客户提供点到点或点到多点的安全、可靠、高速的专用数据通道环境,客户可以选择多种带宽通道及多种接口类型,包括 2 Mbit/s、155 Mbit/s、622 Mbit/s、2.5 Gbit/s等TDM信号,或者是10 Mbit/s、100 Mbit/s、1 000 Mbit/s等以太网信号,甚至更高,可承载语音、数据、视频等各类业务,实现中心节点到分支机构的连接,或者数据中心/灾备中心之间的连接。同时为用户提供数字电路、光纤等电路的租用和维护服务。

数据专线业务将有内部组网需求的大中型企业客户定位为目标客户。利用移动传输网,为用户提供2Mbit/s及以上速率的数字专用电路,为用户提供省内、跨省或者国际间的组网链路服务,以满足客户多媒体通信和组建高速计算机通信网的需要。客户可以利用数字电路专线组建点到点、点到多点及点到网的语音、数据及图像传输网络。

1.4 MPLS VPN专线

MPLS VPN业务构建于中国移动IP承载网络(CMNet或IP专网)之上,采用多协议标签交换(MPLS)技术,为客户提供具有质量保证、安全保证的客户内部专网,实现客户多个跨境分支机构之间内部数据、语音、图像等多种业务通信的服务。

MPLS VPN业务定位于有内部组网需求的大中型企业客户,利用移动的IP网络,为企业用户提供私有数据传输通道。结合服务质量保证,为用户提供组网链路服务,为用户构建点到点,点到多点,点到网的企业内部专用网络。MPLS是多协议标签交换,CE是用户网络边缘设备,PE是运营商网络边缘路由器,P路由器是运营商骨干路由器。MPLS VPN业务由IP网络承载,通过MPLS技术实现各分支机构互联。对不同业务使用不同标签,区分服务质量,保证质量要求高的业务的可用性。

MPLS VPN业务采用公网承载虚拟专网,价格相对跨省传输专线低廉。业务类型分为省内、跨省和国际业务。由于国际业务目前网络条件不成熟,省内业务价格相对较高,跨省业务具备比较价格优势。

1.5 APN专线

APN专线业务是以中国移动现有的无线网络为物理承载,通过隧道加密的VPN方式访问用户本地服务器的一种业务,它可以给用户提供“任何时候、任何地方”通过无线方式方便、安全的访问用户机房侧的服务器。GGSN到用户本地服务器的连接也可采用物理专线方式实现,相关指标参照互联网专线业务。

1.6 语音专线

语音专线业务是通过移动自有传输网络将客户接入到中国移动通信网络,为客户提供语音等服务的专线解决方案。语音专线主要由3部分组成,包括核心网部分、移动接入网络和接入设备。

中国移动核心网目前提供话音服务的网络主要由CS域和CM-IMS域实现。CS域指核心网中为用户业务提供电路交换类型连接的所有网元实体,以及所有支持相关信令的网元实体,主要面对对象为移动接入用户。IMS是一种基于SIP的开放式系统架构,中国移动在IMS国际标准的基础上提出了CM-IMS,CM-IMS网络支持固定接入、移动接入、互联网接入等多种接入方式。

从城域网络来看,接入设备既可通过城域传送网(MSTP/PTN)接入中国移动核心网,也可以通过城域数据网接入中国移动核心网。目前在CS域网络中,接入设备主要为小型交换机(PBX)设备;在CM-IMS网络中,接入设备包括PBX、 SIP-GW、IAD和AG设备,分别适用于不同的企业场景。

2 集客业务质量评估指标设计

集客业务种类较多、业务之间横向跨度大,每一类业务都有自己独特的评估体系,但是综合起来可以从网络层、业务层和面向客户3个维度进行考核。网络层指标关注承载集客业务的网络层设备性能,反应了集客业务传输过程中各节点设备的传输性能。业务层主要关注用户使用专线过程中的感知问题,如网页浏览、视频和游戏业务等。面向客户主要关注用户实际使用中的问题,如开通及时率、回访满意度等。集客业务的网络层指标和业务层指标用于内部进行集客业务运行和服务质量分析管理,便于推动集客业务运行质量评估、管控工作,集客业务的面向客户指标可作为与客户商议、签署SLA时的参考。网络层指标设计如下。

(1)CMNet省网链路利用率:CMNet省网各出口上行带宽峰值利用率,CMNet省网链路利用率=CMNet省网重要链路峰值流量/链路总带宽,数据来自综合数据网管。

(2)省网核心测试时延/分组丢失率:BRAS至省网核心网络时延、分组丢失率,CMNet省网核心测试质量=BRAS至省网核心网络时延 OR BRAS至省网核心分组丢失率,数据来自互联网端到端质量管理平台。

(3)外省IDC测试时延/分组丢失率:省网核心至外省IDC网络时延、分组丢失率,外省IDC测试质量=省网核心至外省IDC网络时延或分组丢失率,数据来自互联网端到端质量管理平台。

(4)网间测试时延/分组丢失率:省网核心至网外网络时延、分组丢失率,网间访问测试质量=省网核心至外省IDC网络时延或分组丢失率,数据来自互联网端到端质量管理平台。

(5)城域网链路时延/分组丢失率:各地市城域网汇聚设备至地市核心链路的时延、分组丢失率,各地市城域网汇聚设备至地市核心链路Ping测时延均值;各地市城域网汇聚设备至地市核心链路分组丢失率。数据来自综合数据网管。

(6)IP城域网链路利用率:全省/地市IP城域网重要链路带宽峰值利用率(汇聚交换机、BRAS上联),IP城域网链路利用率=汇聚交换机、BRAS上联链路峰值流量/总带宽,数据来自综合网管。

(7)OLT链路利用率:OLT上、下联链路带宽峰值利用率,OLT链路利用率=Max(OLT上联链路峰值流量/OLT上联带宽,OLT下联链路峰值流量/OLT下联带宽),数据来自传输性能网管。

业务层指标设计如下。

(1)网页打开时长:用户提取目标网站网页内容的时延指标;仿真Web浏览器,向指定测试目标地址发起get请求时间t0,在超时时间Te内收到网页内容最后1个数据分组时间t2,计算页面提取时长为(t2-t0),向指定测试网站发起测试时间t0,收到全部页面内容最后一个数据分组时间t2,计算网页打开时长=t2-t0。数据来自普天拨测系统。

(2)网页打开成功率:用户到目标网站页面打开成功率指标; 仿真Web浏览器,向指定测试网站发起测试,在超时时间Te内收到全部页面内容即为网页打开成功,用网页打开成功次数除以测试次数,计算网页打开成功率,网页打开成功率=在规定时间内网页打开成功次数/页面请求次数。数据来自普天拨测系统。

(3)视频首帧显示时长:客户端到热点在线网站之间的连接时间指标,以30 min为测试周期,每10 min测试1次,计算连接时间。播放时延超过30 s后,认为连接失败。需测试具有典型性的多个RTP/RTCP服务(如优酷视频、土豆视频、新浪播客、迅雷在线播放),数据来自普天拨测系统。

(4)视频缓冲比:统计从视频首帧开始播放到播放结束中间停顿的每次时长总和与播放时长的比值,视频缓冲比=视频播放卡顿时间总和/播放时长总和,数据来自普天拨测系统。

(5)弱光比:本指标统计数据专线中存在弱光的比例,存在弱光的数据专线总数/本指标统计数据专线总数,数据来自传输网管。

(6)误码比:本指标统计数据专线中存在误码的比例,存在误码的数据专线总数/本指标统计数据专线总数,数据来自传输网管。

(7)注册成功率:本指标统计IMS电话的注册成功率,IMS注册成功的次数/IMS注册的总次数×100%,数据来自话务网管。

(8)端到端下发成功率:在统计时间周期内,单个EC接收的成功的状态报告量占单个EC的MT总量的比率,在统计时间周期内,[客户接收的成功的状态报告次数(MT,不含重发)]/[客户提交短信次数(MT,不含重发)]×100%,数据来自话务网管。

(9)APN PDP激活成功率:在统计时间周期内,APN专线的终端发起的专用APN PDP上下文激活请求消息(Activate PDP Context Request)后,获得PDP上下文激活请求成功应答的情况。所有终端激活请求成功次数/总激活请求数×100%。数据来自话务网管。

面向客户服务指标设计如下。

(1)开通平均时长:本指标统计周期内专线的平均开通时长,∑各专线开通时长/开通专线条数,数据来自综合资源系统。

(2)开通及时率:本指标统计周期内及时开通的专线占比,及时开通的客户专线数/开通的客户专线总数×100%,数据来自综合资源系统。

(3)投诉率:本指标统计周期内相关业务投诉比例,集客专线投诉数/集客专线总数×100%,数据来自EMOS工单系统。

(4)投诉处理及时率:本指标统计周期内及时处理的专线投诉占比,及时维护的集客专线投诉工单数量/集客专线投诉工单总数,数据来自EMOS工单系统。

(5)故障率:本指标统计周期内相关业务产生故障告警的比例,集客专线故障工单数/集客专线总数×100%,数据来自EMOS工单系统。

(6)故障处理及时率:本指标统计周期内及时处理的专线故障告警占比,及时维护的集客专线故障工单数量/集客专线故障工单总数,数据来自EMOS工单系统。

(7)专线维护回访满意度:本指标统计周期内维护回访满意情况占比,回访完全满意数量/成功回访数量×100%,数据来自客户回访。

(8)专线安装回访满意度:本指标统计周期内安装回访满意情况占比,回访完全满意数量/成功回访数量×100%,数据来自客户回访。

3 集客用户端到端感知分析

3.1 分析思路

将网管统计数据和其它多种数据源,结合不同业务用户访问特点,构建全面的监测、分析体系,准确定位关键网元和关键内容源的质差问题,实现内容质量精细化评估。整体思路分为3步:感知评估、问题定界与质差定位。

3.1.1 感知评估与定界

通过建立集客业务质量评估指标体系,进行不同维度指标的归集,定位质差内容源及质差BRAS/OLT/ONU等网元,按以下维度进行归集:地市维度、区县维度、小区维度、BRAS维度、OLT维度、ONU或分光器等维度的统计结果,根据统计结果进行排序,聚类分析出业务的多维度质差情况,然后进行逐层钻取,找出质差区域及网元。

3.1.2 质差问题定位

质差问题定位需要进一步关联各环节网元的告警、KPI统计指标等,结合网管告警、拨测等手段实现端到端问题的精准定位。将关键网元告警归集为用户、网元、地市、出口、内容源等维度的统计结果,根据统计结果(如小区维度)进行排序,找出质差区域、内容源等,输出质差问题聚合表,以便重点排查。

拨测可以通过在关键网元部署软硬探针来实现问题定位:硬探针一般部署在省网(核心)、BRAS(汇聚)、OLT(接入)多层级网络设备下,通过下发网络类、业务类测试任务,获取时延、分组丢失等通用网络类指标,以及游戏业务TCP的Ping时延、视频卡顿次数等关键业务类指标。关联分析不同测试源、相同测试目标的监测数据,逐段排查定界质差问题。

3.2 案例分析(互联网专线)

2016年11月4日11:20某城市经报表统计发现网页质量劣化质差点,网页打开成功率下降至85%基准值以下。原因分析如下。

(1)统计该小区汇聚节点GPON探针数据网页打开成功率为43%,测试网络时延分组丢失达到30%,BRAS探针数据正常,初步判断为GPON接入问题。

(2)排查接入网络性能,该小区GPON某上行链路流量下降。

(3)经过互联网专业排查,确认该小区OLT至城域BRAS3链路存在隐性故障。

解决方案:更换问题板卡后业务恢复正常,统计一段时间指标正常,问题排除。

图1 问题号码统计

3.3 案例分析(语音专线)

2016年8月28日某城市的IMS注册成功率突然从96.34%降低至88%左右。原因排查:首先确定质差用户范围,发现为单个客户的1 100个问题号码,较28日前增长900个左右。其次经排查,确认28日某大型客户新建一台IMS设备,工程调测人员在设备上预配置了新的用户数据并下发。问题号码统计如图1所示。

解决方案:将存在问题的新建IMS数据去激活,该城市SBC注册成功率恢复到96%以上。因此是由于接入设备存在大量无效用户数据导致IMS注册成功率低。

猜你喜欢

时延链路客户
天空地一体化网络多中继链路自适应调度技术
基于GCC-nearest时延估计的室内声源定位
基于改进二次相关算法的TDOA时延估计
为什么你总是被客户拒绝?
如何有效跟进客户?
基于数据包分割的多网络链路分流系统及方法
FRFT在水声信道时延频移联合估计中的应用
基于分段CEEMD降噪的时延估计研究
做个不打扰客户的保镖
23