APP下载

互联网业务质量智能拨测分析系统的研究及应用

2018-07-04吴修权钟其柱梅艳

电信工程技术与标准化 2018年7期
关键词:测系统数据业务核心网

吴修权,钟其柱,梅艳

(中国移动通信集团广东有限公司中山分公司,中山 528400)

1 引言

4G-LTE网络正式商用后,移动数据业务逐步摆脱了过去2G/3G时代下载速率低的瓶颈限制,迎来了爆发式的增长。移动通信业务的重心逐渐由传统的语音业务全面转向互联网侧的数据业务,数据业务也逐步演变成运营商竞争的焦点。而数量庞大,种类众多的数据业务应用和服务,在给运营商的维护优化工作带来了新挑战,所以移动通信网网络维护优化及分析保障更加重要性[1]。在目前的网络分析优化工作中,拨测分析是运营商发现、核实网络故障,排除网络隐患,提高网络服务质量不可或缺的重要手段[2],但传统的拨测方式主要依靠人工完成,存在一定的局限性,如拨测次数有限、拨测成本高,无法实现实时拨测等[3,4]。所以急需一套智能互联网业务拨测系统,将现有繁杂、低效的人工拨测统一为自动化操作,并扩展出一系列综合评测现有移动通信网的运行效率的参数,进而对移动通信网的设备运行安全及网络安全进行预警分析和评估[5,6]。提高发现问题和处理问题的反应速度,提升移动通信网络的运行维护水平。

互联网业务内容的丰富多变性,要求运维监控工作具备一定的智能性,能适应业务内容的快速变化;而数据业务庞大的业务量,也要求运营商的测试工作有足够的采样,才能够相对客观和全面地评价网络质量和业务服务质量[7,8]。

本文建立了一种智能的互联网业务质量拨测分析系统,这是一套获取用户“真实体验”信息的系统,通过模拟用户行为,对互联网业务进行拨测,为网络和互联网业务维护优化人员提供最直接最科学的分析数据,以适应数据业务剧烈增长和服务内容的频繁变化。提高网络质量,提升客户感知。

图1 互联网业务质量智能拨测系统结构

2 智能拨测系统组成

目前影响互联网业务指标的主要有终端、无线网、EPC核心网、CMNet和SP。终端发起数据业务请求,经过无线网、核心网的转发最终将业务请求送至互联网对应的内容服务器,然后由内容服务器作出响应并将响应内容经核心网、无线网最终发送至终端用户接收。终端用户和SP内容服务器处于业务请求和响应的两端,直接决定着业务的发起、响应和终结;而无线网和核心网在数据业务进程中起到调度、转发的管道作用,对业务数据传送的路径时延起决定性的作用,管道质量的好坏也影响着业务数据的传送质量。

系统工作原理是通过自动拨测功能模拟互联网业务的客户端发送HTTP请求,然后对测试的业务进行采集和处理,生成测试结果,多维度(小区、网元、SP、URL)呈现,根据拨测的结果对测试的业务进行无线网、EPC核心网、CMNet和SP潜在影响因素分析。智能拨测系统由拨测前端(软件部分)和分析后端(硬件部分)两大部分组成。

2.1 拨测前端架构

拨测前端是基于Eclipse编程技术用Java语言开发,以一个4G手机作为网络接入热点,一台或多台手提电脑作为专用的拨测设备(设备数量根据业务拨测量而定)。手提电脑通过手机热点接入4G网络后,通过本系统的智能拨测功能模块在设定的时段自动拨测选定的互联网业务URL地址。

根据是否需要人工配置拨测方案,系统前台的拨测方式可分为自动配置拨测和手动配置拨测两种方式。自动配置拨测方式的工作原理是后台拨测系统通过采集现网业务的数据,定期(周期根据需要设置)生成现网热门业务质差URL地址的txt文件后,主动推送到拨测系统前台。智能拨测终端功能模块会自动完成导入动作,然后对新导入的URL地址进行常规的拨测。自动配置拨测是一种具有学习功能的拨测模式,无须人为设置测试内容就能实现自动对热门业务的URL进行拨测。具体流程如图2所示。

另外一种方式是手动配置拨测,也就是当网络出现问题时针对某个节点的拨测,以回溯节点存在的问题。工作原理是人工填入要进行拨测业务的URL文件,通过前台拨测终端人工导入测试内容后,进行拨测动作。手动配置拨测方式主要用于日常用户投诉处理或特定业务性能的测试。

系统的智能拨测功能模块是基于并发原理编写的,一台智能拨测终端能自动完成200万次/小时的拨测,拨测的数量多少可以根据业务测试需求进行灵活的调整。通过高并发高速率,对网络结构中的各层次设备进行大量的压力测试。并发拨测与单点测试原理的对比如图3所示。

图2 自动配置拨测流程图

图3 并发拨测与单点测试原理图

图4 拨测处理流程图

通过常规的高并发高速率的拨测动作,主动发现或者复现手机用户在使用互联网业务过程中出现的故障,并对返回的错误编码进行聚类分析归纳。如图4所示。

前台系统具有强大的自我学习和纠错功能,对同一地址或者域名的主动和被动拨测返回的结果将被抽象成特征参数进行保存匹配,特征参数包含:成功率、失败率、失败返回错误码列表、失败返回错误码占比、拨测使用网络路由、各层次网络设备、时延、分组丢失率等。通过对特征参数的分析和匹配,被动和主动拨测发现的可疑URL地址可排除网络侧本身的问题,并上报对应厂商进行核实,确认为SP问题后对该URL建立白名单,并划定屏蔽时长,在该屏蔽时长内系统上报该URL不再进行判定拨测。

2.2 后端分析系统架构

后端分析系统主要由采集共享服务器、本地数据处理服务器、数据库服务器、应用客户端共四大部分组成的,如图5所示。

1.3.1 色谱条件 色谱柱Acquity UPLC BEH C18 IVD(2.1 mm ×50 mm,1.7 μm),柱温50 ℃,进样量5 μL,流速 0.5 mL/min。流动相:0.1%甲酸水溶液(A),0.1%甲酸甲醇溶液 (B),梯度洗脱,0~0.5 min使用 20%B,0.5~1.3 min使用20% ~80%B,1.3~1.7 min使用80% ~95%B,1.7~1.75 min使用95% ~20%B;1.75~2.0 min使用20%B。

图5 智能拨测分析系统后台结构图

采集共享服务器主要是采集S1-MME/S1-U接口的信令码流进行解析后生成txt文件,传送到集群数据共享服务器,再由本地处理服务器通过Socket方式进行数据接收后发布到Loader,作为智能拨测系统的基础数据源。

处理服务器的主要作用为接收采集服务器发送过来的基础数据源后,完成智能拨测系统的基础数据源的解码及合成、数据的计算、整理、统计,同时根据订阅需求生成XDR信令数据和对应的业务信令数据,组织和存储数据,并通过接口对外提供信令数据的共享和传输。

数据库服务器主要是对处理完成XDR信令数据进行入库应用处理、按信令流程表示和(用户、小区、网元、SP、URL等维度)多维度呈现。

应用终端主要是对智能拨测系统前后台进行远程的访问应用、维护、升级等日常操作。

系统软件架构如图6所示。

智能拨测系统后台功能主要分为两方面:一是采集现网数据生成热门业务的URL文件,自动推送到拨测系统前台,然后前台的主动拨测模块根据推送的URL文件内容进行拨测。二是通过对前台拨测生成的数据进行清洗、过滤,形成的汇总数据能够检测4G手机终端的互联网业务质量存在问题,以及快速定位问题所在的节点(SP、核心网、无线网或者终端本身),用最少的资源完成互联网业务质量问题的测试和定位。

3 智能拨测系统功能模块

目前互联网业务质量的智能拨测系统主要有以下几个功能模块。

3.1 智能拨测

图6 智能拨测软件架构图

前台拨测终端在系统软件控制下,主动获取获取信令分析系统中高频出现错误的URL地址或者由人工配置拨测任务列表,执行拨测任务并记录拨测结果及错误码情况,以时间命名生成TXT文件(.log格式)并上传至拨测系统后台信令分析系统,供后期分析使用。终端在拨测URL时首先会获取从手机到互联网边界出口整个连接路由以及中间网络结构的拓扑,可实现对网络结构中的各个层级进行逐级测试。

3.2 网络性能实时监控

核心网、基站等硬件故障或隐性故障发生时,映射到无线小区上往往是业务异常和流量异常,利用拨测生成的XDR实时数据在ORACLE上按需定制成SGW/Cell等不同维度的汇聚数据,提供给信令、业务及流量异常监控模块,通过模块自动分析网元维度和小区维度数据,观察变化趋势,发现异常的CDN、EPC、小区等网络节点存在的问题,可实现小时或最小5 min粒度实时监控和告警推送。

3.3 互联网业务实时监控

通过对后台采集数据的全方面分析,可提供全维度数据到互联网业务监控模块,实现小时或最小5 min粒度实时监控和告警推送(监控时间粒度可调),及时发现互联网指标劣化情况,并快速提取实时ToP N数据和同期历史数据进行同比或环比分析,准确定位异常的维度和业务类型,数据包含各个考核业务流程的指标性能,如成功率,错误代码等等。

3.4 网络和业务抗压评估

拨测系统前台是基于Java语言的并发测试原理编写,有别于目前拨测系统的单发测试原理,能实现一次同时发多个HTTP请求的拨测动作。单台拨测系统每个小时能实现200万次的自动拨测,甚至更多的次数拨测来达到评估CMNet、EPC、eNode B网络单元或APP应用服务器能承载最高业务量的负荷状态,为网络单元或APP应用服务器的业务接入提供精准的数据支撑。

3.5 报表统计

支持各类网络侧、业务侧、前台拨测log等数据的统计分析和结果导出,满足实际工作需要及二次分析需求。报表统计最小粒度为单用户最小5 min统计。

4 系统效果

目前,该系统已在地市公司进行了部署,进行日常例行的互联网业务拨测。从同一个业务同一时间点执行的结果来看,可以清晰地得出不同IP内容源之间的性能差异及质差业务的具体信息。同时,系统的自动拨测功能,也减少了以往人工拨测的不便和繁琐,大大提升业务测试效率。该系统的实施,对互联网业务的实时监控,提供了很好的保障。系统上线以来,取得了一系列社会和经济效率,具体包括如下。

(1)节约70%人力成本,提供300%工作效率。

单终端的高并发能力和自动拨测功能,极大的提高了业务拨测工作的效率,不仅能直接节省人力资源,降低成本,还能规范统一拨测操作流程,提高发现和处理问题的能力,提高整个通信网络的运行性能。

(2)及时判断质差URL,游戏成功率从97%提高到99%。

通过系统后台分析筛选出的质差业务URL,发送至前台进行针对性拨测,重现用户在在业务层面的使用感知,真实反映业务使用质量,精准定位用户投诉业务问题点,提升游戏等业务的质量。

(3)细化互联网业务质量监控粒度和频度,提升互联网业务质量管控能力。

XDR数据采集分析后,以SP、IP、SGW、URL等不同维度呈现的数据业务使用情况,全方位展现了业务使用过程中各个环节的业务质量。最小5 min的数据统计周期,更能快速发现业务异常,及时进行优化保障。

5 总结

移动通信技术的飞速发展和用户规模不断扩大,伴随移动数据业务的种类多样化,对移动通信网络性能维护和业务质量优化的方式方法提出了新的挑战。互联网业务质量智能拨测系统通过智能的多层次终端模拟拨测系统和信令数据采集分析系统的有机结合,采用自学习优化方式,对拨测的URL进行特征参数提取和分析。通过不断的剔除和优化,增加问题URL的靶向命中率,减少重复URL的拨测和判定,建立对应的白名单系统,在一定程度上实现了数据业务质量的智能化管控,有效的解决了数据业务繁杂多变情况下的业务质量精准监控和故障重现问题,同时也大幅提升传统业务拨测的工作效率和业务质量监控优化精度。从实际应用来看,单进程每秒1000次的高并发拨测量可以很好的满足新业务、新网元引入的压力测试需求。而自学习精准拨测的问题URL的定位准确率,有待进一步提升。如何对URL关键内容的提取归纳和智能拨测的自学习优化算法进行进一步优化,是下一步的改进方向。

[1] 张晓兰. 移动通信核心网优化研究[J]. 新技术新工艺:质量与检测,2015(12):119-121.

[2] 陈卓永. 西藏全业务质量监测系统的开发与应用[D]. 广州:华南理工大学,2013-12-06.

[3] 丁小可, 廖建新, 沈奇威. 一种互联网业务质量拨测系统的设计方案[J]. 电信网技术,2014(11):33-37.

[4] 王存玮, 宋茂强. 移动数据业务自动拨测系统方案的研究与实现[EB/OL]. 中国科技论文在线(2007-10-19)[2018-6-1]:http://www.paper.edu.cn/releasepaper/content/200710-334.

[5] 吕品,谢永基. 基于性能的移动通信VoIP核心网主动预警算法和系统[J]. 中国新技术新产品:信息技术,2013(11):53-53.

[6] 徐斌. 移动通信分组交换域核心网网络风险评估与安全防护[D].上海: 上海交通大学,2013-08-01.

[7] 韩振东, 蔡子龙, 程晓军. 基于用户行为数据挖掘的网络质量优化[J]. 数据通信:技术交流, 2012(01):36-39.

[8] 熊伟. 基于核心网数据挖掘的移动通信用户行为分析及应用[D].北京: 北京邮电大学, 2014.

猜你喜欢

测系统数据业务核心网
上海市交通发展研究中心交通项目评审及交通大数据业务简介
GSM-R核心网升级改造方案
5G移动通信核心网关键技术
通信核心网技术的应用探讨
防洪非工程措施设计实例——嘉兴市水文巡测系统项目设计
电快速瞬变脉冲群对核测系统的影响及对策
VoLTE核心网建设方案
分组域数据业务的停复机优化
基于广域量测系统的电力系统综合负荷辨识模型的研究
三维标测系统指导下射频消融治疗房颤的护理观察