基于流量监控数据的IPRAN网络精准建设研究
2018-10-16郭祥明黄长春
郭祥明,黄长春
(北京中网华通设计咨询有限公司,北京 100070)
1 4G业务增长趋势
随着网游、直播、视频等互联网应用加速向移动终端转移,运营商介入到与互联网内容合作经营,新一轮4G业务竞争加剧,运营商纷纷推出不限流量套餐。随着流量竞争日益加剧,流量资费大幅降低,用户上网行为在改变,对网络游戏、手机视频流量消耗需求越来越大,导致4G流量爆发式增长。
以某省为例,2017年1-9月某省联通无线站点单日流量由282 TB增长至920 TB,月均增长率为25%,城区无线站点单日流量增长量大于非城区。LTE站点单日流量增长情况如图1所示。
2 IPRAN面临考验
图1 某省联通2017年1~9月LTE站点单日流量增长情况
某省联通IPRAN网络定位于移网业务回传,作为2G/3G/4G业务主要承载网络一直以轻载为主,但随着4G流量爆发式增长,对IPRAN网络带来严重冲击,在网络承载能力、网络结构、网络安全方面面临严峻考验。
(1)不合理的网络结构,无法满足4G业务高质量回传要求、影响业务承载安全:某省联通IPRAN网络大规模部署时,才进行两区三点目标网规划,IPRAN部署大都沿用MSTP时代网络结构,存在汇聚层跨区组网、接入层超大环、长支链现象,从接入层至核心层业务经过转接点较多,对时延较为敏感业务,如手机支付、手机游戏业务影响较大。
(2)环路容量不足,无法满足4G流量增长需求:4G流量迅猛增长,部分IPRAN网络环路容量无法满足需求,4G用户视频业务出现卡顿现象,严重影响用户感知。
3 IPRAN流量监控需求
IPRAN网络在面向业务和体验方面缺少必要的数据统计和分析手段,使得IPRAN网络对业务的实际承载能力无法感知,无法对IPRAN网络进行精准优化、扩容。
针对上述问题,在现有网管功能的基础上提出IPRAN流量采集模型,对IPRAN汇聚层、接入层环路流量进行采集分析,准确定位网络短板,指导IPRAN网络精准扩容。并对同一环路在不同时期流量数据进行分析,总结流量增长趋势,对未来几个月内流量增加情况进行预测,为IPRAN网络规划提供参考依据。
4 基于流量监控数据的IPRAN网络分析方法
4.1 流量监控模型
IPRAN网络流量监测数据是衡量整个网络的重要工具,也是判断链路扩容及环路优化的依据。由于IPRAN不同网络层面、不同时间段监测数据差距较大,必须建立一套完善的流量监控模型,才能真实反应出IPRAN网络对业务承载能力。
IPRAN网络流量统计首先要根据现网拓扑,建立接入环首尾端口(主备汇聚设备端口)、汇聚环首尾端口(主备核心设备端口)与环路名的对应关系表项及业务网络连接链路(CE/AR/RNC等)端口表项,在网管上定期倒出相应端口高峰时段平均流量、峰值流量数据,加以对比分析(统计端口如图2所示)。
图2 IPRAN网络流量监控端口示意图
IPRAN网络流量统计包括传统15 min流量统计功能和秒级流量统计功能,视不同厂家网管功能支持而定(据了解,华为、烽火网管支持秒级流量统计,中兴网管仅支持15 min流量统计)。
采样时段应是高峰时段,高峰时段的确认应在前期采样24 h数据分析得出,确认高峰时段后,定期例行采样时长建议设为60 min,采样周期15 min。采集链路按照网络层次划分,主要包含业务汇聚至业务网元(无线网RNC、IP承载B网AR)环路;一级汇聚至核心设备环路;接入至汇聚设备环路。
4.2 IPRAN网络流量分析方法
4.2.1 基于无线覆盖场景的差异化扩容门限设定
IPRAN网络作为4G业务回传的主要承载网络,随着IPRAN与IP承载A网打通(规划2018年打通),会逐渐演变为一全业务承载网。根据IPRAN网络轻载化设计目标,日常运维中会根据环路带宽利用率设定扩容门限。带宽利用率计算方案如下。
环路带宽利用率=(主用端口流量+备用端口流量)/环路单边带宽
表1 不同网络层级不同价值区域扩容门限
通常情况下会根据IPRAN网络峰值下行流量定义扩容门限,根据分组网络覆盖的目标区域价值不同,按照高峰时段监测的环路下行峰值流量带宽利用率,设定不同价值区域差异化扩容门限(如表1所示)。在大量监测数据累计后可根据实际用户体验情况逐渐优化扩容门限值,从而实现网络精准投资与用户感知的完美结合。
4.2.2 某省联通IPRAN网络流量现状分析
2017年9月对某省联通IPRAN网络进行持续1个月的流量监控,通过整理分析流量数据,发现某省IPRAN网络在核心、汇聚、接入层都存在流量超过扩容门限情况。具体流量监测情况如下。
(1)业务汇聚至IP承载B网AR流量(4G出口流量)。某省联通大部分地市业务汇聚至IP承载B网AR为10 GE链路(省会城市、个别大地市为多条10 GE链路捆绑),随着4G流量爆发式增长,大部分地市4G出口链路带宽超过扩容门限,急需进行扩容。
(2)一级汇聚环路流量。某省联通共有137个IPRAN一级汇聚环路,全部为10 GE环路,9月一级汇聚环路峰值下行带宽平均利用率为23%,有16个一级汇聚环路峰值下行带宽利用率超过扩容预警线,应着手进行环路的优化/扩容。
(3)接入环路流量。根据9月流量数据监测数据,参考不同覆盖区域门限值,全省共有102个接入环路下行峰值带宽利用率超过扩容门限,其中19个接入环路带宽利用率超过100%,应从承载业务、环路结构、环路容量等方面进行优化。
5 基于流量监控数据的IPRAN网络精准建设流程
(1)IPRAN网络流量提取:根据流量监测模型,提取核心、汇聚、接入层环路流量数据。
(2)对流量超限环路分优先级实行名单制管理:根据网络层级将超限环路分为核心、汇聚、接入3个层级,根据流量大小及影响范围优先考虑核心层环路优化调整。
(3)分析业务承载合理性:根据网管数据,分析IPRAN网络业务承载是否合理,对承载的不合理业务优先考虑割接至其它方式承载。
(4)分析网络结构合理性:根据两区三点目标网规划,分析网络结构是否与目标网相匹配,对跨区组网、超大环、长支链进行优化调整。
(5)对网络容量进行扩容:在确保业务承载、结构合理的前提下,根据流量分析分轻重缓急对网络扩容。
(6)建立网络流量常态化监测机制:由于4G流量增长极快,且存在不确定性,应尽快建立常态化的流量监控制度,如在省分层面统一流量监控系统,使得流量监控实施具备常态化执行的条件。
6 基于流量监控数据的IPRAN网络精准建设方案
6.1 核心汇聚层优化方案
核心层流量瓶颈主要在业务汇聚设备至IP承载B网AR链路容量不足,某省联通业务汇聚设备都是口字型组网与IP承载B网AR直连,网络结构不存在问题;该链路基本承载4G业务,业务承载合理。对于该链路超限地市扩容方案如下。
(1)非省会城市:采用10 GE链路捆绑方式来解决上行带宽不足问题(方案1)。扩容1条10 GE链路,业务汇聚设备需具备3个10 GE端口(上联、互联、下联),根据目前流量监测数据,大部分地市扩容1-2条链路即可满足4G流量承载需求,单边链路最多可扩容至4条10 GE链路,超过4条应从核心设备出100 GE端口直连EPC MCE设备。
(2)省会城区:省会城市4G流量较大,如长沙目前单边10 GE链路已扩容6条,不建议再继续扩容10 GE链路,可从核心设备出100 GE端口直连EPC MCE设备,减少跳接点。
6.2 一级汇聚优化方案
某省联通IPRAN网络一级汇聚层环路137个,根据IPRAN网络评测结果,一级汇聚环路以承载4G业务为主,部分汇聚环路承载少量大客户业务,对汇聚环流量影响不大。但部分一级汇聚环路存在跨汇聚区组网现象,对环路流量影响较大,需先对环路结构进行“口字型”调整后再根据流量监测情况判断是否需求环路扩容。
已调整为“口字型结构”的汇聚环路,环路流量仍超限的,应考虑采用10 GE链路捆绑方式将10 GE环路扩容为20 GE环路。一级汇聚扩容10 GE端口应分布在不同单板上以防单板故障而导致整个节点失效。
6.3 接入层优化方案
根据网络评测结果,某省联通IPRAN接入层环路在业务承载、网络结构存在不合理现象,如部分地市接入环路承载大量乡镇OLT上行业务、环路网元较多,导致环路带宽利用率偏高,全省已有19个接入环路带宽利用率超过100%,严重影响用户体验。 应从业务割接、结构调整、环路扩容3个方面对接入环路进行优化。
6.3.1 不合理业务割接
不合理业务定位:首先根据流量监测数据定位到某个接入环路,再找到该接入环上联汇聚设备,若分组接入层承载OLT业务,在县城汇聚设备势必要占用大量的GE端口落地,通过网管查询汇聚设备端口来定位不合理业务。
图3 IPRAN一级汇聚设备端口占用图
以某地市接入环1为例,该环路下行峰值带宽利用率为126%,通过查询网管发现该环路所属汇聚设备配置的48×GE单板,GE端口全部被占用,OLT占用34个GE端口,如图3所示。
接入环1峰值流量严重超载,导致数据分组丢失、上网卡顿,引起用户多次投诉,严重影响用户感知。经分析发现该环路承载了7端OLT上行业务,且该部分OLT周边都已部署县乡OTN设备,通过将OLT业务割至县乡OTN承载后,该环路下行峰值带宽利用率由126%下降为24%,降至扩容门限以下。
6.3.2 不合理结构调整
IPRAN接入层网元数量较多,环路结构复杂:超大环、长支链、环套环、跨区组网等现象较为普遍,通过网管或网络拓扑图无法理清接入环路与光缆网、传输系统匹配关系,对环路结构进行优化调整难度较大。
解决方案:可依托谷歌地图工具,将网管拓扑图网元逐个在谷歌地市上进行展示,通过叠加基础架构、光缆网、县乡OTN系统等图层,可根据两区三点目标网规划利用主干光缆、OTN波道资源等快速制定超大环、长支链优化方案。某地市IPRAN结构谷歌展示如图4所示。
方案难点:IPRAN接入网元数量较多,在谷歌地市上标记工作量较大,且接入层网络结构调整频率较高,需在谷歌地图上经常更新组网结构。虽有困难,一旦做起来将会大幅提升接入层优化调整方案设计速度及质量。
接入层超大环结构优化思路:利用县乡OTN系统GE波道资源进行裂环优化。某省联通县乡OTN乡镇覆盖率已达80%,乡镇有大量的GE波道资源冗余,可用于乡镇超大GE环路裂环。
目前,某省联通县乡OTN系统在县城两个汇聚机房都部署有县乡OTN设备,乡镇分组设备可通过裸纤上联至就近县乡OTN节点,通过县乡OTN系统GE波道资源回传至县城IPRAN汇聚设备,完成超大环路的裂环,提升接入环路容量。
6.3.3 环路扩容
对于业务承载、网络结构均合理的接入环路,应根据流量监测数据对超限环路进行及时扩容,通过综合业务接入点分组独立组网升级为10 GE环路、普通GE环路升级为10GE环路等方式提升接入层环路容量。
7 结束语
图4 某地市IPRAN结构谷歌展示示意图
图5 IPRAN接入层超大环利用县乡OTN系统裂环示意图
随着移动互联网业务高速发展,运营商之间流量竞争日益加剧,4G流量爆发式增长,对IPRAN网络带来较大冲击,为提高用户体现,必须在网络建设投资上实现精准、高效、快速投放。通过建立IPRAN网络流量监控模型,对IPRAN网络不同层面、不同覆盖场景进行流量监测,可直接有效的发现网络中存在的问题,指导网络精准建设,在网络建设、维护、规划、可研各阶段均发挥重要作用。
虽然该方法能定位出容量不足环路,但对流量监测数据分析过程仍较为粗略,鉴于4G流量增长较快,现有网管系统不能持续对IPRAN网络某单个网元进行不间断、秒级的监测,流量数据还存在一些不确定性,建议尽快建立流量监控系统,实现对IPRAN网络更为精准的监测。