基于帕累托法则的网络负荷扩容研究
2019-07-19王凌风卢国潇华信咨询设计研究院有限公司浙江杭州310014
王凌风,卢国潇(华信咨询设计研究院有限公司,浙江杭州310014)
0 引言
帕累托法则[1],又名二八定律、不平衡原则,是著名的管理法则,在企业经济学、企业管理学领域具有广泛的应用价值[2]。数据业务流量在不同时间地域的突发和不平稳性导致各个移动小区各个时间段流量分布不均衡[3],通过对移动通信网络用户的行为进行跟踪分析,发现在移动通信网中用户行为也呈现出有趣的“二八现象”,如:30%时间内产生了80%的小区流量、20%的用户贡献了80%的流量等。从目前各运营商应对不限流套餐的扩容思路来看,大多采用的是“自忙时小时级”“周平均忙时”“月平均忙时”的扩容判断准则,长时间跨度的平均统计指标,容易稀释价值小区,不能很好地反映移动用户行为特征[4],也容易忽略最重要20%用户的业务体验感知。
目前各运营商常规扩容判决,所涉及的3个重要评价指标:流量、PRB利用率、RRC连接用户数均为小时级指标。小时级指标平均来看网络负荷不高,平均用户体验良好;但具体在业务发生时段,可能某一时段会存在网络负荷高,影响用户感知速率[5],从而造成用户体验差的情况。为避免常规扩容判决手段容易忽略重要业务时段的用户业务感知体验,较好地匹配移动通信业务不均衡的二八效应,有必要对LTE用户行为特征进行分析,并就主要业务时段的网络负荷进行扩容分析,以适应不限流量业务的流量经营[6]的需求。
1 移动数据业务帕累托现象分析
帕累托图分析法,又称ABC分类法、主次因素分析法,其核心思想是在决定一个事物的众多因素中分清主次,识别出少数的但起决定作用的关键因素和多数的但对事物影响较小的次要因素,从而有区别地确定管理方式[7-9]。通过对某省电信LTE网络1个月的话统数据进行跟踪分析,按小时分段对业务占比进行统计,并绘制小区流量占比的帕累托图,发现数据业务随时间分布严重不均衡,在统计时间段内约30%时间段产生了80%的小区流量,而另外70%时间段则基本表现为网络空载,“二八效应”在流量业务时段体现较为明显,如图1所示。
图1 小区流量占比帕累托分析图
通过对现网小时级PRB利用率在50%以下小区进行移动用户体验速率的跟踪分析,发现有20%左右小区存在用户体验速率偏低,部分移动用户体验速率在2 Mbit/s以下,明显存在PRB利用率和用户体验速率不匹配的现象。
持续对单个小区进行分析,发现存在该现象的原因在于,小时级的统计指标稀释平均了数据业务的帕累托效应。以某小区为例,在18:00这个时间段(见图2),按小时级的扩容指标,统计平均PRB利用率为37.8%,小区中用户体验速率约10.5 Mbit/s,平均体验良好。反映至扩容指标需求来看,该小区不具备扩容条件。但从图2中某个时间段(18:45—18:50)来看,该5 min时段内PRB利用率超过90%,小区中用户体验速率从22 Mbit/s急剧下降到了1.8 Mbit/s左右,从而造成用户体验差。
通过以上全网小区流量占比和单小区业务时段分布的统计分析,可以看出:
a)数据流量业务帕累托效应明显,约30%业务时间段可以产生80%的数据业务,流量随时间分布严重不均衡。
b)小时级平均PRB利用率,容易稀释平均数据业务特有的帕累托效应,因此往往会掩盖业务发生时段的资源不足和用户体验差。
c)小时级平均PRB利用率,无法精准匹配平均用户体验速率的表现。
2 基于帕累托法则的负荷评估
2.1 MTT_PRB利用率概念
帕累托法则主导的是不平衡原则,强调在任何一组东西中,最重要的只占其中一小部分(约20%),其余80%尽管是多数,却是次要的。在流量高速增长阶段,移动数据用户行为具有移动性、随机性、动态性、非线性话务需求等诸多特性,突发的负荷增长又往往集中分布在某个时间段,负荷的增长带来的则是用户体验感的下降;其余70%~80%时间网络负荷又呈现为利用率过低。针对最忙80%负荷发生的20%~30%时间段,参照帕累托法则进行重点分析就显得尤为重要,更能体现网络的关键短板,更好地匹配网络体验。
北京交通大学城市交通复杂系统理论与技术教育部重点实验室,针对用户出行时间的不确定性,引入期望出行时间(MTT)概念,用以评估不确定条件下对交通网络设计的影响分析[10]。在数据网络时代也可以参考引入MTT(Main Traffic Time)概念,在这里可以定义为关键业务时间,用以反映最忙80%流量发生的时间,在该时间段内的PRB利用率(各厂家普遍定义为MTT_PRB利用率),比小时级PRB更能准确反映瞬时用户的感知速率。
根据现网网管统计数据,按流量大小排序,以1 h为统计时间段,采用帕累托图分析最忙流量发生的时间占比,从图1分析结果可知,最忙流量发生的时间占比约为30%。统计该关键业务该时间段内的PRB利用率,也即MTT_PRB利用率。
以MTT_PRB利用率替代常规PRB利用率来应对流量数据业务的不平衡特性,比起常规100%时段的PRB利用率指标,可以更好解决网络负荷的关键短板,提升关键业务时段的用户体验。
图2 小区数据业务1 h段分布图
2.2 帕累托平衡点概念
基于帕累托法则采用MTT_PRB利用率的容量扩容标准,又往往容易陷入另一个极端,那就是过分突出MTT时段的业务负荷。毕竟70%~80%非MTT时段网络基本处于轻载状态,为20%~30%时段投入100%资源来满足80%的业务需求是否经济可行,也是一个值得商榷的话题。
针对“二八效应”的不平衡性,帕累托提出帕累托最优(Pareto Optimality)[11]理论,来达到资源分配的一种理想状态。如何处理帕累托法则下移动网络负荷不平衡的问题,一方面既要避免忽视MTT时段网络过负荷,用户感知体验差;另一方面又需兼顾80%非MTT时段的网络轻载,避免投资过度,造成资源浪费;基于以上分析本文引入帕累托平衡点概念,类似于帕累托最优,来达到网络负荷分配的一种理想状态。在这里“帕累托平衡点”,是指在产生80%流量对应关键业务时段内,满足各类无线网络业务平均速率需求的一个平均门限点。
目前无线网络业务以浏览、视频、社交等为主,不同类别业务有不同的用户体验标准[12],各自对应不同的速率需求。对这3类移动数据主要应用场景,按现网平均体验速率和体验标准关系进行建模,确定相应业务所需平均速率需求。以Web、微信类典型的小包业务[13]场景为例,现网建议确保2 Mbit/s速率,而对应视频类典型大包业务,速率要求则是5 Mbit/s以上。按边缘覆盖比例要求,估算大包小包业务对应的平均用户业务速率需求约为15 Mbit/s。
对平均用户业务速率需求和MTT_PRB数据进行拟合,寻找满足负荷不均衡下的一个平衡点——帕累托平衡点,当平均业务速率需求为15 Mbit/s时,数据业务帕累托平衡点对应的MTT_PRB门限约为80%,如图3所示。因此应对流量业务不均衡的PRB利用率门限,可以按80%进行取值。
图3 平均用户业务速率和MTT_PRB利用率关系图
2.3 流量门限及用户门限分析
随着运营商不限流套餐业务的持续推进,以及LTE网络的发展演进,可以预计视频类大包业务将成为主要业务应用场景,此外移动VR视频也将逐步得到应用,而入门级VR视频的速率要求是普通视频的2~3倍,速率要求通常在10 Mbit/s以上,由此可见,流量的增长是未来一段时间网络负荷增长的主要原因。现网数据表明,RRC连接用户数、下行PRB利用率及下行平均激活用户数均与下行用户速率强相关,通过这些资源与下行用户速率的关联分析可以得出网络扩容的标准[14]。
通过相关业务的速率需求分析,推算下行PRB利用率、RRC连接用户数、流量等扩容门限。PRB利用率门限按上述帕累托平衡点拟合取值,流量门限则根据全网业务占空比[15]、频谱效率[16]等相关联系进行推导:
下行流量门限=频谱效率×小区带宽×MTT_PRB门限×(3 600 s×业务占空比/8/1 024)
以中国电信2.1 GHz LTE FDD为例,20 MHz带宽下行流量门限计算如下:
流量门限(下行)=1.4 bit/s/Hz×20 MHz×80%×(3 600 s×60%)/8/1 024≈6 GB
上行流量门限的确定,可以按LTE下行和上行容量能力比进行确定,根据现网取值建议取3。因此:
流量门限(上行)=流量门限(下行)/3=2 GB
用户门限根据理论分析,结合现网数据的推算方法,依次按小包频谱效率、小区吞吐率、所支持的并发用户数、RRC用户数等相关数据相互关联性,对照现网参数配置情况以及小包场景频谱效率和小包业务的速率要求,通常20 MHz小区用户数门限值建议设定为170个。
3 基于帕累托法则的扩容分析
3.1 负荷评估的对比分析
通过以上基于帕累托法则的负荷评估,在某地区,选取连片495个基站,共1 485个小区,分别基于常规负荷扩容标准和帕累托法则下MTT标准进行分析比较,结果如图4所示。
图4 常规PRB利用率和MTT_PRB利用率对比图
从以上的对比分析,可以看出:
a)高负荷小区由于PRB资源大量被占满,PRB资源利用率分布区间更靠近index较大的区域,因此MTT_PRB利用率和PRB平均占用率基本一致。
b)中负荷小区,MTT_PRB利用率与PRB平均占用率趋势基本一致,趋势增长高于PRB平均占用率,一定程度能够弥补在业务发生期间的资源不足,真实反映业务发生时段用户的体验。
上述1 485个小区基于帕累托法则标准评估需扩容的共有241个,占比16.2%。按常规扩容标准评估需扩容小区共有113个,占比7.6%。扩容小区数量比正常判断标准多出1倍左右;基于帕累托法则标准需要扩容的小区,基本包含常规扩容标准所需扩容的小区,另有128个小区不包含在常规标准所需扩容范围,如表1所示。
表1 MTT_PRB利用率忙小区场景分布表
针对这128个小区进行业务峰均比和业务重要性特征分析,以其中1个校园典型场景小区为例,进行15 min粒度分析如图5所示。
从图5可以看出:
a)高峰时隙主要是由于流媒体业务增长所致,这部分业务对时延、速率感知敏感。
b)部分小区高峰时隙由文件访问导致流量明显升高,部分时段会影响视频、即时通信、VoIP等用户感知。
因此,基于帕累托法则的扩容分析,能够用于识别瞬时业务量高问题,也能识别常规扩容门限下的忙小区。
3.2 扩容小区筛选
以上经常规扩容标准判断不需扩容的128个小区,有一部分小区是由于峰均比较高,导致MTT_PRB占比升高,而落入帕累托法则的扩容门限内,有可能整体流量并不高,并不是真正需要扩容的小区,扩容经济价值也并不高。因此还需着重对这部分拟扩容小区进行流量分析,以识别出真正需要扩容的价值小区。
通过分析某段时间内的流量分布情况,基于经济学LAC曲线[17]拟合概念,对用户感知速率和流量进行包络线拟合分析,用户感知速率与小区流量有如下关系:在用户感知速率为15 Mbit/s时,小区15 min下行流量约为1 200 MB;用户感知速率为5 Mbit/s时,小区15 min下行流量约为100 MB,如图6所示。
基于以上标准流量的分析结论,对基于帕累托法则标准分析需要扩容的128小区进行对比。提取一天中15 min粒度流量数据,按照以上用户感知流量门限进行统计,并按超标准流量以5%步长的比例进行排序,结果如表2所示。
统计结果显示,一天中15 min粒度流量超过标准流量的时段大于60%的小区数为45个,大于40%的小区数为61个。参考业务峰均比和业务重要性特征分类以及扩容效果评判,可以拟定超标准流量60%的45小区为有扩容需求的价值小区。这个60%从扩容比例确定,还需要根据现网实际扩容效果做进一步研究。
3.3 分析总结
图5 小区业务峰均比和业务重要性特征分析图
图6 用户感知速率与小区流量包络线关系图
表2 小区忙时流量超标准流量比例分布表
常规扩容标准能够识别大部分流量、PRB利用率、RRC连接用户数较高的小区,并能给出合理的扩容建议,但对于移动数据的帕累托效应缺乏有效的应对措施,尤其是不限流业务环境下的高流量随时间分布不均衡的问题,无法精准识别,因此也容易忽略MTT业务发生时段的资源不足和用户体验差等问题,无法匹配业务不平衡状态下的用户体验速率。基于帕累托法则的扩容分析,可以准确反映在MTT时段的网络负荷情况,在保证常规负荷扩容的同时,能够准确识别流量及PRB利用率随时间起伏(峰均比)较大的负荷小区,一定程度上更好地匹配移动数据业务的帕累托效应,因此可以补充和完善重要业务时段的用户感知速率体验。
4 结束语
基于帕累托法则的容量扩容,同时也是一把双刃剑,过分关注20%~30%MTT业务时段的网络负荷,容易夸大网络负荷现状,因此在网络实际操作中,还需就业务峰均比、业务特征以及流量现状等做进一步分析处理,以便能识别出真正意义上的负荷小区。