基于大数据的异网覆盖智能测评方案
2020-11-06许盛宏宫云平姚彦强
许盛宏 宫云平 姚彦强
【摘 要】
为了解决目前异网覆盖测评不准确、工作量大、效率低的问题,通过空间聚合、密度聚类等算法研究了异网覆盖智能测评方案,通过对4G异网覆盖测量数据分析了异网所有频点MR的监测、MR的最优RSRP提取、异网覆盖栅格指标的生成、异网问题区域的识别等关键技术,实验证实了异网覆盖智能测评的高度准确性及较高应用价值。
【关键词】4G;大数据;异网覆盖;智能测评
0 引言
随着移动业务竞争带来压力,移动用户感知质量需要迫切提升。由于网络设备投入资源有限、规划站点部署不足将会导致移动网络弱覆盖、覆盖盲区等方面问题,严重影响用户感知的提升。为了支撑移动网络合理而精准的规划、优化,提升网络覆盖质量和业务服务竞争力,往往需要掌握异网(其他运营商)网络部署规模以及覆盖质量等竞争信息,实现有限资源的精准投放,重点保障和快速提升重要区域的客户感知,因此很有必要掌握异网覆盖指标。
1 现有解决方案
为了获取4G异网覆盖指标,需要其他运营商的卡通过路测专用设备进行拉网测试,显然这种方式资源消耗大、成本高且效率低。MR为用户终端上报的测量报告,本方案所指MR均为用户终端周期性上报测试报告MRO。当前,全网通的4G终端周期性上报的MR包含AGPS(MDT-GPS经纬度),也包括主接入小区和邻区覆盖指标,其中主接入小区即为本网接入小区,而邻区包含本网小区和异网小区。所以,通过本网用户上报MR采集异网覆盖指标,成为一种可行的解决方案。
然而,从基站资源节省的考虑,每条MR上报的总的邻区数量一般为6个,并需要预留一定数量的本网小区提供业务切换使用,就无法满足其他运营商周边小区上报。目前技术方案如图1所示,通过网管一次性次开启所有4G异频测量,获取所有含有异网覆盖指标的MR数据,将MR栅格化之后计算RSRP平均值作为栅格覆盖指标,最后通过人工方式识别异网覆盖问题区域。
目前技术方案存在的问题如下:
(1)MR上报邻区数量有限,收集异网频点不全,导致测评很不准确。
(2)不区分频点进行分析,无法反映现网根据最优频点信号接入网络的实际情况。
(3)通过人工方式识别异网问题区域,导致分析效率低且准确性不高。
因此,很有必要研究一种解决当前技术问题的方案,实现高效的、准确的、及时的自动化测评。
目前技术方案的实现流程如图1所示:
2 智能測评方案
2.1 总体实现思路
针对目前每条MR上报异网的邻区上报数量有限、频点收集不全、覆盖测评不准确的问题,提出了基于大数据的异网覆盖智能测评的方法。首先通过基站网管分批次监测异网所有频点,通过海量MR数据采集处理,然后每条MR按照频点分组提取RSRP最优值,将含有友商的MR进行栅格化,同时提取含有友商的MR,根据频点出现次数分布统计其他运营商的主频点,再分运营商计算每个栅格所有MR的频点以及每个频点对应算术平均值,提取运营商频点的RSRP均值高者作为栅格覆盖指标,过滤掉不含主频点的友商栅格,最后通过聚类算法实现问题栅格自动连片得到覆盖问题区域,实现了通过本网用户对异网覆盖进行准确而自动测评,可进一步实现多个运营商覆盖指标同时同地对比分析。具体实现步骤如图2所示:
2.2 相关算法研究
(1)空间聚合算法
空间聚合通过地理化空间对网络指标进行聚合分析[1]。由于栅格数据结构简单,便于网络指标的空间聚合分析,可以对测评区域进行栅格化。栅格数据就是将空间分割成有规律的网格,每一个网格称为一个单元,并在各单元上赋予相应的属性值来表示实体的一种形式,格网单元大小决定了栅格数据模型的分辨率。采用地理化栅格指标进行聚合分析,可满足异网覆盖指标地理化评估分析的需求[2]。
(2)密度聚类算法
聚类算法包括划分、层次、密度、网格等聚类算法[3]。其中密度聚类算法最为代表的为DBSCAN,该算法采用空间索引技术来搜索对象的邻域,引入了“核心对象”和“密度可达”等概念,从核心对象出发,把所有密度可达的对象组成一个簇[4]。为了实现覆盖质量差的地理区域查找,通过地理化栅格对异网覆盖指标进行分析,将满足弱覆盖的栅格自动连片,由于所要的目标区域大小和形状都不固定,通过采用密度聚类算法,从样本密度的角度出发,基于可连接样本不断扩展聚类簇,以获得最终的聚类结果。DBSCN算法包括扫描半径(R)和最小包含对象数(minPts),其中扫描半径R为相邻对象之间的最大距离,最小包含对象数为一个簇所需要最小对象的个数[5]。
(3)主频点过滤算法
每个运营商都有基础覆盖频点,覆盖主要区域范围,通过按照本地网统计异网MR分布得到MR条数最多频点即为主频点,为了实现主要区域的异网测评和提升测评准确性,将含有该运营商主频点的栅格作为分析对象,去掉不含有的该运营商主频点的栅格,避免少量的非主要区域覆盖指标不稳定对整体区域覆盖测评带来的误差。
2.3 关键技术实现
(1)异网所有频点MR的监测
在设备网管上开启其他运营商频点的测量,由于某些运营商的频点较多且异网邻区数量有限[6],需分批次分频点开启异频测量,比如1个月开启4批次,每次3个异网频点,共可收集12个异网频点,最终通过全网通用户终端上报异网覆盖数据,将异网所有频点都进行监测。如表1所示,其他运营商1的频点比较多,每批次开通2个频点,其他运营商2就仅开通1个频点。通过获取用户上报的所有批次且含有异网覆盖的MR数据,即可收集到所有异网频点的覆盖指标,解决通过一条MR无法将全部异网频点收集齐全的问题。
(2)海量MR数据采集预处理
某运营商全省每天的MR数据量为350多亿条,其中每天含AGPS经纬度的MR大概为10亿条,每天含异网频点的MR大概为5亿条,按照每月异网频点监测开通16天,那么就会有80亿的异网频点MR数据,最终生成的20×20的栅格数量大约为2亿个。为了实现海量异网频点MR数据的采集、存储和运算等方面处理,建议构建flume+hadoop+spark+hbase的分布式处理框架[7],通过flume完成底层海量MR数据采集,通过hive程序提取含AGPS且含異网频点的MR数据,并剔除RSRP异常或者缺失的记录,然后存储到hadoop分布式大数据集群,完成MR数据的采集预处理,确保海量数据预处理的完整性和时效性,最后通过spark完成后续的关联分析和逻辑计算,并将所生成的异网覆盖数据的栅格存储在hbase中,实现前端界面快速查询调用和界面栅格渲染。
(3)MR的最优RSRP提取
每条MR按运营商、频点分组,每条MR提取每个运营商每个频点覆盖指标RSRP最高者。如表2所示,根据表1开启异频监测的第一、二批分别提取2条MR,每条MR加粗的频点和RSRP就是每条MR按频点取最优记录,蓝色底的频点为运营商1频点,橙色底的频点为运营商2频点。
(4)异网覆盖栅格指标的生成
采用空间聚合算法,根据MR的AGPS经纬度按照一定栅格大小进行栅格化[8]。比如划分为10×10的栅格,在同一个栅格下不同MR的同一个频点RSRP提取算术平均值,得到栅格内每个运营商每个频点的RSRP均值,最后提取同一个运营商不同频点的RSRP均值最高者值作为运营商栅格的覆盖指标,比如表3中编号为1002210042的栅格的其他运营商1覆盖指标为-95,其他运营商2的覆盖指标为-98。当栅格的覆盖RSRP指标小于-105 dB即认为弱覆盖栅格。
根据主频点过滤算法,假设其他运营商1的主频点为38 950,表2的编号为1006310022栅格并没有38 950这个主频点,其他运营商1将会删除这个栅格,这样更符合现网按照最优的频点信号接入的原则,可真实反应异网实际覆盖情况。
(5)异网问题区域的自动识别
通过DBSCAN密度聚类算法,首先把满足弱覆盖栅格筛选出来,并把栅格作为平面的一个点,再将栅格编号作为平面点的坐标,实现栅格编号和平面坐标关联[9]。最后将DBSCAN算法的扫描半径(R)设置为1或者,最小包含对象数(minPts)设置为10,实现相邻弱覆盖栅格的自动连片,如图3所示。异网弱覆盖栅格的自动连片构成的区域即为异网覆盖问题区域,最终实现了异网问题区域的自动识别,通过计算区域内栅格覆盖指标的算术平均值即为该区域的覆盖指标,从而实现了异网问题区域的自动测评。
(6)多网覆盖同时同地智能关联
在分析异网覆盖指标的问题区域,可根据该问题区域内的栅格编号获取同一个区域同一个时间段的本网覆盖指标,也可以通过本网覆盖问题区域的栅格获取异网覆盖指标,自动实现多个运营商网络的指标同时同地智能关联,满足不同运营商的网络覆盖、网络厚度、网络规模等指标自动对比分析的需求,有力支持移动网络的精准规划。
3 方案验证与应用
通过上述方案研发一套异网覆盖测评系统,提取系统识别的3个覆盖问题区域,与对应区域的异网覆盖的路测数据对比分析,其中路测识别问题路段表示至少连续100 m弱覆盖路段,系统弱覆盖区域表示至少10个10 m×10 m弱栅格连片的区域,整体验证的准确可达85%以上,如表4所示。其中,区域A验证情况如图4所示,多边形区域表示本方案识别异网覆盖问题区域,路上打点为路测方式获取的异网覆盖问题区域,根据RSRP信号覆盖强度分成5段,由绿色到红色,覆盖强度依次减弱,黄色与红色表示弱覆盖(即为问题覆盖区域),系统自动识别问题区域为5个,路测的问题区域为6个,匹配准确率为83.33%。
在移动网络规划、建设、优化时,需要掌握其他运营商的网络覆盖情况,对于同一片区域需要了解竞争对手的网络覆盖情况,根据对方网络覆盖好坏、区域重要性、重要用户分布等因素决定是否需要投放基站,也可以通过网络覆盖好坏而决定所采取不同市场竞争策略[10]。通过本方案研发的多个运营商网络覆盖对比评估系统,可满足上述应用需求,自动实现本网网络覆盖和其他运营商网络覆盖同时同地评估分析,可实现任意指定区域多网覆盖质量对比,如图5所示,实时全面掌握竞争对手的网络覆盖及动态变化,也为掌握竞争对手网络厚度、发展规模评估提供支撑,解决传统多网评估通过路测方式的测试采样点少、对比不全面、费用高的问题,某省每年至少节省600万异网覆盖分析的路测费用,工作效率提升至少10倍。
4 结束语
运营商的设备投入资源有限、规划站点不足将会导致移动网络出现弱覆盖、覆盖盲区等方面问题,通过本网用户上报异网MR数据分析,无需为了获取异网指标而专门进行拉网测试,实时全面掌握友商网络覆盖情况,高效实现网络指标竞争对比,有的放矢地进行网络优化和规划,逐渐缩小与友商网络覆盖质量之间的差距,降低网络运营成本和提升工作效率,具有良好的推广应用价值。后续结合人工智能技术进一步提升异网覆盖测评的准确性,在5G网络发挥更大价值,有力支撑5G网络的智慧化运营。
参考文献:
[1] 刘波. 中国移动基于MR的异运营商网络评估方案研究[J]. 电信技术, 2017(2): 19-23.
[2] 伍进. 基于移动互联网的多运营商网络覆盖评估系统设计与实现[D]. 西安: 电子科技大学, 2017.
[3] 王雅红. 基于大数据挖掘的4G网络规划研究[J]. 中国新通信, 2017,19(19): 92.
[4] 孙雪松. 基于大数据分析的电信网络质量评估系统的实现和应用[D]. 北京: 北京邮电大学, 2017.
[5] 刘通,施兆阳,陈灿,等. 基于LTE MR大数据分析的虚拟化路测应用探讨[J]. 移动通信, 2017,41(12): 1-5.
[6] 张臻. 大数据在移动通信网络优化中的应用研究[J]. 移动通信, 2017,41(5): 27-30.
[7] 刘帆. LTE网络优化方法[J]. 网络安全技术与应用, 2017(6): 1-2.
[8] 李颖. 4G网络覆盖分析及解决方案[J]. 通讯世界, 2016(24): 1-2.
[9] 李维. 基于LTEMR大数据挖掘的网络覆盖评估分析[J]. 中国新通信, 2015,17(24): 110.
[10] 王博. LTE覆盖的评估、定位和优化[J]. 移动通信, 2014,38(17): 1.