基于大数据的室内网络综合分析系统的研究和应用
2015-11-30李亚叶敏
李亚, 叶敏
(中国移动通信集团设计院有限公司安徽分公司,合肥 230041)
基于大数据的室内网络综合分析系统的研究和应用
李亚, 叶敏
(中国移动通信集团设计院有限公司安徽分公司,合肥 230041)
针对当前电信运营商GSM/TD-SCDMA/TD-LTE/WLAN四网业务的管理中缺乏直观的呈现手段,数据分析的粒度不够精细化,数据支撑不够有效等问题提出了一种基于大数据的室内网络综合分析的解决方案,通过细化到楼宇的数据采集以及打通相关系统的数据接口,实现一套信息管理工具,可有效提高管理水平和效率。
室内网络综合分析;GPS定位纠偏;用户与楼宇精准匹配算法
1 引言
随着安徽城市化进程的不断加快和电信运营商GSM/TD-SCDMA/TD-LTE/WLAN四网的快速发展,对网络和用户需求的精细化分析和管理日益重要,迫切的需要一种直观的管理手段,精细化定位和分析市场开拓、终端营销、规划建设、维护优化的重点目标。
本文提出了基于大数据的室内网络综合分析系统的研究和应用,通过本系统的建设,将用户行为信息精准定位到楼宇并直观呈现,从而实现精准的规划优化、市场推广、终端营销,并极大的节省了人工成本,为企业的可持续发展提供了重要支撑。
2 关键技术介绍
2.1 HTML5
HTML5是用于取代1999年所制定的HTML4.01和XHTML1.0标准的HTML标准版本,现在仍处于发展阶段,但大部分浏览器已经支持某些HTML5技术。HTML5有两大特点:首先,强化了Web网页的表现性能。其次,追加了本地数据库等Web应用的功能。在很多场合,我们提到HTML5时,实际指的是包括HTML、CSS和JavaScript在内的一套技术组合。它希望能够减少浏览器对于需要插件的丰富性网络应用服务(RIA,Plug-in-based Rich Internet Application),如Adobe Flash、Microsoft Silverlight的需求,并且提供更多能有效增强网络应用的标准集。
2.2 MongoDB
MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富、最像关系数据库的数据库。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。
3 技术方案
以往的网络和用户行为分析仅能定位到小区级别,本系统建设了一套基于大数据的室内网络综合分析体系,通过楼宇和用户匹配算法,形成了定位到楼宇级别的用户行为指标。本体系分为3层:数据采集层、服务层(数据分析层)、应用展现层,技术架构图如图1所示。
3.1 数据采集层
数据采集层通过开发网管和地图接口,从网管系统和A+Abis系统自动获取网络质量和业务数据,并采用自动采集方式从互联网地图获取楼宇信息。
3.1.1 系统接口自动获取业务数据
与网管系统和A+Abis系统建立系统接口,获取网络指标和用户行为数据。系统建立FTP服务器存储接口文件,本系统通过FTP协议访问网管系统并下载接口文件,实现接口文件异步传输。
3.1.2 自动采集互联网地图的楼宇信息
通过互联网地图信息采集模块自动
采集互联网地图的楼宇信息并导入系统。
本模块通过互联网地图的兴趣点(POI)的分类检索接口统一采集楼宇相关信息,并对采集的数据进行过滤筛选,将名称、经纬度、地址等关键信息保留,并与楼宇信息库进行匹配,确定楼宇的标注状态。
3.2 服务层(数据分析层)
服务层从地图的信息采集和纠偏、用户信息和楼宇信息关联匹配、规划优化和市场营销的建议流程等维度挖掘算法,并为应用层提供支撑。
3.2.1 互联网地图经纬度纠偏算法
(1)互联网地图安全偏移情况现状
目前互联网地图公司(如:百度地图、搜狗地图、谷歌地图等)均按照国家对地理数据安全的要求对经纬度信息进行处理。未经纠偏处理的互联网经纬度与GPS经纬度之间的误差范围为300~500 m。不经过纠偏处理,就无法与现网的网络信息、资源信息相匹配,无法对楼宇、用户、行为准确定位,也就无法指导规划优化和市场营销等应用。
(2)纠偏算法
本系统提出一种纠偏算法,实现互联网经纬度到GPS经纬度的转换。百度API提供GPS经纬度A到互联网经纬度B的转换接口F,但从B到A的逆向转换没有提供接口,本纠偏算法提出一种从B到C的逆向转换算法,经验证C与A的偏差在10 m以内。本纠偏算法流程如图2所示。
本纠偏算法中主要采用欧氏距离和聚类算法等核心算法。
图1 技术架构图
图2 地图纠偏算法流程图
欧氏距离计算函数如下:
聚类算法计算函数如下:
(3)纠偏效果
通过选取实际的GPS数据,通过算法验证后,偏差达到10 m以内,平均为4.63 m。
3.2.2 自助监测和更新采集信息
通过互联网地图信息采集模块自动采集互联网地图的楼宇信息并导入系统,通过监测互联网地图的信息更新,实现楼宇的自动更新和提示功能。
本模块主要针对互联网地图中楼宇的相关信息进行统一采集,通过兴趣点(POI)的分类检索对楼宇信息进行筛选,获取POI中与符合楼宇属性的点并定期进行自动采集和匹配,对变化的信息进行更新和提示。
3.2.3 多维度用户信息关联匹配算法
实现多维度用户信息关联匹配算法,关联A+Abis系统获取的用户级别信息、网管系统获取的小区信息和楼宇信息,将离散的用户与楼宇相匹配,实现信息与楼宇的关联。本系统提出了以下几个算法实现多维度用户信息关联匹配。
(1)精确定位用户经纬度
根据当前时段室内用户占用的小区地理位置、方位角及小区占用比例,通过中点求值算法计算用户经纬度,并结合地理识别因子,最终将用户位置精确地定位出来,确定用户经纬度信息。
该算法的主要思想是:根据测量报告中不同小区电平值的强弱和各小区覆盖、地理位置情况判断用户距不同小区的距离,从而定位用户位置,用户定位示意图如图3所示。该算法在A+Abis平台中实现,本系统可直接调用用户经纬度信息。
图3 用户定位示意图
(2)用户行为信息归属楼宇的匹配算法
根据中心点求值算法计算用户经纬度与楼宇经纬度的归属匹配。目前,仅支持与楼宇经纬度点匹配,后续将扩展到结合楼宇的面积,将实现用户经纬度与楼宇面积边界的匹配算法。
用户归属楼宇的匹配算法主要思路为:以用户经纬度基准,判断与周边楼宇位置的距离,将该用户归属到距离最近的楼宇。用户行为归属算法示意图如图4所示。
图4 用户行为归属算法示意图
(3)小区级数据的楼宇均衡算法
根据当前小区归属楼宇列表,结合楼宇的面积和用户数,用户场景类型等因素,结合影响因子,通过加权均衡算法,计算楼宇的小区级数据。详细公式如下:
KA=(X1/( X1+X2+…+Xn)×F1+Y1/(Y1+Y2+…+Yn)×F2)×K
其中,X1为楼宇A的面积、F1为面积影响因子、Y1为楼宇A的用户数、F2为用户数影响因子、n为楼宇个数,K为每个Cell的业务量,KA为经过加权均衡算法计算的楼宇的业务量。
图5 应用建议算法示意图
3.2.4 应用建议算法
基于楼宇的建设情况、业务量、覆盖率和TD终端占比等信息,提出规划优化和市场营销的规划建设的判断算法,详细流程如图5所示。
3.3 应用展现层
本节列举两个应用展现层模块,作为系统实现举例。
3.3.1 地图直观呈现和修正模块
所有物业点和楼宇以地图元素的形式展示,形象直观,一目了然。支持楼宇信息和物业点信息以及四网信息的管理和呈现,便于直观比较四网与楼宇信息的位置。
3.3.2 多维度统计分析模块
提供当月实时分析、历史数据分析、质量预警、后评估等4个统计分析功能,实现多维度的楼宇级的用户行为分析和呈现。
4 成果应用
本系统投入使用前,全省楼宇原有的测试、维护,通过对数据进行分析输出各类市场和优化结论,合计约2 500个人天。系统使用后仅花费25个人月,合计750个人天。节省了大量的人工,大幅提升了工作效率,节省了70%的人天。
5 总结
本文探讨了大数据的室内网络综合分析系统的研究,系统首先可以自动采集互联网地图信息和定期更新,节省人工成本,降低信息出错率;其次提出了一种互联网经纬度反向纠偏算法,实现了对地图信息的自动纠偏和匹配;同时提出用户与楼宇的精准匹配算法,实现用户行为信息定位到楼宇;最后可以实时分析指标数据,高效输出规划优化和市场营销建议。该系统应用后大大提升了全省楼宇基础资料的完备性,并可高效输出市场营销和规划优化数据,同时大幅提升工作效率,具有很高的实用价值。
[1] 张威. GSM网络优化原理与工程(第2版)[M]. 北京:人民邮电出版社,2010.
[2] 周炯磐. 通信原理[M]. 北京:北京邮电大学出版社,2003.
[3] UMTS30.03 3GPP TR101.112v3.2.0 Selection procedures for the choices of radio transmission technologies of the UMTS[S]. 1998.
[4] Jaana L, Achimi W, Tomas N, Radio Network Planning and Optimisation for UMTS[M]. New York: John Wiley Sons Inc, 2002.
[5] 肖清华. TD-LTE网络规划设计与优化[M]. 北京:人民邮电出版社,2013.
Research and application of indoor wireless network analysis system based on big data
LI Ya, YE Min
(China Mobile Group Design Institute Co., Ltd. Anhui Branch, Hefei 230041, China)
The management of GSM/TD-SCDMA/TD-LTE/WLAN network of telecom operation contains some issues as follows: lacking directly presentation, data analyse is not accurate enough, data source is not effective. To solve these problems above, this article provided a solution which can promote the standard and efficiency of management through an online information system which need gather building datas and construct interfaces with other systems.
indoor analyse; GPS rectifi cation; algorithm of U2B
TN915
A
1008-5599(2015)03-0026-05
2015-02-24