移动大数据应用助力实现G/T双网分流
2014-06-09中国移动陕西分公司周宏旭陈涛
中国移动陕西分公司 | 周宏旭 陈涛
移动大数据应用助力实现G/T双网分流
中国移动陕西分公司 | 周宏旭 陈涛
通过移动大数据技术,可实现3G客户和业务量在3G与2G网上的分布统计分析,精确衡量3G对2G网络业务量的分流效果,指导网络分流优化、3G终端和业务的市场营销工作高效开展。
当前市场上的中国移动3G商用终端大部分仍是GSM/TD-SCDMA双模终端,由于3G网络目前仅覆盖城市主城区、县城和部分热点乡镇,网络覆盖范围远小于成熟的2G网络,因此从保证客户服务质量出发,在TD网覆盖和质量良好的区域,客户可以使用TD网进行通信;在其网络服务质量无法保证的区域,客户终端可以依托于GSM网络进行正常通信。
从市场运营和网络服务质量保障而言,中国移动3G客户的业务量应该大部分承载在TD-SCDMA网络上,但从网络对语音和数据业务量的统计能力上看,存在一个网络无法统计的问题:TD网可统计到G/T双模终端客户在TD网上发生的语音和数据流量,但GSM网络无法区分G网单模客户和G/T双模客户,因此不能统计3G终端客户在G网上发生的语音和数据业务量。现有网络统计工具无法准确评估TD终端客户和其业务量在G/T两网上的承载情况,不能全面掌握客户业务量发生地点信息,难以有效实现对客户业务量集中地点进行网络问题排查分析,不便进行G/T两网精细协同优化及客户网络质量感知的提升。
为解决这个问题,笔者结合现有网络测试统计数据和计费统计数据,运用大数据分析方法,提出一种全新的统计分析方案。通过移动经营分析系统平台,统计分析TD客户在TD网络和GSM网络上的最小承载单位小区级别的客户数和业务量承载情况,对TD客户计费数据进行发掘。在此基础上,结合每个小区的G/T网络归属的属性,汇总统计出TD整体客户的客户数、语音通话时长、数据流量在2G/3G网络上的分布情况。统计结果可用于指导2G/3G网络的协同优化调整,亦可用于指导市场营销部门进行3G终端、业务分区域和客户的精确营销工作。
基于移动网络统计和计费统计两方面数据的采集和集中处理,可以实现网络和市场两个独立业务部门之间的数据联合分析,弥补各自专业分析的不足之处,实现1+1>2的协同双赢效果。通过移动大数据技术,可实现3G客户和业务量在3G与2G网上的分布统计分析,精确衡量3G对2G网络业务量的分流效果,指导网络分流优化和3G终端和业务的市场营销工作高效开展。
系统建模
1.3G客户识别
TD网络上承载的客户必然是3G客户;GSM网络上承载的客户可能是2G客户;也可能是3G客户;虽然无法通过客户手机号码来识别客户使用2G还是3G网络,但可通过客户使用终端的EMEI(设备识别码)中的8位TAC码来区别终端是否支持3G网络,因为2G/3G双模终端的TAC码与2G终端字段不同。通过识别TAC码,可将3G客户划分为TD手机终端客户、TD无线座机客户、TD上网卡(本)客户三类。
2.2G/3G网络区分
通过3G客户通信计费数据记录CDR中的小区识别码CELL ID和位置区代码LAC(local area code),区别客户通信时所占用的网络是G网还是T网,2G网络和3G网络小区CELL使用的CID码可能会重复,LAC码也有2G/3G网络公用的情况,但CID+LAC不会重复。陕西移动3G网络使用LAC号段与2G网络全不相同,网络识别相对简单。
3.2G/3G网络承载客户数和业务量的计算
将属于G网的全部小区承载的3G终端客户数和其产生的语音和数据流量分别求和,就得到了双模终端客户在G网上的客户数和相应业务量;将属于TD网的全部小区承载客户数和业务量求和,就得到了3G客户在TD网上的业务量。
4.3G网络覆盖区内外G网的区分方法
由于TD网络覆盖区域小于GSM网络,因而存在部分G/T双模终端客户在T网覆盖区外使用的情况,有必要统计分析这些客户的数量和业务量情况。TD覆盖区就是全部T网小区覆盖范围的集合,与所有T网小区有邻区关系的G网小区集合即可认为是TD覆盖区内G网,无邻区关系的G网小区集合即为TD覆盖区外G网。可通过在电子地图上标记出T网覆盖范围,根据覆盖范围,将G网分为TD覆盖区内G网和TD覆盖区外G网。
5.输出统计报表设定
(1)2G/3G网络小区承载3G客户和业务量报表
(2)3G客户类型和分布情况统计
(3)不同类型3G客户的语音通话时长在2G/3G网络上的分布情况
(4)不同类型3G客户的数据流量在2G/3G网络上的分布情况
6.特殊数据处理
统计漫游客户在各地网络覆盖边界产生的业务中,存在少量不可识别小区,由于数量比例较小,计入T网覆盖区外G网中。
系统搭建
1.系统实现途径
利用现有的经营分析系统进行数据发掘分析,将上述分析统计规则和报表模板输入经营分析系统,再输入3G网络覆盖区内外G网小区集合数据,结合经营分析系统采集到的原始计费数据,完成数据统计分析,输出需要的2G/3G分流统计报表,输出报表包括日、周、月3个时间维度的报表,空间维度上包括地市分公司和全省汇总的统计结果,以及全网小区级的统计结果。
2.需要占用的经分系统软硬件资源
经营分析系统硬件由IBM780服务器和EMC高端存储组成,数据库软件为IBM DB2,调度工具为亚信ETL产品。
G/T分流统计报表在数据库的最顶层由10个过程完成,日报表用到29个调度,周报表用到5个调度,月报表用到19个调度,调度数约占系统总调度数的1.5%,所用到的表共计219张,占用总空间11T左右,约占经营分析系统总存储量的5%。G/T分流统计报表对经营分析系统软硬件资源的占用比例很低,对系统上其它统计报表的运行几乎无影响。
表1 双模终端2G/3G网络小区级统计结果
统计报表呈现
该项目自2010年10月启动,2010年12月初步统计结果上线,经过持续不断的完善,至2011年8月以后达到稳定状态。主要统计分析结果示例如下。
G/T分流统计结果对相关工作的支撑作用
1.支撑市场营销推广工作
统计3G终端客户分布情况和其业务量分布情况,能够准确衡量TD网络的业务承载与双模终端投放匹配情况,一方面可以掌握3G业务与网络协同发展整体情况,另一方面可以支撑市场部门发现并锁定2G网络的3G客户,通过宣传引导客户使用更高速的3G网络。最后,通过分析TD覆盖区内承载3G客户高业务量的2G小区,指导市场营销部门进行精细化的区域客户终端和业务营销。
表2 3G客户数分布统计结果
2.支撑TD网络优化工作
比较同覆盖的T网和G网小区承载的双模终端客户数和业务量分布数据,可以发现G网承载双模客户和业务量高TOP小区,针对性地排查其相邻T网小区的覆盖和G/T互操作参数设置是否存在问题,从而结合客户需求进行精确的网络优化调整,解决局部T网存在的问题,支撑3G客户和业务发展。
3.支撑网络规划建设工作
统计分析3G客户业务量在T网覆盖区内G/T两网上的分布,可用来评估T网的实际有效覆盖率。
统计G/T双模终端客户和业务量在T网覆盖区外G网小区的分布情况,可以用来支撑T网覆盖扩张的精确规划。
主要创新点
1.建立了双模客户在G/T两网上的分布统计功能,实现了宏观层面T网客户使用T网比例统计分析功能,以及客户在T网覆盖区内外G网上的分布情况统计。
2.建立了双模终端客户的语音通话时长和数据流量在T网及T网覆盖区内外G网三块区域的分布统计功能,实现宏观层面全省和各地市T网对G/T双模客户业务量的分流统计。
表3 3G客户语音通话时长2G/3G网络承载统计结果
表4 3G客户数据流量2G/3G网络承载统计结果
3.建立了微观层面的双模终端和业务量在G/T两网小区级别上的统计功能,可用来衡量小区的T网分流效果,发现G网高双模终端数和高业务量小区,发现T网低客户数和低业务量小区。
总结
该项统计方法从2011年12月起应用于陕西移动全省T网络承载业务量统计分析,实现了对各地TD网络分流效果的精确评估,帮助各分公司发现分流工作弱项,推动网络建设和优化及终端营销工作的精细化。
在此统计分析方法的帮助之下,经过全省网络和市场部门的共同努力,2013年全省使用T网络的客户比例较2011年提升16%,T网覆盖区内T网语音时长占比提升17%,T网承载TD客户数据流量占比提升15%,T网分流效果显著提升。
随着2013年下半年中国移动大规模启动TDLTE网络建设,2G/3G/4G多模终端在2G/3G/4G网络上的业务量承载情况也就成了一个新的课题。参照3G多模终端业务承载分析解决方案,陕西移动在2014年3月在经分系统上实现了4G客户和其业务量在GSM/TD-SCDMA/TD-LTE3张网上的分布情况统计功能。
本成果是一个创新型的统计分析方法,解决了无法精确分析中国移动多模终端客户及其业务量在2G/3G网络上的分布问题,虽未产生直接经济效益,但可帮助网络优化人员和市场营销人员发现存在的问题,从而有的放矢解决问题,间接提高经济与社会效益。