APP下载

应用大数据分析自动识别边界漫游小区

2014-05-18

信息通信技术 2014年6期
关键词:计费漫游通话

中国联通江苏省分公司 南京 210029

引言

边界漫游(Border Roaming)指的是在处于行政区划交界处的两地(省或地级市)基站出现信号交叉覆盖现象[1],如果两地信号强弱不同就可能发生边界漫游,造成用户实际地理位置处于本地行政区的情况下使用了非本地行政区的基站信号,生成漫游话单,从而产生不应有的长途费、漫游费,使用户多支付了通信费用。

为解决由于边界漫游话单多收用户长途费、漫游费而引发的客户投诉问题,移动业务计费系统会对处于边界地区的基站小区作为边界漫游小区进行特殊标识,对在这些特殊小区内产生的漫游话单重新按非漫游计费方式进行批价处理,因此,边界漫游小区[2]标识是否及时、准确就成为边界漫游计费是否准确的关键所在。随着中国联通业务规模的高速增长,通信网络也在同步进行着大规模的建设和扩容,网络的不断调整优化使得边界漫游小区信号的覆盖范围频繁变动,传统的边界漫游小区手工维护方式很难做到及时准确,特别是相邻省分的小区调整更难及时更新。

本文分析的重点是通过大数据分析方法,自动识别边界漫游小区, 做到数据与业务的完美结合,改善工作流程让工作更加高效,从而保证新增加的边界漫游小区及时添加到计费系统中,解决由于边界漫游话单多收用户漫游费而引发的客户投诉,提升联通对用户的服务品质,减少用户投诉引起的话费返还等维系成本;对网络调整后不再是边界漫游小区的及时发现并删除,避免真实漫游话单当作本地话单进行批价而造成话费损失。

1 边界漫游分析的原因和目的

1.1 边界漫游产生原因

边界地区的基站信号太强以致对相邻区域产生了覆盖,这是导致边界漫游问题的根本原因[2]。如:当用户处于北京和河北交界处时,由于信号覆盖范围受天气、建筑、树木等影响,会出现不稳定的情况,哪边的信号强,手机就会切换到信号强的网络。各地频繁进行网络建设与优化调整,造成部分边界地区存在基站信号互相干扰、越界覆盖等问题,加强地区间协作是解决问题的关键。

边界问题一直是无线网络优化的难点,在频率割接及日常优化工作中关注较少,存在问题较多,并且边界基站本身具有3个特点[3]。1)基站稀疏,覆盖较远,切换较城区少;2)对网络总体指标的影响较大;3)用户拨打电话时容易引起掉话;因此,对边界漫游小区进行全面检查、调整优化就显得非常重要。

边界漫游小区的界定是边漫工作中的瓶颈,由于两个区域边界的基站信息不能实时共享、网络不断的变化,很容易造成边界漫游小区过少或遗漏的情况,所以,边界漫游小区的正确性和完整性非常关键。

1.2 边界漫游分析的目的

1.2.1 准确识别边界漫游小区

运用数据分析方法,从客户感知出发,切实跟踪客户使用情况,还原边界漫游场景,从而形成一种全新的边界漫游小区的识别方式。与传统方式相比,该方法更贴近客户实际使用,识别过程中一方面能发掘地理位置上不易觉察的边界漫游小区,另一方面可对路测中发现但实际鲜有用户接触到的小区从边界漫游小区中剔除。两方面结合,修正边界漫游小区信息,使边界漫游小区的识别更为准确。

1.2.2 提高运维人员工作效率

数据与业务的完美结合、工作流程的改善让工作更加高效,仅需对计费话单进行周期性分析,即可充分观察到边界漫游的发生情况,足不出户即可对边界漫游小区分布情况有精准的判断,在提高识别精度的前提下避免了大量实地路测的工作量。

在时效性方面,传统方式与他省边界位置的信息交换需要依赖人工传递,时间延迟过于被动。现有方式通过主动分析用户清单,在更短的周期内就能达到识别新的边界漫游小区的效果。

2 边界漫游分析的实施

2.1 边界漫游分析思路

2.1.1 分析前提条件

从IT系统走向大数据决策,着眼点在于未来服务,通过大数据、云计算的处理分析手段,实现业务综合治理、开拓新应用、创造公司利润、降低公司成本等目标,实现这个目标需要具备如下三个前提条件。

1)新技术契机:云计算技术成熟应用的契机,使我们能利用新技术达到以前传统方式所达不到的效果。

2)公司战略要求:大数据统一支撑的新管理模式要求提供信息武器,展现大数据信息价值。

3)公司内部需求:公司对网络运维工作的高效率要求与传统运维工作的现状不匹配。

2.1.2 自动识别思路

边界漫游小区自动识别是通过对客户语音清单的深度分析,探索实际发生边漫特征的小区,从而辅助边界漫游小区计费处理的一种方法。该方法需要对清单进行分析处理识别疑似边界小区。用户在较短的时间内进行两次通话,两次通话分别是本地通话和漫游地通话,则可认定本地通话的基站小区和漫游地通话的基站小区为疑似相邻边界漫游基站小区。一段时间内两个基站小区成对出现的次数越高,成为相邻边界漫游基站小区的可能性越大,影响用户范围越广,流程如图1所示。

运用云计算技术处理清单数据,能够高效率、可持续地计算处理清单,并稳定地执行分析流程,确保结果稳定落地并应用。

图1 识别流程

2.2 边界漫游分析的实施

2.2.1 分析准备工作

1)数据准备。①确认本次分析清单的分析周期;②剔除错误异常清单后提取计费系统上月全量漫游话单,仅选取对本次分析有关联的字段(如表1所示);③计费系统提供最近的边界漫游基站参数信息。

表1 有关联的字段

2)算法选择。本次采用的是主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析[4]。

在很多情形下变量之间有一定的相关关系,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中取出几个较少的综合变量,尽可能多地反映原来变量的信息统计方法叫做主成分分析或主分量分析,也是数学上用来降维的一种方法。

3)算法原理。主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:

要从这么多变量的数据中抓住事物的内在规律性,需要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。

如果记原来的变量指标为,它们的综合指标——新变量指标为。则

在公式(2)中,系数lij由下列原则来决定:

(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;

(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。

这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。

从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。

2.2.2 分析处理流程

通过算法选择对边界漫游业务影响重要的元素,依据云计算平台的海量数据沉淀和云计算平台的强大运算能力,输出疑似边界漫游小区。

1)分析指标选择。根据边界漫游业务涉及的元素及主成分算法的理解,进行用户特征和消费特征的分析。因此,分析需要用到的主要信息可能如表2所示。

表2 分析用到的主要信息表

2)运用Greenplum分布式数据库处理算法。本次计算采用Greenplum云数据库,Greenplum云数据库软件是业内首创的大规模并行处理(Massively Parallel Processing,MPP)的数据库软件产品,它包含大规模并行计算技术和数据库技术最新的研发成果:包括按列存储数据库、数据库内压缩、MapReduce、永不停机扩容、多级容错等等。同时云计算的按需自服务、共享资源池、快速弹性能力、普遍网络访问、可度量的服务五大特点带来了一种新兴的IT开发、部署和交付模式,允许按需交付、提供信息服务,且可以在实现资源集约共享的基础上按需动态弹性分配来降低成本,优化IT服务,使沉淀和分析海量的计费清单数据成为可能,在数据沉淀、统计、分析应用中充分体现其价值。

运用Greenplum云数据库处理8月份用户通话清单,按照对数据宽表中的字段,进行主成分分析,生成识别边界漫游小区的指标,按照统计数据的范围汇总指标。对分析清单进行以下处理(以地市间漫游为例)。

地市A用户从地市A到地市B,第一条通话为非漫游通话,第二条是漫游通话,分析过程中记录以下信息:第一条话单和第二条话单的基站信息、通话开始时间、通话结束时间;两条话单的间隔(第二条话单的通话开始时间减去第一条话单的通话结束时间)。

地市A用户从地市B回到地市A,第一条通话为漫游通话,第二条是非漫游通话;分析过程中记录以下信息:第一条话单和第二条话单的基站信息、通话开始时间、通话结束时间;两条话单的间隔(第二条话单的通话开始时间减去第一条话单的通话结束时间)。

地市A用户从地市C到地市B,第一条通话为漫游通话,第二条也是漫游通话;分析过程中记录以下信息:第一条话单和第二条话单的基站信息、通话开始时间、通话结束时间;两条话单的间隔(第二条话单的通话开始时间减去第一条话单的通话结束时间)。

将以上三种分析方法数据进行合并,并且对两条话单的间隔时间进行分档处理,形成边界漫游基站360度视图。

运用分布式统计数据库处理数据的效率高于传统关系型数据。

3)验证现有边界漫游参数。通过对边界漫游基站360度视图的分析结果得到如下结论。

设定地市与边界地市单位间隔时间(如:同一用户边漫话单间隔2分钟或5分钟或其他),统计所提供的分析清单中存在多少次边界漫游通话。

地市与边界地市存在边界漫游通话,基站信息已经配置在计费系统的边界漫游信息表中。

地市与边界地市存在疑似边界漫游通话,但基站信息没有配置在计费系统的边界漫游信息表中。

在计费系统的边界漫游信息表中存在地市与边界地市的基站信息,但提供的分析清单没有任何边界漫游通话行为。

2.2.3 分析识别结果

按照上述数据模型与实现方式,系统生成8月份疑似边界漫游小区数据,以模型优化调整后的首次实际应用为例,疑似边界漫游小区数据生成后与移动业务计费系统当前配置边界漫游小区数据匹配情况如表3所示,识别模型处理的识别率达到了89.3%。

表3 数据匹配情况

同时将未匹配成功的疑似边界漫游小区交给运行维护部网络优化中心进行确认,每个地市的成对出现频次TOP10的小区共130组,确认有效达129个,准确率达99.2%,出现频次TOP30小区准确率约85%,总体准确率70%以上,说明需要增补大量的边界小区信息。

另外存在3 518个小区没有任何边漫通话数据,考虑予以剔除,以降低业务计费系统处理负荷。

2.3 边界漫游分析结果应用

固化数据生成与维护流程,首先由江苏联通信息化事业部通过数据模型每周自动生成疑似边界漫游小区,其次运行维护部对系统识别出的边界漫游小区进行全面的核查、确认,经确认后的小区由计费系统维护人员及时在系统中进行标识。通过固化的流程一方面更精准地识别出边界漫游小区,另一方面对已经加入的边界漫游小区进行跟踪,对无边漫特征的小区及时从计费参数表中剔除,从而减少对用户的错误优惠,对边界漫游小区的加入和退出形成了闭环的管理,如图2所示。

图2 数据生成与维护流程

3 边界漫游分析的效果

通过自动识别模型的有效应用,使得边界漫游小区识别流程效率和工作成效得到了很好的提升。体现了信息化技术的服务支撑能力,具体体现在以下4方面。

1)降低客户投诉。自动识别方法的使用为主动发现问题、及时更正计费处理赢得了时间,为客户及时解决问题,变被动接受客户投诉为主动服务客户,对该类型投诉量的下降和客户满意度提升将大有裨益,自边界漫游自动识别上线后,用户关于边界漫游的月均投诉量下降了2000笔左右。

2)提高识别准确率。自动识别方法每周定期测算新增边界小区,及时提供给运维部门予以确认,提高了边界小区识别的及时性。同时该方法基于真实用户感知进行分析,准确率得到大幅提高。

3)减少运营商收益损失。边界漫游小区识别能力的提升,将有效减少公司在该类投诉上产生的退费损失、减少了不必要的优惠、省际漫游等费用的支出,同时在充分保证用户感知度的前提下,有效剔除了非边界漫游小区的错误配置数据,杜绝了公司正常收益的流失。

4)提高运维工作效率。通过自动识别,系统将疑似边界漫游小区进行了有效筛选,后续人工识别的小区数大幅下降,节省了大量的人力物力成本,同时提升了整体工作流程的执行效率。

4 总结

将数据分析方法运用于边界漫游小区识别工作是一次积极的尝试,是一种工作方法的探索和创新,结果证明成效显著。江苏联通信息化事业部将继续积极探索数据分析在公司各项工作中的应用可能,主动服务各业务部门,为公司的经营发展和管理提升提供强有力的支撑。

[1]谢显忠.基于TDD的第四代移动通信技术[M].北京:电子工业出版社,2005

[2]施瓦茨,许希斌.移动通信[M].李云洲,译.北京:电子工业出版社,2013

[3]何林娜.数字移动通信技术[M].北京:机械工业出版社,2010

[4]何晓群.现代统计分析方法与应用(第3版)[M].北京:中国人民大学出版社,2012

猜你喜欢

计费漫游通话
5G网络独立组网中融合计费方案的研究
基于云计算和微服务架构的高速公路计费系统
微信上小额借款 请务必通话确认
生活中的分段计费
《戊戌元日与友人通话》
霹雳漫游堂
NASA漫游记
基于AM3354的电动汽车充电监控计费系统电表通信的实现
边走边看:漫游海底 梦想成真
3G视频通话技术获飞跃