APP下载

浅谈电信行业客户重入网分析方案

2016-03-11雷蕾余凤丽

中国新通信 2016年2期
关键词:模型大数据

雷蕾 余凤丽

【摘要】 电信行业客户重入网会带来大量营销资源的无效消耗,同时带来离网率过高和用户虚增等异常现象,为此,业务分析人员通过建立模型识别出重入网客户加以管理,但是识别的准确率一直不够理想。本文总结重入网建模经验,结合大数据IT建设成果,分析各种识别方法的优劣,为模型优化提供参考。

【关键词】 重入网 模型 大数据

一、背景及研究现状分析

重入网客户行为指的是已拥有某电信运营商的A地市分公司一个移动号码的客户,由于某种原因又新买了该运营商A地市分公司的另一个同类终端产品(手机、数据卡、上网本、MIFI)的号码入网。由此消耗的营销资源包括号卡资源以及渠道销售成本,还有客户在重入网后对前一号卡进行弃卡,引发恶意欠费等现象。传统的重入网识别技术是基本信息识别、IMEI识别和社交匹配度识别,这三种技术或单独或交叉使用,但是这些识别技术准确率低,例如基于用户资料的移动用户身份识别准确率仅为42%,有待改进:1、客户基本信息在实名制还未普及的情况下,很多信息是错误的;2、IMEI识别受山寨机的影响,存在错误;3、可引入大数据实现信令数据的采集,对用户的位置信息进行定位和跟踪,从而分析两个用户是一个客户的可能性。

二、客户重入网识别方法优化方案介绍

以下介绍三种模型优化的方法。

2.1客户基本信息校验

客户基本信息主要包括姓名、家庭住址和身份证,先对客户信息的有效性进行验证,仅在信息有效的客户中识别重入网用户:

1、姓名识别,剔除:

以下一个或多个词语的用户:“预开”、“营业厅”、“开户”、“直邮”、“套卡”、“代销”、“中心”、“批量”、“批开”、“直供”;

中文字符小于2个的。

2、家庭住址识别:剔除中文字符小于2个的。

3、身份证有效性识别,为防止客户乱填,号码有效性识别如下: 参数1:取前17位数字,以i表示其所在位数,从左向右依次为17、16、15...2、1;参数2:每一位上的身份证号码数字记为Ai 参数3:计算MOD(2^i,11),记为Wi;参数4:将每一个Ai与对应位置上的Wi相乘。

将参数4得到的17个数值求和,然后除以11求余数,得到一个数值n

通过n在下面的对应表中进行查表,得到最终的校验位字符:

计算值n 0 1 2 3 4 5 6 7 8 9 10

校验码 1 0 X 9 8 7 6 5 4 3 2

2.2IMEI信息有效性校验

采用IMEI识别之前,先判定客户的唯一有效IMEI,主要分为以下两种判定方式:

1、剔除1个IMEI对应多个号码的情况,即山寨机:

IMEI号对应3个以上号码;

IMEI长度小于14个字符;

IMEI字符全是0或者空的。

2、剔除1个号码对应多个IMEI 的情况,这类客户可能存在频繁换机情况:

IMEI号对应3个及以上号码 ;

用户2个IMEI号,取一个月内使用天数最多的标识为用户的唯一有效IMEI。

三、引入用户位置轨迹匹配

同一个客户的上班地点、住宅地点相对固定,而且该客户出现在这类地点的时间遵循一定的规律,所以,通过比较两个用户在上班地点和住宅地点,来识别两个用户是一个客户的可能性。首先,按照工作日白天、工作日晚上、休息日白天、休息日晚上来划分时段;其次,A口信令数据在客户进行位置移动、开机、关机、通话时等操作会产生数据,无以上操作时,将按照一定的时间间隔进行采集,由此可以计算出客户在该基站下的逗留时长;最后,匹配客户在这四个时段的相同位置的逗留时长,即可评估两个用户是同一客户的可能性。

四、总结及下一步发展

经过对比测试,对客户基本信息和IMEI信息进行校验后,分别有30%和38%的信息正确可用,只针对信息有效的用户识别,重入网准确率达到75%;其余客户基本信息和IMEI信息错误的用户,采用交往圈和位置轨迹匹配的方案提升重入网客户识别的覆盖率,这部分用户通过外呼确认,准确率为48%。总体而言,通过三种方法的引入,能有效提升模型识别的准确率。通过加强社会渠道的管控,随着实名制的普及和携号转网业务的发展,重入网客户可在业务办理时即得到识别和控制。

参 考 文 献

[1]温瑞军.移动代理商渠道养卡套利行为识别与治理[J].电子技术与软件工程,2015(3):54-55.

[2]罗亚.移动电话用户重入网识别及营销建议.北京邮件大学硕士论文,2010.

[3]王征,包磊.基于网络访问项序的移动用户重入网身份识别方法[J].大连理工大学学报,2015(2):016.

[4]日发帖赵丽莎.基于数据挖掘的电信客户重入网预测系统的研究.昆明理工大学硕士论文,2014.

猜你喜欢

模型大数据
自制空间站模型
从勾股定理到“一线三等角”模型
模型小览(二)
导数中涉及“[ex,l n x]”的模型
圆周运动与解题模型
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
离散型随机变量分布列的两法则和三模型