手机上网零流量用户“破零”模型的研究与应用
2013-02-28黄潇聪
黄潇聪
(中国电信股份有限公司深圳分公司网络操作维护中心 深圳518048)
1 引言
技术革新让互联网得以快速发展,智能终端的出现加快了移动互联网的普及。目前我国网民规模的发展进入一个相对平稳的阶段,据中国互联网络信息中心统计,截至2012年6月底,我国网民数量达到5.38亿人,互联网普及率为39.9%。其中手机网民数量达到3.88亿人,较2011年底增加了约3 270万人,网民中用手机接入互联网的用户占比由2011年底的69.3%提升至72.2%,手机成为我国网民上网的第一大终端。
在移动互联网蓬勃发展的今天,各大运营商不断加大对Wi-Fi宽带接入、传统2G移动互联网接入(cdma2000 1x、GPRS),尤 其 是3G移 动 互 联 网 接 入(Ev-Do、WCDMA、TD-SCDMA)的网络运营力度。流量经营理念的提出让运营商的经营发展模式出现了本质的变化,流量的价值成为运营商未来的核心价值所在。
在运营商不断扩大3G移动互联网市场份额的同时,一些问题也逐渐呈现,如用户流量ARPU值低、零数据流量用户占比高、在网时间短等。这些问题的出现,将严重影响运营商的用户群体质量。
本文针对零数据流量手机用户占比高的问题,从网络运营数据中探索能促使用户流量“破零”的分析模型,挖掘培养传统手机用户使用手机上网习惯的方法,让更多的手机用户使用移动互联网,降低零数据流量用户占比,提高移动业务用户群体的质量。
2 研究现状与研究思路
中国电信股份有限公司某分公司(以下简称电信某公司)市场部提供的数据显示,在2012年年初的两个月内,3G用户中零流量用户占比较高,且每月呈上升趋势,这对用户群的整体质量有不可忽视的影响。根据电信分公司的KPI考核条件,还可能影响电信分公司的绩效收入。因此,急需提升整体3G用户的活跃度,减少零流量用户占比。零数据流量用户和“破零”用户的定义如下。
·零数据流量用户:持续在网,且连续3个月未产生2G及3G上网流量的手机用户。
·破零用户:持续在网,且前3个月连续未产生2G及3G上网流量,但第4个月产生2G或3G上网流量且非新开户的手机用户。
用户使用业务时将产生海量的流量数据,其中隐含了大量有价值且可挖掘的信息,如用户基本信息、内容信息、流量流向等。本文将着眼于用户在网络层留下的行为轨迹,并对此展开深入的分析挖掘。
要进行基于用户的数据价值挖掘,首先需要了解能掌握的信息。通过各类网管平台,能得到以下几类信息。
(1)产生移动互联网流量之前
用户使用移动互联网之前,仅能通过以下信息对其展开相应的分析。
·用户基本属性:所属地域、用户年龄、消费水平、用户类型(个人客户、政企客户等)。
·语音短信属性:语音主被叫次数、短信主被叫次数、语音主被叫时长、语音短信地域分布。
·终端特征属性:终端型号、终端类型(智能/非智能)、网络类型(2G/3G)、终端价格。
·业务特征属性:是否宽带用户、是否有加装流量包、流量包内含流量大小。
(2)产生移动互联网流量之后
当某种特定条件促使用户接入并访问了移动互联网时,其将留下移动互联网的行为轨迹,包括关注的网站地址、关注的网站类型、网站地址的访问次数、首个访问的网站地址等内容。
下面将通过对已破零用户的用户基本属性、语音短信属性、终端特征属性、业务特征属性以及移动互联网行为属性进行分析总结,从已破零的用户群体中挖掘可以促使用户数据流量破零的用户模型。
2.1 对分析样本的分析挖掘
本文分别从某本地网的移动AAA话单、天翼用户出账清单中进行筛选,提取了两个分析样本,分别是:4.3万户2011年12月破零用户和10.7万户2012年1月破零用户,并对其进行了深入的分析挖掘。分析样本筛选示意如图1所示。
图1 分析样本筛选示意
2.1.1 用户基本属性
对两个分析样本的用户进行分类统计后发现,用户群体年龄分布类似:中年用户占比最大,其次是青年用户,大部分为碎片时间较多的上班族用户。中年用户和青年用户这两个群体是挖掘“潜在”破零用户的重要参考条件,样本用户的年龄段分布如图2所示。
2.1.2 语音短信属性
手机用户产生上网行为前,其短信及语音行为是其仅有可分析的用户行为。在2011年12月破零的4.3万户样本中,约有0.5万用户在3个月(10月、11月、12月)内 未产生语音及短信记录,可以判定为上网卡用户,不作为本文的分析对象,故有效样本数量为3.8万户,该样本的语音、短信使用活跃度趋势如图3所示。
图2 样本用户的年龄段分布
图3 有效样本的语音、短信使用活跃度趋势
通过图3可以看出,破零用户在流量破零前后始终保持了一定的终端使用活跃度。根据统计数字推测,可以初步将“语音主叫50次/户月”及“短信主叫10次/户月”作为零流量用户的活跃度临界值。
在此,将符合“语音主叫50次/户月”或“短信主叫10次/户月”条件的用户定义为准活跃用户。经统计,破零前两个月的语音、短信次数平均值达到准活跃用户标准的用户占比为36.1%,而在流量破零后增长至50%,是破零的主要用户。另经统计,短信活跃用户的语音活跃度远超过平均值,其分布如图4所示。
图4 短信活跃用户的语音活跃度趋势
短信活跃用户的语音活跃度较高,且该用户群(两月内单月短信主叫次数达到10次/户月及以上的用户)的年龄、流量套餐分布情况与样本用户群的总体分布情况类似。仅通过筛选短信活跃程度,也可以精确圈定破零用户群,简化分析模型。
2.1.3 终端特征属性
经统计,两个样本用户群中,用户使用排行前8名的终端型号如图5所示。
图5 破零用户的终端型号前8名排行
可见,破零用户的终端以中低端机型为主,其中3G终端占了约70%的份额,是主要的终端类型。
2.1.4 业务特征属性
根据用户办理业务时所登记的信息,对样本用户使用的流量包进行统计分析,其分布如图6所示。
图6 样本用户的流量包大小分布
从图6中可以看到,两个样本用户群的流量套餐分布情况类似:破零用户的流量包主要集中在0~50 MB及100~200 MB两个区间,多数为订购手机或宽带套餐赠送的流量。说明分析样本中已破零的用户群对手机上网的需求不大,这使其容易成为流量沉默用户,但同时也是发生流量破零的最大潜在用户群。建议针对这部分用户从用户关怀、资费优惠、优质内容宣传推送等角度开展立体式攻坚营销,使该用户群的流量不但可能破零,且有可能产生流量包套餐升级需求。
2.1.5 移动互联网流量行为
通过对样本用户破零当月的WAP访问行为记录进行标准化加工、合并整理,在剔除代理服务器等非用户访问URL后,提取访问热度排行前8名的URL访问记录,整理2011年12月及2012年1月破零用户WAP上网行为热度排行榜,如图7所示。
图7 破零用户的WAP上网行为热度排行
从图7可以看出,“百度图片服务器”、“安智市场”及“手机百度网”是访问最多的3个URL地址,而QQ空间、新浪微博等热门应用也出现在热度排行前列。说明智能机特有而丰富的3G应用对于沉默用户破零是巨大的吸引和诱惑,做好用户群界定,借助热门应用的吸引力,不断对零流量用户进行针对性宣传,将促使用户流量破零并提高用户的流量。
进一步对样本用户的上网记录进行筛选,热度排行前8名的首次用户WAP上网行为如图8所示。
图8 破零用户的首次WAP上网行为热度排行
由图8可以看出,UC浏览器、互联星空、来电通、天翼空间等预安装应用占据了热度榜前列,说明智能机上预装的热门应用对于拉动沉默用户破零有着良好的促进作用,尤其是用户喜爱的热门预装应用。
2.2 已破零用户的流量保持情况
经过持续两个月对已破零用户的观察,发现约有60%的用户在破零后两个月内仍保持手机上网流量。已破零用户的流量保持情况分布如图9所示。
通过图9可见,破零用户的流量黏度较高,进行潜在破零用户的挖掘对流量经营有重要意义。
2.3 潜在可破零用户群的模型构建及应用
经过上述从客户基本属性到客户行为属性的分析,可以看出已破零的手机用户在各种属性中的分布情况。通过对这些属性进行整合,最终可以形成一个用于挖掘大机率破零用户的模型,其主要判断条件为:两个月内,其中一个月短信使用次数达到10次/户月及以上的零流量用户。细化筛选条件包括:业务、终端属性特征,套餐流量>30 MB、3G终端用户、宽带用户;用户基本属性,青年(18~40岁)、中年(41~60岁)。潜在可破零用户群挖掘模型示意如图10所示。
通过图10的模型对潜在的天翼手机移动互联网用户进行挖掘,给营销部门提供“潜在数据流量破零用户清单”,可以协助前端营销部门更精确地挖掘潜在的客户价值。此外,通过向低零流量用户推送手机上网行为热度排行榜,可促进其互联网行为习惯的培养,增加用户黏度。
图9 已破零用户的流量保持情况分布
图10 潜在可破零用户群的挖掘模型示意
3 结束语
互联网的多样性使得用户的上网行为千变万化,通过大面积的抽样分析可以发现,海量的用户属性、上网行为均呈正态分布。对于移动网络也一样,应立足现有的用户信息数据资源,对用户的信息进行分类归总,找出大多数用户共有的特征及行为喜好。
通过分析移动互联网用户的特征筛选出特定的用户群体,而对这部分用户群体推送符合该群体喜好的行为将可能引起用户共鸣。结合不断更新的上网行为排行榜,利用短信推送等手段将大部分用户关注的内容向新用户推送,将逐渐培养其使用移动上网的习惯,促进手机上网零流量用户“破零”。
1 中国互联网络信息中心.中国互联网络发展状况统计报告,2012