用户行为大数据分析应用探讨
2018-10-17杨磊
杨磊
中国电信股份有限公司徐州分公司
0 综述
本文主要以数据深度挖掘、关联分析为主要手段,并基于该数据对市场前端进行业务指引。通常的数据分析划分为:
(1)业务结构:全网各类业务占比分析,展现热门业务应用;
(2)用户偏好:不同用户使用TOP业务类型,获悉用户业务使用偏好;
(3)时间轨迹:24小时网络利用情况,闲时资源让利用户,提升好感度;
(4)终端分析:定位问题终端,减少质差终端推广;终端性能比较,根据用户使用需求推荐终端。
本文的数据分析目的如下:
(1)投放热门应用相关业务:微信、优酷视频定向流量包;
(2)闲时资源让利给用户:1点到6点,网络资源闲置,可推闲时流量包;
(3)每个用户需求不同:有人偏爱视频,有人偏爱新闻,可根据终端性能推荐使用手机;
(4)挖掘潜在用户:引导高流量消耗的3G用户使用4G终端、4G业务;
(5)选择行业合作伙伴:哪个平台用户保有量最多,哪个平台访问量最大,选择热门网站实现强强合作。
1 用户行为分析
本文的用户分析,主要关联大数据分析平台,按终端类型、区域、时间点、用户标签等多个纬度进行综合分析,以便于真实、有效的反映现网用户现状。文中所使用的数据,均来自于徐州电信4G业务范围的公开数据。
图1 区域流量时段
1.1 基于行政区域维度分析
1.1.1 活跃时段分析
本节以徐州行政区域为例分类分析。对比各区县流量可发现,各区域用户的流量峰值时段,均为中午11点至下午18点之间,且在该时段内,各区域流量基本平稳,持续保持在峰值区间,可根据流量峰值分布情况选择业务推送时间。从全区看,视频类业务流量都高于浏览类业务流量;基于视频业务分析,泉山、铜山人均流量较高,邳州、新沂人均流量较低,通过对各区域用户流量使用占比进行分析,便于分区域进行业务、流量套餐推广。
图2 各区域人均业务分布
1.1.2 业务流量分析
通过分析不同用户组的流量消耗及对应APP的差异,便于针对性地进行定向流量包、套餐等推广。
(1)4G流量用户分析
在流量使用不同时,用户应用比例分布不同。徐州高流量用户视频流量较多,中、低流量用户视频流量很少。(日流量5-40M定义为低流量用户,日流量40至200M定义为中等流量用户,日流量大于200M定义为高流量用户)
1)低流量用户应用特点:腾讯应用(含微信)占56%,视频类APP占比较小;
2)中流量用户应用特点:腾讯应用(含微信)占45%,百度、爱奇艺等占比增多;
3)高流量用户应用特点:芒果TV应用占48%,腾讯、优酷、搜狐等占比34%。
(2)3G流量用户分析
使用3G卡并且使用3G终端的总体占比最多,需引导用户更换4G卡和4G终端。使用4G卡但使用3G终端的,主要分布在农村场景,需引导这部分用户更换4G终端。使用4G卡4G终端的(用户主动关闭),占比最少,其中县区中占比较高,需加大业务的宣传和4G流量推送。
1.2 基于APP使用维度分析
本部分数据主要体现徐州区域内不同用户组的4G流量消耗总量及对应APP使用时段的差异,以便于针对性地进行定向流量包、套餐等推广。
1.2.1 APP流量早晚对比
从图3可看出天翼视讯流量远超其他APP,天翼视讯、腾讯视频、优酷、秒拍等APP流量占比在晚上明显上升,而QQ、百度、淘宝、微信等APP晚上流量占比明显下降,可看出用户在晚上偏向于使用视频类APP,白天偏向于聊天类APP。
图3 常用APP流量占比变化
1.2.2 APP用户早晚对比
如图4所示,统计APP用户数情况,微信、百度、QQ及淘宝等APP用户保有量最高。微信晚上用户数占比增加最多,但流量减少,说明单用户平均流量在减少,其余各类APP白天和夜晚用户数占比变化不大。可以根据用户白天和晚上的使用习惯制定定时流量包,例如白天聊天类定向流量包,晚上视频类定向流量包。
图4 常用APP用户占比变化
1.3 基于终端维度分析
本部分数据主要对不同类型的终端进行软件使用性能分析,以便于向用户介绍更适合的终端类型,进行区域性的、针对性的终端销售推广。可根据用户的不同业务需求级别,分类进行终端推荐,比如视频业务需求较高的用户推荐使用苹果手机;网页浏览类业务需求较多的用户推荐使用华为、OPPO等品牌的手机。
1.3.1 终端型号分布
取终端类型占据前五的手机,分别列出了每款手机在分区销售前三的终端类型,详情如下:
(1)终端品牌:华为、苹果、OPPO占据前三,其中华为占比27.25%,苹果占比21.19%,OPPO占比14%,总比例达到62%左右;
(2)品牌型号:苹果手机中Phone 6、Phone 6 Plus、IPhone 6S占据前三,占比70%;华为手机中Mate 8、Ascend P7、Ascend Mate7占据前三,占比21%;小米手机中REDMI NOTE、H3A、H3X LTE占据前三,占比33%。
1.3.2 终端场景分布
从四个场景来看,除农村Che1-CL10占据第三名外,其余场景iPhone 6、iPhone 6 Plus、IPhone 6S均占前三名,说明大多数用户还是使用苹果终端;各场景苹果手机占比相差不大。
可根据不同场景开展针对性手机推销业务,比如农村场景除了苹果手机外,可推广Che1-CL10 终端。
图5 终端区域场景分布
1.3.3 终端综合性能分析
(1)视频性能
从视频下载速率来看,苹果iPhone6、iPhone6 Plus、三星SM-G935V排在前列,说明这几款终端适合视频类业务。
(2)会话性能
从http平均时延排名来看:Vivo V3L、vivo Y929、华为HUAWEI P8性能较好,接收信息快;三星SM-N9200、华为VNS-CL00、三星Galaxy Note5三款终端平均打开时延较高,性能较差。
(3)浏览性能
从页面打开时延排名来看:华为_Mate 8、Oppo_A33m、小米_H3X LTE终端性能较好,网页打开快。iPhone系列手机排名最后,主要因为此类终端的服务器大多落于国外,导致平均时延及成功率均不高。
表2 终端综合性能指标排名
1.4 基于用户群体维度分析
本部分数据主要通过用户分布区域,来定义用户分组标签,通过对不同的用户分组行为进行分析,从而进行针对性的业务推送。
1.4.1 业务分布
(1)不同用户群体业务请求分布
从业务请求来说,各群体腾讯系列的APP使用频率最高,主要为微信、QQ,新浪、百度、淘宝等APP的请求次数次之,可定位重点SP软件,进行专项感知指标提升,保障用户使用感知。
1)银行职工偏向于使用微信、淘宝、百度等APP软件;
2)医生使用微信最频繁;
3)蓝领除了微信以外,其他各类APP使用分布比较均衡;
4)公务员偏向于使用微信;
5)学生群体使用较为频繁的为微信、QQ、以及新浪网;
6)白领群体使用微信占比最高,其他业务占比很少。
(2)业务流量分布
白领、医生、学生、银行人员的流量分布主要集中在浏览类及聊天类业务上;公务员及蓝领在视频业务上花费较大流量,可针对这些业务进行适当流量推送或者制定定向流量包。
1)银行职工微信、大申社区等APP流量使用较多。
2)医职人员大申社区、微信以及爱奇艺等视频APP流量使用最多。
3)蓝领群体流量主要集中在腾讯视频、大申社区、微信等APP上。
4)公职人员爱奇艺、天翼视讯、腾讯、App Store等APP占用流量较大。
5)学生群体的视频类业务相比其他群体有很大提升,天翼视讯占比最高。(备注:天翼视讯还包括爱看4G产生的流量,目前天翼视讯、爱看4G都有定向流量包,可看出定向流量包对于拉动自有业务的使用有推动作用)
6)白领群体流量主要集中在天翼视讯以及腾讯、微信等APP。
表3 综合群体业务分布
1.4.2 用户群体综合分析
综合分析六类群体可以发现,医生、蓝领、银行人员这三个群体流量主要分布在个别时间段,且其余时段流量较为平均,整体人均流量低;学生的人均流量在六个群体中为最高,其次为公务员和白领。
(1)银行职工的流量使用高峰期在12、13、14及21点;银行人员白天的业务均为低流量业务,但中午时段及下班后,人均流量有所提升;
(2)医生人员除1时至7时流量较少外,其余时间流量消耗比较平均,峰值时段为晚上11点;
(3)蓝领群体整体的流量消耗水平偏低,但在晚上23点整体流量飙高,可在使用最频繁的23点推送广告或者业务消息;
(4)公职人员群体除1时及23时流量较多外,流量消耗整体较为平均,无明显波动趋势;
(5)从流量消耗和业务请求次数可以看出,学生群体3-6时人均流量及请求次数较低,峰值时段在早上8点,其余时段流量消耗接近,处于中间水平;
(6)从白领24小时流量及业务请求次数来看,白领群体除0-6时业务请求及流量较少,早上7点和8点为流量峰值时段,其余时段较为平均,与学生群体类似。
1.5 基于分布场景维度分析
本部分数据主要通过用户分布区域,来定义用户分组标签,通过对不同的用户分组行为进行差异分析,从而进行针对性的业务推送。
1.5.1 业务使用类型
(1)业务请求
统计徐州农村场景,微信及淘宝业务请求次数最高;统计居民区场景,业务请求次数方面,微信占比最高;商业区场景的业务流向,腾讯类业务请求次数最高。
(2)流量分析
统计徐州农村场景,流量对象除腾讯、快手以外,主要还是流向视频或社交APP;统计居民区场景流量方面,除了天翼视讯以外,主要还是流向微信、大申社区等社交视频APP或门户网站;商业区场景的流量方面,除了微信外,主要还是流向快手、大申社区、天翼视讯等社交或视频APP。
图6 区域业务分布
1.5.2 流量消耗时段
各场景的活跃时段基本吻合,业务请求的峰值时段分布在8点至18点,流量占比的峰值时段分布在10点至22点,且在峰值时段内,各区域曲线基本平稳,持续保持在峰值区间。
图7 区域流量时段
2 总结
本次用户分析从多个维度进行,相比传统指标统计模式,更高效、直观地展现了徐州现网的4G用户行为现状,体现了现网分析与大数据平台的结合效果,在一定程度上,突破了我们以往分析问题的局限性,对于提升现网指标、指引前端市场,均有良好效果。
在后续的开发过程中,将更紧密地结合各项分析需求,比如前端数据采集、用户信息、指标信息、覆盖现状、基站工参资料等等,不断地进行完善、提升,更好地适应大数据的发展趋势。