用户画像在用户价值提升中的研究与应用
2019-06-25施晓光
施晓光
【摘 要】针对互联网业务数据量大、用户画像在用户消费行为模型构建中使用较少的问题,利用用户画像技术,通过用户的自然属性、使用属性、消费行为属性、充值行为属性建立用户画像模型。通过跟踪单个用户ARPU值的变化轨迹,用户画像报告生成,用户ARPU的宏观关联性分析介绍了用户画像模型的使用。通过高危用户的挽留实验,从实践的角度证实了模型的用途。此模型的使用有效地反应了业务的经营状况,可以全景展示业务视图,为提升用户ARPU值提供了策略制定依据。
【关键词】用户画像;模型构建;关联分析
中图分类号:TN929.5
文献标志码:A 文章编号:1006-1010(2019)04-0070-05
[Abstract] In view of large amounts of Internet data and few uses of user portrait in user consumption behavior model, the user portrait technology is used to build user portrait model based on natural property, usage attribute, consumption behavior attribute and charge behavior attribute. By tracking the changing trajectory of ARPU value for a single user, the user portrait report is generated. The macro correlation analysis of users ARPU introduces the use of user portrait model. Through the retention experiment of high-risk users, the use of the model is validated from the aspect of practice. The use of the model effectively reflects the operation state of business, comprehensively displays the business view and provides a strategic basis to enhance users ARUPU value.
[Key words]user portrait; modeling; association analysis
1 引言
移動通信技术的快速发展和应用不仅提升了用户使用通信媒体的便利性,也产生了大量的用户信息,而如何完善这些用户信息,进而根据用户的使用规律有效地配置资源,做到效益最大化是一项迫在眉睫的事情。用户画像作为真实用户的虚拟代表,是建立在一系列真实数据之上的用户模型。关于用户画像的使用遍布各个行业[1],为了对“知乎”网站PM2.5话题下1 303位用户进行实证分析,构建了基于用户基本属性、社交属性、兴趣属性和能力属性四个维度的动态用户画像模型[2]。赵刚等人在入侵检测技术中引入了用户画像技术,提出基于用户画像的入侵检测模型,实现入侵检测粒度的细化,将大数据技术引入网络安全领域,发掘其潜在研究及使用价值,使入侵检测技术具有大数据特性。用户画像在通信领域的应用也非常的普遍,尤其是在分析用户的运动轨迹方面[3],有显示移动用户的频繁活动规律、周期性行为及出行方式的移动用户行为画像模型,可用来分析移动用户群体行为及用户间交互行为[4]。通过时空关联分析的方法提出了一套通信用户停留分析的方法,分析用户的轨迹行为。通过用户画像技术分析用户的消费行为的模型不是很多。
本文利用用户画像技术,通过用户的自然属性、使用行为属性消费行为属性、充值行为属性建立用户画像模型。在跟踪单个用户的ARPU值的变化轨迹,生成用户画像报告,在用户ARPU的宏观性关联性分析方面阐述了此画像模型的应用,为提升用户ARPU值提供策略制定依据。
2 用户画像模型构建
在本文中,一切研究目的都是围绕着提升用户ARPU值,所以建模的目的就是为了发现各个属性对ARPU值的影响。图1为本文的建模思路:
整个用户画像建模思路为:首先整理数据,并拆分为自然属性、使用行为属性、消费行为属性、充值行为属性四个数据集;然后分别对每个数据集进行定义,构建用户画像模型;最后则是介绍此用户画像模型的应用。
2.1 数据收集与处理
本文选择的数据集为某电信运营商近半年线上用户的消费行为数据和缴费数据。此数据包含60万用户5个月的属性行为、消费行为、缴费行为数据,在数据收集的过程中,根据数据的类别进行了拆分处理,整理后的数据集如图2所示。
2.2 用户画像模型构建
(1)用户自然属性
在本文中,基于用户数据收集成本与隐私的保护,主要考虑了用户的年龄、性别、所属区县、星级、受教育程度对用户ARPU的影响力,通常受教育程度越高的用户产生的ARPU会偏高一些。定义函数Natu(i)表示用户i的自然属性对用户ARPU的影响力:
(2)用户使用行为属性
本文探讨的使用行为属性包含套餐、时长、合约与否。在本文的数据集中,用户的套餐会有基本的月租费,用户ARPU由基本的月租费和套餐外收入组成,月租费越高,对应的用户ARPU相应也会增加。在网时间越长,用户的使用习惯会逐渐形成,用户的ARPU值便会趋于一个稳定值。定义函数App(i)表示用户i的使用行为属性对用户ARPU的影响力:
其中,Pro(i)表示用户使用的套餐对用户ARPU的影响力;Star(i)表示目前用户的所属星级对用户ARPU的影响力;Long(i)表示用户在网时长对用户ARPU的影响力;Nat(i)表示用户目前合约与否对用户ARPU的影响力。
(3)用户消费行为属性
目前用户使用通信服务,通常体现在用户拨打电话、发送短信、使用流量三个方面。相应地,反映出来的数据为语音通话时长、短信条数、流量值。其中语音通话时长又分为市话和长途、来话与去话;短信分为发送短信和接收短信;流量的区分按网络制式可分为2G、3G、4G流量,按使用范围又可分为本地流量和长途流量等。针对不同的产品、不同的人群,用户消费行为的侧重点也不一样,年轻人通常使用流量比较多,老年人则较习惯拨打电话。在不同时期,用户消费行为的三个方面对用户ARPU值的影响比重又有变化。前几年用户移动端上网没有完全普及的时候,用户使用短信和通话对用户ARPU的影响比较大,现在则是流量对用户ARPU的影响比较大。本文定义了函数Con(i)表示用户i的消费行为属性对用户ARPU的影响力:
(4)用户充值行为属性
用户的充值行为与用户的ARPU是相辅相成的,用户ARPU值越大,用户的充值行为则越频繁,充值金额则越大;用户的充值属性越明显,用户则越稳定,则越容易成为稳定客户。在本文中,我们着重考虑用户的充值行为对用户ARPU的影响。定义了函数Pay(i)表示用户i的充值行为属性对用户ARPU的影响力:
3 用户画像模型应用
本文构建的用户画像模型包含了与用户ARPU值直接关联的各种属性,同时数据集的体量也是非常大的,包含了60万线上用户的属性信息。这对于充分发掘此画像模型的应用提供了强有力的基础。在本文中,从单个用户ARPU的变化规律、用户画像报告和用户ARPU的宏观性关联分析方面介绍此用户画像模型的应用。
3.1 单个用户的ARPU变化规律
企业整体的收入是由单个用户产生的收入累加起来的,所以分析好每一个用户的ARPU值变化则显得尤为重要。本文选择了某一个用户近五个月的ARPU值与消费行为数据进行举例阐述,如表1所示:
从表1、图3、图4可以看出,用户的套餐月租费远小于用户的ARPU,这表明用户目前的套餐不适于用户的使用方式;ARPU值和流量的下降,则表明用户有离网的倾向。综上,需要协助用户选择合适的套餐,做好用户的挽留工作。
3.2 用户画像报告
用户画像报告对用户进行全景视图展示,本文可以从各个视角进行用户画像报告,比如年龄、性别、区局、套餐等。现在从用户ARPU值高于平均ARPU和低于平均ARPU的角度来介绍用户画像模型的使用。图5和图6展示了高于平均ARPU和低于ARPU的組成情况。
3.3 用户ARPU的宏观性关联分析
从图7至图9可以看出,用户近5个月的收入呈现上升的变化趋势,用户的收入增加由新增用户的收入和存量用户的收入组成。新增收入在201804账期呈现了下降趋势,而存量收入在201804账期上升明显。由此可见,用户收入的上升是由存量用户的收入增加引起的,这表明存量用户的维系工作做的比较到位,而新增用户的发展则需要加强。
4 实验结果
利用本文构建的用户画像模型,提取了1 025条高危用户,本文定义的高危用户指的是连续三个月用户ARPU值都持续下降,并且流量、语音、短信使用很少的用户。图10为本批用户的年龄分布:
不同年龄段的用户有不同的使用习惯与需求,通过图10可以看出,用户着重分布在30岁以下,这也说明30岁以下的年轻人更容易流失。所以本文制定策略时着重考虑年轻人,依据目前年轻人都比较喜欢玩网游的特点,采用微信推广与短信通知的方式推荐用户参加公司的“充值送流量”活动。策略实施后的平均ARPU变化如图12所示:
5 结束语
移动通信技术的迅猛发展产生了大量的用户数据,如何从大量的数据中提取有益于提高效益的信息是非常重要的。本文利用用户画像技术,从用户自然属性、使用行为属性、消费行为属性和充值行为属性方面构建了用户画像模型,并从单个用户的ARPU变化规律、用户画像报告和用户ARPU的宏观性关联分析方面探讨了用户画像模型的使用。通过高危用户的挽留实验,从实践的角度证实了模型的用途。此模型的使用直观明了地反映了用户的全景视图及收入变化的原因,为企业制定决策提供了依据。
参考文献:
[1] 陈志明,胡震云. UGC网站用户画像研究[J]. 计算机系统应用, 2017(26): 24-25.
[2] 赵刚,姚兴仁. 基于用户画像的异常行为检测模型[J]. 技术研究, 2017(7): 18-24.
[3] 黄文彬,徐山川,吴家辉,等. 移动用户画像构建研究[J]. 现代情报, 2016(10): 54-61.
[4] 席岩,张乃亮,王磊,等. 基于大数据的用户画像方法研究[J]. ICTC, 2017(10): 37-41.
[5] 马亮,陶利涛,谢骏凯. 基于客户画像的客户诉求管理[J]. 电力需求侧管理, 2016(10): 98-100.
[6] 王宪朋. 基于视频大数据的用户画像构建[J]. 网络与融合, 2017(4): 20-21.
[7] 裴国才. 基于用户画像的电信精准营销模型研究[J]. 信息通信, 2017(12): 240-243.
[8] 何雪海,黄明浩,宋飞. 网络安全用户行为画像方案设计[J]. 通信技术, 2017(4): 789-794.
[9] 陈秀敏,许向东,黄毅华,等. 基于数据挖掘的4G用户投诉预测[J]. 移动通信, 2017(12): 32-34.
[10] 齐帅,单桂华,田东,等. 基于基站数据挖掘个人驻留规律[J]. 计算机系统应用, 2017(6): 176-180.