APP下载

大数据如何给企业用户画像

2020-05-20赵宏田

商界评论 2020年4期
关键词:业务人员画像标签

赵宏田

互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据,这是企业经营活动的真实记录。如何更加有效地利用这些数据进行分析和评估,成为企业基于更大数据量背景的问题所在。

随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务上,但要做精细化运营,首先要建立本企业的用户画像。

大数据如何给用户画像?

要實现给用户画像,首先得知道用户画像是什么?

用户画像实际上就是把用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。

大数据已经兴起多年,其对于互联网公司的应用来说已经如水、电、空气;对于人们的生活来说,也成为不可或缺的重要组成部分。从基础设施建设到应用层面,主要有数据平台搭建及运维管理、数据仓库开发、上层应用的统计分析、报表生成及可视化、用户画像建模、个性化推荐与精准营销等应用方向。

很多公司在大数据基础建设上投入很多,也做了不少报表,但业务部门觉得大数据和传统报表没什么区别,也没能体会到大数据对业务有什么帮助和价值。究其原因,其实是“数据静止在数据仓库,是死的”。

而用户画像正好可以帮助大数据“走出”数据仓库,针对用户进行个性化推荐、精准营销、个性化服务等多样化服务,为数据驱动运营奠定了基础。

其次我们需要给用户画像建模,其实就是给用户“打标签”。结合数据应用体系的层级划分(如图1),以及给用户打标签的方式来看,用户画像一般有3种标签类型:统计类标签、规则类标签、机器学习挖掘类标签。

1.统计类标签

这类标签是最基础、常见的标签类型。例如,对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段,可以从用户注册数据、用户访问、消费数据中统计得出。

2.规则类标签

这类标签基于用户行为及确定的规则产生。例如,对平台上“消费活跃”用户可以定义为“近30天交易次数≥2”。在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则一般由运营人员和数据人员共同协商确定。

3.机器学习挖掘类标签

这类标签是通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯,判断该用户是男性还是女性;根据一个用户的消费习惯,判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

在项目工程实践中,一般统计类和规则类的标签就可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般情况下,机器学习标签开发周期较长,开发成本较高,因此其开发所占比例也比较小。

用户画像有哪些模块?

借助用户画像,我们可以对商品的销量进行分析。比如说可以快速定位到爆款品类,进一步分析购买爆款品类的用户在各个维度上的特征。

比如,运营人员在分析用户购买记录时,可以直观地看出产品品类的销量情况。如果运营人员想进一步了解用户的其他特征,我们可以搭建一套完整的用户画像系统,以便进行精准营销。

一般来说,一套用户画像方案需要考虑8个模块的建设(如图2)。

用户画像基础:需要了解、明确用户画像是什么,包含哪些模块,数据仓库架构是什么样子,开发流程,表结构设计,ETL设计等。这些都是框架,大方向的规划,只有明确了方向,后续才能做好项目的排期和人员投入预算。这对于评估每个开发阶段重要指标和关键产出都非常重要。

数据指标体系:根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系。

标签数据存储:标签相关数据可存储在Hive、MySQL、HBase、Elasticsearch等数据库中,不同存储方式适用于不同的应用场景。

标签数据开发:这是用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,可有效打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。

开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优。

作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来。

用户面像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上。产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等。

用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用。

这些模块可以有利于帮助我们更清楚地了解用户画像是如何从0到l搭建起来的,并以此作为提供服务、驱动用户、将用户画像产品化的基础。

怎样做一款用户画像产品?

我们开发出画像的标签数据、搭建起画像的整体模块之后,如果只是“躺在”数据仓库中,并不能发挥更大的业务价值。只有将画像数据产品化才能更方便业务方使用,比如用户画像产品主要可能涵盖到的功能模块,以及这些功能模块的应用场景。

画像产品按常见的功能来看,主要包括标签视图与即时查询,用户分群,用户人群透视分析,对用户从事件、留存、漏斗、分布等多维度展开的深入交瓦式分析等模块。下面我们详细介绍—下画像的产品形态。

1.标签视图与查询

标签视图与查询功能主要面向业务人员使用,如图3所示。

在平台标签视图板块中,层级化地展示了目前已经上线使用的全部用户标签。用户可以层级化地通过点击标签,查看每个标签的详细介绍。

当点击图中“用户属性”这个一级类目,可进入到“自然性别”“购物性别”“用户价值”等二级类目;点击“自然性别”二级类目,可看到展开的“男性”“女性”三级标签;进一步点击三级标签“男性”或是“女性”,可以进入查看该标签的详细介绍,如图4所示。

在该标签详情页中,可以查看人口属性这一个类目下面的各个标签覆盖用户量情况。

每天通过对标签的覆盖用户量进行监控,可以作为预警使用。例如:某天某个标签的覆盖用户量与前一天相比出现了很大比例的波动,这时就需要排查该标签当日ETL作业是否出现异常,或是否因业务上的操作导致标签量级的波动。

在标签查询模块中,通过输入用户对应的usend或CookieID,可以查看该用户的属性信息、行为信息、风控属性等多维度的信息,从多方位了解一个用户的特征。

2.用户分群功能

用户分群功能主要面向业务人员使用。产品经理、运营、客服等业务人员在应用标签时,可能不仅仅只查看某一个标签对应的人群情况,更多地需要组合多个标签来满足其在业务上对人群的定义。

例如,组合“近30日购买次数”大于3次和“高活跃”“女性”用户这3个标签进行定义目标人群,查看该类人群覆盖的用户量,以及该部分人群的各维度特征。在“用户分群”板块下,点击“新建人群”或编辑之前已添加的分组(如图5),进入详情页可自定义涵盖某些标签的人群。

在自定义编辑用户分群时,对于有统计值类型的标签,可以自定义筛选该标签的取值范围,如“近30日购买次数”的标签,业务人员可筛选该标签的数值。对于分类型标签,(如图4)中“活跃度”标签,业务人员选中该标签即可圈出包含该标签的用户。“人群名称”和“人群描述”表单用于业务人员描述该人群在业务上的定义,方便后续继续查看、应用该人群。

3.人群分析功能

人群分析功能主要是面向业务人员、数据分析师、产品经理等人群使用。

人群分析是一个根据现有用户标签圈定用户群的功能,方便业务方从多个维度(如地域、性别、年龄、消费水平等)进一步分析该批用户群的特征,从而为精细化运营提供支持。和用户人群功能相似,人群分析功能首先也需要组合标签圈定用户群体。不同之处在于多维透视分析功能支持从多个维度去分析圈定用户群体的特征,而用户分群功能侧重的是将筛选出来的用户群推送到各业务系统中,提供服务支持。

和用户分群功能一樣,人群分析功能也需要组合标签筛选出目标用户群体,创建起需要分析的人群。然后,在“对比维度”选择菜单中选择需要分析该批用户的维度,如下单次数、活跃度。“对比维度”列表中的可选标签也是用户属性、用户行为栏目中已经构建的标签。这样我们就可以看到刚才筛选出来的用户群在活跃度和下单次数上的表现了。

除了能透视分析单个人群在多个维度上的特征,还可以支持同时分析多个人群在不同维度上的表现。业务人员可以根据不同业务规则同时创建两个人群,然后筛选对比维度,从多个维度上对比分析这两个人群的特征。

用户画像产品化只是把数据应用到业务服务中的一个重要出口,方便业务人员分析用户群特征,将分析后的用户群推送到对应业务系统中,更方便、快捷地将数据赋能到业务场景中去。企业想要在营销和业务增量上有更大的突破,还需要在用户画像的基础上,做更多产品策略性的思考。

【编辑 陈俊伶】

猜你喜欢

业务人员画像标签
威猛的画像
“00后”画像
画像
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
90%的奶粉企业要瘦身,谁会被裁掉?
快消品行业业务人员流失的原因与影响浅析
标签化伤害了谁
基于多进制查询树的多标签识别方法
潜行与画像