APP下载

电商直播平台行为用户群体画像研究

2021-09-18丁文文李征宇李贵

科技资讯 2021年14期

丁文文 李征宇 李贵

摘  要:为电商直播平台更精细运营提供建议。以蘑菇街电商直播间动作用户作为研究对象,通过爬虫程序,获取直播间截图、分享、加购物车、加关注、弹幕、时间等和动作用户个人主页的粉丝数、关注数、种草力数、身高、体重等,提出并使用二次聚类的群体画像方法。结论表明该平台存在9类典型群体,对聚类中心点对比,识别各群体特征,提出精准运营策略和建议。

关键词:电商直播平台  二次聚类    行为用户   群体画像

中图分类号:F49;F274                    文献标识码:A文章编号:1672-3791(2021)05(b)-0043-03

Abstract: Provide suggestions for the finer operation of the e-commerce live broadcast platform. Taking the action users of Mogujie e-commerce broadcast room as the research object, through the crawler program, the screenshot, share, add shopping cart, add attention, bullet screen, time, etc. of the broadcast room and the number of fans, number of attention, number of grass planting, height, weight, etc. of the personal homepage of the action users are obtained. And the group portrait method of secondary clustering is proposed and used. The conclusion shows that there are 9 types of typical groups in the platform. By comparing the clustering center points, the characteristics of each group are identified and precise operation strategies and suggestions are put forward.

Key Words: E-commerce live broadcast platform; Secondary clustering; Behavior user; Group portrait

2020年以來,中国境内受疫情影响,线下交易受挫,但直播行业逆势上涨,发展空间巨大。对电商直播平台行为用户群体画像,精准识别特征及需求,对平台提供精准运营有重要意义。

群体画像已有不少探索。薛欢雪从4个方面建立学科服务用户画像模型[1]。Iglesias J A等研究者用聚类描绘各群组用户画像[2];上述大多是理论宏观描绘,不适宜大量用户数据处理。对平台研究多在传播模式、运营策略等方面,比如:王亮分析语音直播传播模式和知识变现方式[3];杨静用长尾理论分析知乎平台三阶段运营模式[4];用户行为层面大多研究参与动机或付费因素[5]。仅是分层理论研究,规模数据实验探索较匮乏,应用电商直播平台分析更加之少。

该文提出基于二次聚类群体画像研究方法。发挥了DBSCAN在处理异常数据时优越性,处理效率大大提高;KMEANS方法对样本群体划分,根据轮廓系数灵活确定最优簇数,收敛速度更快,结果更合理。

1  聚类思想在画像领域的应用

用户群体画像是聚类算法重要应用领域,聚类得到不同群体模型,可在大规模数据下更好地研究用户需求和特征。例如:杨卫红等研究者用k-means对用电行为划分类别[6];朱钰涵用k-means算法对弹幕用户聚类[7];张莉曼等研究者用密度峰值算法对付费用户聚类分析[8]。

2  画像设计

2.1 画像概念模型

基本属性由关注数、粉丝数、种草力数、城市、身高、体重这6个标签构成。动态属性含有发送弹幕、动作时间、是否关注、加购物车数、截图数、分享数这6个标签。

2.2 画像构建流程

群体画像有用户数据采集与处理、聚类及特征提取、群组画像及精准营销等环节。群体画像的构建流程见图1。

3  数据采集与处理

爬取29 289条直播间样本。选取关注数、粉丝数、种草力数、弹幕数、弹幕长度、加购物车次数、分享次数和截图次数为特征,数据汇总见表1。

均值和中位数差异非常大,最大值都远大于均值和中位数,这意味可能存在一些离群点。

4  群组聚类及特征提取

离群值与绝大多数值差距大,但数量稀少。DBSCAN结果受半径和类的最小样本数影响,半径设为10,较大半径设置有助找出离群严重样本点。对离群值探索,试图分析异常具体原因,有3个用户的粉丝数和种草力都非常大,都超过了平均水平几十倍。经过查看这3个用户的具体弹幕发言内容,提取该用户前5条直播实时数据,发现该用户实际是该直播间的客服,同样的另外俩位也是这种情况。其余异常点,均是行为相对较为异常的用户,有大量的刷屏、加购物车行为。共找出8个离群点,因行为过于异常,因此删除。

5  群组画像及精准营销

进行K-means聚类,选择簇数为9,聚类中心特征见表2。

样本量非常小的类第2类和第5类,发言数量是正常水平。可能是其他直播间主播或客服,结果有逻辑合理性。

另外,数据被聚类成7类。第0类用户是“推广大使”型用户。有远高于平均水平的分享次数,但购物车次数远低于平均水平,帮助了店铺商品传播,可寻找其需求主题,改善购物体验。第1类用户是“静默大众”型用户。各指标均低于平均水准,价值最低的大众用户;平台可消息提醒、客服回访等与用户建立联系,激发行为意愿。第3类用户是“主力购物”型用户。这类用户发言次数和长度很少,以默默购买行为为主,是主力购买用户群体;用户有较高购物意愿,是平台和主播营收关键,可用等级、特权等方式提高身份价值。第4类用户,是“积极问答”型用户。其发言长度远超平均水平,是问题和发言最多群体,是发言氛围得以活跃的关键,应不断优化体验,对积极参与弹幕行为进行奖励。第6类用户是“对比同款”型用户。购买车行为高于平均水平,截图次数远高平均水平。发言长度和次数只略高于平均水平,此类用户对产品疑问主要通过直播间内交流得到答复,用户更倾向截图去其他网店或直播间找同款、对比等方式来解决购买决策问题。该群组购物主要关注并选择单价较低或者有折扣优惠物品。大多无迫切需求,购物意愿受价格影响较大。可推送折扣信息、发放优惠券等刺激消费。第7类用户,是“潜在购买”型用户。购物车行为很少,发言次数和长度都较高,可能在直播室聊天或询问產品问题,有转化购买用户潜力。可回访调研购物少原因,通过积分等标签去提高身份价值,激励参与弹幕贡献。8类用户是“广泛关注”型用户。关注数非常多,可能关注了数量众多的主播,但购买力一般。应通过各种方式了解并满足其购物需求,积极引导关注用户向消费用户转变。

6  结语

平台可根据画像挖掘特征及需求精准运营。因平台信息保密,获得数据还不全面,如没有获得用户搜索和消费数据,未来可考虑获得更全面数据。

参考文献

[1] 薛欢雪.高校图书馆学科服务用户画像创建过程[J].图书馆学研究,2018(13):67-71,82.

[2] Iglesias J A,Angelov P,Ledezma A, et al. Creating Evolving User Behavior Profiles Automatically[J].IEEE Transactions on Knowledge and Data Egineering,2012,24(5):854-867.

[3] 工亮.基于语音互动的知识付费问答社区的传播模式研究[D].上海师范大学,2018.

[4] 杨静.长尾理论视阂的知识分享变现条件分析[D].南京大学,2017.

[5] 赵杨,袁析妮,李露琪,等.基于社会资本理论的问答平台用户知识付费行为影响因素研究[J].图书情报知识,2018(4):15-23.

[6] 杨卫红,赖清平,兰宇,等.基于调节潜力指标的用户用电行为聚类分析算法研究[J].电力建设,2018,39(6):96-104.

[7] 朱钰涵.在线视频社区中弹幕信息交互群体的用户画像研究[D].南京大学,2019.

[8] 张莉曼,张向先,卢恒,等.知识直播平台付费用户群体画像研究[J].图书情报工作,2019,63(5):84-91.