全生命周期客户价值数据分析挖掘方法
2020-07-08徐晓敏谷晓燕
徐晓敏,谷晓燕
(北京信息科技大学 信息管理学院,北京 100192)
0 引言
客户价值是企业从与其具有长期稳定关系并愿意为企业提供产品和服务承担合适价格的客户中获得的利润,也即顾客对企业的利润贡献[1]。企业通过客户的消费行为等数据测度出客户价值,基于客户价值可以对客户进行差异化决策[2]。因此客户价值分析是企业客户关系管理的一项重要内容。在电子商务蓬勃发展的今天,对于日趋庞大的网店经营者来说,关注客户价值是竞争取胜的重要环节之一。通过分析顾客的购买行为,识别每个客户的价值,根据客户价值的不同采取有效的数据分析挖掘方法对客户进行分类以识别出可以为商家带来更大利润的顾客[3]。通过精准的营销手段,全面提升客户满意度及忠诚度,以使得网店获得更多的利润。
本文以网店实际经营数据为背景,基于网店实际交易数据,构建客户全生命周期客户价值分析模型。通过综合应用数据分析挖掘方法,即RFM分析法和K-means聚类算法对客户价值进行分析研究。在客户全生命周期的各个阶段,根据其不同的价值对客户进行分类管理,满足客户不同的需求,制定相应的经营策略,以达到为商家经营提供决策支持的目的。有助于商家维持现有客户,发掘潜在客户,提升客户价值。
1 方法模型
一个顾客与企业的关系从建立再到终止的全过程,称之为客户全生命周期,它是客户关系发展变化的水平轨迹记录。在客户关系管理研究中通常将其划分为考察期、形成期、稳定期和退化期4个时期[4]。基于全生命周期客户价值数据分析挖掘方法综合应用了RFM分析法和K-means聚类算法。
RFM模型首先是在1994年由Hughes提出[5]。在本文研究中,RFM分析法主要涉及3个变量:最近购买时间(recency),购买频率(frequency),购买金额(monetary)。以R表示顾客最近一次的购买时间和分析时间点之间的间隔天数,F表示统计期内顾客购买商品的次数,M表示统计期内顾客购买商品的总金额。
K-means聚类算法一般用于对大量数据进行分析。它是从样本中随机选取K个点作为初始聚类中心,计算所有数据到各个聚类中心的距离,将距离聚类中心较近的点归为一类[6]。在本文研究中将应用此方法对RFM分析结果进行聚类分析挖掘,得出基于客户生命周期的分阶段客户群体。
基于RFM分析法和K-means聚类算法的客户价值数据分析挖掘方法基本思路为:在店铺一定时间段内的稳定交易数据记录中选取主要字段:订单创建时间、买家会员名及总金额,并从这些数据记录中提取得出最近购买时间(R)、购买频率(F)和购买金额(M)三个指标进行RFM分析,然后对得到的RFM分析结果求其等权重总分,最后再使用K-means算法对每个客户的RFM总分进行聚类分析,得出分阶段客户群聚类结果。基于RFM分析法和K-means聚类算法的客户价值分析模型如图1所示。
方法模型具体描述如下:
1)数据获取。具体选择一家网店,获取一定时间内具有一定规模的连续交易数据作为分析样本。
2)数据清洗整理。①选取字段:从网店交易数据Excel文件中提取所要进行数据分析的相应字段:订单创建时间、买家会员名和总金额。②生成RFM分数表:对提取字段进行载入,根据分析工具数据处理要求将其格式调整为可以识别的数据模式后进行相应的操作计算,生成分别具有R、F、M三项每项得分的分数表。然后将R、F、M分别依照由大到小、由多到少的顺序进行排列,再按照排列顺序将最近购买日期、购买频率及购买金额3个指标分别划分为5个等份。对于每项指标,规定最前面20%的顾客5分,其次20%的顾客4分,以此类推分别赋予3分、2分与1分。分数越高代表客户价值越高。
3)数据分析挖掘。①分值计算:对上一步得到的RFM分数表中每一项数据按照等权赋值方式进行总分数计算,得到加权总分值。②分值聚类:将加权总分值进行K-means聚类计算,得到聚类结果。
4)数据结果分析。通过以上步骤,可以得到店铺在指定周期内所有客户按照其客户价值分类的聚类结果,在此基础上将客户划分为4类:重要保持客户、重要发展客户、一般重要客户和一般客户。其中:重要保持客户是可以为店铺带来最大价值的客户,对店铺具有高度认同;重要发展客户对店铺已有较强认同,是潜在的忠诚客户;一般重要客户是基数较大的客户,是店铺销售订单的主要来源;一般客户是店铺的基石,所有顾客都是经过一般客户这个阶段而逐步提升。在聚类结果中可以根据客户的用户名清楚地查询到每一客户属于上述哪一种客户类型,也可以根据类型查看到每一聚类客户中都包含有哪些客户。
根据聚类结果所划分的4类客户,分别给出各类客户在客户全生命周期各个阶段的表现特点及相应营销策略,详见表1。以此为店铺经营者的经营决策提供支持。
2 方法应用
2.1 数据获取
选取淘宝网某C2C网店作为应用研究对象。该店铺主要经营外贸女装,属于女士服装精品层次,2008年网店开始营业,在官方的卖家信用体系中拥有103 191个卖家信用,属于淘宝四皇冠卖家。用于客户价值分析的数据来源于该店铺2017年11月1日至2018年10月31日完整一年的稳定交易数据,共17 462条订单数据。
2.2 数据清洗整理
2.2.1 选取字段
下载该店铺日常经营数据所生成的原始网店交易记录总表,经过对相关字段的抽取整理,形成网店交易基本数据表,从中提取进行客户价值分析所需的数据:买家会员名、订单创建时间和总金额作为分析数据。经整理后的分析数据表如图2所示。
表1 全生命周期客户价值分析及相应对策
为保证数据分析的有效性,需要对数据表单中的极端数据分析结果影响进行进一步处理,主要处理方法:
1)交易次数。通过对买家会员名字段进行数据透视,得出基于顾客购买次数的统计表。统计期内共有8526名顾客在该商铺内进行交易17 462次,购买1次的顾客13 379人,顾客数占比为76.62%;购买2次的顾客有2144人,顾客数占比为12.28%;其中购买次数达到13次及以上的顾客数只有82人,顾客数占比只有0.47%,这部分顾客在总顾客数中所占比例极小,所以将该部分顾客剔除。
2)购买金额。通过对客户购买金额进行数据透视,可以看出顾客单笔交易订单产生较大购买金额的订单极少,在总的交易订单中所占比例较低,考虑这部分订单直接用于RFM分析,会对消费金额的波动区间产生较大影响,故将该部分消费金额过大、顾客数占比又很小的客户进行剔除。
2.2.2 生成RFM分数表
将经过处理的数据导入SPSS statistics 17.0中,采用其分析选项中的RFM分析模型进行交易数据分析。根据分析要求,选择订单创建时间对应交易日期;总金额对应交易金额;买家会员名对应客户标识符。在输出选项卡中选择块计数图、块计数表可以清晰地表示出RFM分数表结果。
其中RFM 块计数图表示的是离线后的块分布。横轴表示按照客户购买频率将客户分为4级,纵轴表示按照客户最后一次消费时间将客户分为5级。共分为20块。在每块中又根据客户消费金额将客户细分为5级,显示出柱状图,从左到右客户的消费金额依次增大,高低表示该项得分的客户样本量的大小。块计数图如图3所示。
与块计数图相对应的块计数表可以更加详细清晰地显示每个分块中具有的样本数量,RFM分数表如图4所示。
2.3 数据分析挖掘
2.3.1 分值计算
根据上一步得到的RFM分数表,给RFM 模型中的3个指标赋予相同的权重进行加权,计算得到每个客户的RFM分数的加权总分值如图5所示。
2.3.2 分值聚类
最后使用K-means聚类算法对上一步得到的RFM分数的加权总分值进行聚类。使用SPSS statistics 17.0中的分析选项中的K-means聚类,运行后生成客户价值聚类结果及每个类别的客户样本数量如图6所示。
2.4 数据结果分析
从图6中可以看出1类数据集有1114名客户,2类数据集有2766名客户,3类数据集有4073名客户,4类数据集有533名客户。
结合RFM的分析结果以及对客户实际交易数据的对比分析,可以做出如下定义:聚集于第4类的样本客户为重要保持类客户;聚集于第2类的样本客户为重要发展类客户;聚集于第3类的样本客户为一般重要类客户;聚集于第1类的样本客户为一般类客户。
进一步的数据分析统计得知:该店铺的重要保持类客户533人,占总客户数的6.3%;重要发展类客户2766人,占总客户数的32.59%;一般重要类客户4073人,占总客户数的47%;一般类客户1114人,占总客户数的13.11%。
3 结束语
从本文数据结果分析可以看出:重要发展客户与一般重要客户占比较大,网店经营者可以结合客户生命周期各阶段的特点进一步分析各类客户的具体情况,进而采取相应的营销策略,促使其升级成为店铺的重要保持类客户。网店实例对分析挖掘方法的实际应用,证实了基于RFM分析法和K-means聚类算法的客户生命周期价值分析挖掘方法的有效性。