基于改进RFM模型的百度外卖客户价值分析
2019-05-05包志强赵媛媛胡啸天黄琼丹
包志强, 赵媛媛, 赵 研, 胡啸天, 黄琼丹
(西安邮电大学 通信与信息工程学院, 陕西 西安 710121 )
“百度外卖”是指百度公司向客户提供外卖订餐服务而构建的专业外卖服务平台[1]。为了核算客户为百度外卖带来的价值,对百度外卖进行客户价值分析,通过对客户群体的细分,区别出不同价值的客户群[1],有利于企业有针对性地对不同价值的客户提供服务,并及时调整企业的营销策略。
目前,进行客户价值分析的相关文献有,文献[2]提出一种针对消费数据挖掘的多指标客户细分方法,但该方法不适用于消费次数较低的客户群[3]。文献[4]根据铁路货运特征,引入近期发货行为能力特征,提出货运客户价值分类模型,该模型更适用于铁路货运客户价值分析,但对于直销领域客户价值分析的适用性较弱[5]。文献[6]构建了一种多指标的电子商务客户价值分析体系,该体系从内部数据和外部数据两个角度出发,对客户进行价值分析,但该方法对数据的完整性和规范性要求较高[7]。
RFM模型在反映客户价值及客户购买偏好方面具有良好的表征性,适合单次消费金额相对较低、消费频次相对较高的直销行业中,如电信、外卖和物流等行业[7]。采用RFM模型进行客户价值分析的相关文献有,文献[8]采用数据挖掘中的聚类技术和RFM模型对铁路快捷货物客户进行了客户分类,但该文献存在最近消费时间指标随机性过大的不足,导致分类的结果不准确[9]。文献[10]提出基于熵值法的改进RFM模型,计算电力客户对每种缴费渠道的偏好,但该文献仅对指标的权重进行了分析,未对RFM模型的自身缺点进行改进,因此不能准确地进行电力客户行为分析[11]。文献[12]采用RFM模型,以电信行业流量包订购业务为对象,完成了顾客价值分析及消费行为预测,但采用该方法预测订购该业务的客户的准确率为67%,准确率较低[13]。文献[14]提出基于购买行为和评论行为的改进RFM模型,对大众点评网的用户进行了客户价值分析,但该文献中对评论进行贡献值的评分具有主观性[15]。
为实现百度外卖客户价值分析,本文拟提出改进RFM模型,将采用离差标准化方法[16]对改进后RFM模型的指标进行规范化处理,将采用主成分分析法[17-18]对改进后RFM模型的指标进行权重分析,采用K-means聚类算法[19-20]对客户数据进行分群,针对不同客户群进行指标特征分析,以期得出各客户群的价值。
1 RFM模型
RFM模型[7]是一种针对客户价值分析的统计划分方法,包括最近消费时间R(recency)、消费频率F(frequency)、消费金额M(monetary)3个变量。
最近消费时间R,指客户在分析时间点和最近一次消费时间点之间的间隔时间。理论上,最近消费时间越短,客户对企业提供的商品或服务也最有可能发生反应,因此,最近消费时间越小,表明客户与企业再次发生交易的可能性越大。
消费频率F,指客户在一定时期内发生消费行为的次数。消费频率越高的消费者,忠诚度越高,给企业带来的价值越大,因此,消费频率越大越好。
消费金额M,指客户在一定时期内的消费总金额。消费金额是对企业产能最直接的衡量指标,消费金额越大,客户给企业带来的价值越大,因此,消费金额越大越好。
根据客户购买行为,RFM模型可以完成客户群体的细分,评估客户的价值,采用RFM模型进行客户价值分析的步骤如下。
步骤1得出最近消费时间、消费频率、消费金额3个客户行为指标。
步骤2采用规范化方法对RFM模型的指标进行规范化处理。
步骤3对RFM模型的指标进行权重分析。
步骤4采用K-means聚类算法对RFM模型的指标进行聚类分群。
步骤5针对每个客户群进行指标特征分析,得出不同客户群的价值。
2 改进RFM模型的百度外卖客户价值分析
为了更准确地对百度外卖客户进行价值分析,提出改进RFM模型,改进的RFM模型采用平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间4个指标对客户行为进行分析,得出不同客户群为企业带来的价值。
2.1 改进RFM模型
在RFM模型中,最近消费时间R随机性较大,虽然考虑了消费时间对顾客价值的影响,但新客户和老客户在最近消费时间R指标的表现可能相同,在参考时间段内具有相似的最近消费的记录,企业无法根据该指标判断客户的新老属性。RFM模型中指标F和指标M之间存在共线性问题,忽略了客户与企业间的互动因素。为了更准确地对百度外卖客户进行价值分析,提出一种改进RFM模型,改进RFM模型指标构成如下。
RAI为客户一定时期内的平均订单交易时间间隔。
F1为客户在一定时期内发生订单交易的次数。
MAM为客户一定时期内的平均单次订单交易金额。
S为客户贡献时间,指客户历史第一次交易至参考时间的最后一次交易的时间间隔。
RAI指标的公式为
(1)
其中Tlast_time表示参考时间段内客户最后一次订单交易时间,Tfirst_time表示参考时间段内客户第一次订单交易时间。
MAM指标的公式为
(2)
S指标的公式为
S=Thfirst_time-Tlast_time。
(3)
其中Thfirst_time表示客户历史第一次交易时间。
在改进的RFM模型中,采用平均订单交易时间间隔RAI代替RFM模型中的最近消费时间R,克服了RFM模型中R指标随机性较大的缺陷,对于交易频次较高的老客户,平均订单交易时间间隔更具有代表性。采用客户一定时期内的平均单次订单交易金额MAM代替RFM模型中的指标M,消除了RFM模型中指标F和指标M之间的共线性问题,指标MAM描述了客户对于商家的客单价,相对于RFM模型中的指标M有利于商家制定适宜的营销策略。客户贡献时间指标S在一定程度上反映了客户的忠诚度与持续消费能力,即客户历史第一次交易至参考时间的最后一次交易的时间间隔。
2.2 指标规范化
由于改进RFM模型的平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间4个指标的取值范围数据差异较大,为了消除数值对分类结果带来的影响,采用离差标准化方法对数据进行标准化处理,规范化处理式为
(4)
其中x为样本数据,x′为规范化处理后的样本数据,xmin为样本数据中的最小值,xmax为样本数据中的最大值。
2.3 指标权重分析
指标权重[20],是指被测对象各个考察指标在整体中价值的高低和相对重要的程度。根据外卖行业客户数量大、消费数据多的特点,改进RFM模型的4个指标RAI、F1、MAM和S权重各不相同,对改进RFM模型采用主成分分析法确定指标权重。主成分分析法[17-18],是一种通过降维技术把多个指标转化为少数几个综合指标的统计分析方法。这些综合指标即主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。各指标的权重等于主成分的方差贡献率,方差贡献率越大,主成分的重要性越强[20]。
改进RFM模型 4个指标RAI、F1、MAM、S的权重确定过程如下,由L个用户的RAI、F1、MAM、S指标构成的输入矩阵AL×j中的列矩阵为
xj=[x1j,x2j,…,xLj],j=1,2,3,4,
计算xj的协方差矩阵C为
(5)
C=UΩUT。
(6)
其中
是矩阵C的特征值矩阵,U为矩阵C的特征向量,这样得到的λ1,λ2,λ3,λ4为指标的权重。
2.4 客户分类
以改进后RFM模型的平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间4个指标为分类变量,采用K-means聚类算法[19-20]对进行规范化处理和指标权重分析后的指标进行聚类分析。
K-means聚类算法,将具有相似特征的对象聚集在一起,将不具有相似特征的对象划分到不同的类中,通过迭代计算从每个点到聚类中心的距离,找到给定数据集的K个聚类中心。采用K-means聚类算法对客户作聚类分群,对每个客户群进行指标分析,分析不同客户群的客户价值高低。
3 实验结果分析
3.1 实验数据
实验采用百度外卖企业某市某商家为期3个月的4 815条真实订单交易历史数据,数据中存在冗余特征且特征维数较多,如用户姓名、商户名称、订单状态、商圈、支付类型、配送物流等,将原始数据进行预处理,得到对客户价值分析有用的行为特征,如得到符合改进RFM模型的4个指标,即平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间。部分订单交易样本数据,如表1所示。
表1 部分订单交易样本数据
表1中,用户名为1001的客户,平均订单交易时间间隔为2.88天,客户一定时期内的交易次数为8次,平均单次订单交易金额为38.5元,客户贡献时间为50.94天。用户名为1002的客户,平均订单交易时间间隔为0天,客户一定时期内的交易次数为1次,平均单次订单交易金额为26元,客户贡献时间为50.69天。
采用主成分分析法对4 815名客户的各指标进行权重的计算,以R统计分析软件中的princomp函数计算后的主成分的方差贡献率为各指标的权重,如表2所示。表2中,客户平均订单交易时间间隔的方差贡献率为0.413,表征其权重为0.413,客户交易次数的方差贡献率为0.238,表征其权重为0.238,客户平均单次订单交易金额的方差贡献率为0.207,表征其权重为0.207,客户贡献时间的方差贡献率为0.142,表征其权重为0.142。
表2 各指标变量的权重
3.2 客户价值结果分析
客户价值分析模型主要由两个部分组成:第一部分,根据改进RFM模型中的4个指标的数据,将4815名客户进行聚类分群,得到不同价值的重要保持型客户、忠诚型客户、发展型客户、一般客户、低价值客户5类客户群体;第二部分,针对每个客户群进行特征分析,得出客户的价值,并对客户群进行排名。
以改进后RFM模型的指标作为聚类变量,采用K-means聚类算法[19-20],将客户分为5类客户群,客户的分群聚类结果如表3所示。
表3 客户的分群聚类结果
表3中,SAI表示经过规范化处理后的平均订单交易时间间隔,SF1表示经过规范化处理后的客户一定时期内的交易次数,SAM表示经过规范化处理后的平均单次订单交易金额,SS表示经过规范化处理后的客户贡献时间。
将聚类后的客户分群结果进行分析,如图1所示。图1中,客户群1在贡献时间指标上偏大,在平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额3个指标上最小。客户群2在指标平均订单交易时间间隔和交易次数两个指标上达到最大,在客户贡献时间指标上达到最小。客户群3在平均单次订单交易金额上达到最大,在平均订单交易时间间隔、客户一定时期内的交易次数、客户贡献时间3个指标上表现不明显。客户群4在平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间4个指标上的表现均不太显著。客户群5在贡献时间指标上达到最大,在平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额3个指标上表现不显著,为劣势特征。
图1 客户分群分析
通过对上述客户群的指标分析,将百度外卖的客户视作为:重要保持型客户、忠诚型客户、发展型客户、一般客户、低价值客户5种客户类别,每类客户群的特征如下。
(1)重要保持型客户。这类客户群(客户群3)的平均单次订单交易金额指标达到最大,消费频率较高,贡献时间也较高,是企业的高价值客户,也是最为理想的客户类型,但该类客户群所占的比例较小,企业应该投入更多的精力和资源,并对他们进行差异化地服务和精准营销,延长该类客户的贡献时间。
(2)忠诚型客户。这类客户群(客户群5)的平均单次订单交易金额相对较高,贡献时间指标为优势特征,客户的贡献时间久,对企业的贡献度相对较高,企业应重点发展此类客户,使这类客户逐渐转化为企业的高价值客户。
(3)发展型客户。这类客户群(客户群2)的平均单次订单交易时间最长,消费频率最高,平均单次订单交易金额适中,但其贡献时间较短,企业应重点发展此类客户群,延长其贡献时间。
(4)一般客户。这类客户群(客户群4)在平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间4个指标上的表现均不太显著,外卖企业应该根据这类客户的最近消费时间和消费次数的变动情况,推测客户的异动情况,采取一定的营销手段,延长客户的生命周期。
(5)低价值客户。这类客户群(客户群1)的平均单次订单交易时间最低,贡献时间较长,但其消费频率和平均单次订单交易金额最低,为企业的低价值客户群。
3.3 实验结果验证
分析得到客户的价值后,从回归客户订单交易的原始数据中,对改进后RFM模型进行百度外卖客户价值分析结果进行验证,现以部分客户经过RFM模型和改进RFM模型的客户价值指标及客户分类结果为例,说明改进RFM模型的可信性,如表4和表5所示。
表4 RFM模型聚类结果
表5 改进后RFM模型聚类结果
表4和表5中,用户名为1001顾客为交易次数较高的老客户,用户名为1002顾客为新客户,其最近消费时间相近,故最近消费时间指标不能很好地描述顾客价值,而平均订单交易时间间隔克服了最近消费时间指标的这一缺陷,对于交易次数较高的老客户,平均订单交易时间间隔更具有代表性。将原始数据通过RFM模型和改进后的RFM模型进行百度外卖客户价值分析,得到客户群聚类结果。通过各指标分析得出平均订单交易时间间隔越小、交易次数越高、平均单次订单交易金额越大、客户贡献时间越久,客户相对于企业的价值越高。
数据表明,RFM模型将用户名为1001的顾客划分为价值较低的第4类客户群即一般客户群,由于该客户的消费频率和消费金额较高,客户贡献时间久,该客户应属于价值较高的客户群,改进RFM模型将用户名为1001顾客划分为价值较高的第3类客户群即重要保持型客户。 RFM模型将用户名为1002的顾客划分为价值较高的第2类客户群即发展型客户,由于该客户的消费频率较低,消费金额较少,该客户应属于价值较低的客户群,改进RFM模型将用户名为1002的顾客划分为价值较低的第4类客户群即一般客户。因此,改进RFM模型的客户细分结果更为准确。
上述实验分析结果表明,改进后RFM模型不仅能消除RFM模型的不足,而且改进后RFM模型的客户细分结果与RFM模型的客户细分结果相比较更为准确,基于改进后的RFM模型可更准确地对百度外卖客户进行价值分析。
4 结语
为了分析百度外卖客户的价值,提出一种基于改进后RFM模型的客户价值分析方法。包括平均订单交易时间间隔、客户一定时期内的交易次数、平均单次订单交易金额、客户贡献时间4个指标,运用离差标准化方法对指标进行规范化处理,采用主成分分析法计算4个指标的权重,4个指标与指标对应权重的乘积之和为客户的价值,采用K-Means聚类算法将客户细分为不同价值的客户群。以2017年百度外卖企业某商家为期3个月的4 815名客户的订单交易数据为例进行客户价值分析,结果表明,4 815名客户可以被划分为不同价值的5类客户群体,分别为重要保持型客户、忠诚型客户、发展型客户、一般客户、低价值客户。改进后的RFM模型可以更准确地对百度外卖客户进行价值分析。