RFM改进模型下的商场会员价值分析
2020-07-26张国发
鲁 燚 张国发 刘 茂
(遵义医科大学 贵州 遵义 563000)
前言
电商行业利用本身优点,如阿里巴巴旗下的达摩盘营销系统,能够根据客户消费信息迅速进行数据分析,不仅能留住老会员,还能吸引用户消费。造成实体商场压力很大,商场若想要谋求更多利益,需要根据会员消费情况进行精准化运营,刺激消费。
一、数据预处理
本文用2018年全国大学生数学建模竞赛题C题(链接:http://www.mcm.edu.cn/)做研究。针对附件1(会员信息表),将表中错误的入会时间信息删除;找出表中重复卡号,有选择地删除数据,保证卡号的唯一标示性;附件2存在金额(je)、数量(sl)为负的情况,作以下规定:Sl<0,je>0表示商品被退回,消费金额为正,视为数据异常,进行删除。最后,由于附件3中的会员消费明细是该商场所有会场的总的消费记录,而我们只针对附件1中的商场主会场会员进行管理。所以根据卡号将附件1和附件3进行对比,只保留附件1中的会员消费明细,从而得到本商场会员消费明细表。为了将非会员与会员进行区分,将附件3中消费记录时间区间与附件2统一,再将本商场会员消费明细表与附件3进行对比,于是可以得到2016年1月9日至2017年9月23日的会员消费流水表。
二、分析消费者特征
从消费总金额来看会员∶非会员=431994698.9∶790624190.7;从消费商品总数来看会员∶非会员=344725∶707705。其次统计各年龄段会员的消费能力:由于数值间差距过大,所以将各个数值转为倍数关系,方便进行数据可视化。以<18岁的数据为分子,如,<18岁的消费总金额是1031196元,而18-43岁的消费总金额为414291445元,后者消费总金额数值大小为前者的401倍,则导入两者的消费总金额数据为1,401。
图1 各年龄段消费情况柱状图
统计男女会员消费情况:从消费数量来看女性∶男性=308463∶29638;从消费金额来看女性∶男性=381209838.7∶43334214.3。可以看出女性为本商场消费的主力。
三、会员价值分析
(一)模型准备
会员分类,不但可以让会员被商场管理者识别,还能为商场对会员的服务性营销策略提供支撑。首先对数据进行限定:选取2017年1月(31天)时间段的数据进行研究,能够得出会员短期内消费情况以及平均价值。接下来对改进的RFM模型进行解释。
1.RFM模型介绍
由Hughes发现并建立的RFM模型是衡量客户价值重要工具。对RFM模型,在本文R指时间段(本文指会员在2019年1月1日-1月31日的消费)里,会员最后一次消费的时间距离统计时间(2019年1月31日)的天数;F指时间段里会员消费次数;M是时间段里会员消费总金额。
2.改进的RFM模型
对于原模型M指标仅反映会员指定段时间的消费总金额,从长期来看,取统计时间里会员的平均消费金额能够很好地反映该会员的实际消费水平。因此本文在基于RFM模型的基础上提出了RFA模型,其中将M这一指标替换成了A(Average)会员在规定时间内的平均消费金额。
(二)建模思路
首先,数据标准化[1-2]。第二步,层次分析法[3-4]确定权重。对RFA各指标权重问题,本文认为会员价值受各指标的影响并不一致,因此采用层次分析法对各个指标赋予不同的权重。第三步,进行K-Means聚类。最后,计算会员价值得分。
Score=Ri×WR+Fi×WF+Ai×WA
公式1
其中Ri表示第i个会员对R指标的得分,WR表示,R指标所占的权重,Score表示会员价值得分。
(三)模型求解
第一步,采用max-min标准化。数据导入R-Studio,根据公式编写自定义函数,得到三个指标标准化后的数据。在第二步,对于各指标权重,首先要将相关因素分解成三层,得到基于RFA的层次结构模型。
图2 基于RFA的层次结构模型
其次,根据Saaty等人提出1~9尺度[4]确定权重。邀请两位专家给出判断矩阵,作为权重的数量依据。通过使用层次分析软件yaahp可以得到各要素最终占的比例为
WA:0.6189、WF:0.2266、WR:0.1545
结果表明A(Average)权重最大,对会员价值的影响也最大,F指标次之。在第三步,对1月消费数据(5763条记录)进行聚类分析,得到between_SS/total_SS=87.0%。经过多次试验,发现该值在分为7类的时候为85.3%;在分为6类的时候为83.4%。由组间距离越大,组间距离尽越小,聚类效果越好,则该值越大,可以知道分为8类的聚类效果非常好。
在第四步,根据权重,结合聚类分析的结果将每类会员价值得分排序。对于每一类会员的价值总分采用公式
Total Score=Rj×WR+Fj×WF+Aj×WA
公式2
其中Ri表示属于第j类会员的R指标的均值,WR表示该指标的权重。Total Score表示该类会员价值总分。将8类的R指标均值按照从小到大排序,得到一个取值区间,其中规定数值在0-0.036时该类会员R值得分为1,在0.036-0.07时R值得分为2;在0.07-0.11时得分为3;高于0.11时得分为4。对F、A指标分别按照R指标的处理方法,得到取值区间并进行排序,规定数值段分值。最终得到各类会员价值得分排序表。最后将8类会员的价值得分进行排序,得到会员的8个级别。总分越大,级别越高,如总分为3.3811的这类会员,为最高级别第8级。
表1 会员价值得分排序表
总分越大则会员价值越高。数据表明,该商场会员中等级为5的会员人数最多,等级为6的人数最少。也就意味着本商场的中高级会员是本商场的主要销售对象,且为商场带来的利益最多,商场可以不仅根据这部分会员的消费习惯和消费爱好进行有针对性的推销,还可以根据三指标中得分情况,指定销售策略,有针对性地提高某一低指标的得分。
(四)模型检验
为了将改进的模型与传统RFM模型进行对比,将两模型数据进行指标间的相关性分析。最后得到传统模型中F指标与M指标存在线性相关,相关系数为0.613。而改进的模型避免了指标间的共线性。
四、总结
通过对传统RFM模型的M指标进行改进,得到RFA模型。改进模型对会员得分进行量化,能够很好地衡量各类客户的价值。且能够规避指标间的相关性。存在的不足在于,指标过于单一,聚类效果还没有达到最好的效果(95%以上),应该参考更多因素进行建模,以希望能将聚类效果得到提高。