APP下载

基于MBG/CNBD-k模型的客户购买行为预测

2022-06-07王子君梁峰

中国市场 2022年13期

王子君 梁峰

摘 要:客户未来活跃度和购买频次信息对客户关系管理具有重要决策参考价值。文章基于国内某大型石化企业成品油客户购油数据,采用MBG/CNBD-k模型对客户未来活跃度及购买频次进行建模,研究结果表明,该模型对客户流失率预测具有较高的准确率,有助于石化企业及时发现可能流失的客户,针对性地开展客户维系与挽留措施,减少客户流失。

关键词:MBG/CNBD-k模型;客户活跃度;客户购买行为预测

中图分类号:F274 文献标识码:A 文章编号:1005-6432(2022)13-0137-04

DOI:10.13939/j.cnki.zgsc.2022.13.137

1 引言

在客户关系管理中,非契约客户与企业关系不受合同影响,客户转移成本较低,客户未来活跃度信息对于营销决策具有重要价值。管理者可以依据客户活跃度预测,提升营销政策的精准性,通过对客户活跃度细分,及时采取措施降低客户流失率。目前,预测客户购买活跃度主要有两大类方法:一类是机器学习模型,例如逻辑回归模型[1]、决策树模型[2]、支持向量机[3]等;另一类是概率模型,例如Pareto/NBD模型[4-5]、BG/NBD模型[6-7]、MBG/NBD模型[8]、MBG/CNBD-k模型[9]等,这两条技术路线均有各自的追随者。MBG/CNBD-k模型是新提出的针对客户购买行为的概率建模方法[9],其对经典Pareto/NBD概率模型进行了改进,由于提出时间较短,其预测效果尚未得到广泛验证。文章基于国内某大型石化企业成品油客户购油数据,使用MBG/CNBD-k模型对客户活跃度及购买频次构建模型,增进客户管理相关领域对MBG/CNBD-k模型的认识及推广应用。

2 MBG/CNBD-k模型简介

2.1 模型设定

MBG/CNBD-k模型建立在MBG/NBD模型的基础之上,模型有六个基本假设。

(1)在客户活跃时,客户与企业交易的动机和行为是随机的,并且客户交易次数服从交易率为λ的泊松分布,客户交易时间间隔服从k阶爱尔朗分布,其概率密度为:

当k等于1时,MBG/CNBD-k模型退化为MBG/NBD模型,k值越大意味购买时间间隔的规律性越强。

(2)不同客户之间的交易率存在异质性,既有频繁购买客户,也有购买一次之后流失的客户。假定交易率λ在不同客户间的异质性服从形状参数为r和尺度参数为α的伽玛分布,其概率密度为:

不同客户交易率的平均值为E[λ|r, α]=r/α,方差为D[λ|r, α]=r/α2。客户的交易率受到参数r和α的共同影响。

(3)每个客户存在一个不可观测的生命周期,假定客户每次交易后变得不活跃的概率为p,允许客户在首次交易便以概率p退出,客户退出时间点服从几何分布。

(4)假定客户流失概率p的异质性服从形状参数为a和尺度参数为b的贝塔分布。与伽玛分布相比,贝塔分布其变量取值范围介于0到1之间,适合用于描述未知概率值的变化。

其中B(a, b)为贝塔函数, 可以用伽玛函数表示为:

不同客户流失概率的均值为E[p|a, b]=a/(a+b),故客戶的流失概率受到参数a和b的共同影响。

(5)交易率λ和流失概率p相互独立。

(6)观测期从客户第一次购买开始。

2.2 参数估计

MBG/CNBD-k模型除了需要客户在观测期内的重复购买次数x、交易关系时间长度tx 以及观测截止时间T三个方面信息之外,还加入一个反映客户购买时间间隔规律性的变量,记为litt,这是MBG/CNBD-k模型与之前提出的概率模型一个重要不同之处。客户交易时间间隔是否具有规律性,对于预测客户活跃度具有重要影响,litt近似为客户交易时间间隔的对数和,表达式如下:

其中ti表示第i次交易时间,ti+1-ti为交易时间间隔。litt值越大,客户购买时间间隔规律性越强。

MBG/CNBD-k模型中,随机选择的客户在时间T活跃的条件概率为:

客户在未来一段时间内条件期望交易次数为:

模型中的五个参数k, r, α, a, b可以通过式(9)的最大似然法估计得到,样本的似然函数如下。估计程序使用R语言BTYDplus程序包。

根据式(7)和式(8),代入客户历史购买信息(x, tx, T, litt),可以计算客户在观测期结束时客户活跃度及在未来指定时段的期望购买频次。

3 实证分析

3.1 数据处理及描述统计

本研究选取国内某大型石化企业成品油客户交易数据,数据包含约5万客户的80余万条购油交易记录,交易时间为2017年1月到2019年10月。对数据的转换主要包括以下几个方面。

(1)剔除数据中企业内部交易记录,该类交易属于非市场化的交易行为。

(2)构建客户交易特征变量。将原始数据中同一客户分布在多行的交易信息进行汇总,测算每一客户在观测期内除首次购买之外的重复购买频次x;观测期内第一次交易与最后一次交易的时间间隔tx;客户在观测期内第一次交易到观测期截止的时间间隔T,计算客户时间规律性变量litt。四个预测变量的描述性统计如表1所示。

3.2 实验设计

为防止模型出现过拟合,客观评价模型的预测效果,本研究将数据分为训练数据集和测试数据集,训练集为从全部样本客户中随机抽取80%样本客户,测试集为剩下20%的样本客户。并将训练集和测试集划分为观测期和验证期,观测期为2017年1月到2019年6月客户交易数据,验证期为2019年7月到2019年10月数据。使用训练集观测期数据估计模型参数。452F8187-7752-45FF-A17F-EB9E6F421547

MBG/CNBD-k模型对客户流失率的预测效果使用预测准确率、精确率、召回率、特异度、F1值五个指标综合评价。将预测的活跃度与客户后期实际购买情况对比,使用KS曲线选择活跃度阈值,作为流失预测临界点。客户活跃度大于或等于该阈值为未流失客户,小于该阈值为流失客户。

3.3 参数估计结果及预测效果

代入样本客户信息(X=(x, tx, T, litt)),式(9)最大似然法得到估计参数结果为:k=2, r=0.87, α=15.09, a=0.37, b=3.53,代入式(7)得到客户2019年6月30日的活跃度。根据KS曲线选择MBG/CNBD-k模型活跃度阈值为0.8。MBG/CNBD-k模型准确率为81.55%,指在模型预测结果中预测正确的样本占总样本数的81.55%;精确率为88.47%,指在模型预测为流失的客户中预测正确的样本所占比例,模型精确度越高,第一类错误越低;召回率为80.22%,指在真正流失的客户中模型预测为流失的客户占真正流失客户的比重,召回率越高,第二类错误越低。这三个指标互相补充,综合反映模型的估计结果,远高于随机判断。

4 MBG/CNBD-k模型发现的客户购买行为规律

通过对比模型测算的客户活跃度及其购买特征,发现客户在观测截止时间点的活跃度与其购买特征存在以下规律。

4.1 最近购买时间距离当前越近,活跃度及未来复购频次越高

具有相同复购次数客户,客户最后一次购买时间距离观测截止点的时间越近,即tx與T差值越小,其计算得到的活跃度概率及未来交易次数越高。这表明与客户之间没有交易的时间越长,客户流失的可能性越大。表2列出若干个随机抽取的客户,客户6和客户2重复购买频次x及客户时间规律litt相同,客户6距离当前时间更短,其活跃度及未来复购频次高于客户2。

4.2 复购频次越高,活跃度及未来复购频次越高

客户最后一次购买时间距离观测截止点的时间相差不大,客户重复购买频次越高,客户活跃度及未来交易频次越高,如表2中,客户7和客户5时间规律litt及客户最后一次购买时间距离观测截止点的时间相差不大,客户7复购频次更高,其活跃度及未来复购频次高于客户5。

4.3 规律购买客户具有更高的活跃度及复购频次

客户实际复购频次及最后一次购买时间距离观测截止点的时间间隔相差不大,客户购买时间规律性litt越大,客户活跃度及未来交易频次越高,如客户3和客户4复购频次及最近度相近,客户4时间规律性越大,其活跃度及未来复购频次高于客户4。

4.4 最近购买时间对活跃度及未来复购频次的影响高于复购次数及购买规律性

客户最后一次购买时间距离观测截止点时间间隔比复购频次对活跃度及未来交易频次的影响更大,如客户2和客户6活跃度及未来复购频次变化幅度,远大于客户5和客户7的变化幅度;客户最近度影响比时间规律性对活跃度及未来复购频次的影响更大,如客户2和客户6活跃度及未来交易频次变化幅度大于客户3和客户4。

4.5 客户活跃度与购买频次正向相关

随着客户活跃度增大,客户购买可能性和客户未来复购次数也随之增加,详见表3。客户活跃度小于0.8,发生0次购买的客户占比较大,表明购买概率较低,可认为该客户已流失;客户活跃度大于或等于0.8,发生0次购买的客户比例明显下降,发生多次购买的客户比例显著增加。

从以上分析可知,采用KS曲线确定流失临界值的效果较好。客户活跃度临界值对预测客户购买行为具有重要作用,客户活跃度大于或等于该临界值,客户与企业发生交易的概率显著提升。

5 小结与应用建议

MBG/CNBD-k模型在预测客户活跃度和重复购买频次有较好的准确度,企业可将其用于客户关系管理,作为石化企业预测客户行为的决策依据,有助于石化企业维持客户。企业根据客户活跃度和未来重复购买频次对客户进行细分,实行不同类型的客户差异化管理。针对MBG/CNBD-k模型的应用,文章提出以下建议。

5.1 根据客户活跃度进行客户分类管理,提升营销的精准性

根据客户预测活跃度可将客户分为两大类客户:活跃客户和不活跃客户。在活跃客户中进一步识别出零星活跃客户,零星活跃客户是指模型预测为活跃,但是两次购买时间间隔较长的客户。针对不同类型客户采取个性化管理措施。零星活跃客户在活跃与流失之间摇摆,挽留这类客户是企业营销工作的重点,可以给企业带来较大价值。针对活跃客户应采取定期回访措施,保持客户的活跃度。不活跃客户是已经流失的客户,应该分析其流失原因,属于近期流失还是早已流失,针对近期流失的采取必要的挽留营销措施。

5.2 定期根据客户交易特征数据开展客户活跃度预测,了解客户活跃总规模

活跃度除了设置阈值判断客户活跃程度,反映具体客户的流失情况,还可以运用MBG/CNBD-k模型计算客户活跃度,然后将所有客户的活跃度进行加总,以此估算企业客户总规模。客户活跃度总和反映企业有购买需求的累计客户数量,该统计指标是对以客户人数记录测度客户规模指标的一个补充,帮助企业了解客户总体满意度的变动。

参考文献:

[1]周静,周小宇,王汉生.自我网络特征对电信客户流失的影响[J].管理科学,2017(5):28-37

[2]张宇,张之明.一种基于C5.0决策树的客户流失预测模型研究[J].统计与信息论坛,2015(1):89-94.

[3]夏国恩,马文斌,唐婵娟,等.融入客户价值特征和情感特征的网络客户流失预测研究[J].管理学报,2018,15(3):442-449.

[4]齐佳音,李怀祖,舒华英,等.SMC模型在IT分销业的实证研究[J].中国管理科学,2003,11(6):71-76.

[5] SCHMITTLEIN D C,MORRISON D G,COLMBO R.Counting your customers: who-are they and what will they do next?[J].Management Science,1987,33(1):1-24.

[6]吴昊,王纯,周立娟.BG/NBD模型的手机阅读业务客户价值预测实证研究[J].计算机系统应用,2013(3):166-169.

[7] OEST R V,KNOX G.Extending the BG/NBD: a simple model of purchases and complaints[J].International Journal of Research in Marketing,2011,28(1):30-37.

[8] BATISLAM E P,DENIZEL M,FILIZTEKIN A.Formal response to “Erratum on the MBG/NBD Model”[J].International Journal of Research in Marketing,2008,25(3):227-227.

[9] PLATZER M,REUTTERER NADINE S.Leveraging purchase regularity for predicting customer behavior the easy way[J].International Journal of Research in Marketing,2020(12): 194-215.

[基金项目]文章得到教育部人文社科基金(项目编号:19YJA790052)资助。

[作者简介]王子君(1998—),女,汉族,湖北人,硕士,研究方向:客户关系管理;通讯作者:梁峰(1977—),男,汉族,广东人,副教授,博士,研究方向:经济统计、数据挖掘。452F8187-7752-45FF-A17F-EB9E6F421547