APP下载

航空公司客户价值分析及流失预测

2021-09-05周杨頔

商讯·公司金融 2021年18期

作者简介:周杨頔(1999-),女,汉族,北京人。主要研究方向:信息管理与信息系统(大数据与商务分析方向)。

摘要:随着民用航空运输的不断发展,乘机出行已经成为越来越多人的选择,航空公司也面临着愈加庞大的客户群体。那么,了解客户特点和计算客户价值成为航空公司必须面临的课题。本文以某一航空公司为例,分析航空公司客户群体的整体分类并且利用已有的数据对客户进行流失预测。通过研究,发现该航空公司的客户可以分为五类,对应着不同的客户价值,并从不同角度对分类和价值进行验证。在此基础上,本文还分析不同指标之间的相互影响和关联,帮助航空公司更好的了解客户和市场。

关键词:RFM模型改进 客户细分 Logistic回归 流失预测

随着人们生活水平的不断提高,我国航空客运业务发展迅速。2014-2019年,我国民航主要客运能力指标保持平稳增长,其中2019年全行业完成旅客周转量11705.1亿人公里,较2018年增长9.3%。航空客运需求不断增大的同时,各个航空公司之间的竞争也日益激烈。

一.研究背景及目的

客户价值理论经过前人不断地研究,例如RFM模型、CRM理论等等相关研究,已经为如今市场面临的客户价值分析和客户关系建立打下了坚实的基础。其中,研究的主要目的即为客户细分和流失预测。使用改进后的RFM模型对客户评估打分,量化每一位客户的客户价值,并给出航空公司相应的营销策略,帮助航空公司对客户流失进行预测,尽可能早地察觉客户的流失风险,为挽留客户争取时间和机会。

(一)数据处理

样本数据主要包括客户的会员卡号、入会时间、性别、会员卡级别、飞行里程数、飞行积分情况、飞行次数、飞行时间间隔等属性。根初步分析,将数据杂乱和缺失较多的变量删除并剔除部分分析指标上有缺失的个案。

其次,将“WORK_COUNTRY”“GENDER”转换为哑变量“IS_DOMASTIC”(0-国外,1-国内)和“NGENDER”(0-“男”,1-“女”);将“AGE”大于100的样本剔除;“LOAD_TIME”有四个省缺值,故将省缺值记为相同日期;计算首末乘机时间差并剔除小于零的个案。

第一和第二年票价“SUM_YR_1”、“SUM_YR_2”两个变量中均存在观测值为0的个案,这可能是乘机人购买到零元折扣机票或用积分兑换。由于此类个案所占比例较小,故不纳入分析。因此删除总票价为0,平均折扣率为0(数值越大,折扣越大),积分兑换次数为0,而飞行里程大于0或者乘机次数大于0的个案。

(二)数据初步分析

通过独立样本T检验可知,男性观测窗口内的平均飞行次数比女性多3.47次。此外,在飞行加权公里数、观测期内支付的总票价以及入会时长上,男性均与女性有显著差异且平均值更大。

通过单因素的方差分析发现,与级别4相比,会员卡级别5、6的客户支付的总票价较高、乘机次数较多并且明显更加活跃,客户价值明显高于级别4。通过ANOVA检验发现,会员级别越高,平均折扣率越大,这可能更加激励了高级别会员的乘机选择。

二.客户细分

(一)RFM模型

RFM模型是常見的评价客户价值的模型。R指客户最后一次消费行为发生到观测点之间的时间差,F是指观测窗口内客户的消费频率,M是指观测窗口内消费的总金额。[1]为保证模型更加贴近研究,做出如下改进:

1.改进R算法

借鉴季晓芬、贾真在该方向上的研究,R的测算可以做出如下改进:

其中为客户观察期内首次乘机的时间,为客户观察期内的末次乘机的时间,为观测窗口结束时间。当最远乘机时间差相同时,最近乘机时间差越小,R越小,表示客户更加活跃。当时,R=1,这可能是由新客户在观测窗口期内仅乘机一次造成的[2]。同时,为保证R大于0,在进行日期之间差运算时,将首末乘机日期均向前推一天。

2.改进后的RFM模型——DRFKM模型

由于原始数据中包含的属性太多,且根据数据的初步探索之后可知有些变量不适合进行计算,故选取与改进后的RFM相关的属性进行分析和计算。

因为航空公司会员的加入时间一定程度上可以影响客户价值,所以我们在航空公司客户价值分析模型中添加客户关系长度 D(Duration),作为区分客户价值的一个指标[3]。

1.D:Duration,“入会时长”,以天数为单位

2.R:M_R,即“客户活跃度”,参考改进后的R算法

3.F:Frequency,“飞行总次数”

4.K:WEIGHTED_SEG_KM,即“飞行加权公里数”

5.M:Monetary,“支付的总票价”

首先,直接对相关的五个指标进行标准化变换。此处没有取到数运算是因为逆向指标R的聚类结果更理想。由于样本数量较大,故采取随机抽样的方式,抽取4%的个案进行系统聚类,确定分为五类比较合适,并将各类的聚类中心作为K-Means聚类时的初始聚类中心。在各分类上,个案的分布情况和不同类别在不同指标上的得分区别亦比较明显。

(二)综合评价体系计算客户价值

1. 综合评价体系

在前人研究经验的基础上构建综合评价体系,具体实现方式由图表1所示[4]:

2. 数据处理

(1)将积分类变量进行探索性因子分析

会员积分类变量包含18个相关变量,建立模型前先对这些指标进行初步探索分析,对部分不适于建立模型的变量进行剔除。总共提取了四个因子,分别命名为“乘机积分”、“里程积分比例”、“其他积分”和“积分变动”。因子分析结果中,KMO 取样适切性量数为0.706,同时,为了保证所有指标的提取度大于75%,所以提取4个因子,总共解释了84.214%的方差,提取度较好。

数据处理

“AGE(年龄)”与指标M“支付的总票价”的散点图,客户支付总票价从40岁向两边递减。故将年龄以40为界,大于40岁的个案按照比例:

映射到[10,40)岁的范围内,可得“NEW_AGE(年龄N)”。y表示映射后的年龄,x表示个案的真实年龄。

“预期”指标下的“客户的成长预期”是:以飞行总次数、支付的总票价和总累计积分三项指标在观测期的第二年与第一年的差值为基础,再对三项差值用主成分的方法提取一个因子,将因子得分作为观测值。

“客户活跃度(x9)”由改进后的RFM模型中R(NEW_R)的倒数来衡量。

“会员价值”下的指标可以从原数据和之前已经计算的数据中获得;“保持价值”的“积分变动”可以从上述对积分类变量的因子分析中获得。

3. 层次分析法

判断矩阵由桂林电子科技大学市场管理学院老师做出,以此为参考计算各个客户的各级指标得分以及综合得分(“SCORE”表示综合得分)。数据规格化和权重计算过程用R语言实现。

三.客户细分基础上的探究

DRFKM模型和综合评价体系结果对比,在数据的初步分析阶段可知,男性客户偏向高价值客户。根据上述的分析将客户分类:

重要保持客户——分类1

这类客户的飞行总次数、飞行的加权公里数明显高于其他类型的客户, 说明此类客户对航空飞行的依赖程度较大,一般情况下不会改变对出行的选择,是航空公司重要的优质客户群。

重要发展客户——分类2

与重要保持客户相比,这类客户在各指标上的得分或者是数值明显小,尤其是这类客户的入会时长短造。也就是说,只要能持续吸引此类客户消费,培养其消费习惯,这类客户有很大的发展潜力,可以给企业带来较高的潜在利润。

1.重要挽留客户——分类3

组4应当属于重要挽留客户。这类客户在入会时长这一项指标上明显较高,但是飞行次数和活跃度等均不高。这类客户游走在流失的边缘,说明这类客户对本企业或者是对于航空出行的方式依赖度不高,但是并没有完全排除这种出行选择。

2.一般客户与低价值客户——分类4、5

组2为一般客户,这类客户的入会时长较短,其他指标与组别1、3比较来说均比较低。组别5在所有衡量指标上都呈现弱势,所以将此类归为低价值客户,这类客户可能只在能够获得低价票时才会消费,所以企业不应将精力过多花费在此类客户上。

四.Logistic回归预测客户流失

(一)模型建立

對客户是否流失作预测,有本文对流失客户作如下定义:最后一次乘机时间至观测窗口末端时长大于等于观测窗口内最大乘机间隔[5]。

由于利用SPSS采用“向前:有条件”的方法二元回归,并将原始数据中经过数据处理后的数据均加入模型进行筛选。同时为更好解释结果和便于数据直接获得,用转换后的年龄作为“年龄”的观测值,用“客户活跃度”用末次乘机至观测期结束的天数差为衡量标准。

(二)结果分析

经过多次迭代,在步骤17筛选出最终的17个变量建立整体显著且拟合效果较好的回归模型,最终预测准确率达到94%。

对方程中的变量进一步分析可知,“季度平均飞行次数”每增加一个单位,客户流失的风险与原来相比增加7.525。其他指标的影响虽然没有这项显著,但是也可以看出整体的影响趋势。例如,“积分兑换次数”、“末次乘机至观测窗口末端时长”两项指标的观测值偏大的客户容易流失,会员等级为4的客户相对于会员等级为6的客户容易流失。

从Exp(B)小于1的指标来看,“第1年乘机次数比率”对客户是否流失的影响最大,每增加一个单位,客户流失的风险与原来相比降低。参考其他指标的优势比可知,年龄越接近40岁、性别为女性,在国内工作以及平均折扣率偏低的客户流失的风险偏小。

结合DRFKM模型再次对样本做相应分析,用最优标度法做出类别点的联合图。由图表2可知,只要各个指标水平达到中等及以上,客户的流失风险就会降低。流失趋势和上述DRFKM模型和综合评价体系分析结果相照应,流失风险和指标得分呈现负相关。

五.结语

通过本文的分析和研究,可以对航空公司的客户群体细分为五类,并向航空公司提出一下建议:

一.会员等级变更

建立会员制已经是大多数商家的营销手段,从本文的样本分析数据来看,乘坐过该航空的客户基本都成为航空公司的会员。通过上述的分析可知,会员等级越高,客户给航空公司带来的价值就越高,相应的客户生命周期也越长。级别5比级别6的客户在总体上大约仅多出3%,对于航空公司而言,应当注重发展级别5的客户,使级别5和6之间的有一定的差异,保证不同会员级别的人数合理,才能保证会员制度的有效性。航空公司还注重会员等级制度与其他服务的关联,尤其是“平均折扣率”以及“非乘机积分变动”之间的联系。

二.积分变动与交叉销售

从Logistic回归分析可知,“非乘机积分的变动次数”越多,客户流失的风险就越小。因此,航空公司可以深入了解客户非乘机积分的变化情况,分析客户的主要积分获取途径。对于重要挽留客户而言,如何提升乘机价值是航空公司应当重点考察的因素。这类客户入会时间,但是乘机价值并不高,这可能因为此类客户有一部分的乘机需求具有季节性。由于消费间隔期较长,客户容易降低对对航空公司的关联程度,所以航空公司可以通过与其他航空公司或者其他产品联合销售,让客户在非乘机期间持续与航空公司保持关联。

三.保持优质客户,挖掘客户价值

综合DRFKM模型和综合评价得分结果来看,组1重要保持客户和组3重要发展客户的得分差异主要体现在客户的当前价值和潜在价值上,尤其使当前价值上的差异。企业如果采取更积极、恰当的营销手段,让这类客户充分了解企业的产品或者提供更多接触的机会,会从这类客户身上获取相当的利益[7]。

参 考 文 献

[1]Hughes A M. Making database pay off using recency, frequency and monetary analysis(J}. Journal of Database Marketing, 1995, 3:77-89.

[2]季晓芬,贾真.基于RFM行为模型的服装企业VIP顾客数据挖掘[J].浙江理工大学学报,2015,34(04):131-135.

[3]刘婷婷,王小丽,葛明涛.基于数据挖掘的航空公司客户价值分析[J].山东工业技术,2017(04):287-288.

[4]陈延杰. 基于数据挖掘技术的航空公司会员客户价值研究[D].福州大学,2015.

[5]申玉伟. 航空公司客户分类及流失预测[D].贵州财经大学,2019.