基于机器学习的航空客户价值分析
2020-07-04季杰陈强仁朱东
季杰 陈强仁 朱东
摘要:随着各大航空公司的业务竞争越来越激烈,在知名度与航空服务的竞争已经分不出太大差异的情况下,怎样努力提高用户客户满意度是当前航空公司最要注重的问题,可在海量的用户数据面前,传统的方式显然不够用,所以笔者尝试用机器学习技术处理航空公司客户价值分析问题。解决方案就是使用K-Means聚类均值算法将现有航空公司客户进行分群,这样航空公司就好针对不同的客户群体进行不同的营销方案。
关键词:机器学习;客户价值分析;K-Means算法
中图分类号:TP3 文献标识码:A
文章编号:1009-3044(2020)14-0238-02
1引言
在经济发展快速的现代社会,飞机出行已经不是难事,各大航空公司的竞争也开始愈演愈烈,从价格战转到服务战,但由于其之间差异又不是很大,导致竞争一直没有分出个胜负。但随着航空客户体系越来越成熟,企业开始注重“以人为本”,注意到以前的营销方式只会造成资源倾斜,所以新时代下不同的客户要有不同的营销方案。而本案例做的就是针对客户以往的消费以及飞行情况进行分析,然后进行分群,这样航空公司就可以针对不同的客户群体制定不同的个性化服务,从而达到留住客户,吸引客户的目的。
2航空客户价值分析流程&数据预处理
2.1航空客户价值分析流程
想要对客户价值进行分析,我们首先要对航空客户信息数据进行预处理操作,因为其中存在一些异常数据,这些数据将会影响到我们的结果,而预处理结束后,我们就可以进行特征构建了,毕竟用户信息那么多的情况下,我们必须选取出我们适用的特征指标,所以我们采用了LRFMC模型来构建特征模型,最后我们使用K-Means聚类算法来进行客户人群分类。
2.2航空客户数据预处理
航空公司客户数据中存在着少量的异常值,若是不处理的话会对之后结果产生影响。
1)通过对原始数据的观察发现,在数据中有票价为0,折扣率为0,总飞行里程却大于0的数据,这很显然是不正常的,其中还有票价为空值的数据,这可能是客户乘机记录不存在导致的,所以我们将这类数据丢弃掉。
2)数据中也可能存在折扣为0,客户乘坐0折飞机的情况发生,由于原始数据集数量大,所以我将这类数据也丢失掉,以免影响分析结果。
3构建航空客户价值模型
3.1客户价值分析常青树-RFM模型
想要对用户进行分群,除了进行预处理以外,还要构建用户的特征模型,这样我们好将用户区分开来,而各行业最常用的客户价值模型就是RFM模型。
1)R指的是客户最后一次消费与这次观测结束时间的间隔。
2)F指客户的消费次数,消费越多的自然客户价值也就越大。
3)M指客户的消费金额,消费金额越大的他们的消费水平也自然越高。
3.2航空客户价值分析-LRFMC模型
与寻常的客户分析不同,RFM模型的客户消费金额并不能体现航空客户的价值水平,所以本案例去掉了客户的消费金额,并选择了客户的飞行里程与购买机票的平均折扣系数,一共五个特征指标,记为LRFMC模型。下面是特征详细解释:
1)客户入会时间L:客户第一次购买机票距离现在的时间;
2)消費时间间隔R:客户最近一次乘坐飞机距离现在的天数;
3)消费频率F:客户在观测期间乘坐飞机的次数;
4)飞行里程M:客户在观测期间飞行里程;
5)平均折扣系数C:客户在观测期间获得的机票折扣的平均值。
4基于K-Means算法进行客户分群
之所以选择K-Means算法,因为这是最普及的聚类算法,也是比较适合我这类新手的聚类算法,下面我简单地介绍下步骤:1)Kmeans算法先要假设将数据分成多少类,我认为航空客户群体可以分为5类。2)随机选取k个目标点,它们作为聚类中心3)计算数据集中每个点到K个聚类中心的距离,然后将它们分配到距离它们最近的聚类中心,这样就能形成5个簇。4)因为本案例的数据量比较大,所以以上步骤得到簇是比较散的,而我们要的结果是要相似的越接近,不相似的越远,所以算法会重复上面的步骤,直到得到合适的客户群。
总体来说,K-Means算法的结果符合我的预期想法,我们可以从下图中详细地看出各类人群的人数以及他们分布的原因,比如图中第三类客户群体,他们折扣系数高,人数少,他们的其他特征指标都不突出,但却能带来很多利益,所以航空公司要提升这类重要发展客户的价值,又比如第5类人群,他们飞行里程高,飞行次数也多,为航空公司创造了很多价值,这类重要保持客户群的高消费水平是航空公司要稳定保持的,平时要多给些优惠和折扣让他们对公司产生依赖,除了上面两类人群外,航空公司还要防范重要挽留客户的流水并积极进行关系修复。至于一般客户,平时公司可以给些小优惠和福利折扣来进行吸引消费,但不用太多太勤,至于无价值客户,建议航空公司不要在这类客户群身上花功夫,趁早选择保留还是放弃。
5结论
在本次航空客户价值分析案例中,首先我对航空客户数据进行了探查与预处理,得到了无异常值的数据,确保之后的模型训练中不会影响结果,然后我根据客户信息,选取并构建特征指标,构建了LRFMC航空客户价值模型,最后我通过K-Means聚类算法将航空公司客户群体分为了特征需求比较明显的五类。这次案例的结果符合我的预期,也符合市场销售的法则,并且在流程结尾我也对航空公司怎样针对这五类客户群体进行了建议,最后我感觉不管在哪个行业,在新时代对不同客户群体进行精准营销势在必行。