基于数据挖掘的航空公司客户价值分析
2017-03-28刘婷婷王小丽葛明涛
刘婷婷+王小丽+葛明涛
摘 要:伴随着航空公司的竞争日益剧烈,怎样改善个性化服务提高客户满意度是公司在体验经济时代必须面对的问题。面对海量数据,传统的统计办法弊病浮现,笔者尝试用数据挖掘技术处理航空公司客户价值分析问题。数据挖掘技术应用到航空范畴,可以实现对航空公司现有数据资源深度挖掘,为航空公司针对不同的客户群采取个性化的营销方案提供科学依据。本文的创新之处在于将数据挖掘技术应用于解决航空公司具体问题之中,目的在于提高客户价值分析的准确性和高效性,提高信息化应用水平。
关键词:数据挖掘;客户价值分析;K-Means聚类分析
DOI:10.16640/j.cnki.37-1222/t.2017.04.248
1 绪论
体验经济时代消费趋势主要有以下六个方面:体验化、情感化、个性化、主动化、休闲化和求美化。[1]第三次工业革命以来,现代信息技术得到迅猛发展,各行各业意识到数据的重要性,建立了无数的数据库,面对数以亿计的数据,传统的统计方法的弊端日益显现。人们面对海量的数据,却不能挖掘出有用的信息,随着“数据爆炸”困惑的增加,人们迫切需要新的数据处理技术,因而数据挖掘技术应运而生。法国著名雕塑家罗丹说,生活中从不缺少美,而是缺少发现美的眼睛。如今,企业从不缺少数据,而是缺少挖掘数据价值的能力。通过对现有数据的挖掘,发现隐藏在数据里的模式,有用信息,指导航空公司作出决策,增加顾客的满意度,是航空公司必须解决的问题。自从1989年举行的第十一届国际联合公认学术会上首次提出数据库中发现知识(KDD),到目前为止,美国人工智能协会曾经举办了9次KDD全球研讨会。规模从原来的专题讨论会到策略和技术的集成以及多学科跨领域融合。数据挖掘技术迅速在航空电子领域,航空安全领域,航空维修等等航空领域得到较好的应用与发展。我国在上世纪90年代的时候就已经开始的对数据挖掘的研究,经过多年的研究,我国已经形成数据挖掘基础理论的框架,并且越来越多的学者投入数据挖掘的研究之中。不过相对于国外来说,我国的数据挖掘应用并没有得到较高的发展,依然面临着严重的挑战,仍旧有很多问题等待着研究人员去探索和发现。
2 数据挖掘技术
数据挖掘有三大步骤:第一数据筹备,第二数据挖掘,第三结果表达和解释[5]。
数据筹备包含数据集成,数据选择,目标数据预处理。
数据挖掘主要是对预处理后的数据进行挖掘。
结果表达和解释即我们所说的结果可视化。
3 航空公司客户价值分析
3.1 传统客户价值分析方法
传统的客户价值分析使用RFM方法(Recency--最近购买日期, Frequency--各时期购买频率, Monetary一段时间内消费总和)在多数领域中的多数情况下能有效地预测老顾客今后可能的消费行为和费用,之后对销售毛利率、关系营销费用进行预测,就能按不同时间段分析出今后短期内的客户价值。[6]说明, 在这种分析方法中,客户价值是指CRM毛利。CRM毛利 = 购买金额 - 产品成本 - 关系营销费用。[7]
RFM模型以Recency为X轴,Frequency为Y轴,Monetary为Z轴做一个三维立体模型,可以把客户价值分为八种:重要发展客户、重要价值客户、一般发展客户、一般价值客户、一般保持客户、一般挽留客户、重要保护客户、重要挽留客户。
由于航空公司客户的独特性,RFM方法分析航空公司客户价值存在多种弊端和不足,造成分析结果的不准确和实用性降低。
(1)在RFM模型中,消费金额是一段时间内客户消费总和,由于航空票价受到运输距离,舱位等级,闲忙时,天气等众多因素的影响,同样消费金额的客户对于航空公司的价值是不同的。所以用这个指标分析航空公司客户价值存在不妥。
(2)RFM是使用属性分箱法分析客户价值的,这种方法细分客户群较多,需要逐个识别客户特征和行为,大大提高的针对性营销的成本。
(3)RFM方法在处理大量数据时由于模型的限制需要的成本较高。
3.2 航空公司客户数据分析方法与步骤
航空客户信息,包含会员档案信息和其他乘坐航班记录信息等
(1)因为消费金额总和这一指标在航空公司客户价值分析过程中不太实用,所以我们可以选择航空客户在一段时间内积累的乘坐距离M和乘坐舱位折扣系数平均值C来替代消费金额总和。同时,因为航空公司会员的加入时间一定程度上可以影响客户价值,所以我们在航空公司客户价值分析模型中添加客户关系长度L,当做区分客户价值的另一个指标,所以我们构建出LRFMC模型。
(2)使用聚类分析的方法把客户进行分类,并且分析客户群的特征,分析客户价值。
第1步数据抽取。
(1)以2014年3月31为结束日期,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有顾客的详细资料形成历史数据。对于后来新增客户信息利用数据中最大的某个时间作为结束时间,采用同样的方法进行抽取,形成增量数据。
(2)根据末次飞行日期从航空公司系统内抽取2012年4月1日至2014年3月31日内所有所有乘客的详细数据,共62988条记录。
第2步数据探索分析。
在原始数据中存在票价为空的情况,票价为空值的数据有可能是航空客户未有乘机记录造成的。票价最小值为0,折扣率最小值为0,总飞行里程不为0的数据有可能是顾客使用0折机票或者是使用积分兑换的机票造成的。
第3步数据预处理。
(1)数据清洗:从航空公司业务和数据挖掘建模需要考虑筛选出需要的数据。
A)不需要票价为空的数据。
B)不需要票價为0,平均折扣率不为0,总飞行里程不为0的数据。
(2)属性规约。在原始数据中数据属性太多,我们只需要与LRFMC模型相关的6个数据属性,所以我们需要删除不相关,弱相关和冗余的数据属性。
(3)数据变换。A)数据属性构造 B)数据标准化
第4步建构模型。
构建航空公司客户价值分析LRFMC模型
A)客户K-Means聚类分析 B)客户价值分析 C)应用模型
A客户K-Means聚类分析。
采用K-Means办法对所有客户数据进行聚类分析,将客户数据聚为5类。(具体情况具体分析,必须依据实际状况决定分几类)
B客户价值分析。
对聚类结果进行属性分析:顾客群1在L、M属性上最小;顾客群2在R属性上最大,在F、M上最小;客户群3在属性F、M上最大,在R上最小;客户群4在属性L上最大;客户群5在属性C上最大。
根据航空公司业务定义为五个等级的客户类别:重要保持客户,重要发展客户,重要挽留客户,普通价值客户,低价值客户。
根据每种客户群类型的特征对客户群進行客户价值排名,以便获得高价值客户的信息。
C模型应用:根据每种客户群的特征,可以采取更多个性化服务和营销策略。
由于各种行业面临的具体问题不同,数据挖掘技术的发展受到不同的挑战,不过总大趋势来说,数据挖掘技术必将会得到更好发展和更加普遍的运用。随着数据量爆炸式的激增,分析决策难度的增加,传统分析方法弊端的显现,人们对分析决策智能化和自动化的迫切需求,数据挖掘技术与工具将得到更广泛的使用和发展。在数据爆炸时代,航空公司面临的新挑战为数据挖掘技术提供了发展背景,个性化服务的发展为数据挖掘技术提供了很好的基础和发展平台。
数据挖掘未来会吸引越来越多的研究人员,会涌现出越来越多的研究成果。从目前来看,数据挖掘在中国的研究与应用还有很多务实的问题没有解决。本文仅仅是数据挖掘技术在航空公司客户价值分析中的初步尝试,展望未来数据挖掘的发展,有以下几点需要注意的地方:要充分考虑是否有必要进行数据挖掘。传统的数据分析办法的确有很多弊病,但是相对于传统的方法数据挖掘需要成本较高。在传统数据分析技术可以满足要求的情况下,没有必要必须进行数据挖掘,这样能更加节省成本。数据挖掘需要较大的成本,须要大量的人力,物力和财力用于数据筹备,数据搜集,问题建模,生成模型和数据分析等等。
参考文献:
[1]吴钊.体验经济时代六大消费趋势[J].商业研究,2003(24).[2]Jiaweihan,Miche line kan ber.Data ming:Concepts and techniques.Diane Cerra Publisher.20063
[3]刘浩,韩晶.MATLAB R2014a一本通[J].电子工业出版社.
[4]李定远.CIO时代网.2012,09(29).
[5]耿向华.数据挖掘在旅游商务系统中的应用研究[J].魅力中国,2013,5(27).
[6]郭良.基于数据挖掘技术的客户信息分析[J].华东师范大学硕士论文,2015.
[7]郭良.基于数据挖掘技术的客户信息分析[J].华东师范大学硕士论文,2015.
项目基金:郑州大学西亚斯国际学院2016校级课题,编号2016KY0