APP下载

K-means聚类算法在民航客户细分中的应用

2015-01-04杨倩倩生佳根赵海田

电子设计工程 2015年12期
关键词:客户群订票细分

杨倩倩,生佳根,赵海田

(江苏科技大学 江苏 镇江 212000)

近年来随着国内航空业的迅速发展,航空公司之间的竞争愈演愈烈。如何利用民航信息系统中海量的旅客行为数据进行客户细分,针对不同的旅客群体制定最优的营销策略,以此来保持老旅客,吸引新旅客,充分挖掘潜在的价值旅客,提升企业的竞争力和经济效益,已经到了刻不容缓的地步。

目前,航空公司传统的信息系统已经积累了大量的包含旅客人口统计特征和行为特征的数据,但是,这些数据仅仅局限于简单的记载,缺乏深层次的分析,采用数据挖掘方法进行数据挖掘,发现数据里面蕴含的规则和知识,可以为航空公司提供更有效的客户关系管理方法。本文利用A航空公司的旅客订票行为数据,采用聚类算法中的K-means方法构建民航客户细分模型,并根据客户细分结果分析相应的客户行为特征,针对不同群体的客户提出相应的营销策略建议。

1 客户关系管理

客户关系管理[1](CRM)是一种经营战略,该战略利用信息技术整合企业的客户信息,为企业提供一种全面可靠的认知,赋予企业更完善的客户交流能力,从而有助于维系和拓展这种互利的关系。CRM系统的目的是通过技术和营销策略的结合来改进客户服务、提升客户满意度,实现客户收益率的最大化。

从管理理念讲,CRM是一种以客户为中心的管理理念与经营策略,是将企业的客户作为最重要的企业资源,通过深入的客户分析和完善的客户服务来满足客户的需求,保证实现客户的终身价值。

从技术手段讲,CRM是一种管理软件和技术,它将商业活动和数据挖掘、数据仓库、销售自动化以及其他信息技术紧密结合起来,在企业与客户之间建立一种实时的、互动的交流系统。

2 客户细分

客户细分[2]是客户关系管理(CRM)的重要组成部分,是企业实现客户关系管理的重要工具和环节。客户管理学中的二八法则表明,企业80%的利润是由20%的客户创造的,即相对较少的大客户创造了极大的利润。因此,如何维持与高价值客户的良好关系,进一步挖掘潜在价值客户,合理分配有限的资源,提供有针对性的差别服务,是企业在激烈的市场竞争中制胜的关键。

3 K-means聚类算法

K-means算法是一种得到最广泛使用的基于划分的聚类算法,把n个对象分为k个簇,以使簇内具有较高的相似度。相似度的计算根据一个簇中对象的平均值来进行。K-means算法采用迭代更新的思想,首先随机地选择k个对象,每个对象代表一个簇的初始均值或中心。对剩下的每个对象,根据其与各个簇中心的欧式距离,将它分配到最相似的簇。然后K-means算法迭代地改善簇内变差。对于每个簇,它使用上次迭代分配到该簇的对象,计算新的均值。然后使用更新后的均值作为新的簇中心,重新分配所有对象。迭代继续,直到分配稳定,即本轮形成的簇与前一轮形成的簇相同[3]。

K-means算法的具体步骤:

输入:聚类个数k和包含n个对象的数据集X={x1,x2,…,xn};

输出:k 个簇{S1,S2,…,Sk}

方法:1)从数据集中随机选定k个对象作为初始聚类中心 c1,c2,…,ck;

2)逐个将对象 xi(i=1,2,…,n)按欧式距离分配给距离最近的一个聚类中心

其中Nj是第j个聚类Sj所包含的对象个数;

4)若聚类中心不再变化,目标函数最小,算法终止,否则转步骤2)。

4 民航客户细分模型

随着民航信息化程度的日益加深,航空公司快速准确的客户分析将成为制定差异化营销策略、提升企业竞争力的必然需要。本文为A航空公司提供科学合理的客户细分模型,能够正确地对该航空公司的旅客进行分析,确定不同的客户群对该航空公司的价值,以此方便A航空公司针对不同客户群的行为特征制定有差别的营销策略,提升A航空公司对客户的吸引力,从而提升A航空公司在民航市场中的竞争力。

4.1 数据准备与预处理

数据处理是模型实施的保障,数据预处理所得到的数据质量将直接影响到民航旅客细分结果的精度和性能。本实验采用A航空公司的旅客订票数据,包含旅客的订票记录、旅客个人基本信息等。使用SPSS作为数据预处理的主要工具,通过数据清理、数据细分变量的选择来实现对数据的预处理[4]。

首先对数据进行清理,主要对数据集中缺失的数据进行缺失值处理,采取SPSS自带的临近点中位数的方法为缺失值进行填补,如图1所示。

细分变量的选择是数据预处理的关键步骤,细分变量不仅关系到模型的实施,而且关系到后期的结果分析[5]。本文使用SPSS软件对这些数据变量进行分析,筛选出对民航客户细分模型有意义的属性项,得到的结果如表1所示。由于涉及客户和航空公司隐私,省略了一些属性项的列举。

图1 SPSS数据缺失处理Fig.1 SPSSmissing data process

表1 A航空公司的订票数据Tab.1 The ticket data of A airline

4.2 应用K-means聚类算法建模

本文根据客户价值将客户分为高价值客户、普通客户和低价值客户3类。因此建模的聚类个数k设为3,实验所用数据集为A航空公司的1 000条订票数据,预处理后利用K-means算法进行聚类,得到结果如表2所示。

表2 聚类结果Tab.2 The results of clustering

分析表2各个客户群的特征:就舱位而言,Y舱在每个客户群中都占有较重的比例,由此可见商务型旅客应该是航空公司今后的重点营销对象。客户群1的主要特征是提前订票时间较短,并且折扣较低,可知这类旅客对票价不敏感,但对时间敏感,且以商务旅客为主,应该是高价值客户。客户群2多为常旅客,提前订票时间为5天左右,对时间的敏感度仅次于客户群1,折扣也相对比较低,应是普通价值客户,航空公司可提供一些营销策略,将该类客户向客户群1发展。客户群3提前订票时间长,折扣较高,应是低价值客户,以学生、游客为主。

5 结 论

客户管理和营销是目前我国民航运输企业发展的一个难点,如何将航空旅客划分为不同的客户群,针对不同的客户群制定有差别的营销策略,从而提供不同的服务与管理成为民航企业发展的关键问题[6]。本文利用K-means聚类算法实现对航空旅客的划分,航空公司可以根据旅客细分的结果进行分析,结合实际条件,为不同价值的客户提供不同的服务,从而提升企业在民航市场中的竞争力。

[1]郭雯.基于客户认知价值的CRM战略[J].商业研究,2003,8(268):9-12.GUOWen.CRMstrategy based on customer cognitive value[J].Commercial Research,2003,8(268):9-12.

[2]朱金福,刘凤.航空货运客户细分与客户价值分析方法[J].交通运输工程学报,2005,5(2):73-76.ZHU Jin-fu,LIU Feng.Analysing method of customer segmentation and customer value of air cargo[J].Journal of Traffic and Transportation Engineering,2005,5(2):73-76.

[3]闫相斌,李一军,叶强.基于购买行为的客户分类方法研究[J].计算机集成制造系统,2005,11(12):1770-1774.YAN Xiang-bin,LI Yi-jun,YE Qiang.Research on customer segmentation based on purchase behaviors[J].Computer Integrated Manufacturing Systems,2005,11(12):1770-1774.

[4]胡少东.客户细分研究[J].工业技术经济,2005,24(7):63-69.HU Shao-dong.The research of customer segmentation[J].Industrial Technology and Economy,2005,24(7):63-69.

[5]刘英姿,何伟.基于不同视角的客户细分方法研究综述[J].商场现代化,2007(31):271.LIU Ying-zi,HE Wei.The research of customer segmentation method based on a different perspective review[J].Market Modernization,2007(1):271.

[6]罗彪,闫维维.基于ANP和K-means聚类的客户价值分类模型及应用[J].计算机应用,2013,33(10):2954-2959.LUO Biao,YAN Wei-wei.Customer value classification model and application based on analytic network process and K-means clustering[J].Journal of Computer Applications,2013,33(10):2954-2959.

猜你喜欢

客户群订票细分
深耕环保细分领域,维尔利为环保注入新动力
WebService接口技术在项目中应用
订票姑娘
1~7月,我国货车各细分市场均有增长
浅析微电影
整体低迷难掩细分市场亮点
专注于特殊客户群社交网广告
纸媒新希望 看新型报纸如何细分市场逆势上扬
改进的k—means聚类算法在客户细分中的应用研究
稍安勿躁