基于层次聚类FCM算法的航空客运市场细分
2015-02-16曾小舟
王 悦,曾小舟,傅 骏
(南京航空航天大学 民航学院,江苏 南京 210016)
基于层次聚类FCM算法的航空客运市场细分
王 悦,曾小舟,傅 骏
(南京航空航天大学 民航学院,江苏 南京 210016)
运用层次聚类法和FCM算法,从Kotler四维顾客价值角度构建航空客运市场细分量表,形成施测问卷,获取样本数据。将因子分析与基于层次聚类的FCM算法相结合,获得4类差距明显的子市场,并验证了市场细分的有效性。研究结果表明,基于层次聚类的FCM算法细分航空客运市场能够获得较为满意的结果,也验证了该混合算法的合理性、有效性和可操作性,其中细分量表与基于层次聚类的FCM算法可作为航空客运主体细分市场的依据和方法。
航空客运;层次聚类法;FCM算法;市场细分;顾客价值
1 市场细分方法
就本质而言,所有市场细分方法均可归结为两类,即事前细分和因果细分。事前细分指在细分前已选定细分标准与方法,根据已确定的依据或标准对顾客进行分群;因果细分,也称事后细分,即在市场细分前,细分标准和最终细分类目均未知,通过相应的统计技术对顾客调研结果进行分析,从而得出细分结果[1]。目前,常用的市场细分方法主要有多维尺度分析法[2]、联合分析法[3],以及聚类分析法。其中,聚类分析方法是进行市场细分最常用的方法之一。传统的聚类分析是一种硬划分,如典型且应用广泛的层次聚类、K-Means聚类,以及C-均值算法。而现实中,待处理样本或对象往往显示出多个类别特征。模糊聚类分析方法则建立了样本类属的不确定性描述,较为契合并能够反映现实状况[4],其中模糊C-均值(fussy C-means,FCM)算法运用广泛。
秉着实用、简洁、可靠性强的甄别原则,笔者对照各类方法的使用状况,在Kotler四维顾客总价值概念与顾客感知价值测评相结合的基础上,将层次聚类与FCM算法的联合使用引入航空客运市场细分研究中,并验证细分结果的有效性,实现科学划分航空客运市场,为航空运输主体的有效性营销提供理论借鉴。
2 基于层次聚类的FCM算法
层次聚类法可分为凝聚的层次聚类和分裂的层次聚类两种,算法简单,操作方便。但在该算法中,对象点一旦被合并或分裂,所作处理不可撤销,类间也无法交换;此外,层次聚类法可伸缩性较差。
FCM算法通过最小化基于某种范数和聚类原型的目标函数将没有标签的数据进行分类。FCM算法虽在原有硬划分基础上添加了0与1之间的隶属度概念,但仍存在以下两个缺陷: ①对噪声和野值敏感;②对初始聚类中心较为敏感,难以确保收敛至全局最优解。
以金薇等[5]提出的基于层次聚类的K-Means算法为发散点,将层次聚类与FCM算法相结合,由层次聚类得出数据样本的轮廓信息,继而使用FCM算法进行高质量的聚类运算。以航空客运市场细分为具体研究对象,将该算法的思想使用Qt 5.3.2进行编程实现,获得航空客运细分子市场。
该混合算法中,对象间的相似性用欧氏距离度量,即:
(1)
式中,xi与xj为两个p维数据对象。基于层次聚类的FCM算法过程分为两个阶段。
第一阶段由层次聚类获得样本数据轮廓信息,获得初始类个数与初始中心点,算法思想描述为:①以s维向量xi(xi1,xi2,…,xis)(i=1,2,…,n)描述n个样本数据点,构成n行s列数据矩阵;②以欧氏距离判别数据点间亲疏关系,获得相距最短的两个数据点并将其归为一类;③以相距最短两个数据点的均值作为新类中心点,以聚类特征Yi=(ai,bi)(i=1,2,…,c)描述新类,ai为第i类中数据点个数,bi为该类数据点均值,亦即该类中心点;④重复步骤②和步骤③,直至层次聚类运行时间占整个算法运行时间达到预设比例,该时间比例为多次实验获得的最佳数值,该研究中以分层类目体现;⑤通过上述步骤获得初始类目c,以bi作为FCM算法的初始类中心,将初始类目c与初始类中心作为FCM算法运行的初始值。
第二阶段是在层次聚类结果的基础上,运用FCM算法获得最终聚类结果。FCM算法思想描述如下:令X={x1,x2,…,xn}⊂Rs表示给定样本集合,s为样本空间维数,n为样本个数,c(c>1)为X的聚类数目,则FCM算法可表述为[6]:
(2)
使得:
(3)
(4)
uij≥0,1≤i≤c,1≤j≤n
(5)
式中:m>1为模糊系数;U=uij为c×n的模糊划分矩阵;uij为第j个样本xij属于第i类的隶属度值;V=[v1,v2,…,vc]为由c个聚类中心向量构成的s×c的矩阵;dij=‖xj-vi‖为从样本点xj到中心vi的距离。
3 航空客运市场细分量表确定
该研究将顾客感知价值概念与Kotler的顾客总价值概念相结合,将基于顾客价值的航空市场细分基准要素划分为4个主维度:产品价值维度、服务价值维度、人员价值维度,以及形象价值维度,共包含43项条款,并通过专家小组座谈和预测试问卷两个步骤对其进行删选,最终剩余20项条款。
由预测试117份问卷数据,对该20项条款进行相关分析,由数据分析软件SPSS19.0输出的相关矩阵得出,四维度下的条款间两两相关。继而对剩余20项条款进行因子分析,将主成分分析法与因子的最大方差旋转相结合,选取因子载荷大于0.6的条款项,最终得到4个主维度下的13项条款,如表1所示。
表1 量表条款项及其因子载荷值
在量表确定的基础上,需对其信效度进行检验,该研究量表信效度通过预测试问卷数据验证。问卷信度即为问卷的可靠性或稳定性,通常以α系数值衡量。一般而言,α系数值大于0.7时,问卷可信;α系数值大于0.8时,问卷信度高[7]。该研究中四维度及问卷总体的α系数值如表2所示,量表稳定性尚可,较为可信。
对问卷效度的测量通常采用KMO检验统计量,KMO值大于0.7即为较适合做因子分析。该研究中问卷条款项KMO值如表3所示,p<0.01,保证了该问卷的结构效度。
表2 问卷四维度及总体的α系数值
表3 KMO和Bartlett检验
4 航空客运市场细分结果与验证
4.1 数据收集
为获取足够的样本数据,笔者选择南京禄口、上海浦东及虹桥机场作为正式测试问卷发放地点,以宁—深及沪—深航班候机区域的乘机旅客作为施测对象,进行验证性问卷调查,共向旅客发放550份问卷,回收436份有效问卷。
4.2 因子分析
由回收的有效问卷,获得乘机旅客的特征统计量。针对收集的样本数据,在探测性因子分析中,取样足够度的KMO度量值为0.87,Bartlett的球形检验中近似卡方值为806.446,在0.000水平上显著,验证了量表的有效性,表明已有样本量适合进行因子分析。
对旅客感知价值进行因子分析时,依旧遵循因子载荷值大于0.6的原则,最终得到4个因子,其解释的累计方差为77.652%,而公因子累计解释变量达到60%则表示公因子具有可靠性[8]。图1所示为各维度下条款项的因子载荷及各维度α系数值。分别将这4个因子命名为航空客运产品价值、航空客运的服务价值、航空客运的人员价值、航空客运主体的形象价值。
图1 各条款项因子载荷及各维度α系数值
4.3 市场细分结果
将因子得分作为回归分析的输入变量可解决变量间的共线性问题,为得到具有解释力的细分类别,该研究在已获得4个感知因子得分的基础上,使用基于层次聚类的FCM算法进行最终的市场细分。
在运行基于层次聚类的FCM算法之前,需确定m、ε和η的值。KESKIN在实证研究中获得m=2为优的结果[9]。ε和η参数值依据样本数据实际状况而定,以期获得最佳聚类结果。该研究ε阈值取0.001且η取35%时聚类质量最优,类间距最大。由Qt 5.3.2输出的最终聚类中心距离及类间距分别如表4和表5所示。
表4 航空客运市场细分与聚类中心距离
表5 类间距
聚类结束,由Qt 5.3.2输出各类对应的个案信息,结合SPSS19.0,获得各细分市场中旅客特征统计量,如表6所示。依次将各类别命名为效率至上者、服务追求者、能力注重者,以及形象在意者,各类细分市场在旅客年龄、教育程度、职业属性,以及月收入层面表现出明显的区别。
4.4 市场细分有效性验证
该研究通过分析各子市场旅客对乘机经验的接受程度及再次购买倾向,以其差异化判别市场细分的有效性。
在实证性调查问卷中,采用7分制描述旅客对航空客运的接受程度及购买倾向,从1~7接受程度与购买倾向依次加强,通过均值分析与方差分析刻画上述两项指标在各类子市场中的差异性。表7为各子市场中旅客对航空客运的接受程度及购买倾向的方差分析结果;图2和图3分别为各子市场中旅客对航空客运的接受程度及购买倾向。由均值分析与方差分析可知,4类细分市场中旅客在接受程度与购买倾向方面均呈现出显著的差异性。就旅客对航空客运的接受程度而言,效率至上者接受程度最高,其次为服务追求者,能力注重者和形象在意者接受程度偏低;旅客对航空客运的购买倾向也呈现出相似状况,其中效率至上者和服务追求者表现出较强的购买倾向,而能力注重者和形象在意者的购买倾向不明显。差异化的市场特征结构再次验证了该研究市场细分的有效性。
表6 航空客运子市场旅客特征统计量
表7 各子市场中旅客对航空客运接受程度及购买倾向的方差分析
图2 4类细分市场中旅客对航空客运的接受程度
图3 4类细分市场中旅客对航空客运的购买倾向
5 结论
该研究结合层次聚类与FCM算法的优势,利用基于层次聚类的FCM算法对航空客运市场细分问题进行分析研究。将Kotler四维顾客价值理论与顾客感知价值衡量相结合,确定市场细分量表并据此设计指向性的调查问卷,调查了宁—深及沪—深航线上乘机旅客的市场行为特征。最终获得4类市场细分结果,分别为效率至上者、服务追求者、能力注重者及形象在意者。该研究亦通过各细分市场旅客对航空客运接受程度及购买倾向的差异化验证市场细分结果的有效性,为航空客运主体提供了以顾客价值为导向的市场细分方法量表模型,同时也为其他行业的市场细分提供了借鉴。
[1] ANABLE J. Complacent car addicts or aspiring environmentalists:identifying travel behaviour segments using attitude theory [J]. Transport Policy, 2005,12(1):65-78.
[2] SHEPARD R N. Representation of structure in similarity data[J]. Psychometrika, 1974,39(4):373-421.
[3] LUCE R D, TURKEY J W. Simultaneous conjoint measurement: a new type of fundamental measurement [J].Journal of Mathematical Psychology, 1964,1(1):1-27.
[4] MURUGAPPAN I, VASUDEV M. PCFA: mining of projected clusters in high dimensional data using modified FCM algorithm[J]. International Arab Journal of Information Technology, 2014,11(2):168-177.
[5] 金薇,陈慧萍.基于分层聚类的K-Means算法[J].河海大学常州分校学报,2007,21(1):7-10.
[6] 曲福恒,崔广才,李岩芳,等.模糊聚类算法及应用[M].北京:国防工业出版社,2011:61-62.
[7] NUNNALLY J C. Assessment of reliability in psychometric theory[M]. New York: McGraw-Hill, 1978:33-34.
[8] 吴明隆.问卷统计分析实务:SPSS操作与应用[M].重庆:重庆大学出版社,2009:205-206.
[9] KESKIN G A. Using integrated fuzzy DEMATAL and fuzzy c means algorithm for supplier evaluation and selection [J]. International Journal of Production Research, 2015,53(12):358-360.
WANG Yue:Postgraduate; School of Civil Aviation, Nanjing University of Aeronautics and Astronautics, Nangjing 210016, China.
[编辑:王志全]
Market Segmentation of Air Passenger Transport Based on Joint Algorithm of Hierarchy Clustering and FCM
WANGYue,ZENGXiaozhou,FUJun
Combining the strengths of the hierarchy clustering method and the fuzzy c-means (FCM) algorithm, the practical issue of the market segmentation (MS) of the air passenger transport was analyzed. The market segmentation scale for the air passenger transport was constructed from the Kotler's four-dimensional customer value (CV). On the basis of the scale, a questionnaire was formed and the correspondent data were collected. Combining the factor analysis and the joint algorithm of hierarchy clustering and FCM, four segmented markets with significant differences were finally obtained. The mean value analysis and the variance analysis were applied to verify the effectiveness of the result. The results demonstrate that by applying the joint algorithm of hierarchy clustering and FCM, combining Kotler's four-dimensional CV, the market of air passenger transport could be desirably segmented. In turn, the results also confirm the feasibility and reasonableness of the joint algorithm. The market segmentation scale and the joint algorithm can be utilized for the MS for the operational subjects in civil aviation.
air passenger transport; hierarchy clustering method; FCM algorithm; market segmentation; customer value
2015-05-06.
王悦(1992-),女,安徽芜湖人,南京航空航天大学民航学院硕士研究生.
中国民用航空局“十三五”规划基金资助项目(JS-201408931007).
2095-3852(2015)06-0752-05
A
F560
10.3963/j.issn.2095-3852.2015.06.020