基于熵的星座聚类理论在我国航空市场结构分析中的应用
2016-01-08孟会芳
孟会芳 彭 怡
(南京航空航天大学民航学院 南京 211100)
基于熵的星座聚类理论在我国航空市场结构分析中的应用
孟会芳彭怡
(南京航空航天大学民航学院南京211100)
摘要:为了明确我国航空市场目前的竞争格局,从国内航空公司角度出发,选取能够反映航空公司生产运输能力的8个指标,利用信息熵理论确定指标权重,构建了基于信息熵的星座聚类分析模型,定量分析了国内主要航空公司的发展情况.结果表明,该方法能够较为准确、客观的反映各航空公司的综合实力和整体发展水平.
关键词:熵权法;指标权重;航空市场;灰色星座聚类
孟会芳(1988- ):女,硕士,主要研究领域为航空市场与经济分析
0引言
航空业是5大运输产业的重要组成部分,起步最晚,但是发展速度惊人.国内民航业真正拉开序幕可以追溯到1920年北京到天津航线的开辟,但是由于中国特殊国情导致民航业一直不受重视.民航业的真正转变是在1978年之后,尤其是近几年的发展更是迅猛,航空运输业在客运和货运方面都有受人瞩目的表现[1].随着民航业竞争的不断加剧,航企面临越来越多的问题,如何给予企业准确定位、抓住机遇是目前航空公司立足航空市场不败之地的首要任务[2].本文将Shannon的信息熵理论引入到灰色星座聚类理论中,解决了聚类指标权重的问题,通过选取能够代表航空公司生产运营实力的8个运输指标,根据各航空公司在星座图中的位置进行聚类,并通过综合值Z验证聚类有效性.
1灰色熵权星座聚类理论
1.1灰色星座理论
灰色星座聚类属于多元统计的范畴,其基本原理是:根据样本属性,利用相似性原理将每个样本点按照一定的规则点在1个半圆内,即1个星点,从而得到包含所有样本点在内的一组“星座图”,通过归类区分不同星座的边界范围将相似的样本聚集为一类[3-6].由于各指标单位不同,为了消除指标量纲的影响,首先要对样品指标矩阵的原始数据进行预处理.本文采取极差变换的方法,并使预处理后的数据落在[0,π]的范围内,即在1个半圆之内[7]:
假设原始指标矩阵是X=(xij)m×n,xij为第j个航空公司第i个生产运输指标值.
(1)
式中:bij为极差变换后的数据,用弧度表示;xj min,xjmax为第j个指标的最小值和最大值.则变化后的样本矩阵为Bm×n=(bij)m×n.
其次,将极坐标转化为直角坐标,并计算出各航空公司的直角坐标值及综合指标值Zi.
(2)
最后,根据各航空公司的(Xi,Yi)值确定每个航空公司在星座图内的位置,将相似及相近的样本点聚集为一类,形成“星座”;利用综合指标值Zi检测各航空公司是否符合分类结果[8].
1.2基于熵理论的权重确定
根据信息论可知,信息是系统有序程度的度量,而熵是系统无序程度的度量.熵权法是一种客观赋权方法,主要是根据指标的变异程度,利用信息熵计算各指标的熵权,通过熵权修正各指标的权重,从而得到各指标的权重[9-11].
2实例分析
本文选取了2012年我国29个主要航空公司的8个生产运营指标,包括飞行班次、飞行小时、旅客运输量、旅客周转量、机队规模、货邮运输量、货邮周转量、运输总周转量等.其数据来源于《2013从统计看民航》.计算步骤如下.
步骤1根据式(1)计算极差变换后的样本矩阵Bm×n.
步骤2根据式(3)及式(4)计算各指标的信息熵和权重,其中式(3)中的xij即为式(1)以过极差变换后的数据.
步骤3根据式(3)计算各航空公司的Xi,Yi,Zi;
步骤4绘制星座图,确定各星座的边界.
2.1总体业务聚类分析
根据上述计算步骤对航空公司的8个生产运输指标进行总体业务的聚类划分.表1描述航空公司各运输指标的信息熵和权重.由表1可见,飞行班次的信息熵最大,货邮周转量的信息熵最小,因此,货邮周转量的权重最大,对航空公司的整体运营水平影响较大.
表1 航空公司运输指标信息熵Ej和指标权重wj
表2描述了各航空公司的Xi,Yi,Zi值,并根据Z值降序排列得到.首先利用Xi,Yi值绘制出星座图中各航空公司位置,根据相似性原理对航空公司进行聚类,聚类结果见图1.由图1可见,全部航空公司明显被分为六类.同时,利用各航空公司的综合指标Z值检验聚类结果,可以看出在二维星座聚类图中国航(-1,1.23×1016)被归为第一类,但是国航Z值最高;因此为求得正确聚类结果,我们将星座图加入Z值.检验结果表明,国航与南航、东航可以归为一类,其余各航空公司与原划分结果一致,表明灰色星座聚类结果很好的反映了我国航空市场的客观现状.因此,我国航空市场总体聚类结果见表3所列.
表2 航空公司总体聚类坐标及综合指标
注:由于通用类航空公司与以客/货运为主的航空公司运营指标不同,故在此不作考虑
图1 我国航空公司星座聚类二维图
类别航空公司代码ICZ,CA,MUIIZH,HU,MFIII3U,SC,FMIV9C,GS,JD,Y8,X2,HOV8L,KN,8Y,BK,O3,PN,EU,2Z,OQ,KY,NS,G5,CN,JR
整体来看,国航、南航、东航3大航空公司占据领先地位,地方航空公司发展迅速,而处在第V类的主要是以民营航空公司和直线航空公司为主.图2是加入Z值调整后的三维星座图,可以更直观的看出聚类结果.
图2 我国航空公司星座聚类三维图
2.2子业务运输指标聚类分析
对于航空公司具有代表性的2种业务类型(客运与货运)进行分析,运用1的方法分别按客运与货运聚类划分,其中客运选择旅客运输量与旅客周转量作为聚类指标,货运选择货邮运输量与货邮周转量作为聚类指标.图3、图4分别表示29个航空公司两种子业务聚类结果二维图.
图3 航空公司客运市场聚类二维星座图
图4 航空公司货运市场聚类二维星座图
从分析结果可以看出,我国航空公司的发展规模具有一定的分布特点.在总体发展水平和两类子业务方面均可分为5大类.不管是在客运市场还是货运市场,国航、南航、东航都处在领先地位,遥遥领先于其他航空公司,3家航空公司旅客周转量和货运周转量之和各占整个民航市场运输总量的59.4%和56.0%.在客运市场上,地方航空公司崛起,深航、海航、厦航的快速发展加剧了航空市场的竞争,这主要是由于政府对地方航空公司的管制较少,这3家航空公司处于同等发展水平,不仅相互之间的竞争影响最大而且对3大航也构成了直接威胁,被归为第II类;在第III类中,4家航空公司的综合指标均在0.4上下,企业初具规模,具有一定的市场认可度;而在第IV类中,均属民营航空公司,它们共同的特点是企业规模较小、成立时间短.在货运市场上,东航发展水平逊于国航和南航,虽然在综合实力及两类子业务方面都处于第三位,但其在货运方面的表现远落后于国航和南航,被归为了第II类;另外,近几年在货运市场上值得一提的是扬子江快运、中国邮政货运公司及顺丰快递,尤其是扬子江快运与顺丰快递公司,近几年的发展速度比较快.
需要指出的是,我国民航市场卖方集中度较高,在一定程度上可以称之为寡头垄断市场,主要表现为企业规模较小、规模经济尚未成形.在总体聚类和2个子业务聚类的第V类中,航空公司数目分别为14,15,17.鉴于此,对于航空公司而言,首先要做的是明确公司在整个民航业内所处的位置,了解自身的优缺点,对公司的未来发展方向做出清晰的定位,不管是主攻客运市场还是准备在货运市场大展拳脚,或者是双管齐下,都要清楚目前以及未来自己最强劲的对手,不能盲目跟风.表4是2种子业务前四类聚类结果及综合指标Z值.
表4 两种子业务的前四类聚类结果及综合指标Z值
3结束语
本文基于灰色系统聚类分析理论,将信息熵运用到确定指标权重上,就我国航空市场的整体发展情况以及各航空公司两类子业务的发展状况进行研究,准确、客观地评估了我国航空市场目前的竞争格局,定量分析了各航空公司的综合实力和发展水平,并对我国航空市场的快速发展提供了参考意见,对航空公司制定未来发展的战略规划具有重要意义.
参 考 文 献
[1]管雅雯.基于生命周期的民航运输业规制演变研究[J].商品与质量, 2010(6):19-20.
[2]任曙明.我国民用航空运输市场结构分析[J].中国工业经济, 1998(6):60-63.
[3]付聪, 吴薇薇. 基于灰色聚类理论的我国农林业航空区域化研究[J]. 武汉理工大学学报,2013(5):994-997.
[4]靳慧芳.“星座”聚类法在农用地分等因素指标划分中的应用[J].江西农业大学学报,2008,30(1):165-174.
[5]吴金华,刘小玲,张伟,等.基于星座图的神木县工矿废弃地复垦潜力研究[J].资源科学,2013(12):90-95.
[6]郑淑霞.星座图聚类分析法在青海冬果种质资源分类上的应用[J].青海大学学报:自然科学版,2010(6):15-18.
[7]YEZhengwang.Theresearchofintrusiondetectionalgorithmsbasedontheclusteringofinformationentropy[J].SciverseScienceDirect,2012(12):1329-1334.
[8]RASTOGIR,SHIMK,GUHAR.Arobustclusteringalgorithmforcategoricalattributes[J].InformationSystems,2005, 25(2): 345-366.
[9]GUHAS,RASTOGIR,SHIMK.ROCK:Arobustclusteringalgorithmforcategoricalattr-ibutes[C]∥DataEngineering,Proceedings, 15thInternationalConferenceon,IEEE, 1999: 512-521.
[10]李霞,蒋盛益,郭艾侠.基于聚类和信息熵的特征选择算法[J].郑州大学学报:理学版,2009(1):77-80.
[11]郭红钰.基于信息熵理论的特征权重算法研究[J].计算机工程与应用,2013(10):140-146.
[12]AHMADIN.UsingfuzzyclusteringandTTSASalgorithmformodulationclassificationbasedonconstellationdiagram[J].EngineeringApplicationsofArtificialIntelligence,2010,23(3):357-370.
中图法分类号:F562.6
doi:10.3963/j.issn.2095-3844.2015.01.042
收稿日期:2014-11-10
AnalysisofChinaAviationMarketStructure
BasedonEntropyofConstellationClusteringTheory
MENGHuifangPENGYi
(Nanjing University of Aeronautics and Astronautics,Nanjing 211100,China)
Abstract:In order to explicit the China aviation market competition pattern and from the perspective of domestic airlines, this paper has chosen eight indexes which can fully reflect the airlines production transportation capacity. The information entropy theory is used to determine the index weight, and the constellation clustering is used to build the cluster analysis model which based on information entropy and quantitative analysis the major domestic airlines development situation.Results show that this method could more accurately and objectively reflect the comprehensive strength of the airlines and the overall level of development. It provides the guidance for airline strategic program in the future.
Key words:entropy method; index weight; aviation market; gray constellation clustering