基于SSOOMM的我国民用机场分类研究
2015-03-11杨柳白钊张婷
杨 柳 白 钊 张 婷
中国民航飞行学院,机场工程与运输管理学院,广汉,618307
0 引 言
机场作为航空运输网络的重要组成部分,在航空运输中扮演的角色越来越重要。研究我国机场分类不仅可以为我国机场布局和规划提供依据,简化政府对机场发展的具体政策,同时也可以为机场自身建设发展提供根据。吴琪[1]等人也为我国的机场发展进行了定位,客观说明了准确定位机场的重要性。
目前的机场分类主要有以下几种:
(1)依据旅客吞吐量对机场分类。例如,美国FAA按照旅客吞吐量占当年旅客运输量的比例将机场分为四类:大型枢纽机场、中型枢纽机场、小型枢纽机场和非枢纽机场。
(2)依据机场重要程度和地理位置对机场分类。例如,加拿大将机场分为:国家机场系统、地方机场、小型机场和北极圈机场。
(3)依据机场的类型对机场分类。例如,巴西将机场分为:民用机场、军用机场、特殊机场和临时机场。
我国目前的机场分类主要还是依据旅客吞吐量,方法比较单一简单,往往带有较强的主观性和任意性,并且分类所得的同类型机场共性较少,使得对比分析比较模糊粗略。为了避免这些缺陷,机场分类还需要考虑更多的影响因素,并且要采用科学客观的分类方法,这样才能使同类机场之间有更多的相似性,机场发展战略及政府政策才能更好地具有一般性。因此,本文选取众多可能影响机场分类的因素,应用神经网络等技术将我国机场进行细分,并比较所分各类机场之间的特点。
1 自变量及分类方法选择
董志毅[2]等人在机场分类问题中提出可能影响机场分类的影响因素有:(1)机场运营指标:旅客吞吐量、货邮吞吐量、航线条数、起降次数;(2)机场所在城市宏观经济指标:GDP、职工平均工资、接待入境人数、外国直接投资、就业人数、总人口数、第三产业占 GDP比重、城市综合能力;(3)综合交通指标:铁路客运量、公路客运量;(4)机场自身指标:航站楼面积、旅客吞吐量增长率16个因素。他所选的16个影响因素不光考虑了机场本身,还考虑了影响机场发展的外部因素,比较全面可靠,但由于数据的可得性以及指标的模糊性,本文借鉴其所选择的15个影响因素,即旅客吞吐量、货邮吞吐量、航线条数、起降次数、GDP、职工平均工资、接待入境人数、外国直接投资、就业人数、总人口数、第三产业占GDP比重、铁路客运量、公路客运量、航站楼面积、旅客吞吐量增长率。
收集2012年我国通航的177个机场的数据可以看出,自变量之间并非相互独立,而是存在着较强的相关性,因此在使用一般方法分类时,比如模糊聚类[3],必须先要筛选自变量。筛选自变量的方法有主成分分析法、局部保持映射法、局部线性镶嵌法等。但是这些算法容易陷入局部最优解,有的可能破坏数据的拓扑结构,并且缩小了数据量,即减少了有用信息,使得分类结果存在较大偏差且使得问题复杂化。自组织特征映射网络(SOM)的数据分类方法是一个由全连接的神经元阵列组成的无教师、自组织、自学习的网络,根据输入空间中输入向量的分组进行学习和分类。SOM 网络是由输入层和输出层构成的两层网络,与传统的聚类方法相比,SOM 网络形成的聚类中心可以被映射到一个曲面或平面上,以保持固定不变的拓扑结构。孙进进[4]等人同样利用 SOM神经网络将我国民用机场进行了分类,但只选用了董志毅等人处理之后剩下的 8个影响因素,且仅仅将我国2010年全国客货吞吐量排名前40位的机场进行了分类,潜移默化之中加重了客货吞吐量影响因素的权重,更重要的是没有充分应用SOM神经网络分类优势。利用SOM神经网络来进行机场分类,可以省去对自变量多重性的处理,只是增加了运行时间,但是由于机场数据数量在可接受范围之内,较多的数据另一方面也增大了网络学习,使结果更准确,且运行时间也在几十分钟之内,同时本文采取此方法先进行大分类,再进行小分类,结果更客观、合理。
本文选用15个影响因素,利用SOM神经网络方法来进行分类,既补充了其缺陷,同时又更科学、更准确、更简单和更全面。
2 SOM神经网络结构及学习算法简介
SOM 网络由输入层和竞争层构成,输入层神经个数为m,竞争层是由a*b个神经元组成的二维平面列阵,输入层与竞争层各神经元之间实现全连接。SOM 网络的一个典型特征就是可以在一维或者二维的处理单元阵列上,形成输入信号的特征拓扑分部,因此SOM网络具有抽取输入信号模式特征的能力。SOM神经网络学习算法[5]如下:
2.1 网络初始化
用随机数设定输入层和映射层之间的权值初始值。对m个输入神经元到输出神经元的连接权值赋予较小权值。选取输入神经元j个邻接神经元的集合Sj。其中Sj(0)表示时间t= 0的神经元j的邻接神经元集合,Sj(t)表示时刻t的邻接神经元的集合。区域Sj(t)随时间的增长不断减小。
2.2 输入向量的输入
2.3 计算映射层的权值向量和输入向量的距离
(欧式距离)
在映射层,计算各神经的权值向量和输入向量的欧式距离。映射层的第j个神经元和输入向量的距离,如式(1)所示:
式中,ijω为输入层的i神经元和映射层的j神经元之间的权值。通过计算,得到一个具有最小距离的神经元,将其称为胜出神经元,记为j*,即确定出某个单元k,使得对于任意的j,都有dk= min(dj),并给出其邻接神经元集合。
2.4 权值的学习
按式(2)修正输出神经元*j及其邻接神经元的权值:式中,η为一个大于0小于1的常数,随着时间变化逐渐下降到0:
2.5 计算输出 ko
式中,(*)f一般为1~0函数或者其他非线性函数。
2.6 是否达到预先设定的要求
如达到要求则算法结束;否则,返回步骤(2)进入下一轮学习。
3 我国民航机场的SOM聚类分析
选用2012年我国通航的177个机场,根据所统计自变量数据,使用MATLAB软件实现SOM网络的构建,输入层共15个节点,分别对应所选的15个自变量。竞争层数选为3,训练步数选为10 000次,由此将我国民用机场分为三大类,之后再分别将每一大类机场进行细分,最终分类结果如表1所示。
表1 我国机场分类Tab. 1 Classficstion of the civil airports of our country
续表
4 我国民航机场分类结果特点对比
值,比较各类别机场特征如表2所示。
根据以上所分类别,求取各类别机场指标的平均
表2 不同类别机场比较Tab.2 Comparision of different catagories of the airports
5 结 论
本文在全面考虑了影响机场分类因素的情况下,运用神经网络技术,将我国177个机场进行了分类,由分类结果可以看出,机场所分类别更加细致,相同类别机场之间的共性更大,这说明基于 SOM 的分类方法客观、科学,能够准确地把握各个类别的本质联系。同时,运用这种方法较好地弥补了以往分类考虑不周全、主观性较强的缺点。在各类机场比较时,选取了各类机场指标的平均值,个别特殊机场无法区分,这也是本文的不足所在。但是 SOM 方法的客观性及精准性,使得误差进一步缩小。利用SOM分类方法准确地将我国民用机场分类,不仅可以为我国机场布局和规划提供依据,同时可以简化我国政府工作,为不同类型机场进行政策指导,而且对于比较和评价机场提供了一个科学平台,可以深入研究同类型机场的运行效率、竞争力评价等问题。由此可知,科学、准确地将我国民用机场进行分类对我国民航的发展有着重要的作用。
[1] 吴琪, 何继红, 郑晓娣. 准确定位指导发展战略—— 对中国机场发展定位的几点思考[J]. 中国民用航空, 2007, (3): 23-28.
[2] 董志毅,夏新平.我国机场分类的影响机理与聚类分析研究[J].商业视角,2006:190-191.
[3] 徐豪杰. 基于聚类分析的我国机场分类研究[J]. 空运商务, 2011, (19): 42-44.
[4] 孙进进, 王苗苗. 基于 SOM 神经网络的民用机场分类方法[J]. 交通科技与经济, 2013, 15(5): 82-84.
[5] 史峰, 王小川, 郁磊, 等. MATLAB 神经网络 30个案例分析[M]. 北京: 北京航空航天大学出版社,2010.