APP下载

基于K-means聚类算法的机场客流量变化对机场出租车数量影响情况

2020-06-03许一洲

科技创新与应用 2020年16期

许一洲

摘  要:近年来,随着交通运输的不断发展,乘坐飞机人数越来越多,而出租车成为乘客们离开机场的主要交通工具之一。为研究机场出租车的流量情况,通过寻找分析指标来建立出租车司机在机场的决策模型,帮助机场对打车乘客和机场出租车进行合理规划,文章通过收集某日机场的一天中各时间到达航班乘客数据和机场蓄车池中出租车数量的实时数据,运用SPSS软件的K-means聚类算法对机场到达航班乘客进行时间上的分类,比较不同时间段下对机场出租车的数量变化。

关键词:机场客流量;机场出租车数量; K-means聚类

中图分类号:TP18          文献标志码:A         文章编号:2095-2945(2020)16-0022-03

Abstract: In recent years, with the continuous development of transportation, more and more people take planes, and taxi has become one of the main means of transportation for passengers to leave the airport. In order to study the flow of airport taxis, the decision-making model of taxi drivers at the airport is established by looking for analysis indicators to help the airport make reasonable plans for taxi passengers and airport taxis. In this paper, by collecting the data of passengers arriving at different times of the day at the airport and the real-time data of the number of taxis in the airport car storage pool, the K-means clustering algorithm of SPSS software is used to classify the passengers arriving at the airport in time, and the changes of the number of airport taxis in different time periods are compared.

Keywords: airport passenger flow; number of airport taxis; K-means clustering

1 概述

K-means聚類算法[1]是由Steinhuas 1955年、Lloyd 1957年、Ball&Hall 1965年、McQueen 1967年分别在不同的科学研究领域独立提出来的一种算法,K-means聚类算法被提出来之后,被广泛研究和应用于不同的学科领域,并且发展出了大量的不同的改进算法。目前它依旧是应用最广泛的划分聚类算法之一。通过K-means聚类算法,可以有效分析机场客流量的变化对机场出租车数量影响情况。

2 模型的建立与求解

2.1 机场客流量数据的收集与分析

首先通过选取了某日郑州新郑机场的当日航班的客流量信息,筛选出了当日机场的到达航班,得出了某日全天不同时间的到达航班乘客人数,并用SPSS软件生成当日到达航班乘客数量散点图(如图1所示)。

通过以1小时为单位,整理出某日0:00至24:00各小时乘车总人数与时间的关系线形图(如图2所示)。

2.2 利用K-means聚类算法分析机场客流量变化

由以上散点图和折线图分析,可初步将所有时间段分为5类:0:00点至2:00点,5:00点至8:00点,8:00至14:00,14:00至18:00和18:00至24:00这几个时间段,具有一定的分类效果。因此可通过K-means聚类算法对该数据进行进一步分析。

K-means算法首先需要的是选取初始聚类中心,然后对相关的所有数据进行分类,最后计算出每一个聚类的平均值调整聚类中心,再进行不断地迭代循环。最终使得类内对象相似性最小[2]。K-means聚类算法流程图如图3所示。

设置最大迭代次数为20,聚类个数为5,得到最终聚类中心,每个聚类中的个案数目,聚类成员和与聚类中心位置(如表1和表2所示)。

通过本次聚类分析可以得到0:00至2:00,5:00至10:00,10:05至13:40,13:45至18:20和18:25至23:50五组分类,与上述初步分类接近。可以认定机场的客流量在不同时间段具有不同的影响效果。

2.3 机场客流量与蓄车池候车量之间关系比较

通过提取郑州新郑机场某日从11:30至22:30在机场内蓄车池等待的车辆数量数据,利用Excel数据分析,可以得到场内待运车辆数与机场乘客人数随时间变化的线形图(如图4所示)。

由该表的曲线趋势可以看出,在17:00之前机场乘客人数与场内车辆数量大致呈正相关关系,而在17:00之后,机场场内车辆数量大致与后一小时的机场乘客人数呈正向关系。但在17:00到19:00之间,机场人数和场内车辆数关系有差异。结合现实生活我们可以得知,在17:00至19:00这一时间区间,市区正值下班高峰期,市区交通拥堵状况较为严重,而在上下班高峰期时,市区交通拥堵程度过高,使得市区交通拥堵程度成为了主要因素迫使出租车司机选择在机场蓄车池排队。

3 结束语

K-means聚类算法对数据的划分聚类具有一定的优点。通过收集机场一天中乘客人数变化和机场蓄车池出租车数量变化情况,利用K-means聚类算法进行分类,可以有效直观得出不同时间段下机场出租车的变化因素,合理建立机场出租车司机的决策模型,对机场乘客打车和机场出租车的规划有一定积极作用。

参考文献:

[1]Anil K J. Data clustering: 50 years beyond K-Means[J]. Pattern Recognition Letters,2010,31(8):651-666.

[2]朱明.数据挖掘[M].合肥:中国科学技术大学出版社,2002.

[3]司守奎,孙尧亮.数学建模算法与应用(2版)[M].北京:国防工业出版社,2019.