APP下载

基于BP神经网络的机场安检旅客流量预测模型

2019-11-04钟翔朱彩云韩旭

航空工程进展 2019年5期
关键词:值机时段航班

钟翔,朱彩云,韩旭

(天津滨海国际机场,天津 300300)

0 引 言

随着民航运输需求的逐渐增大,机场所面临的压力也在增大,对机场旅客服务提出了更高的要求,而机场航站楼是提供旅客服务的重要场所,只有不断优化航站楼旅客离港服务流程才能不断提升旅客服务,提高旅客满意度。安检是机场航站楼离港服务流程中的重要一环,采用科学的手段,对机场安检旅客流量趋势做出正确的分析,从而对机场安检服务资源进行合理的配置及调度,不但能够降低机场航站楼的运营成本,提高运行效益,还能够减少旅客滞留时间,为旅客带来更舒适的出行体验,提升机场的服务水平。

目前,关于机场客流量预测已有一些研究。例如,黄艳红等[1]针对机场安检口优化问题,以美国芝加哥奥黑尔国际机场为例,基于泊松分布理论对机场安检口旅客流量进行分析,运用随机Petri网、同构理论和连续时间的马尔科夫链构建出机场安检流程模型来增加安检口旅客流量,减少旅客等待时间,提高机场安检效率;南娟等[2]在中小机场吞吐量预测方法中首次引入了巢式Logit模型(NL),并以无锡机场旅客吞吐量为例进行预测;刘夏等[3]在三亚机场2005~2015年旅客流量数据的基础上,分别采用Holt-Winter季节模型、ARMA和线性回归模型对三亚机场2016~2017年的旅客流量进行了预测,并运用组合加权的方法对数据进行了组合预测;黄黎慧等[4]以蛇口-香港机场航线为例,分析航线运量需求不平衡的特点,提出季节-灰色组合预测模型,以实例计算证明所提出模型的可行性。

针对机场旅客流量呈现出的非线性、随机性等复杂特征,国内外研究人员将BP神经网络方法应用到机场旅客吞吐量的预测系统中,试验了神经网络的预测精度,对比传统预测方法,确定神经网络预测结果更为出色[5-11]。廖成等[12]针对成都双流国际机场的特点选择参数,采用BP神经网络方法进行客流量预测,结果表明该方法具有良好的预测精度;张青青等[13]同样使用BP神经网络对机场旅客吞吐量进行预测研究,进一步证明神经网络在非线性系统预测方面具有强大的函数逼近能力。

然而,上述研究主要针对机场中长期客流量预测,而中长期客流量预测模型不能适用于机场安检服务资源的动态分配及调度。为此,本文对单位时间段(以30 min为单位时间段)的机场安检旅客流量预测进行研究,以天津机场实际数据为例,通过ETL工具[14]对天津机场源数据进行预处理、转换、挖掘抽取及分析,建立基于BP神经网络的机场安检旅客流量预测模型,并对实验结果进行验证,以期为机场安检服务资源的智能分配及调度提供科学依据。

1 机场安检旅客流量的影响因素

本文选取天津机场2016年6月~2017年5月集成系统中的航班数据、旅客安检信息系统中旅客数据及天津空管局提供的机场场区各时段的历史气象数据为研究对象,利用ETL工具进行数据预处理,统计单位时段(以30 min为单位时间)航班数量、安检旅客流量、值机旅客流量等信息,从时间段、天气情况、航班数量、值机旅客流量等角度对机场安检旅客流量的影响因素进行探索分析。

1.1 时间段对机场安检旅客流量的影响

选取2017年3月1日~5日这五天各时段安检旅客的数据记录,按时段对安检旅客数据进行对比分析,如图1所示(横坐标表示时间段(单位时间段为30 min),13表示6:00至6:30,以此类推,43表示22:00至22:30),可以看出:机场每时段安检旅客数量差异很大,有高峰时段及低谷时段,在高峰时段需要相应的增加安检通道的开放数量及相应的安检服务人员,避免旅客安检等待时间过长,但是如果低谷时段仍开放相同的安检通道及配备相应的安检服务人员,则会造成设备及人力资源的浪费,因此需要对单位时段的安检旅客流量进行准确的预测,根据预测结果实时对安检设备及人力资源进行分配及调度。

图1 2017年3月1~5日安检旅客流量变化趋势Fig.1 Change trend of security-check passenger flow during March 1~5, 2017

1.2 场区可视距离对安检旅客流量的影响

天津空管局所提供的2016年6月~2017年5月的天津机场场区数据,主要包括天气数据(晴天、小雨、阵雨、大雨、霾、雾、轻雾等)、可视距离及温度等,天气的好坏直接影响着可视距离。2017年1月1日天津机场场区可视距离一直在500 m以下;直至1月2日上午10点半以后才上升到1 000 m以上;1月3日,出现可视距离较低的时段为航班接近结束的晚上;1月4日上午可视距离低,下午好转;1月5日天气晴朗,可视距离均保持在1 000 m以上。通过对2017年1月1日~5日单位时段安检旅客数据进行分析,得知可视距离将影响机场航班的班次,进而影响安检旅客流量,如图2所示。

图2 2017年1月1~5日天津机场安检旅客流量变化趋势Fig.2 Change trend of security-check passenger flow in Tianjin airport during January 1~5, 2017

民航规定,有盲降设备(利用飞机仪表着陆)的大中型飞机,飞行员起飞最低可视距离为500 m。2017年1月1日,可视距离低于500 m的持续时间过长导致大面积航班取消,当天的航站楼安检旅客流量持续偏低;1月2日可视距离好转,安检旅客流量相对保持在一个较高的水平;1月3日,出现可视距离较低的时段为航班接近结束的晚上,因此,1月3日可视距离对机场安检旅客流量的影响不大;1月4日,可视距离低于500 m的持续时间较短,对安检旅客流量的影响时段只在可视距离低于500 m期间,恢复可飞距离后安检旅客流量逐渐恢复正常;1月5日天气晴朗,可视距离对机场安检旅客流量无影响。因此,可视距离长时间低于最低可飞距离时,将影响机场航班的班次数量,进而影响单位时段内的安检旅客流量。

1.3 航班数量对安检旅客流量的影响

通过历史数据统计分析得知旅客在航站楼隔离区里面停留时间为60~120 min,而停留2 h以上的很少。故本文研究当前安检时刻后续30、60、90、120 min的航班数量与安检客流量的变化,如图3所示。

(a) 30 min

(b) 60 min

(c) 90 min

(d) 120 min图3 后续航班数量与安检旅客流量变化趋势Fig.3 Change trend of follow-up flight quantity and security-check passenger flow

从图3可以看出:单位时段内安检旅客流量的变化趋势与后续30 min内的离港航班数量变化趋势不同,但与后续60、90、120 min的离港航班数量变化趋势较一致,说明安检旅客流量受到后续一段时间内离港航班数量的影响,不同的航班数量导致安检旅客流量的不同。

1.4 值机旅客流量对安检旅客流量的影响

选取当前单位时段前30、前60 min值机旅客流量,分别分析与安检旅客流量的关系,如图4所示。

(a) 前30 min

(b) 前60 min图4 前序值机旅客数量与安检旅客数量变化趋势Fig.4 Change trend of preceding check in passenger quantity and security-check passenger quantity

从图4可以看出:安检旅客流量与前30 min值机旅客流量基本一致,而与前60 min值机旅客流量差异很大,但变化趋势相一致,其原因是大部分旅客在值机过后直接选择安检,不在隔离区外滞留。

通过上述分析可知,影响当前单位时段安检旅客流量的因素包括:时间段,能见度,后续30、60、90、120 min的离港航班数量,前30 min的值机旅客数量。因此,本文将选取这7个指标作为建立机场安检旅客流量预测模型的指标。

2 机场安检旅客流量预测模型研究

2.1 BP神经网络及其实现原理

误差反向传播BP(Back-propagation)模型是目前应用最广泛的一类人工神经网络模型,该模型具有很好的函数逼近能力,通过对训练样本的学习,能够很好地反映被研究对象的输入和输出之间复杂的非线性关系。

BP神经网络的基本结构如图5所示,其模型拓扑结构包括输入层(input)、隐含层(hidden layer)和输出层(output layer)三层结构。

图5 BP神经网络基本结构图Fig.5 Basic structure chart about BP neural network

其中,输入层各神经元负责接收来自外界的输入信息,并传递给中间隐含层各神经元;中间隐含层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间隐含层可以设计为单隐层或者多隐层结构;输出层向外界输出信息处理结果。

BP神经网络算法包括正向传播和反向传播两个过程,即计算误差输出时按从输入到输出的方向进行,而调整权值和阈值则从输出到输入的方向进行。在正向传播过程中,输入信息从输入层经隐含层单元处理后,传至输出层。每一层神经元的状态只影响下一层神经元的状态。当实际输出与期望输出不符时,则转入误差的反向传播过程。误差反传是将误差通过输出层沿连接路径返回,按误差梯度下降的方式修正各层权值,向隐含层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,通过调整各层神经元之间的连接权值,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差信号减少到可以接受的程度,或者预先设定的学习次数为止[15]。

2.2 基于BP神经网络算法的机场安检旅客流量预测模型实现

在机场安检旅客流量预测中应用BP神经网络方法主要分为三个步骤:确定网络结构、数据预处理、网络的训练及预测。

(1) 建立三层BP神经网络模型结构。根据机场安检旅客流量的影响因素分析,选取时间段,能见度,后续30、60、90、120 min的离港航班数量以及前30 min的值机旅客数量为BP神经网络模型结构的输入,输出为当前单位时段的安检旅客流量。隐含层的节点个数初始值设定为6,根据平均绝对误差的计算结果调整节点个数。

(2) 数据选取及数据预处理。利用ETL工具对机场源数据依次进行如下处理:

①数据抽取:从航班集成系统数据库、安检信息系统及机场场区气象数据库等多个数据库中抽取航班数量、安检旅客数量、值机旅客数量及天气因素等数据,需要对多源数据进行数据统一化。本文采用Microsoft SQL Sever 2012标准规范定义元数据来进行数据统一化。

②数据清洗:在数据处理的过程中,数据清洗相对繁琐,占用的时间也较长,并且需要根据数据的实际情况找到共性规律,反复调整ETL程序,添加条件判断过滤错误或缺失信息。例如身份证和护照信息需要分开判断处理,将不同类型身份信息的旅客分类装入样本数据库中。

③数据转换:进行机场安检旅客流量预测是基于单位时段的,而机场安检信息系统中原始存储安检旅客数据是基于每名旅客的,因此,要进行数据粒度的转换。另外需要构建新的字段满足预测分析需求,例如统计单位时段的安检旅客数量、值机旅客数量、航班数量及该时段的气象数据。

④数据装载:由于航班数据、旅客数据及天气数据等数据源分别来自不同的机场业务数据库,在转换后需要将多个输入,包括安检旅客数据、值机旅客数据、航班数据及气象数据合并为一个输出,建立机场安检旅客流量预测样本数据库。

另外,为了消除数据指标之间的量纲影响,需要对样本数据库中的数据进行归一化处理,以解决数据指标之间的可比性。采用min-max标准化的方法把数据指标A的值a映射到[0,1]区间的值a′,计算公式为

(1)

式中:maxA和minA分别为属性A的最大值和最小值。

(3) 训练网络并利用网络进行预测,根据误差大小不断调整网络参数。本文利用建立的样本数据库,对天津机场2017年5月每日的单位时段安检旅客流量进行预测,基于文章篇幅限制,仅将5月24日~5月30日一周的预测结果进行展示描述。利用此模型,5月24日~30日预测结果的平均绝对误差如表1所示。

表1 2017年5月24日~30日预测结果的平均绝对误差Table 1 Mean absolute error of predictions during May 24~30, 2017

从表1可以看出:采用BP神经网络算法预测机场安检旅客流量的平均绝对误差约为8%~10%,预测精度高达90%以上。

2017年5月24日~30日这一周的各单位时段安检旅客流量的预测值与真实值的对比曲线如图6所示,横坐标23表示5月23日,以此类推。

图6 一周内(2017年5月24日~30日)天津机场安检旅客流量预测值与真实值对比图Fig.6 The comparison chart about predictions and true value of security-check passenger flow in Tianjin airport during May 24~30, 2017

从图6可以看出:采用BP神经网络算法预测机场安检旅客流量,预测结果与真实值曲线拟合很好,预测精度较高,表明BP神经网络是机场安检旅客流量预测的可行方法。

3 基于BP神经网络机场安检旅客流量预测模型应用

采用BP神经网络进行机场安检旅客流量的准确预测,可以帮助机场决策者对机场安检客流量趋势作出正确分析,动态分配安检资源(工作人员、安检通道、安检设备),以达到高峰时段满足运行需求、低谷时期容量不浪费,提高旅客对安检服务的满意度,提升机场服务质量。

3.1 安检通道开放数量的动态分配

设单位时段(30 min)的安检旅客流量预测值为Q,单个安检通道的服务速率为μ,则该时段所需安检通道开放数量N的计算公式为

(2)

假设每条安检通道的服务速率μ相同,μ取单个安检通道半小时内平均安检旅客数量。

根据天津机场2016年6月~2017年5月一年安检通道数量与旅客安检速率数据,可以分析出对应的关系,如表2所示。

表2 天津机场安检通道开放个数与旅客通过安检速率关系表Table 2 Correlation chart about opened security-check channel quantity and go through the safety check for passengers in Tianjin airport

从表2可以看出:每个通道每半个小时最多安检人数为160人,由于每个通道每半个小时最少安检人数极值差别很大,导致每半个小时平均安检人数过低,而一般情况下只需要考虑非空闲时期旅客通过安检的速率,因此本文μ取值为高峰时段半小时内平均安检旅客数量。结合图1分析可知,安检旅客最高峰一般在早6点至7点半之间,这一时段9个通道全部开放的概率为96.43%,通过计算得知,高峰时刻九个通道全部开放的情况下,每个通道半小时内的平均安检旅客数量为95人。对于天津机场,单位时段安检通道开放数量N=Q/95,其中Q为该时段安检旅客流量的预测值。

3.2 安检人员模拟派工

根据《民用航空安全检查人员定额定员》规定,旅客安检通道劳动定额为180人/通道小时的劳动定员。旅客安全检查通道岗位基本定员如表3所示。

表3 旅客安全检查通道岗位基本定员Table 3 Basic staff members for passenger security-check channel post

目前天津机场每个通道配置人数即按标准(表3)进行配置,根据天津机场旅客服务标准,旅客安检最长等待时间为12 min,而天津机场单通道安检非空闲时段平均安检速率为95人/半小时,因此根据最长等待时间可计算出每条安检通道外最多等待旅客人数为38人。通过旅客安检流量的实时预测来决定开通的安检通道数量,进而可以最大化地设置安检工作人员待岗时间,同时根据现场安检外等待旅客数量随时加开通道,加派安检人员,以减少旅客安检外的等待时间,提升机场服务质量。

4 结束语

本文采用BP神经网络算法对机场安检旅客流量进行了预测,从预测结果来看,采用BP神经网络算法的预测结果比较理想,预测精度高达90%以上。在基于BP神经网络的机场安检旅客流量预测模型基础上,动态分配机场安检通道、安检工作人员等资源,从而实现安检服务资源的合理利用,可有效提升机场服务质量。

猜你喜欢

值机时段航班
机场值机柜台资源的配置研究
山航红色定制航班
山航红色定制航班
基于蒙特卡洛仿真的机场值机系统优化研究
山航红色定制航班
山航红色定制航班
第70届黄金时段艾美奖主要奖项提名
浅谈如何提高自助值机设备的使用效率
西藏文物 迎来大修时段