APP下载

单航班行李提取旅客密度动态预测

2020-12-02邢志伟

中国民航大学学报 2020年5期
关键词:行李航班旅客

邢志伟,吴 哲,罗 谦

(1.中国民航大学电子信息与自动化学院,天津 300300;2.中国民用航空局第二研究所,成都 610041)

近年来,民航运输快速发展,民航机场数量逐渐增多,吞吐量急剧增长。2019年底国内机场旅客吞吐量达千万级的数量已有41 个,北京首都国际机场以九千万吞吐量排名第一。机场客流量迅速增长,对机场运行各方面提出越来越高的要求。机场运行效率由航班保障各环节共同保证,任何一个环节的延误或故障都可能导致旅客出行过程产生不便。因此,研究航班保障环节对机场运行有着极为重要的意义。航班保障分为到港和离港两个部分,旅客乘机到达机场后,最主要的环节是托运行李的提取,因此,研究机场旅客到港行李提取环节的优化尤为重要。

国内外学者的研究内容主要集中在航班保障的流程分析,同时对航站楼行李提取的研究集中在行李分拣系统的设计,尚未有学者对行李提取的旅客密度进行研究。

文献[1]利用关键路径还原方法刻画航班保障流程。文献[2]建立了一种改进的行李作业流程仿真模型,并将现行行李流程和改进流程进行对比,但未考虑旅客流程处理情况。文献[3]基于MIP 模型的决策支持系统来解决行李传送带分配问题,并成功在法兰克福机场实施运行。文献[4]使用SysML 为行李处理系统建模并生成相应的仿真模型,从而进行分析和评估系统的关键性能。文献[5]分析了航站楼行李提取区旅客提取行李的等候时间与旅客体验的服务质量评分之间的因果关系,并据此制定机场的服务水平标准。文献[6]以现有单航班单行李认领动态模型为基础,提出了多航班多行李提取模型,模型仅还原了行李提取部分的情况,并未完全还原真实情况。文献[7]通过计算高峰时刻旅客在行李提取大厅的平均停留时间,提出了机场行李提取大厅面积的优化方法。文献[8]根据现场调查和航班历史数据建立计算机仿真模型,得到行李提取处旅客到达规律。文献[9]建立区域内板车需求量计算模型,并提出一种机坪行李运送班车分区配置方法,有效降低了调用延迟率,但研究仅限于行李运送班车的流程分析。文献[10]将RFID 技术应用到行李分拣系统,从而可有效定位和识别旅客托运行李的位置和信息,但该方法只运用在乘机旅客托运环节。

综合目前的研究工作,国内外对于航站楼行李提取的研究集中在行李处理系统的设计和指标计算模型,对旅客密度的研究较少。针对行李提取区的旅客密度预测问题,将通过分析到港旅客及行李流程,建立旅客行李提取模型,再结合机场运行数据分析,建立贝叶斯网络(BN,Bayesian network)并分析确定其中的关键环节,从而对行李提取区的旅客密度进行预测。

1 旅客行李提取流程分析

航班抵达机场,旅客下机并提取行李离开机场,不同旅客(性别、年龄等)到达行李提取区的规律不同,机场工作人员处理行李的效率不同,都会影响该区域旅客密度。若机场行李提取转盘附近聚集旅客过多,会造成拥挤情况,不利于机场运行管理,容易产生安全隐患。

对于进港航班,当飞机驶入停机位后,机务人员分别开启客舱门和货舱门,并引导旅客下机,将托运行李卸载到行李运送板车上。工作人员会驾驶板车将行李运送至行李分拣厅,再将行李放到航班对应的转盘上,并开启转盘将行李传送到行李提取厅。对于下机后的旅客,若是在远机位,旅客会由摆渡车运送进入航站楼;若是在近机位,旅客会步行或通过廊桥进入航站楼。托运行李的旅客进入航站楼后,需要步行抵达指定的行李提取转盘,等待行李推出。当旅客提取到所有行李后,便会携带物品离开行李提取厅。

行李提取环节虽是旅客到达并提取行李,但实际上是旅客下机后机场提供服务的主要环节。旅客对到达机场服务质量的体验和评价主要体现在该环节,也最易发生旅客密度高、旅客等待时间长等问题。

1.1 行李提取模型

旅客下机后到达行李提取区,行李运送及旅客提取行李的整个流程中存在旅客和行李的分离处理、旅客提取行李等动态过程。旅客在行李转盘传送带旁随机聚集,主要集中在行李出口附近。因此,需重新建立行李提取模型。针对单航班的旅客行李提取过程,参考文献[6]建立了单行李提取动态模型。旅客下机后,需要提取行李的旅客和行李分别到达行李提取转盘。图1给出了旅客和行李随时间变化的分布曲线,其中:A(t)代表下机后到达行李转盘的旅客数占该航班提取行李旅客总人数的比例;B(t)代表行李转盘送出的行李数量占行李总数的比例;C(t)代表到达行李转盘附近且已发现行李的旅客所占比例;C′(t)代表已提取完行李且离开行李提取区的旅客所占比例。

图1 旅客与行李分布曲线Fig.1 Passenger and luggage distribution curve

假设旅客流程和行李流程是两个相互独立的事件,且由同一旅客办理托运的所有行李同时到达转盘,则

由于国内航班的旅客大多数只托运一件行李,因此,对少数托运多个行李的旅客,式(1)同样可得到较好的近似值。设从旅客找到行李到提取行李并离开的时间差为t0,则C′(t)可表示为

设L 是行李转盘旅客可接触的长度,v 是转盘运行速度,pi为航班i 提取行李旅客数量,则t0可近似为

代入式(2)可得

由以上计算,可得到行李提取区的旅客拥挤程度,可用航班i 任一时刻t 行李转盘前的旅客密度动态分布来表示,即

又有首末件行李上转盘时间差为td,则航班的平均旅客密度为

1.2 行李提取旅客密度影响因素分析

针对下机旅客和行李处理流程进行分析,同时结合机场运行环节可提取的节点数据,可得到影响行李提取区旅客密度的因素:航班到达时间、机位号、首末件行李上转盘时间、行李数、旅客数、转盘长度、摆渡车行驶时间、远近机位、行李上转盘的速度。

根据机场运行流程分析和数据采集的情况,采用因子分析法对影响行李提取区旅客密度的因素逐一进行分析,从中得到的关键因素如下。

1)航班到达时间 即航班抵达机场的时间,当飞机停靠在停机位后,工作人员开启客舱门和货舱门进行下客和行李卸载。

2)机位号 远机位旅客需要乘坐摆渡车到达航站楼,同时不同机位摆渡车和行李板车的行驶时间也不同。

3)旅客数量和行李数量 旅客人数及托运行李数越多更易造成行李转盘区域出现拥堵。

4)转盘长度 指每个转盘传送带可供旅客提取行李的传送带长度,转盘传送带越长,转盘附近旅客密度越小。

其余因素对旅客密度产生的影响与上述因素相互关联或可由各方协调处理,故将这类因素忽略。

2 行李提取区旅客密度预测模型

2.1 静态BN 模型

研究机场运行状况,需要考虑航班、机场保障环节、旅客、机场工作人员等多方面因素。贝叶斯网络可联结先验知识与样本信息,并联合依赖关系和概率表示,且对历史数据库需求较低,在历史数据中存在数据缺失及数据错误等情况下也能进行推理。因此,通过构建行李提取区旅客密度BN 模型,并对历史数据进行学习实现BN 模型参数的动态调整,从而对旅客密度进行动态预测。

贝叶斯网络也叫信念网络(BN,belief network)或有向无环图模型(DAG,directed acyclic graphs),由两部分构成:第1 部分是一个有向无环图,由一组随机变量的节点集X={X1,X2,…,Xi}及变量之间相互关系的连接节点的有向边构成;第2 部分是与所有节点相关的条件概率分布(CPD,conditional probability distributions)P,代表随机变量Xi之间的相互关系强度。该BN可表示为

其中:G=〈X,A〉为由i 个节点构成的有向无环图;A 为有向边的集;为节点Xi的条件概率分布,parent(Xi)为该节点中所有父节点(指向节点Xi的所有节点称为Xi的父节点)的集合。如果已知各变量的条件独立性假设和各节点的条件概率分布,便可推理计算出X 的联合概率分布P(X)。

构建BN 模型的方法有3 种:①完全数据学习,通过对大量样本数据进行机器学习得到先验知识,即BN 的网络结构和参数学习,该方法不适用于样本量较少甚至缺失的情况;②专家知识,基于领域内专家及相关行业从业人员等经验,明确变量间的依赖关系,定性地建立各节点间的关联关系及关联强度,该方法适用于缺乏样本数据且专家知识重要的情况,但主观性强,容易出现误差;③综合方法,结合专家知识和数据学习两种方法,一般先以业内专家知识为基础,初步确定变量间的依赖关系,建立BN 的网络结构,再对样本数据进行参数学习,可提高BN 模型的学习效率。

通过对民航领域的相关专家进行走访和调研,结合机场运行中航班到达后旅客行李提取流程分析,确定了影响行李提取区旅客密度指标的各节点及状态、节点间的独立或相互依赖关系。构建的行李提取旅客密度预测BN 结构,如图2所示。

图2 行李提取旅客密度BN 结构Fig.2 BN structure of passenger density in baggage claim area

变量集为X={X1,X2,…,X6},其中X1~X6分别表示航班到达时间、行李数量、旅客数量、转盘长度、机位号、行李提取区旅客密度。各变量含义为

X1={0,1,2,…,23},其中数字代表航班到达的时刻;

X2= {0~20,>20~40,>40~60,>60~80,>80},代表每个航班旅客办理托运行李的数量区间;

X3={0~50,>50~100,>100~150,>150~200,>200},代表每个航班乘坐的旅客人数区间;

X4= {72,80,85,93,98,109,132},代表航班分配对应的行李转盘的长度(m);

X5={A,B,C,D,E},代表飞机停靠不同停机位的情况;

X6={0~0.2,>0.2~0.4,>0.4~0.6,>0.6~0.8,>0.8~1.0,>1.0~1.2},表示旅客密度的取值范围(人/m)。

2.2 参数学习

结合业内专家知识及业务流程确定BN 的结构后,需要基于样本数据获得BN 模型中的节点参数值,该过程称为参数学习。参数学习的方法包含极大似然估计(MLE,maximum likelihood estimate)、贝叶斯估计(BE,Bayesian estimation)、期望最大化(EM,expectation maximization)和梯度下降法(GD,gradient descent)等。其中,期望最大化方法主要应用于数据集缺失情况。对于行李提取流程,涉及到航班保障的各个环节,旅客及行李保障流程复杂。在各种条件的制约下,整个行李提取流程中会存在节点数据缺失情况。因此,采用期望最大化方法对样本数据集进行参数学习。图3给出不完备样本数据处理流程。

图3 不完备数据处理流程Fig.3 Incomplete data processing flow

假设D={D1,D2,…,Dn}为一组存在数据缺失的样本数据集,Z={Z1,Z2,…,Zn}为隐藏数据集。Si为Di中的缺失样本值,Ωsi为si取值的全集,θi为参数θ 的估计,则定义基于Di的θ 对数似然函数为

其中,P(Si=si|Di,θ)i表示当Si≠时,假定P(Si=si|Di,θ)i=1。由于Di由D和θi决定,因此,(lθ|D)i常表示为l(θ|Di,θi),其含义即参数θ 基于D 的期望对数似然函数。而在EM 方法的循环迭代中,样本数据集D 不变,则l(θ|Di,θi)也常表示为Q(θ|θi)。对于EM 方法,通过迭代方式循环且交替执行E 步和M 步(E 步是根据现在的参数估计来计算期望值,M 步则是基于E 步计算的期望值,最大化当前的参数估计)。第i+1 次迭代时,E 步为

M 步为

其中:P(θ|D,Z)、P(Z|θi,D)分别是参数θ 基于样本集D增加隐藏数据后的后验分布密度及给定了θ 和D 时Z的条件分布密度。然后将E 步和M 步循环迭代直到‖{θi+1-θi}‖足够小为止。

2.3 动态预测模型

随着时间增加和推移,航班保障服务及流程运行相关数据逐步积累。为提高对新数据的适应性和预测的准确性,需要将新数据不断加入已有数据集中,并基于贝叶斯法则通过已有数据集的先验概率P(D)计算后验概率P(h|D),实现BN 的动态预测,即

其中:D 为历史数据集;h 为假设情况;P(h)为假设h 的先验概率;P(D|h)为假设h 成立时D 的概率。后验概率与样本数据集D 相关且可反映样本数据集D 的影响。新增数据作为新的样本数据集评估BN 模型的有效性,并经过处理后作为新增数据集对BN 模型进行调整,实现行李提取区旅客密度的动态预测。

3 应用实例

3.1 实验结果及分析

实验数据来自于国内某大型枢纽机场运行保障数据库,提取了该机场2018年7月和8月的航班保障及机场运行相关数据共14 000 组左右,经初步处理筛选出行李提取过程相关的数据,包括航班号、航班信息、转盘信息、航班保障节点、旅客流程等数据,部分航班信息原始数据如表1所示。一些节点由于人工记录或设备问题等原因存在数据缺失。对于数据缺失现象,按照不完备数据处理流程进行数据处理。实验使用2018年7月1日—7月31 处理完成后的数据进行BN 模型数据学习,得到BN 模型的先验概率;然后用8月1日—10日的数据对BN 模型增量学习,得到BN 动态预测模型;再使用8月11日—15日数据对模型进行验证。

表1 航班信息数据样例Tab.1 Sample flight information data

当预测某航班到达后旅客提取行李的密度时,根据历史数据建立模型,并结合该航班的具体信息来计算旅客密度的概率分布,求得预测值。E(t)表示其他节点值确定下的旅客密度预测值,Ti表示第i 个航班旅客密度值域的中值,Pi表示指标可能取得第i 个值域中的概率。将旅客密度的期望值认为是行李提取旅客密度的预测值,即

表2为8月13日航班ID 为30771986 的航班的旅客密度预测结果。当使用静态BN 模型时,模型预测结果为0.372 人/m,而当使用动态BN 模型时结果为0.322 人/m 且预测结果更集中在0.2~0.4 人/m 区间,显然动态BN 模型结果更接近实际值0.3 人/m。表3为随机选取的几个航班数据。

表2 旅客密度预测结果Tab.2 Passenger density prediction results

表3 航班数据Tab.3 Flight data

为验证所建立的动态BN 模型预测有效性,将使用静态BN 预测模型、动态BN 预测模型与直接神经网络方法结果进行对比分析,部分航班旅客密度和预测结果如表4所示。从表4中可看出,动态BN 模型预测值整体均与实际运行数据更接近,预测的精确度更高。因此,基于动态贝叶斯网进行行李提取旅客密度预测的方法可行。

表4 不同方法预测结果与实际值对比Tab.4 Prediction result of different methods vs.real value

3.2 模型评价

采用计算预测值与实际值的均方根误差(RMSE)来评价模型的准确性。均方根误差指标对于误差极大值和极小值有良好的识别度和敏感性,因此,可很好地反映模型的精确度。计算方法为

表5 均方根误差计算结果Tab.5 RMSE calculation results

从表5可知,3 种预测方法中动态BN 预测最终的结果误差最小,经过动态调整的BN 模型能更好学习并适应更新后的数据,对新数据情况下的旅客密度的预测能力更强。

4 结语

结合民航业内专家经验及对机场运行流程分析的结果,建立贝叶斯网结构。然后基于历史样本数据作为先验知识选取EM 算法进行参数学习,将数据进行训练得到BN 模型并进行动态估计。对实验结果及模型评价结果分析表明,该BN 模型能够实现对旅客密度的动态预测,并具有较高准确度。未来的研究方向为机场航班保障中对行李提取区影响的因素研究及优化航班保障流程,以改善行李提取区拥挤情况。

猜你喜欢

行李航班旅客
山航红色定制航班
山航红色定制航班
山航红色定制航班
山航红色定制航班
非常旅客意见簿
爱因斯坦的心灵鸡汤
候车大厅的旅客
行李
教你轻松收拾行李
我是人