基于子空间方法的航站楼安检队列状态预测

2023-09-20丁新伟邢志伟凌若鸿

计算机仿真 2023年8期

秦倩,丁新伟,邢志伟,凌若鸿

(1. 首都机场集团有限公司国际科技部,北京 100621;2. 中国民航大学电子信息与自动化学院,天津 300300)

1 引言

随着国民生活水平的不断提升,越来越多的旅客选择飞机作为出行工具,由2020年6月中国民航局发布的统计公报可知去年民航完成旅客运输13.52亿人次,同比增长6.9%。运输量的增长必然为民航服务质量带来巨大挑战。航站楼旅客安检服务效率作为旅客出港流程中机场服务质量的集中体现,有效分析研究队列状态变化对在不改变原先机场空间布局的基础上提高运行效率及旅客满意度至关重要,能够在一定程度上为机场控制提供决策依据,从而实现整个机场的安全高效运行。

国内外学者对行人在不同场景中的排队行为与规律进行了各方面的研究[1-2]。文献[3-5]通过对安检排队系统进行特征分析,利用排队理论建立安检排队模型,优化安检通道数量配置、提高安检运行效率提供理论依据与决策支持;文献[6-8]通过研究场景空间特点构建队列模型,为服务系统的资源配置和优化提供思路;文献[9-11]分别根据数据经验分布、服务水平标准设定以及Logit-SUE模型构建合适的队列模型,由此对排队现象进行定量分析,取得了较好的效果。子空间辨识作为系统辨识的重要分支,引起了大量控制领域专家学者的注意[12-15]。文献[16]提出一种基于Laguerre滤波器的核范数子空间辨识方法,针对连续时间随机系统辨识有较高的有效性和精确性;文献[17,18]考虑方法中模型定阶问题,对构建低秩矩阵逼近的秩最小化问题进行相关研究。

目前子空间辨识多用于工业过程辨识,在机场等场景中的应用较少。对排队行为研究的主要方法都集中在排队论和社会力模型上,且对于具体模型构造仍处于起步阶段。航站楼中拓扑结构和业务类型异常复杂,这其中的安检过程的高效有序是旅客满意度的重要决定性因素。在系统性分析航站楼安检服务的影响因素的基础上,基于子空间辨识方法构建了旅客安检服务模型,并分析优化模型和传统模型的结果差异,为航站楼旅客出港排队流程的仿真提供了新方法,为安检状态辨识提供符合实际运行情况的参考。

2 过程分析

2.1 安检流程分析

传统的旅客安检队列模型构建方法难以对安检旅客服务资源的运行指挥提供十分精准数据支持,且离港旅客安检服务环节的复杂性等一系列问题致使其成为了旅客排队滞留的重灾区。因此,如何设计精准有效的旅客安检队列模型成为了提升航站楼内安检运行效率的研究重点。旅客值机结束后下一步到达安检区排队等候接受安检服务,具体安检流程如图1所示。

图1 航站楼安检服务流程

航站楼安检的主要属性包括旅客到达数量、旅客所属航班号、旅客所属航班计划起飞时间、旅客性别、旅客值机托运行李数量、安检通道开放数、安检时间、安检班组等。在实际运行中,这些属性具有不稳定性,提高了安检状态辨识难度。为设计精准有效的旅客安检队列模型,研究基于子空间辨识方法的安检状态预测,在筛选出合适有效的安检属性后,根据安检旅客到达流量特征将数据进行分组,并对每组数据分别构建安检状态预测模型。

2.2 影响队列状态的主要因素

航站楼安检队列状态受旅客到达数量、安检口开放数量等因素影响,且在实际运行中,这些因素具有不确定性,加大了队列状态预测的难度。主要影响因素分析如下:

1)安检旅客到达数量

因数据量较大,同时在机场繁忙时段,机场会呈现多样性与复杂性,因此这里选取繁忙时段数据做代表分析。对国内某大型机场于2019年度繁忙时段9:00-11:00所有前往安检项目的旅客数据进行整理与分析,获取时间段内每分钟安检旅客到达均值如图2所示。繁忙时段旅客到达数量与同时段航班数量相关,存在少数峰值,此时为安检系统压力最大时段。

图2 9:00-11:00每分钟安检旅客到达均值折线图

安检旅客到达数量作为航站楼安检场景的重要因素,在实际运行中具有周期性,流量特征较为明显,可清晰建立历史流量日历。使用无监督聚类对安检流量历史数据做处理以挖掘其中规律,目标是为保证同一分类的数据尽可能相似而非相异。再使用SVM(支持向量回归机)分类算法将数据根据特征完成分类,从而预测出某个时间的流量曲线。

2)安检通道开放数量

机场在不同时段内根据所承受的安检压力决定开放的安检通道数量,通过控制安检通道数量开放以保证机场的高效运行。国内大型枢纽航站楼安检通道通常在两边各设置一个安检服务,可在同一时间对单通道内两名旅客进行安检,在饱和状态下甚至可开放资源在同一时间对四名旅客进行安检,以保证繁忙时段安检环节的高效运行。据调研,数据来源机场单个安检通道仅会设定两个安检服务,因此不考虑其它多服务情况。

3)旅客安检状态

由于旅客个人的行程计划安排,携带的行李数量有一定差别,由此将决定旅客是否需要办理行李托运。通过对旅客是否办理行李托运和安检效率的分析可知,前去柜台并办理值机托运行李的旅客在通过安检时携带随身物件更少,安检通过时长更短。

对于各个样本,对旅客是否办理行李托运以及托运数量有详细的记录,将已办理行李托运的旅客记为1,未办理行李托运的旅客记为0,以此计算每分钟未办理行李托运的旅客比例。该比例在一定程度上决定该时间段安检队列状态。

4)其它因素

机场实际运行中,安检场景可能出现诸多不确定因素,如行李开包检查、旅客不配合安检工作甚至扰乱安检工作等情况的出现,将极大影响当前安检通道的安检效率,进而影响整体安检队列状态。

3 于改进子空间辨识的安检队列模型

安检场景作为航站楼内典型的队列场景之一,在实际运行过程中,其基本目标是在不同条件下保持安检输入量和安检输出量差值稳定在一定范围内,达到安检系统高效率运行的目的,保证航站楼整个大系统有条不紊的高效率运行。

子空间辨识方法的主要特点在于直接由输入输出数据辨识系统的状态空间模型,适用于多变量系统辨识,且不需要参数化与迭代优化,仅依靠线性代数方法实现。因此考虑到子空间辨识方法的特点,适用于所讨论的航站楼安检场景。但航站楼安检场景系统较为复杂,随机场繁忙度呈现不同特性,是随时间变化而具有不同特征的非线性系统,但子空间辨识方法更适用于线性度较佳的系统,在系统稳定波动较大时各指标会有不同程度的下降。为改善这种现状,结合航站楼安检系统特性,基于大量历史数据对安检流量进行特征分析完成分类,根据不同安检状态分别建模以保证准确性,完成对航站楼安检场景的子空间辨识。

3.1 子空间辨识方法

航站楼安检过程的输入数据和输出数据均可从历史数据库中得出。系统的状态空间表达式如下[19]

xk+1=Axk+Buk+wk

(1)

yk=Cxk+Duk+vk

(2)

满足

(3)

式中,xk∈Rn,uk∈Rm和yk∈Rl分别为系统在k时刻的过程状态向量、输入观测向量和输出观测向量;vk∈Rl和wk∈Rn均为系统的不可测噪声信号,vk为输出测量噪声,wk为系统的过程测量噪声;A,B,C,D为系统矩阵;E为期望算子;σpq表示当p=q时σpq=0,当p≠q时σpq=1;系统中各个矩阵已设定相应的维数。

在确定系统的输入输出后,可确定系统的状态空间矩阵。为此,需要构建输入输出数据给定值的Hankel矩阵,并确定模型阶次,计算所需系统矩阵A,B,C,D。根据航站楼安检场景和数据,将安检旅客到达数、安检通道开放数和旅客安检状态作为输入,旅客安检平均等待时间、安检队列平均长度作为输出,构建一个三输入二输出的多输入多输出(multiple input multiple output,MIMO)系统。

3.2 获取系统矩阵

子空间辨识方法基于输入观测向量ut∈Rm和输出观测向量yt∈Rl,为确定模型阶次n和获取系统矩阵,将数据进行处理构成所需Hankle矩阵

(4)

(5)

(6)

(7)

Up和Uf分别表示数据库中设定的过去时刻和未来时刻的输入观测向量,同理Yp和Yf。此外为保证模型的准确性,p和f在适应系统参数的前提下应适当选取为大于系统阶次的参数,以降低对噪声的敏感度。由此可得Hankel形式状态空间表达式

(8)

其中,广义能观矩阵

三角Toeplitz矩阵

低维分块三角Toeplitz矩阵

子空间方法主要包括N4SID、MOESP和CVA,三种方法的区别仅在于权重矩阵的选取方式不同[20]。对比实验可知,在当前场景下N4SID误差相对较大,而CVA和MOESP相对较好,但MOESP的加权方式运算量相对于CVA更小,因此本文采用MOESP方法,对获得的状态空间表达式使用斜向投影后,在投影左右加权,消除噪声和未来输入Uf后即可得到

Om=W1Γmm

(9)

(10)

由此可获得系统的阶数n即为上式中非零奇异值的个数。再利用广义能观矩阵Γm和状态估计序列m,通过最小二乘法即可计算出系统矩阵A,B,C,D。

3.3 安检初始队列状态

航站楼安检场景在非空闲状态下有队列长度不为0的特性。结合这一特点,对子空间辨识方法进行改进,构建额外的“初始队列状态”,以提高子空间辨识方法和安检场景的契合度。在历史数据的指导下提高预测精确度,式(2)修改为

yk=Cxk+Duk+vk+dk

(11)

其中dk为初始队列状态,包括初始队列长度和初始等待时间。机场9:30-11:00的历史队列长度变化和历史等待时间变化如图3所示。

图3 9:30-11:00历史队列状态

队列长度和等待时间相关性较强,且基本呈正相关关系。等待时间变化的波动幅度比队列长度较大,总体曲线特征明显。通过对历史数据的分析,获取各时段规律,可获取在一定时间同特征下安检场景的队列长度常态值和等待时间常态值,由此完成对初始队列状态的设定。

在对一段时间的安检状态进行辨识预测时,根据起始时间从库中获取对应的初始队列状态,以此为基础对未来队列状态进行预测,解决子空间方法初始误差问题,避免因队列初始状态差异较大而导致的预测精度较差问题。

3.4 改进子空间辨识方法求解步骤

改进后的子空间辨识方法求解安检队列状态模型步骤如图4所示。

图4 子空间辨识方法求解流程图

4 实例分析

4.1 数据分析及预处理

数据来源于国内某枢纽机场部署的机场协同决策系统中的航站楼安检共享数据,数据样例如表1所示,包含航班号、安检通道、安检时间、安检模式和所属航班的计飞实飞情况等。近年来这些丰富的历史数据,为从不同的角度挖掘旅客安检情况提供了强有力的数据支撑。

表1 旅客安检与所属航班数据样例

结合该机场某航段的实际运行数据分析各因素对航站楼安检过程的影响,介绍详细的分析过程。在航站楼安检的各影响因素中,安检旅客的到达情况、旅客安检时间和旅客安检状态是构建具体模型的重要支撑和入手点。因此对数据的预处理过程如下:

1)删除VIP通道旅客数据。安检旅客数据中包括少量VIP通道旅客,VIP通道为额外安检通道,通过旅客较少,较少存在排队现象。不会对其它队列长度产生影响;

2)删除安检时间、安检通道等关键字段存在空值的旅客记录;

3)结合机场繁忙度设定对安检数据做批处理,并对历史数据进行训练获取流量特征,并根据特征将数据分类。

4.2 数据分组

在影响因素分析中可知,安检旅客到达数量是影响安检队列状态的主要因素之一。由于在实际运行中,不同时间段的旅客流量特征差距很大,因此,将安检状态按照繁忙时间段特征分组,使得组内时间段旅客到达数量特征相似,并分别构建各个分组的安检队列状态模型。

对机场2019年的安检旅客流量进行分析,获取的年度平均每半小时安检旅客数量如图5所示。由图可知:6:00～9:00安检旅客流量波动较大,并在临近9:00时呈现上升趋势;9:00～12:00和15:30～19:00为安检高峰期,旅客流量较大;12:00～15:30期间安旅客流量相对平稳,并于临近15:30时安检旅客流量呈现上升趋势并再次达到高峰状态;23:00至次日6:00期间安检旅客流量较小,一般不会发生安检资源紧张的情况。

图5 每半小时平均安检旅客数量

根据机场繁忙度设定将23:00～6:00定义为空闲状态,将6:00～9:00、12:00～15:30和19:00～22:00定义为一般繁忙状态,将9:00～12:00和15:30～19:00定义为繁忙状态。由于夜间航班流量较小,离港旅客流量也因此较小,不存在安检资源紧张的情况,因此,只探讨繁忙和一般繁忙状态的安检状态辨识问题。

结合所用方法的特性,根据特征再将数据分为高峰趋近t1、高峰远离t2、次高峰趋近t3、次高峰远离t4四种类型,分别辨识建模以保证模型准确性和适用性。

4.3 预测结果及分析

以每分钟安检旅客到达均值、安检通道开放数、未办理行李托运旅客比例作为输入,每分钟平均队列长度和旅客平均等待时间为输出,构建一个三输入二输出的MIMO系统。取连续时段的60组数据作为测试集,余下的作为训练集。在此以高峰-趋近时段为例,子空间MOESP辨识方法获取的航站楼安检高峰-趋近时段系数矩阵如下

为说明方法的有效性,分别采用以下未分组子空间MOESP方法和支持向量回归(SVR)与之进行对比实验。图6和图7分别为3种方法的队列长度和等待时间预测结果对比。

图6 平均队列长度

图7 平均等待时间

对于预测结果的误差评价,使用平均绝对误差(MAE),平均绝对百分误差(MAPE)来衡量模型的预测效果,队列长度误差取± 3人,等待时间误差取± 60秒。表2、3、4分别给出了各组实验的预测准确率和MAE及MAPE对比。

由表2可知,分组子空间方法对于队列长度和等待时间的预测准确率在各个特征段均优于未分组子空间方法和SVR方法,其中预测效果最好的为次高峰-趋近时段,达到了84.44%。未分组子空间算法在复杂非线性系统中适应性较差,难以对各个时段特征变化的安检场景完成准确预测;SVR方法所需的支持向量个数较多,在使用数据量较大的支持向量训练模型耗时较长,且在安检场景中预测效果相对较差。

由表3、表4可知,分组子空间方法的MAE和MAPE明显优于其它两种模型,说明分组子空间方法预测模型具有更小的误差波动,并且预测模型更加稳定。因此,分组子空间方法所获取的模型的预测性能明显优于其它两种模型。利用该模型对航站楼安检进行预测,能够获取更准确的队列状态,并及时对场景资源进行判断,一定程度提高安检资源调控响应速度,减少安检队列过长、旅客等待时间过长等问题的出现的可能。

表3 平均队列长度MAE和MAPE对比

表4 平均等待时间MAE和MAPE对比

5 结束语

研究了航站楼安检队列状态预测问题,以提高预测准确率为目标,并提出基于子空间算法的安检队列状态预测模型,具体包括如下几个方面:1)构建了基于子空间方法的航站楼安检队列状态预测模型,使用国内某大型机场安检数据对模型进行训练与检验,取得了良好的效果;2)根据安检旅客到达流量特征和繁忙度设定将数据分组,分别构建不同特征数据下的预测模型,提高了预测准确率;3)将该方法和未分组子空间方法、SVR方法预测进行对比,该方法的准确率和稳定性均为更优效果。

目前,将子空间辨识方法应用于机场系统的研究较少,将子空间辨识方法应用于航站楼安检场景,为后续的安检资源优化设计提供了重要思路。