基于GA-BP神经网络的空中交通网络流系统拥堵预测
2021-08-04张兆宁张莹莹冀姗姗
张兆宁,张莹莹,冀姗姗
(1.中国民航大学空中交通管理学院,天津 300300;2.中国民用航空华东地区空中交通管理局飞行服务中心,上海 200335)
大面积航班延误为机场、空管、航空公司等民航单位带来严峻挑战。目前,造成大面积航班延误的原因较多,如恶劣天气、空域繁忙、机场设施故障、军事活动等,都会造成机场或航线的容量下降,从而产生容量和流量需求之间的矛盾,导致空中交通网络流系统(ATNFS,air traffic network flow system)发生拥堵。若能预先向流量管理部门发布拥堵等级,则可提前采取相应措施,进行流量控制,提高ATNFS 的运行效率。
国内外学者采用不同方法进行空中交通状态预测。在国外,Tu 等[1]使用统计方法分析空中交通延误的长、短期模式;Rehwald 等[2]提出了机场交通拥堵的概念,即进离场和扇区流量需求与容量不匹配的状态;Lee 等[3]使用多元线性回归分析方法创建预测模型,对由天气导致的交通拥堵变化进行评估;文献[4-5]针对航班延误预测问题,先后提出了基于长短时记忆法的递归神经网络预测模型和一种结合天气数据的机器学习模型,后者可预测由恶劣天气条件引起的航空公司延误;Liu 等[6]利用随机森林算法构建了交通拥堵预测模型;文献[7]提出一种预测和评估机场到达运行状态的方法,研究结果表明,对机场延误和拥堵影响最大的因素包括到达过程的饱和程度、时间段和气象条件。
在国内,李善梅等[8]针对机场拥挤问题,提出基于聚类神经网络的拥挤等级预测模型;徐肖豪等[9]总结了空中交通拥挤预测的方法和模型,并对未来的研究方向和热点问题进行分析;黄荣顺等[10]针对机场拥挤问题,提出基于多元线性回归和支持向量机方法的拥挤预测模型;丁辉等[11]针对空域拥堵状态,提出使用堆叠自编码网络的拥堵预测模型,但未将其应用到实际数据中;王莉莉等[12]针对突发事件下的短期空中交通流量调度问题,使用动态网络流方法进行研究;张兆宁等[13]从机场和航线角度对空中交通网络流系统的拥堵进行研究。
综上所述,对于空中交通拥堵预测的研究多是针对空中交通某单元,如扇区、机场、某航段等,且对于拥堵和拥挤的区分不明显。实际上,空中交通拥挤是一种常态,常常出现在流量高峰时段或机场、扇区等空中单元受到轻微干扰时。而拥堵使机场、扇区等空中交通单元的容量大幅下降,从而导致流量需求和实际容量远不匹配的状态,造成机场大面积航班延误。空中交通拥堵造成的后果要比拥挤严重得多。若只从机场、扇区等单元开展研究,则研究角度比较微观,不能从宏观角度把握拥堵的发展态势。因此,有必要从ATNFS 角度进行拥堵预测研究。
在实际工作中,空中交通流量管理部门需要对ATNFS 的拥堵态势进行预测,才能更好地采取控制措施。拥堵发生的原因主要是流量需求远远大于容量,因此,从二者的关系入手预测拥堵状态。主要包括3方面内容:①ATNFS 的容量、实际流量和流量需求的关系;②ATNFS 的状态分类、评价指标和确定预测指标;③建立基于GA-BP 神经网络的ATNFS 拥堵预测模型。
1 问题描述
1.1 空中交通网络流系统的拥堵机理分析
ATNFS 拥堵是指其中的机场和航线容量下降,导致其不能满足流量需求而发生航班延误、取消、返航和备降等现象。不同于ATNFS 拥挤,拥堵是指实际的流量接近容量,造成的交通滞留现象。一般情况下,系统内的航班都是按航班计划安排的,且正常情况下航班计划不会超过机场和航线的容量,流量需求不会猛增。若发生拥堵,必定是系统内机场或扇区的容量下降,从而导致其不能满足流量需求。因此,需从实际流量、容量和流量需求的角度对ATNFS 的状态进行分类。
1.2 空中交通网络流系统的状态划分
ATNFS 容量C 是指在一定可接受的延误条件下,在给定时间内系统中能安全运行的最大航班架次,包括航线飞行的航班,机场内起飞、降落和滑行的航班,但不包括机场内尚未起飞的航班。实际流量F 是指在给定时间内ATNFS 中运行的实际航班数,包括实际进入系统内航线和机场的航班数量,但不包括机场内尚未起飞的航班。流量需求FD是指给定时间内系统中预计运行的航班架次,包括正在运行的航班架次和预计进入系统的航班架次。根据三者关系将ATNFS 的状态分为4 类:正常、拥挤、拥堵和堵塞。
1)正常
机场节点和航线容量都可满足流量需求,几乎所有航班都能正常运行。三者关系基本满足FD≈F <C。在无意外情况发生时,机场和航线容量没有下降,各航班按照正常航班计划运转,ATNFS 稳定运行。
2)拥挤
系统中某些机场或航线容量稍有下降,或系统流量需求和管制负荷增大,同时系统中出现延误航班,但ATNFS 基本能维持正常运行。航班高峰时系统会出现拥挤,但当大面积航班延误开始结束时,系统通行能力开始恢复,大量延误的航班开始放行,此时系统中的实际流量会大于航班计划,这同样属于拥挤状态。此时三者关系基本满足FD≈F≈C。若系统处于拥挤状态,流量管理部门应该及时采取措施,以避免拥挤程度加深,造成更严重的后果。
3)拥堵
系统内某些重要机场或航线容量长时间严重下降,导致这些机场或航线不能满足流量需求,但能运行,同时出现大量航班滞留、延误、取消、返航、备降等情况,系统中实际运行的航班数会远小于计划航班数,即流量需求。当发生大面积航班延误时会出现拥堵状态,此时三者关系基本满足FD>F ≈C。在此状态下,应当及时调整系统内的流量分布,以免某些机场或航线容量饱和,导致出现完全不能执行航班的情况。
4)堵塞
系统内多个重要机场或航线容量长时间严重下降,开始出现某些机场和航线容量饱和的情况,即不能容纳除了紧急航班外的其他航班。当发生暴雪、雷雨天气等特殊原因导致航线和机场容量下降时,会出现堵塞的状态。此时三者的关系基本满足FD >F≈C。此时的流量需求FD和容量C的差远大于拥堵状态。若有些机场或航线容量下降为0,或未能及时采取措施,则会出现此状态。
2 预测模型构建
在航班延误预测问题研究中,常用两类预测方法:①回归法,即对延误时间等变量的预测;②分类法,即对延误程度的划分。为从宏观上对大面积航班延误进行预测,从ATNFS 角度出发,采用这两种预测方法:回归(连续输出,输出变量是一个连续的值,表示拥堵度)和分类(二分类预测,拥堵或不拥堵)。找出影响系统拥堵的变量并利用其进行预测,通过利用过去和当前时段的状态变量,预测下一时段的状态变量,即短期预测。
2.1 选取拥堵评价指标
为了预测是否会发生拥堵,建立拥堵预测指标。事实上,当发生拥堵时,流量需求远大于实际流量;当不拥堵时,系统容量基本可以满足流量需求,实际流量基本等于流量需求。故用流量需求和实际流量给出拥堵的评价指标拥堵度,表示为
事实上,当FD和F两者相差不大时,系统的状态可能只是拥挤,不会发生拥堵,而当实际流量远远小于流量需求时才发生拥堵。因此,定义一个阈值α,当D≥α 时,认为系统发生了拥堵,否则不拥堵,α 应根据不同系统而确定。
根据拥堵度的定义,围绕流量需求和实际流量建立预测指标。
1)某时段t的流量需求
FD(t)=A(t)+P(t)
式中:A(t)为截止到t时段初累计延误的航班架次;P(t)为t时段计划的航班架次,表示当前时刻系统的流量需求。一般航班需求越大,该时段的负荷越大,越容易产生拥堵。
2)累计延误航班变化率
累计延误航班变化率表示的是累计延误未执行的航班架次变化情况,即
ω(t)=A(t)/A(t-1)
若累计延误航班变化率ω(t)<1,说明累计延误的航班数减少,下一时段发生拥堵的概率会减小。
3)上时段容量变化
上时段容量变化表示t的上时段容量恢复情况,即
ε(t-1)=FD(t-1)/P(t-1)一般航班计划是根据容量制定的,若FD和P两者相差不大,说明该时段系统的容量正在恢复,航班延误会减少,可减小下一时段的拥堵情况。
4)某时段容量变化
某时段容量变化表示t时段的容量恢复情况,即
ε(t)=FD(t)/P(t)
2.2 基于GA-BP 神经网络的拥堵预测模型
ATNFS 是一个复杂的人—机—环系统,不仅包括复杂的空中交通网络拓扑结构,还有环境、人、设备设施等复杂因素,难以建立具体的拥堵预测模型,而神经网络可以很好地解决该问题。数学理论证明,3 层BP神经网络特别适合求解内部机制复杂的问题,但鉴于初始化的权值和阈值对神经网络训练影响较大,因此,采用遗传算法(GA, genetic algorithm)对其进行优化以避免BP 神经网络局部极小问题的产生。预测模型的输入为FD(t)、ω(t)、ε(t-1)、ε(t),节点数为4,模型输出为t时段内的拥堵度值,节点数为1。具体建模过程如图1 所示。
图1 BP 神经网络预测模型框架Fig.1 Framework of BP neural network prediction model
模型流程图如图2 所示。算法的具体步骤如下。
图2 GA-BP 算法流程图Fig.2 Flowchart of GA-BP algorithm
(1)确定网络结构,使用Sigmoid 函数,f(x)=1/(1+e-x)作为激励函数,计算隐藏层和输入层。
(2)初始化,包括神经网络的权值ωi0、阈值bh0、种群P、交叉规模N、交叉概率Pc(一般取60%~100%)、变异概率Pm(一般取0.1%~10%)、种群规模n。
(3)设置适应度函数fi,用误差平方和Ei来衡量,即
式中:i为第i条染色体;k为输出层的节点数;yi,k为第i条染色体的预测输出值;tk为实测值。
(4)选择操作,使用概率值pi选择网络个体,即
(5)交叉操作,以交叉概率Pc对染色体Gk和Gl在第j基因位上进行交叉操作,得到新的基因位Gkj和Glj,没有进行交叉操作的个体直接进行复制,即式中b为[0,1]间的随机数。
(6)变异操作,利用变异概率Pm突变产生新的染色体,选取第i个染色体的第j个基因aij进行变异操作,即
式中:amax和amin分别为基因的最大值和最小值;r为[0,1]间的随机数;r1为随机数;g为当前的迭代次数;Gmax为最大迭代次数。
(7)将新个体插入到种群P,并计算新染色体的适应度函数。判断算法是否结束,若结束,则得到最优结果,作为BP 神经网络的最优权值和阈值;否则,返回步骤(4)。
(8)计算BP 神经网络的代价函数获得误差。
(9)误差反向传播,更新权值和阈值。
(10)判断算法是否达到计算精度或满足最大迭代数,若是,则使用训练好的模型进行ATNFS 的拥堵预测;若否,返回步骤(8)继续训练。
3 实例分析
3.1 数据获取
以机场A为中心建立一个ATNFS。将与其航班数量最多的4 个机场作为系统内其他机场,如图3 所示。其中:A、B、C、D、E代表机场,1~15 代表航线,航线1 代表机场B除了与机场A、C、D、E连接的航线外其他所有航线汇总成的一条航线,航线3、5、7、15 同理。
图3 以机场A 为中心的ATNFS 结构Fig.3 ATNFS structure centered on airport A
已知2018年7月某天6:00—18:00 机场A受台风天气影响,10:00—20:00 机场B受雷雨天气影响,获取当天5 个机场的航班数据。由于00:00—06:00的航班数量极少,在此不做考虑,从06:00 开始到当天24:00,以半小时为间隔,将时间段分为了36 个时间段,统计和计算每个时间段内的流量需求和实际流量,计算拥堵度值并进行拥堵与否的分类。在该系统中设置α=2,即当D≥2时,说明系统是拥堵的。使用前27个(06:00—19:30)数据作为训练数据,后9 个(19:30—24:00)数据作为预测数据。
使用Matlab 进行计算,此次预测模型的输入层有4 个节点FD(t)、ω(t-1)、ε(t)、ε(t),输出层有1 个节点,隐藏层包含6 个节点,训练迭代次数为100 次,训练精度达到0.000 01,学习率为0.1。遗传算法的参数设定为最大迭代次数Gmax=10、种群规模n=30、交叉概率Pc=0.6,变异概率Pm=0.1。
3.2 预测结果及误差分析
经计算,基于BP 神经网络和GA-BP 神经网络算法的预测结果如图4 所示。
图4 BP 和GA-BP 神经网络预测结果Fig.4 Prediction results by BP and GA-BP neural networks
从图4 可看出,所建立的ATNFS 拥堵情况仍然很明显,这是由于雷雨天气导致大量航班延误,很多当天计划的航班没有执行,即流量需求一直较大,预测结果拥堵度值基本处于3 以上,一直处于拥堵状态,说明流量需求仍然远大于容量,这和实际拥堵情况基本相符,说明模型能基本反映出拥堵趋势。
使用3 种评价指标评价,即平均绝对误差(MAE,mean absolute error)、最大绝对误差(MAXAE,maximum absoulte error)和均方根误差(RMSE,root mean square error),对两种算法的预测结果误差进行评价,即
式中:yi为实测值;为预测值。
模型预测误差如表1 所示。
表1 模型预测误差Tab.1 Predicted error of the model
从表1 可看出,基于GA-BP 神经网络的3 种评价指标预测误差都比较小,且优于BP 神经网络方法的训练结果,说明该模型能较好地预测出拥堵度值。
4 结语
文中分析了容量、实际流量和流量需求的关系,根据三者关系建立了预测指标,基于GA-BP 神经网络建立了ATNFS 的拥堵预测模型;通过遗传算法对BP神经网络算法进行了优化,提高了模型的准确性;通过对实际数据的分析证明,所提出的预测模型效果较好,可用于ATNFS 的拥堵预测,为空中交通流量管理部门提供了决策依据。
通过预测实际流量与流量需求对比来判断是否拥堵,仅一个简单的二分类。实际上,具体的拥堵程度分类还有待进一步研究,下一步工作重点将通过深度解读更加丰富的指标来评价容量、实际流量和流量需求三者的关系,以获得更加精准的预测效果。