APP下载

基于LSTM模型的机场航班飞行轨迹预测

2022-09-20付茂洺陈纪宗

现代计算机 2022年14期
关键词:航迹轨迹维度

付茂洺,陈纪宗

(中国民用航空飞行学院,广汉 618307)

0 引言

互联网的高速发展,也对民航空中交通管理系统的智能化提出的新要求。欧洲和美国的SERSAR和NextGen均采用了基于航迹(trajectory based operation,TBO)的运行理念。该模式下通过飞机飞行时间和轨迹的准确预测,有效降低飞行航路的不确定性,同时提高航空运行的安全,以及在飞机出现故障时计算有效的故障发生时间和可能进行迫降的地点,对后续救援工作提供有力的帮助。

国内外学者对航迹预测的研究方法主要有:

基于参数估计的方法,该类方法需要获取飞机在飞行过程中的各类数据。文献[1]通过仿真实验模型对飞行阶段的轨迹特征生成4D飞行轨迹。文献[2]提出基于飞行时间、耗油量等指标构建预测模型,实验结果表明可以提升TBO的鲁棒性。虽然对航迹预测做出了重要贡献,但大多数研究都是在理想情况下实现,很少考虑现实环境对飞行轨迹的影响。此外,大量参数数据也都大多涉及商业隐私性,不易获取,一旦数据出现不完整,预测精度将大打折扣。

为了解决上述问题,基于无参数估计方法应运而生,该类方法是建立在假设情况下的预测方法。文献[3]提出直接根据目标机的历史位置预测未来位置。文献[4]提出MIEKF有效减少预测模型的误差,提高预测系统的鲁棒性,以及稳定性和实时性。文献[5]提出基于混合方法的轨迹预测,对历史轨迹数据分析建模,在保证准确性的基础上保持长期稳定性。无参数模型需要大量的建模分析,但内部网络结构相对简单,因此可能导致模型的鲁棒性不足,如果数据中存在冗杂数据可能会对预测结果影响较大。

本文在现有的经纬轨迹数据基础上,以LSTM模型为主体,通过学习历史轨迹与下个位置之间的关系,建立深度学习模型,从而预测将来可能出现的位置。可用于解决空域冲突、紧急救援等,本文使用的数据是来自某机场交通管理系统中某航班从国内机场A到国内机场B的历史飞行数据。

1 相关技术

1.1 长短期记忆网络(LSTM)

LSTM是循环神经网络(recurrent neural Network,RNN)的变体,能解决普通RNN梯度爆炸或梯度消失的问题,适用于时间序列数据,它的下个时间周期输入是上个时间周期的输出。LSTM模型具有独特的记忆模块,可以减缓数据信息的丢失速度,LSTM单元包括输入门、输出门、遗忘门以及输入节点等,内部结构如图1所示。

图1 LSTM内部网络图

在当前时刻从输入层输入的信息会首先经过输入门,输入门的开关决定当前时刻的信息是否输入到记忆细胞中,计算公式为:

式(1)中,w是输入门的权重矩阵,b是输入门的偏置项。

用于决定当前时刻是否有信息从记忆细胞输出。

当前时刻的记忆细胞中的值都会经历一个是否被遗忘的决策,这些决策都由遗忘门决定。

W是遗忘门的权重矩阵,[,x]表示把两个向量连接成一个更长的向量,b是遗忘门的偏置项,是sigmoid函数,如果输入的维度是d,隐藏层的维度是d,单元状态的维度是d(通常d=d),则遗忘门的权重矩阵W维度是d*(d+d)。事实上,权重矩阵W是由两个矩阵拼接而来的:一个是W,它对应的输入项,其维度为d*d;另一个是W,它对应的输入项X,其维度为d*dW可以写为:

信息传递的顺序是先进入输入门,观察是否有信息输入;再由遗忘门判断是否遗忘记忆细胞里的内容;最后经过输出门,判断是否将当前时刻的数据进行输出。流程如图2所示。

图2 LSTM单元结构

通过三道门之后,使得LSTM可以保留有用的特征,而抛弃作用较小的特征,从而增大记忆长度,提高长时间序列问题的处理能力。

2 LSTM航迹预测模型

分析目标航班的数据后,使用LSTM神经网络建立预测模型,预测过程主要分为:数据预处理、模型训练、预测与真实值对比分析。

2.1 数据预处理

首先对航班轨迹数据进行筛选,以前四个经纬度判断第五个经纬度是否发生较大偏差,对数据中的冗杂和缺失进行平滑处理,以保证整个航线的准确度。数据处理判断公式如下所示:

2.1.1 配置训练集与测试集

模型数据集由训练集与测试集组成,训练集用于训练模型;测试集用于检测验证模型的准确度。本文设定用前九个位置数据预测下个位置,则输入后划分训练集和测试集数据如表1所示。

表1 示例数据集

2.1.2 数据归一化

为了降低数据取值范围对网络最终准度的影响,需要把输入数据归一化到[0,1]区间内。本文采用min-max进行归一化,公式如下所示:

其中为各个维度的最大值,为各个维度的最小值,x为归一化后的数据,归一化可以尽可能消除数量级对最终预测的影响,且不会破坏数据集原本的内在联系。使用归一化后的数据作为输入数据则预处理基本完善。

2.2 LSTM模型

LSTM预测模型主要分为三层,分别是输入层、隐藏层、输出层。预测模型如图3所示。

图3 LSTM预测模型

对经过上一节处理后的数据按照10∶1划分,采用大小为的窗口进行分割数据,以X的,二维坐标位置信息做数据标签。隐藏层的和分别作为LSTM细胞的状态与输出。故模型的预测输出Y 可用如下公式表达:

经过训练模型迭代训练,直到损失函数值收敛,即可得到最终的LSTM预测模型。再将模型的输出经过反归一化处理,得到真实的经纬度坐标值,即可得到具有参考意义的二维坐标。

时间窗口的选择:LSTM模型最终的性能会受到输入时序长度的影响,过长或过短的序列意味着记忆单元会记忆多余冗杂特征或无法记忆关键特征。经多次反复实验后,本文在实验中选择十个时刻的轨迹特征来预测下一时刻,也就是说时间窗口等于十时为模型的最佳大小。

抛开时间窗口,合适的超参数同样对模型的性能有巨大的影响,本文模型超参数主要包括:学习率alpha(简写为α),模型LSTM隐藏层的层数,隐藏层中神经元个数,训练集单次输入个数Batch_Size(简写为B),防止过拟合Droput,模型总迭代次数epoch(简写为E),损失函数均方误差计算(简写为MSE,并设置起始值为0.0075,最小值为0.0001),优化器Adam,输入序列长度μX10的一维矩阵。参数设置如表2所示,网络模型训练结果如表3所示。

表2 参数设置

表3 网络模型训练结果

3 实验及结果分析

3.1 实验数据集和环境

本实验的航班轨迹是来自某机场交通管理系统中某航班从国内机场A到国内机场B的历史飞行数据。数据时间间隔为1~10 s不等,经过上一节数据清理以及归一化后,总计10000条位置数据。将该航班轨迹按10∶1划分后分别作为训练集和测试集,经过反复实验并调优后,随机选取该机场另外10个航班用于测试模型的精度与误差分析。本文的实验设备如表4所示。

表4 实验设备

3.2 实验评价标准

通过模型预测当前飞机位置为(,),实际飞机位置为(,)。使用均方误差(MSE)来评估预测精度,将经纬度转换为弧度后,用Haversine公式计算球面两点间的距离,MSE以及Haversine公式如下所示:

变形转化为可以计算的公式,则有:

MSE公式中,y是真实值,y是预测值,为样本个数,为当前系数。

Haversine公式中,是任意两点之间的中心角,是球面两点直接的球面距离,是球体的半径,和表示两点的维度;和表示两点的经度。预测过程如图4所示。

图4 LSTM模型预测过程

3.3 实验结果分析

为了验证当前模型对不同航班的预测效果,取同一机场的9个航班数据,对数据集按照10∶1划分为训练集和测试集,按照上节所述步骤进行训练,并预测飞行轨迹,计算预测轨迹和真实轨迹之间的误差,结果如表5所示,9个航班轨迹以及预测轨迹如图5所示。

表5 预测误差

图5 航班预测

4 结语

本文通过对航班航迹飞行数据研究,在航迹数据的基础上,结合时间序列方法,提出了基于LSTM模型的短期航班航迹预测方法。在真实数据的基础上,使用LSTM模型进行航迹预测,大量实验证明了LSTM模型算法的有效性。

本文的航迹预测算法仍存在一些不足。例如现在只能对较短航班航迹进行预测,且时间采样间隔较小,对于连续跨间隔的航迹经纬度预测仍需要多次迭代实现,且有一定概率导致偏离正确航迹,使得误差在迭代中变大。因此,下一步将考虑多个模型组合使用,比如ARIMA、注意力机制等,提高算法模型精度。同时也会引入更多特征,比如高度、转向、飞行姿态等来降低模型误差。

猜你喜欢

航迹轨迹维度
基于自适应视线法的无人机三维航迹跟踪方法
如何促进我国综合交通运输高质量发展
——基于FSO框架的分析
基于高斯过程的航迹片段关联算法*
基于K-means++时间聚类的飞行航迹预测
理解“第三次理论飞跃”的三个维度
浅谈求轨迹方程中的增解与漏解
无从知晓
多媒体情境下培养学生阅读素养的三个维度
幼儿教师专业成长的三个维度
捕捉物体运动轨迹