基于LSTM的Encoder-Decoder多步轨迹预测技术
2021-08-05李青勇何兵张显炀朱晓宇刘刚
李青勇 何兵 张显炀 朱晓宇 刘刚
摘要:针对弱约束非合作目标的轨迹特性和运动特性,提出一种基于LSTM的Encoder-Decoder多步轨迹预测技术(EDMTP)。引入一阶差分处理,降低了轨迹数据的时间依赖性,得到了无趋势的轨迹。构造输入输出的轨迹数据对,将预测问题转化为有监督学习问题,研究多步预测过程中模型性能的变化,實现端到端的轨迹预测。仿真结果表明,该方法能够从历史轨迹数据中提取更多的轨迹特征,在多步轨迹预测中具有明显的优势。与KFTP和HMMTP算法相比,EDMTP的误差增长率分别同比下降了2.18%和3.52%,取得了较好的轨迹预测效果。
关键词: 轨迹预测;LSTM;编码器-解码器;监督学习;多步预测
中图分类号:TJ761;TP181 文献标识码: A 文章编号: 1673-5048(2021)02-0049-06
0 引 言
近年来,着眼于全球范围快速精确打击、远程武装力量投送等作战意图,通过对弱约束非合作目标的轨迹数据进行分析建模,挖掘其中蕴藏的运动规律和特征趋势,研究相应的预测模型及算法,进一步完成轨迹预测,满足精确打击和打赢未来局部战争的军事需求,为打赢未来局部战争方案设计与关键技术攻关提供技术支持,为作战筹划和态势感知提供理论支撑。弱约束非合作目标通常是指无固定路径约束或路径约束很弱的非合作方移动目标。如临海巡航的航母战斗群、失效或故障的航天器、高机动的坦克装甲车等,其具有运动方向随机性强、移动自由度大、运动规律多样、轨迹特征不明显等特点,且轨迹数据一般为自身所有,共享程度较低,获取手段单一,通常依靠天基平台上的各类电子侦察卫星、雷达和地面基站等设备多维联合定位跟踪观测。对该类目标的轨迹数据进行分析及预测成为各军事大国当前亟需研究解决的难题。
轨迹预测是指对历史轨迹进行全面剖析和映射,挖掘各个位置之间隐藏的时空信息和语义特征,然后基于一定的预测模型,推断出下一时刻或多个时刻的位置信息[1]。传统的轨迹预测主要有基于运动模型的轨迹预测和基于统计分析和概率计算的轨迹预测。基于运动模型的常用思路是卡尔曼滤波(Kalman Filter,KF)[2]。如乔少杰等[3]提出了一种基于KF的动态轨迹预测算法,采用系统的状态空间模型以及观测模型,对移动对象进行连续的位置预测。Cheng等[4]提出了一种基于KF和支持向量机(SVM)算法,在中快速乒乓球的轨迹预测上取得很好效果。但该算法结构过于简单,无法分析复杂的轨迹模式,且对于长期预测表现不佳。为克服该缺陷,引入基于统计分析和概率计算的预测模型,主要包括高斯过程模型和隐马尔科夫模型(Hidden Markov Model,HMM)[5]。如高建等[6]提出基于概率分布模型的高斯混合-时间序列模型,实现车辆轨迹预测。赵晓光[7]提出一种应用哈希表实现多阶马尔科夫预测模型,解决了状态空间膨胀的问题。Kurashima等[8]在位置信息中结合用户的偏好信息,提出了基于概率行为的马尔科夫旅游线路预测模型。尽管这种模型对预测轨迹的物理过程进行显示建模,但其求解计算复杂度较高,在实际场景中算法性能受到限制。
随着深度学习的不断发展,一些深度学习模型应用于时间序列方面的研究。与传统的预测模型相比,深度学习模型拥有强大的数据挖掘和特征提取能力。长短期记忆(Long Short-Term Memory,LSTM)作为一种强大的递归神经网络(Recursive Neural Network,RNN)可以维持内部的输入记忆,并且弥补了RNN在训练过程中存在的梯度消失和梯度爆炸问题,广泛应用于轨迹预测问题[9]。如季学武等[10]提出了基于LSTM网络的意图识别和轨迹预测模型,有效提高了轨迹预测的准确性。Zaroug等[11]将LSTM网络应用于下肢运动学的多个时间步轨迹,取得了不错的效果。
基于此,结合弱约束非合作目标的运动特点及轨迹特征,提出了基于LSTM的Encoder-Decoder多步轨迹预测技术(Multi-Step Trajectory Prediction Based Encoder-Decode,EDMTP),从而实现了端到端的轨迹预测。
1 问题描述
轨迹预测问题认为是通过分析移动目标的历史轨迹,挖掘隐藏的运动规律和运动模式并预测未来的轨迹信息[12]。形式上,可认为存在一组可观测输入特征I和一组可观测的输出特征O,假设I和O之间是可以预测的。设Tprev={t=t1,t2,…,tobs},对于x∈I且t∈Tprev,用xk表示在t=tk时刻观测到的特征值。同样,定义Tpost={t1,t2,…,tobs},并用yl表示对于y∈O且t∈Tpost在t=tl时刻的输出值。令X=(xk)x∈I,t∈Tprev和Y=(yl)y∈O,t∈Tpost分别表示观察到的特征的张量和对应的预测输出,通过训练非线性映射关系F,使预测输出y^=F(X)尽可能与实际值Y接近,如图1所示。
设待预测的轨迹之间存在某种上下文的语义相关性,Tr表示由n条轨迹组成的数据集:
Tr={Tr1,Tr2,…,Trn}(1)
Tri=(xti,yti) (t=t1,t2,…,tobs)(2)
式中:Tri为轨迹数据集中的第i条轨迹; (xti,yti)为第i条轨迹在t时刻轨迹数据点。设当输入特征为Tr时,输出T^r为
T^r={T^r1,T^r2,…,T^rn}(3)
T^ri=(x^ti,y^ti) (t=t1,t2,…,tobs)(4)
式中:T^ri为预测的第i条轨迹;(x^ti,y^ti)为预测的第i条轨迹在t时刻的轨迹数据点。因此,轨迹预测问题可描述为
T^ri=Fλ[(x1i,y1i),(x2i,y2i),…,(xtobsi,ytobsi)](5)
式中:F,λ分别为Tri和T^r之间的非线性映射关系和模型参数。通过优化参数λ使得输出T^ri逼近特征Tri,从而得到模型的最优参数估计值:
λ^=argminλD(Tri,T^ri)(6)
式中:D(Tri,T^ri)為某种度量方式[13],一般采用欧氏距离。由此便完成了模型的训练和参数估计过程,即可基于该映射关系进行轨迹预测。
2 基于LSTM的Encoder-Decoder多步预测技术
2.1 轨迹数据处理
轨迹是一组连续性的数据信息,具有时间延续性和空间随机性。对原始轨迹数据进行相应处理不仅可以加速模型的收敛,提高模型的预测精度,还降低训练成本和复杂性。
2.1.1 特征缩放
由于轨迹具有空间随机性,导致轨迹间的差别很大,原始轨迹特征量纲不一致可能会影响到模型预测的结果[14]。为消除轨迹特征之间的量纲影响,提高计算的稳定性,需要对原始轨迹进行特征缩放,使不同特征的度量指标之间具有可比性:
xnew=2x-(xmax+xmin)xmax-xmin (7)
ynew=2y-(ymax+ymin)ymax-ymin(8)
式中:xmax,xmin,ymax,ymin为轨迹数据的最大值和最小值。
2.1.2 数据差分
轨迹具有时间连续性,存在某种随时间增加或减少的趋势,对预测算法的精度有一定的影响。为获得稳定的训练结果,在应用预测算法前,应移除轨迹之间的趋势,考虑轨迹之间的变化情况,使轨迹趋于平坦。差分是移除趋势的一种标准方法[15],通过用t时刻的观察值(xt,yt)减去t′时刻的观察值(xt′,yt′),得到轨迹数据变化率,来移除轨迹数据的时间依赖性,得到无趋势轨迹:
xdiff=xt-xt′(9)
ydiff=yt-yt′(10)
在预测结束后,需要执行反差分操作,通过将t′时刻的观察值添加到预测值(x^diff,y^diff)中,将预测值迅速恢复到原始数据比例:
xinverted=x^diff+xt′(11)
yinverted=y^diff+yt′(12)
将1×(n+1)维的轨迹经过差分处理,得到1×n维的无趋势轨迹:
[pdiff1,…,pdiffn]=[p2-p1,…,pn+1-pn](13)
式中:pi=(xi,yi)为特征缩放后的轨迹数据;pdiffi=(xdiffi,ydiffi)为差分后的轨迹数据。
2.1.3 构造监督型数据
模型训练的目的是为了找出输入I和输出O之间的映射关系,通过将无趋势轨迹构造为输入输出的轨迹数据对,学习输入和输出之间的依赖关系,将预测问题转化为监督型学习问题[16]。如式(14)所示,将1×n的无趋势轨迹,重构为n×(t+1)的输入输出矩阵,t为构造的监督数据输入步长,矩阵左边的n×t数据作为输入特征,右边n×1作为输出特征。
0…00pdiff10…0pdiff1pdiff20…pdiff1pdiff2pdiff3…pdiffn-t+1…pdiffn-3pdiffn-2pdiffn-1pdiffn-t…pdiffn-2pdiffn-1pdiffn(14)
2.2 LSTM神经网络
LSTM网络是RNN的变体,与传统的RNN相比,具有独特的存储和遗忘功能,通过学习轨迹序列规律,提取隐藏的轨迹序列特征,既可以准确地获得轨迹序列之间的依赖关系,又克服了RNN在训练过程中出现的梯度消失、梯度爆炸和长期记忆消失问题[9]。因此,LSTM网络可以很好地处理轨迹序列问题。LSTM网络隐藏层中线性自循环的存储单元,可以长期保留梯度,并且通过三个门控制流入和流出的信息。
在t时刻LSTM网络的输入有三个,当前时刻的输入值xt,上一时刻的输出值ht-1及单元状态ct-1。输入门it,输出门ot和遗忘门ft,接收相同的输入[ht-1,xt],经过激活函数σ,用来控制单元状态ct的更新过程,基本的LSTM网络如图2所示。
门是一个全连接层,其接收一个向量作为输入,输出是0~1之间的实数向量,设W为门的权重矩阵,b是偏置项,则门可以表示为
g(x)=σ(Wx+b)(15)
采用Sigmoid作为激活函数,将输入[ht-1,xt]调整到(0,1)区间。激活函数定义为
σ(x)=11+e-x(16)
输入门it控制当前时刻的输入xt有多少保存到单元状态ct,定义为
it=σ(Wi[ht-1,xt]+bi)(17)
遗忘门ft控制上一时刻的单元状态ct-1有多少保存到当前时刻状态ct,定义为
ft=σ(Wf[ht-1,xt]+bf)(18)
输出门ot控制当前时刻状态ct有多少输出到当前输出值ht,定义为
ot=σ(Wo[ht-1,xt]+bo)(19)
根据上一时刻的输出ht-1和当前输入xt来描述当前输入的单元状态c~t,定义为
c~t=tanh(Wc[ht-1,xt]+bc)(20)
通过输入门it和遗忘门ft调整当前时刻的单元状态ct,定义为
ct=ftct-1+itc~t(21)
网络的最终输出ht由输出门ot和单元状态ct共同确定,定义为
ht=ottanh(ct)(22)
式(17)~(19)中,矩阵Wi,Wf,Wo和Wc是门权重矩阵,向量bi,bf,bo和bc是门的偏置项。
用于单元状态ct的更新,遗忘和输出其状态的信息由式(17)~(19)中的门控向量确定,单元状态和输出由式(20)~(22)更新。使用遗忘ft重置或恢复单元状态,并通过输入门it添加部分信息来获得新状态ct,同时使用输出门ot控制和更新隐藏状态ht。
2.3 基于Encoder-Decoder架构的多步轨迹预测
假设轨迹数据中所有可能的结果服从某一概率分布,则轨迹预测问题可认为是在给定历史轨迹的情况下估算未来轨迹出现的概率,即可以看作是一个条件概率问题[17]。
在给定输入序列{x1,x2,…,xT}的前提下,对输出序列{y1,y2,…,yT′}的条件概率进行建模。编码器将整个输入序列信息{x1,x2,…,xT}进行特征提取,经式(17)~(22)进行T次递归更新之后,映射为单元状态cT,则条件概率近似为
p(y1,y2,…,yT′|x1,x2,…,xT)≈
∏T′t=1p(yt|cT,y1,…,yt-1)(23)
在给定单元状态c′t-1和前t-1时刻的输出yt-1的条件下,解码器会连续求解p(yt|c′t-1,yt-1)的概率分布:
p(y1,y2,…,yT′|x1,x2,…,xT)≈∏T′t=1p(yt|c′t-1,yt-1)(24)
基于ED模型,构建如图3所示的EDMTP预测算法,采用多输入多输出的形式,通过将原始轨迹作为输入并进编码,不断调整网络参数和优化损失函数,学习输入特征和输出标签(即候选的下一个位置)之间的依赖关系,实现非合作目标的多步轨迹预测。
编码阶段通过处理长度为T的输入序列{x1,x2,…,xT},进行映射分析和特征提取,将整个轨迹信息压缩为一个固定维度的状态向量,并通过非线性变化生成包含历史轨迹特征分布的中间状态向量cT[18-19]。在t时刻,编码器的状态ht由当前输入xt以及前一时刻状态ht-1共同决定:
ht=f(ht-1,xt)(25)
状态向量cT是对编码网络所有状态的加权平均:
cT=q(h1,h2,…,hT)(26)
式中:q为加权平均函数。
编码器部分使用单层LSTM网络,在t时刻,该网络将原始轨迹数据Tri=(xti,yti)[t=t1,t2,…,tobs]作为输入,映射到状态向量cT和隐藏层状态ht,为解码器提供输入。
解码器阶段从初始输入yinit开始,接收来自编码器中间状态向量cT,并将其作为解码器的初始状态(即c′0=cT),结合当前时刻的输入数据,模型通过求解p(yt|c′t-1,yt-1),并选择概率最大的输出作为模型的预测结果,然后将该预测结果递归的馈送到网络中,并多次重复这一过程,使得状态向量转换为长度为T′的输出序列{y1,y2,…,yT′},λ为模型参数:
y^t=argmaxλpλ(yt|c′t-1,yt-1)(27)
解码器部分由LSTM和全连接层组成,该模型以编码器的输出(状态向量cT和隐藏层状态ht)以及LSTM网络每个时间步的历史轨迹数据作为输入,通过全连接层,得到未来轨迹数据的预测结果。
在多步预测过程中,LSTM展开成前馈神经网络,以当前时间点为基准,循环地获取先前的轨迹序列,并作为当前时间点的输入,通过滚动预测的原理从训练集的历史数据中获取最后一次观测值,并用其预测当前的可能取值。重復此过程,直到达到所需要的预测长度,实现多步轨迹预测,如图4所示。
3 算法设计与仿真
本文仿真实验采用MIT Trajectory Data[20]数据集完成,数据来源是卫星跟踪定位的某大型平面上移动的机动车辆,该目标在运动特征、路径约束,采集方式等均与弱约束目标类似[21],可用来检验所提出的算法性能。
采用线下训练、线上预测的方式进行训练,先利用原始轨迹数据集训练模型,再用训练好的模型进行预测分析。通过与基于KF的轨迹预测算法(KFTP)和基于HMM的轨迹预测算法(HMMTP)进行了比较分析,验证了EDMTP模型多步轨迹预测的准确性。
3.1 算法流程
将轨迹经过相应处理之后,得到无趋势的监督数据作为模型的输入,在训练过程中,由式(17)~(22)前向计算出每个神经元的输出值O^,然后反向计算每个神经元的误差项,根据误差项计算每个权重的梯度,使用RMSE作为损失函数,Adam算法作为优化算法不断对编码网络和解码网络进行参数更新。预测过程如下:
Step1:数据获取。
Step2:数据处理。根据2.1节对轨迹数据进行处理,得到无趋势的输入输出轨迹数据对。
Step3:模型构建。将n×(t+1)维的输入输出数据对的左边n×t维作为输入特征,右边n×1维作为输出特征,通过最小化预测结果与真实轨迹的误差,不断调整模型参数,优化网络结构,得到最终的预测模型。
Step4:模型验证。把测试数据输入到训练好的网络中,并将预测的轨迹数据,进行反差分、反归一化处理,得出预测结果。
Step5:性能分析。
3.2 仿真条件设置
仿真环境为CPU IntelCoreTMi9-9900K @3.60GHz,内存16 GB,GPU NVIDIA GeForce RTX 2080Ti,仿真平台为MATLAB 2018a和PyCharm Community Edition 2019.2.4,数据处理库为numpy1.18.4,pandas 1.0.3,并搭建TensorFlow1.12.0rc0,Keras2.2.4深度学习框架,编程语言使用Python3.6.10。
3.3 仿真结果及分析
轨迹预测是一个经典的回归问题,本实验使用MIT Trajectory Data数据集进行验证,该数据集包含40 453条不同长度的轨迹数据,实验中抽取每条轨迹的前85%的数据点作为训练集,后15% 的數据作为测试集,训练过程中超参数的设置如表1所示。为使实验结果更具有说服力,仿真结果取50次运行结果的平均值。
采用均方根误差(Root Mean Square Error,RMSE)来评估预测模型:
RMSE=1k∑ki=1(p^i-pi)2(28)
式中: k为预测步长; pi,p^i分别为真实值和预测值。
3.3.1 轨迹训练结果
为检验预测算法的有效性和可行性,随机抽取一条1×82的轨迹进行验证。根据2.1.1和2.1.2节处理步骤,得到1×81的无趋势轨迹。由表1可知input_step=8,根据2.1.3节数据构造方法,得到81×9的输入输出数据对,将前61×9作为训练数据,后20×9作为测试数据。预测结束后,进行相应的反差分、反归一化处理,得到步长为20的预测轨迹,即pred_step=20,对应着原始轨迹中63,64,…,82的数据点。图 5所示为实验结果及局部预测放大图。
3.3.2 算法性能比较
为了进一步比较算法性能,验证模型的准确性和可靠性,比较了EDMTP,KFTP和HMMTP模型在多个预测步长的RMSE变化情况,如表2、图 6所示。
采用误差增长率描述模型在多步预测过程中轨迹性能的变化情况:
η=Lossj-Lossipred_stepj-pred_stepi(29)
由图6可知,在短期内KFTP,HMMTP和EDMTP模型的预测结果均较为接近,其中EDMTP模型的性能略优于KFTP和HMMTP模型。随着预测步长的增加,EDMTP模型的优势变得越来越明显,对于pred_step=35的预测结果,相较于KFTP和HMMTP的误差增长率同比下降了2.18%和3.52%,EDMTP模型的预测效果明显优于KFTP和HMMTP模型。尽管这三个模型的预测误差随预测步长的增加而增加,但EDMTP模型预测误差的增加趋势明显小于KFTP和HMMTP的预测误差。因此,在多步轨迹预测中,EDMTP模型的性能优于其他模型。仿真结果表明,基于LSTM的EDMTP模型可从历史轨迹数据中提取更多的轨迹特征,从而获得更好的轨迹预测结果。
4 结 束 语
针对弱约束非合作目标,由于运动方向随机性强、移动的自由度大、运动规律多样、轨迹特征不明,导致轨迹数据特征复杂。本文提出了一种基于LSTM的Encoder-Decoder多步轨迹预测方法,主要的贡献点:(1)采用了一阶差分处理,移除了轨迹数据之间存在的趋势,弱化了轨迹数据的时间依赖问题,使轨迹趋于平坦,得到了轨迹变化率,加快了算法的执行效率;
(2)将无趋势轨迹构造为输入输出的轨迹数据对,通过学习输入和输出之间的依赖关系,将预测问题转化为监督型学习问题,提高了模型的预测精度,降低训练成本和复杂性;
(3)提出了基于编码器-解码器架构的多步预测模型,编码器网络通过分析历史轨迹的运动模式,将轨迹信息压缩为一个固定维度的状态向量,解码器网络通过对状态向量解析,并递归的将预测结果馈送到网络中,实现多步轨迹预测。
参考文献:
[1] 张显炀,刘刚,马霄龙,等. 基于变分自编码的海面舰船轨迹预测算法[J]. 计算机应用研究,2020,37(S1): 122-125.
Zhang Xianyang,Liu Gang,Ma Xiaolong,et al. Variational Auto-encoding Based for Warship Trajectory Prediction[J]. Application Research of Computers,2020,37(S1): 122-125.(in Chinese)
[2] Kalman R E. A New Approach to Linear Filtering and Prediction Problems[J]. Journal of Basic Engineering,1960,82(1): 35-45.
[3] 乔少杰,韩楠,朱新文,等. 基于卡尔曼滤波的动态轨迹预测算法[J]. 电子学报,2018,46(2): 418-423.
Qiao Shaojie,Han Nan,Zhu Xinwen,et al. A Dynamic Trajectory Prediction Algorithm Based on Kalman Filter[J]. Acta Electronica Sinica,2018,46(2): 418-423.(in Chinese)
[4] Cheng Q,Wang C L. A Method of Trajectory Prediction Based on Kalman Filtering Algorithm and Support Vector Machine Algorithm[C]∥Proceedings of the 14th Chinese Intelligent Systems Conference,2018.
[5] 孙红,陈锁. 一种聚类隐马尔可夫模型的时空轨迹预测算法[J]. 小型微型计算机系统,2019,40(3): 472-476.
Sun Hong,Chen Suo. Spatio-Temporal Trajectory Prediction Algorithm Based on Clustering Hidden Markov Model[J]. Journal of Chinese Computer Systems,2019,40(3): 472-476.(in Chinese)
[6] 高建,毛莺池,李志涛. 基于高斯混合-时间序列模型的轨迹预测[J]. 计算机应用,2019,39(8): 2261-2270.
Gao Jian,Mao Yingchi,Li Zhitao. Trajectory Prediction Based on Gauss Mixture Time Series Model[J]. Journal of Computer Applications,2019,39(8): 2261-2270.(in Chinese)
[7] 趙晓光. 基于多尺度区域划分和运动模式的车辆轨迹预测[D]. 北京: 北京邮电大学,2017.
Zhao Xiaoguang. Trajectory Prediction Based on Multi-Scale Region Division and Vehicle Mobility Pattern[D]. Beijing: Beijing University of Posts and Telecommunications,2017. (in Chinese)
[8] Kurashima T,Iwata T,Irie G,et al. Travel Route Recommendation Using Geotagged Photos[J]. Knowledge and Information Systems,2013,37(1): 37-60.
[9] Li M X,Lu F,Zhang H C,et al. Predicting Future Locations of Moving Objects with Deep Fuzzy-LSTM Networks[J]. Transportmetrica A: Transport Science,2020,16(1): 119-136.
[10] 季学武,费聪,何祥坤,等. 基于LSTM网络的驾驶意图识别及车辆轨迹预测[J]. 中国公路学报,2019,32(6): 34-42.
Ji Xuewu,Fei Cong,He Xiangkun,et al. Intention Recognition and Trajectory Prediction for Vehicles Using LSTM Network[J]. China Journal of Highway and Transport,2019,32(6): 34-42.(in Chinese)
[11] Zaroug A,Lai D T H,Mudie K,et al. Lower Limb Kinematics Trajectory Prediction Using Long Short-Term Memory Neural Networks[J]. Frontiers in Bioengineering and Biotechnology,2020,8: 362.
[12] 张显炀,朱晓宇,林浩申,等. 基于混合高斯-变分自编码的轨迹预测算法[J/OL]. 计算机工程,2020. DOI: 10.19678/j.issn.1000-3428.0055074.
Zhang Xianyang,Zhu Xiaoyu,Lin Haoshen,et al.Gauss Mixture-variational Autoencoding Based for Trajectory Prediction[J/OL].Computer Engineering,2020. DOI: 10.19678/j.issn.1000-3428.0055074.(in Chinese)
[13] Núez J A,Cincotta P M,Wachlin F C. Information Entropy[J]. Celestial Mechanics & Dynamical Astronomy,1996.
[14] 郝晓静,李国新,李明珠,等. 无迹卡尔曼滤波算法在目标跟踪中的研究[J]. 电子设计工程,2012,20(13): 161-164.
Hao Xiaojing,Li Guoxin,Li Mingzhu,et al. Research of UKF in the Target Tracking[J]. Electronic Design Engineering,2012,20(13): 161-164.(in Chinese)
[15] 李明锁,井亮,邹杰,等. 结合扩展卡尔曼滤波的CamShift移动目标跟踪算法[J]. 电光与控制,2011,18(4): 1-5.
Li Mingsuo,Jing Liang,Zou Jie,et al. CamShift Algorithm Combined with Extended Kalman Filter for Moving Target Tracking[J]. Electronics Optics & Control,2011,18(4): 1-5.(in Chinese)
[16] Liu C Y,Shui P L,Li S. Unscented Extended Kalman Filter for Target Tracking[J]. Journal of Systems Engineering and Electro-nics,2011,22(2): 188-192.
[17] Lü P Y,Chen N,Mao S J,et al. LSTM Based Encoder-Decoder for Short-Term Predictions of Gas Concentration Using Multi-Sensor Fusion[J]. Process Safety and Environmental Protection,2020,137: 93-105.
[18] 孙晓骞,苏依拉,赵亚平,等. 基于编码器-解码器重构框架的蒙汉神经机器翻译[J]. 计算机应用与软件,2020,37(4): 150-155.
Sun Xiaoqian,Su Yila,Zhao Yaping,et al. Mongolian-Chinese Neural Machine Translation Based on Encoder-Decoder Reconstruction Framework[J]. Computer Applications and Software,2020,37(4): 150-155.(in Chinese)
[19] 张金超,艾山·吾买尔,买合木提·买买提,等. 基于多编码器多解码器的大规模维汉神经网络机器翻译模型[J]. 中文信息学报,2018,32(9): 20-27.
Zhang Jinchao,Aishan Wumaier,Maihemuti Maimaiti,et al. A Large-Scale Uyghur-Chinese Neural Machine Translation Model Based on Multiple Encoders and Decoders[J]. Journal of Chinese Information Processing,2018,32(9): 20-27.(in Chinese)
[20] Grimson E,Wang X,Ng G W,et al. Trajectory Analysis and Semantic Region Modeling Using a Nonparametric Bayesian Model[C]∥ IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2008.
[21] Wang X G,Ma K T,Ng G W,et al. Trajectory Analysis and Semantic Region Modeling Using Nonparametric Hierarchical Baye-sian Models[J]. International Journal of Computer Vision,2011,95(3): 287-312.
Encoder-Decoder Multi-Step Trajectory
Prediction Technology Based on LSTM
Li Qingyong,He Bing*,Zhang Xianyang,Zhu Xiaoyu,Liu Gang
(Rocket Force University of Engineering,Xian 710025,China)
Abstract:
Aiming at the trajectory and motion characteristics of weakly constrained non-cooperative targets,a LSTM-based encoder-decoder multi-step trajectory prediction technology (EDMTP) is proposed. The introduction of first-order difference processing reduces the time dependence of the trajectory data,and obtains a trendless trajectory. Constructing an input and output trajectory data pair,transforming the prediction problem into a supervised learning problem,the change of model performance in the multi-step prediction process is studied to realize end-to-end trajectory prediction. Simulation results show that this method can extract more trajectory features from historical trajectory data,and has obvious advantages in multi-step trajectory prediction. Compared with the trajectory prediction algorithms of KFTP and HMMTP,the error growth rate of EDMTP decrease by 2.18% and 3.52% year-on-year,respectively,and achieves better trajectory prediction results.
Key words: trajectory prediction;LSTM;Encoder-Decoder;supervised learning;multi-step prediction
收稿日期:2020-08-13
基金項目:国家自然科学基金青年科学基金项目(61403399)
作者简介: 李青勇(1995-),男,甘肃白银人,硕士,研究方向为轨迹分析、轨迹预测。
通讯作者:何兵(1983-),男,陕西西安人,副教授,博士,研究方向为人工智能、数据分析、导航制导与控制。