面向毫米波雷达路侧交通监测的时变滤波器参数估计模型
2022-02-14王彦平申文杰
李 洋 王 铜 王彦平 林 赟 申文杰
(北方工业大学信息学院雷达监测技术实验室,北京 100144)
1 引言
毫米波雷达能够实时感知车辆及行人的位置及运动状态,在智慧城市建设及自动驾驶辅助应用领域是主要传感器之一。交通场景中运动目标种类不确定、杂波干扰、背景杂乱等因素限制多目标跟踪效果。根据交通状况与监测环境可以分为几种特定的交通场景,根据雷达监测的目标数量可划分为交通拥堵、交通流畅、行人与非机动车较多等场景。目前,多假设跟踪(Multiple Hypothesis Tracking,MHT)[1]与联合概率数据关联滤波(Joint Probabilistic Data Association Filter,JPDAF)[2]是两种常用的多目标跟踪算法,适用于航空领域即跟踪目标数量较少且目标运动方式简单的情况。当目标类别增多,场景复杂时,参数无法及时调优会导致跟踪性能下降。目前多目标跟踪算法的研究热点为基于随机有限集(Random Finite Set,RFS)[3]。Ba-N,Vo 和Ba-T,Vo 提出了带标签的随机有限集及其贝叶斯滤波过程,并且提出delta泛化后的带标签多伯努利滤波(δ-Generalized Labeled Multi-Bernoulli filter,δ-GLMB)[4]。该算法跟踪性能依赖参数设定,滤波器参数与交通环境限制多目标跟踪性能。因此,滤波器在时变交通场景下不能及时匹配到合适参数,从而导致滤波器的跟踪性能下降。本文将引入神经网络,根据场景对滤波器的参数进行估计,使滤波器在不同场景下可以及时匹配到参数。
利用实测雷达数据有效估计出滤波器参数是一个关键理论问题。目前,常用的参数估计方法是基于数理统计理论,例如矩估计方法、数值优化方法和最大似然估计方法[5],其不足在于每一次的估计都需要大量样本,并且估计所需时间较长,在时变交通监测场景中,雷达每帧产生的样本数量有限,所以不适用于滤波器实时估计。并且本文将对滤波器多个参数进行估计,以保证较好的目标跟踪性能,在使用统计优化方法估计较多参数时,容易陷入局部最优解,使滤波器跟踪性能下降。
为解决上述非实时性与局限性问题,本文考虑使用神经网络模型对滤波器参数进行估计。目前,神经网络广泛应用在各个领域。常用的神经网络包括卷积神经网络(Convolutional Neural Networks,CNN)[6]、循环神经网络(Recurrent Neural Networks,RNNs)[7]和生成对抗网络(Generative Adversarial Networks,GAN)等。时变交通监测中,对目标每帧的位置坐标与方向速度进行采集,构成训练数据集,将每帧的坐标与速度数据作为神经网络的输入,由于每帧中的坐标与速度信息相关联,可以将参数估计问题抽象为复杂的时间序列预测问题。对于序列模型,RNN 神经网络具有长时记忆功能,在这种想法下通过搭建合理的RNN 神经网络结构并进行训练,使神经网络可以通过训练学习实现对多参数估计,并利用实测雷达数据进行其效果验证。
实际交通场景监测中,目标运动模型是未知的,目标的数量、速度变化和位置变化为非线性,预测目标下一时刻运动状态时,滤波器参数可能已不匹配当前的交通场景。本文将用神经网络对滤波器的检测概率、新生概率和存活概率3 个参数进行估计。数据采集方面,在同一地点不同时间采集雷达数据,采集包括道路拥堵、目标数量多、行人与自行车较多等场景。使用GLMB算法实现了多目标跟踪,并对滤波器参数进行人工调优,将调优的参数作为真值,滤波器参数研究表明:检测概率参数会影响滤波器对目标与杂波判别,当杂波过多时需要对其调整;新生概率参数决定滤波器对新目标的识别性能,参数过大或过小会导致滤波器误检、漏检目标;存活概率参数决定每帧中目标的存活状态,参数过低会导致目标中途消失。意味着当交通场景差异时,滤波器参数需要做出自适应调整。针对上述问题,本文提出神经网络参数估计方法,使用多种场景的雷达数据训练神经网络,在训练网络前,对雷达数据进行降维与归一化处理,能够更好的训练神经网络,使其能够将特殊交通场景与滤波器参数相匹配,估计出滤波器当前交通场景下的参数。
本文结构安排为:第一部分介绍目标跟踪滤波器参数选择,第二部分介绍了毫米波雷达路侧交通监测的时变滤波器参数模型与LSTM 神经网络模型,第三部分介绍了使用LSTM 神经网络对滤波器多参数估计,第四部分为实验结果和分析,第五部分为总结与展望。
2 模型建立
2.1 毫米波雷达路侧交通监测的时变滤波器参数模型
基于随机有限集的GLMB 滤波算法模型中,目标检测概率参数为pD(x,l),目标未被检测到的概率为qD(x,l)=1-pD(x,l),算法定义如下:
其中L(X)是X的标签集合,Δ(X)表示X中各元素互异,每对(I,ξ)表示一种关联假设,ω(I,ξ)是相应的权重。
在目标跟踪过程中,若量测z未与任何现有目标产生关联,那么z则可能为新生目标的量测,定义量测关联函数判断此时刻量测是否关联:
当Φk(z)=1,量测z关联,不会产生新生目标;当Φk(z)=0时,量测z与目标无关联,可能有新生目标产生。通过式(2)确定量测z没有关联时,则有可能产生新生目标。φk(z)=1-P<λ>×表示新生目标产生的概率。Ntrue为上一时刻预测的目标数,N为当前的量测总数,P<λ>为泊松分布。最终的新生概率可以表示为:
目标的存活概率为:
式(4)中,λB,k+1|k为新生目标数的期望;rB,max∈[0,1],为新生目标存在概率的最大值。
用GLMB 算法实现了多目标跟踪,如图1~图3所示,每个跟踪目标对应一种颜色标记,并对滤波器参数进行人工调优,将调优的参数作为真值,调整上述参数过程中,跟踪实验出现的轨迹会出现以下三种问题:①由被检测概率参数设置导致的问题:该参数设置过高导致将杂波误检为目标点,参数设置过低导致漏检原有目标点,将原有目标点视为新目标从而生成新的点迹,如图1 所示,在80 帧附近时,滤波器将杂波检测为目标;
②由新生概率参数设置导致的问题:该参数设置过高将导致下一时刻检测的目标与现有目标无关联,视为新生目标,如图2 所示,在原有航迹附近出现许多点,即新生目标;
③由目标存活概率参数设置导致的问题:该参数设置较低将导致检测目标在中途某一时刻消失,造成航迹间断,如图3 所示,航迹间不连续,出现间断现象。
情形①的出现主要由于环境杂波影响,若环境中杂波发生变化,需对检测概率参数进行调整,因为下一时刻的变化未知,人为对其调整较困难。情形②出现在目标数量变化时,导致目标独立的跟踪轨迹变得难保持最终轨迹合并或错乱,需对出生概率参数进行适当调节,由于目标数量多变且速度快,对参数做出及时调整困难。情形③出现在目标被遮挡或某一帧未检测到时,视为该目标消失,若下一时刻再次检测到该目标,滤波器会将其视为新目标,给予新的标签(图中轨迹颜色发生变化),因此对存活概率参数进行适当调节至关重要。针对上述问题,本文提出LSTM神经网络估计滤波器参数的方法,训练LSTM神经网络,使其可以学习到交通场景与滤波器参数之间的关系,可以对交通场景与参数进行匹配。
2.2 LSTM 神经网络模型
在传统神经网络中,模型仅处理当前时间点信息,而不关心是否可以在下一时刻使用前一时刻处理的信息。但是,与传统的神经网络不同,循环神经网络具有一个指向自身的环,以表示其可以将当前时刻处理的信息传递给下一时刻使用。
图4 为循环神经网络结构,可以将其视为相同的神经网络进行多重复制,并且每一时刻的神经网络会将信息传递给下一时刻。
长短期记忆神经网络(Long Short Term Memory network,LSTM)[8]是RNNs 的一种特殊类型,其解决长时依赖问题方面效果突出,但它的重复模块较RNNs 更复杂,它有四层结构。LSTM 的记忆块,主要包含三个门(遗忘门、输入门、输出门)还有一个记忆单元(cell)。
图5中的ct-1即为记忆单元,输入(xt,ht-1)到输出ht的线被称为单元状态(cell state),它可以控制信息传递给下一时刻。ft,it,ot,分别为遗忘门、输入门、输出门,用sigmoid层表示。
对遗忘门ft输出进行更新:
式(5)中,σ为sigmoid 激活函数,Wf是遗忘门的权重矩阵,[ht-1,xt]为输入的数据,bf为偏置项。
t时刻输入门it更新为:
式(6)中Wi为输入门权重矩阵,bi为偏执项。
t时刻生成候选值为:
式(7)中WC为权重矩阵,bC偏置。
t时刻单元状态Ct更新为:
式(8)中Ct-1为长期单元状态,将第一时刻到当前时刻的相关信息保存起来。
T时刻更新输出门ot为:
式(9)中Wo是输出门的权重矩阵,bo为偏置。
最后一步LSTM神经网络t时刻输出值为:
2.3 GLMB-LSTM 参数估计模型
本文所使用的数据使用毫米波雷达在实际道路上采集,由于道路状况处于变化状态,毫米波雷达监测到的目标数量、目标位置与目标速度都会产生变化,导致跟踪效果变差,因此,采用目标数量、目标位置坐标以及目标速度作为滤波器参数的影响要素,构建预测模型。所以本文数据样本包含目标数量、目标方向速度、目标位置坐标以及人为调整的参数。以目标数量、目标方向速度、目标位置坐标为样本的输入;人为调整的参数信息作为样本的输出。使神经网络可以训练学习出道路状况与特殊数据之间的关系从而对参数进行估计。雷达数据中,每帧的目标数量为6个以内,每个目标共有4 个特征,所以将雷达数据特征设定为24 维,对数据进行预处理,构建一个24 维数据特征与3 维人为调优的参数特征组成的数据集。
在模型训练过程中,为了避免模型训练时学习效率低,训练效果偏差,应选择适当的优化器以及训练方法提升训练效率,以保证最终预测准确度。训练方法方面,本文采用小批量(Mini-Batch)方法。优化器方面,本文将使用自适应性矩估计(Adaptive Moment Estimation,Adam)优化器对模型进行训练,其优点在于优化过程中对学习率进行更新,可以使LSTM模型较快实现收敛。
为了防止模型找不到规律,本文采用降维方法,将雷达数据降维,用较低维度表示高维特征。构建一个3 维输入与输出型的LSTM 神经网络[9]进行训练。神经网络初始学习率设置为0.0025,在500 次训练后通过乘以因子0.2 来降低学习率以保证学习过程平稳。为了防止梯度爆炸,将梯度阈值设置为1。将训练执行环境设置为GPU以增加神经网络的训练效率。
将数据集前90%作为训练集,后10%的数据作为验证集,对LSTM 神经网络训练效果进行评估。
3 基于LSTM 神经网络的雷达数据滤波器多参数估计
采用LSTM 神经网络,将雷达数据作为输入数据,训练LSTM 神经网络,对GLMB 滤波器参数进行估计。将输出的参数代入滤波器模型中,根据目标跟踪效果调整权重,再将雷达数据输入神经网络进行训练,直到参数可以与交通场景匹配。其流程图如图6所示。
1)采集必要的训练数据以构建数据集,对LSTM 神经网络进行训练,同时构建相同格式的测试数据对训练后的神经网络进行测试。
2)采集的训练数据与测试数据数据预处理,将雷达数据的高维特征进行降维,并且将数据进行归一化,使数据更容易训练,使神经网络的训练时间与效率得到提高。否则,特征矩阵过大,导致计算量较大,且神经网络拟合度效果下降。
3)训练LSTM 神经网络,将预处理后的数据输入网络进行训练。得到训练完成的LSTM 神经网络模型。
4)当LSTM 神经网络训练完成后,对其进行测试,将测试数据输入到网络中,神经网络将对参数进行估计,采用均方根误差进行评估,均方根误差公式为:
式(11)中:m为数据的总数;yi为观测值为预测值。
4 实验及结果分析
4.1 实验设备与数据采集
对一条道路数据采集使用的实验设备为毫米波雷达,如图7 所示。在某个时间段对道路进行观测,毫米波雷达采样频率范围为11~14Hz。
实验选定3 个时间点进行数据采集,分别为Time1、Time2、Time3,并且为了保证有交通拥堵、目标数量多、行人与自行车较多的场景,选定的时间包含车流量集中时段,人流量较多时段与车辆较少时段如图8所示。
实验期间,每个时间点采集350帧左右,设备位置保持不变。
对道路上目标的位置坐标、方向速度以及目标数量进行采集。经过一轮数据采集,获得1120帧观测值,并对所有数据进行预处理、数据筛选、降维以及归一化,保证数据可以成功输入神经网络进行训练。
表1 测试时间点Tab.1 Test time point
4.2 数据预处理
雷达数据格式为数值形式,其每帧跟踪目标位置数据有一定关联,但每帧跟踪的目标会出现差异,且采集数据中可能包含低质量的样本(如杂波或跟踪目标被遮挡),直接用原始数据集对神经网络进行训练的效果不理想。为了提高神经网络的拟合效果与参数估计的准确度,本文将采用主成分分析(Principal Component Analysis,PCA)[10]与归一化的方法处理雷达数据。主要原因是:雷达特征数据为高维数据,高维空间样本具有稀疏性,导致模型难找到数据特征,且过多的特征会妨碍模型查到规律。PCA 降维通过某种线性投影,将雷达中的高维数据映射到低维的空间中表示,即把原先的n个特征用数目更少的m个特征取代,新特征是旧特征的线形组合,尽量使新的m个特征互不相关。不仅使用较少的数据维度,而且可以同时保留住较多的原数据的特性。本文中将24 维的雷达数据信息进行PCA 降维,如表2 所示,降维后的RMSE 比数据预处理前明显减少。
表2 PCA处理前后均方根误差对比Tab.2 Comparison of root mean square error before and after PCA processing
将降维的雷达数据进行归一化,使数据按比例缩放,统一映射到[0,1]区间上。本文使用的是min-max 标准化(Min-Max Normalization),也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0,1]之间。转换函数如下:
式(12)中max 为样本数据的最大值,min 为样本数据的最小值。把雷达数据映射到0~1 范围之内处理,更加便捷快速,从而提升模型的收敛速度还可以提升模型的精度。
4.3 实验结果及分析
为了验证本文使用神经网络对滤波器参数进行估计,将使用道路上采集的数据进行实验。训练和测试数据按照9:1 的比例进行划分,将进行2000次迭代。首先将时间点Time1、Time2 和Time3 的数据分别作为测试组进行实验。实验结果如图9~图11所示。
图9 为Time1 时间点参数估计结果,即拥堵场景。蓝色实线表示为当前场景下人为调优的参数值,红色星型代表每帧LSTM 神经网络输出参数估计结果。可以看出在拥堵场景下,输出参数与设定值接近,证明神经网络可以将滤波器参数与实际交通场景相匹配;图10 为Time2 时间点估计结果,即行人较多场景。行人较多时,LSTM 神经网络依旧可以准确的将当前场景与参数相匹配;图11 为Time3 时间点结果,即交通畅通场景。神经网络可以准确的将场景与参数相匹配。证明在不同的特殊场景下,LSTM 神经网络可以对滤波器参数进行准确估计。
将测试组的数据设计为Time1 和Time2 时间点数据组合,当交通场景突然发生变化时即场景有差异时,LSTM 神经网络能否通过雷达数据信息,对参数做出及时匹配,以保证目标跟踪性能。实验结果如图12所示。
图12 为LSTM 神经网络对滤波器3 个参数的估计结果,在测试数据第59帧左右时,场景发生变化,参数也随之发生变化。可以看到,当交通场景变化时,神经网络对参数进行估计,使参数及时匹配,证明LSTM 神经网络能够将特殊交通场景与参数相关联,对滤波器的参数进行有效估计,有效保证滤波器的目标跟踪性能。
比较LSTM 神经网络法与最大似然估计法[11]对存活概率参数的估计值,如图13 所示,对比发现最大似然估计法并不理想,不能准确的对参数进行估计。
在60帧时,利用最大似然估计对滤波器检测概率参数、新生概率参数与存活概率参数进行估计,参数估计如表3所示。
表3 神经网络与传统参数估计方法对比Tab.3 Comparison of neural network and traditional parameter estimation methods
由表3 可见,在交通场景发生变化时,即60 帧时,通过最大似然估计法获得的滤波器参数不能很好的及时做出调整,与LSTM 神经网络相比,无法做到滤波器参数与交通场景相匹配,且LSTM 神经网络估计的参数值更接近人为调优值。
5 结论
针对毫米波雷达路侧交通监测时,特殊场景差异导致滤波器参数不能及时调整,使目标跟踪性能降低的问题,本文提出LSTM 神经网络估计滤波器参数的方法。利用毫米波雷达采集的数据训练LSTM 神经网络,使其能够将场景与参数匹配,并能够根据特殊场景差异对参数进行调优。使用实际道路数据对模型进行了验证。在不同场景中,LSTM 神经网络可以输出对应的滤波器参数,并且根据雷达数据,可以判别场景差异,实时对滤波器参数进行调整。实验结果表明,本文提出的LSTM神经网络估计参数模型能够很好地保证在时变交通场景下滤波器参数及时有效调整,防止滤波器目标跟踪性能降低。但本文提出的模型在参数估计时会有短时间的延迟,训练时迭代次数也较多,未来将进一步进行研究,且此模型目前估计参数精度不高,未来将提高参数估计的精度。