融合一维卷积神经网络和双向门控循环单元的APM车辆轮胎径向载荷识别方法

2023-02-20曾俊玮季元进任利惠葛方顺孙泽良黄章行

中国机械工程 2023年3期

曾俊玮季元进任利惠葛方顺孙泽良黄章行

同济大学铁道与城市轨道交通研究院，上海，201804

0 引言

轮胎载荷是车辆设计、安全性评估的基础数据，是车辆研发所必须知道的边界条件。测量轮胎载荷是进一步优化车辆设计、提高车辆机械强度和运行性能所必需的基础工作。车辆系统的状态检测对行车安全起着至关重要的作用，轮胎动态载荷作为车辆与道路相互作用的直接结果，是数据监测的重点。特别是在曲线工况行车的情况下，左右侧走行轮出现增载与减载现象，严重时可能导致车轮倾覆，轮胎动态载荷对行车安全性的影响进一步加大。其中，对车辆行车安全性和平稳性影响最大的轮胎动态载荷主要为径向载荷，其频率范围大致在0～40 Hz。

轮胎载荷的监测方法包括直接测量法与间接识别法。直接测量法原理简单，但具有很大的局限性：由于轮胎-路面之间的高速相对运动及各个方向载荷的相互影响，运行状态下的激励载荷通常难以测量，且车辆系统结构设计大多没有考虑传感器的安装位置，传感器的引入往往会阻碍系统的正常运行甚至改变原有结构的固有特性。如今常用的车轮六分力计[1]可实现车轮所受六分力的实时动态同步精密测量，但需要根据车轮轮毂定制生产，成本极高，不易推广。

国内外很多学者也提出了一些间接的载荷求解方法。LAW等[2]通过时域算法利用桥梁弯矩和振动加速度辨识出列车以恒速通过桥梁时的垂向移动载荷，并利用最优状态估计方法在频域建立了移动载荷识别模型，识别出移动载荷功率谱，再通过逆傅立叶变换求得移动载荷的时程曲线，形成了移动载荷识别系统[3]，该系统在实际工程应用中具有一定的精度和稳定性，但仍然存在许多不足之处。YU等[4]利用时-频域辨识法由响应识别移动载荷，并重点比较了伪逆解法和奇异值解法的识别结果，讨论了载荷间距与移动速度以及测量噪声等参数对载荷识别结果的影响。XIA等[5]提出了铁路货车轮轨接触力的反演模型，利用货车车体动态响应数据反演出轮轨接触力，但由于悬挂装置的隔离作用，轮轨接触力的高频分量不能很好地被预测。BAFFET等[6]提出了一种考虑道路摩擦变化的自适应轮胎力模型，将车辆模型和轮胎力模型相结合，构造了自适应观测器，用以计算轮胎侧向力、车辆侧滑角和路面摩擦力。DAKHLALLAH等[7]提出了利用扩展卡尔曼滤波器来估计车辆动态状态和轮胎-路面力的方法，并使用摩擦模型根据估计的纵向和横向力来评估摩擦因数和侧滑角。上述方法均基于物理模型，在建模时对一些复杂的非线性系统进行简化，从而造成识别精度降低，识别效果不佳，且识别条件较为苛刻，难以真正应用于工程实践。

近年来，随着计算机水平的提高以及车辆系统感知能力的增强，基于数据驱动的载荷识别模型被越来越多的学者研究。LI等[8]提出一种基于径向基函数网络的连续测量轮轨接触力的方法，为载荷识别提供了新的思路，但受限于径向基神经网络的性能，该模型未能达到较好的结果。张冉佳[9]将BP神经网络应用于轮轨载荷的识别上，并用遗传算法对模型进行优化，完成载荷的识别，但误差较大。罗金屯等[10]建立了卷积神经网络模型来对轮轨力进行反演，对轮轴横向力反演结果进行对比分析，发现该模型在直线和曲线轨道行车条件下均能有效拟合趋势变化和数据指标。目前相关研究多为简单的神经网络模型的应用，识别精度仍有很大提升空间，且研究对象大多为既定的数据集，缺乏对不同质量数据适用性的考量，模型应对噪声情况较为恶劣的数据时，其预测效果不佳，缺乏一定的现实应用意义。

本文提出一种基于一维卷积神经网络和双向门控循环单元混合的神经网络的载荷识别方法。卷积神经网络(convolutional neural networks,CNN) 可以有效地提取信号的多维度空间特征；门控循环单元(gate recurrent unit,GRU)作为循环神经网络的变体，在处理时序数据时性能表现优异；而双向门控循环单元(bi-directional gated recurrent unit,BiGRU)可双向捕获特征，能更好地提取时序数据隐含信息，两者的结合大大增强了对多维度时序数据的空间、时序特征提取能力。该方法充分考虑轮胎径向载荷数据的先验信息，以车辆振动响应、车体位姿、运行状态等信息构建的特征集作为输入，利用1D CNN提取特征在高维空间的联系形成高维预测特征向量，再输入BiGRU中提取时序特征，最终输出载荷预测的结果。以APM300型车辆为例，采用该方法建立其走行轮和导向轮径向力的预测模型。

1 基本原理

1.1 一维卷积神经网络1D CNN

卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，主要由输入层、卷积层、池化层、全连接层和输出层构成。对单维时序信号的处理常采用1D CNN，其基本架构如图1所示，整个网络共计l层。对于输入的时间序列x=[x1x2…xn]T，首先通过卷积层进行特征提取。不同的一维卷积核通过对局部区域卷积可提取出不同的特征信号。第i层的输出结果xi可由上一层的输出xi-1得到：

图1 1D CNN基本架构

xi=fi(wi⊗xi-1+bi)

(1)

其中，wi为第i层权值矩阵；bi为第i层偏置矩阵；fi为第i层激活函数。本文卷积层及全连接层的激活函数均选用LeakyReLU函数，其形式如下：

(2)

LeakyReLU函数在继承ReLU函数优点的同时，解决了ReLU的局部神经元死亡问题，在负区域具有小的正斜率，因此，即使对于负输入值，它也可以进行反向传播。

随后将卷积层提取的特征信号输入池化层。池化运算用于选择卷积层序列最重要的特征并实现特征降维，简化网络计算复杂度。本文的池化运算选取最大值池化。根据实际需要设计多层卷积层与池化层，将最后一层池化层的输出作为输入传递给全连接层。全连接层最终输出结果为

y=fl(wl⊗xl-1+bl)

(3)

式中，wl为第l层权值矩阵；bl为第l层偏置矩阵；fl为第l层激活函数。

将输出层结果与实际值的误差反向传递，计算误差梯度并更新权值及阈值，直至误差满足条件，完成训练。表征均方误差的损失函数如下：

(4)

1.2 双向门控循环单元BiGRU

门控循环单元是循环神经网络(recurrent neural network, RNN)的一种。循环神经网络具有记忆能力，能够有效保存历史信息，是专门用以处理序列信息的具有时间依赖的网络。长短期记忆网络(long short-term memory,LSTM)是一种特殊的RNN，通过门控机制使循环神经网络记忆历史信息并选择性忘记一些不重要信息，且能够保留长期依赖的信息。GRU是LSTM的一种变体，参数相对少更容易收敛，训练效率高，能降低过拟合的风险，可有效解决RNN梯度消失的问题，适合构建较大的网络。

GRU引用重置门(reset gate)与更新门(update gate)的门控机制来控制梯度信息传播，缓解梯度消失现象，其结构如图2所示。重置门与更新门分别用于捕捉时间序列里短期的依赖关系和长期的依赖关系，当前时间步输入xt和上一时间步的隐藏状态ht-1作为重置门与更新门的输入，经由激活函数为sigmoid的全连接层计算得到输出。

图2 GRU结构原理图

重置门输出rt为

rt=σ(wr⊗[ht-1,xt]+br)

(5)

更新门输出zt为

zt=σ(wz⊗[ht-1,xt]+bz)

(6)

(7)

式中，wr、wz、wh为权值矩阵;br、bz、bh为偏差矩阵。

ht-1包含时间序列从前端某时刻至上一时间步的全部历史信息，由式(7)可知，重置门的输出rt控制了上一时间步的隐藏状态ht-1到当前时间步的传递，因此，重置门可以用来丢弃无意义的历史信息。

(8)

双向门控循环单元(BiGRU)由一个前向的GRU和一个反向的GRU网络构成，其框架如图3所示。BiGRU网络可以提取时序信号在时间顺序及时间逆序上的特征，记忆时间片段起点及终点至当前时间步的前向及反向历史信息。其隐藏状态ht由前向传播层的输出hLt与反向传播层的输出hRt计算得到：

图3 BiGRU总体框架

ht=m(wLhLt+wRhRt)

(9)

其中，wL、wR分别为hLt、hRt的权值矩阵；m为拼接函数。BiGRU充分利用了单时刻前后时段的信息，使特征提取更加全面，提高了预测的精度。

2 轮胎径向载荷识别模型

本文模型理论框架如图4所示。轨道不平顺产生的载荷激励输入至车辆系统激发相应的振动响应，结合车体位姿、运行状态等多源信息，经数据预处理，特征选择后保留有效的特征子集，作为一个样本的输入，而载荷值则作为该样本的标签。构造“多时间步输入-单时间步输出”形式的样本集，用于训练基于1D CNN和BiGRU的轮胎径向载荷识别模型。该模型联合应用一维卷积神经网络和双向门控循环单元，可充分提取信号的时间空间特征，且具有较强的抗噪能力。采用均方误差MSE、可决系数R2score等指标评判模型的识别误差及精度，并分析模型在不同运行工况下的泛化性能，应对不同噪声级别和异常程度的输入数据的鲁棒性能，不断改进，得到最终模型。

图4 模型理论框架

2.1 数据处理与特征选择

由于多源输入数据具有不同的量纲，为了提高训练效果，需将原始数据转换为量纲一指标测评值，故对数据进行归一化或标准化处理。由于车辆系统运行工况繁多且复杂，数据可能存在较多异常冲击值，而极端值会对归一化效果产生很大影响，故本文采用Z-Score标准化方法，计算公式如下：

(10)

式中，x为原始数据；μ为平均数；σ为标准差。

在车辆系统布置雷达、加速度计、位移传感器、陀螺仪等传感器，可采集多个通道的信号，每个通道的信号为样本的一种特征。由于传感器种类繁多及测点布置位置多样，每个样本的原始特征很多，为提高模型的效率和泛化性能，避免维度灾难，需对输入数据进行特征选择，去除无关特征及冗余特征。本文采用过滤法(Filter)和包裹法(Wrapper)组合式算法，先使用Filter剔除无关特征，降低特征维度；然后利用Wrapper进行特征选择，去掉冗余特征。其中，Filter采用互信息法，捕捉每个特征和标签之间的任意关系(包括线性和非线性)，进行相关性的计算，其公式为

(11)

其返回值在0～1之间，0表示完全不相关，1表示完全相关。Wrapper则是结合后续回归模型，根据评估结果进行选择，它包含4个主要过程：①候选特征子集的生成；②特征子集优度的评价；③终止条件的判定；④特征子集有效性的验证。

2.2 样本集构造与网络设计

特征选择后的多源时间序列数据构成特征集，将标准化后的m个通道的数据进行拼接、截取、滑动取样。每一时刻的载荷值作为一个样本的标签，该时刻前后共l个时间步长的振动响应、车体位姿、运行状态信息作为一个样本的特征，构造出形式为l×m个输入、1个输出的样本，如图5所示。相比单时刻输入输出对应的样本，本文的样本构造方式充分考虑了研究对象是时序信号而非普通数据的现实，以时间片段取样使得每个样本的输入充分保留了时间维度上的特征信息，由时间切段而非单个时刻的特征预测输出，可有效克服各传感器测点存在相位差、动力学系统输入输出存在时间滞后、单个时刻数据可能损坏或异常、信号含噪声过多等情况带来的识别不准问题，使模型更稳定，鲁棒性更强。

图5 样本集的构造

本文将1D CNN 和BiGRU集成并改进后应用到胶轮车辆径向载荷识别模型中，充分发挥CNN的空间特征提取能力和BiGRU的时序特征提取能力。在CNN 中加入BN 层，用来规范数据分布，增强模型泛化性能和鲁棒性能；在全连接层加入Dropout 层来随机屏蔽部分神经元输出，防止模型过拟合。采用学习率可以自适应的ADAM优化算法来训练模型，实现车辆径向载荷的识别。

以下节具体使用到的1D CNN-BiGRU模型为例，其网络结构如图6所示。单个样本的输入为14个通道100个时间步的时序数据，输出为中间时刻的载荷值。对样本的输入再次进行滑动取样，取样窗大小为10×14，步长为1，共取得按照时间顺序的91组10×14的小片段。对以上小片段经过两次卷积、最大池化操作提取数据空间特征，一维卷积核的大小为[1，1]，步长为1，两次卷积深度分别为14和128，卷积核个数分别为128和64，激活函数采用LeakyReLU；卷积和池化过程中不进行填充，最终得到64个通道的特征数据。

将91组64通道的特征数据输入至BiGRU层中，双向提取时序数据的隐含信息，BiGRU的隐含单元数设置为20。将BiGRU层的输出经Flatten层展平后输入至全连接网络，其两个隐藏层的神经元数量分别为64和8，Dropout 率设为0.2，最终输出载荷预测值。

网络训练过程中的损失函数(loss function)选用均方误差(mean square error,MSE)，其计算方式如下：

(12)

同时，采用可决系数R2score评估模型的精度，其定义如下：

(13)

在工程应用中，对轮胎载荷的识别具有实时性要求，故引入平均推理时间用以量化模型的载荷识别效率，并作为模型应用价值的考核指标之一。本文定义平均推理时间为100 Hz的采样频率下，模型对测试集每1 s的输入数据完成载荷识别的平均时间。

3 实例分析

3.1 模型预测结果及误差分析

选择庞巴迪公司生产的Innovia APM 300车型对本文方法进行验证。APM车辆也称为自动旅客捷运系统，是一种以无人驾驶胶轮车辆为主导的、在专用线路的运行道与导向轨上全自动运行的城市轨道交通系统制式。APM 300采用高压充气轮胎走行，实心橡胶轮胎导向，走行部的结构如图7a所示[11]。轮胎动态载荷对APM车辆的运行安全性和平稳性十分重要，而其中径向载荷的影响尤为重要。因此，本文主要研究对象为走行轮径向力和导向轮径向力，两者分别为走行轮-走行面及导向轮-导向轨之间的法向作用力，如图7b所示[12]。

(a)走行部结构

利用滚动试验台测得轮胎物理参数，通过标准实验测得车辆系统质量、惯量及其他悬挂的物理参数，建立车辆动力学模型，并以实际线路动力学实验对模型进行验证。利用该仿真模型在多种工况下进行实验，并构造仿真数据集。本节数据原始信噪比为6 dB，运行工况为时速20 km/h下直线工况，数据信号的采样频率为100 Hz。走行面不平顺为ISO 8608A级公路谱，导向轨不平顺为美国五级谱。

以一位车体、一位轴及左侧走行轮、左前侧导向轮为例进行研究，结合实际工程应用中的采集可行性与便捷性初步选取车辆系统的诸多状态参数特征，并采用Filter-Wrapper组合式算法进行特征选择，去除无关特征与冗余特征；最终保留车辆系统的14个易测得且有意义的状态参数特征作为预测模型的输入，如表1中x1～x14。走行轮径向力和导向轮径向力作为模型输出，如表1中Fw和Fg。在实际应用中，车体及轴桥的加速度由加速度计测得，车体-轴桥的相对位移由激光位移传感器测得，车体点头、侧滚、摇头角速度由陀螺仪测得，一系、二系悬挂转向角度由拉线位移传感器测量计算得出。

采用图6所示的1D CNN-BiGRU模型对走行轮径向力进行识别。为了验证本文方法的有效性，构建了不同的载荷预测神经网络模型作为对比模型，包含常用的ANN、LSTM、CNN等，并根据数据特点选取合适的模型参数。在训练过程中，各模型训练误差及训练精度的变化情况如图8a所示，测试误差及测试精度的变化情况如图8b所示，其中一个训练周期指所有的数据送入网络中完成一次前向计算及反向传播的过程。

(a)训练集

各模型最后一个训练周期训练集和测试集的MSE值和R2指标及测试集平均推理时间见表2。可以看出，各模型测试误差与训练误差相差不大。由于原始样本数据包含大量噪声，导致ANN与LSTM模型的误差较大，而多时间步输入的样本形式及CNN的使用，可以有效地提取时间片段上的特征信息，避免了单时刻异常数据的负面影响，起到抗噪的作用。在该噪声等级的数据环境下，本文模型最终测试集MSE值达0.0623，相比其他模型降低了31.8%～78.7%；R2值达0.9002，相比其他模型提高5.4%～69.4%；平均推理时间为17.40 ms，略长于其他模型，但绝对值仍保持在很低的水平，具有很高的效率和实时性，满足工程需求。上述结果证明了本文模型应对实际含噪信号时识别误差小，精度高于其他模型，实时性保持在较高水平，具有较高的工程应用价值。

表2 不同模型误差与精度对比(走行轮)

一组测试集的实际走行轮径向力与各模型预测值的对比结果如图9所示，该测试集为该工况下车辆连续运行3 s内的数据，采样频率100 Hz，共计300条样本数据。由图9可以看出本文模型对走行轮径向力的预测结果和实际值最为接近，误差最小。

图9 不同模型预测结果对比(走行轮)

信号的实质是不同频率波的叠加，信号在频域上比在时域上有着更加简单直观的特性和更加明确的物理意义，因此，大部分信号分析工作是在频域中进行的。本模型预测结果在时域上很好地贴合了真实值，但它是否具备更高的应用价值，还需通过频谱对比进行评判。不同模型预测结果的频谱与真实值频谱的对比如图10所示，可以看出本文模型预测值的频谱和真实值频谱最为接近，很好地还原了原载荷信号的频域特性。

图10 不同模型预测结果的频谱对比(走行轮)

同理，将本文模型应用于导向轮径向力的识别中。训练过程中各模型训练集和测试集误差及精度的变化情况如图11所示。

(a)训练集

各模型最后一个训练周期训练集和测试集的MSE值和R2指标及测试集平均推理时间见表3。可知，各模型测试误差与训练误差相差不大。在导向轮径向力的识别上，本文模型最终测试集MSE值达0.1012，相比其他模型降低47.8%～70.1%；R2值达0.8088，相比其他模型提高27.5%～124.8%；平均推理时间为17.25 ms，略长于其他模型，但仍具有较强的实时性。相比走行轮径向力，导向轮径向力的预测精度较低，但仍处于较高水平，优于其他对比模型。

表3 不同模型误差与精度对比(导向轮)

一组测试集的实际导向轮径向力与各模型预测值的对比结果如图12所示，可以看出本文模型对导向轮径向力的预测结果和实际值最为接近，误差最小。

图12 不同模型预测结果对比(导向轮)

上述测试集各模型预测值与真实值的频谱对比结果如图13所示，可知本文模型预测值的频谱和真实值频谱最为接近，很好地还原了原载荷信号的频域特性。

图13 不同模型预测结果的频谱对比(导向轮)

3.2 模型泛化性能评估

设置运行速度20 km/h、30 km/h、40 km/h下的直线线路及曲率半径300 m、200 m、100 m的曲线线路共12种工况，以走行轮为例，在同样的噪声环境及轨道不平顺激励下本文模型在上述12种工况下连续2 s内的载荷识别效果如图14所示。图中R为曲率半径，v为车速。

(a)直线 (b)R=300 m (c)R=200 m (d)R=100 m

不同工况测试集的MSE值和R2值见表4。可知，本文模型在不同运行速度及不同半径的曲线工况下R2值均达到0.9以上，MSE值均在0.1以下，识别精度较高，适用于不同工况，具有很强的泛化能力。

表4 不同工况的识别误差与精度

3.3 模型鲁棒性能评估

在车辆系统实际运行中，各传感器采集的信号必然存在噪声，尤其当路况不好时，信号中噪声成分很大，这可能导致原本理想环境下预测效果很好的载荷识别模型在实际应用中效果很差。因此，所建立的载荷识别模型必须具有对不同程度的噪声的抗干扰能力，即具备较好的鲁棒性能，方能具有较大的工程应用价值和现实意义。

当原始输入数据依次为1 dB至1000 dB信噪比的含噪信号时，各模型的MSE值如图15a所示，R2值如图15b所示。可知，当信噪比在100 dB以上时，4种模型均呈现出极好的识别效果，MSE值均在0.06以下，R2值均超过0.92，此时各模型效果差别很小。当噪声程度加大，信噪比小于100 dB时，ANN和LSTM模型的识别效果迅速下降，最终降至很低的水平；而CNN和本文模型1D CNN-BiGRU也有所下降，但降幅很小，仍一直保持着较高水平的识别精度。当信噪比达到1 dB时，4种模型的R2值依次为0.1873、0.1902、0.7013和0.7759。由此可见，本文模型具有优异的鲁棒性，能很好地适用于恶劣噪声环境下的载荷识别。