APP下载

基于LSTM网络的路面不平度辨识方法*

2021-05-12梁冠群危银涛

汽车工程 2021年4期
关键词:平度鲁棒性悬架

梁冠群,赵 通,王 岩,危银涛

(清华大学车辆与运载学院,汽车安全与节能国家重点实验室,北京 100084)

前言

路面不平度对于车辆的行驶安全和驾乘舒适性均有很大影响,掌握路面不平度信息对于车辆动力学控制尤其是悬架控制具有重要意义。在悬架控制中,需要满足乘坐舒适性和行驶安全性的双重要求,而不同不平度等级的路面下无法利用同一套控制参数实现最优的控制效果。因此路面不平度等级信息可以为控制算法的参数调节提供直接有效的依据[1]。

现有的车载道路辨识策略整体可分为直接和间接两种方式。直接辨识的方式通过对道路表面进行感知测量来实现,它通常需要借助专用的传感器。表面光度仪是最简单、便捷的测量方法,但是它需要特殊定制且成本高,无法实现大规模商用。可见光成像是一种被广泛采用的方法,手工提取道路图像的颜色、纹理和边缘特征,通过训练神经网络分类器实现道路辨识[2];还有利用包含干路、湿路、雪路和泥路图像的数据集,用深度学习中的卷积神经网络模型进行端到端的辨识[3]。但是这种深度学习方法需要巨大的计算量,并且它的性能严重依赖于训练数据量。路面点云模型法利用车载激光雷达获取路面的三维点云数据,用形态梯度计算点集的粗糙度,在复杂环境下的实车实验证实该算法能够自适应地实现道路辨识[4]。但激光雷达价格昂贵,建立点云时需要较大计算量和存储空间,可移植性也比较差。超声波法利用超声波传感器感知不同路面,提取回波信号的波形特征并输入到分类器中进行辨识[5]。这种方法需要考虑车速和声波能量在大气中的耗散对辨识精度的影响。

以上直接辨识的方法都要借助专用的传感器,这不仅提高了道路辨识的成本、降低了传感器的可扩展性,而且算法的高计算量要求导致无法实现实时辨识。目前基于悬架系统响应的间接辨识方法受到了更多研究者的关注。不同粗糙度等级的道路对行驶车辆有着不同带宽和幅度的激励,反映在悬架上即为不同的加速度响应,间接辨识方法旨在从悬架加速度响应中反向推断出道路等级。

间接辨识法亦可分为基于模型[6-8]的和数据驱动[9-16]的方法。用卡尔曼滤波的方法从仿真和实验数据中估计道路的粗糙度,这种方法需要的模型简单、计算量小,且可扩展到利用其他信息来提升估计性能[6]。用高阶滑模和非线性Lipschitz 观测器同时估计路况和胎-路摩擦力[7]。这种基于观测模型的方法可能会遇到所需状态量无法测量的问题。

数据驱动的方法可以不考虑路面激励到悬架系统响应的物理过程,利用算法模型自主地学习数据中的潜在模式。对单个悬架簧上质量的垂向加速度信号进行2 阶小波变换,分别提取时域和变换域信号的统计波形特征,然后输入到自适应神经网络模糊推理系统中进行道路等级分类[9-10]。簧下质量的加速度响应更适合用于道路辨识,因为它更易测量且能达到更高的准确率[11]。将该方法扩展,与卡尔曼滤波相结合构成自适应卡尔曼滤波器,以较高精度估计出悬架系统的状态[12]。利用滑动窗提取整车4 个悬架的簧下质量加速度信号的均方特征,用神经网络分类器进行预测,作者同时探讨了滑动窗长度和特征计算方法对准确率的影响[13]。

综合以上路面辨识技术可以发现,目前尚无低成本、可靠、精确、快速的方法用于实际的悬架主动控制。为此,本文中提出利用长短期记忆(LSTM)网络作为主体,选择车辆簧下质量加速度作为输入量进行端到端的路面不平度等级的辨识。LSTM 是循环神经网络(RNN)的一种特殊类型[17-20],它也是典型的数据驱动方法。能够学习序列数据的前后长期依赖问题,因此相比于其他深度学习方法更适合应用于加速度响应这种时间序列的分析。

1 基于LSTM网络的辨识算法

加速度信号是时序的非结构化数据,而经典的分类问题通常使用结构化数据作为输入。结构化数据由不同的特征组成,而将时序信号转换为结构化数据需要手动提取特征。常用的关键特征有最大值、最小值、平均值、方差和峭度等。特征越多网络越能够捕捉不同类别的差异,从而提高准确性,但同时也带来了更大计算负担甚至维数灾难。采用主成分分析法(PCA)可以消除冗余特征,最终保留的特征及其数量将基本决定模型的准确性。该方法的主要问题是,在训练或测试时,每条输入数据都需要进行预处理,实际在线应用时会降低运行速度。

时序加速度信号自身已经蕴含许多不同的特征,手动特征提取无法利用信号自身的全部信息且会产生冗余。任意一个时刻的加速度值虽然不能体现特征,但持续的信号片段可以。因此,在这种情况下,具有结构化输入的经典全连接神经网络并不适用。而长短期记忆网络非常擅长提取有上下文关系的时序数据的特征。

1.1 LSTM网络架构

LSTM 网络与循环神经网络(RNN)有着相似的链状结构,不同的是前者的每一个重复的单元都包含更复杂的层级[21]。

LSTM 网络顺序结构如图1 所示。图中在时刻t下每一个重复单元的输入量包括样本输入数据x、上一单元的状态c和上一单元的输出a。具体的单元层级如图2所示。

图1 LSTM重复单元的顺序结构

图2 LSTM单元结构

图2中:Wf为遗忘门的权重;Wi、Wc为更新门的权重;Wo为输出门的权重;bf为遗忘门的偏置;bi、bc为更新门的偏置;bo为输出门的偏置。叠加表示将两个数组合并为一个,σ(·)表示sigma函数,tanh(·)表示双曲正切函数,“*”表示按元素相乘,“+”表示按元素相加。

遗忘门Γf通过sigmoid 函数筛选了上一单元的状态中未被舍弃的部分:

更新门Γu决定了需要更新的部分,c͂提供了备选的更新数据:

更新的单元状态由选取的上一时刻状态与新选取的备选变量组成:

在输出环节中,tanh(Ct)将Ct的值重新布置在(-1,1)的范围中,输出门Γo决定了输出的部分,最终获得该单元的输出量a

整个网络的架构如图3所示。

LSTM 层之后连接的是全连接层(fully connect⁃ed layer,FC),其中隐藏层的神经元数目与分类的类别数Nc相同。全连接层中各元素为

图3 时序输入到分类结果输出的全网络架构

式中:i为全连接层中的各神经元下标;wi为神经元的权重;bi为偏置。由于此问题是分类问题,因此在最后连接一个softmax 层将全连接层输出的离散特征转化成对应类别的概率分布。每种类别的概率ŷi计算方式为

式中e 为自然指数。由此完成了从时序加速度信号输入到分类结果输出的流程,每一步正向传播的计算均已完成。

1.2 LSTM反向传播及迭代过程

上述网络建立过程即进行正向传播,最终的损失函数Lj定义为交叉熵的形式:

对于所有样本的整体目标函数为

式中:yi为实际的概率;Θ为网络中需要迭代的各参数,如权重W和偏置b;m为样本数量。

为求解该优化问题,需要对参数进行反向传播迭代。重复反向传播过程并利用计算得到的当前LSTM单元的输出和状态变量向前一时刻传递。

最小化目标函数所用的算法是Adam 算法(adaptive optimization algorithm),它是当前深度学习参数优化算法中较为高效的一种,结合了批量梯度下降、动量法、RMSProp 等算法的优点,可以自适应改变学习率快速寻优,变量的更新迭代算法如下:

式中:vdΘ为动量变量;SdΘ为学习率调整变量;β1为梯度衰减因子;β2为平方梯度衰减因子。经过数次迭代后,网络中所有需要更新的变量都会迭代至使目标函数尽可能小的值。

2 路面不平度辨识算法

利用上述LSTM 网络对于时序信号强特征捕捉能力和时序车辆加速度响应,就可以构建在线路面不平度辨识算法。这是本文的主要创新点,其主要流程如图4 所示,分为网络训练阶段和实际使用阶段。

图4 路面不平度等级辨识算法流程

在网络训练阶段,首先进行LSTM 网络的搭建,由于直接利用时序加速度作为输入,网络的第1层为时序输入层,将时序信号中的每个采样点单独输入下一层。第2层为LSTM 层,包含大于等于采样点数目的LSTM 单元,每个单元与前后时刻对应的单元相连,能够传递之前时刻单元的状态和输出信息。第3层为全连接层,将上一层网络输出的结果进行线性运算得到不同类别的分数。第4 层为Softmax 层,得到不同类别的概率并选择最大者作为分类结果输出。

深度学习需要大量的数据进行网络训练,而试验数据不易包含大量完整的工况,因此在网络训练阶段中可以利用仿真加实测的加速度信号作为训练数据集的来源。仿真获取训练数据集的方案中,首先利用白噪声滤波产生不同不平度等级的路面激励,通过悬架的传递特性来计算对应不同等级路面的车轮垂向加速度。试验获取数据集的方案中,在轮心处安装加速度传感器及数据采集系统,在不同不平度等级的路面行驶中采集车轮垂向加速度。之后截取时长1 s的加速度时序信号片段,并进行归一化处理。

设置初始参数后,将加速度时序信号与相应的路面不平度等级标签输入网络开始训练。通过训练结果调整超参数,如迭代次数、学习速率,以实现较高的分类准确率。

在实际使用阶段,训练好的网络可应用于实时路面分类。在轮心处安装加速度传感器及数据采集系统,在车辆行驶过程中采集车轮垂向加速度。截取1 s加速度信号片段后进行归一化处理,输入一训练好的网络,便可以快速得到最终路面不平度等级分类的结果。

3 网络训练

考虑到实际会出现的各种不同的工况,较难利用实车测量的方法获得大量的训练数据。因此利用滤波白噪声产生大量不同的道路不平度信号,通过悬架模型传递特性计算的车轮垂向加速度响应,在大量训练数据的基础上进行网络的训练。训练好的网络可以直接用于实时的加速度信号进行路面不平度等级的辨识。

3.1 路面模型

路面截面高程通常被认为服从一种均值为零的正态分布,为了描述这一随机过程的特征,通常利用功率谱密度(PSD)[22]。根据ISO 8601,路面不平度的功率谱密度如下:

式中:n为空间频率,m-1;n0为参考空间频率,n0=0.1 m-1;Gq(n0)为在参考空间频率下的路面功率谱密度,m3,也被称为路面不平度系数;W为频率指数,决定了路面功率谱密度的频率分布,通常为2。Gq(n0)与对应的方差σq随不同等级的路面粗糙度而变化。

功率谱密度的时间频率为

考虑到路面不平度是一种有限带宽噪声,具有所需路面功率谱密度的时域路面不平度则可以通过特定白噪声通过滤波产生。

式中:Sω为白噪声功率谱密度,这里取1。传递函数为

传递特性的状态方程为

式中:q(t)为路面不平度,m;n00为空间下限截止频率,n00=0.011 m-1;w(t)为均值为0、功率谱密度为1的时域白噪声信号。

由白噪声生成的以20 m/s 通过的E 级路面不平度结果如图5所示。

图5 E级路面在20 m/s下的不平度时域信号

将生成的道路与E 级路面的标准功率谱密度进行比较,下边界是E 级标准功率谱密度的1/2,而上边界则为2倍,结果如图6所示。从图中可以看到频谱位于E级区域。

图6 生成的E级路面功率谱密度与标准E级路面上下界

因此由滤波后的白噪声产生的路面不平度能够接近实际采集的结果,可用于路面不平度等级识别的训练。

3.2 悬架传递特性

为了展示轮胎和悬架的传递特性,选用2 自由度1/4 车辆模型,如图7 所示。图中,簧上质量ms,簧下质量mu,弹簧刚度ks,可变阻尼系数cs,轮胎刚度kt。车身、轮胎和路面的位移分别用xs、xu和xr表示。1/4车辆模型的参数如表1所示。

图7 1/4 车辆悬架模型

表1 1/4车辆模型参数

从路面位移到簧下质量加速度的传递函数为

路面不平度可以通过簧下质量加速度和式(15)的传递特性得到

以20 m/s 驶过图1 所示的E 级路面上的车辆簧下质量加速度如图8所示。

生成5 个不平度等级,包括B、C、D、E、F 级路面下的车辆加速度响应信号。为使数据更贴近实际加速度传感器测量的数据,在加速度信号中叠加一定功率的白噪声,也可以提升算法辨识的鲁棒性。为使生成的信号更具有随机性和普遍性,避免叠加某些系统性偏差,每次利用不同的随机数种子进行白噪声的生成,并且生成十倍于所需时长的信号,之后进行随机的片段采样,能够避免加速度信号存在某些由该生成方法引出的固定特征。训练集中使用的每个样本时长1 s,片段选取如图9所示。

图8 20 m/s驶过E级路面的车轮垂向加速度

图9 随机窗口选取加速度

训练集有1 000 组样本,由5 种不同等级路面的激励结果组成,每种200 个样本,每个样本时长1 s,不同等级的采样结果如图10所示。

图10 5种不同等级路面的车轮垂向加速度响应结果

考虑到不同等级加速度的幅值范围,为使加速度信号具有相近的分布,对信号进行归一化处理:

式中μ和σ分别为一种路面激励加速度下的平均值和方差。

3.3 训练过程

验证集包含250 个样本,与训练集具有相同的分布,并进行了归一化处理。在完成数据的准备和网络的搭建后,就可以进行深度学习训练。用于训练的超参数如表2所示。

表2 用于训练的超参数

训练集1 000 个样本分为10 个小批量,每个批量有100 个样本。每次完整利用全部数据集正向和反向传播进行10次迭代,遍历数据集300次,共进行3 000次迭代。在每次完全遍历整个数据集时,将训练集样本顺序重新打乱,学习率衰减为

本节展示了网络的训练方式和结果。在训练中每次迭代均进行小批量测试集的准确率计算,每遍历5 次全部数据集后计算一次验证集的准确率,以检查网络是否过拟合了训练集。如果出现过拟合,应终止训练以调整样本量或超参数的值。训练过程的准确率及损失值如图11所示。

训练准确率在波动中呈上升趋势,由于训练样本仅包含一段时域信号,没有结构化数据,对网络进行分类训练提出了更高的要求,需要更深层次的网络和更多的样本,这样就将在线处理的运算负担转移至离线训练的过程中,为在线算法的实时性和快速性提供便利。算法中利用小批次梯度下降,因此准确率上升过程中存在波动。训练与验证准确率均趋近于100%,损失值均趋近于0,训练未发生欠拟合的情况。验证集的准确率与训练集结果趋势相同,这表明网络在训练集上也未发生过拟合。在训练过程进行到1 200次迭代时,准确率和损失函数产生了较明显的波动,可能是由于对于训练集重新打乱后,对小批量的样本产生了欠拟合的情况从而导致的准确率下降。

图11 训练及验证

4 算法验证与分析

4.1 结果分析

测试集与验证集具有相同的分布和样本量。在测试集上测试网络的准确率,结果如表3 所示,表明训练的网络对于不同的数据集均有较高的准确率。

表3 不同数据集的准确率

该算法利用时序加速度信号进行识别,能够用于在线实时运行,之后测试该网络对连续信号的识别能力。路面以B 级、E 级、C 级、F 级和D 级的时序顺序导入网络进行测试,结果如图12所示。

测试集结果的混淆矩阵如图13 所示。大多数预测类别与实际类别一致。错误预测的路面不平度等级在实际等级的±1范围内。因为F级路面的特征更加显著,使网络更容易捕捉到特征并进行分类,因此准确率相对高于其他类别。

图12 测试集时域预测结果

图13 测试集结果混淆矩阵

除准确率(Accuracy)外,用于评估深度学习网络性能的3 个常用指标是精确率p(Precision)、召回率r(Recall)和F1值(F1score)。三者定义方式如下:

式中:TP为真阳性,代表实际为真预测也为真;FP为假阳性,代表实际为假预测为真;FN为假阴性,代表实际为真但预测为假;而i为不同类别的索引。测试集的结果如图14 所示。同一路面等级中精确率与召回率都较高且接近,F1值也相应较高。不同路面等级的精确率和召回率都较高,表明对不同等级的路面均有一致的较好的效果。平均F1值为97%证明该网络可以实现针对不同路面不平度级别的准确分类。

图14 测试结果评价指标

4.2 鲁棒性分析

本节进行算法的鲁棒性验证,判断算法在不同的条件下是否能满足需求,分别考察不同车速、不同采样时长、不同减振器阻尼和不同簧上质量的鲁棒性。

4.2.1 速度鲁棒性

速度鲁棒性是实际使用路面不平度辨识算法需要考虑的重要因素。在以前的研究中,用于训练集的样本通常来源于固定的车速,但在验证时通常避开不同车速下的准确率问题。而车速在行驶中变化很大,因此这个问题不能忽略。训练集样本是在20 m/s的车速下获取的加速度信号,归一化处理对不同加速度的幅值范围进行了约束,使网络能够适应不同速度范围的信号。测试集选取了车速为5-50 m/s时不同等级路面激励的加速度,通过已训练的网络进行验证,该网络在较宽速度范围内准确率均在96%以上,且随速度变化无变化趋势,如图15所示。

图15 不同车速下的辨识准确率

4.2.2 采样时长鲁棒性

采样时长鲁棒性验证中,由于算法利用了LSTM网络,能够实现对于不同时长的输入时序信号进行处理。测试集分别为0.6、0.8、1.0、1.5 和2.0 s 时长的加速度信号,通过前文训练下的网络,在不同等级路面下的F1值如图16 所示。该网络训练集所用信号时长为1.0 s,在测试中,当采样时长减小时,由于包含的信息减少,F1值有所下降,但即便时长仅为原训练集样本时长的60%,平均F1值仍有90.8%。而输入信号时长大于原时长时,由于提供了更多信息,F1值也会增大,当时长大于1.5 s 时,F1值均超过98.0%。这表明该算法能够针对不同的需求输入不同时长的数据,当需要为悬架控制实时提供高频信息时,在满足准确率需求下可以适当缩短采样长度。而对于实时性要求低的需求中可以延长采样时间已提供更准确的辨识结果。

图16 采样时长鲁棒性测试

4.2.3 减振器阻尼鲁棒性

减振器阻尼鲁棒性测试中,路面辨识的结果为半主动悬架控制提供判据,而半主动悬架控制会改变减振器的阻尼,使得系统模型参数发生了变化。而辨识结果应对不同减振器阻尼有较高的鲁棒性,才能保证在实际应用中不会在控制介入时失效。训练集加速度样本通过2 000 N·s/m 阻尼系数产生,测试集选取了500、1 000、2 000 和3 000 N·s/m 阻尼系数的传递特性获得的加速度,输入前文训练好的网络中,得到的不同减振器阻尼鲁棒性结果如图17所示。在不同减振器阻尼下F1值趋势与2 000 N·s/m下的结果一致,当阻尼系数变化后F1值均有所下降,但仍高于90%,均值仍高于94%。表明在阻尼系数产生大范围变化时,算法仍能提供较高的辨识精度。

4.2.4 簧上质量鲁棒性

在实际使用中载荷的变化会导致簧上质量变化,同样会产生系统模型参数失配的问题,簧上质量鲁棒性保证了算法的辨识效果不随簧上质量变化而产生明显变化。训练集原簧上质量为300 kg,测试集选取了300、400 和500 kg 的全等级路面进行测试,如图18 所示。在不同簧上质量下F1值无明显变化,均高于95%。

图17 减振器阻尼系数鲁棒性测试

图18 簧上质量鲁棒性测试

在上述鲁棒性测试中可以发现,在同一套超参数下训练出的网络,当悬架系统参数或测试条件发生变化时,同一网络均能较好地适应上述变化的条件,证明算法在实际使用中的不同环境下均能够实现较高的鲁棒性和准确率。

5 结论

对训练完成的网络进行测试,结果表明,通过加速度信号对路面不平度等级进行辨识的方法有效可行,辨识准确率超过95%,性能评价指标均较高。与以往路面不平度等级辨识算法相比,该算法优点在于:

(1)仅需要一路信号,如簧下质量加速度,传感器布置简单,硬件成本低;

(2)输入量为时序的加速度信号,无需进行傅里叶变换等频域变换,无需提取特征,能够直接输入原始信号;

(3)无需复杂的滤波,对噪声容忍度高;

(4)鲁棒性高,在车速、采样时长、减振器阻尼系数及簧上质量变化时均能进行有效识别;

(5)在没有充足试验数据时也能够通过白噪声滤波方式生成训练集,覆盖工况更广,且能在训练集中融入实测数据以进一步提升实际使用时的辨识准确率;

(6)训练网络时无需离线进行大量的手动特征选取,降低了开发难度;

(7)在线算法对算力需求低,无数据预处理过程,训练好的网络直接运行速度很高,为算法的实时性提供了保障。

利用车辆加速度响应基于LSTM 网络进行路面不平度等级辨识的算法行之有效,具有高准确率和高鲁棒性。因此在实际工程应用中能通过实测加速度,进行实时的路面辨识。路面不平度等级信息能够为半主动悬架控制等车辆控制提供重要的自适应算法的参数调整依据,具有很高的工程实用价值。

猜你喜欢

平度鲁棒性悬架
悬架KC试验分析
轿车前后悬架运动学仿真分析
武汉轨道交通重点车站识别及网络鲁棒性研究
汽车被动悬架的建模与仿真
第二个“平度”在哪里
发现平度之美
“食在平度”举办美食大赛引爆全域旅游
一种基于三维小波变换的鲁棒视频水印方案
电子节气门非线性控制策略
基于鲁棒性改进理论的大面积航班延误治理分析