基于轨迹规划与CNN-LSTM预测的履带式混合动力无人平台能量管理优化
2022-12-01谭颖琦许景懿熊光明李子睿陈慧岩
谭颖琦, 许景懿, 熊光明, 李子睿, 陈慧岩
(1.北京理工大学 机械与车辆学院, 北京 100081; 2.北京工业职业技术学院 机械工程学院, 北京 100042)
0 引言
现代传感、电子控制、机器视觉和导航定位等先进技术的飞速发展,推动了地面无人机动平台的高速化进程以及越野环境下行驶能力的迅速提升。履带式无人车辆因其承载能力大、可靠性高、机动性强,是无人机动平台的重要分支[1]。面对世界新军事变革和国内军事变革形势需求,各种高电能武器迅速发展,履带式混合动力无人平台因其优良的特性[2],成为了地面无人机动平台的重要领域。履带式混合动力无人平台可以在多种工作模式下适应不同行驶工况的需求,获得比传统车辆更好的整车效率、燃油经济性和机动性,对提升陆战平台整体性能、适应未来作战需求具有重要意义。
对于混合动力无人平台来说,能量管理技术是影响系统性能的关键因素。能量管理技术是根据混合动力系统不同组件的状态反馈和能量管理策略,实现不同动力源之间的功率调控,满足动力性需求,将动力电池的电池荷电状态(SOC)维持在一定范围,从而提高燃油经济性、降低燃油消耗并减少尾气排放。由于履带式无人车辆行驶路况复杂多变,所以对其能量管理策略的工况适应性提出了更严苛的要求。因此,设计具有良好工况适应性的能量管理策略是履带式混合动力无人平台综合性能的最关键任务。
随着能量管理技术的迭代,根据实现方式的差异,混合动力车辆能量管理策略主要分为基于规则的能量管理策略和基于优化的能量管理策略[3-9]。其中,基于优化的控制策略是近年来能量管理策略研究的主要方向,分全局最优和实时优化两种策略。实时优化控制策略不依赖于预先计算的控制策略,而是根据车辆信息在每个时间步长内执行主要计算,以产生控制决策。近年来国内外学者提出的实时优化的能量管理策略,包括等效燃油最小[10-12]、机器学习[13-14]、模型预测控制(MPC)[5,7,15-17]等算法,能在线对能量管理决策进行优化计算。MPC是实时优化的一种实现方法,通过不断预测、求解、控制、更新形式实时优化。
本文将以履带式混合动力无人平台为研究对象,面向能量管理进行混合动力无人平台建模,合理分配发动机- 发电机组及动力电池组的输出功率,在越野工况轨迹规划设计上,提出基于卷积神经网络(CNN)与长短期记忆网络(LSTM)的预测模型,并设计MPC能量管理策略对混合动力无人平台进行能量管理优化。通过实车试验,验证基于轨迹规划的MPC策略的有效性,实现能量管理优化目标,提高燃油经济性。本文研究内容结构图如图1所示。
图1 本文研究内容结构图
1 面向能量管理的履带式混合动力无人平台建模
本文研究对象是履带式混合动力无人驾驶平台,如图2所示。
图2 履带式混合动力无人驾驶平台
该履带平台是以我国63式履带装甲车为基础,保留履带和侧减速器,具有良好的动力性能。文献[18]对该履带平台进行了无人化、电控化的改造,配备激光雷达、毫米波雷达、双目摄像机、惯性导航单元、实时差分定位导航系统、CAN通讯网络和工控机等器件组成,即具有完整的感知、规划及运动控制系统,能自主完成环境探测、避障、超车等无人驾驶车辆的能力。该车的基本结构参数如表1所示。
表1 无人履带平台结构相关参数
该平台由原车的柴油机传动系统替换为串联式混合动力系统。图3为该履带式无人驾驶平台的混合动力系统结构图。
该平台采用双电机独立驱动方案,主要由发动机- 发电机组、动力电池组、电力集成控制器、双侧驱动电机、传动系统等组成。发动机- 发电机组与动力电池组通过功率耦合与电力集成控制器为平台各用电设备提供电能。发动机不直接参与机械传动,无机械能直接输出到驱动轮,仅带动发动机- 发电机组实现发电,从而提供稳态功率,满足平台各部件功率需求,使动力电池SOC维持在一定的范围内,保持系统功率平衡。当动力电池SOC较低时,发动机为整车提供动力并为动力电池充电;当动力电池SOC较高时,发动机停止工作,由动力电池提供整车需求功率。通过调控发动机的工作状态及工作点维持动力电池电能平衡以提高燃油经济性。
对于本文研究的履带式串联混合动力无人驾驶车辆,其混合动力能量管理技术是决定混合动力系统综合性能的关键技术。能量管理策略的主要目标是在满足行驶动力性的前提下,合理分配发动机- 发电机组或动力电池组的输出功率,从而提高燃油经济性、降低排放和提高电池寿命等性能指标。
发动机输出轴与发电机输入轴刚性连接,二者的转速相等,考虑发动机和发电机的转动惯量,发动机和发电机的转速、转矩和输出功率满足:
(1)
式中:ne为发动机转速;ng为发电机输入轴转速;Te为发动机转矩;Tg为发电机输入轴转矩;Je和Jg分别为发动机和发电机的转动惯量;Pg为发电机输出到直流母线的电功率;ηg为发电机效率。
本文对履带车辆动力学进行简化,忽略履带的滑转、滑移等运动,根据车辆动力学方程、滚动阻力、空气阻力、坡度阻力方程以及转向阻力矩公式等可获得串联混合动力车辆的需求功率为
(2)
发动机- 发电机组和动力电池组共同提供能量,满足整车功率需求,功率平衡方程为
Pg+Pb=Preq
(3)
式中:Pg为发动机- 发电机组输出功率;Pb为动力电池组的输出功率。
以上介绍了履带式混合动力无人平台的结构和能量管理系统工作模式,并构建了发动机- 发电机组模型、整车动力学模型和功率平衡方程,为后续平台的能量管理策略研究奠定了基础。
2 基于轨迹规划的MPC能量管理策略优化
本节通过分析混合动力履带车辆运动学模型,进行局部轨迹规划设计,并基于轨迹规划提出CNN-LSTM的预测方法,对工况进行精准预测,采用MPC能量管理策略,在履带式混合动力无人车辆上实现能量管理优化控制,其策略原理图如图4所示。
图4 基于MPC能量管理策略
MPC是一种针对多变量难控问题的先进控制方法。MPC的基本思想是利用已有的模型、系统当前的状态和未来的控制量去预测系统未来的输出,通过滚动地求解带约束优化问题来实现控制目的。
以某一时刻作为当前时刻,预测系统在未来预测时域内的系统动态过程和状态轨迹,计算控制时域内使得系统优化目标取得最优解的最优控制序列,获得预测控制轨迹,并将最优控制序列的第1个控制量作用于系统,并在下一个时刻,重复上述过程,如此滚动完成带约束的优化问题,实现对系统的持续控制[19]。MPC的优化过程使得系统对于动态特性的变化和不确定性的干扰具有较强的鲁棒性。
基于MPC的能量管理策略包含三步:预测模型建立、实时滚动优化、反馈校正控制。本节将按这三个步骤设计MPC方法进行混合动力无人平台能量管理实时优化[20]。
2.1 预测模型建立
建立预测模型是MPC方法的首要步骤,通过对未来信息的预测,为实时滚动优化提供基础。
本节将基于局部轨迹规划提出CNN-LSTM工况预测方法实现对预测时域内车速预测,从而构建能量管理最优控制问题。
2.1.1 局部轨迹规划
本文采用3阶螺旋线作为状态采样的曲线模型[21]获得了一条运动可行的无碰撞路径,并将控制输入表示为3阶螺旋线,如(4)式所示:
k(s)=a+bs+cs2+ds3
(4)
式中:k(s)为曲线在一定长度内的曲率;a为起点曲率;b、c、d为拟合参数。
基于车辆运动学方程得到车辆弧长运动学模型,如(5)式所示:
(5)
式中:x(s)、y(s)为某一长度上路径点的坐标;θ(s)为曲线的走向;x0、y0为起点的位置;s为弧长;θ0为起点的走向。
在以3阶螺旋线为状态空间采样中,通过对(4)式和(5)式进行积分求出最终路径点坐标,再对路径分割和选择。
采用迭代式算法进行速度规划设计。通过对每个路径点的速度施加横向加速度约束、纵向加速度约束以及冲击度约束,每个约束将以连续和有限差分形式表示,以生成速度剖面。通过迭代式算法修改速度剖面,在每次循环中考虑所有约束,调整当前路点的速度以满足约束值,直到速度剖面不改变,最终的速度剖面即为规划速度序列。
2.1.2 CNN-LSTM预测方法
为了同时处理历史速度序列和规划速度序列,本文提出了基于CNN-LSTM的预测模型。
CNN是深度学习的代表算法之一,用于学习时间序列数据的局部趋势特征。由于其局部连接和权值共享等特性,降低其处理多变量时间序列的网络的复杂度,减少了训练参数的数量,在提高学习效率的同时,也提高了鲁棒性和容错能力。但是时间序列数据(如车辆速度)会表现出对过去数据的依赖。CNN的浅层学习模型由于没有考虑对历史数据的依赖性,在处理时间序列问题时无法取得良好效果。
LSTM作为循环神经网络的一个变种,可以通过隐藏记忆状态来体现这种依赖性,揭示时间序列的本质。LSTM可用于从对应的时间序列数据中获取长期相关特征。LSTM由4个神经网络层以一种特殊的连接方式构成,通过4个相互作用的层可以有效解决梯度消失问题,其结构如图5所示。
图5 长短期记忆网络
如图5所示,LSTM除了典型的循环神经网络中的tanh层以外,增加了3个门层:遗忘门、输入门和输出门。通过4个相互作用的层可以有效解决梯度消失问题。典型的LSTM单元模块计算过程如(6)式所示:
(6)
式中:WX、UX分别为隐藏状态和输入状态的权重矩阵,bX为偏置,X=i,f,o,g,分别表示输入门、遗忘门、输出门和内部隐藏状态;ht是新的隐藏状态。
基于规划速度与预测速度的CNN-LSTM的流程图如图6所示。首先将历史速度序列与规划速度序列合并,并作为CNN的输入量,经过CNN与LSTM的处理,输出预测速度序列。
图6 基于规划速度与预测速度的CNN-LSTM预测模型
2.2 实时滚动优化
2.2.1 能量管理优化设计
将预测的工况模型代入履带式混合动力无人车辆的控制模型(2)式和(3)式中,可以求解出预测时域内无人驾驶车辆的功率需求,从而构建出最优控制问题。能量管理优化控制问题是在满足系统约束条件下,求解使得性能指标最小的最优控制量,是一个非线性时变最优控制问题。本文仅考虑混合动力履带车辆的燃油经济性,即获得最小燃油消耗值。因此,本文的能量管理最优控制问题的性能指标为
(7)
(8)
φfuel为根据台架试验数据确定的发动机油耗特性图查表函数。
维持动力电池组平衡是能量管理目标之一,即初始时刻的电池SOC与结束时刻的电池SOC应相同。由于MPC的优化问题中的预测时域比全局优化的预测时域短,且初始SOC也不等于目标SOC,因此在MPC的优化过程中不做电池SOC的硬约束。但为了达到维持电池SOC稳定的目的,在性能函数中加入电池当前SOC与目标SOC的差值作为一个优化目标,所以将(7)式性能函数改为
(9)
式中:ω1、ω2为权重因子;SOC(t)为当前电池SOC;SOCtar为目标电池SOC。
可将(9)式写成离散时间形式
(10)
动力电池组的SOC作为系统的状态变量,状态方程为
(11)
式中:Voc为动力电池组开路电压;Rb为电池内阻;Pb为电池功率;Cb为电池的额定容量。可将(11)式写成离散时间形式
(12)
在本文研究的串联混合动力系统中,发动机输出轴和发电机输入轴直连,发动机采用转速控制方式,发电机采用转矩控制方式,发动机转速和发电机转矩需要符合发动机和发电机的外特性,并且在相邻两个控制区间,发动机转速ne和发电机转矩Tg的变化不能太快,否则无法完成工作点的转移,发动机- 发电机组无法达到目标输出功率。因此需要满足如下约束
(13)
式中:ne为发动机转速;ne,min、ne,max分别为发动机的最小转速和最大转速;Δne为发动机转速变化率;Δne,min、Δne,max分别为发动机转速变化所允许的最小值和最大值;Tg为发电机转矩;Tg,min、Tg,max分别为发电机的最小转矩和最大转矩;ΔTg为发电机转矩变化率;ΔTg,min、ΔTg,max分别为发电机转矩变化所允许的最小值和最大值。
本系统中动力电池组的充放电能力有一定的限制,为了防止动力电池过充和过放,需满足如下约束
(14)
式中:SOCmin、SOCmax为动力电池组SOC所允许的最小值和最大值;Pbmin、Pbmax为动力电池组的最大充电功率和最大放电功率。
2.2.2 动态规划算法优化设计
本节设计优化的前向动态规划算法[22]求解能量管理最优控制问题。
求解履带式混合动力无人平台能量管理最优问题的前提是全局工况已知,即每个时刻车辆的动力学约束是已知的。由2.2.1节可知,能量管理最优控制问题为求解最小成本函数,即获得最小燃油消耗值。本文根据最小成本对应储存的转移状态,设计优化的前向动态规划算法逆向搜索最优状态,从而获得最优状态轨迹,即燃油消耗最小值各时刻的SOC值以及对应的控制量序列。
根据能量管理最优控制问题,将动力电池SOC作为系统的状态变量x,对SOC状态进行离散化处理,将电池SOC范围等分为p份,其上下限需满足能量管理控制目标的要求,本文为0.6~0.8,n为总离散阶段数,k为当前阶段,k=1,2,…,n-1。
对于采样时刻k=1时,第i个SOC状态xi时的最小成本函数为
J1(xi)=L1(xi)
(15)
式中:J1(xi)为第1个采样时刻xi状态的最小成本函数;L1(xi)为在第1个阶段的系统约束下状态从初始状态转移到xi的瞬时成本函数。
以此类推,可以得到所有阶段的最小成本函数,即对于采样时刻k(1 Jk(xi)=minj[Jk-1(xj)+Lk(xi,xj)] (16) 式中:Jk(xj)为第k个采样时刻xj状态的最小成本函数;Jk-1(xj)为第k-1个采样时刻xj状态的最小成本函数;Lk(xi,xj)为在第k个阶段的系统约束下状态从xj转移到xi的瞬时成本函数。 对于本文研究的混合动力能量管理最优问题,由(17)式可知,系统在采样在采样时刻k的瞬时成本函数为 (17) 该瞬时成本函数的计算取决于系统状态变量电池SOC(j)和控制变量u(j),其中控制变量为发动机转速ne和发电机转矩Tg。由发动机- 发电机组约束(13)式和动力电池组约束(14)式可知,状态变量SOC(j)和两个控制变量u(j)都有上下限约束,本文选择状态变量电池SOC和发动机转速来确定系统的状态,然后将动力电池SOC范围和发动机转速范围离散化,从而可以计算瞬时成本函数。但是,随着离散化网格数的增加,计算量呈指数增长,计算时间过长。为降低动态规划的算法的计算量,提高计算效率,本文根据履带式混合动力无人车辆的特性,通过减小电池SOC和发动机转速这两个量的搜索范围,提高算法的求解速度。 系统的状态变量电池SOC是根据离散化后的所有离散点进行计算,从动力电池组约束(14)式可知,动力电池SOC在每一个时刻的变化收到电池充放电功率的约束,无法过大变化。因此,通过减小动力电池SOC的变化范围,从而缩小每个时刻电池SOC的搜索域,即对于一个SOC值,只在红色线处进行搜索,而另外其他的SOC值不进行计算,减小计算量。由于电池SOC终端没有固定,所以最后一个状态不再固定,而是与前面状态相同,计算所有离散化的SOC值,从而获得预测时域内的最优控制序列,实现预测时域内的局部优化,如图7所示。 图7 基于动态规划的实时滚动优化 对于系统控制变量发动机转速,可根据发动机- 发电机组约束(13)式,将上一状态对应的最优控制量作为基准,仅搜索附近区域,如(18)式所示,即可减小发动机转速的搜索范围。 ne(k-1)+Δne,min≤ne(k)≤ne(k-1)+Δne,max (18) 以上考虑到电池充放电功率约束和发动机转速变化约束,通过缩小电池SOC和发动机转速的搜索范围,减少动态规划算法的计算量,提高动态规划的计算效率,从而得到最优轨迹,实现了前向动态规划算法的优化。求解最小成本函数流程图如图8所示。 根据图8,针对每一个SOC离散值,求得时刻k-1 到k的SOC变化值ΔSOC,如 图8 求解最小成本函数流程图 ΔSOC=SOCk-SOCk-1 (19) 由动力电池模型可计算电池的充放电功率为 Pb=-VocCbΔSOC-(CbΔSOC)2Rb (20) 整车需求功率Preq可由(2)式计算求解。根据功率平衡,发动机- 发电机组的目标输出功率可Pg由(3)式计算求解。因为发动机和发电机刚性连接,所以转速相同,将发动机转速代入发动机- 发电机组模型(1)式,可求解发电机转矩和发动机转矩,从而由发动机油耗模型(8)式求解油耗。 根据约束(13)式,比较控制变量的可行解,从而得到最小瞬时成本函数。如果在计算过程中,无可行解,则说明此时的电池SOC的值无法达到,即系统状态不可获得,则设定该过程的成本函数为最大值。 根据前向动态规划优化算法,当前总成本为上一时刻状态对应的总成本与转移状态最小成本的和的最小值,即为 (21) 按照(21)式一直计算到终止时刻,获得系统整个过程的总成本函数、每个时刻的最优状态量和控制量。 采用优化动态规划解决MPC中的最优控制问题是局部最优控制,而不是全局最优控制。由于存在预测误差和外部干扰,求解出的最优控制序列不能全部作用于系统,只能将第一个最优控制量作用于系统,在下一个控制周期重新观测系统状态,根据历史速度序列和规划速度序列重新预测速度,对上一时刻的预测值进行修订,然后重新求解新预测时域内的最优控制问题,如此循环。 本试验采用履带式混合动力无人平台,即图2所示平台,可设置纯电动模式和混合动力模式。本试验是在某试验场越野环境中,以混动模式为前提,比较两种不同的能量管理策略方法,对基于轨迹规划预测的MPC能量管理策略进行验证。在无人驾驶模式和混合动力模式下,考虑到动力电池SOC维持在70%左右能发挥较好的充放电特性,因此将其电池SOC初始值设置为70%[2]。试验场环境如图9所示。图10为实车试验中的无人驾驶全局路径。 图9 实车试验环境 图10 实车试验无人驾驶全局路径 本试验首先根据2.1.1节介绍的轨迹规划算法输出规划速度序列,如图11所示。 图11 规划速度序列 该规划速度序列与历史速度序列合成为合并速度序列,作为后续基于轨迹规划的工况预测方法的输入量;其次将基于规划速度序列的直接预测精度与采用CNN-LSTM工况预测精度进行对比;最后通过对比基于多步神经网络的等效燃油消耗量,进一步验证基于CNN-LSTM工况预测的能量管理策略的有效性。 本研究利用采集的大量的实车无人驾驶数据训练基于轨迹规划的CNN-LSTM工况预测模型,以实际无人驾驶工况作为测试,验证模型效果。 图12显示了直接用规划速度作为预测速度的预测效果与同时使用规划速度和历史速度并采用CNN-LSTM模型进行工况预测的比较结果。表2给出了预测精度对比,预测精度用均方根误差作为评价指标,其计算公式为 表2 两种模型的预测精度对比 图12 两种预测模型对比图 (22) 式中:e为均方根误差;vpre和vreal分别为预测速度和实际速度。 由表2可知,通过对比不同工况预测方法,采用CNN-LSTM模型预测方法效果比基于规划速度的直接预测模型的预测精度提高了3%,说明使用CNN-LSTM模型可以提高工况预测效果。 为了验证本文研究的基于CNN-LSTM预测的MPC能量管理策略,本节将传统的基于多步神经网络预测的策略与其进行对比实验。图13 显示了两种不同策略下动力电池SOC变化的结果。 图13 两种能量管理策略的电池SOC结果对比图 由图13可知,两种能量管理策略都能使电池SOC维持在目标值附近。对于基于CNN-LSTM预测的能量管理策略SOC曲线,在50~150 s期间,工况比较稳定,履带车辆需求功率比较平稳,电池SOC稳定在目标值处;在150~180 s期间,需求功率较大,动力电池和发动机共同提供电能,SOC下降至0.695左右;在180~210 s期间,需求功率较小,发动机发电机组的输出功率不仅用于驱动车辆,还给动力电池充电,使动力电池SOC上升至初始值。此过程为该履带车辆在混动模式下的输出结果,证明基于CNN-LSTM预测能量管理策略较基于多步神经网络的能量管理策略更有效地使动力电池发挥削峰填谷的作用,能够完成维持动力电池SOC稳定的目标,并且能够适时调节电池的充放电功率,从而更有利于调节发动机的工作点使之更多地工作在高效区,提高燃油经济性,如图14所示。 图14 两种能量管理策略的发动机工作点对比图 通过比较两种能量管理策略下发动机工作点的状态,如图14展示可知,与基于多步神经网络策略相比,基于CNN-LSTM预测的MPC优化策略使得发动机能有更多的工作点落在高效区内,工作范围得到更多改善,经过SOC修正后,两种能量管理策略的等效燃油消耗量对比情况如表3所示。 表3 两种能量管理策略等效燃油消耗量对比 通过对比可知,基于CNN-LSTM预测的MPC的能量管理优化策略比基于多步神经网络策略的等效燃油消耗量减少了3.9%,改善了燃油经济性,也体现了基于CNN-LSTM预测方法的预测精度高。 本文以履带式混合动力无人平台为研究对象,面向能量管理对平台进行建模;对发动机- 发电机组及动力电池组的输出功率进行分配;基于局部轨迹规划提出CNN-LSTM模型预测的方法;设计了MPC的优化策略,实现了能量管理优化目标。 通过实车试验,验证了基于CNN-LSTM预测模型的有效性;证明了基于CNN-LSTM预测的能量管理策略比基于多步神经网络预测的策略燃油经济性要好,减少了燃油消耗,提高了控制策略的优化性、适应性和鲁棒性。2.3 反馈校正控制
3 实车验证与结果分析
3.1 基于CNN-LSTM工况预测的能量管理策略验证
3.2 能量管理策略对比验证
4 结论