APP下载

参数自优化的有人与无人车辆编队鲁棒模型预测控制

2023-02-27宋佳睿陶刚李德润臧政吴绍斌龚建伟

兵工学报 2023年1期
关键词:领航扰动无人

宋佳睿,陶刚,李德润,臧政,吴绍斌,龚建伟

(1.北京理工大学 机械与车辆学院,北京 100081;2.中汽研汽车检验中心(天津) 有限公司,天津 300300)

0 引言

近年来,为实现无人装备集群化、规模化和可指挥化,无人装备集群行驶在军事领域中得到了越来越多的应用[1]。当前,有人与无人车辆编队领航跟踪控制作为无人装备集群行驶的一项关键技术,其发展也被越来越多的学者关注。车辆编队控制可以分为领航-跟随法[2]、行为控制法[3]、滑模控制法[4-5]、鲁棒控制方法[6]、模糊控制法[7]和模型预测控制(MPC)[8-9]等。

MPC 方法在车辆编队控制方面具有可预测性和可约束性等众多优点,广泛应用于集群车辆列队系统中[10-13]。鲁若宁等[14]针对单向通信拓扑的车辆编队自适应巡航控制问题,提出一种满足队列稳定的模型预测控制策略。Zhai 等[15]提出基于多目标优化问题的切换控制策略以协调多车自适应巡航系统中的安全性、舒适性、协同性和燃油经济性等控制目标。Ozkan 等[16]提出一种应用于同质量重型卡车成队列行驶的燃油经济性模型预测控制策略,该策略将领航车的燃油最优控制方法与跟随车的协同控制方法相结合,提升了系统的燃油经济性。李永福等[17]在编队控制基础上提出一种双向领导跟随通信拓扑结构以考虑车车通信时延对控制器的影响。

上述研究提供了丰富的无人车辆编队行驶控制策略,但是由于军用无人车队通常行驶在非结构化道路,且其控制器模型存在结构和参数的不确定性,所以军用无人车编队行驶控制存在受地面外部扰动和模型失配的问题。因此,由外部扰动和模型失配的引起的鲁棒控制问题是编队控制急需解决的关键问题。针对此类鲁棒问题,孙中奇[18]对具有输入边界限制和有界不确定影响的轮式机器人展开研究,提出基于不变集的鲁棒模型预测控制(RMPC) 方法,该方法将实际状态轨迹收紧在鲁棒不变集内并保证系统渐近稳定性。Zambelli 等[19]在模型预测控制方案的基础上,引入2 阶积分滑膜校正项,保持和增强了车队在巡航时的一致性。Zhuang 等[20]设计了集中式扰动观测器获得稳定状态参考,并利用RMPC 控制器保证队列稳定和实现轨迹跟踪,同时减小参数不确定性的影响。Meng 等[21]提出分布式RMPC 与终端不变集结合的方案用于多地面无人车辆控制,有效地应对突发状况与通信数据包丢失问题。

上述方法均在解决车辆系统的参数不确定、结构不确定或外部扰动不确定方面取得了成功。但是不同于无人车编队行驶,对于有人车领航与无人车跟踪控制问题,有人领航车通常为处理突发场景需要进行紧急加减速和转向,进而产生随机不连续的扰动输入且难以预测。同时随机扰动的鲁棒边界不易确定,边界过小或过大会引起控制系统鲁棒性不足和保守性过大的问题。因此,综合考虑有人领航车随机扰动输入并优化其鲁棒边界是有人车领航与无人车跟踪控制需要解决的重要问题。

根据上述分析,本文提出一种参数自优化的有人与无人车辆编队RMPC 算法。该算法在RMPC控制器中考虑了有人领航车的输入扰动,并设计了基于线性矩阵不等式的局部反馈鲁棒控制器抑制该扰动。基于贝叶斯优化方法对鲁棒边界进行优化,保证控制器鲁棒性和低保守性。最后通过ROSVREP 仿真实验和实车试验验证该算法在有人领航与无人跟随控制中的可靠性。本文的总体框架如图1所示。

图1 总体框架图Fig.1 Overall frame diagram

1 领航跟踪及有人和无人车辆模型

1.1 领航跟踪几何模型

领航跟踪需要控制器精确跟踪期望路径并与领航车辆维持期望间距。领航跟踪控制系统使用l-φ方法建立表述车间相对位置的领航跟踪几何模型。有人领航车和无人跟随车如图2 所示。图2 中,坐标系OgXgYgZg为大地坐标系,(Xi,Yi) 为领航车辆i的全局位置坐标,θi为车辆i 的航向角,(Xj,Yj)为跟随车辆j 的全局位置坐标,θj为车辆j 的航向角,定义车辆j 和车辆i 的质心间距为dij,定义车辆i、j的质心连线与车辆j 航向的角度偏差为φij。

图2 领航跟踪几何模型Fig.2 Cooperative control geometry model

车辆节点i、j 的相对位置关系可表述为

1.2 轮式车辆运动学模型

阿克曼前轮转向车辆的运动示意图如图3 所示。图3 中:(Xf,Yf)、(X,Y) 分别为全局坐标系下车辆前、后轴中心坐标;δ 为车辆前轮转角;L 为车辆前后轴轴距;v 为车辆后轴中心前进速度;θ 为车辆航向角;黑色曲线为参考轨迹。

图3 轮式车辆运动学模型Fig.3 Kinematic model of a wheeled vehicle

由此可得笛卡尔坐标系下的车辆运动学微分方程[22]如下:

进一步,该微分方程可重写为控制系统的一般形式:

式中:ξack为控制系统状态量,ξack=[X,Y,θ]T;uack为控制系统控制量,uack=[v,δ]T。

1.3 履带车辆运动学模型

由于传统运动学模型容易忽略履带车辆滑移、滑转等运动特性,而动力学模型的参数随环境变化较大且不易获得,本文选取在Frenet 坐标系下基于瞬时转向中心的履带速差转向车辆运动学模型[23]。将状态向量[s,ed,eθ]T替代[X,Y,θ]T对车辆位姿进行描述,模型如图4 所示,并作出如下假设:

1) 假设履带车辆只在水平面上运动;

2) 假设履带车辆的几何中心与质心重合;

3) 车体坐标系原点Ol位于几何中心。

图4 中:s 为沿曲线移动的切向距离;ed为沿曲线的法向距离;eθ为航向角跟踪误差;vx、vy为履带车辆的纵向速度和横向速度;ω 为履带车辆的横摆角速度;θ 为车辆的航向角;Oc为履带车辆的瞬时转向中心;(xc,yc) 为车体坐标系下车辆瞬时转向中心坐标;Ole、Ori分别为左右两侧履带的瞬时转向中心;(xle,yle)、(xri,yri) 分别为两侧履带的瞬时转向中心坐标;vl、vr分别为左右两侧履带的卷绕速度;vMq、vNq为左右两侧履带牵连速度;B 为左右两侧履带中心距。

图4 履带车辆运动学模型Fig.4 Kinematic model of a tracked vehicle

进而可得Frenet 坐标系下履带车辆运动学模型微分方程的矩阵形式如下:

式中:κs为履带车辆几何中心Ol在参考曲线上对应点Pr的曲率值。

由于基于瞬时转向中心的运动学模型更加有利于控制系统的建模,在实车控制时通常运用该模型进行建模,其运动学微分方程如下:

式中:ξ 为系统状态量,此处ξ=[s,ed,eθ]T;u 为系统控制量,此处u=[vr,vl]T。

2 领航车轨迹预测与跟踪控制器设计

领航轨迹预测与跟踪控制器首先对有人领航车轨迹进行预测,并使用MPC 控制器跟踪预测轨迹,实现编队控制。

2.1 基于混合整数线性优化的有人领航车轨迹预测

有人车的未来状态可由轨迹树状图表示。以当前车辆位置作为根节点,并通过对车辆行为进行采样拓展可得到未来时刻的状态和预测轨迹,如图5所示。

图5 车辆轨迹树示意图Fig.5 Vehicle trajectory tree diagram

图5 中χij为车辆轨迹树的节点,后文统一将节点以χ 表示:

式中:t 为当前节点的时间戳;Jχ为节点的代价。

每次向轨迹树中添加新的节点时,则向扩展列表β 中添加新节点对应所有可能扩展节点及其轨迹,并进行下一步探索和扩展。扩展列表中,使用边γ 表示两节点之间的状态转移。边γ 由带有转移代价的转角输入和固定速度组成,表述为

式中:Jγ为力γ 的代价。状态转移方程来自轮式车运动学模型的2 阶Runge-Kutta 离散。

轨迹树一步扩展算法流程如图6 所示。

图6 轨迹树一步扩展算法伪代码Fig.6 Pseudo code of one-step extension algorithm of the trajectory tree

根据有人车驾驶员在实际驾驶过程的行为设计节点χ 的代价Jχ计算公式为

式中:Jχ中两项分别表征该节点与参考路径上最近点的距离和速度偏差;χref为参考距离;vref为参考速度;wχ、wv分别为各项的权重系数,分别表征了预测轨迹与有人车驾驶过程的实际轨迹和实际运动的相关程度,对应权重越大则轨迹预测器越基于对应实测值进行预测,二者需根据驾驶员行为确定。为使有人车的转向控制量尽可能小,设计边γ 的代价Jγ计算公式为

式中:wδ为权重系数。将轨迹优化计算模块中优化问题表述为图5 中边的流问题,ne表示边的数量,ns表示图中节点的数量,流问题的决策变量表述为

式中:so 表示源节点,si 表示目标节点;0 表示节点连接经过该边,1 表示节点连接不经过该边。

为决策变量的求解构建如下目标函数:

有人车轨迹要保证轨迹树根结点位于车辆初始位置,并保证流入和流出某节点的边的数量一致,构建如下优化问题求解决策变量

上述决策变量求解得到有人车的预测轨迹。

2.2 模型预测控制器设计

为实现编队任务下的无人车辆跟踪控制,本节将设计模型预测控制器。

参考点上的任意值均满足系统微分方程,有

对于基于瞬时转向中心的运动学模型,泰勒展开作差,可得

参考点处ξr=[sr,ed,r,eθ,r],ur=[vr,r,ve,r]T,同时对系统进行离散化,得

控制器需精确跟踪期望路径,即令无人车辆的实际横向偏差、航向偏差最小,控制器选取路径跟踪的代价函数项设计为

控制器需以尽量小的无人车控制量完成任务,选取控制量的代价函数项为

控制器还需考虑车辆行驶的平顺性及稳定性,即前后采样时间内的控制量变化不能太大,由此设计目标函数为

无论是打赢“三大攻坚战”,还是深化经济、政治、文化、社会、生态、党建等各领域改革,都不可能毕其功于一役,必须锲而不舍、久久为功。看清楚时和势,保持定力和耐心,不为任何风险所惧,不为任何干扰所惑,方能坚如磐石、行稳致远。

最后控制器需考虑无人车辆的间距保持功能,即无人履带车和其他车辆节点的实际间距与预设的期望间距差异最小,由此设计代价函数为

式中:wd为距离偏差权重参数;Δdt为实际间距与期望间距的跟踪误差。从而可得总的代价函数为

同时由于控制量及增量需要符合执行机构的客观要求,因此对控制量及控制增量不等式约束如下:

则在当前控制周期k 最终发送给车辆底层执行器的控制量如下:

3 参数自适应优化的鲁棒控制器

3.1 鲁棒局部反馈控制器

鲁棒局部反馈控制器用于消除有人领航车紧急加减速和紧急转向控制输入、无人跟随车系统模型不确定性和外部环境的扰动。基于1.3 节建立的无人履带车运动学模型建模结果,设具有建模误差的实际系统为

式中:dk为实际系统未建模部分的系统扰动误差。MPC 控制器对应名义系统为

将实际系统与名义系统做差,可得表征扰动不确定系统的误差转移方程为

为保证上述系统的渐进稳定性,设计鲁棒控制器线性状态反馈控制率为ue,k=Kξe,k,并假设扰动误差dk=Bωωk,则扰动不确定系统可表述为

式中:ωk为具有单位协方差的零均值白噪声;Bω为有界噪声标准差矩阵。

为使系统极点均位于D(q,r) 内,D(q,r) 表示左半复平面的中心在-q +j0(q >0)、半径为r(r <q)的圆盘,则可以通过求解如下线性矩阵不等式问题[24]。

当存在对称正定矩阵P 和矩阵Y 使得该问题有解,则ue,k=KLMIξe,k,KLMI=YP-1可使系统渐进稳定,且满足上述要求,证明如下:

将线性矩阵不等式基于Schur 补定理进行展开整理,可得

式中:Am=Ak+BkKLMI,Am为反馈后闭环系统矩阵。从而有

根据Lyapunov 稳定性理论可知,矩阵(Am+qI)/r 的特征值均在单位圆内,因此Am的极点均在圆盘D(q,r) 内。同时根据式(35) 易得0,即系统渐进稳定,证毕。

3.2 有界扰动和鲁棒不变集确定

对于基于线性矩阵不等式求解的鲁棒局部反馈控制器,扰动误差的边界是控制器的重要参数。本文将利用无人车辆历史测试数据中系统真实状态与名义系统预测模型输出的系统状态作差求解有界扰动,偏差求解如下:

式中:ξk-1与uk-1分别为在k -1 时刻记录的车辆状态量和控制量。需要说明的是,上述历史测试数据是以当前时刻为起点向前固定时段的车辆实时反馈数据,并作实时更新以确定在不同工况下的状态偏差和扰动边界。对在某一工况下的历史数据进行计算,可得图7 所示一系列状态偏差值,取状态偏差值的最大值作为系统的噪声边界dbd:

由此,确定系统的扰动边界如下:

由图7 可知,状态偏差的均值近似为0。因此将上述系统噪声近似简化为零均值白噪声,并对扰动边界进行适当放缩以权衡系统的鲁棒性和保守性,可以确定有界噪声的标准差矩阵为

图7 模型一步预测误差Fig.7 Frame diagram of the model predictive co-controller

式中:α 为-1~1 的鲁棒边界放缩系数。

在已得到反馈控制律KLMI的基础上计算系统状态偏差的鲁棒不变集。对于状态偏差的闭环系统方程:

式中:Reachf,k表示第k 个控制周期状态偏差的鲁棒不变集。在第k+1 个控制周期状态偏差的鲁棒不变集如下:

式中:⊕表示集合求并运算。通过对上述步骤的循环计算,直至Ωk+1=Ωk或到达循环次数时,将Ωk作为系统状态偏差的鲁棒不变集Z,即

鲁棒不变集的具体计算流程如图8 所示。

图8 鲁棒不变集计算流程伪代码Fig.8 Computation flow pseudo code of the robust invariant set

3.3 名义模型预测控制器设计

名义模型预测控制器使用2.2 节的MPC 控制器,并在约束中加入对名义状态量和控制量的收紧约束,以保证RMPC 的稳定性条件。对名义模型预测控制器的鲁棒性约束如下:

式中:⊖为集合求相对补集运算。

名义模型预测控制器的数学描述如下:

根据优化问题求解器求解名义模型预测控制器的最优控制量,得到控制量序列如下:

则RMPC 控制器在第k 个控制周期的最终控制量如下:

将控制量uk发送至无人履带车底层执行器,并在下个控制周期重复上述控制器计算过程。

3.4 控制器参数的贝叶斯优化

RMPC 控制器中鲁棒边界放缩系数α 和距离偏差wd、横向偏差we、航向偏差wθ、控制量wu以及其变化率wΔu5 个权重系数待优化调整。使用贝叶斯优化方法对上述参数参数优化[25],如图9 所示。

图9 基于贝叶斯优化的参数自优化框架图Fig.9 Frame diagram of parameter self-optimization based on Bayesian optimization

考虑到有人领航与无人跟随编队任务中路径跟踪和间距保持的需求,建立如下全局目标函数:

式中:wbo,e为全局目标函数横向偏差项系数;wbo,d为全局目标函数间距偏差项系数。通过调整优化参数矩阵WBo=[wd,we,wθ,wu,wΔu,α]T使得全局目标值最小:

式中:Ω 为保证控制器稳定的参数有界域。由于全局目标函数的梯度及凹凸性等性质未知,假设全局目标函数JG为高斯过程:

式中:μ(WBo) 为高斯过程的均值函数;为高斯过程的协方差函数。

设NBo次采样的参数集为次计算的全局目标值,并对采集到的样本数据集(Θ,Υ) 进行高斯过程回归,得到替代模型高斯过程的后验均值和后验方差,并由上置信边界采集函数得到下一次迭代建议采样优化参数WBo。贝叶斯优化算法伪代码如图10 所示。

图10 贝叶斯优化算法伪代码表Fig.10 Pseudo code of the Bayesian optimization algorithm

4 试验验证

为证明本文控制算法的有效性,试验设计分为仿真与实车两部分进行试验验证。仿真实验使用V-REP 仿真平台和ROS 系统联合仿真进行,实车试验使用一辆有人东风猛士越野车和一辆双侧独立电驱动中型无人履带平台。

4.1 ROS-VREP 联合仿真

仿真实验使用一辆有人轮式车和两辆无人履带车,车辆平台参数如表1 所示。

表1 各平台实验参数Table 1 Parameters of each platform

仿真实验在V-REP 软件中建立两种车辆仿真模型如图11 所示,同时建立包括直线、直角弯、S 形弯和U 形弯等典型行驶工况的仿真场景,仿真场景及参考路径如图12 和图13 所示。选用MPC 和RMPC 两种控制器进行对比仿真,并且在对比仿真之前使用贝叶斯优化确定控制器的待优化参数。

图11 ROS-VREP 联合仿真车辆模型Fig.11 ROS-VREP co-simulation vehicle model

图12 ROS-VREP 联合仿真场景Fig.12 ROS-VREP co-simulation environment

图13 有人车与无人车参考路径Fig.13 Reference paths for manned and unmanned vehicles

贝叶斯优化试验中使用RMPC 控制器,并根据控制器全局目标函数RMPC 中控制器参数进行优化。全局目标函数横向偏差项系数和间距偏差项系数分别为8 和1,贝叶斯优化结果和RMPC 各优化参数如图14 所示。

图14 贝叶斯优化结果Fig.14 Bayesian optimization results

对比贝叶斯优化结果,选取全局目标值最低结果作为仿真实验和实车试验控制器参数值,参数如表2 所示。

表2 控制器参数Table 2 Parameters of the controller

为验证控制器在不确定扰动下MPC 与RMPC两种控制器的控制效果,设计图15 所示场景中的仿真实验,并对控制器在沿路径长、横向偏差和航向偏差3 个方向施加相同的有界随机扰动。图15(a) 中①~④表示路径中的4 个代表位置。3 个方向扰动最大边界值分别为0.3 m、0.25 m 和6°,控制效果如表3 和图16 所示。

图15 参考路径和场地图Fig.15 Reference paths and field map

结合表3 和图16 可以得出,在安全性方面,普通MPC 控制器下的无人车1 非常接近鲁棒边界,无人车2 无法抵抗不确定性扰动而在位置⑤和位置⑦处超过鲁棒边界,大大增加了无人车的碰撞风险。而RMPC 控制器在相同扰动下,可以保证两个无人车在鲁棒边界内行驶。在速度控制和间距保持方面,虽然RMPC 控制器具有更大的间距绝对偏差(如位置⑦) 和误差均值,但不影响控制器任务完成能力且可以一定程度上提高控制器的安全性能。此外,由统计数据分析可知,在不确定性扰动下,无人车1 和无人车2 的RMPC 控制器相比MPC 控制器,横向绝对偏差均值能减小17.284%和11.696%,航向绝对偏差均差能减小11.852%和5.101%。

图16 领航跟踪控制效果Fig.16 Piloting and tracking control effects

表3 仿真实验结果统计Table 3 Simulation results

综上所述,在不确定性扰动下相比与普通MPC控制器,RMPC 控制器在保证安全性的前提下,降低较小的间距保持功能,并能提高无人车的路径跟踪功能,有更好的控制效果和更优异安全性能和通过性能。

基于ROS-VREP 的联合仿真对算法进行了初步的验证,为实车试验的设计提供了重要参考。

4.2 实车验证

实车试验使用1 辆东风猛士有人车和1 辆双侧独立电驱动中型无人履带车进行试验。东风猛士车辆参数如表4 所示。无人履带车搭载了卫星信号接收机、激光雷达、码流相机、感知定位工控机、规划控制工控机及其他必要的软硬件。规划控制工控机处理器为Intel® CoreTMi7-6820EQ,装有Linux 操作系统,通过致远电子的CANET 设备与车辆底层进行信息交互。

表4 车辆参数Table 4 Vehicle parameters

实车试验选择在内蒙古阿拉善某测试场的越野、水泥铺路面组合进行测试验证,试验天气为常规试验天气。有人车和无人车的全局参考轨迹和实际场地见图15。

实车试验使用MPC 和RMPC 控制器进行对比实验,有人车和无人车行驶轨迹、行驶速度、间距偏差和跟踪偏差如图17 和表5 所示。

表5 实车试验结果统计Table 5 Experimental results

图17 领航跟踪实车试验跟踪结果Fig.17 Piloting and tracking real vehicle test tracking results

通过对比两种控制器的跟踪效果可以得出,在间距保持方面,两种控制器均通过调速与有人车保持了一定的间距,且最终都没有突破安全间距边界,表明两控制器均有良好的安全性能。在跟踪精度方面相比于MPC 控制器,RMPC 横向绝对偏差降低了27.2%,航向绝对偏差降低了4.1%;在扰动的影响下,两控制器的航向偏差都存在振荡现象,但RMPC控制器下的抵抗振荡效果要优于MPC 控制器。

综上所述,两种控制器均能在实车场景下完成领航跟踪任务中的间距保持功能。同时RMPC 控制器具有更高的跟踪精度和更小的振荡效果,从而避免车辆冲出道路边界,减小碰撞风险,更好地完成编队任务。

5 结论

本文针对有人与无人车辆编队控制中,有人领航车紧急加减速和转向控制输入的扰动问题,建立了参数自优化的有人与无人车辆编队RMPC 算法,保证控制在扰动下的鲁棒稳定性。同时进行了ROS-VREP 仿真实验和实车试验的算法验证。得出主要结论如下:

1) 通过建立具有鲁棒局部反馈的RMPC 控制器并确定扰动噪声和鲁棒边界,有效地抑制了来自有人领航车紧急加减速和转向控制输入、无人跟随车系统模型不确定性和外部环境的扰动。

2) 使用贝叶斯优化的方法对鲁棒边界放缩系数和代价函数权重系数进行参数自优化,提升了RMPC 控制器的跟踪性能和鲁棒性能。

3) ROS-VREP 仿真实验和实车试验结果表明,与传统MPC 控制器相比本文设计的RMPC 控制器,在跟踪精度和抵抗扰动方面有明显的提升。控制器减少了横向和航向误差,并且降低了扰动造成的振荡和不稳定性,试验证明了本文提出方法的有效性和可行性。

猜你喜欢

领航扰动无人
Bernoulli泛函上典则酉对合的扰动
领航
一类四次扰动Liénard系统的极限环分支
带扰动块的细长旋成体背部绕流数值模拟
领航
领航海外
(h)性质及其扰动
无人战士无人车
反击无人机
领航海外