APP下载

基于权值惩罚法自适应人机协同避撞策略

2022-06-14汪选要魏星谢东徐同良

科学技术与工程 2022年13期
关键词:人机侧向权值

汪选要, 魏星, 谢东, 徐同良

(1.安徽理工大学机械工程学院, 淮南 232001; 2. 陕汽淮南专用汽车有限公司, 淮南 232008)

随着人工智能与传感器测试技术的飞速发展, 智能化汽车逐渐代替或辅助人进行紧急工况的决策与处理。汽车在高速公路行驶,遇到前车突然制动这一紧急工况,由于车速较高且驾驶员反应时间短,易造成两车碰撞或车辆失控事故,且涉及车辆数越多,造成损失也越大[1]。为解决高速车辆避撞问题,中外学者在汽车主动避撞控制方面取得诸多研究成果。在辅助驾驶系统自动避撞方面,刘溯奇等[2]设计了变预测时域轨迹跟踪控制器,提高了车辆轨迹跟踪对车速的自适应性;华一丁等[3]基于时间与误差绝对值乘积的积分设计了鲁棒比例-积分-微分(proportion-integration-differentiation,PID)控制器,保证了车辆在换道过程的稳定性与舒适性;任玥等[4]提出一种分层避撞控制方法,上层用人工势场函数描述车辆碰撞风险,基于模糊预测理论规划避撞路径,下层基于最优控制理论进行路径跟踪,实现汽车主动避撞;袁伟等[5]提出转向制动协调避撞控制方法,结合纵向行驶安全系数和碰撞时间倒数指标,弥补了现有汽车避撞控制策略与碰撞风险评价指标单一的不足;汪等[6]融合实时交通环境信息与车辆状态信息提出一种避撞模式分类方法,协调制动与转向系统,设计基于数据驱动的自学习协调控制策略,在完成避撞的同时保证了车辆的稳定性。

以上研究大多采用辅助驾驶系统代替人完成操作,无法保证驾驶员实时在环。由于车辆长时间脱离驾驶员操控,驾驶员易产生慌乱和失控感,针对此类问题,人机协同驾驶被提出。Schnelle等[7]基于驾驶员行为建立个性化驾驶员模型,实现人车一体化避撞控制;Na等[8]基于动态博弈论,对驾驶员建立了分散型、非合作型纳什、非合作型斯塔克尔伯格和合作型帕累托4种控制模式,用于模拟驾驶员与考虑驾驶员目标路径的辅助系统间的交互;Nguyen等[9]通过在道路车辆系统中引入实测的权重参数,根据驾驶员操作实时进行辅助控制,实现驾驶员与辅助系统的横向共享控制。

驾驶员与道路条件具有多样性,避撞过程中不仅仅有单一的碰撞风险。上述研究极少涉及对不同驾驶特性的驾驶员的权值分配问题,且对驾驶风险的评价指标较为单一。为此,现引入事故风险度描述避撞过程所受风险,提出驾驶员权值惩罚法,通过设计模糊控制器,协调驾驶员与辅助驾驶系统共同避撞。

1 表征驾驶风格的驾驶员模型

为保证驾驶员实时在环,使用驾驶员模型模拟避撞过程中的驾驶员行为特性。根据最优曲率预瞄理论[10]可知,驾驶员在驾驶过程中通过预瞄期望路径,来获得车辆与预瞄点的侧向偏差,接着通过2/T2这个理想环节得到当前最优侧向加速度,通过类似滚动更新的过程不断跟踪路径。对其跟踪精度建立评价指标函数为

(1)

上述评价指标仅描述了以最小跟踪误差为原则的驾驶员模型,而在避撞过程中,不同的驾驶员有不同的决策意愿。驾驶风格激进的驾驶员,会选择较大的侧向加速度快速逼近预瞄点,得到最小的跟踪误差;而驾驶风格保守的驾驶员,则会选择较大的跟踪误差,换取较小的侧向加速度,保证驾乘的稳定性与舒适性[11]。侧向加速度最小指标为

(2)

式(2)中:a为侧向加速度,m/s2。

结合式(2)和式(3)得到单点预瞄意愿决策模型。对于不同的驾驶风格,通过引入权重p和q,建立驾驶员对跟踪误差与侧向加速度的决策意愿指标为

(3)

(4)

此时驾驶员对侧向加速度的决策,不再是通过2/T2这个理想环节,而是根据侧向加速度决策意愿函数,即

(5)

驾驶员的期望侧向加速度对转向盘转角增益与车速的关系为

(6)

式(6)中:vx为汽车纵向车速,m/s;l为汽车的轴距,m;Is为转向盘转角到车轮转角的转向系角传动比;K为汽车的稳定性因数,s2/m2。由于车辆的不足转向特性,K一般取为0.002~0.004 s2/m2。

驾驶员转向避撞过程可看作车辆由自车道向侧向车道的单移线过程,将预瞄点侧向偏差设为

(7)

式(7)中:φ为汽车航向角,rad。

考虑驾驶员的生理限制,选择驾驶员神经反应滞后时间td,用传递函数exp(-tds)表示;驾驶员操作过程的肌肉动作滞后时间th,用传递函数1/(1+ths)表示。最终得到含驾驶风格的驾驶员模型如图1所示。

图1 表征驾驶风格的驾驶员模型Fig.1 Driver model with driving style

2 主动避撞系统

使用线控转向系统,利用其转角叠加特性进行自动避撞控制。这种控制包括3个步骤:辅助系统实时检测车辆和道路边界;当探测到即将发生的碰撞时,辅助系统控制器规划用于避免碰撞的目标路径;辅助系统控制器最终通过转向操作来引导车辆沿着目标路径行驶。

2.1 避撞模式切换策略

为确定辅助系统的介入时机与介入方式,基于距离策略,将自车与前车碰撞前的一段距离划分为主动避撞系统反应区如图2所示,反应区分为预警反应区和强制反应区。

当自车与前车距离Sw辅助系统进行预警反应,对驾驶员发出警报;距离Sb辅助系统进行强制反应,根据驾驶员操作判断驾驶员是否有变道意图,驾驶员有变道意图,辅助系统为协同避撞模式;若无变道意图,进入自动避撞模式。

图2 辅助系统反应区间Fig.2 Assistance system reaction zone

将满足路面附着系数μ的最短制动距离设为Sb,考虑一定的安全区间Ss,其表达式为

(8)

考虑驾驶员反应时间td与操作时间th,预警反应区的长度为

Sa=vx(td+th)

(9)

式(9)中:td为0.4~0.8 s,th为0.05~0.2 s。

2.2 横向控制算法

采用一元七次多项式的函数进行换道路径规划,表达式为

(10)

式(10)中:yH为换道横向距离,m;te为换道完成时间,s。

采用模型预测控制器(model predictive control,MPC) 跟踪规划路径,其滚动优化更新的优点可得到实时最优控制量,且其对模型精确度要求不高,鲁棒性好。

基于经典二自由度线性车辆动力学模型,可得状态方程为

(11)

式(11)中:vy为车辆侧向速度,m/s;Cf、Cr分别为前、后轮的侧偏刚度,N/rad;Iz为车辆绕z轴的转动惯量,kg·m2;δ为前轮转向角,rad。

大地坐标系中车辆质心处速度可表示为

(12)

式(12)中:xx、yy分别为大地坐标系中车辆质心纵向和横向坐标;x、y分别为车辆坐标系下汽车质心纵向和横向坐标。

选取状态变量为X=(vy,r,yy,φ)T,输出量Y=(yy,φ)T,控制量为前轮转角U=(δ,0,0,0)T,由式(11)得

(13)

式(13)中:

取采样时间Ts=0.01 s,将连续状态方程离散化,得

(14)

取预测步长为P,控制步长为M。则在k时刻的系统预测输出为

(15)

式(15)中:y(k+i)为第i时刻对k+i时刻的系统预测输出,i=1,2,…,P。

将预测方程写为

Y(k+1|k)=SxX(k)+SuU(k)

(16)

式(16)中:Y(k+1|k)为预测输出变量集;U(k)为控制输入变量集,且

定义期望路径的横向位移Ydes(k+i)为

(17)

式(17)中:ydes(k+i)为第k+i时刻的期望横向位移,i=1,2,…,P。

为保证车辆在避撞控制中相对规划路径的偏差较小,实现有效避撞,同时使系统控制量较小以保证避撞的平稳和舒适,建立优化目标函数为

(18)

式(18)中:Γy、Γu分别为位移和转向角权重系数,其中

(19)

通过滚动优化策略,将控制时域内的第1个值作为避撞的转角输入增量,即

(20)

使用MATLAB软件的mpctool工具箱进行仿真时,令预测时域P=10,控制时域M=3,系统输入约束umax=0.523,umin=-0.523,Δumax=0.262,Δumin=-0.262,权重Γy=diag(1,1,…,1),Γu=diag (1,1,…,1)。

3 人机协同控制策略

一般情况下,认为人机共驾过程中的控制权分配是一个动态的过程,驾驶员与控制器所获得的车辆驾驶权大小会随着车辆所处的不同环境而不断变化,最终目的是在保证车辆安全的前提下尽量提高驾驶员的舒适性以及操纵性[12]。

受决策意愿影响,驾驶员表现出不同的驾驶风格;受道路条件影响,车辆稳定边界发生变化;车辆避撞过程中,所受风险也在实时变化。为适应上述因素的变化,针对人机协同控制问题,提出一种驾驶员权值惩罚法。

3.1 基于先验条件的惩罚权值

驾驶员避撞过程中,其表现与“人”“路”因素紧密相关。将驾驶员参数p/q、T与路面附着系数μ看作“先验条件”,即提前给定或测出。将协同避撞模式下的驾驶员初始权值设为1,考虑到不同驾驶风格、预瞄时间与道路条件带来的风险,下面根据p/q、T、μ对初始权值进行先验条件的“惩罚”。

由图3可知,预瞄时间T越小,驾驶员期望侧向加速度越大;p/q越大,期望侧向加速度也越大,但同时受T的影响,T越大,p/q对于驾驶员期望加速度的决策影响越小。取T=1时,将复杂函数式(4)近似为

(21)

式(21)中:λ1=-0.59,λ2=0.32,λ3=0.66。

图3 侧向加速度决策意愿Fig.3 Lateral acceleration decision willingness

图4 预瞄时间关系图Fig.4 Preview timing diagram

(22)

同时考虑到当路面附着系数μ较大时,能提供较大的侧向力,可相应减少驾驶员惩罚权值。综上所述,得到基于先验条件的惩罚权值为

(23)

为防止辅助系统介入强度过大,设定Pe1取值范围为0~0.1,惩罚系数kT=0.1,kp/q=0.1。选择预瞄时间Tpe=1.2 s、风格权重p/qpe=5作为惩罚基准值。

3.2 基于事故风险度的惩罚权值

上述基于先验条件的惩罚权值,仅仅是对驾驶员与道路条件可能引起危险的提前惩罚,而驾驶员的实际操作依然可能引起不同的风险。引入事故风险度[13],根据驾驶员实际避撞中引起的风险对驾驶员权值进行实时的惩罚。在避撞过程中,可能发生的事故为碰撞前车Pcol、车辆失稳Psli(主要指侧滑)、越出车道Pcro。

碰撞风险主要来自前车紧急制动时自车驾驶员未及时操作或操作不足,导致自车车身前部与前车碰撞或剐蹭。用自车车身右前角p2与前车左后角p4′的距离dp2-p4′描述碰撞风险度为

(24)

式(24)中:ds为碰撞安全间距,取0.5 m。

侧滑风险主要来自驾驶员慌乱时的过度操作,由于转向剧烈导致车辆横摆角速度超出稳定边界发生侧滑。通过车辆实时横摆角速度与稳定边界值之比描述车辆侧滑风险度为

(25)

式(25)中:r为横摆角速度,rad/s;rss为横摆角速度稳定边界值,rad/s。

越出车道风险主要来自驾驶员未及时回正转向盘或回正不足,导致车身触碰或越出侧向车道边界。经典的判断车辆越出车道的指标为TLC阈值,车辆避撞时横越车道时间为

(26)

式(26)中:W为车道宽度;y为车辆横向位移;vy为侧向速度。

根据驾驶员的神经肌肉反应时间设定TLC阈值[14]为

tth=td+th

(27)

得到车辆越出车道风险度为

(28)

根据上述3种事故风险度,得到基于事故风险度的惩罚权值Pe2,设定Pe2取值范围为0~0.1。3种事故风险对权值的影响无法用明确的函数关系表示,通过设计模糊控制器对风险度惩罚权值进行实时调节。其中Pcol、Psli、Pcro基本论域都为[0,1]。依据经验,上述3种事故风险度增大时,都应增大相应事故风险度惩罚权值。模糊控制器的输入和输出子集均为{S,M,L},模糊规则如表1所示。

输入隶属度函数如图5(a)~图5(c)所示,描述3种事故风险度的隶属度;输出隶属度函数如图5(d)所示,描述由事故风险度确定的基于风险度的惩罚权值,其对应的推理规则表如表1所示。

表1 模糊规则表Table 1 Fuzzy rule table

图5 隶属度函数Fig.5 Membership function

最终得到惩罚权值即辅助驾驶系统的权值为

Pa=Pe1+Pe2

(29)

驾驶员权值为

Pd=1-Pa

(30)

则驾驶员与辅助系统协同输出转角为

δ=δaPa+δdPd

(31)

式中:δa为辅助系统转向角;δd为驾驶员转向角。

4 基于CarSim与Simulink联合仿真

通过MATLAB/Simulink搭建驾驶员模型与模型预测控制器如图6所示,避撞过程中,由驾驶员模型与辅助系统控制器通过叠加转角,共同输入CarSim对车辆进行控制,自动避撞模式下,辅助系统控制器权值为1,即完全由辅助控制器控制车辆;协同避撞模式下的人机权值根据避撞过程中的事故风险度通过模糊控制器进行实时调节。

通过CarSim与Simulink搭建人-车-路联合仿真场景,各参数选择如下:驾驶员反应与神经肌肉延迟为td=0.5 s,th=0.05 s,车道宽度即换道过程横向距离W=yH=4 m。仿真车辆模型选择C-Class/Hatchback车型,其车辆动力学模型各项参数如表2所示。

避撞轨迹如图7所示,虚线表示驾驶员单独避撞时车辆质心轨迹,实线为人机协同避撞轨迹。如图7(a)和图7(b),当μ1=0.75,路面附着系数较高,驾驶员参数[p/q,T]分别取[4,0.9]、[4,1.3]、[9,0.9]和[9,1.3]时,驾驶员单独避撞过程中,其

图6 人机协同避撞联合仿真Fig.6 Human-machine cooperative collision avoidance co-simulation

表2 车辆动力学参数Table 2 Vehicle dynamics parameters

图7 避撞轨迹图Fig.7 Collision avoidance trajectory

车辆质心轨迹相对于侧向车道中心线的最大偏移量分别为[1.39,0.48,1.30,0.36] m;人机协同避撞下的最大偏移量分别为[0.76,0.43,0.17,0.26] m;由图7(c)和图7(d)可知,取低附着系数μ2=0.5,驾驶员单独避撞时其轨迹相对最大偏移量为[1.56,0.53,1.84,0.42] m,协同避撞下的最大偏移量为[0.46,0.32,0.18,0.15] m。通过以上结果可得出,辅助系统的介入能显著减小避撞轨迹的偏移量,使避撞曲线更平稳。

各工况下的惩罚权值即辅助系统权值曲线如图8所示,根据上述权值惩罚法可知,其权值包含两部分:基于先验条件的惩罚权值(对应曲线的初值)和基于事故风险度的惩罚权值(对应曲线的实时变化值)。相同条件下,预瞄时间越小,惩罚权值的初值越高;驾驶风格越激进,惩罚权值的初值相应增加;对比图8(a)和图8(b),相同驾驶风格与预瞄时间下,道路附着系数越小,惩罚权值的初值也越高。同时,惩罚权值的实时值随不同程度的事故风险度实时变化,高速避撞过程中最易发生侧滑风险,当侧滑风险度最大时惩罚权值曲线出现峰值。以上结果表明,惩罚权值分配方案可适应不同的驾驶员、道路条件和实时风险度。

为探究协同避撞对车辆稳定性的影响,选择低附着系数μ=0.5,车速为108 km/h,驾驶员预瞄时间为0.9 s的工况下进行车辆稳定性仿真,驾驶员与人机协同避撞过程中车辆质心侧偏角β与横摆角速度r相图如图9所示,此时稳定边界值|rss|=0.185 rad/s,单独避撞时,保守风格驾驶员控制车辆最大横摆角速度为rmax=0.187 rad/s[图9(a)],激进驾驶风格驾驶员为rmax=0.237 rad/s[图9(b)],都超出稳定边界。在协同避撞模式下车辆最大横摆角速度分别减小为0.151 rad/s和0.185 rad/s,都在稳定边界内。通过上述结果可得,协同避撞策略能有效提高车辆行驶稳定性。

图8 辅助系统权值Fig.8 Assistance system weight

图9 稳定性相图Fig.9 Stability phase diagram

5 结论

针对驾驶员与辅助系统协同避撞权值分配问题,提出了一种自适应人机协同避撞策略。搭建了CarSim/MATLAB联合仿真平台,建立不同风格的驾驶员模型,同时设计模型预测控制器进行人机协同避撞仿真验证。

仿真结果表明,所提出的自适应人机协同避撞策略,能有效适应不同驾驶员、道路条件,同时针对实时事故风险度可动态调节人机权值。通过对比驾驶员单独避撞与人机协同避撞轨迹,验证了协同避撞策略的安全性与有效性。在低附着系数路面上进行避撞仿真,结果表明该控制策略可有效提高车辆高速避撞的稳定性。

研究中仅考虑了线控化转向系统的人机协同问题,而在实际工程中驾驶员通过转矩控制车辆,下一步工作将考虑实车上应用广泛的电动助力转向系统与驾驶员的协同问题。

猜你喜欢

人机侧向权值
人机“翻译员”
一种融合时间权值和用户行为序列的电影推荐模型
一起飞机自动改平侧向飘摆故障分析
军航无人机与民航航班侧向碰撞风险评估
从内到外,看懂无人机
CONTENTS
程序属性的检测与程序属性的分类
基于权值动量的RBM加速学习算法研究
“人机大战”人类智慧遭遇强敌
未来深空探测中的人机联合探测