基于二次Lasso回归的纵向驾驶员模型研究
2022-11-14刘通曾小华李泰祥宋大凤庄晓
刘通 曾小华 李泰祥 宋大凤 庄晓
摘要:为了更好地模拟实际驾驶员行为,提出基于二次回归和Lasso回归方法的纵向驾驶员回归模型.通过采集纵向驾驶行为数据,提取可能影响驾驶行为的状态参数,进而建立二次回归驾驶员模型;面向多参数回归模型中的多重共线问题,采用Lasso回归方法进行状态参数筛选;结合筛选数据建立二次回归驾驶员模型.为了验证模型的有效性,与PI驾驶员模型和一次Lasso回归驾驶员模型进行仿真对比.仿真结果表明,相较于其他两种模型,所建立的驾驶员模型具备良好的工况跟随效果,同时能较好地反映实际驾驶行为特征.
关键词:车辆性能;回归分析;纵向驾驶员模型;Lasso回归;工况跟随
中图分类号:U469.79文献标志码:A
Research on a Longitudinal Driver Model Based on Quadratic-Lasso Regression
LIU Tong1,ZENG Xiaohua1,LI Taixiang2,SONG Dafeng1,ZHUANG Xiao3
(1. State Key Laboratory of Automotive Simulation and Control,Jilin University,Changchun 130025,China;2. CRRC Qingdao Sifang Rolling Stock Research Institute Co.,Ltd.,Qingdao 266031,China;3. FAW Jiefang Qingdao Automobile Co.,Ltd.,Qingdao 266043,China)
Abstract:To better simulate the real driver behavior,a longitudinal driver regression model based on quadratic regression and the Lasso regression method is proposed. Firstly,by collecting longitudinal driving behavior data,state parameters that may affect driving behavior are extracted,and a quadratic regression driver model was established. Then,the Lasso regression method is applied to screen the state parameters for the multicollinearity problem in the multi-parameter regression model. Finally,a quadratic regression driver model is developed based on the screened data. In order to verify the effectiveness of the model,a simulation comparison is made between the proposed model and PI driver and Lasso regression driver models. The simulation results show the driver model developed here not only has a better effect on driving cycle traction when compared with the other two models but can also better reflect the characteristics of actual driving behavior.
Key words:vehicle performance;regression analysis;longitudinal driver model;Lasso regression;driving cycle following
在整車控制策略设计过程中,基于仿真模型进行控制策略开发可以显著节约研发时间和成本.目前,车辆控制策略仿真模型可分为前向模型和后向模型.相较于后向模型,前向模型的控制信号和功率流均为正向传递,符合车辆实际使用情况.通过引入驾驶员模型,前向模型中在线控制策略开发和测试更易实现[1-2],实车整车控制策略开发和验证过程中多采用前向仿真模型.在台架或仿真测试过程中,车辆轮速或仿真车速与目标车速的偏差,即工况跟随偏差对油耗有显著影响.此外,驾驶风格对整车油耗的影响也不可忽视,相同的控制策略和测试条件下,不同驾驶风格对车辆油耗的影响差异可高达40%[3].因此,构建纵向驾驶员模型时,除了工况跟随偏差需要满足国标要求外[4],加速与制动踏板等输出信号也要尽可能符合实际驾驶员的操纵行为,以实现合理评价车辆能耗的目的.
目前,基于PI控制的驾驶员模型是最常用的驾驶员模型.PI驾驶员模型以实际车速和目标车速偏差为输入,通过调整PI参数得到合适的踏板输出,进而实现工况跟随[5].为了改进简单PI驾驶员模型参数难以确定的缺点,文献[6]采用遗传算法对PI参数进行优化,在给定工况下实现了良好的工况跟随效果.有研究人员[7-8]采用模糊PI控制和单神经元自适应PID控制建立驾驶员模型,能够实现控制参数的在线自整定,具有较好的适应性和鲁棒性.但是,以上模型仅以工况跟随误差最小为目标,均未考虑模型特征和实际驾驶行为之间的差异.
面向复杂的驾驶行为决策问题,有研究人员提出采用智能控制算法建立驾驶员模型:文献[9]采用局部神经网络和远端学习控制方法建立面向驾驶风格的驾驶员模型,充分考虑了环境因素对驾驶行为的影响,既保证了良好的车速跟随效果,又保留了原始数据中的驾驶风格.根据驾驶员预瞄行为特征,沈沛鸿等[10]建立了基于自适应网络模糊推理方法的纵向驾驶员模型,实现了良好的工况跟随效果.但是,实际的驾驶行为往往由多种影响因素决定,以上研究并未充分考虑.另外,智能控制算法尽管能较好地模拟驾驶行为,但模型较为复杂,会显著影响优化效率.
本文以一款行星式混合动力物流车为研究对象,通过转鼓试验台试验,采集整车和驾驶行为数据,建立二次线性回归驾驶员模型,采用Lasso回归方法筛选变量并优化回归模型;最后,建立整车仿真模型、PI驾驶员模型和一次Lasso回归驾驶员模型,对3种不同的驾驶员模型进行仿真验证,并论述了本文所建模型的有效性和合理性.
1纵向驾驶行为数据采集
纵向驾驶行为是决定车辆纵向运动特征的驾驶员操纵行为,具体为驾驶员操纵加速踏板、制动踏板、离合器、变速器和驻车制动器的行为.本文所研究的行星式混合动力物流车动力系统无变速器和离合器,在进行循环工况测试时,驾驶员的纵向操纵信号只有加速和制动踏板开度信号.研究样车及转鼓试验平台如图1所示.驾驶员在操纵踏板跟随目标工况时,正前方放置工况跟随显示器,可动态显示目标工况车速和实际车速轨迹,驾驶员通过观察车速跟随偏差,实时调整踏板开度以保证良好的工况跟随效果.鉴于驾驶过程中历史车速、加速度、驾驶员行为信息对驾驶员决策有显著影响,本研究从实车控制器中提取车速、加速踏板开度、制动踏板开度等信息,从转鼓试验台提取目标车速、加速度信息.
样车台架测试由熟练驾驶员进行操作,其驾驶行为与多数驾驶员的平均驾驶水平相吻合,然后按照国标GB/T 27840—2021的要求进行10次C-WTVC工况测试[4].测试数据通过整车CAN网络和台架数据进行采集.
根据台架测试驾驶员反馈,历史驾驶行为、历史车速状态、未来目标工况对驾驶行为均有影响,且影响时间不超过5 s.驾驶员模型初选输入参数如表1 所示.驾驶员在操纵过程中加速和制动踏板不存在同时踩下的情况,本研究将两踏板信号统一为踏板开度,以减少参数数量,提高模型运行效率.当踏板开度大于0、制动踏板开度为0时,表示为加速踏板开度,车辆处于驱动状态,反之亦然.
2基于二次Lasso回归的驾驶员模型
2.1二次回归驾驶员模型
驾驶员行为决策具有复杂的非线性特征,输入变量之间存在一定交互关系.兼顾模型效率和非线性特性,本文采用二次回归模型.为了消除变量间量纲不同、自身变异或者数值相差较大所引起的误差,首先需要对影响驾驶行为的多项参数进行标准化处理,然后建立二次回归模型:
式中:x1,x2,…,xp为p个标准化后的模型自变量,按次序和表1中变量相对应;y为因变量;β0为回归常数;β1,β2,…,βp为一次项回归系数;β1,1,β1,2,…,βm,m为二次项回归系数;ε为随机误差[11];二次项xixj(1≤i≤j≤m)包括二次主效应(i=j)和双向交互效应(i≠j)[12],二次项可认为是新的自变量,综合一次和二次项,输入变量由27个初始变量扩展为406个.
在初始建模时,为了尽量考虑所有可能的影响因素,通常会选择尽可能多的自变量.但是多维度自变量容易造成“维数灾难”,使得模型求解困难.另外,高维自变量之间可能存在显著的相关性,建模时容易出现过拟合的问题,进而影响模型性能.因此,有必要对回归模型进行多重共线性检测.方差扩大因子法(Variance inflation factor,VIF)是一种有效的多重共线性验证方法.VIF定义式为:
2.2基于Lasso回归的驾驶员模型优化
针对多重共线问题,本文采用Lasso回归剔除相关性较高的自变量.Lasso回归是一种有效的变量筛选方法,该方法是在岭回归的基础上将惩罚项由L2范数变为L1范数,通过把一些不重要的变量的回归系数缩减为0,以获得稀疏解,进而筛选得到对因变量有显著影响的自变量,并完成参数估计[13].
设因变量y∈R,输入矩阵为X∈Rm,可得Lasso模型[14]:
式中:λ为正则参数或收缩算子;β0、βi为回归系数向量.
Lasso回归惩罚项非连续可导,需要采用求极值解法、坐标轴下降法和最小角回归法等方法进行求解.其中,坐标轴下降法是一种最快解法,但是其变量计算过程只能沿坐标轴进行,而最小角回归法是一种基于前向选择算法和前向梯度算法的变量筛选算法,能够得到更为精确的特征向量,本文采用最小角回归法求解回归系数.由于本研究采集的工况测试数据是典型的小样本数据,因此采用K折交叉验证的方法以充分利用数据信息,取参数K为9(即测试集为9个C-WTVC工况数据),可得式(3)中各參数回归系数随参数A变化轨迹如图2所示,交叉验证均方误差随A变化如图3所示.图3中MSE和误差条分别表示9次训练和测试得到的均方误差和误差限.
从图2可以看出,随着A增大,越来越多的回归系数压缩为0,当A取0.565 0时,回归系数趋于稳定,这时只有28个参数的系数不为0,极大地降低了模型复杂程度.同时由图3可知,当A逐渐增大至0.565 0的过程中,尽管回归均方误差有所增大,但是,在预测误差范围基本保持不变,能够较好地兼顾预测精度和模型效率.综合考虑,最终A取0.565 0,相应28个参数(包括复合参数)及其系数如表2所示,共需要22个初始变量,即建立的驾驶员模型为22元二次回归模型.
从表2中可以看出:1)车速跟随偏差(历史车速跟随偏差以及当前车速和未来目标车速的偏差)对驾驶行为的影响最明显;2)历史踏板开度信息对驾驶行为也有一定程度的影响;3)历史特征和未来目标车速越接近当前决策时刻,对驾驶行为影响越大. 以上分析充分说明驾驶行为同时受到了历史驾驶行为、车辆状态信息以及未来预期状态的影响,体现了驾驶决策的复杂性.
3仿真验证
3.1工况跟随效果对比
为了充分验证二次Lasso回归驾驶员模型的合理性,本文基于MATLAB/Simulink建立了整车仿真模型和实车控制策略模型.为了验证本文提出的驾驶员模型的合理性,基于表1参数构建一次线性Lasso回归驾驶员模型和PI驾驶员模型.将3种驾驶员模型仿真结果和实车测试结果进行了对比,从多个角度分析了各模型优缺点.
驾驶员模型首先应具备良好的工况跟随效果,在此基础上仿真得到的工况跟随偏差和油耗测试结果偏差等指标也应该尽可能接近实车测试结果.仿真结果和台架试验结果如表3所示,不同驾驶员模型工况跟随偏差如图4所示.由于本研究基于多个C-WTVC工况测试结果建立驾驶员模型,仿真结果与单个实车测试工况进行对比是不合理的.因此,图4展示了3种仿真模型单个工况测试结果,未考虑与实车测试工况进行对比.
由表3和图4可以看出,3种驾驶员模型都具有良好的工况跟随效果,车速偏差大于3 km/h的时间均满足国标测试要求.其中,二次Lasso回归驾驶员模型工况跟随偏差大于其他两种模型,但是跟随偏差接近真实驾驶员,油耗相比实车小1.07%,接近实车测试结果.相比之下,PI驾驶员模型工况跟随偏差最小,但是踏板开度波动剧烈,这说明PI驾驶员模型良好的工况跟随效果是通过频繁操纵踏板实现的,和实际驾驶行为差别较大.而激烈的驾驶行为会显著增加油耗,表3中PI驾驶员模型油耗比实车大4.5%,显然不利于车辆燃油经济性分析.此外,一次线性Lasso回归驾驶员模型踏板输出特征与二次Lasso回归驾驶员模型类似,但是油耗和工况跟随效果较实车驾驶员存在较大偏差.
3.2不同驾驶员模型踏板开度分布和台架测试结果对比
为了深入分析不同驾驶员模型输出特征,本文对各驾驶员模型和台架测试驾驶员输出分布进行了量化分析.
如图5所示,本文统计了实车以及各驾驶员模型在不同踏板开度和不同车速下的工作时间分布. 由图5可知,两种基于Lasso回归的驾驶员模型的踏板开度分布相比PI驾驶员模型更接近实车驾驶员.
进一步采用分布相似性评价方法量化对比各模型与实车驾驶员之间踏板输出分布差异.本文以常用的JS 散度(Jensen-Shannon Divergence)作为相似性评价指标.JS散度源于信息熵和KL距离(Kullback-Leibler Divergence).其中,KL距离也是一种度量两个概率分布相似性的指标.假设分布P和Q对应的概率密度函数分别为p(x)和q(x),则两分布的KL距离如式(4)所示,该距离满足非负性.
式中:p(x)≥0;q(x)>0.显然,P和Q的分布越相近,KL距离越小,当两分布相同时,DKL(P,Q)=0.但是,
DKL(P,Q)≠DKL(Q,P),所以KL距离是非对称的.JS散度在此基础上进行了改进,其表达式如下:
可见,JS散度具有对称性,值域为[0,1],相较于KL距离,JS散度能够更确切地判别两个概率分布的差异性.但是JS散度要求p(x)>0,q(x)>0,显然本文中踏板开度分布不满足要求.一种有效的解决方法是对p(x)和q(x)相加极小值ε,使得概率值均大于0,在不明显影响概率分布特征的基础上得到合理的JS散度值.
分别计算各驾驶员模型与实车驾驶员踏板开度分布之间的JS散度值,结果如表4所示.由表4可见,基于二次Lasso回归的驾驶员模型与实车驾驶员的踏板输出分布最为接近.
4总结
本文以一款行星式混合动力物流车为研究对象,通过对3种纵向驾驶员模型的研究和仿真对比,可得出如下结论:
1)基于二次Lasso回歸的纵向驾驶员模型的工况跟随效果较好,满足国标测试要求.
2)与PI驾驶员模型和一次线性Lasso回归驾驶员模型相比,基于二次Lasso回归的纵向驾驶员模型充分考虑了多种因素对驾驶行为的影响,纵向驾驶行为和能耗特征更接近真实驾驶员.
参考文献
[1]王达.增程式电动汽车的动力分布设计方法与控制策略研究[D].长春:吉林大学,2016:29-56.
WANG D. Study on power distribution design method and control strategy of extended-range electric vehicles [D]. Changchun:Jilin University,2016:29-56.(In Chinese)
[2]周云山,贾杰锋,李航洋,等. CVT插电式混合动力汽车经济性控制策略[J].湖南大学学报(自然科学版),2016,43(8):25-31.
ZHOU YS,JIAJF,LIHY,et al. Economic control strategy for a plug-in hybrid electric vehicle equipped with CVT[J]. Journal of Hunan University (Natural Sciences),2016,43(8):25-31. (In Chinese)
[3] BINGHAM C,WALSH C,CARROLL S. Impact of driving characteristics on electric vehicle energy consumption and range[J]. IET Intelligent Transport Systems,2012,6(1):29-35.
[4]重型商用车辆燃料消耗量测量方法:GB/T27840—202[S].北京:中国标准出版社,2022:2-3.
Fuel consumption test methods for heavy-duty commercial vehicles:GB/T 27840—2021 [S]. Beijing:China Standard Press,2022:2-3.(In Chinese)
[5] HAO J X,YU Z P,ZHAO Z G,et al. Optimization of key parameters of energy management strategy for hybrid electric vehicle using DIRECT algorithm[J]. Energies,2016,9(12):1-24.
[6]胡斐,趙治国.基于遗传算法的混合动力汽车前向仿真驾驶员模型参数优化[J].机械与电子,2010,28(5):76-78.
HU F,ZHAO Z G. Optimization of driver's model parameters for facing-forward simulation of HEV based on genetic algorithm[J]. Machinery & Electronics,2010,28(5):76-78. (In Chinese)
[7]邓涛,孙冬野,胡丰宾,等.遗传算法优化的方向与速度综合控制驾驶员模型[J].重庆大学学报,2011,34(9):1-8.
DENG T,SUN D Y,HU F B,et al. Direction and speed integrated control driver model optimized by genetic algorithms[J]. Journal of Chongqing University,2011,34(9):1-8.(In Chinese)
[8]吴松松,郑燕萍,杜政平,等.基于模糊PID控制理论的驾驶员模型的建立[J].公路与汽运,2012(4):14-16.
WU S S,ZHENG Y P,DU Z P,et al. Establishment of driver model based on fuzzy PID control theory[J]. Highways & Automotive Applications,2012(4):14-16.(In Chinese)
[9] XU L,HU J,JIANG H,et al. Establishing style-oriented driver models by imitating human driving behaviors[J]. IEEE Transactions on Intelligent Transportation Systems,2015,16(5):2522- 2530.
[10]沈沛鸿,赵治国,郭秋伊.基于ANFIS的工况跟踪用纵向驾驶员模型开发[J].汽车工程,2019,41(7):815-822.
SHEN P H,ZHAO Z G,GUO Q Y. Development of longitudinal driver model for driving cycle tracking based on ANFIS[J].Auto- motive Engineering,2019,41(7):815-822.(In Chinese)
[11]何秀丽.多元线性模型与岭回归分析[D].武汉:华中科技大学,2005:2-6.
HE X L. Research on multivariate linear model and ridge regres- sion[D]. Wuhan:Huazhong University of Science and Technol- ogy,2005:2-6.(In Chinese)
[12]高露.高维二次回归的正则化模型选择[D].合肥:中国科学技术大学,2019:16-38.
GAO L. Model selection for high-dimensional quadratic regression via regularization[D]. Hefei:University of Science and Technology of China,2019:16-38.(In Chinese)
[13] TIBSHIRANI R. Regression shrinkage and selection via the lasso:a retrospective[J]. Journal of the Royal Statistical Society,Series B(Statistical Methodology),2011,73(3):267-288.
[14] LIU W,DOU Z H,WANG W G,et al.Short-term load forecasting based on elastic net improved GMDH and difference degree weighting optimization[J].Applied Sciences,2018,8(9):1603.
[15] MAJTEY A P,LAMBERTI P W,PRATO D P. Jensen-Shannon divergence as a measure of distinguishability between mixed quantum states[J]. Physical Review A,2005,72(5):762-776.