APP下载

基于一种多分类半监督学习算法的驾驶风格分类模型

2020-05-06李明俊张正豪宋晓琳曹昊天易滨林

湖南大学学报·自然科学版 2020年4期
关键词:支持向量机主成分分析

李明俊 张正豪 宋晓琳 曹昊天 易滨林

摘   要:基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入. 利用K-means聚类完成样本标记工作. 基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(iMLCU)的原理,分别建立SVM与iMLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和iMLCU模型的驾驶风格识别准确率. 结果表明:相比于SVM,iMLCU表现出了更优异的驾驶风格识别能力,由此可知半监督iMLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力.

关键词:驾驶风格;主成分分析;K-means聚类;支持向量机;多分类半监督学习算法

中图分类号:TP391.41                         文献标志码:A

Abstract:This paper designs an experimental scheme based on the driving simulation platform and collects driver's operation information and vehicle status information synchronously.   Six  characteristic parameters are selected to recognize the driving style. The principal component analysis (PCA) algorithm is used to extract the multi-feature parameters and the first three principal components are used as the input features of the driving style recognition model. The K-means method is used for data labeling. Based on the principles of supervised support vector machine (SVM) method and inductive multi-label classification with unlabeled data (iMLCU) approach, the driving style recognition models of SVM and iMLCU are established, respectively. By adjusting the trained dataset ratios between the labeled and the unlabeled data, the accuracy of driving style recognition between the two models is compared. The results show that iMLCU has better driving style recognition than SVM. The semi-supervised iMLCU model can improve the recognition ability of driving style by using unlabeled samples.

Key words:driving style;principal component analysis;K-means clustering;support vector machines;multi-label semi-supervised classification with unlabeled data

近年来,自动驾驶汽车因其安全、节能、环保等特点而受到了广泛关注.[1-3]驾驶风格与道路交通安全密切相关. Carsten等[4]研究发现,激进型驾驶风格的驾驶员容易出现急加速、急减速、近距离跟驰、频繁换道等不良驾駛行为,易造成道路交通安全问题. 曾诚等[5]研究表明,通过规范激进型驾驶员的不良驾驶行为,可以提高车辆行驶安全性. 因此,对驾驶风格进行有效识别,有利于增强驾驶安全性.

目前,国内外学者对驾驶风格识别进行了多方面的研究,归纳起来主要为两方面:1)驾驶风格特征参数的选取. Wang等[6]对制动/节气门踏板位置、方向盘角度等驾驶数据取其平均值、标准差、最大值、最小值作为特征参数用以评价驾驶风格;Chu等[7]采用速度超过60 km/h所占的时间比为驾驶风格识别特征参数;文献[8-9]基于冲击度(加速度的变化率)提出了驾驶风格识别系数Rdriver、冲击度的累计量等概念[8-9];Shi等[10]将能量谱密度作为激进型驾驶风格的评价指标. 上述研究大多基于一个或几个特征参数对驾驶风格进行识别,不能全面反映驾驶风格. 2)驾驶风格识别算法. 基于实验驾驶数据,Wang等[11]使用模式分类技术直接分析驾驶风格;Koh等[12]利用高斯混合模型(GMM)对驾驶风格进行梯度分类;金辉等[13]采用GMM聚类算法对起步工况下的驾驶数据进行分析,以驾驶风格聚类分析结果为基础建立了基于Fisher判别的驾驶风格识别方法模型,运用经典和改进Fisher判别对驾驶风格数据的测试集进行识别;文献[14]通过结合序列分割算法的贝叶斯多元线性模型,从自然驾驶数据推断出驾驶行为;Guardiola等[15]利用马尔科夫(MC)结合蒙特卡洛提高了驾驶风格识别精度. Aoude等[16]使用支持向量机-贝叶斯滤波器(SVM-BF)和隐马尔可夫模型(HMM)相结合的方法训练分类器,显著提高了分类效率;Karginova等[17]对K邻近算法(KNN)、神经网络(NN)、决策树和随机森林等方法进行了比较,在仿真环境中发现神经网络具有最好的驾驶风格识别能力;文献[12-14]中的无监督学习算法直接通过对未标记样本的学习对驾驶风格进行分类,但是需要对样本进行大量分析处理,才能得到可靠的分类结果;文献[15-17]中的有监督学习算法被广泛应用于驾驶风格识别且取得了较好的效果,但该算法需要大量的标记样本作为数据支持,而现实生活中标记样本十分稀缺,未标记的样本获取却极容易. 手动标记的训练数据需要花费大量精力,并且手动标记驾驶行为数据会导致主观标签问题.

为了克服上述不足,提高驾驶风格分类的性能并减少标记工作量,本文结合有监督和无监督方法的优点,选择一种半监督学习方法iMLCU对驾驶风格进行分类. 基于驾驶模拟器,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取表征驾驶风格的多元特征参数,并通过无监督学习算法对特征参数进行聚类,完成样本标记工作. 采用PCA算法进行特征降维,提取特征作为SVM与iMLCU的输入,分别建立有监督SVM与半监督iMLCU驾驶风格识别模型,对比两模型的驾驶风格识别准确率.

1   实验设计与数据采集

本文基于驾驶模拟平台(如图1所示)设计实验方案,同步采集驾驶过程中的驾驶操作信息和车辆状态信息,选取驾驶风格特征参数,完成特征提取,之后进行样本标记,为驾驶风格识别模型的构建提供数据支持.

1.1   实验设计

实验道路模型如图2所示,实验道路由前6段直道+弯道[18](曲率半径为50 m、100 m、200 m,圆心角为45°、90°)、避障道路、S型弯道3个驾驶场景组成,每个弯道前50 m处都设置了限速60 km/h的标志牌.

实验共招募20位持有有效驾驶证件的志愿者(12名男性和8名女性驾驶员). 在正式实验前,每位驾驶员需熟悉习惯驾驶模拟器的操作. 根据驾驶任务,每位驾驶员需要进行10次数据采集实验,以采集驾驶过程中的驾驶操作信息和车辆状态信息. 若在实验过程中发生车辆失控或偏离驾驶道路,则此次实验数据无效. 为了确保实验数据的一致性,驾驶员需遵循以下规则:

1)所有驾驶员均处于正常驾驶状态,不允许酒后驾驶或疲劳驾驶;

2)每位驾驶员除完成实验驾驶任务外,不允许执行与驾驶无关的其他活动,如与他人交谈、打电话、听音乐等;

3)两次实验间休息1~2 min.

1.2   特征参数的提取

车速可以反映驾驶员的纵向驾驶行为. 如激进型驾驶员在弯曲的道路上行驶时偏爱较高的车速,而谨慎型驾驶员行驶速度较低. 节气门开度由驾驶员直接控制,因此与加速/减速直接相关[10]. 车辆的纵向和横向加速度也可以反映驾驶风格. 偏好较大纵向加速度/减速度的驾驶员驾驶更为激进. 为了研究驾驶员的驾驶风格,使用速度和加速/减速来捕获驾驶员特征[19]. Shi等[10]发现制动信号不足以区分激进型和正常型驾驶员. 因此,在这项工作中,没有设置制动踏板功能. 基于以上讨论,本文选取了6个驾驶风格特征参数,包括速度均值及标准差、纵向加速度均值及标准差、节气门开度的均值和标准差. 如表1所示.

由表2可知,节气门开度的均值和标准差与第一个主成分具有较强的相关性,因此,第一个主成分称为“节气门开度特征变量”. 第二个主成分与加速度的均值和标准差有较强相关性,第二个主成分称为“加速度特征变量”. 与前两个主成分不同,第三个主成分与速度的均值和标准差有较强相关性,第三个主成分称为“速度特征变量”. 如图3所示,根据累积贡献率不小于90%对应的主成分为选择依据[20],前3个主成分可以表征所选择的6个变量的特征. 因此,本实验选取前3个主成分(PC1~PC3)作为驾驶风格识别模型的特征输入.

1.3   样本标记

实验共收集了20个驾驶员的600个数据集,每个数据集包含约2 000个数据点(200 s×10 Hz =2 000). 基于K-means聚类在驾驶风格识别及样本标记中有着广泛应用[21-23],为了简化样本标注工作,本文基于这种方式对驾驶模拟实验中的上述特征参数进行聚类,以激进程度打标签. 将驾驶员的驾驶风格分为3个类型,“1”表示谨慎型;“2”表示正常型;“3”表示激进型.

1.4   训练和测试过程

将宽度为6 s[24]的移动窗口应用于训练集和测试集所有需要训练的数据中. 位于指定窗口内的所有特征数据都被聚集到一条数据记录中(即6 s内这段数据中,特征参数的均值和標准差). 这些数据包括车速、加速度和节气门开度. 对所有测试数据也进行了与训练数据相同的处理.

2   驾驶风格识别模型的构建

基于SVM与iMLCU的原理,分别建立有监督SVM与半监督iMLCU驾驶风格识别模型.

2.1   支持向量机(SVM)

将每位驾驶员对应的前3个主成分和驾驶风格类型形成实验数据样本,将驾驶风格识别模型的训练样本分为标记样本Dl = {(X1,Y1),(X2,Y2),…,(Xl,Yl)}和未标记样本Du = {Xl+1,…,Xl+u},其中X_i = (x_1,x_2,x_3)为主成分因素,Yi ∈(y1,y2,y3)为驾驶风格类型标签.

为了解决上述最优化问题,SVM采用拉格朗日对偶变换对模型进行凸优化,求解最优超平面,得到SVM驾驶风格多分类模型.

2.2   多分类半监督学习算法(iMLCU)

多分类半监督学习算法 (inductive Multi-Label Classification with Unlabeled data,iMLCU)利用已标记样本的标记相关性,将未标记样本的正则项纳入目标函数,使用CCCP(ConCave Convex Procedure)算法优化目标函数,得到iMLCU驾驶风格多分类半监督模型.

iMLCU模型基于SVM分类原理利用已标记样本的标记相关性得到目标函数(2). 为了在模型训练过程中有效利用未标记样本,借鉴二分类半监督支持向量机(Semi-Supervised Support Vector Machine,S3VM)使用未标记样本的思想[20],将其应用于驾驶风格多分类模型的建立. iMLCU将未标记样本X利用式(1)预测其驾驶风格类型作为“假定标记集合”,并使用链式损失计算X在第i个类型y_i上的损失,  求解上述优化问题得到iMLCU驾驶风格多分类半监督模型.

3   结果分析

本文基于驾驶模拟实验共获得了600组数据样本,采用无放回的方式随机选取10%~50%的样本(以10%递增)作为已标记样本Dl,将剩余的50%作为未标记样本Du,从Du中随机选取30%的未标记样本作为测试样本T. 有监督SVM模型与半监督iMLCU模型之间的不同之处在于:SVM只使用Dl训练模型,而iMLCU同时使用Dl与Du训练模型. 之后使用相同的测试样本T检验并对比SVM与iMLCU两模型的驾驶风格识别准确率. 此外,为了消除训练数据过拟合问题和提高iMLCU模型的识别准确率,研究采用基于网格搜索法进行交叉验证[25],确定模型最佳惩罚系数C1与C2,结果为C1 = 6,C2 = 0.05.

表3和图4为SVM与iMLCU两模型的驾驶风格识别准确率,结果表明:在相同标记样本比例的情况下,相较于SVM,iMLCU表现出了更优异的驾驶风格识别能力. 在10%标记样本比例条件下,iMLCU的驾驶风格识别准确率比在50%标记样本比例的SVM模型识别准确率高(分别为81.04% 、 79.16%). 由此可知半监督iMLCU模型可以利用未标记样本,提高模型对驾驶风格的识别能力. 此外,增加了55%标记样本比例和60%标记样本比例,发现在标记样本比例大于40%时,半监督iMLCU驾驶风格识别模型趋于收敛[23],且准确率收敛于87%. 增加标记样本比例会大大增加iMLCU模型训练时间[25]. 因此,综合考虑训练时间和识别准确率,基于iMLCU驾驶风格分类识别模型最佳标记样本比例为40%.

4   结   论

本文基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用PCA算法进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入. 利用K-means聚类完成样本标记工作,为驾驶风格识别模型的构建提供数据支持. 基于SVM与iMLCU的原理,分别建立有监督SVM与半监督iMLCU驾驶风格识别模型,通过调节标记样本比例,对比SVM与iMLCU两模型的驾驶风格识别准确率. 结果表明,使用iMLCU可以减少训练分类器标记工作,提高识别准确率.

参考文献

[1]    兰凤崇,李诗成,陈吉清,等. 考虑操纵稳定性的自动驾驶汽车轨迹综合优化方法[J]. 湖南大学学报(自然科学版),2019,46(10):36—45.

LAN F C,LI S C,CHEN J Q,et al. Comprehensive approach for trajectory optimization of autopilot vehicles considering handling stability [J]. Journal of Hunan University (Natural Sciences),2019,46(10):36—45.(In Chinese)

[2]   CAO H T,ZHAO S,SONG X L,et al. An optimal hierarchical framework of the trajectory following by convex optimization for highly automated driving vehicles [J]. Vehicle System Dynamics,2019,57(9):1287—1317.

[3]    宋晓琳,周南,黄正瑜,等.改进RRT在汽车避障局部路径规划中的应用[J].湖南大学学报(自然科学版),2017,44(4):30—37.

SONG X L,ZHOU N,HUANG Z Y,et al. An improved RRT algorithm of local path planning for vehicle collision avoidance[J].Journal of Hunan University(Natural Sciences),2017,44(4):30—37. (In Chinese)

[4]   CARSTEN O,KIRCHER K,JAMSON S. Vehicle-based studies of driving in the real world:the hard truth [J]. Accident Analysis & Prevention,2013,58:162—174.

[5]    曾誠,蔡凤田,刘莉,等. 不同驾驶操作方法下的汽车运行燃料消耗量分析[J]. 交通节能与环保,2011(1):31—34.

ZENG C,CAI F T,LIU L,et al. Analysis of vehicle fuel consumption under different driving methods [J]. Traffic Energy Saving and Environmental Protection,2011 (1):31—34. (In Chinese)

[6]    WANG W S,XI J Q,CHEN H Y. Modeling and recognizing driver behavior based on driving data:a survey [J]. Mathematical Problems in Engineering,2014(1):1—20.

[7]    CHU D F,DENG Z J,HE Y,et al. Curve speed model for driver assistance based on driving style classification[J]. IET Intelligent Transport Systems,2017,11(8):501—510.

[8]    秦大同,詹森,曾育平,等. 基于駕驶风格识别的混合动力汽车能量管理策略[J]. 机械工程学报,2016,52(8):162—169.

QIN D T,ZHAN S,ZENG Y P,et al. Hybrid vehicle energy management strategy based on driving style recognition [J]. Journal of Mechanical Engineering,2016,52 (8):162—169. (In Chinese)

[9]    陈镜任,吴业福,吴冰. 基于车辆行驶数据的驾驶人行为谱分析方法[J]. 计算机应用,2018,38(7):92—98.

CHEN J R,WU Y F,WU B. Driver behavior spectrum analysis method based on vehicle driving data [J]. Computer Applications,2018,38 (7):92—98. (In Chinese)

[10]  SHI B,XU L,HU J,et al. Evaluating driving styles by normalizing driving behavior based on personalized driver modeling[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2015,45(12):1502—1508.

[11]  WANG W S,XI J Q. A rapid pattern-recognition method for driving styles using clustering-based support vector machines[C]// IEEE 2016 American Control Conference (ACC).Boston:IEEE,2016:5270—5275.

[12]  KOH D W,KANG H B. Smartphone-based modeling and detection of aggressiveness reactions in senior drivers [C]//2015 IEEE Intelligent Vehicles Symposium (IV). Seoul,South Korea:IEEE,2015:12—17.

[13]  金辉,吕明.基于改进Fisher判别的起步工况驾驶风格研究[J].北京理工大学学报,2020,40(3):262—266.

JIN H,L? M. A study on the driving style recognition in the vehicle starting condition based on the modified Fisher discrimination [J]. Journal of Beijing Institute of Technology,2020,40(3):262—266. (In Chinese)

[14]  BENDER A,AGAMENNONI G,WARD J R,et al. An unsupervised approach for inferring driver behavior from naturalistic driving data [J]. IEEE Transactions on Intelligent Transportation Systems,2015,16(6):3325—3336.

[15]  GUARDIOLA C,PLA B,REIG A. Modelling driving behavior and its impact on the energy management problem in hybrid electric vehicles[J]. International Journal of Computer Mathematics,2014,91(1):147—156.

[16]  AOUDE G S,DESARAJU V R,STEPHENS L H,et al. Driver behavior classification at intersections and validation on large naturalistic data set [J]. IEEE Transactions on Intelligent Transportation Systems,2012,13(2):724—736.

[17]  KARGINOVA N,BYTTNER S,SVENSSON M. Data-driven methods for classification of driving styles in buses [J]. SAE Technical Paper,2012-01-0744.

[18]  CHANDRASIRI N P,NAWA K,ISHII A. Driving skill classification in curve driving scenes using machine learning [J]. Journal of Modern Transportation,2016,24(3):196—206.

[19]  WU J P,DU Y M,QI G Q,et al. Leveraging longitudinal driving behavior data with data mining techniques for driving style analysis [J]. IET Intelligent Transport Systems,2015,9(8):792—801.

[20]  DEUTSCH H P. Principle component analysis: derivatives and internal models[M]. Basingstroke:Palgrave Macmillan,2004:793-804.

[21] MARTINEZ C M,HEUCKE M,WANG F Y,et al. Driving style recognition for intelligent vehicle control and advanced driver assistance:a survey[J]. IEEE Transactions on Intelligent Transportation Systems,2018,19(3):666—676.

[22]  郝景賢,余卓平,赵治国,等. 混合动力汽车驾驶风格识别的研究[J]. 汽车工程,2017,39(12):1444—1450.

HAO J X,YU Z P,ZHAO Z G,et al. A study on the driving style recognition of hybrid electric vehicle [J]. Automotive Engineering,2017,39(12):1444—1450. (In Chinese)

[23]  WANG W S,XI J Q. Driving style classification using a semi-supervised support vector machine [J]. IEEE Transactions on Human-machine System,2017,47(5):2168—2291.

[24]  MURPHEY Y L,MILTON R,KILIARIS L. Drivers style classification using jerk analysis [C]//2009 Computational Intelligence in Vehicles and Vehicular Systems(CIVV). Nashville,TN,USA:IEEE,2009:23—28.

[25]  WU L,ZHANG M L. Multi-Label classification with unlabeled data:an inductive approach [J]. Journalof Machine Learning Research,2013,29:197—212.

猜你喜欢

支持向量机主成分分析
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
基于熵技术的公共事业费最优组合预测
SPSS在环境地球化学中的应用
基于支持向量机的金融数据分析研究