APP下载

驾驶人分心状态判别支持向量机模型优化算法

2018-03-01钱大琳邵春福钱振伟菅美英

交通运输系统工程与信息 2018年1期
关键词:标准差准确率状态

张 辉,钱大琳*,邵春福,钱振伟,菅美英

(1.北京交通大学交通运输学院,北京100044;2.清华大学土木系交通研究所北京100084)

0 引言

驾驶人分心是导致道路交通事故的重要原因之一.据美国国家道路安全管理局(NHTSA)的统计,2013年有10%的死亡事故、18%的受伤事故是由驾驶人分心导致的[1].随着手机和导航等车内智能终端的日益普及,驾驶人分心现象日趋严重.因此,研究驾驶人分心对驾驶安全的影响,构建驾驶人分心状态判别模型对驾驶人分心状态进行判别,对于开发驾驶人分心预警系统,减少驾驶人分心带来的安全隐患具有重要的意义.

国外研究表明,驾驶人分心对驾驶人的驾驶绩效、视觉行为模式和生理指标产生一定的影响,从而增大发生事故风险的概率[2].减小和预防驾驶人分心的有效措施是开发驾驶人分心预警系统,这种系统通过判别驾驶人状态给予驾驶人适当的安全预警提示,以降低事故发生的风险概率.现有的驾驶人分心判别研究项目包括欧洲的HASTE、AIDE,美国的SAVE-IT等.由NHTSA主导的SAVE-IT(Safety Vehicle Using Adaptive Interface Technology)项目通过传感器获取驾驶人状态判别驾驶人是否分心,当检测到分心,可以通过一系列的手段进行预警,包括碰撞警告系统、重新定向注意力系统等[3].驾驶人分心驾驶状态与正常驾驶状态在驾驶绩效方面存在显著的特征差异,当驾驶人分心时会出现大幅度车速变化、车道偏离、跟车距离增加等现象[2,4-5],驾驶绩效特征在驾驶人分心状态判别领域方面具有良好的应用.Wollmer等[6]提取方向盘转角、油门位置、速度、车头朝向、横向偏离和车头转向等驾驶绩效指标,采用LSTM神经网络对驾驶人分心状态进行判别.马艳丽等[7]采集驾驶绩效数据(方向盘转角和转速、横向位移、加速度和速度等),采用SVM分类算法构建了基于驾驶绩效的IVIS操作分心判定模型.

驾驶人分心预警系统的核心在于建立实时准确的驾驶人分心状态判别模型.在驾驶人分心状态判别领域,常用的模式识别算法有神经网络、混合高斯模型、贝叶斯网络、支持向量机(SVM)、神经模糊推理系统(ANFIS)及各种组合算法等[3,6-7].其中SVM以统计学习理论为基础,克服了模式识别领域的小样本难题,在解决多维度、非线性及小样本的识别问题和实际应用中有很多优点.已有研究虽然将SVM应用到驾驶人分心状态判别,但是由于未对模型参数进行优化,导致模型分类效果一般[7].因而选取合适的优化算法对SVM模型参数进行优化,建立最佳参数的驾驶人分心状态SVM判别模型,进而判别驾驶人分心状态,有助于为驾驶人分心状态预警提供支持.

本文在现有研究基础上,采集驾驶绩效数据,提取驾驶人分心状态判别指标,采用遗传算法(GA)优化支持向量机(SVM)模型惩罚参数C和核函数参数g,建立以径向基为核函数的基于GASVM的驾驶人分心状态判别模型,并利用实验数据验证模型的有效性.本文驾驶绩效使用的是车辆运行参数.研究期待为驾驶人分心预警系统、驾驶人安全管理培训和交通安全管理法规的制定提供理论依据.

1 驾驶人分心状态判别模型

1.1 驾驶人分心状态判别

驾驶人分心会影响驾驶人的驾驶绩效,导致车速降低、方向盘控制能力降低、跟车距离增加等[2,4-5],对这些指标的研究是驾驶人分心状态判别的基础.随着智能设备的普及,驾驶过程中使用耳机或车载设备免提通话和语音短信聊天的现象日益普遍,对驾驶安全产生较大的威胁.针对这种现象,本研究设计分心模拟驾驶实验,采集3种状态下(免提通话、正常驾驶和语音短信)的驾驶绩效数据,提取能够表征分心状态特征的驾驶绩效指标作为驾驶人分心状态判别指标,建立驾驶人分心状态判别模型.本文驾驶绩效指标采用的是车辆运行参数.驾驶人分心状态判别可以从模式识别的角度进行研究,属于有监督学习.在训练集中,将驾驶人分心判别指标作为判别模型的输入,3种状态分别标记为0、1、2,作为判别模型的输出,对模型进行训练.在测试集中,利用训练好的模型对驾驶人分心状态进行判别.

1.2 SVM判别方法

本文建立以径向基为核函数的驾驶人分心状态判别SVM模型,采用GA对模型参数C和g进行优化.将驾驶人分心状态判别指标作为SVM模型的输入,驾驶人分心状态作为SVM模型的输出.支持向量机(SVM)是由Vapnik首先提出,被广泛地应用于模式识别和非线性回归,具有较强的泛化性能,在解决非线性可分的分类问题方面具有显著的优越性.它可以通过构建多维度决策曲面,最大化两类数据之间的分割边缘,从而准确地实现两类样本数据分离的目的[8].SVM中核函数理论有效克服从低维空间线性不可分映射到高维特征空间以实现线性可分过程中的“维数灾害”现象,常用的核函数包括线性核函数、多项式核函数、径向基核函数(RBF)和Sigmoid核函数[8].

由于径向基核函数能够实现非线性映射,本文选择径向基核函数作为SVM模型的核函数.在建立不同交通状态下的驾驶人分心状态判别SVM模型时,为得到较为理想的分心状态判别效果,需要优化模型中的惩罚参数C和RBF核函数参数g,可以利用遗传算法(GA)等启发式算法对SVM模型中的惩罚参数C和核函数参数g进行优化,以达到理想的分类准确率.基于GA-SVM的驾驶人分心状态判别方法步骤如下:

Step 1选定训练集和测试集.随机选取驾驶人分心特征指标数据的70%作为训练集,30%作为测试集,确保训练集和测试集包含驾驶人3种状态.

Step 2数据标准化.为避免不同驾驶绩效指标之间单位量纲不同的影响,消除各指标间的数值差异,采用min-max标准化方法的一种特殊形式,所有样本数据按照式(1)进行标准化[7],将各特征指标无量纲化在[-1,1]区间.

Step 3最佳参数的确定.在训练集中利用GA算法对SVM模型的参数C和g进行优化.

Step 4利用最佳参数训练驾驶人分心状态判别SVM模型.

Step 5在测试集中利用训练好的模型对驾驶人分心状态进行判别.

Step 6模型性能评估.

1.3 模型参数优化

针对上述Step3,基于GA的并行性和全局搜索能力,采用GA进一步优化SVM模型参数C和g.GA优化SVM的适应度函数为交叉验证准确率,如式(2)所示.

式中:CCV Accuracy为交叉验证准确率;k为交叉验证次数;li为每次迭代错误分类样本数;l为总的训练样本数.

GA对SVM中惩罚因子C和分类函数中RBF参数g进行优化,参数优化流程如图1所示.

GA优化SVM参数步骤如下:

Step 1 将SVM训练参数C和g以二进制的形式进行染色体基因编码,设定训练参数.

图1 基于GA的SVM参数优化Fig.1 SVM parameter optimization based on GA

Step 2随机产生1组表示SVM参数值的染色体.

Step 3利用获得的SVM参数训练SVM模型,利用交叉验证法评估适应度,选取交叉验证准确率为适应度函数.

Step 4通过选择、交叉、变异等遗传算子操作,产生1组新的染色体,其中选择采用轮盘赌法.

Step 5当满足终止条件时,进化过程结束,输出最优SVM参数;否则,转到Step3.

2 实验数据的采集与处理

2.1 实验过程

本文实验利用动感型汽车模拟驾驶器(QJ-4B1型6自由度模拟驾驶器),模拟双向4车道城市快速路场景中的跟车行为.实验场景分为自由流和拥挤流2个状态,车道宽度为3.5 m.在自由流状态场景中,模拟主车跟随引导车做跟车行驶,引导车车速设定为65 km/h,要求主车紧跟引导车,保持合适的跟车距离,不允许超车.在拥挤流状态场景中,设置缓慢行驶的车流,车流速度限定为35 km/h.主车汇入车流中缓慢行驶,不允许随意超车和变道.驾驶过程中,驾驶人需要在2种交通流场景中执行指定驾驶次任务,以模拟驾驶分心状态.指定的驾驶次任务包括正常驾驶(基准)、免提手机通话和收发语音短信,记录驾驶过程中各项驾驶绩效指标的变化情况.

实验共招募53位驾驶人进行模拟驾驶实验,所有驾驶人均持有有效驾照,年龄在26~59岁之间(均值:37.7,标准差:8.51),驾龄为3~39年(均值:12.1,标准差:9.34),累计行驶在0.5万~400万km(均值:64.2,标准差:94.63).驾驶人身心健康,无视觉和听觉障碍.具体实验流程如下:

(1)实验人员向驾驶人介绍实验主要内容和基本要求,驾驶人在知情同意书上签字;

(2)调查驾驶人年龄、驾龄、职业等个人基本信息;

(3)驾驶人进行大约10 min的适应性训练,以适应模拟驾驶环境;

(4)正式实验,驾驶人完成包含自由流状态场景和拥挤流状态场景的实验路段,在该过程中完成指定驾驶次任务;

(5)收集和整理驾驶人车辆运行数据和视频录像.

2.2 数据采集

本实验中驾驶模拟器的采集频率为30 HZ,可以采集到17项驾驶绩效指标.参考国内外相关研究[4-7],结合驾驶次任务对驾驶绩效的影响,确定基于驾驶绩效的驾驶人分心状态判别变量,包括:车速、方向盘转角、跟车距离、车道侧向偏离、纵向加速度和横向加速度等6项指标.按照执行驾驶次任务的顺序,将数据划分为6个阶段进行数据提取:自由流—免提通话、自由流—正常驾驶、自由流—语音短信、拥挤流—免提通话、拥挤流—正常驾驶、拥挤流—语音短信.利用三倍标准差法对实验数据进行预处理,经K-S检验,可知各指标数据均服从正态分布.

2.3 特征指标选取

在收集驾驶分心实验数据的基础上,通过检测不同分心水平对应驾驶绩效指标是否存在显著差异进行特征指标提取.在2种交通流状态下,分别用单因素方差分析方法检验6项驾驶绩效指标的均值和标准差在不同分心水平之间是否存在显著性差异.由表1可知,自由流状态下的车速均值、方向盘转角标准差、纵向加速度标准差、车道侧向偏离标准差等4项指标,拥挤流状态下的车速标准差、方向盘转角标准差、跟车距离均值、纵向加速度标准差、横向加速度标准差和侧向偏离标准差等6项指标在不同分心水平影响下均存在显著性影响(P<0.05).因此,可以将表1中自由流状态的4项指标和拥挤流状态的6项指标作为驾驶人分心状态判别特征指标.

表1 单因素方差分析结果Table 1 Statistical comparison results of one-way ANOVA

3 模型验证

本文共选取自由流状态场景下27 156组样本数据,拥挤流状态场景下21 209组样本数据,将数据分为70%训练集和30%测试集.自由流状态场景下每个样本具有4个特征指标,拥挤流场景下每个样本具有6个特征指标,驾驶人分心状态(免提通话状态、正常驾驶状态和语音短信状态)分别标记为0、1、2.

本文采用遗传算法优化SVM模型参数,利用获得最佳参数的SVM模型分别对2种交通状态下的3种分心状态进行判别.SVM模型中选择径向基(RBF)作为核函数,使用Matlab进行GA-SVM模型的建立和训练.自由流状态下GA寻优算法中设置:最大遗传代数为50,种群数量为20,参数C的取值范围为[0,100],参数g的取值范围为[0,100],代沟为0.9,交叉验证次数k=5,交叉率为0.7,变异率为0.01.拥挤流状态下,GA寻优算法中设置与自由流状态相同.利用GA寻优算法得到自由流状态下SVM最佳惩罚参数C=99.104 3,最优核函数参数g=0.101 6,拥挤流状态下SVM最佳惩罚参数C=84.964 4,最优核函数参数g=0.546 84,GA参数寻优结果如图2所示.

图2 不同交通状态下的GA-SVM适应度曲线Fig.2 Fitness curves of GA-SVM in different traffic conditions

将2种交通流状态下最优参数代入SVM模型中,对训练集进行训练,并对测试集进行测试,得到模型的分类效果,如表2所示.由表2可知,模型在自由流状态和拥挤流状态中的分类准确率较高,分别为94.5%和96.3%,这表明通过GA参数寻优后得到的SVM分类模型可以有效地判别2种交通流状态下3种分心状态.通过特征指标的提取和模型分类准确率可以看出,在拥挤流中驾驶人分心对驾驶绩效的影响更为明显.

为了进一步验证GA-SVM模型的分类性能,将GA-SVM方法与决策树C4.5、交叉验证(CV)-SVM进行对比.其中CV-SVM方法中参数寻优采用K-CV方法,K取10.本文采用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和 F1值(F1-Measure)对3种模型性能进行评价,模型性能评价结果如表3所示.

表2 不同交通流状态下的分类准确率Table 2 Classification accuracy under different traffic flow states

表3 2种交通流状态下各模型性能评价指标Table 3 Performance evaluation indicators of classification methods under two traffic flow conditions

从表3可以看出,无论在自由流还是拥挤流状态中,GA-SVM模型各项性能均较其他2种模型为优,这说明GA-SVM模型分类效果最佳.

4 结论

(1)本文建立基于GA-SVM的驾驶人分心判别模型,通过模拟驾驶实验采集驾驶绩效数据,对模型进行验证.结果表明,自由流状态和拥挤流场景中模型的分类准确率分别为94.5%和96.3%,可以准确判别2种交通流中驾驶人分心状态.

(2)与决策树C4.5、CV-SVM相比,GA-SVM在准确率、精准率、召回率和F1值等模型性能指标上能够体现出更好的性能.

最后,本文实验是在模拟驾驶环境中进行的,能够达到预期研究目的,但是其在现实环境中的适用性还待进一步研究,因而下一步工作应开展自然驾驶条件下驾驶分心判别研究.

[1]Traffic Safety Facts Research Note.Distracted Driving 2013[R].Washington DC:National Highway Traffic Safety Administration,2015.

[2]HORREY W J,LESCH M F,GARABET A,et al.Distraction and task engagement:How interesting and boring information impact driving performance and subjective and physiological responses[J].Applied Ergonomics,2017(58):342-348.

[3]DONG Y,HU Z,UCHIMURA K,et al.Driver inattention monitoring system for intelligent vehicles:A review[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(2):596-614.

[4]LIANG Y,LEE J D.Combining cognitive and visual distraction:less than the sum of its parts[J].Accident Analysis&Prevention,2010,42(3):881-890.

[5]RUMSCHLAG G,PALUMBO T,MARTIN A,et al.The effects of texting on driving performance in a driving simulator:The influence of driver age[J].Accident Analysis and Prevention,2015(74):145.

[6]WOLLMER M,BLASCHKE C,SCHINDL T,et al.Online driver distraction detection using long short-term memory[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(2):574-582.

[7]马艳丽,顾高峰,高月娥,等.基于驾驶绩效的车载信息系统操作分心判定模型[J].中国公路学报,2016,29(4):123-129.[MA Y L,GU G F,GAO Y E,et al.Driver distraction judging model under in-vehicle information system operation based on driving performance[J].China Journal of Highway and Transport,2016,29(4):123-129.]

[8]VLADIMIR N VAPNIK.统计学习理论[M].北京:电子工业出版社,2015.[VLADIMIR N VAPNIK.Statistical learning theroy[M].Beijing:Publishing House of Electronics Industry,2015.]

猜你喜欢

标准差准确率状态
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
状态联想
浅析标准差及其在工程统计中的运用
高速公路车牌识别标识站准确率验证法
生命的另一种状态
更 正
坚持是成功前的状态
医学科技论文中有效数字的确定