基于深度学习DBN算法的高速公路危险变道判别模型
2017-07-26徐良杰汪济洲
赵 玮 徐良杰 冉 斌 汪济洲
(1武汉理工大学交通学院, 武汉 430063)(2内蒙古科技大学经管学院, 包头 014010)(3东南大学交通学院, 南京 210096)
基于深度学习DBN算法的高速公路危险变道判别模型
赵 玮1,2徐良杰1冉 斌3汪济洲1
(1武汉理工大学交通学院, 武汉 430063)(2内蒙古科技大学经管学院, 包头 014010)(3东南大学交通学院, 南京 210096)
针对危险变道过程影响交通安全这一问题,提出一种基于深度学习DBN(deep belief networks)算法与分类分析方法的新型危险变道量化判别模型,以解决现存车辆变道过程不可被量化分析及准确判别的问题.招募28名被试者,利用模拟器仿真平台开展实际场景下试验,获取详细的车辆行驶数据及驾驶环境数据作为训练的模型输入.采用SVM算法作为输出层的分类器,建立了DBN-SVM判别模型及基于样本下模型的一般训练方法.该模型的识别精度为93.78%,较朴素贝叶斯模型和BP-ANN神经网络分别提高20.11%和14.45%,并且调整参数后判别结果稳定.DBN-SVM模型可以根据驾驶员历史驾驶数据对即将发生的危险变道做出预测及判别,对驾驶员提出警告,从而减少交通事故的发生.此外,该研究为车联网环境下变道判别及警示的研究提供了理论支持.
危险变道判别;模拟车试验;智能交通;深度信任网络;自动驾驶;车联网
危险变道行为是造成重大高速公路交通事故的重要原因之一.全世界每年约有130万人在交通事故中丧生[1],其中我国约占25万人,美国约占3.7万人.这些交通事故大多发生在高速公路路段[2-3].研究证实,变道行为是高速行驶过程中发生交通事故的主要安全隐患之一.
随着车辆驾驶模拟器在交通安全研究领域的广泛应用,国内外学者更倾向于利用模拟器研究可靠驾驶行为模型、跟车模型及车道变换模型.Hidas[4]证实在低速行驶的复杂交通环境及所有高速行驶环境下,车流实时车道变换数据采集难度较大,提出利用模拟驾驶来解决这一难题.Cassidy等[5]研究了交通事故发生区域及交通流瓶颈处的变道情况,结果表明频繁变道对此类路段的道路通行能力有较大的负面影响.Zheng等[6]的研究结果证明了他们提出的车道变换模型可以较为完整地揭示交通流从形成到传播的全部演化过程.Laval等[7]针对不合理的变道行为对交通安全的影响进行了研究,证明了危险变道行为增加了交通事故率,降低了道路通行能力.Zheng[8]同样对不妥当的变道行为对交通安全的威胁进行了量化分析.Moridpour等[9]着重研究重型车辆的车道变换过程及决策模型,以便提升微观交通模拟软件评估和预测宏观交通流的精度.Chen等[10]以变道行为与交通安全的关系为研究基础,从辅助变道安全性方面提出了仿真算法并用计算机软件实现.
综上所述,已有研究覆盖了变道过程的微观和宏观层面,但所得结论和模型多适用于城市交通条件下的变道行为,且有关变道危险性的量化研究不充分.车辆完成变道的过程综合了“人-车-路”多方面因素,是驾驶环境、驾驶人行为及车辆操作性等多方面因素共同作用下的车辆控制过程.本文首先通过被试者实际驾驶试验车模拟器获取变道数据,然后提出一种基于深度学习算法与分类分析方法的危险变道量化判别模型,进而量化分析并准确判别车辆变道过程的危险性,从而实现可靠、快速的自动化变道判别过程.
1 实验设计
1.1 仪器
近年来,模拟驾驶器越来越多地应用于交通安全的微观研究,其中实验场景的真实性及模拟器的操作性成为研究的重点[4,6-7].现有模拟器技术已经可以较为真实地对交通环境和驾驶环境进行模拟.本文利用威斯康星交通操作与安全实验室(TOPS)的模拟驾驶器进行试验.虚拟驾驶有3个显示屏幕,即环绕240° 2.13 m圆柱屏幕、外后视镜及内后视镜屏幕,如图1所示.
图1 模拟器驾驶环境
1.2 场景设计及被试者
场景构建过程分3个步骤:① 将二维CAD图形导入到3D模型软件中生成驾驶模拟场景;② 将道路和路面从三维CAD图形导入软件生成场景;③ 将移动激光雷达数据和照片相结合创建出最终模拟场景.实验路段取威斯康星州联邦高速43°02′28.7″N89°16′35.3″W至43°14′46.8″N89°22′32.8″W段(见图2),全程26.2 km. 招募了28名持有驾驶执照的被试者,实际驾龄均超过1年,平均年龄32岁,其中男性、女性各16名,被试者的精神和身体状况良好,每名被试者被要求完成3次完整驾驶过程.
图2 实验路线
1.3 实验数据采集
原始数据维度较大,部分原始数据为标签数据,不计入后期数据处理,也不作为输入数据.实验数据采集主要分为3个模块:① 登记驾驶员信息,记录基本驾驶人数据;② 驾驶过程中的车辆数据采集,包括眼动仪输出数据及车内信息;③ 驾驶过程中的驾驶环境数据采集,包括路测标志及路网内临近车辆信息.
2 危险变道判别模型建立
2.1 数据处理
2.1.1 自变量选取及处理
通过筛选有效信息,最终选取的模型的输入变量(自变量)如表1所示.
表1 输入变量描述
定义第k个样本的车辆驾驶状态向量vk如下:
uk={uk1,uk2…,uk9}
(1)
相应的车辆驾驶状态矩阵为
Uk=[u1u2…uk]
(2)
式中,k为Uk的样本数量;uk1,uk2,…,uk9为在样本数量k情况下的车辆驾驶状态自变量.经过预处理,进入后期模型的有效变道数据为852组,即k=1,2,…,852.
2.1.2 因变量计算模型
本文因变量值为0或1,1表示危险变道,0表示非危险变道,其具体取值根据Chen等[10]提出的变道模型确定,车辆之间的距离小于最小安全距离为危险变道,否则为非危险变道.
假定车辆M的加速度满足
aM=(vR-vM(0))/tl0≤t≤tl
(3)
式中,aM为车辆M的加速度;vR为道路安全限速;vM(0)为车辆M初始速度;t为车辆M从初始速度加速到vR所用的时间;tl为车辆M加速驶入目标车道的时间.
考虑乘客的舒适性,车辆M的加速度aM取值范围为0~2 m/s2,车辆之间的安全距离S(t)表达式如下:
(4)
式中,S(t)表示在t时间时车辆到车辆的安全距离;vN为车辆N的行驶速度,且vN≤vR;Lv为车辆M的车长.当且仅当S(t)≥Lv时,可确保车辆M和车辆N在变道过程中不会发生碰撞,进而推导出下式:
(5)
由式(5)可得出如下结论:
1) 当vN-vM(0)≤0,车辆M在原车道加速,然后变道至目标车道,当满足S(0)>Lv时,车辆M不与车辆N碰撞.
2) 当vN-vM(0)>0时,车辆M在原车道加速,当车辆M的速度达到vN时,距离S(t)达到最小,此时车辆M从起始位置到两车冲突点处所用的时间为tc=(vN-vM(0))/aM.故S(0)最小安全距离为
(6)
2.2 深度学习与深度信念网络(DBN)
深度学习理论源于人工神经网络的发展,学者们对深层神经网络已进行了很多研究[11-12].Hinton等[13]提出了深度信念网络的模型和学习算法,即基于层叠的RBM深度信念网络的学习算法.DBN解决了传统BP算法需要训练多层神经网络的难题,不再需要大量含标签的训练样本集,并且其收敛速度较快,更易找到全局最优解.
2.3 受限玻尔兹曼机(RBM)
2.3.1 RBM模型[14]
RBM利用随机神经网络解释概率图,与一般玻尔兹曼机的区别在于网络中的神经元随机分布,且层内神经元之间无连接.其输出状态只有2种,状态的取值依据概率统计法则.RBM是由神经元、神经元之间的连线构成的二分图,包含可视层和隐层,神经元之间相互独立,隐藏神经元也相互独立[15].所有的可视神经元与隐藏神经元都有连接,即层间全连接;所有的可视神经元与可视神经元、隐藏神经元与隐藏神经元不连接,即层内不连接[13].可视层由显元组成,用作训练数据的输入;隐层由隐元组成,用于特征检测器的输入与输出.每层都是随机的二进制向量,表示为
(7)
式中,fi为可视节点i的二进制状态;hj为隐藏节点j的二进制状态;F为可视节点数量;H为隐藏节点的数量.
令矩阵W表示可视层与隐层之间的权重,wij表示fi和hj之间的权重.向量b={b1,b2,…,bi,…}T表示各可视神经元的偏置向量,向量a={a1,a2,…,aj,…}T表示各隐藏神经元的偏置向量.RBM中神经元的全概率分布满足玻尔兹曼分布,RBM的某一状态(f,h)的联合组态能量定义如下:
E(f,h;θ)=-fTWh-bTf-aTh=
(8)
式中,bi为可视节点i的偏置;aj为隐藏节点j的偏置;θ={W,b,a}为模型参数.
2.3.2 RBM训练算法
利用对数似然概率log(p(f;θ))的梯度,可以推导出RBM权值更新公式如下:
Δwij=EP(fihj)-Emodel(fihj)
(9)
算法1RBM训练算法(CD-1)
1) for all隐藏节点jdo
end for
从而得到向量h1;
2) for all可见节点ido
end for
从而得到向量f2;
3) for all隐藏节点jdo
end for
4) 按照如下公式更新参数:
W←mW+ε(h1f1-h2f2)
b←mb+ε(f1-f2)
a←ma+ε(h1-h2)
2.4 深度信念网络
2.4.1 DBN模型
DBN模型[16]是由多个受限玻尔兹曼机层层堆叠而成,网络构架如图3所示.图中,x为DBN的输入向量,hc为隐层的输入与输出向量,c为隐层数量.
图3 DBN结构图
2.4.2 DBN训练算法
Hinton等[13]提出了针对DBN的逐层贪婪训练方法,并证明了非监督逐层贪婪训练算法用于预先训练生成模型的权值是有效的.具体算法如下:
算法2 DBN逐层贪婪训练算法
1)x为样本输入,将X视为可视层,与hl构成一个RBM,采用CD-1算法训练这个RBM,得到第1个隐层h1的参数{W1;a1}.
3) 使用CD-1算法训练tl(可视层)和hl+1(隐藏节点层)构成的RBM,得到hl+1层的参数{Wl+1;al+1},且得到训练结果hl+1=al+(Wl)Ttl.
4) 自下而上逐层训练各个隐层,获得DBN网络的参数集{W1,W2,…,Wc;a1,a2,…,ac}.
3 基于DBN的危险变道判别模型
3.1 输出层分类器及模型定义
本模型的y层输出值为0-1变量,即表示是否为危险变道.为了实现判别,本文拟在y层即输出层添加一个或多个可以处理维数较多的非线性数据的分类器.因此,本文对常用的分类分析方法——支持向量机(SVM)进行改进作为分类器,改进后的SVM具有良好的泛化性能与分类精度,并且可以处理线性回归和非线性回归问题[17].本文所提出的网络结构如图4所示,因该网络采用改进后的SVM作为分类器,故将本文所提算法命名为DBN-SVM.
图4 DBN-SVM故障诊断网络结构图
本文以SVM算法为基础提出的分类器如下所示:
s.t.yi(w·xi+b)≥1i=1,2,…,l
(10)
式中,w为优超平面法向量;b为阈值.利用拉格朗日乘子法求解上述问题,得到优化目标函数:
(11)
式中,αi为拉格朗日乘子.由于SVM计算结果不全为整数,因此令
(12)
式中,O为输出结果;Ci表示判别结果,Ci=1表示危险变道,Ci=0表示非危险变道.
3.2 DBN-SVM模型训练过程
DBN-SVM模型训练可分为2个阶段:① 使用非监督贪婪逐层法获取模型权值,通过可视层的向量X传递到第1层隐层,然后,可视神经元激活单元向其他隐层逐步传递,构成隐层向量h;② 利用BP算法对带标签的数据进行调整,并且在权值参数空间进行局部搜寻.和其他神经网络相比,DBN-SVM模型训练速度快,收敛时间少.
4 结果对比及检验
4.1 模型学习及结果
在模型训练过程中首先要选定参数,DBN-SVM模型的初始参数如表2所示.DBN网络含有4个隐层,每个被试者每组实验变道一般不超过20次,所以按照经验[18]每个隐层设定有20个神经元,可视层也就是输入层有9个节点,即2.1.1节中的自变量向量维度,而输出层有2个节点,即2.1.2节中的因变量维度.
表2 DBN-SVM默认参数设置
对2.1节中预处理结束后得到的数据集进行随机选择,为保证实验结果不过度拟合,分别以随机选择的数据集的60%,70%及80%作为训练集,剩余数据集的40%,30%及20%作为测试集来验证模型.将每个训练集分别代入DBN-SVM模型进行训练,分别得到3个训练模型.然后分别将原来的3个训练集及对应的测试集代入已得到的对应模型.本文使用的计算软件为R语言软件(版本3.2.4),以程序包darch和e1071为基础编写代码完成计算.
4.2 模型验证
为了验证DBN-SVM模型的判别准确性,选择朴素贝叶斯模型[19](Naïve Bayes)和人工神经网络模型[20](BP-ANN)作为对比方法,这2种方法都是分类判别分析模型中较为常用的方法.朴素贝叶斯模型和BP-ANN模型分别以R语言程序包e1070和neuralnet为基础编写代码完成计算.
4.2.1 朴素贝叶斯模型
(13)
式中,P(ck)为某特征在分类中发生的先验概率.由训练数据估计得到P(tick)和P(ck).
4.2.2 BP-ANN模型
BP-ANN模型[20]结构相对简单,被广泛应用于拟合非线性连续函数和模式识别中,其原理是利用误差反向传播来训练每个神经元的权重.BP-ANN模型包含输入层、隐层和输出层.如果BP-ANN网络的输出结果不能满足预先期望,那么反向调节参数,即调节每一神经元的权重来减少训练错误.本文采用的BP-ANN模型含有1个输入层、2个隐层和1个输出层,根据现有成熟算法经验,每层隐层默认的节点数量都为20.
4.2.3 对比验证结果
将训练集数据代入朴素贝叶斯模型,BP-ANN和DBN-SVM分别进行验证.由于因变量为0-1变量,若模型判别结果与实际因变量值相同则视作正确判别,验证结果如表3所示.由表3可看出:① 3种模型在不同情况下的最低判别精度都在可接受范围内.② 本文提出的DBN-SVM模型的判别准确性最优,其次是BP-ANN模型,最后是朴素贝叶斯模型.③ 同一训练集下,均是DBN-SVM模型的判别准确性最高,其中选取80%的整体样本数据训练出来的模型判别效果最好,高达95.11%.综上所述,利用训练集数据验证判别效果时,DBN-SVM模型体现出了较好的性能.
表3 训练集模型判别结果
为了避免训练过程中模型过度拟合问题,本文用各个训练集对应的测试集数据进行判别准确性验证,结果如表4所示.可以看出:① DBN-SVM模型的优越性更加明显,其最低判别准确性都好于其他2种方法的最优判别准确性,并且平均正确率90.66%远远高于朴素贝叶斯模型的72.67%和BP-ANN的76.82%.② 选取80%的样本数据作为训练集仍然得到了最好的判别准确性,正确率为93.78%,较朴素贝叶斯模型和BP-ANN神经网络分别提高了20.11%和14.45%.③ 训练集数据越多,模型的准确性越高,可见增加样本容量有助于提高模型的正确率,这就要求进一步采集更全面的样本数据来进行分析.综上所述,DBN-SVM模型在实际数据验证及对比过程中被证实具有较强的准确性和可靠性.
表4 测试集模型判别结果
4.3 DBN-SVM模型参数优化
为了进一步研究DBN-SVM模型的准确性和稳定性,得到相对最优的判别模型和结果,本文又通过改变隐层数量及隐层中节点数量来检验和比较判别结果的准确性.为了进一步优化模型参数,本研究进行了大量的测试,图5展示了部分较优结果,这些结果是在选取80%的总体样本数据作为训练集,20%总体样本作为测试集下得出的.可以看出,3条准确率曲线在多数情况下变化趋势有相似性,但整体准确率变化范围较小(90.56%~94.11%),表明本方法判定的稳定性较强,波动范围较小.
图5 可变参数下判别准确率的变化
5 结论
1) 本文提出的DBN-SVM模型可以对危险变道驾驶过程进行可靠、准确的判别.
2) 为了验证模型的准确性,本文还同时训练了常用于分类判断的BP-ANN模型和朴素贝叶斯模型与DBN-SVM模型进行比较,结果证实DBN-SVM模型有效地提高了判别精度.
3) 对DBN-SVM模型的参数进行优化,并进行了大量的验证,发现该训练模型判别结果较为稳定,可靠性高.
4) DBN-SVM模型有助于实现危险变道的自动识别并在变道发生前给予驾驶员警示信息,给车联网的发展提供有效的理论基础.未来将进一步扩大模型的判别内容,从自变量中量化分析导致危险变道产生的原因,以更有效地保证变道过程的安全性.
References)
[1]Jewett A, Shults R A, Banerjee T, et al. Alcohol-impaired driving among adults—United States, 2012[J].MMWRMorbidity&MortalityWeeklyReport, 2015, 64(30): 814-817. DOI:10.15585/mmwr.mm6430a2.
[2]Dharmaratne S D, Jayatilleke A U, Jayatilleke A C. Road traffic crashes, injury and fatality trends in Sri Lanka: 1938—2013[J].BulletinoftheWorldHealthOrganization, 2015, 93(9): 640-647. DOI:10.2471/BLT.14.150193.
[3]World Health Organization.Globalstatusreportonroadsafety-2013:Supportingadecadeofaction[M]. World Health Organization, 2013: 286.
[4]Hidas P. Modelling lane changing and merging in microscopic traffic simulation[J].TransportationResearchPartC:EmergingTechnologies, 2002, 10(5): 351-371. DOI:10.1016/s0968-090x(02)00026-8.
[5]Cassidy M J, Rudjanakanoknad J. Increasing the capacity of an isolated merge by metering its on-ramp[J].TransportationResearchPartB:Methodological, 2005(10): 896-913. DOI:10.1016/j.trb.2004.12.001.
[6]Zheng Z, Ahn S, Chen D, et al. Freeway traffic oscillations: Microscopic analysis of formations and propagations using wavelet transform[J].TransportationResearchPartB:Methodological, 2011, 45(9): 1378-1388.
[7]Laval J A, Daganzo C F. Lane-changing in traffic streams[J].TransportationResearchPartB:Methodological, 2006, 40(3): 251-264. DOI:10.1016/j.trb.2005.04.003.
[8]Zheng Z. Recent developments and research needs in modeling lane changing[J].TransportationResearchPartB:Methodological, 2014, 60: 16-32. DOI:10.1016/j.trb.2013.11.009.
[9]Moridpour S, Sarvi M, Rose G, et al. Lane-changing decision model for heavy vehicle drivers[J].JournalofIntelligentTransportationSystems, 2012, 16(1): 24-35. DOI:10.1080/15472450.2012.639640.
[10]Chen S W, Fang C Y, Tien C T. Driving behaviour modelling system based on graph construction[J].TransportationResearchPartC:EmergingTechnologies, 2013, 26: 314-330. DOI:10.1016/j.trc.2012.10.004.
[11]Dahl G E, Yu D, Deng L, et al. Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition[J].IEEETransactionsonAudioSpeech&LanguageProcessing, 2012, 20(1): 30-42.
[12]Zhang Y, Zhang E, Chen W. Deep neural network for halftone image classification based on sparse auto-encoder[J].EngineeringApplicationsofArtificialIntelligence, 2016, 50: 245-255. DOI:10.1016/j.engappai.2016.01.032.
[13]Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J].NeuralComputation, 2006, 18(7): 1527-1554. DOI:10.1162/neco.2006.18.7.1527.
[14]Fischer A, Igel C. Training restricted Boltzmann machines: An introduction[J].PatternRecognition, 2014, 47(1): 25-39. DOI:10.1016/j.patcog.2013.05.025.
[15]Kollar T, Tellex S, Roy D, et al. Toward understanding natural language directions[C]//2010 5thACM/IEEEInternationalConferenceonHuman-RobotInteraction(HRI). Osaka, Japan,2010. DOI:10.1109/hri.2010.5453186.
[17]Yu R, Abdel-Aty M. Utilizing support vector machine in real-time crash risk evaluation[J].AccidentAnalysis&Prevention, 2013, 51: 252-259. DOI:10.1016/j.aap.2012.11.027.
[18]Bengio Y. Learning deep architectures for AI[J].FoundationsandTrends®inMachineLearning, 2009, 2(1): 1-127. DOI:10.1561/2200000006.
[19]Chen J, Huang H, Tian S, et al. Feature selection for text classification with Naïve Bayes[J].ExpertSystemswithApplications, 2009, 36(3): 5432-5435. DOI:10.1016/j.eswa.2008.06.054.
[20]Saravanan N, Ramachandran K I. Incipient gear box fault diagnosis using discrete wavelet transform (DWT) for feature extraction and classification using artificial neural network (ANN)[J].ExpertSystemswithApplications, 2010, 37(6): 4168-4181. DOI:10.1016/j.eswa.2009.11.006.
Dangerous lane-change detecting model on highway based on deep learning DBN algorithm
Zhao Wei1,2Xu Liangjie1Ran Bin3Wang Jizhou1
(1School of Transportation, Wuhan University of Technology, Wuhan 430063, China) (2School of Economics and Management, Inner Mongolia University of Science and Technology, Baotou 014010, China) (3School of Transportation, Southeast University, Nanjing 210096, China)
Aiming at the problem that the vehicle lane-changing process cannot be quantitatively analyzed and accurately discriminated, a new quantitative discriminant model based on the DBN (deep belief networks) algorithm and the classification analysis method is presented. Twenty-eight participants were recruited. The participators took part in real-scene simulation experiments using the simulation driving platform. The detailed data of vehicle traveling and driving environment was required and used as the input of the model. With the SVM (support vector machine) algorithm as the classifier of the output layer, the discriminant model DBN-SVM and corresponding training method are set up. The discriminant accuracy of the DBN-SVM is 93.78%, increasing by 20.11% and 14.45% compared with the Naïve Bayes model and BP-ANN (back propagation-artificial neural networks), respectively. And, the results are stable with adjusted parameters. The DBN-SVM model can predict and discriminate coming dangerous lane-changing according to drivers’ driving history data, and warn drivers. As a result, it can reduce the chance of traffic accidents. This study provides theoretical support for lane-changing discrimination and warning under the connected vehicle environment.
dangerous lane-changing discriminant; vehicle simulation experiments; intelligent transportation; deep belief network; automatic driving; connected vehicle
10.3969/j.issn.1001-0505.2017.04.031
2016-11-06. 作者简介: 赵玮(1988—),男,博士生,讲师;徐良杰(联系人),女,博士,教授,博士生导师,laurrie119@163.com.
教育部社科青年基金资助项目(16YJCZH157)、国家重点基础研究发展计划(973计划)资助项目(2012CB725405)、内蒙古科技大学创新基金资助项目(2015QDL27).
赵玮,徐良杰,冉斌,等.基于深度学习DBN算法的高速公路危险变道判别模型[J].东南大学学报(自然科学版),2017,47(4):832-838.
10.3969/j.issn.1001-0505.2017.04.031.
U491.2
A
1001-0505(2017)04-0832-07