APP下载

基于随机森林模型的右转车与非机动车冲突风险影响因素研究

2024-08-15黄士倩周旦顾国斌杨瑞新赵振忠陈建球

时代汽车 2024年14期

摘 要:为分析车速、周期、冲突位置,以及交通量等因素对城市平面交叉口交通冲突的影响,从机动车特性、非机动车特性、交叉口特性三方面初选21个影响因素,选取南宁市桂林市4个典型平面交叉口进行实地调研,记录右转机动车与非机动车之间345条交通冲突数据作为分析样本,采用随机森林法分析城市交叉口右转车与非机动车风险构成要素间的致因及其显著性。研究结果表明:在城市交叉口中右转车与非机动车速度、各进口道周期、绿灯时长、交通量越大,发生冲突的概率越大;当机非冲突位置在交叉口中时,冲突的发生概率越大,应加强右转车在交叉口与非机动车转弯的安全风险防控。

关键词:机非冲突 影响因素 随机森林 交通安全

在城市道路交叉口交通安全的影响研究方面,Kathryn[1]得出骑行者骑行过程中打电话行为、听音乐行为以及与同行者攀谈行为等是诱发交通冲突发生的重要因素。程国柱[2]建立机非冲突数与非机动车流量的回归分析模型,模型结果表明自行车数量与机非冲突数成正相关,通过拓宽自行车道,可减少机非冲突的发生。Jiang等[3]在对交通冲突严重度进行辨别与分析后认为由红灯期间驶入左转车辆待转区的车辆而导致的二次冲突以及追尾冲突显著地 增加了交通冲突的严重性。刘志士[4]分析非机动车与机动车发生冲突的影响因素,发现土地利用类型、停车泊位利用率以及机动车开关门行为等是重要影响因素。郭延永等[5]发现直行和右转交通量与交通冲突存在显著的正相关关系,右转专用相位等可有效降低交通冲突。

目前对交通风险因素的分析,多集中与事故数据的双因素分析,基于交通冲突的更多要素的分析较少。本文通过对城市道路交叉口交通风险因素的分类整理,构建交叉口风险影响因素模型。并基于实际交通冲突数据和特征分析,谈论多风险因素对交叉口交通安全的量化影响,为交叉口多因素风险分析提供参考和借鉴。

1 基本思路

本文以实地调查采集和提取的数据为基础,对右转机动车与非机动车冲突样本提供了“严重性”标签,以便本文能够将每次冲突的“严重性”与其影响因素状况关联起来,开展有监督的机器学习训练。本文将介绍随机森林理论,阐述了它对本研究的适用性以及进行影响因素分析的思路。然后从交叉口、机动车、非机动车三个角度,选取21个影响因素并进行了量化。之后通过调整随机森林的超参数,实现了高精度的分类。按照因素重要度计算结果,将各因素分为强影响、弱影响和基本无影响三个等级。最后结合统计数据,分析了强弱影响因素的具体作用。

2 影响因素分析

2.1 随机森林模型

本文通过使用随机森林(RandomForest,RF)[6]的特征重要性评估,进行交通冲突影响因素分析。基本思路是:首先衡量每个因素特征在随机森林中的每棵决策树上做出的贡献,再根据决策树的数量取平均值,最后比较不同因素特征的贡献大小,进行重要性排序。本文采用基尼指数作为贡献度衡量指标,以下具体介绍因素重要性的计算思路和流程。

假设VIM为特征的重要性评分,GI代表Gini值。当前节点分到的样本中共有y个特征,表示第k个特征在节点m中所占的比例,则节点m的基尼值为:

(1)

可以看出,基尼值在0~1之间,越接近0,样本分类就越统一,纯度越大。

假设节点m以特征作为分支依据,则在节点m的重要性表现为分支前后GI值的变化量:

(2)

其中,和分别表示分支后的左右两个新节点的GI值。

设集合M是特征在决策树i中出现的所有节点,则在决策树i的重要性为:

(3)

若随机森林中总共有n棵树,则有:

(4)

最后对所有特征重要性评分进行归一化处理,得到最终重要性评分:

(5)

上述流程总结为:先计算某个特征在单个节点的纯度,再遍历一棵树的所有相关节点进行求和,之后遍历整片森林求和,最终进行归一化处理即为该特征对随机森林分类预测的贡献度,据此对影响因素重要性进行排序。

2.2 交通冲突影响因素

在交叉口安全影响因素研究中,Rodionova等[7]考虑了驾驶员、车辆、道路、事故形态和环境5个方面;初旭新等[8]则综合考虑车、路和环境因素,本文主要选取人、车辆、道路和管理因素作为交叉口交通风险的构成要素。目前对交叉口风险影响要素分析的研究中,并没有对冲突位置、车辆转弯半径与转弯车道半径进行区分,因而也忽视了分析由此而产生的交通冲突,而这种冲突在实际交通运行过程中会产生一定的安全隐患。本文从“交叉口”、“机动车”、“非机动车”这三个角度共提取21个因素对城市交叉口风险构成要素进行分析,城市交叉口风险构成要素见表1。

3 实例分析

选取南宁市白沙大桥-教育路、桂林市普陀路-芳香路、桂林市六合路-普陀路、桂林市东二环-航天路,共4个交叉口对随机森林模型进行验证,选择17:00-18:00时段四个交叉口合计60min交通视频,分析其中共计796辆机动车,4471辆非机动车。

冲突数据源于无人机采集高精度、连续的多车辆轨迹视频,结合Labelimg可视化图像标定工具实现运行车辆状态识别与跟踪,并记录车辆每一帧的运动数据;其次,基于交通冲突识别指标TTC,进一步对提取的轨迹数据进行以冲突角度、速度和距离、车身长度等为核心的机非冲突综合判别,并使用K-medoids 聚类算法确定右转车与非机动车各冲突的类型与严重程度,划分为严重、一般、轻微冲突三个等级。

本文基于Python3.7实现随机森林模型的分类预测和特征重要度排序,然后导入交通冲突严重性和影响因素量化的数据集,对各数据标签进行命名,按0.8和0.2的比例划分为训练集和测试集,使用训练集的数据训练随机森林模型。然后将测试集代入模型,计算分类学习的精度。之后计算特征重要度,对各影响因素进行排序。在超参数寻优时,设置决策树数量n_estimators范围为10至100,间隔为10,设置决策树深度max_depth范围为1至总特征数,间隔为1。分别计算两种冲突的每种参数组合的分类精度,结果如表4-4和表4-5所示(标红加粗的数值为最优值)

把上表绘制成三维图,数值为精度,横轴坐标分别是决策树数量与决策树深度。

找到上面计算的最优参数,即最优的决策树数量和决策树深度后,进行500次训练,检验模型分类精度与鲁棒性,结果如图所示,可以看出冲突测试集精度均稳定在0.8以上,曲线波动较小,模型鲁棒性较好。

每个数据样本由上方进入决策树后,在各个节点按照某个因素特征进行分割,最终划分形成叶片,得到冲突严重性结果。本文的随机森林模型以这些决策树为基础,根据前面2.1“影响因素分析原理”,完成对影响因素与冲突严重性关系的评估。各影响因素重要度计算结果如表3图3所示。

由图3可以看出,对于右转车与非机动车冲突,强影响因素有2个,分别是右转车速度、非机动车速度,重要度均在0.18以上;弱影响因素有5个,包括周期时长、非机动车交通量、绿信比、非机动车起始过街位置、右转车交通量,重要度在0.05~0.1;其余14个因素基本无影响。

4 结论

分析统计数据可以得出以下结论:

(1)在冲突双方的速度方面,右转车速度和非机动车速度越大,发生轻微冲突概率越小,发生严重冲突的概率越大。

(2)各进口道周期、绿灯时长越大,发生冲突的概率越大,这可能是由于周期、绿灯时长越大,交通状况越复杂。

(3)非机动车交通量与机动车交通量越大,发生冲突的概率越大。

(4)当机非冲突发生的位置在交叉口中时,冲突的发生概率和严重性越大,原因可能是其冲突距离更小,冲突反应时间更短。

(5)一块板和两块板对于右转hnJrJ3Pjg8Mn/OoF+uJS/2xsRw9X+ydic2WN0ixCpZQ=车和非机动车的冲突严重性影响相差不大,但三块板和四块板能明显降低严重冲突的概率,这可能是机非分隔带增加了右转车与非机动车的距离,提供了相对较大的缓冲空间。

在接下来的工作中,对应多因素风险影响机理可以进一步深入探讨,对应不同类型交叉口风险或不同类型车辆冲突之间的多因素影响效应还有待进一步分析和研究。

基金项目:大学生创新训练计划立项项目(S202210595279);2021年度广西中国-东盟综合交通国际联合重点实验室运行补助项目(21-220-21);南宁市科学研究与技术开发计划项目(20223230)。

参考文献:

[1]HU F, LV D, ZHU J,等.Related Risk Factors for Injury Severity of E-bike and Bicycle Crashes in Hefei[J].Traffic Injury Prevention,2014,15(3):319-323.

[2]程国柱,王婉琦,徐慧智.城市道路机非冲突分析与自行车道宽度计算方法[J].哈尔滨工业大学学报,2019,51(9):130-136.

[3]Safety evaluation of signalized intersections with left-turn waiting area in China - ScienceDirect[EB/OL].(2021-05-19)[2024-01-28].https://www.sciencedirect.com/science/article/pii/S0001457515300634.

[4]路侧停车对非机动车骑行干扰机理研究[EB/OL].(2021-05-19)[2024-01-28].https://d.wanfangdata.com.cn/thesis/ChJUaGVzaXNOZXdTMjAyNDAxMDkSCUQwMTA5Nzg5NBoIajE5eGM4b2U%3D.

[5]郭延永,刘攀,吴瑶,等.基于交通冲突模型的信号交叉口渠化岛设置方法[J].交通运输工程学报,2017,17(4):140-148.

[6]李英帅,张旭,王卫杰,等.基于随机森林的电动自行车骑行者事故伤害程度影响因素分析[J].交通运输系统工程与信息,2021,21(1):196-200.

[7]RODIONOVA M,SKHVEDIANI A, KUDRYAVTSEVA T. Prediction of Crash Severity as a Way of Road Safety Improvement:The Case of Saint Petersburg, Russia[J].Sustainability,2022,14(16):9840.

[8]初旭新,宗刚,彭朝霞,等.基于ISM的道路交通安全影响因素研究[J].安全与环境学报,2017,17(5):1668-1672.