重点交通违法行为识别方法研究
2024-03-17李雨龙
摘要 文章针对承担事故主要责任的驾驶人群体,挖掘其历史交通违法行为记录中包含的事故风险信息,筛选重点交通违法行为。使用经频率修正后的互信息,刻画事故严重程度类型与交通违法行为类型的关联关系,依据与不同严重程度事故的显著关联性对重点交通违法行为进行选取。采用广州市采集到的数据进行分析,分别得到死亡、伤人、财产损失事故相关联的重点交通违法行为,将筛选结果与基于发生频率选取的重点交通违法行为、基于与事故直接关联关系选取的重点交通违法行为进行对比,结果表明,基于驾驶人交通违法行为记录与事故严重程度视角筛选得到的重点交通违法行为涉及范围更广,包含更为丰富的驾驶人事故风险信息,对于有效识别驾驶人的事故倾向具有重要作用。
关键词 交通工程;重点交通违法行为;驾驶人历史违法行为;违法行为事故关联
中图分类号 U491.31文献标识码 A文章编号 2096-8949(2024)02-0016-03
0 引言
随着我国民用汽车保有量不断增加,道路交通事故已成为危害人民生命财产安全的最大威胁之一[1]。人作为道路交通系统的核心,与事故的关联最为紧密[2],而人的不安全行为则是造成事故最重要的因素之一。通常意义上来讲,不安全行为包括但不限于攻击性驾驶行为、疲劳驾驶行为、分心驾驶行为等,其中部分具有较高危险性、负面影响,违背官方道路交通管理控制相关条例,抑或涉及侵犯公共秩序、他人合法权利的行为,被广泛地认定为交通违法行为。针对驾驶人的交通违法行为进行全方面的挖掘和探索,深入刻画驾驶人事故风险因素,是掌握人因道路交通安全风险来源、道路交通事故发生规律,进而控制事故发生频率和严重程度的重要途径。
交通违法行为与事故的关联关系是既有交通违法行为研究的核心主题。基于事故报告,提取报告中认定的驾驶人交通违法行为,单独或与其他相关因素一道作为自变量,采用参数或非参数模型,分析交通违法行为与事故的直接关联关系,是既有研究通常采用的模式和流程。张丽霞等[3]认为酒后驾驶、疲劳驾驶、超速、不按规定让行四类行为对道路交通事故的影响最大。
除事故报告外,驾驶人日常驾驶中的交通违法行为记录虽未伴随事故的发生,却隐藏了驾驶人不良驾驶习惯、驾驶风格、风险感知能力等丰富的信息。刘林等[4]使用对应分析方法,刻画了事故车辆碰撞类型与部分历史交通违法行为类型间的关联程度。但对应分析方法本身更倾向于描述研究对象之间的相似性而非相关性,结论成果有明显缺陷。
1 数据准备
1.1 数据结构及预处理
该文采用的交通事故、违法数据采集地点为广州市主城区,事故数据时间跨度为2018—2019年,违法数据时间跨度为2015—2019年。去除与该文研究无关的字段,得到脱敏违法数据样例表,部分展示如表1与表2所示。
1.2 相关性检验
事故严重程度类型有死亡事故、伤人事故、财产损失事故3种,各类型发生频数总计表示为A={A1, A2, A3}。违法行为类型有251种,发生频数总计表示为W={W1, W2, …W251}。依据驾驶人责任事故类型以及交通违法行为记录,汇总计算发生j类型事故的驾驶人群体,交通违法行为记录中存在违法类型i的频数记为fi,j,事故严重程度类型—交通违法行为类型列联表汇总如表3所示,其中,N=A1+A2+A3=W1+W2+…+W251。
依据交通违法行为与事故严重程度列联表,采用Person卡方检验分析交通违法行为类型与事故严重程度类型的相关性,具体公式为:
(1)
式中,,计算得到1 374.48>,表明驾驶人在日常驾驶中发生的交通违法行为类型与后续事故的严重程度类型具有显著关联[5]。
2 重点交通违法行为识别方法
2.1 修正互信息
互信息是信息论中的概念,如基于熵的定义式(2)所示,它通过衡量一个变量加入后另一个变量不确定性的变化,描述两个变量间的相关程度。计算公式如(3)所示:
(2)
(3)
相对于统计学中常用的各类相关性系数,互信息具有能够同时衡量线性、非线性相关性,计算简便等优势。故该文使用互信息描述特定类型交通违法行为与事故严重程度的相关关系,基于表3,构造单一交通违法行为类型与事故类型對应表如表4所示。
其中,
(4)
(5)
(6)
(7)
(8)
(9)
计算交通违法行为类型wi与事故类型aj的互信息,计算方法如下:
(10)
其中,、、。
该文将违法行为类型频数与违法记录中各类违法行为总频数之比作为修正系数,如式(11)所示。将结果与各类违法行为与事故严重程度的互信息相乘,得到修正后的互信息结果如式(12)所示。
(11)
(12)
2.2 潜在关联重点交通违法行为筛选
借鉴使用ROC平面,评估二分类分类器性能时的基本思想,定义关联方向系数β,具体确定方法如下:
(13)
其中,
(14)
(15)
当发生该类事故驾驶人群体存在此交通违法行为的比率,高于未发生该类事故驾驶人群体存在此交通违法行为的比率,此交通违法行为与事故类型之间存在正向关联,此时两者关联方向系数为正,否则为负。
将关联方向系数与修正互信息相乘,得到正向关联修正互信息,如式(16),正向关联修正互信息的正负仅代表关联关系方向。
(16)
基于正向关联修正互信息,筛选得到各类型事故潜在关联的重点交通违法行为集合[6]。
3 筛选结果及对比分析
采用上文方法,得到关联死亡事故的重点交通违法行为10种,具体如表5所示。
参考《广东省道路交通安全条例》,死亡事故关联重点交通违法行为中惩罚最为严厉的为“饮酒驾驶机动车”,将被处以驾驶证暂扣及行政拘留的处罚,除此之外的其他违法行为对应驾照扣分平均值为3.25分;伤人事故关联重点交通违法行为中惩罚最为严厉的为“未取得市交通运输管理部門核发的从业资格证书驾驶营运车辆从事营运活动,或者驾驶非营运车辆从事营运活动的”“驾驶改变、加装不符合国家安全技术标准的动力装置的机动车上道路行驶的”,惩罚措施分别为暂扣驾驶证1~3个月、扣留车辆处罚。除此之外的其他违法行为对应驾照扣分平均值为2.54分;财产损失关联重点交通违法行为中并无以暂扣驾驶证、扣留车辆或行政拘留为处罚方式的违法行为,对应驾照扣分平均值为1.08分。三类重点交通违法行为适用的惩罚强度,依照关联事故严重程度增加而递增。这表明日常驾驶活动中被记录交通违法行为的危害性大小与驾驶人的事故倾向类型相对应。此外,在现行管理处罚规定下,针对三类重点交通违法行为的惩治力度总体不足。
对比该文视角下筛选得到的重点交通违法行为集合与传统研究基于频率、基于与事故的直接关联两种视角下所关注的重点交通违法行为类型,可以分析得到如下结论:
(1)绝对发生频率无法准确刻画交通违法行为中包含的事故风险信息,以发生频率作为重点交通违法行为的筛选条件并进行针对性管控的策略,很难真正实现降低交通事故风险的目标。
(2)基于直接、潜在关联两种视角下筛选得到的交通违法行为具有一定相似性,其中,“在同车道行驶中,不按规定与前车保持必要的安全距离”“驾驶机动车不按交通信号灯规定通行”“机动车逆向行驶”“驾驶机动车手动操作移动电话、电子设备”“驾驶机动车跨越、骑轧道路中心黄色实线行驶”“驾驶机动车不按规定使用灯光”共同出现,表明这六类交通违法行为不仅本身具有较大的危害性,还可能直接导致不同严重程度的事故产生,同时也是危险驾驶人的典型特征。
(3)相对于基于直接关联视角筛选的结果,基于潜在关联筛选得到的重点交通违法行为涵盖类型相对更为丰富和全面,如不文明驾驶相关、行政违规相关的交通违法行为,传统研究中均未涉及。这表明基于交通违法行为记录—事故严重程度关联,对交通违法行为进行挖掘,能够更为充分、全面地展现驾驶人日常驾驶活动中更为常见的交通违法行为内包含的事故风险信息。
4 结论
该文基于驾驶人交通违法行为记录—事故严重程度关联视角,全面刻画交通违法行为与事故严重程度的潜在关联,并以此为依据筛选得到重点交通违法行为。结合基于频率、基于与事故直接关联选取的重点交通违法行为的联合分析结果表明,采用交通违法行为的发生频率筛选重点交通违法行为将遗漏事故风险信息,很难实现通过控制重点交通违法行为降低事故严重程度的目标;“在同车道行驶中,不按规定与前车保持必要的安全距离”“驾驶机动车不按交通信号灯规定通行”“机动车逆向行驶”“驾驶机动车手动操作移动电话、电子设备”“驾驶机动车跨越、骑轧道路中心黄色实线行驶”“驾驶机动车不按规定使用灯光”六类交通违法行为兼具危险性和危险驾驶人的表征能力,应进行重点研究和管控。
参考文献
[1]曾强, 王雪松, 张璇, 等. 基于时空交互模型的高速公路季节事故频次影响因素分析[J]. 中国公路学报, 2020(11): 255-263.
[2]张旭欣, 王雪松, 马勇, 等. 驾驶行为与驾驶风险国际研究进展[J]. 中国公路学报, 2020(6): 1-17.
[3]张丽霞, 刘涛, 潘福全, 等. 驾驶员因素对道路交通事故指标的影响分析[J]. 中国安全科学学报, 2014(5): 79-84.
[4]刘林, 傅惠, 吕伟韬, 等. 交通事故类型和违法类型对应分析[J]. 中国安全科学学报, 2017(11): 79-84.
[5]宋燕超. 高危交通违法类型的识别及其时空分布分析[D]. 南京:东南大学, 2022.
[6]敖谷昌, 杨利. 机动车驾驶员人为因素与交通事故危害性关联分析[J]. 重庆交通大学学报(自然科学版), 2010(1): 121-124.
收稿日期:2023-11-27
作者简介:李雨龙(1995—),男,硕士,研究方向:交通仿真、交通安全。