机非交通事故中驾驶员过错和事故严重程度影响因素的Logistic回归分析
2019-10-10林庆丰邓院昌胡继华
林庆丰,邓院昌,胡继华
(中山大学智能工程学院广东省智能交通系统重点实验室,广东 广州 510006)
道路拥堵的加剧和绿色出行理念的普及,使得非机动车在交通中扮演着日益重要的角色。目前,我国非机动车数量已超过4亿辆[1]。随着非机动车数量的增加,机非交通事故数量也呈现逐年上升的态势[2]。机非交通事故频发对人民群众的日常出行造成了严重的安全隐患,因此对机非交通事故进行探究具有重要的现实意义。
当前,国内外已有许多学者针对交通参与者的过错进行了探究。在国外,针对行人-机动车交通事故方面的研究,主要有Kim等[3]和Ulfarsson等[4]分别以美国夏威夷州和北卡罗莱纳州的交通事故记录数据为基础,分析了事故中行人和机动车驾驶员是否出现过错与事故发生时段、道路和环境等因素之间的关系;Zhang等[5]则通过分析事故中的过错对事故严重程度的影响,发现行人出现过错更有可能导致严重交通事故。在国内,针对驾驶员过错的研究主要集中于生理心理状态对驾驶行为差错的影响[6-7],以及如何为事故中驾驶员的过错定责[8]等方面,但比较缺乏综合考虑人、车、路和环境等因素对机非交通事故中双方驾驶员是否出现过错的影响研究。
在机非交通事故严重程度及数量方面,也有学者开展了一系列的研究。如Nie等[9]和聂进等[10]通过事故重建,分析了典型碰撞形态下自行车驾驶员的动态响应过程以及头部碰撞条件与车辆碰撞速度之间的关系,并进一步研究了其身体各部位的损伤分布以及头部损伤和下肢骨折风险;Raslavicius等[11]也通过重建汽车-自行车交通事故来评估自行车驾驶员的受伤情况,并指出自行车驾驶员的受伤情况很大程度上取决于汽车的行驶速度;Mcadams等[12]通过分析美国儿童自行车驾驶员发生的交通事故,发现自行车驾驶员是否使用头盔、事故是否涉及机动车等与自行车驾驶员的受伤情况密切相关;Li等[13]通过研究表明,由于共享单车对步行者的吸引力大于机动车使用者,造成路网上自行车数量的增加,但对减少机动车流量并没有明显作用,这导致机非交通事故数量上升;Prati等[14]使用数据挖掘技术来预测自行车交通事故的严重程度,发现碰撞类型、道路类型和机动车类型是事故严重程度最重要的影响因素;王涛等[15]采用有序Logit模型分析电动自行车交通事故严重程度的主要影响因素,得出照明情况和交通管控方式等11个因素与电动自行车事故严重程度显著相关。
上述研究主要分析了机非交通事故中自行车驾驶员个人受伤情况、事故数量和整体事故严重程度的影响因素,尚未见有综合考虑驾驶员过错和人、车、路、环境等因素对机非交通事故严重程度影响的研究报道。鉴于此,本文以广东省2017年交通事故数据库中的1 357条记录完整的机非交通事故数据为基础,综合考虑多种影响因素,分别建立了二元Logistic回归模型和三元有序Logistic回归模型,探究各因素对机非交通事故中双方驾驶员过错和事故严重程度的影响,为避免驾驶员出现过错和降低机非交通事故严重性提供参考依据。
1 研究方法
1.1 二元Logistic回归模型
假设因变量Y为二分类变量,1表示事件发生,0表示事件未发生。有m个自变量与因变量有关,记X=(x1,x2,…,xm),即有:
(1)
式中:P为事件发生的概率;β0为常数项;βi为回归系数。
1.2 有序Logistic回归模型
假设因变量Y含有J个等级,有K个自变量与因变量有关,记X=(x1,x2,…,xK),即有:
(2)
(3)
式中:P为累计概率;αj为常数项;βk为回归系数。
2 机非交通事故变量的选取与分析
本文从广东省2017年发生的机非交通事故中筛选出1 357条记录完整的事故数据作为本次研究的基础数据。
2.1 变量选取
2.1.1 因变量
若驾驶员被认定为需要承担事故的全部或主要责任,则认为该驾驶员在事故中出现过错;若驾驶员被认定为无责,则认为该驾驶员在事故中没有出现过错[5]。考虑到仅造成财产损失的机非交通事故在样本中占比较小,本次研究将机非交通事故严重程度按造成人员死亡、人员重伤和人员轻伤或财产损失分为恶性事故、严重事故和轻微事故3类。
2.1.2 自变量
交通系统由人、车、路和环境等因素组成,任何一个环节出现问题都可能导致交通事故的发生。因此,从机非交通事故信息中初步选取机动车驾驶员属性、非机动车驾驶员属性、机动车辆、非机动车辆、道路和环境等因素包含的20个变量作为候选自变量。
2.2 变量赋值与分析
机非交通事故因变量和自变量的赋值和描述性统计,详见表1。
表1 机非交通事故变量的赋值和描述性统计
3 机非交通事故影响因素的Logistic回归分析
本文使用SPSS 24.0软件分别构建二元Logistic回归模型和三元有序Logistic回归模型,对机非交通事故中双方驾驶员过错和事故严重程度的影响因素进行了Logistic回归分析。
3.1 机动车驾驶员过错的二元Logistic回归分析
以机动车驾驶员是否出现过错为因变量,选取表1中的机动车驾驶员属性、机动车辆、道路和环境等因素包含的16个变量为自变量,进行了二元Logistic回归模型拟合。在模型拟合前,采用回归系数方差分解法(RCVD)诊断了16个自变量之间的多重共线性,结果显示:条件指数超过30的维数对应变量(33.109)只有1个,且该变量的方差分解比均小于0.5,说明这16个自变量之间不存在明显的共线性关系,可作为独立变量进行二元Logistic回归分析。
通过构建机动车驾驶员过错的二元Logistic回归模型可得:机动车驾驶员性别、机动车驾驶员驾龄、机动车行驶状态、机动车使用性质、道路横断面位置、道路物理隔离、道路类型、时段和天气9个自变量满足建模条件。以这9个自变量构建的机动车驾驶员过错的二元Logistic回归模型拟合结果,见表2。
表2 机动车驾驶员过错的二元Logistic回归模型拟合结果
注:表中B为回归系数;S.E.为标准误;Wald为Wald检验值;Sig.为显著性水平;Exp(B)为优势比。以下同。
由表2可以看出:
(1) 在机动车驾驶员属性方面,男性驾驶员出现过错的概率是女性驾驶员的1.914倍;随着驾龄的增长,机动车驾驶员出现过错的概率先升后降。
(2) 在机动车辆方面,车辆直行状态下,机动车驾驶员出现过错的概率为车辆非直行状态下的0.525倍;非私用车辆驾驶员出现过错的概率仅为私用车辆驾驶员的0.269倍。
(3) 在道路方面,非混行道路上机动车驾驶员出现过错的概率为机非混行道路上的0.618倍;在无隔离的道路上,机动车驾驶员出现过错的概率最高,为中心隔离道路上的1.367倍,而在机非隔离道路上,机动车驾驶员出现过错的概率最低;机动车驾驶员在城市道路上出现过错的概率为在非城市道路上的0.547倍。
(4) 在环境方面,机动车驾驶员在夜晚出现过错的概率为白天的0.673倍;机动车驾驶员在晴天出现过错的概率为不利天气下的0.649倍。
通过对机动车驾驶员过错的Logistic二元模型整体进行检验,得到似然比卡方值为116.086,自由度为13,通过查卡方检验临界值表可知,当显著性水平为0.05时,卡方临界值为22.362。由于模型的卡方值116.086大于卡方临界值22.362,且Sig.值小于0.001,说明该模型整体通过了检验。同时,对该模型进行了Hosmer和Lemeshow检验,得到卡方值为6.896,自由度为8,通过查卡方检验临界值表可知,当显著性水平为0.05时,卡方临界值为15.507。由于模型的卡方值为6.896小于卡方临界值15.507,且Sig.值为0.548,大于0.05,说明该模型拟合度较好。
3.2 非机动车驾驶员过错的二元Logistic回归分析
以非机动车驾驶员是否出现过错为因变量,选取表1中的非机动车驾驶员属性、非机动车辆、道路和环境等因素包含的13个变量为自变量,进行了二元Logistic回归模型拟合。在模型拟合前,采用回归系数方差分解法(RCVD)诊断了13个自变量之间的多重共线性,结果显示:各维数的条件指数均小于30,且所有维数对应变量的方差分解比均小于0.5,说明这13个自变量之间不存在明显的共线性关系,可作为独立变量进行二元Logistic回归分析。
通过构建非机动车驾驶员过错的二元Logistic回归模型可得:非机动车驾驶员性别、非机动车驾驶员年龄、非机动车类型、道路横断面位置、道路物理隔离和道路类型6个自变量满足建模条件。以这6个自变量构建的非机动车驾驶员过错的二元Logistic回归模型拟合结果,见表3。
表3 非机动车驾驶员过错的二元Logistic回归模型拟合结果
由表3可以看出:
(1) 在非机动车驾驶员属性方面,男性驾驶员出现过错的概率是女性驾驶员的2.424倍;随着年龄的增长,非机动车驾驶员出现过错的概率逐步降低。
(2) 在非机动车辆方面,电动自行车驾驶员出现过错的概率是普通自行车驾驶员的2.318倍。
(3) 在道路方面,在非混行道路上,非机动车驾驶员出现过错的概率为机非混行道路上的1.832倍;在无隔离的道路上,非机动车驾驶员出现过错的概率最低,为中心隔离道路上的0.826倍;非机动车驾驶员在城市道路上出现过错的概率为在非城市道路上的1.679倍。
通过对非机动车驾驶员过错的二元Logistic模型整体进行检验,得到似然比卡方值为113.430,自由度为10,通过查卡方检验临界值表可知,当显著性水平为0.05时,卡方临界值为18.307。由于模型的卡方值113.430大于卡方临界值18.307,且Sig.值小于0.001,说明该模型整体通过了检验。同时,对该模型进行了Hosmer和Lemeshow检验,得到卡方值为5.601,自由度为8,通过查卡方检验临界值表可知,当显著性水平为0.05时,卡方临界值为15.507。由于模型的卡方值5.601小于卡方临界值15.507,且Sig.值为0.692,大于0.05,说明该模型拟合度较好。
3.3 机非交通事故严重程度的三元有序Logistic回归分析
以机非交通事故严重程度为因变量,选取表1中的机动车驾驶员过错、非机动车驾驶员过错、机动车驾驶员属性、非机动车驾驶员属性、机动车辆、非机动车辆、道路和环境等因素包含的22个变量为自变量,进行了三元有序Logistic回归模型拟合。在模型拟合前,采用回归系数方差分解法(RCVD)诊断了22个自变量之间的多重共线性,结果显示:机动车驾驶员过错与非机动车驾驶员过错之间存在共线性关系。因此,将非机动车驾驶员过错这一自变量删除,保留下来的21个自变量之间不存在明显的共线性关系,可作为独立变量进行三元有序Logistic回归分析。
通过构建机非交通事故严重程度的三元有序Logistic回归模型可得:机动车驾驶员的驾龄、机动车使用性质、机动车安全状况、非机动车类型、道路物理隔离、道路线形和机动车驾驶员过错7个自变量满足建模条件。以这7个自变量构建的机非交通事故严重程度的三元有序Logistic回归模型拟合结果,见表4。
由表4可以看出:
(1) 在机动车驾驶员属性方面,驾龄大于15年的驾驶员比其他驾龄的驾驶员更易发生严重程度较高的事故。
表4 机非交通事故严重程度的三元有序Logistic回归模型拟合结果
注:“a”表示该参数冗余,故对应的回归系数B的取值设置为0。
(2) 在机动车辆方面,非私用车辆比私用车辆更易发生严重程度较高的事故;安全状况差的机动车辆发生严重事故的概率也高于正常车辆。
(3) 在非机动车辆方面,电动自行车比普通自行车更不易发生严重程度较高的事故。
(4) 在道路方面,中心隔离道路上发生更严重交通事故的概率最高;非平直道路比平直道路更易发生严重程度较高的事故。
(5) 在驾驶员过错方面,有过错的机动车驾驶员比有过错的非机动车加强员更易发生严重程度较高的事故。
通过对机非交通事故严重程度的三元有序Logitic回归模型进行平行线检验,结果显示:显著性大于0.05,说明比例优势假设存在,表明运用符合比例假设的三元有序Logistic回归模型进行拟合是有效的。另外,模型的拟合优度检验结果显示:皮尔逊统计量和偏差统计量的显著性均大于0.05,说明该模型拟合度较好。
4 讨 论
4.1 驾驶员因素
在驾驶员性别方面,无论机动车或非机动车,男性驾驶员都比女性驾驶员更容易出现过错。相关研究也表明,男性驾驶员违反交通法规的行为比女性驾驶员多[16]。这可能与男性驾驶员普遍较为易怒和喜欢冒险等有关。
在机动车驾驶员驾龄方面,驾龄低于2年的新手驾驶员不容易出现过错。这可能是因为新手驾驶员一般较为谨慎,所以较少出现违反交通法规的行为。
在非机动车驾驶员年龄方面,年龄大的非机动车驾驶员出现过错的概率更低,说明年龄大的非机动车驾驶员更加遵守交通法规。
综上,相关部门和单位应关注不同性别、驾龄和年龄的驾驶员出现过错和事故严重程度的差异性,提出有针对性的交通安全教育和管理措施。此外,相关研究[5]指出,在行人交通事故中,机动车驾驶员的酒驾和超速等违法行为与事故严重程度相关。本文通过分析驾驶员过错对机非交通事故严重程度的影响,发现机动车驾驶员的过错更容易造成严重程度较高的机非交通事故。因此,相关部门要加大力度整治机动车驾驶员的交通违法行为,避免机动车驾驶员出现过错。
4.2 车辆因素
4.2.1 机动车辆
在机动车辆行驶状态方面,车辆在非直行状态下,机动车驾驶员较容易出现过错。这可能是因为车辆非直行时驾驶员更需要集中注意力,操作也较为复杂,稍有不慎就可能出现过错。
在机动车辆使用性质方面,非私用车辆驾驶员出现过错的概率较低,但一旦出现过错,发生更严重交通事故的概率较高。这可能是因为驾驶营运车辆或单位用车等非私用车辆时,出现违法行为等过错会导致驾驶员受到相应处分,所以非私用车辆驾驶员一般较为谨慎。然而,大部分非私用车辆车型较大,一旦发生事故,容易造成严重的后果。
在机动车辆安全状况方面,安全状况差的机动车辆发生更严重交通事故的概率远高于正常车辆,说明车辆的日常检修、维护与运行安全息息相关。
综上,相关部门和单位应加强交通执法工作,并加大对机动车驾驶员安全教育的力度;同时,机动车驾驶员要严格执行道路运输车辆技术管理规定,并严格落实车辆的日常检修和维护工作。
4.2.2 非机动车辆
电动自行车驾驶员出现过错的概率高于普通自行车驾驶员,但普通自行车更容易发生严重程度较高的交通事故。这可能是因为电动自行车速度较快,驾驶员追求刺激、冒险的行为多于普通自行车驾驶员,但由于电动自行车具有照明灯和后视镜等安全装置,因此发生严重交通事故的概率较低。
综上,相关部门和单位要严格查处非机动车的违法行为,规范非机动车驾驶员的驾驶行为;同时,普通自行车驾驶员夜间行车应安装夜行灯,以保障安全。
4.3 道路因素
在道路横断面位置方面,机非混行道上机动车驾驶员出现过错的概率较高,而非机动车驾驶员出现过错的概率较低。这可能是因为机非混行道上的交通比较复杂,机动车驾驶员需要集中注意力才能进行正确的操作;而非机动车由于缺少防护,驾驶员在机非混行道上驾驶时一般比较谨慎。
在道路物理隔离方面,机非驾驶员出现过错概率最低的道路分别为机非隔离道路和无隔离道路,但事故严重程度较高的道路隔离类型为中心隔离道路。这可能是因为在中心隔离道路上机非交通事故双方驾驶员都放松了警惕,但该类地点又没有实现严格的机非隔离,所以容易导致严重的交通事故。
在道路类型方面,城市道路上机动车驾驶员出现过错的概率较低,非机动车驾驶员出现过错的概率较高。这可能是因为城市道路各类管理措施和电子警察等执法设施较为完善,对机动车驾驶员具有一定的约束作用,但这也使非机动车驾驶员放松了警惕,因而更容易出现过错。
在道路线形方面,机非驾驶员在平直道路上驾驶时发生更严重交通事故的概率较低。这可能是因为在非平直道路上,驾驶员需要时刻注意道路线形的变化,并对车辆进行相应的操作以保证正常行驶,稍有不慎就可能酿成事故;此外,在非平直线形道路上,驾驶可能存在视线盲区,容易导致严重交通事故。
综上,相关部门和单位应在事故多发点设置合理的交通管理设施,并加强交通执法力度,同时在规划和设计道路时应尽量采用平直线形,且在其他线形的合理位置设置相应的标志警示驾驶员。
4.4 环境因素
在时段方面,机动车驾驶员在夜间出现过错的概率较低。这可能是因为夜晚光线较差,机动车驾驶员一般比较谨慎。
在天气方面,机动车驾驶员在晴天出现过错的概率较低。这可能是因为雨天和雾天等不利天气下,行车条件较差,严重影响了驾驶员的判断和操作,因而驾驶员更容易出现过错。赵晓华等[17]对不良天气下驾驶行为研究的综述中也指出,雨雪雾等天气下驾驶员的行为能力会出现明显的下降。
综上,相关部门和单位除加强交通执法工作外,还应对交通运行环境进行实时动态监测[18],做好不利天气条件下的交通管理和事故救援应急预案,并采取合理措施保障交通安全。
5 结论与展望
本文通过研究驾驶员、车辆、道路和环境因素对机非交通事故中机非双方驾驶员过错和事故严重程度的影响,得到如下结论:
(1) 机动车驾驶员是否出现过错与机动车驾驶员性别、机动车驾驶员驾龄、机动车行驶状态、机动车使用性质、道路横断面位置、道路物理隔离、道路类型、时段和天气9个变量显著相关。
(2) 非机动车驾驶员是否出现过错与非机动车驾驶员性别、非机动车驾驶员年龄、非机动车类型、道路横断面位置、道路物理隔离和道路类型6个变量显著相关。
(3) 机非交通事故严重程度与机动车驾驶员驾龄、机动车使用性质、机动车安全状况、非机动车类型、道路物理隔离、道路线形和机动车驾驶员过错7个变量显著相关。
(4) 通过模型检验,表明本文构建的二元Logistic回归模型和三元有序Logistic回归模型具有较好的有效性和正确性。
本文的研究结果可为交通规划设计和交通管理等相关部门采取有效措施降低机非交通事故严重程度提供参考依据。例如:有针对性地对男性营运驾驶员进行交通安全教育;严格查处安全状况不达标的车辆;规划设计道路时应尽量采用平直线形;相关部门要做好不利天气下的管理和事故救援应急预案等。
机非交通事故中双方驾驶员负同等责任时,说明双方均存在过错。后续研究可考虑分析机非双方驾驶员均出现过错的影响因素,以进一步完善机非交通事故影响因素的分析。