考虑乘客的交通事故受伤严重程度模型
2018-07-25王立晓
杨 晔,王立晓,左 志
(新疆大学 建筑工程学院,新疆 乌鲁木齐 830047)
近年来,随着城市经济的高速发展,城市化进程的不断加快,交通运输业随之得到了前所未有的发展,同时,这也给道路交通安全带来了巨大压力。为了有效改善道路交通安全现状,预防道路交通事故发生,需要对交通事故严重程度进行建模,掌握对交通事故产生影响的因素及各因素的影响程度[1]。
交通事故具有偶然性和随机性,并且影响交通事故严重程度的因素有很多并且也较为复杂[2]。国内外学者对于交通事故严重程度的研究已较为成熟,主要运用的是离散选择模型[3],其中二项Logit模型作为离散选择模型中的一类已广泛用于交通事故严重程度的研究中。例如:Theofilatos等[4]为探究城市内外影响道路交通事故严重程度因素的差异,根据2008年希腊的交通事故数据,以二项Logit模型为基础,分别建立城市内与城市外的交通事故严重程度分析模型。Shawky等[5]为分析追尾事故的严重程度,根据阿布扎比酋长国2010—2014年的追尾事故数据,基于二项Logit模型建立追尾事故严重程度模型。Valent等[6]采用二项Logit模型,分析意大利乌迪内省的死亡事故中的主要风险因素。马柱等[7]根据乌鲁木齐市5年的交通事故统计资料,基于二项Logit模型建立城市交通事故严重程度分析模型。马壮林等[8]根据京珠高速公路韶关段4个隧道的交通事故资料,采用二项Logit模型,分析了发生在隧道的交通事故的严重程度。王星等[9基于灰色马尔科夫模型对交通事故进行预测,对道路安全管理提供决策支持。肖赛等[10]对驾驶疲劳致因及监测研究进展综述,提出建立驾驶人生理特性与车辆行为变化特性的评价指标。冯忠祥等[11]为探析及量化绕城高速交通事故影响因素,结合二项Logit模型理论,建立绕城高速公路交通事故严重程度模型。
通过研究现状可知,研究者们多以驾驶员的受伤严重程度为研究主体,而乘客作为车内人员的一部分,并未考虑在交通事故中的受伤情况。因此,本研究根据某市2010—2015年的交通事故数据,分别以交通事故中的驾驶员和乘客的受伤程度为因变量,通过相关性和经验判断分析,筛选得到适合的自变量,基于二项Logit模型,分别建立交通事故驾驶员和乘客的受伤严重程度分析模型,分析比较影响驾驶员和乘客受伤严重程度的各影响因素。
1 二项Logit模型
本研究主要研究车内人员(包括驾驶员和乘客)的受伤严重程度,因变量分为二分类变量,分别为非严重受伤和严重受伤。设定车内人员严重受伤的概率为p,非严重受伤的概率为(1-p),根据Logit模型定义,可得
Logit(p)=β1x1+…+βixi(i=1,2,3…).
(1)
式中:xi为第i个人员的自变量,βi为第i个人员的自变量的回归系数。
根据Logit模型的转化定义可得
Logit(p)=ln[p/(1-p)].
(2)
将式(2)代入式(1),可得到车内人员严重受伤的概率p的计算公式
(3)
2 实证分析
2.1 数据介绍
本研究选取某市2010—2015年的道路交通事故数据,共发生3 744起事故,其中涉及的驾驶员有
5 430人,乘客有1 457人。交通事故数据可分为以下4类:事故基本信息、事故人员数据、事故车辆数据和现场环境数据。其中,事故基本信息主要有事故类型、事故伤亡人数、事故直接财产损失、事故发生的季节和地点等;事故人员数据主要有人员的性别、年龄、交通方式、受伤程度等;事故车辆信息主要包含车辆使用性质、车辆类型等;现场环境数据主要包括事故发生时的路表情况、道路物理隔离等道路信息和事故发生时天气、能见度等环境信息。
2.2 因变量
因变量分别为交通事故的驾驶员和乘客的受伤严重程度。根据交通事故数据,交通事故的驾驶员和乘客的受伤严重程度可分以下4类:无伤害、轻伤、重伤、死亡。本研究设定无伤害和轻伤为一类,定义为非严重伤害,并用Y=0表示,设定重伤和死亡为一类,定义为严重伤害,并用Y=1表示。
2.3 自变量
道路交通事故人员受伤严重程度的影响因素主要有人、车辆、道路和环境。本研究选取以下16个备选自变量,包括人员的性别、人员的年龄、事故是否发生在节假日、事故发生的季节、事故是否发生在高峰时段、事故形态、天气、能见度、路面状况、路表情况、照明条件、道路类型、道路线形、路口路段类型、道路物理隔离、路侧防护设施类型。受数据的限制,对于每个车内人员,无法得到与其相应的车辆信息,因此本研究未选择与车辆信息相关的变量。
本研究通过因变量和自变量的相关性分析对自变量进行了前期的筛选,将相关性较弱的变量根据经验判断选择性剔除,最终筛选得到以下9个变量:人员的性别、人员的年龄、事故发生的季节、事故是否发生在高峰时段、事故形态、路面状况、照明条件、路口路段类型、路侧防护设施类型。具体各自变量设置见表1。
当某个变量有k(k>2)个分类时,模型需要引入(k-1)个虚拟变量,将所有变量变为0-1变量。以人员的年龄变量为例,其分为3类,需要引入2个虚拟变量,具体如表2。
3 模型的建立与参数估计结果
对原始数据量化后,分别建立驾驶员和乘客的二项Logit模型,并利用R语言软件对模型参数进行估计,估计结果如表3所示。
表1 模型自变量设置
表2 人员年龄虚拟变量
表3 二项Logit模型的参数估计结果
注:|t|>1.64:90%置信水平显著,|t|>1.96:95%置信水平显著,|t|>2.58:99%置信水平显著
根据模型的估计结果,可以得到以下结论:
1)人员的性别:此变量在乘客模型中不显著,而在驾驶员模型中显著,参数值为负,表明女性驾驶员相较于男性驾驶员更容易受到严重的伤害。
2)人员的年龄:在驾驶员模型中,仅有变量年龄为22~60岁显著,且参数估计值为负,表明相较于年龄为22~60岁的驾驶员,年龄为22岁以下的驾驶员更容易受到严重伤害;在乘客模型中,变量年龄为22~60岁和年龄为60岁以上均表现为显著,且参数估计值均为负值,说明相较于年龄为22岁以上的乘客,年龄为22岁以下的驾驶员更容易受到严重伤害。
3)事故发生的季节:在驾驶员模型中,夏季和秋季是显著的,且参数估计值为正,说明春季发生的事故相较于夏季和秋季的发生事故对驾驶员造成的伤害可能更重;在乘客模型中,该变量不显著。
4)事故是否发生在高峰时段:在驾驶员模型中,该变量是显著的,参数估计值均为正,表明在高峰时段发生的事故更容易对驾驶员造成严重的伤害。在乘客模型中,该变量不显著。
5)事故形态:在驾驶员模型和乘客模型中,人车事故、碰撞运动车辆均为显著的,且参数均为负值,表明单车事故与人车事故和碰撞运动车辆事故相比,驾驶员和乘客的受伤程度可能会更重;除此之外,变量碰撞静止车辆还在驾驶员模型表现为显著,参数估计值为负,说明表明单车事故与碰撞静止车辆事故相比,驾驶员的受伤程度可能会更重。
6)路面状况:该变量在驾驶员模型中显著,参数估计值均为正,说明非完好路面下更容易发生严重的事故。在乘客模型中,该变量不显著。
7)照明条件:在驾驶员模型中,夜间无路灯照明变量为显著变量,并且夜间无路灯照明的参数估计值为正,这表明在夜间无路灯照明的条件下发生的事故可能会对驾驶员造成更严重的伤害。在乘客模型中,该变量不显著。
8)路口路段类型:此变量仅在乘客模型中显著,其参数值为负,说明在非普通路段的道路上发生的事故更容易对乘客造成严重的伤害。
9)路侧防护设施类型:此变量仅在驾驶员模型中显著,其参数值为负,说明在无路侧防护设施的道路上发生的事故更容易对驾驶员造成严重的伤害。在乘客模型中,该变量不显著。
4 结 论
本研究分别以驾驶员和乘客受伤严重程度为因变量,选取9个影响因素作为自变量,基于二项Logit模型,分别建立驾驶员和乘客的受伤严重程度模型,并利用某城市的交通事故数据进行参数估计。通过模型可以得出,性别、年龄、事故发生的季节、事故是否发生在高峰时段、事故形态、路面状况、照明条件、路侧防护设施类型对驾驶员的受伤严重程度有显著的影响,而年龄、事故形态、路口路段类型与乘客的受伤严重程度显著相关。今后的研究不仅要关注驾驶员的受伤严重程度,还要重视乘客在事故中的受伤情况,更深入地分析乘客的受伤机理和特征。