基于NAIS的高速公路严重交通事故特征及致因分析
2022-10-19刘鑫肖乐金思雨
刘鑫,肖乐,金思雨
(西华大学 汽车与交通学院,四川 成都 610039)
随着机动车保有量与驾驶人数量的增加,高速公路交通流量日益增长,随之而来的是道路交通事故频发。与普通公路相比,高速公路具有行驶速度快、通行流量大等特点,发生碰撞事故时往往会造成更大的财产损失和更严重的伤亡事故。国内外学者基于不同的道路交通事故数据源对交通事故特征及致因进行了研究,如李振明等基于沪昆(上海—昆明)、京哈(北京—哈尔滨)高速公路2016—2019年1 396起真实伤亡事故数据,分析得出事故原因的差异主要在于车流量和气候的影响;张宝等通过分析内蒙古G65高速公路交通事故数据,发现在不同条件下高速公路事故的空间分布存在明显差异;孙烨垚等基于深圳市2017—2019年高速公路交通事故数据,得出高速公路交通事故呈现货车事故高发、追尾事故占比高、二次事故易发的特征;牛毅等基于浙江省2012—2017年高速公路交通事故数据,分析得出凌晨时段最易发生由疲劳驾驶引起的死亡事故;冯蕾等对雾天交通事故多发的10条高速公路近5年事故数据进行分析,得出雾天交通事故造成的后果更严重,伤亡率显著上升;刘志强等基于济南市高速公路交通事故数据,得出行驶速度与雾霾程度同时增大时,事故发生率以平方速度增长;Wang X.S.等基于自回归模型对上海高速公路交通事故数据进行分析,得出道路几何特征及交通运行情况是引起单车和多车碰撞事故差异的重要原因;袁振洲等基于河北省2018年高速公路交通事故数据,通过Apriori算法进行关联规则挖掘,得出在不良道路和不利环境共同作用下发生事故的概率显著增大;Goniewicz K.等根据波兰事故数据分析得出引起44岁以下男子死亡的首要原因是道路交通事故;Bashir A.等基于阿拉伯联合酋长国(UAE)10年交通事故数据,分析发现由于驾驶员失误造成的事故占多数;Kreicbergs J.等通过分析2016年拉脱维亚道路事故案例,指出道路使用者在事故中受伤害的比例最高;冯忠祥等基于合肥绕城高速公路交通事故,分析得出事故时间段和天气对交通事故严重性的影响最大。不同的数据源会有不同的研究思路和研究对象,从而导致研究结论产生差异。数据源是事故特征和致因分析的关键所在,基于此,该文采用国家车辆事故深度调查体系数据库(NAIS)中的数据,将重伤或死亡一人及以上的事故定义为严重事故,分析这类事故的基本特征及致因机理,为降低和缓解高速公路交通事故严重程度提供依据。
1 数据来源
NAIS成立于2011年8月,由国家市场监督管理总局联合国内多所高校及交通司法鉴定中心共同建立,其目的是对车辆事故进行深度调查挖掘,为缺陷汽车产品召回、自动驾驶体系研究开发及标准制定等提供数据支撑。数据库中采集的案例大部分为较严重的道路交通事故,是中国起步最早、最详细的交通事故数据库之一。目前,NAIS拥有8个工作站点,进行7个不同地区的事故深度调查,分别为成都、天津、广州、上海、济南、昆明、哈尔滨,涵盖多种事故类型及多种地理条件。NAIS的数据规范参考美国道路交通安全管理局(NHTSA)的深度调查体系,并针对中国道路实际情况对调查字段进行更新与优化。因此,根据其中事故数据进行分析得出的结果应该能较好地反映中国道路交通事故的特点。
NAIS数据库共收录2011—2019年底的4 651起事故数据,其中事故涉及人员12 585人。该文以2017—2019年289起发生在高速公路上的严重交通事故作为数据来源,包含非死亡事故90起、占比31.1%,死亡事故199起、占比68.9%。
2 高速公路交通事故特征
2.1 事故的时间分布规律
根据事故发生时的月份、星期、时段对数据进行统计,得到图1~3所示事故月份、星期、时段分布。
由图1可知:10月发生的事故数量最少,之后逐渐增长,到1月形成小高峰;2月的事故数量有所下降,3月开始事故数量逐渐增加,在8月形成最高峰;9—10月事故数量急剧下降。6—8月事故多发的原因可能是夏季温度较高,很容易发生爆胎等故障,同时驾驶员更易疲倦、困乏。另外,从11月开始气温逐渐降低,路面和环境状况不佳,导致行驶风险大幅增大。
由图2可知:事故数量在星期上呈倒V形分布,星期三发生的事故数量最多,约占20%;随后逐渐下降,星期六事故数量最小;从星期天开始,事故数量逐渐增多。星期一至星期五为工作日,出行情况相对较多,相应地发生的事故也较多;周三可能是事故采集地区的出行最高峰时间,事故率最高。
图2 高速公路交通事故星期分布
由图3可知:从17:00开始,事故数量逐渐增多,多为刮蹭、追尾等轻微事故;20:00—21:59事故数量多,占所有事故的12.8%,可能是由于晚上缺乏光照,驾驶员视线和视野都受到一定程度影响,加上疲劳驾驶和超载等原因,很容易导致事故且其后果相当严重;12:00—12:59事故数量最少,只占3%。
图3 高速公路交通事故时段分布
2.2 事故的地点分布规律
在采集事故信息时,NAIS对事故地点进行了详细划分。这里结合各事故地点的共同属性对事故地点进行再分类,分为普通路段、高架路段、匝道口、进出口及隧道、其他特殊路段5类。根据事故发生地点对事故进行统计分析,结果见图4。
图4 高速公路交通事故地点分布
由图4可知:发生在普通高速公路路段的事故数量最多,占77.16%;其次为高架路段,占15.22%;其余路段事故数量相对较少。这主要是因为高速公路中普通路段居多,其余路段较少。
2.3 驾驶员过失分布规律
由于高速公路交通事故具有多种形态,一次事故可能有多个参与方,为方便统计,只选取单车事故及其他事故形态中乘用车驾驶员的主要过错进行分析,共统计289起事故,其中单车事故40起,其他事故249起。
2.3.1 单车事故驾驶员过失分布
如表1所示,从驾驶员过失来看,造成单车事故的主要原因是驾驶员超速行驶,占所有单车事故的30%;疲劳驾驶、操作不当及不安全行为也是导致事故的重要原因。
表1 单车事故驾驶员过失分布
2.3.2 其他事故形态中乘用车驾驶员过失分布
其他事故形态中驾驶员过失种类更多,包括一个参与方过失导致事故和双方都存在过失导致事故。对所有乘用车驾驶员的过失中出现次数最多的前8类进行分析,结果见表2。
表2 乘用车驾驶员过失分布
由表2可知:高速公路交通事故中驾驶员过失与碰撞方式存在高度联系,由于尾随相撞事故所占比例最高,相应地在驾驶员过失统计中超速行驶及未保持安全距离所占比例最高,分别为34.7%、22.0%。
2.4 事故后果分布规律
NAIS在采集事故案例时将事故后果分为轻微事故(仅轻伤)、一般事故(重伤,未死亡)、重大事故(死亡1~2人)、特大事故(死亡3人及以上)。这里将严重事故定义为1人及以上重伤或死亡事故。共统计事故289起,事故后果占比见图5。4种事故形态的事故后果占比见表3。
图5 高速公路交通事故后果分布
表3 高速公路交通事故形态分布 %
由表3可知:高速公路上发生的事故大多为重大事故,其后果比城市道路上事故更严重。重大事故在车撞行人事故中占比最高,超过90.00%,在车撞二/三轮车事故中占60.00%,在车撞车事故中占63.58%,在单车事故中占52.50%。
事故发生后,行人、二/三轮车骑车人的死亡率都相当高,这主要是因为行人、二/三轮车骑车人普遍缺乏保护装置,事故发生后非死即伤。车撞车事故中,虽然汽车有安全气囊和安全带等保护装置,但由于在高速公路上行驶速度较快,驾驶员的死亡率也相当高。另外,车车事故中特大事故也有一定占比,这是因为在高速公路上汽车容易发生连环碰撞。
3 研究方法
3.1 Logistic回归模型构建
将交通事故造成的后果分为非死亡事故、死亡事故两类,采用二项Logistic回归模型分析事故影响因素。假设造成事故发生的影响因素有n个,记作自变量x=(x1,x2,x3,…,xn),条件概率P(y=1/x)是相对于参考值的事件发生概率,则Logistic回归模型可表示为:
(1)
g(x)=w0+w1x1+w2x2+…+wnxn
(2)
式中:xi(i=1,2,…,n)为对事故后果有显著影响的自变量;y为两种事故后果的取值;w0、wi(i=1,2,…,n)为常量。
取式(1)的对数形式:
wnxn
(3)
分析中以显著水平p=0.05作为判断标准,得出对事故后果有显著影响的因素。p≤0.05时,因变量对事故后果有显著影响。
3.2 模型检验
自变量的显著性因数<0.05,表示该变量中至少有一个指标的优势比OR(事件发生概率P与事件不发生概率1-P的比值)有统计学意义,模型总体有意义。通过Hosmer-Lemeshow验证模型的拟合程度,p>0.05时,数据模型拟合良好,可进行下一步自变量分析;反之,自变量的统计学意义不足,不能进行进一步分析。
4 变量选取及编码
4.1 因变量
以是否有人员死亡进行区分,将严重交通事故造成的后果分为非死亡事故、死亡事故两类,因变量编码见表4。
表4 因变量编码
4.2 自变量
交通事故其实是车辆、道路、环境因素共同作用的结果,任意改变其中一个因素都会对事故后果造成或多或少的影响。为尽量体现实际交通条件对事故严重程度的影响,以客观性原则为基础,从环境、车辆、时段、气象方面选取8个自变量指标对高速公路严重交通事故影响因素进行研究。8个自变量均为分类变量,分析前将其设置为哑变量,每个变量都以最后一类为参照。变量编码及含义见表5。
表5 自变量编码
5 模型结果分析
5.1 模型检验
将自变量与因变量事故后果建立二项Logistic回归模型,借助统计分析方法,得到模型系数综合检验结果、模型拟合程度检验结果(见表6、表7)。步骤、块、模型的检验结果都为零,说明模型中变量均有意义;模型的拟合程度检验结果为0.556>0.05,说明模型的拟合性良好,可进行下一步自变量分析。
表6 回归模型系数的综合检验结果
表7 回归模型的拟合程度检验结果
5.2 计算结果分析
二项Logistic回归模型分析结果见表8。其中B为自变量的相关系数,exp(B)为自变量的OR值,是事件发生概率P与事件不发生概率(1-P)的比值,即死亡事故与非死亡事故的比值。
表8 回归模型的计算结果
根据自变量的显著性,满足p≤0.05的自变量有路段类型、事故形态、是否与货车有关及是否超速,即这4个自变量与高速公路事故严重程度呈显著关系。
从事故路段类型来看,普通路段、高架路段、匝道口、进出口的OR值分别为38.096、25.016、38.318、8.093,且相关系数B>0,这4种路段上发生死亡事故的概率为高速隧道及其他特殊路段的38.096、25.016、38.318、8.093倍。这可能是因为高速公路中普通路段居多,驾驶员长时间处于高速行驶,很容易分心和疲劳;高架路段处于较高位置,驾驶员心理紧张,加之较高的速度,加重了事故严重程度;匝道口、进出口的交通状况复杂,驾驶员需提前换道,一旦换道距离过短极有可能与来不及刹车的后车发生碰撞,增加事故严重程度。
从事故形态来看,车撞行人时发生死亡事故的概率最大,其OR值为13.509,且B>0,涉及行人时造成人员死亡的概率为单车事故的13.509倍。说明行人作为弱势道路交通参与者,一旦与车辆发生碰撞极易造成死亡,也说明发生事故的高速路段的路面巡逻、宣传不到位,导致行人安全意识不足,横穿高速公路的现象时有发生。
从事故是否与货车有关来看,事故与货车有关时,发生死亡事故的概率为无货车参与事故的3.305倍。主要是由于货车自重较大,加上超载,一旦发生紧急情况来不及刹车或刹车距离较短,从而增加事故严重程度。
从事故是否与车辆超速有关来看,车辆超速行驶时,发生死亡事故的概率为车辆没有超速时的2.267倍。主要是由于高速公路上车辆行驶速度本来就较快,如果超速,造成的事故更严重,更易导致死亡事故。
6 结语
以事故严重程度为因变量,从事发时天气、时段、季节、路段类型、事故形态、道路信息、涉及车辆、车辆类型等方面选取8个候选自变量,采用向前逐步回归法分析自变量与因变量之间的显著性关系,得出路段类型、事故形态、是否与货车有关及是否超速与事故严重程度显著相关。
综合分析上述影响交通事故后果的自变量,可采取如下减缓事故严重程度的对策:1)在匝道口路段附近增设醒目、有效的标识信息,提示驾驶员事故多发,警示其减速慢行并谨慎驾驶。2)在高速公路附近村庄散发宣传单并请相关人员进行安全教育,告诫居民不得横穿高速公路。3)加强对中大型货车的管制,坚决治理货车超限、货车驾驶员疲劳驾驶等问题;要求大型车靠右侧行驶,所有车辆不得无故占用应急停车道。4)加强驾驶员安全教育,加大对超速行为的惩罚力度。