基于部分优势比的高速公路路产损失严重度分析
2022-10-18姚红云曹志富凃强
姚红云,曹志富,凃强
(重庆交通大学 交通运输学院,重庆 400074)
公路路产损坏不仅影响公路的安全、畅通,也影响正常的经济和生活秩序。公路路产损坏索赔是公路行政部门进行路产修复的经济来源,然而受当事人、保险公司、案件复杂度以及执法能力等因素的影响,路产损失往往得不到赔偿。因此,明晰路产损坏严重度的影响因素及影响程度大小,将有利于管理部门进行针对性管理,从而降低路政部门的管养经济损失。
《道路交通事故处理程序规定》[1]中,将道路事故分为财产损失事故、伤人事故和死亡事故。现有文献在研究事故严重性时,也多按财产损失、轻伤、重伤死亡三个等级划分,缺乏对财产损失的细致考虑[2-5]。而现有关于路产损失的研究中,仅涉及了路产损失赔偿[6]、法律保护[7]和权益维护[8]问题,忽视了需从管理层面降低路产损失程度,因此有必要对路产损失严重程度进行深入研究。在关联性研究中,多采用Logistic回归、多项Logit模型、有序Logit模型等统计分析方法[9-15],但多元Logit模型未考虑到被解释变量的内在有序性,且需要满足不相关选择项独立性假设[16],这与事故严重度的有序特性相违背。有序Logit模型虽然考虑到了被解释变量的有序性,但需满足比例优势假设,即模型解释变量系数对任意等级被解释变量都是固定不变的[17],这种假设限制了影响因素对不同等级事故的影响效果。支持向量机、随机森林和神经网络等智能算法[18-21],虽在精度上保持着优势地位,但受限于数据量,且可解释性不强[22]。部分优势比模型相比以上模型,不仅在保证被解释变量内在有序性的同时放宽了比例优势假设,且对数据量的要求也不高,因此应用于关联性研究时考虑因素更多,解释性更强。考虑到路产损失事故中,不是所有的影响因素都满足比例优势假设,因此本文选用部分优势比模型,以成渝高速公路造成路产损失的事故为对象,探究与路产损失严重度显著相关的因素,并以弹性系数分析这些因素对路产损失的影响程度。
1 数据来源与分析
1.1 数据来源
以成渝地区某高速公路2011—2018年8年间造成路产损失的交通事故为研究对象,根据事故台账记录数据(包含日期、时段、方向、桩号、车牌号、大小车型、事故形态、事故原因、事故、天气状况、路段线形等信息),剔除台账中信息缺失的数据,结合赔偿能力(西南地区平均薪资水平)及数据特性,将产生路产赔偿的814起事故按路产赔偿金额大小划分为3级,并统一定义为路产损失事故。1级路产损失事故损失不超过4 000元,共449起(55.16%);2级路产损失事故损失为4 000~10 000元,共252起(30.96%);3级路产损失事故损失为10 000元以上,共113起(13.88%)。
1.2 数据分析
1.2.1 事故分布特性分析
(1)时间特性
通过对814起路产损失事故按路产损失等级进行分析,昼夜分布和季节分布见图1。从图1(a)可以看出白天的事故数多于夜间的事故数,下半夜的事故数多于上半夜的事故数,且损失程度越高的事故占比越小。按照北半球对于季节的划分,每年3—5月为春季,6—8月为夏季,9—11月为秋季,12—2月为冬季。从图1(b)可以看出1级路产损失事故在冬季发生的次数较高,而2、3级路产损失事故在冬季发生的次数较低,反而在秋季发生的次数较高,因此季节也应为路产损失事故考虑的一个因素。
图1 路产损失事故时间分布特性Fig.1 Time-distribution characteristics of road accidents
(2) 空间特性
根据事故统计数据,按照路产损失事故等级及平直路段事故占比,可以得到,路产损失事故主要发生在平直路段,特殊路段上发生的路产损失事故较少,表明特殊路段对事故发生率的影响较小。随着路产损失等级的提高,发生在平直路段的事故占比越大,且1、2、3级事故数分别为416、247、112起,其占比分别为93%、98%和99%,因此平直路段这一解释变量对事故等级的分布影响较大。由于本文将事故发生位置定义二分类变量,即平直路段和特殊路段,因此特殊路段中事故等级的分布也具有相似的规律。
1.2.2 事故形态及原因分析
考虑到路产损失严重程度可能与事故形态相关,本文将事故形态分为追尾、擦挂、撞固定物、翻车、其他5种形态,用以分析不同事故形态对路产损失程度的影响,具体信息如图2(a)所示。从事故发生的形态来看,路产损失事故中事故形态为碰撞固定物的事故数最多,追尾、擦挂、翻车的事故数大致相当,其他事故形态的占比最小,表明路产损失的严重程度很大程度上受事故形态的影响,因此分析事故形态与路产损失的相关关系是很有必要的。
图2 路产损失事故形态及原因Fig.2 Types and causes of road accidents
由图2(b)可以看出,从事故原因分析,操作不当对路产损失的影响最大,其他因素对路产损失的影响较小。肇事车辆类型中,重大货车为重型和大型货车构成的集合,中小货车为中型和小型货车构成的集合,客车为大型、中型和小型客车构成的集合。由图2(c)可知,在路产损失事故中,轿车是发生事故的主要车辆,然后是重大货车和中小货车,肇事车辆占比最小的是客车。且3级路产损失事故中由重大货车发生的事故占比最大,1、2级路产损失事故中由轿车发生的事故占比最大,客车发生2、3级路产损失事故的占比最小,表明肇事车辆类型与路产损失的严重程度存在着一定的相关性。
同时,根据表1统计数据,在路产损失事故中,雨雾天气的事故共计210起,非雨雾天气的事故共计604起。路产损失严重程度与雨雾天气发生事故数比例呈正相关,表明天气状况对路产损失严重程度有一定的影响。
表1 不同天气下路产损失事故数及占比
2 模型方法
2.1 部分优势比模型
在现实的交通场景中,受地区环境等影响,交通事故的影响因素通常只有部分因素能够满足比例优势假设,而其余因素违反,部分优势比模型在该数据条件下具有很强的适用性。该模型能够利用Stata中的gologit2命令求解[23]。模型可以表示为:
(1)
式中,Y为路产损失严重程度等级,X为满足比例优势假定的解释变量构成的向量,J表示划分的等级数,β为第j级路产损失事故满足比例优势假定的解释变量对应的系数,H为不满足比例优势假定的解释变量构成的向量,τ为第j级路产损失事故不满足比例优势假定的解释变量对应的系数。
本文将交通事故结果损失分为3个等级,因此部分优势比模型可表示为:
(2)
2.2 伪弹性分析
建模的目的是为了明晰与被解释变量呈显著相关的解释变量,部分解释变量与被解释变量虽然呈显著相关,但其系数的大小与正负情况并不总是决定影响程度大小[20]。弹性分析方法能够量化解释变量变化对被解释变量的影响程度,但模型为离散模型,不能以传统的弹性分析法计算。在合作博弈模型中,沙普利值的计算往往以缺失解释变量研究其对整体收益的影响,从而得到各解释变量对合作集体的影响力大小。与上述思想类似,考虑上述模型中解释变量为二分类变量或多分类变量,通过计算解释变量的边际效益得到伪弹性系数[24],用以评价解释变量对被解释变量的影响程度,计算公式如下:
(3)
3 案例分析
本文以成渝地区某高速公路发生在2011—2018年8年间的814起路产损失事故为研究对象,以统计分析软件Stata 16.1为工具,采用多重共线性检验控制解释变量之间的相关性,排除高度相关变量。采用逐步回归选择法进一步对变量选择,显著性水平为0.10。若P<0.10,则认为该解释变量对被解释变量有显著影响,对该解释变量进行保留。
3.1 变量分类与编码
根据现有数据的类型及数据量,以车、路和环境为参考,确定影响路产损失程度的解释变量共12个,见表2。原始统计数据中缺少驾驶员性别、年龄数据,且驾龄数据为编码信息,不能反应出驾驶员的实际驾龄,故不考虑驾驶员特性对被解释变量的影响。考虑到路产损失可能受涉事车辆数的影响较大,将涉事车辆数分为单车事故和多车事故。考虑交通量昼夜比及上下夜分布不均的影响,将事故发生时间分为3个等级。因原统计数据未统计路面干湿度、是否结冰和能见度,故将天气分为雨雾天气和非雨雾天气,季节按春夏秋冬四季划分。
表2 解释变量的分类与编码
表2(续)
解释变量中包含二分类变量和多分类变量两种,其中二分类变量可直接带入模型进行计算,对于多分类变量,需进一步设置虚拟变量,将每种类型转化为二分类变量,才能带入模型计算。若多分类变量有n类,则需生成(n-1)个虚拟变量用于计算。从表2中可以看出,肇事车辆类型、事故形态、事故原因、事故发生位置、事故发生时间和季节均为多分类解释变量。
这里以肇事车辆类型为例展示虚拟变量的设置,以“重大货车”为参照类型,引入三个虚拟变量,结果如表3所示。
表3 肇事车辆类型的虚拟变量
3.2 模型参数估计与分析
3.2.1 线形分析
由表4可知,曲线半径为1 000~2 000 m及大于2 000 m的参数估计为负,表明发生在半径小于1 000 m的事故与路产损失严重程度关系更紧密。缓和曲线的参数估计为正,表明拥有缓和曲线的路段发生的事故与路产损失严重度相关性呈正相关。同样由表4可以发现,线形特征这一影响因素满足严格的比例优势假定。
3.2.2 车辆分析
由表4可以看出,中小货车、客车、轿车的参数估计均为负值,且显著性水平高,表明重大货车事故对路产损失事故的影响更大。对比两个界限下的参数估计情况,可以发现二者发生了变化,表明肇事车辆类型中的中小货车、客车、轿车并不满足严格的比例优势假定,同时也证明了部分优势比模型的适用性。由涉事车辆数的参数估计可知,该变量与路产损失的严重程度联系相对紧密,但显著性水平不如肇事车辆类型。而涉事车辆中含有货车的参数估计为负,表明涉事车辆含有货车与路产损失严重度呈负相关,两者关系显著,但显著性水平并不高。
3.2.3 事故形态及原因分析
表4中并不含有事故形态相关变量,这是因为各事故形态变量对路产损失程度的影响较小,两者相关性不显著。而事故原因中间距不足和不按规定变道与路产损失严重度相关性显著,且参数估计值为负,结合其他原因事故数在路产损失事故中的占比情况,表明驾驶员操作不当对事故损失的影响更大。
表4 部分优势比模型的参数估计
3.2.4 位置、天气、季节分析
事故发生位置与路产损失严重度相关性显著,表明事故发生在平直路段对路产损失的影响更大。天气条件也同样与路产损失严重度相关性显著,且参数估计为正,表明雨雾天气相比非雨雾天气对事故严重度的影响更大。由表4可知,冬天在1级和2级损失事故的界限与路产损失相关性不显著,在2级和3级损失事故的界限与路产损失相关性显著,且参数估计均为负值,表明其他季节对事故严重度的影响更大。同时由参数估计值可知,季节为冬天这一因素并不满足严格的比例优势假定。
3.3 模型伪弹性分析
为了进一步分析由部分优势比模型得到的显著解释变量对被解释变量的边际影响,本文采用伪弹性系数分析显著解释变量对路产损失程度的影响,弹性系数值如表5所示。
表5 部分优势比模型解释变量伪弹性分析
表5(续)
(1) 线形分析
模型结果揭露了曲线半径对路产损失严重度的影响,由表5可知,在曲线半径为1 000~2 000 m的路段上,2级和3级路产损失事故的发生概率分别降低了7.20%和10.33%。在曲线半径超过2 000 m的路段上,2级和3级路产损失事故的发生概率分别降低了6.61%和14.29%。但在以上两类路段上,1级路产损失事故发生概率分别增加了3.14%和7.68%。对比缓和曲线对损失程度的影响情况,由于缓和曲线的影响,2级和3级损失事故的发生概率分别增加了8.48%和17.43%,表明拥有缓和曲线的曲线路段与重大路产损失事故相关性较高。
(2)车辆分析
伪弹性系数结果显示,肇事车型为中小货车、客车、轿车引起1级路产损失事故发生的概率分别增加14.04%、12.02%、26.10%,而对于2级和3级损失事故,三者的边际影响效果均为负,表明重大货车会引起2级和3级路产损失事故的发生概率增加,且从三者的边际影响程度来看,肇事车辆为重大货车发生2、3级路产损失事故的概率增加幅度较大。模型分析结果同样显示,多车事故会引起2级和3级路产损失事故的发生概率增加,增量分别为4.86%和9.75%,虽然相关性显著,但显著性水平不高,且涉事车辆数与1级路产损失的相关性不显著。从表6中还可以得出涉事车辆含有货车仅与1级损失事故显著相关,且引起1级路产损失事故的发生概率增加,增量3.96%。
(3)事故形态及原因分析
模型结果并没有揭示事故发生形态在路产损失程度方面的显著差异。事故原因方面,间距不足或不按规定变道均与路产损失程度显著相关,且前者的显著水平更高,两者均与1级路产损失事故发生概率的增加和2、3级路产损失事故发生概率的降低有关,两者分别使1级路产损失事故发生的概率增加2.51%和1.27%,使2级路产损失事故发生的概率降低3.94%和2.99%,使3级路产损失事故发生的概率降低6.45%和4.26%。
(4)位置、天气、季节分析
根据模型结果显示,平直路段使2级和3级路产损失事故的发生概率分别增加了67.61%和147.57%,且相关性显著,表明高速公路上重大路产损失事故发生在平直路段的数量占比更大。因为事故发生时间和行驶方向等变量与路产损失事故严重度的相关性水平较低,故未在模型中显示。雨雾天气也使2级和3级路产损失事故的发生概率得到增加,增量分别为2.75%和8.34%,表明雨雾天气对损失程度的影响较大。冬天仅与3级路产损失显著相关,且与3级路产损失事故发生概率的降低有关,为14.23%,表明其他季节与3级路产损失事故发生概率的增加有关。
4 结语
(1)以路产损失程度为被解释变量,按路产赔偿金额大小,将路产损失分为3个等级,1级路产损失程度损失为不超过4 000元、2级路产损失程度损失为4 000~10 000元、3级路产损失程度损失为10 000元以上。因驾驶员的相关数据缺失,仅从车、环境、事故形态及原因等方面选择29个相关解释变量,其中车的方面包括肇事车辆类型、是否涉及货车和事故涉及车辆数等;环境的方面包括是否为事故位置、时间、方向、季节、曲线半径等;事故形态及原因包括追尾、擦挂、翻车、间距不足等;建立了山区高速路产损失严重程度分析模型。
(2)与路产损失严重程度呈显著相关的13个解释变量,分别是1 000 m<曲线半径≤2 000 m、曲线半径>2 000 m、缓和曲线、中小货车等。其中肇事车型为中小货车、客车、轿车以及季节为冬季不满足比例优势假设,其余解释变量均满足比例优势假设。
(3)由部分优势比模型的分析结果可知,肇事车辆为重大货车会使2级和3级路产损失事故的发生概率增加,因为重大货车为虚拟变量的参考值,故不能得到具体的增加量,但从分析结果可以认为影响程度较大;拥有缓和曲线的曲线路段、多车事故、雨雾天气和平直路段均与2级路产损失事故和3级路产损失事故发生概率增加有关,概率为8.48%、4.86%、2.75%、67.61%和17.43%、9.75%、8.34%、147.57%。
本文的研究结果可以为交通路政管理部门制定预防措施提供一定的科学依据。受已知数据量的局限,文中未将驾驶员的年龄、性别、驾龄以及是否系安全带等特征纳入解释变量,在未来的研究中会进一步完善数据,并量化每种因素对路产损失程度的影响。