基于GIS的济南市交通事故成因分析
2023-07-14冯海霞宁二伟
冯海霞,宁二伟,王 琦,李 健
(山东交通学院 交通与物流工程学院,山东 济南 250399)
0 引 言
近年来,随着城市化以及各种先进技术的发展,我国的交通越来越发达。同时,车辆的增多也导致交通安全问题越来越严重。据统计,2018年,全国汽车保有量增加2 285万辆,达到2.4亿辆;驾驶人数增加2 455万人,达到4.09亿人;公路通车里程增加8.6万km,达到486万km。根据世界卫生组织发布的《2018年全球道路安全现状报告》,道路交通死亡人数继续上升,每年达到135万人。2018年,全国发生交通事故约24.5万起,造成约6.3万人死亡。交通事故会对社会稳定产生负面影响,造成大量人员伤亡和财产损失。道路交通安全已成为一个社会问题关注的焦点。如何通过交通事故分析,找出交通事故的成因,从而减少交通事故的发生是急需解决的问题。
国内外学者对交通安全问题都十分重视,并对其进行了相关的研究,取得了大量的成果。毛应萍等[1]提出了基于事故严重程度的GIS事故多发点段动态分析模型;孙烨垚等[2]基于GIS分析平台对高速公路道路交通事故特征及其事故成因进行分析,提出了交通安全改善对策及措施;刘尧等[3]利用时空网络核密度估计、热点分析法等方法进行交通事故的时空特征分析;陆化普等[4]利用聚类分析与密度分析法对道路交通事故多发的区域和事故严重程度较高的区域进行鉴别分析;彭璇等[5]实现了基于GIS的全国高速公路事故时序特征分析、事故空间特征分析、事故趋势综合分析等可视化应用;王丽雅等[6]将GIS系统和交通事故数据相结合,融合了事故数据的属性信息以及空间位置,得到了城市道路的真实安全情况;熊丽[7]提出一种基于地理信息系统(GIS)的交通事故热区鉴别的方法,通过对事故本身属性以及空间属性的综合考虑,对道路网的交通事故空间分布特征进行探索,并对事故高发区进行鉴别;张光南等[8]结合GIS对2010年广州市道路基础设施对交通事故的影响进行分析,并给出相应建议;A.AL-OMARI等[9]利用地理信息系统(GIS)和模糊逻辑对不同地点的事故热点进行预测,分析事故成因并提出预防措施;T. H.HAYIDSO等[10]利用ArcGIS将全局定位系统点数据和事故数据添加到路网数据中,根据事故严重程度确定热点区域;M.E.BOLLA等[11]基于GIS并以ArcView GIS为界面,开发了交通事故资料库以提供交通事故综合信息;G.A.SHAFABAKHSH等[12]利用ARCMAP核密度估计(KDE)和SANet软件(4版)对交通事故区域进行了分析,使网络分析结果与传统的KDE方法进行了比较,揭示空间因素对其形成的影响。笔者拟采用地理信息系统(GIS)技术,如核密度分析、缓冲区分析、地理加权回归分析等,主要从事故的空间特性方面进行分析,寻找事故成因。
1 研究区和研究数据
1.1 研究区域
济南市位于山东省中西部,具体经纬坐标为北纬36°01′ ~ 37°32′、东经 116°11′ ~ 117°44′。笔者以济南市为研究区域,包括市中区、天桥区、槐荫区、历下区、历城区、长清区、章丘区、济阳区、商河县、平阴县8区2县的数据。(2018年,莱芜区与钢城区未并入济南市)。
济南市2018年公路通车里程为12 637.7 km,其中,境内高速公路488.5 km。公路客运量为3 149.0万人;旅客周转量为52.9亿 人. km;公路货运量为2.6亿t;货运周转量为474.0亿t.km;机动车保有量超过230万辆。
1.2 研究数据及数据预处理
笔者主要使用了2018年济南市10个区县的交通事故数据(2018年钢城区和莱芜区未并入济南市,因此笔者未对这2个区域进行研究),数据来自济南市交警支队。因数据存在重复录入等情况,故对数据进行了预处理,即对原始数据进行排序和去重;并使用地理信息系统(GIS)的地址编码技术获取每个事故的经纬度数据。济南市2018年发生了6 796起交通事故,交通事故数据如图1。
图1 济南市交通事故数据Fig.1 Traffic accident data in Ji’nan
2 研究方法
笔者主要采用了核密度分析、热点分析、缓冲区分析、地理加权回归分析等方法。首先,使用核密度分析的方法直观地描述济南市交通事故在空间上的分布特征;其次,通过事故当量法结合缓冲区分析方法鉴别研究区的事故多发区域;最后,通过构建地理加权回归(GWR)模型,分析人口、车辆数、公路通车里程等因素对事故数量的影响,从空间特性方面分析事故的成因。
2.1 核密度分析
核密度分析从数据的样本出发,研究数据的分布特征。这种方法能够充分地利用原始的数据信息,且在不附加任何假定条件下研究数据分布。依照地理学第一定律,所有的事物都是与其相邻近的事物相关的,且距离越近,相关性就越强。基于这一定律,核密度分析通过核函数对一定空间范围内事故点的密度进行计算,距离越远,其核心的影响强度就越弱,因此空间差异性较强,可以对交通事故的空间分布进行分析[13]。
2.2 热点分析
热点分析能够计算每个要素的Getis-Ord Gi*统计。首先对所有要素进行查看,计算各个要素与其相邻要素的局部总和,然后与所有要素的综合进行对比,若局部总和与预期局部总和差距过大,分析结果不是随机产生的,则会生成具有显著统计学意义的Z得分。正值Z得分越高,则热点的聚类越紧密;负值Z得分越低,则冷点聚类越紧密。
2.3 缓冲区分析
笔者选用缓冲区分析的方法鉴别事故多发区域,以当量事故死亡人数作为各事故点的缓冲区半径;再利用GIS里的缓冲区向导工具对事故点进行缓冲;最后通过缓冲区结果图得到事故多发区域,结合交通事故热力图对道路基础设施情况的统计,得出事故多发原因。
2.4 地理加权回归模型
地理加权回归(geographic weighted regression, GWR)具有较强的空间数据局部分析能力。它对空间范围内的各点建立了局部回归方程〔式(1)〕,从而探索和研究一定尺度上研究对象的空间变化规律和相关驱动因素,可以很好的揭示空间异质性条件下的空间关系,并可用于对未来结果的预测。地理加权回归是普通线性回归模型的一种扩展,它将数据的空间位置嵌入到回归方程中,考虑了空间对象的局部效应,从而提高了准确性[14]。
(1)
式中:yi为因变量在i点的值;(μi,vi)为样点i坐标;βk(μi,vi)为样点i的第k个回归参数;xij为观测到i的第k个影响变量;p为影响变量的个数;εi为回归残差。
3 结果分析
3.1 核密度分析与热点分析结果比较
将核密度分析结果与热点分析结果进行叠加,结果如图2。
图2 核密度分析与热点分析对比Fig.2 Comparison between kernel density analysis and hot spot analysis
由图2可知:在人口聚集、车辆和道路密度更大的市区,交通事故相比于其他地区发生更为频繁;事故多发地具有明显的聚集性,济南市有多个事故多发中心。
热点分析的结果同样表明,市区的交通事故发生更为频繁。
对比结果显示:文中热点分析与核密度分析均能够鉴别交通事故的多发区域,但相较于热点分析,核密度分析能够更全面的显示交通事故多发区域。故选取核密度分析与缓冲区分析进行叠加分析。
3.2 缓冲区分析
为进一步分析事故成因,笔者采用“事故当量死亡人数法”和缓冲区分析相结合的方法,鉴别事故多发区域,分析事故成因。
3.2.1 事故当量死亡人数法
笔者以交通中的死亡人数、受伤人数以及直接财产损失作为反映交通事故的严重程度的数据项。事故严重程度通过道路交通事故当量死亡人数计算模型[15]确定,如式(2):
nD, E=nD+KZnZ+KQnQ+KClC
(2)
式中:nD, E为当量死亡人数;nD、nZ、nQ、lC分别为死亡人数、重伤人数、轻伤人数及直接经济损失;KZ、KQ、KC分别为重伤、轻伤和直接经济损失的换算系数。
而换算系数KZ、KQ、KC的计算中,主要使用“标准损失工作日S”这一指标。一人死亡损失工作日是死者由于道路交通事故而丧失的工作时间。假设一年有250个工作日,其计算公式如式(3):
S=(YR-Y)×250
(3)
式中:S为死亡一人所对应的损失工作日;YR为平均退休年龄;Y为平均死亡年龄。
根据公安交通管理部门提供的数据可知,2006—2009年,中国道路交通事故的平均死亡年龄为40岁,平均退休年龄为60岁,所以每一人死亡对应的标准损失工作日大约是5 000 d。
重伤换算系数KZ的计算方法如式(4)。不同级别的重伤对应的损失工作日为SZ,用其除以死亡一人的标准损失工作日S,即可求得重伤换算系数KZ:
(4)
当无法按伤残的评级折算时,由于重伤损失工作日的范围是100~5 000 d,取其算数平均值作为代表值,则其换算系数取0.51。
轻伤换算系数KQ的计算方法如式(5):
(5)
其中,轻伤的损失工作日SQ∈[2,100]。
直接经济损失换算系数KC的计算方法如式(6):
(6)
式中:KC为直接经济损失换算系数;G为上一年度职工的平均工资标准,万元。
计算出死亡一人标准损失工作日S对应的经济损失总额,取其倒数,即可推算出1万元直接经济损失的死亡换算系数KC。
根据国家统计局2018年发布的数据,城镇集体单位职工年平均工资为60 664元。经计算得直接经济损失的死亡换算系数KC约为0.008。对死亡人数、重伤人数、轻伤人数、直接财产损失进行相应的换算,最后求和得到各个交通事故的当量死亡人数。换算结果如表1。
表1 事故当量死亡人数换算
3.2.2 缓冲区分析
根据表1中的事故当量死亡人数,每个交通事故点以事故当量死亡人数的数值为半径进行缓冲区分析。由于每个事故点的当量死亡人数不同,分析结果即为半径不同的缓冲区。将缓冲区的结果和济南市的行政规划图叠加后,结果如图3。
图3 济南市交通事故缓冲区分析Fig.3 Analysis of traffic accident buffer zone in Ji’nan
图3的分析结果显示:A、B、C、D、E、F 共6个区域为事故多发区域,其区域面积分别为51、30、1 350、495、135、144 km2;每个多发区域的缓冲区个数分别为8、12、167、33、12、8个,如表2。用缓冲区个数除以对应的面积,得到单位面积缓冲区个数分别为0.159、0.400、0.124、0.067、0.089、0.056个。单位面积缓冲区个数计算结果表明,事故多发最为严重的区域为B,其次为A。C区域内的交通事故数量最多,计算结果也显示事故较为严重。
表2 事故多发区的面积和缓冲区个数
3.2.3 与核密度分析的异同
将缓冲区分析结果与核密度分析结果进行叠加,结果如图4。
图4 核密度分析和缓冲区分析结果对比Fig.4 Comparison of kernel density analysis and buffer analysis results
图4的叠加结果显示,缓冲区分析与核密度分析均可以鉴别出事故多发区域,但也有一些不同之处。缓冲区分析的结果显示A、B、C这3个区域均为事故多发区域,但核密度分析的结果显示A、B、C这3个区域均不是事故多发区域。
通过对原始数据进行分析,得出以下结论:A区域的3个缓冲区的事故发生次数分别为1、6、1次,死亡人数分别为3、0、0人,受伤人数分别为0、1、3人;B、C区域与A区域类似。综上,造成缓冲区分析与核密度分析差异的原因是,核密度分析是对事故发生次数进行分析,而缓冲区分析则是对交通事故的严重程度进行分析。
3.2.4 交通事故特征分析
对6个事故多发区域的事故特征数据进行统计,结果如表3。其中,路面不完整包括施工、凹凸等;道路物理隔离包括机非隔离、中央隔离等。
表3 事故多发区事故特征统计
经计算,事故多发路段无路侧防护设施与无道路物理隔离的占比分别高达36.3%和35.2%,夜间无照明与路面不完整的占比则分别为3.8%和2.6%。综上可知,无道路物理隔离与无路侧防护设施是交通事故多发的主要原因。
3.3 地理加权回归分析
为进一步对事故成因的空间差异性进行分析,笔者采用能充分反应空间异质性的地理加权回归模型进行分析,选取了人口、交通财政支出、区域面积、车辆数、公路通车里程等作为备选解释因子。根据统计年鉴等数据,2018年济南市各区县的人口、交通财政支出、区域面积、车辆数、公路通车里程以及交通事故数等数据如表4。
表4 济南市各区县基本情况数据
3.3.1 空间自相关分析
对交通事故进行空间自相关分析。莫兰指数作为一个用来衡量空间自相关的经典指标,其值若为正,则表示空间正相关;若为负,则表示空间负相关。笔者利用ArcGIS中空间自相关工具中的莫兰(Moran I)指数进行分析,其结果如图5。
图5 空间自相关报表Fig.5 Spatial autocorrelation report
图5显示:Z得分为1.914,则随机产生此聚类模式的可能性小于10%;济南市交通事故变量的莫兰指数为0.244,事故具有空间正相关性,即事故的分布呈现出明显的聚类模式,适用于地理加权回归模型。
3.3.2 地理加权回归模型分析
利用GWR模型对济南市各区县的交通事故发生次数分别与人口、GDP、交通财政支出、区域面积、车辆数、公路通车里程、路网密度的关系分别进行定量分析,其结果见表5。
表5 因变量为事故发生次数时的结果
GWR模型分析的结果表明,影响交通事故发生的主要因素为车辆数、公路通车里程、GDP以及人口。其回归系数分别约为0.557、0.353、0.351、0.334。交通财政支出、区域面积、路网密度3个参数的相关性较低,回归系数均低于0.11。综上,选取相关性较高(>0.25)的车辆数、人口等4个因子做解释变量进行相关性分析。
对4个影响因子之间进行相关性分析,其相关性详见表6。回归结果显示,公路通车里程和其他几个因子之间的相关性都很低,与车辆数的回归系数为0.045 1,与GDP的回归系数为0.004 7,与人口的回归系数为0.142 3,故选择公路通车里程作为一个解释变量;车辆数和GDP、人口之间的回归系数都在0.46以上,即具有较强的相关性,三者之间存在共线性问题,故选取了三者中与交通事故数相关性最高的车辆数作为另一个解释变量。在GWR的回归分析结果中,条件数如果小于0或者大于30或者设置为空,就意味着回归模型中存在较强的局部共线性问题,回归模型缺乏可信度,文中公路通车里程的条件数全部在3到4之间,车辆数在5到6之间,能够通过共线性检验,可信度较高。因此选取车辆数和公路通车里程作为解释变量,交通事故数为因变量同时进行地理加权回归分析,其结果如表7。
表6 因子相关性平方表
表7 车辆数、公路通车里程作为解释变量GWR结果
每个影响因子都对交通事故的发生有促进或者抑制作用,在回归结果上表现为回归参数的正、负情况。回归系数为正,则表示其会促进交通事故的发生;回归系数为负,表示其会抑制交通事故的发生。表5的回归结果显示,将公路通车里程和车辆数单独作为解释变量时,其回归系数为正,即2个影响因子都会促进交通事故的发生,而相较于分别与事故数进行地理加权回归,两者共同作为解释变量的回归系数(表7),其结果明显提高。
4 提高安全措施的建议
从宏观层面来看,交通财政支出与交通事故数没有明显相关性,但是在各类财政支出中,交通财政支出太少;公路通车里程和车辆数的增加导致了交通事故的增加,说明需要从需求侧入手,一方面要优化路网结构,最重要的是另一方面要减少需求,比如限行、限号等措施。
从微观层面来看,无路侧防护设施、无道路物理隔离这2个特征在事故中占比高达36.3%和35.2%,因此完善交通设施是最急迫的,可设立机非分隔栏和中央分隔栏并完善照明条件。另外,要加强隐患排查,并且做好日常的维修工作,对损坏的路面、标志标线及时进行维修。
除此之外,还应当加强交通管理,加大科技信息化管控,整治路段重点违法行为,加大对交通违法的惩治力度。
5 结 语
笔者采用GIS分析方法,主要从空间特性方面分析事故的特性和成因,主要获得以下结论:事故发生具有明显的聚集性,鉴别出了济南市6个事故多发区域,无道路物理隔离和无路侧防护设施是事故多发区中的主要原因;车辆数、公路通车里程、GDP、人口等都对区域交通事故数有较大影响,且都与交通事故数呈正相关的关系,其中车辆数的影响最大;构建的基于车辆数和公路通车里程的GWR模型相关性回归系数高达0.75,可根据模型对各区县事故多发区域进行及时预警和完善相应的交通设施。研究对于减少交通事故发生,提升交通安全水平具有重要意义。但本研究也存在一些不足之处:由于仅获得了济南市2018年的交通事故数据,地理加权回归模型仅有济南市10个区县的数据,因此模型的解释度并不是特别高。这些不足之处将在进一步的研究中加以改进。