我国交通事故时空分布规律及其影响因素研究
2018-06-12刘浩然金含香
方 园,刘浩然,丁 琴,陆 畅,金含香
(阜阳师范学院 经济学院,安徽 阜阳 236037)
随着我国经济的发展,公路里程不断增加。道路交通的迅速发展给人民的发展带来了极大的便利,同时也带来交通事故的频发和交通控制的不合理等问题。据官方统计[1],2016年交通事故发生数总计212846起,其中死亡人数63093,受伤人数226430,造成的经济财产损失为120759.9万元。另外,2015年交通事故死亡人数占比高达87.91%。由此可见,交通事故已成为社会公害,其直接威胁人民的生命安全,影响道路交通系统的正常运作。对道路交通事故进行预测是提升交通安全水平的主要方式之一[2]。
交通事故的发生是随机的[3]。然而,从统计学的角度来看,发生事故的时间域分析具有地域性和空间自相关性。本文采用数理统计的有关方法研究交通事故的发展趋势,分析事故发展的相关规律性,并预测交通事故发展趋势。
道路交通安全的预测分析是一个较为繁琐的过程[4-5],常用的预测方法主要有指数平滑预测法[6]、时间序列预测法[7]、神经网路预测法[8]、灰色预测法[9]、灰色马尔科夫预测法[10]、主成分分析法[11]、回归分析法[12]等。由于指数平滑预测法仅适用于较短期预测;时间序列预测分析法所需要的历史数据较多,且研究对象较为稳定,从而导致预测精度偏低,不利于交通事故预测的准确性;神经网络预测法则需要较为完整的样本数据,交通事故所涉及的因素众多,该方法难以实现数据的完整性易出现偏差,导致训练出来的网络外延性不强;灰色模型的预测精度不理想,其要求数据序列必须呈指数分布且对波动较大的随机序列数据拟合较差。灰色马尔科夫预测模型只适用于中短期的预测,且只适合近似于指数增长的预测。
由于道路交通事故的发生是一个多因素事件[13],因此采用多元线性回归(ordinary least squares,OLS)方法来构建道路交通事故的预测模型,为交通安全管理部门制定预防、控制相关规划和宏观决策提供依据,制定合理的交通安全策略。
1 数据源与研究方法
1.1 数据源
由国家统计局统计年鉴获得2001-2016年有关各地交通事故的发生数、死亡人数、受伤人数以及财产损失数的变化情况。通过统计数据[14]获取得到国民生产总值、人口、公路里程、民用汽车拥有量历年变化数据。由于港澳台数据暂缺,故本研究不涉及上述各省区。
本文主要选取了万车死亡率、事故平均财产受损、事故死亡率、死伤比以及交通事故死亡人数占比五个相对指标数据。其中万车死亡率指死亡人数(人)与民用汽车拥有量(万辆)之间的比率;事故平均财产受损(万元)指事故直接财产损失(万元)与事故发生数之间比值的数值;事故死亡率指死亡人数与事故数之间的比率;死伤比是指死亡人数与受伤人数之间的比率;交通事故死亡人数占比是指交通事故死亡人数与全国安全事故死亡总人数之间的比率。
万车死亡率、事故死亡率、死伤比指标用来刻画交通事故的严重程度;事故平均财产受损指标用来刻画交通事故的经济损失状况;交通事故死亡人数占比用来比较交通事故相对于其他安全事故的危害程度。
1.2 研究方法
多元线性回归模型可说明一个被解释变量与多个解释变量间的线性关系。对由n个单位构成的整体,包含被解释变量Y与m个解释变量X1,X2,X3,…,Xm的多元线性总体回归函数形式:
式中,βj(j=0,1,2,…,m)为模型的参数;μi为随机扰动项;m为解释变量的个数。
2 我国省域交通事故事故时空分异特征
2.1 我国交通安全绝对指标分析
本文统计分析了2001-2016年我国事故次数、直接财产损失、死亡人数以及受伤人数四项绝对指标,如表1。可以看出,时域方面,4项绝对指标均呈现出下降趋势。事故发生数降幅为71.8%;死亡人数降幅为40.4%;受伤人数降幅为58.6%;直接财产损失降幅为60.9%。
表1 2001-2016年我国交通事故数据
从图1可以看出,4项指标从2002年后总体呈现出下滑趋势。但在2016年事故发生数和受伤人数均有13.3%增幅,另外2016年死亡人数有8.7%的增幅,直接财产损失有16.5%的增幅。这表明,我国交通安全总体形势有所好转,但近期有恶化迹象。
图1 2001-2016年我国交通事故各项指标变化趋势
2.2 我国交通事故相对指标分析
为研究事故发生的严重程度,使用表2所示的5个相对指标指标来说明。根据表2中数据可绘制图2和图3。
由图2可以看出2001-2016年交通事故万车死亡率逐年下降,降幅为94.2%;而交通事故死亡人数占比则总体呈现出上升趋势。其中,2001-2003年与2004-2005年以及2014-2015年交通事故死亡占比分别有小幅下滑,降幅分别为5.7%、0.8%、0.8%。此现象说明从时间序列分析,长期以来我国交通安全状况逐渐改善。但从截面数据来看,我国交通死亡人数占比逐渐上升,说明我国交通安全形势依旧严峻。
从图3可以看出,事故死亡率呈现出上升趋势,涨幅为111.25%;死伤比总体呈现出上升趋势,涨幅为43.7%;事故平均财产受损总体呈现出波动上升趋势,在不考虑通过膨胀的影响下其涨幅为38.7%。其中,死伤比2004-2006年有小幅下降,降幅为6.8%;事故平均财产受损2003-2006年有一定下降,降幅为27.4%。这说明我国交通安全状况呈现出交通经济损失量大,交通伤亡严重程度深,交通形势依旧严峻。
图2 2001-2016年交通事故死亡率,万车死亡率变化
图3 2001-2016年事故平均财产受损、事故死亡率和死伤比变化
表2 2001-2016年交通事故相对指标变化数据
2.3 我国交通事故省域分析
由于我国国土面积大,地质结构十分复杂,区域间的经济发展水平差异较大,道路状况差异较大,各省的交通安全形势具有明显的差别。近期省域交通事故分析以2016年交通事故截面数据为例绘制图4。
从图4中可以看出2016年沿海地区交通事故数量较内地更多。这与我国经济发展重心、交通安全监督管理状况以及地质条件相关。但仅考虑交通事故的发生数并不能客观地刻画出交通事故的严重程度,因此可从万车死亡率的角度进行描述。从图4(b)得知天津、安徽、湖北、贵州和海南等地的交通事故严重程度较高;西北和华南地区适中;东北、华北和西南地区较轻。
从图5可以看出2001-2016年交通事故发生频率较高的省份为广东、浙江、山东和江苏省份,上述省份占比为35%,可见交通事故发生的集聚性较高。因此交通管理部门需要对这些重点省份制定合理的安全管理目标,采取合理的安全对策。
3 交通事故预测模型
选取交通事故死亡人数指标作为因变量,这主要因为死亡人数最能反映交通事故的危害程度,选取民用汽车拥有量、公路通车里程、GDP和人口数指标作为因变量。汇总后数据如表3。
3.1 回归模型的建立与求解
设y为交通事故死亡人数、x1为民用汽车拥有量、x2为公路通车里程、x3为GDP、x4为人口数,假设
上式为线性回归方程,其中β0,β1,...,β4是回归系数。根据表3中数据求解得到回归方程:
由上式可知,民用汽车拥有量、人口数与死亡人数呈现出正相关,即随着公路通车里程和人口数的增加,死亡人数指标呈上升趋势;相反GDP、公路通车里程与死亡人数呈负相关关系,表明随着GDP和公路通车里程的上升,死亡人数下降。
图4 2016年各省事故发生数以及严重程度等级划分
图5 2001-2016年各省交通事故发生数汇总统计
表3 2011-2016年交通事故死亡人数及4项影响因素的统计数据
3.2 回归方程的显著性检验
为检验上述方程回归效果的显著性,本文使用F检验法来检验方程整体回归效果。检验得出的观测值F=134.42,在显著性水平a=0.01下,F0.99(4,16-4-1)=5.67,由于F>F0.99(4,16-4-1),因此拒绝关于回归方程显著性检验的零假设,故4个因素对交通事故死亡人数整体上具有显著性的线性影响。
3.3 单个回归系数的显著性检验
从F检验的结果可以看出该方程整体回归效果显著,下面本文探讨单个系数的显著性效果,在此使用t统计量来检验单个回归系数是否显著。通过计算得
给定显著性水平a=0.05,查t分布表可知:t0.0975(16-4-1)=2.2010。对比观察可知,4个影响因素中,民用汽车拥有量指标对交通事故死亡人数影响最为显著,其次陆续为GDP、公路通车里程、人口数。在显著性水平a=0.05下,民用汽车拥有量、GDP与死亡人数的线性关系是显著的;相反公路通车里程和人口数是非显著的。
3.4 向后筛选下的回归分析
由上述单个回归系数的显著性检验中我们得知民用汽车拥有量和GDP变量对交通事故死亡人数的线性影响是显著的。由此我们采用向后筛选以完成自变量的选择,通过筛选依次剔除了变量公路通车里程和人口数,最终保留了民用汽车拥有量和GDP两个变量。从而建立回归方程
此时的回归方程以及系数的p值均约等于0,其远低于显著性水平a=0.01,故上述模型是恰当的。通过上式可知:民用汽车拥有量与死亡人数成正比,GDP与死亡人数成负比。
3.5 交通事故预测
上式通过检验得知其回归效果和回归系数均显著,当给定x1=m,x3=n时,可以预测出y的估计值为以及的1-a置信区间。
当给出某一年民用汽车拥有量和GDP指标的预测值,便可以计算出该年交通事故死亡人数的点估计值。根据官方数据[15]得知2017年GDP增速为6.9%,国内生产总82.7122万亿元,假设民用汽车拥有量按10%的速度增长则2017年其值为20432万辆,计算出2017年交通事故死亡人数的预测值为57815人,95%置信水平下的预测区间为(46039,62716)。
同理对各省数据指标进行回归分析后也可以计算出各省的的点估计值和预测区间,本文查阅了各省统计局的地区生产总值数据,除云南和内蒙古自治区尚未公布2017的GDP数据其余省份均已公布,通过计算平均增长率预测云南省和内蒙古自治区2017年GDP数据分别为16282.6亿元和19377.87亿元;另外通过对各省2001-2016年民用汽车拥有量数据计算平均增长率,进而预测2017年各省民用汽车拥有量数据。从而可以计算出各省交通事故死亡人数的点估计值并进行区间预测。
4 小结
本文采集了2001-2016年我国交通事故的相关各项数据,分析了全国交通事故现状和发展趋势。分析发现:2001-2016年间,事故发生数、直接财产损失、死亡人数以及受伤人数四大指标均总体呈现出下降趋势,这说明我国交通安全状况总体趋于好转,但2016年四大指标均有较大增幅,这说明近期形势严峻。
采用相对指标的分析发现:万车死亡率逐年下降,这说明了长期以来我国交通安全状况逐渐改善;交通事故死亡人数占比则总体呈现出上升趋势,说明交通事故越来越成为事故主要危害;事故死亡率和死伤比总体呈现出上升趋势,说明交通事故的严重程度逐渐加深;事故平均财产受损总体呈现出波动上升趋势,说明交通事故带来的经济损失加大。
通过对近期全国省域交通事故分析,选取2016年全国各地区相关数据,发现沿海地区交通事故发生数较内地更多;危害程度方面,津皖鄂黔琼五省事故严重程度高,西北和华南地区适中,东北、华北和西南地区较轻。长期方面分析发现:2001-2016年间交通事故发生主要聚集在东部沿海地区,其中长三角、京津冀和珠三角地区事故发生次数较多,且聚集性较高。
选取全国交通事故死亡人数为因变量,民用汽车拥有量、公路通车里程、GDP和人口数为自变量,利用2001-2016年的数据进行多元线性回归,分析得出:4个因素总体对交通事故死亡人数具有显著的线性影响。通过向后筛选的回归分析发现GDP、民用汽车拥有量与死亡人数之间的线性关系是显著的,且随着GDP上升,死亡人数减少;而民用汽车拥有量则相反,并以此构建起交通事故死亡人数预测模型。
通过对交通事故的分析预测,提出建议如下:相关部门要合理控制汽车数量,加强汽车品质监管,提升汽车安全系数,严格进行车辆年检;政府要大力发展经济,提高经济发展水平,大力发展新能源及混合动力技术以建设生态绿色经济;针对交通事故方面,可大力发展自动驾驶技术减少交通事故数量,降低经济财产损失。