APP下载

基于GIS 空间聚类的事故多发路段鉴别分析系统

2018-06-22朱新宇丛浩哲索子剑

城市交通 2018年3期
关键词:数字地图点位城市道路

朱新宇,丛浩哲,支 野,索子剑

(公安部道路交通安全研究中心,北京100062)

截至2016年末,中国已有64个城市的机动车保有量超过100万辆,有49个城市的汽车保有量超过100万辆。在城市机动车数量飞速增长的同时,城市交通安全问题也日益突出。2016年中国城市道路交通事故死亡人数逾2万人,占道路交通事故死亡总人数的31.68%[1]。城市道路交通事故正在严重威胁城市社会功能的正常运行,关注和确保城市道路交通安全,不仅考验着城市的运行管理水平,更是保护人民群众安全、保证弱势群体出行权益的重要举措[2]。而如何对城市中的交通事故多发路段进行精准定位和鉴别分析则成为道路交通安全管理中亟须解决的问题之一。

1 交通事故多发路段研究概述

国外对交通事故多发路段的研究分析已经历了较长时间的发展:20世纪40年代,美国佛罗里达州交通管理部门就开始用事故数法识别道路交通事故多发点,这是最早提出的事故多发点鉴别方法[3-4]。20世纪50年代,丹麦、意大利、泰国等国家利用交通事故调查数据,结合交通量数据,建立了事故率评价指标体系[5]。随后,美国相继提出质量控制法[6]和交通冲突技术法[7],苏联提出安全系数法等事故多发路段分析方法[8]。进入20世纪90年代,美国开始将GIS等技术应用到交通事故分析中,威斯康星州建立了基于GIS的道路交通事故信息系统,爱荷华州运输局交通运输安全办公室构建了基于GIS的事故点及分析系统(GIS-Based Accident Location andAnalysis System,GIS-ALAS)[9]。

中国在交通事故多发路段的鉴别方面虽然起步较晚,但结合近年来蓬勃发展的大数据分析等先进技术,使得中国拥有相应的后发优势。然而,在中国现阶段的城市道路交通事故分析中,大多数仍采用统计学描述方法,利用事故数、死亡人数等指标对道路交通安全性进行评价或预测研究,例如文献[10]利用道路交通事故的随机性特点,采用多元统计方法分析了各风险因素对交通事故的影响。研究发现,在城市道路交通中,主次干路路段、交叉口、无信号控制出入口等位置交通安全问题较为突出。文献[11]以5 190起交通事故为基础,采用专家意见和数据融合方法建立城市道路交通事故分析的贝叶斯网络结构,通过此网络结构的训练,可以较为准确地对城市道路交通事故进行预测分析。文献[12]根据乌鲁木齐市近5年的交通事故统计数据,分析了事故的严重程度与事故影响因素之间的相互关系。此外,文献[12]还采用Logistic回归模型对交通事故的严重程度进行分析,并对模型参数进行估计与可靠性分析。

在综合交通事故的空间因素方面,中国也开展了相应研究[13],例如文献[9]采用ArcGIS软件,利用空间数据管理工具,采用当量事故次数指标搭建事故多发点鉴定软件系统,实现了多发点的自动鉴定。文献[14]提出基于空间自相关鉴别城市道路事故多发点的方法,利用交通事故点的二维分布,将GIS与空间数据挖掘结合,用城市道路网络拓扑模型构建空间统计单元,采用核密度空间聚类分析,生成事故多发点分布图。然而,这些研究多数是单纯借鉴国外的交通GIS分析模式,而中国道路交通管理及事故信息处理与国外有着显著差异,事故点的定位方式较国外有很大区别。因此,很难将国外的研究成果直接应用于中国道路交通安全领域,开发适合中国国情的道路交通事故多发路段鉴别分析系统显得尤为重要。

本文以深圳市城市道路交通事故多发路段鉴别分析为例,描述从获取道路交通事故数据到最终形成适合中国国情的基于空间聚类的城市道路交通事故多发路段鉴别分析系统的研究过程。

表1 深圳市交通事故数据总体情况Tab.1 Overall data of traffic accidents in Shenzhen

2 城市道路交通事故数据处理与分析

通过参与深圳市交通事故数据开放分析竞赛,获取深圳市2014—2016年辖区内全部交通事故数据信息,共计23万余条,其字段类型中包含事故编号、事故发生时间、路号、路名、公里数、伤亡人数和事故原因等多项指标。事故数据总体情况如表1所示,本文根据获取的交通事故数据信息开展城市交通事故多发路段分析工作。

为便于开展数据分析,首先需要对数据进行预处理,具体过程如下:

1)清洗各字段空值。

由于各字段中含有大量空值,而空值会对计算机程序开展计算分析产生影响,因此需先编写程序,将数据中所有空值删除或替换,以便利用程序开展大数据量运算。同时还需计算每个字段的数据缺失比,综合评判每个字段的数据适用性。

2)制作字典表。

由于本次竞赛提供的数据中并没有包含字典表,因此需要通过查询数据库规范、事故现场信息采集表、代码填写说明的相关资料,整理汇总相关字段的字典表,用于支撑后续分析。同时对于部分字段仅有汉字没有查询到对应标准代码的情况,采用自编代码的形式在字典表中体现,支撑计算机开展后续计算应用。

3)数据编码化处理。

在原始数据中,存在大量汉字与代码混杂的情况,不仅难以直接开展统计分析,更不利于利用计算机开展大数据量程序计算。因此需要编写数据编码程序,利用制作的字典表,将原始数据中涉及的所有汉字全部替换成编码,以便开展后续分析。

3 基于GIS空间聚类的城市道路交通事故多发路段鉴别分析法

基于空间聚类的城市道路交通事故多发路段鉴别分析法是指:从事故分布的地理视角出发,以道路空间单元之间的邻近关系为前提,结合道路空间单元上的事故属性值描述其地理分布特征,探讨交通事故空间位置及属性的相互关系,将空间聚类方法应用于城市道路事故多发点鉴别,为城市道路交通安全评价及管理提供思路与手段的一种鉴别分析方法。

在空间上准确鉴别事故多发路段,首先要对交通事故的地理位置进行精确测定,这个步骤在欧美发达国家是事故处理环节进行的。当交警抵达事故现场后,基于车载电脑对照GIS地图即可直接获取事故点的GPS经纬度坐标,无须记录文字信息,同时在GIS地图上可进行修改、确认等操作[15]。虽然中国警用地理信息系统(P-GIS)[16]正在逐步推广,但目前交警对交通事故位置的数据采集依然采用传统的“道路名称+里程桩号”以及“事故地点信息描述”的形式进行事故定位,在数字信息社会环境下,这种位置采集方法已显得较为滞后。

以深圳市为例,辖区内包含高速公路、普通公路、城市道路等多种道路类型。高速公路、国道的道路里程信息较为完善,采用道路名称+里程桩号字段对其进行事故定位相对较为准确;但普通公路、城市道路就较少有里程桩号等实体可供参考,事故地点信息描述由于没有固定格式,更是描述得千差万别。针对如此复杂的事故数据信息情况,首先要解决的就是事故的准确定位问题。为此,本文采用以下几种方式分别对事故多发路段进行定位鉴别。

3.1 基于数字地图API 的事故坐标定位分析法

在中国的交通事故信息数据采集中,交警对于城市道路交通事故现场地点的描述不是用经纬度点位信息来确定,而是利用道路里程和明显特征地点、地物来确定事故位置,通常还会引用附近的特征点作为参考,并辅以交通事故位置相对参考点的方向和偏移量。这样虽然便于交警记录,但是在事故后想再次获取事故的准确点位信息变得十分困难。

图1 数字地图API事故点位搜索示例Fig.1 Example of digital mapAPI search of accident locations

图2 2014—2016年深圳市非简易事故空间分布地图Fig.2 Spatial distribution of non-trivial accidents in Shenzhen from 2014 to 2016

表2 博深高速事故次数与相应路段数的累计频率Tab.1 Cumulative frequency of accidents and corresponding roadway segments of Boluo-Shenzhen Expressway

本文采用大数据的形式,利用已有的事故路段信息结合相关数字地图API进行搜索定位。API(Application Programming Interface)是应用程序编程接口,指一些预先定义的函数接口,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无须访问源码或理解内部工作机制的细节。

图3 博深高速累计频率曲线拟合及转点位置Fig.3 Cumulative frequency curve fitting and turning point of the Boluo-Shenzhen Expressway

表3 博深高速事故黑点位置与事故次数Tab.3 Location of black spots and number of accidents of the Boluo-Shenzhen Expressway

通过数字地图API的POI检索接口,可以直接调用数字地图的POI搜索功能。对深圳市交通事故数据中的“事故地点”字段进行搜索,并在数字地图中将与该字段信息匹配度最高的点位信息确定出来,从而获取事故点位信息的相应坐标(见图1)。

本文中的POI主要用来解决城市道路交通事故点位问题,采用多字段关联API搜索算法,包括事故地点的描述性文字、与道路交叉口位置关系的描述、所属辖区街道办及乡镇等行政区划字段来约束事故点位,使其不会有大的偏离;另外,事故编号的唯一性可以保证每一起事故的POI唯一,即使在同一地点发生多起事故也可以进行分析识别。

获取事故点位的坐标信息后,将其相应坐标转换为火星坐标,即可将事故点位数据准确导入数字地图中。为了更好地分析重大事故多发的特性,本文选择非简易事故进行事故坐标定位,并导入数字地图(见图2)。

利用基于数字地图API的事故坐标定位方式,可以清晰直观地看出深圳市2014—2016年非简易事故发生的坐标位置,并能够对每起事故的位置等属性进行查询分析,从而依照空间分析方式基于事故坐标地点来确定事故多发路段。这种方式可满足一般性事故多发路段分析需求,也是目前中国应用较为广泛地与GIS结合的事故多发路段鉴别方式。

这种方法也有自身的缺陷所在,首先它只获取了数字地图图层和POI点图层的信息,而交通事故都是在道路上发生的,针对道路的线状要素信息仍然缺失,虽然能看出事故点位主要发生在数条相应的主干路上,但有些确定的事故点并不能完全准确的定位在主干路内。其次,搜索引擎是利用事故点位信息描述字段进行位置搜索的,基于文字描述的复杂性,虽然选择了与“事故地点”字段信息匹配度最高的点位作为事故点,但依然可能出现位置识别偏离的情况。

3.2 基于累计频率法的道路事故黑点分析法

为了更好地鉴别分析线性图层,即处在线状道路上的事故黑点与多发路段,本文对含有道路里程数据的主干道路(高速公路和部分普通公路)进行事故黑点数据归一化分析。首先选取深圳市境内事故发生次数较多的10条高速公路、2条国道以及2条快速路,进行基于累计频率法的事故黑点鉴别分析。累计频率法是指将事故数(或事故率)按照发生的频率排序,得到累计频率较小、事故数较高的位置,从而将其作为事故多发路段的可能位置。本文以博深高速和惠深沿海高速为应用实例进行阐述。

1)博深高速。

事故次数与相应路段数的累计频率见表2,累计频率曲线拟合及转点的位置如图3所示。根据累计频率曲线得到博深高速公路拟合公式为y=1-ae-bx+ae-b,a=0.2905390,b=3.487 342 2; SSE=0.001 098 8, R2=0.986 798 1。可以看出,转点位置发生在归一化事故次数为0.103 143 3的位置。事故黑点的位置和事故次数如表3所示。

2)惠深沿海高速。

累计频率曲线拟合及转点的位置如图4所示。根据累计频率曲线得到惠深沿海高速拟合公式为 y=1-ae-bx+ae-b,a=0.479 457 6,b=19.098 280 5; SSE=0.078 650 5, R2=0.897 912 5。可以看出,转点位置发生在归一化事故次数为0.134 099 6的位置,即事故次数大于等于18.505 75可认为是事故黑点。事故黑点的位置和事故次数如表4所示。

图4 惠深沿海高速累计频率曲线拟合及转点位置Fig.4 Cumulative frequency curve fitting and turning point of the Huizhou-Shenzhen Coastal Expressway

表4 惠深沿海高速事故黑点位置与事故次数Tab.4 Location of black spots and number of accidents of the Huizhou-Shenzhen Coastal Expressway

由博深高速和惠深沿海高速事故黑点分析实例可以看出,利用累计频率分析法对道路事故黑点进行鉴别和定位的优势明显,能够直接通过数据得到基于线性道路的事故黑点的准确位置信息,无须借助任何地图平台,具有实用性强、计算简单的优点。但此方法也有劣势:首先,累计频率分析法得出的结论是文字数据,在直观展示方面较为薄弱;其次,这种方法对数据质量的要求比较高,对事故点位的里程桩号字段进行分析必须首先确保里程桩号都处在同一个起算点下,否则会出现较大偏差。本文中深圳市境内的广深沿江高速、107国道等数条道路都出现了这一问题,广深沿江高速的里程桩号数据为1~2 030不等,事故点的里程数据在几十乃至几千之间变动,这是因为事故数据在录入时分别采用了国家里程标准和省内里程标准,这些不统一的里程桩号标准导致分析结果出现很大偏差。此外还有龙大高速、福龙快速路数据因数据质量问题而无法成功进行曲线拟合,计算结果有误。

图5 深圳市辖区内道路零散线状矢量要素Fig.5 Scattered linear vector elements of roadway in Shenzhen

图6 道路线状要素识别与提取Fig.6 Road linear element identification and extraction

3.3 基于GIS 线性参考技术的事故多发路段分析法

在上述两种事故分析方法的基础上,为了精确确定事故点位,解决基于API的特征提取点位坐标偏移道路的“有点有图无路”问题,同时解决累计频率分析法的“有点有路无图”问题,本文基于线性参考技术,利用ArcGIS作为GIS平台对深圳市的道路进行线状要素提取,实现深圳市辖区内道路矢量化,然后在道路线状要素的基础上进行事故多发路段的鉴别分析,做到“有点有路有图”。

为了实现深圳市道路矢量化,首先需要提取道路的线性数据(见图5)。根据深圳市2014—2016年交通事故数据以及全国道路交通网格数据,对深圳市所有道路进行线性矢量化提取,将零散的道路数据进行整合并添加相关属性信息。具体步骤如下:对选中的道路进行识别剥离,脱离繁多复杂的道路网(见图6),然后进行矢量化处理,合并其离散的矢量数据,最终将其绘制成一条完整的道路。绘制完毕后,还需要添加道路属性,确定其完整属性状态,并加以识别区分(见图7)。

图7 道路要素属性添加Fig.7 Road element attribute addition

图8 系统算法框架流程及功能展示Fig.8 System algorithm framework flow and functionalities

图9 基于事故起数的道路排序分布Fig.9 Ranked road distribution based on the number of accidents

4 基于多种鉴别方法的GIS事故多发路段鉴别分析系统

本文在GIS平台上将利用上述三种鉴别方法获得的事故点位、事故黑点位置信息与数字地图的道路线状要素进行融合,并在此基础上进行独立封装和二次开发,从而形成了可实现交通事故统计、道路要素查询、事故点位要素查询、属性查询、热力图分析等一系列功能的事故多发路段鉴别分析系统,系统算法的框架流程以及系统功能见图8。系统应用实例如下:

1)道路事故起数分析。

将深圳市2014—2016年交通事故数据输入GIS事故多发路段鉴别分析系统后,提取事故起数排名前30的道路,并在GIS平台上展示,得到的数据分析结果见图9。

2)道路伤亡事故分析。

对深圳市2014—2016年交通事故起数排名前30的道路进行细化分析,利用分析系统将每千米路段内的伤亡事故数量在图中标注,可以更好地分析事故多发点位(见图10)。

3)道路死亡事故分析。

对深圳市2014—2016年交通事故数据提取死亡事故数量排名前30的道路。针对死亡事故本文同样将事故点位精确到每千米里程路段,以便更好地分析事故多发点。基于道路线性要素的深圳市死亡事故多发路段分布见图11。

4)道路死亡事故区域热力分析。

对深圳市2014—2016年交通事故数据提取死亡事故数量排名前30的道路。针对死亡事故,在分析事故多发点的道路线路图基础上,基于GIS空间分析功能,生成基于行政区划的死亡事故GIS热力分析图(见图12)。

图10 深圳市道路伤亡事故多发路段分布Fig.10 Distribution of casualty accident-prone roadway segments in Shenzhen

图11 深圳市道路死亡事故多发路段分布Fig.11 Distribution of fatal accident-prone roadway segments in Shenzhen

图12 深圳市道路死亡事故分布热力图Fig.12 Distribution heat map of road fatalities in Shenzhen

5 结语

本文借助参与深圳市交通事故数据开放分析竞赛的机会,根据深圳市辖区内2014—2016年全部道路交通事故数据信息进行事故多发路段的鉴别和分析。分别采用基于数字地图API的事故坐标定位分析法、基于累计频率法的道理事故黑点分析法,以及基于GIS线性参考技术的事故多发路段分析法等进行城市道路交通事故多发路段鉴别分析,并综合比较和分析各种方法的优劣,最终采用GIS平台对以上三种事故鉴别方法进行融合封装以及二次开发,构建形成可实现交通事故统计、道路要素查询、事故点位要素查询、属性查询、生成事故点位热力图等一系列功能的GIS事故多发路段鉴别分析系统。该系统的开发是基于中国交警所采集的事故数据,因此能够较好地匹配中国目前的事故数据字段形式,未来还可以将程序移植到其他城市来实现城市道路事故多发路段的鉴别与分析功能。

:

[1]戴帅,刘金广.中国大城市道路交通发展研究报告:之四[M].北京:中国建筑工业出版社,2018.

[2]戴帅.我国城市道路交通安全问题及对策[J].综合运输,2015,37(7):9-12+21.Dai Shuai.Urban Traffic Safety Problems and Countermeasures in China[J].China Transportation Review,2015,37(7):9-12+21.

[3]Fernandes A,Neves J.An Approach to Accidents Modeling Based on Compounds Road Environments[J].Accident Analysis and Prevention,2013,53:39-45.

[4]Krammes R A.Interactive Highway Safety Design Model:Design Consistency Module[J].Public Roads.1997,61(2):47-51.

[5]Sawalha Z.Traffic Accident Modeling Statistical Issues and Safety Applications[D].Vancouver:University of British Columbia,2002.

[6]Kononov J.Road Accident Prediction Modeling and Diagnostics of Accident Causality a Comprehensive Methodology[D].Denver:University of Colorado at Denver,2002.

[7]Hidas P.Modelling Vehicle Interactions in Miceoscopic;Simulation of Merging and Weaving[J].Transportation Research Part C-Emerging Technologies,2005,13(1):37-62.

[8]Yannis G,Gollas J,Kanellaidis G.A Comparative Analysis of the Potential of International Road Accident Data Piles[J].ATSS Research,2000,124(2):111-120.

[9]李娜.基于ArcGIS的城市道路交通事故多发点鉴别系统研究[D].成都:西南交通大学,2009.Li Na.Identification System for Urban Traffic Accident Hazardous Locations Based on Arcgis[D].Chengdu:Southwest Jiaotong University,2009.

[10]马明.基于多元统计方法的城市道路交通事故分析研究[D].武汉:武汉理工大学,2010.Ma Ming.Research of Urban Road Crash Analysis Based on Multivariate Statistical Techniques[D].Wuhan:Wuhan University of Technology,2010.

[11]赵金宝,邓卫,王建.基于贝叶斯网络的城市道路交通事故分析[J].东南大学学报(自然科学版),2011,41(6):1300-1306.Zhao Jinbao,Deng Wei,Wang Jian.Bayesian Network-Based Urban Road Traffic Accidents Analysis[J].Journal of Southeast University(Natural Science Edition),2011,41(6):1300-1306.

[12]马柱,陈雨人,张兰芳.城市道路交通事故严重程度影响因素分析[J].重庆交通大学学报(自然科学版),2014,33(1):111-114.Ma Zhu,Chen Yuren,Zhang Lanfang.Influence Factors of Accident Severity for Urban Road[J].Journal of Chongqing Jiaotong University(Natural Science),2014,33(1):111-114.

[13]任光贤.基于GIS的城市道路黑点分析与决策支持研究[D].济南:山东建筑大学,2016.Ren Guangxian.Black Spot Analysis and Decision Support Research of Urban Road Based on GIS[D].Jinan:Shandong Jianzhu University,2016.

[14]蒋宏,方守恩,陈雨人,等.基于空间自相关的城市道路事故多发点鉴别[J].同济大学学报(自然科学版),2013,41(5):664-669.Jiang Hong,Fang Shouen,Chen Yuren,et al.A Spatial Autocorrelation-Based Approach for Identifying Hot Spots on Urban Road[J].Journal of Tongji University(Natural Science),2013,41(5):664-669.

[15]王雪松,方守恩,乔石,等.中美两国道路交通事故信息采集技术比较研究[J].中国安全科学学报,2012,22(10):79-87.Wang Xuesong,Fang Shouen,Qiao shi,et al.A Comparison of Crash Data Collecting Technologies Used in China and U.S.[J].China Safety Science Journal,2012,22(10):79-87.

[16]王晓燕,陈学浩.基于P-GIS的道路交通事故分析系统的构建[J].交通信息与安全,2013,31(5):93-97+103.Wang Xiaoyan,Chen Xuehao.Road Accident Analysis System Based on P-GIS[J].Journal of Transport Information and Safety,2013,31(5):93-97+103.

猜你喜欢

数字地图点位城市道路
城市道路拓宽改造设计探讨
城市道路照明电气设计常见问题探究
城市道路清扫之我见
基于结构光视觉的钻孔点位法矢检测技术研究
数字地图在绿化市容行业中的应用分析
水泥搅拌桩在城市道路软基处理应用中的思考
机器人点位控制速度规划算法选择策略
大盘仍在强烈下跌趋势中
对车辆自定位特征的评估
基于空间网格的机器人工作点位姿标定方法