APP下载

建成环境对城市交通事故严重程度影响研究

2023-05-10邱智宣刘柯良傅志妍庹永恒

关键词:主干路交通事故土地利用

陈 坚,邱智宣,彭 涛,刘柯良,傅志妍,庹永恒

(1. 重庆交通大学 交通运输学院,重庆 400074;2. 重庆第二师范学院 经济与工商管理学院,重庆 400067; 3. 重庆市公安局 大渡口区分局交巡警支队,重庆 400084)

随着城镇化的快速推进,城市机动车保有量迅猛增长,交通安全问题也日益突出。近年来,我国道路交通死亡人数长期居于世界首位,每年有6万人以上死于道路交通事故,直接财产损失达13亿元,交通安全形势依然严峻。因此,从多维视角解析交通事故十分必要。

国内外学者围绕交通安全进行了系统研究。已有研究从事故构成要素入手,将人、车、路及自然环境等方面与事故的关系进行分析。董傲然等[1]从人、车、路和自然环境这4个方面出发,构建了机动车与行人事故严重程度的分析模型;S.KUMAR等[2]考虑了受伤者的性别与年龄、照明条件、道路情况等11个因素,对印度车辆交通事故严重程度进行了对比分析。也有学者从区域视角出发,探索区域人口经济、土地利用特征及区域路网特征等因素与交通安全之间的关系。王雪松等[3]选择了区域人口特征、道路及交通特性、路网形态特征等指标对交通安全进行分析,结果发现路网形态和交通安全显著相关;P.NAJAF等[4]基于年龄、人口、人均收入等测度,分析了城市形态特征与交通安全的关系;潘义勇等[5]考虑了公园、医院等建成环境因素,探索了老年人因事故造成伤害严重程度的影响因素。

现有研究仅考虑了部分建成环境因素对事故的影响,如道路特征[3]、人口密度[4]、土地利用情况[6]等。尚缺少对建成环境因素系统的考虑及与其它因素的对比,导致难以从城市规划本源出发,来规避交通事故的发生。笔者基于重庆市某区交通事故信息,运用机器学习方法,探究建成环境对交通事故严重程度的非线性关系,得到了变量的重要度。

1 建成环境

1.1 研究单元划分

空间数据分析结果会随着面积单元定义的不同而发生变化,其影响主要体现在尺度效应与划区效应两个方面,因此适宜的空间尺度对空间数据分析及结果获取十分重要。杨文越等[7]对比分析了多尺度建成环境对居民通勤出行的状况,发现不同尺度建成环境的显著性为:社区尺度>社区边界1 km缓冲范围尺度>街道尺度。由于文中研究的对象为事故点,社区尺度相对狭窄,故笔者选取事故点1 km缓冲区作为建成环境的研究单元。

1.2 建成环境指标选取

与自然环境不同,建成环境是土地利用、城市设计及交通系统等一系列相关要素的集合。建成环境的定量测度一直是城市规划学的研究热点,从20世纪80年代开始建成环境的内涵不断被丰富。R.EWING等[8]将建成环境归结为“3D”维度,包括密度、多样性和设计,而后在“3D”维度基础上增加了目的地可达性和到站点距离,形成“5D”维度[9]。

笔者所指的建成环境测度指标是在“5D”维度基础上,对建成环境要素进行重构,甄选人口密度、土地利用混合度、路网密度、距市中心距离、公交站点密度等11个变量用于度量建成环境的密度、多样性、交通设计、可达性及公共交通邻近度5个维度。建成环境变量描述见表1,其中密度为点密度,通过计算POI点个数与研究区域面积之比得到;多样性通过土地利用混合度表征[10],计算如式(1);交通设计涵盖交叉口密度与路网密度;可达性通过计算各研究单元距离城市中心的欧几里得距离得到;公共交通邻近度用研究单元内的公交站点密度及地铁站点密度进行度量。

(1)

式中:Li为第i个研究单元的土地利用熵指数;Pij为第i个研究单元内第j种POI数量占总数的比例;N为POI兴趣点个数。

表1 建成环境变量

1.3 建成环境数据获取与处理

建成环境数据处理主要借助Arc GIS平台,涉及数据包括:街道行政区数据、道路网络数据和POI兴趣点数据。街道行政区数据以面为单元,用于研究空间范围的构建;道路网络数据包括不同等级的道路线网,以测度研究区域的路网密度;POI兴趣点数据通过Python中的爬虫工具在Open Street Map中获取,用于计算不同研究区域点密度及可达性。建成环境数据处理流程见图1。

图1 建成环境数据的处理过程

2 城市道路事故数据处理与分析

2.1 事故分类与统计

交通事故按事故严重程度分为轻微事故、一般事故、重大事故和特大事故4类,不同等级事故划分标准见表2。

表2 事故等级分类

2.2 事故数据地理编码

由于事故原始数据中只有对事故发生点的地址描述,没有经纬度数据,因此需要对事故原始数据进行地理编码。将表示地址的文字在地图中进行相似性匹配,并在这些表示地址的文字中匹配到相似度最高的文字,最后返回匹配结果和相应的经纬度信息作为最终结果。田沁等[11]比较了百度、高德、搜狗和腾讯等地图厂商的地理编码应用程序编程接口的服务品质,认为腾讯的地理编码API整体服务品质较好,具有较高的数据质量和较完备的地址数据。故笔者采用腾讯的地理编码API进行事故发生点地址到经纬度坐标转换。

2.3 事故空间分布特征

笔者采用2016—2018年重庆市某区102 km2范围内的道路交通事故数据,共计154起,经剔除缺失值、地理编码后,最终确定了126起事故数据作为研究对象。基于python对事故伤亡情况进行识别并做出统计,不同等级事故统计情况见表3。

表3 事故数据统计

将含经纬度的事故数据导入GIS中,运用核密度分析工具描述事故的空间分布特征。不同等级事故分布情况见图2,图2中:颜色越深的地方表示事故数量越多;从分布情况来看,西部的事故数量明显高于东部,特别是靠近北侧的事故数量最多,同时这3种类型事故均在不同区域出现了集聚现象。

图2 事故分布

3 事故非线性分析模型

3.1 模型选取

传统统计学模型由于变量的度量方式(如单位、数量级等)的不同,难以体现出各变量对因变量的重要程度。而梯度提升决策树(gradient boosting decision tree, GBDT)模型具有以下优势:① 没有预先确定两个变量之间的结构关系假设,可以实现数据的自我学习;② 可以提供各变量在结果中相对重要性估计;③ 与回归模型不同,该模型对建成环境与交通问题分析中经常存在的多重共线性问题不敏感。因此,笔者选择GBDT模型对建成环境因素与事故严重程度的非线性关系进行分析。

3.2 变量描述

城市道路交通事故是人、车、路、环境等诸多因素耦合作用的结果,因此除了考虑建成环境因素外,同时将个体行为、道路情况、事故类型和自然环境因素纳入到模型中,其它变量见表4。

表4 其它变量描述与赋值

3.3 模型构建与求解

GBDT是基于Boosting算法的集成决策树模型,Boosting算法依据上一次训练的残差生成基学习器。GBDT是在Boosting基础上,沿着残差减小的梯度方向上建立新的决策树。GBDT方法的核心目标是不断减小训练过程产生的残差,模型可由式(2)表示[12]。

(2)

(3)

式中:γj、c分别为待估计参数;hj(x)为弱分类器j的估计结果;J为弱分类器数量。

GBDT模型求解过程如下[13]:

2)计算第m次迭代的残差,如式(4):

(4)

3)利用弱分类器hm(x)拟合步骤二中得到的残差rim;

4)计算估计乘子,如式(5):

(5)

5)根据得到的γm对Fm(x)进行更新,Fm(x)=Fm-1(x)+γmhm(x);

6)判断是否达到预先设置的迭代次数与精度要求,若满足,则得到最终估计结果;否则,返回2)。

GBDT模型通过计算所有加法树的均值,从而得到每个变量对因变量的相对重要程度,如式(6):

(6)

4 实证分析

4.1 模型训练

学习率、最大决策树数量、树深度这3个参数取值决定了GBDT模型的整体效果。GBDT模型中树的深度不会超过log2(n),其中n为样本数量,因此文中树的深度取7。对学习率、最大决策树数量取值进行调参,探究不同取值对模型得分的影响,从而获得最优参数值,如图3。由图3可看出:有多处位置可取到最大值,最终文中模型的学习率取值0.15,树的数量取值82。

图3 参数调整

4.2 模型结果

经训练后的模型拟合效果稳定,各变量对交通事故严重程度影响的重要度见表5。

表5 变量重要度排序

建成环境变量中:土地利用混合度、快速路及主干路密度、次干路及支路密度、人口密度及可达性的累计重要度达60.57%。故这5个变量是解释建成环境对交通事故严重程度影响的主要因素。其中土地利用混合度对交通事故严重程度的影响最大,为14.29%;其次是快速路及主干路密度、次干路及支路密度、人口密度和可达性,分别占比12.43%、11.54%、11.35%、10.96%;剩余变量重要度较低,均低于10%,这说明这些变量对交通事故严重程度影响较小。道路情况与文献[14]研究结果中的道路物理隔离与车道数对事故严重程度不显著相吻合;事故发生时间变量与文献[15]研究结果中的时间段对事故严重程度的重要度较低的结果一致。土地利用混合度、快速路及主干路密度、次干路及支路密度、人口密度及可达性对交通事故严重程度的影响曲线见图4。

图4 事故严重程度影响曲线

由图4可知:土地利用混合度在1.72处发生较大突变,土地利用混合度高的地方,车辆的速度会受到限制,从而导致较低的事故严重程度;快速路及主干路密度在2.2 km/km2处发生较大突变,这表明快速路及主干路密度在超过该阈值后,对事故严重程度将产生较大影响,因此快速路及主干路密度在前期规划中应考虑安全合理取值;人口密度方面,在约1 600人/km2和19 000人/km2处发生突变,在该区间内基本对事故严重程度影响基本不变,因此人口密度只有达到阈值后对事故严重程度的影响才能得到凸显;次干路及支路密度对事故严重程度的影响与快速路及主干路相反,整体上表现出下降的趋势,因此从交通安全的角度出发,次干路及支路的建设应受到重视。可达性对交通事故的影响呈现出上升的趋势,最后趋于稳定;即随着距离市中心距离越远,事故严重程度越高,且在超过阈值后基本稳定。

5 结 语

笔者基于重庆市某区的交通事故数据,运用GBDT模型探索了建成环境与交通事故严重程度的非线性关系;得到各变量的重要程度排序,同时给出了重要度较高的变量对事故严重程度的影响曲线。从研究结果可看出:① 建成环境变量在事故严重程度方面具有重要作用,其中土地利用混合度、快速路及主干路密度、次干路及支路密度、人口密度及可达性的集体贡献占比60.57%;② GBDT模型能更加精确地捕获各变量对事故严重程度影响的非线性关系及阈值效应。

猜你喜欢

主干路交通事故土地利用
谈城市道路交叉口设计要点
城市主干路拓宽改造设计的新思路
城市主干路接入道与侧分带开口模式研究
不同寻常的交通事故
预防交通事故
山区主干路景观绿化设计
土地利用生态系统服务研究进展及启示
一起高速交通事故院前急救工作实践与探讨
滨海县土地利用挖潜方向在哪里
论低碳经济与转变土地利用方式