APP下载

大型公共事件前后交通事故空间分布分析模型研究

2022-08-17张书浩周妍黄晴

警察技术 2022年4期
关键词:热点交通事故区块

张书浩 周妍 黄晴

1.浙江警察学院 2.浙江省杭州市公安局萧山区分局

引言

受到2020年初新冠疫情影响,人们日常生活的方方面面都受到了较大的冲击,尤其是公共交通领域,在疫情期间,公交车、地铁等公共交通设施流量骤减,私家车出行比例上升,导致疫情前交通事故的空间分布特点与疫情后存在着部分差异,疫情前的交通事故空间分布分析的参考价值可能存在一定的局限性和差异性。且在疫情下,大部分警力投入疫情防控中,交通事故的精准预测与预防显得尤为重要。

鉴于上述原因,对疫情前后的交通事故空间分布特性进行分析并对比,利用分布特性的空间差异,找出在大型公共卫生事件(如新冠疫情)对交通事故空间分布特性的影响,对于疫情下交通事故的预防及未来大型公共卫生事件下警力的布控有重要意义。因此,本文以2019年10月~12月和2020年10月~12月共六个月间某市某区发生的事故为研究对象,采用聚类法,分析疫情前后交通事故空间分布特征的差异,从而为公安机关在疫情状况下的警力部署提供帮助。

目前,国内外对交通事故空间分析的研究大都针对事故整体进行事故多发区域、事故热点区域分析。在时空数据模型的实际应用方面,从2000年以来,该模型结构的建立与改进更多用来满足特殊行业和研究的需要。如David等提出基于图论的时空数据模型,尹章才等和黄照强等又对该模型进行了更深入的扩展研究及延伸实验;Rasinmaki等针对自然林分设计了一种以嵌套地理实体类结构为基础的环境资源时空数据模型,之后又进一步探究并新增了时空数据处理、时空数据查询和林分模拟分析等功能。

根据现有研究,本文利用DBSCAN聚类、核密度计算等方式,对事故发生的空间分布进行可视化处理分析,从而得到疫情前后交通事故空间分布特征变化,并根据事故发生点附近的兴趣点种类及数量,分析变化产生的原因。

一、研究区域和数据

本文的数据来源于2019年10月~12月以及2020年10月~12月某市某区的交通事故报警数据共20381条。报警数据包括报警时间、接警单警情地址、接警单警情类型(包括普通路面堵塞、普通路面事故、危险驾驶、其他)、报警内容(包括财产损失情况、人员伤亡、涉事车辆拍照)。由于普通路面交通事故在空间上的分布与地理环境紧密相关,本文从中筛选出普通路面事故数据,并将得到的相关事故接警单警情地址利用高德地图OPI定位转化为经纬度数据,对部分无效数据进行剔除后共得到16067条有效数据。其中,部分案件因报警地点描述较为模糊,故本文采取将其定位在最近兴趣点方法。经验证,对总的交通事故空间分布分析以及之后的聚类分析并无影响。

二、研究方法

(一)事故热点图的绘制

将得到的16067条数据(其中2019年共7341条、2020年共8636条)进行可视化处理,得到2019年10月~12月、2020年10月~12月某区交通事故的分部热点图,如图1所示。

(二)基于DBSCAN密度聚类的事故热点中心计算

DBSCAN是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,DBSCAN算法将“簇”定义为密度相连的点的最大集合。利用DBSCAN地理坐标聚类模型,分别对2019年与2020年某区交通事故发生地点进行分析,求出事故发生频率较高区域的中心点,即为事故的热点中心。具体过程如下:

根据不同事故地点的经纬度,计算出两点之间的欧氏距离,以事故地点A于事故地点B为例,公式如下:

式中Along、 Alat表示事故地点A的经度和纬度(单位:度),Blong、 Blat表示事故地点B的经度与纬度(单位:度),C1、 C2表示经纬度与实际距离转化的系数,数值分别为100000与111320(单位:m/度)。

根据求出的欧氏距离,对事故地点进行区块的划分。设定一定值X(单位:米)对任意一事故点,以其为圆心,在半径为X的范围内,若事故点数量超过N个,则将其定义为核心点;若其半径为X的范围内事故点少于N个,但跟任意核心点距离小于X的点定义为边界点。若一个事故点既不是核心点,也不是边界点,将其定义为噪声点。核心点、边界点、噪声点的定义解释如图2所示。

将定义为噪音点的事故点排除,边界点与核心点进行聚类,组成聚类的簇,即为事故的热点区块。

将定值X设定为250(单位:米),核心点附近最少数量N为5(单位:个),得到2019年符合条件的区块数109个、2020年132个。由于大部分区块事故点数量较少,参考价值较小,因此将其去除。保留下事故点数量在50以上的区块进行分析,最终得到2019年事故区块16个、2020年事故区块14个。部分事故区块点数量详见表1、表2。

?

根据上表中各年事故点数前8的区块进行比较,可以发现,在事故总量相近的前提下,2020年的事故发生明显比2019年疫情爆发前更加集中。针对这种情况,继续对这些事故区块进行分析研究,利用模拟退火算法寻找各事故区块的中心热点。

模拟退火算法与贪心算法相同,且在寻找最优解的过程中引入了随机变量因素。最早应用于统计力学中,在给定的温度下,随着温度不断的降低,微观粒子会在各个温度的情况下达到一个平衡的状态,当物体在常温时,内能最小。模拟固体退火的过程,给定一个初始温度点以及初始解,随着温度的下降,在每个平衡状态下得到新的解,如果新的解小于前一个解,则接受新的解,否则以设定的概率接受新解。因其具有概率跳突性,能够有效防止求出的解为局部最优解,从而找到全局最优解。

利用该思想,对每一个区块中任一一点到其余所有事故点的欧氏距离和进行计算:

Step1:选择各个点经纬度的平均值作为出发点;

Step2:将控制参数S设为10^9,将当前点向上下左右各走S,包括当前点一找到5个新点;

Step3:计算这5个点到簇中各个距离的点的距离之和,取最小的点,并设定仍使用当前点设定接受的概率为5%,得到区域内的某点到其余事故点的欧氏距离和最小,将该点定义为区块内的事故中心热点。2019年与2020年各区块的中心热点经纬度详见表3、表4。

将经纬度与热力图相结合,结果如图3所示。

结合图表数据后,进行对比发现,疫情前后事故的中心热点均集中在城镇区域,且大部分的点位有所重合。但是疫情发生后城镇区域内的事故热点更加集中,为了凸显结论,对各区块的事故核密度进行计算。

(三)各区块核密度的计算

核密度估计原理(Kernel Density Estimation,KDE),指某一点处的密度大小与一定范围内所包含的其他数据点存在着相关性,从而采用非参数的方法对空间数据的一阶属性进行讨论。核密度计算的公式如下:

表示空间网络核密度估计值,n为区块内事故数的总量,h为空间窗宽,K为高斯核函数,di表示第i个事故点到该区块内中线热点的欧氏距离。

高斯核函数在不同情况下的公式如下:

根据不同的区块,将事故点与中心热点的欧氏距离最大值设定为空间窗宽,得到各区块的空间窗宽值,部分结果如下:

?

?

带入公式(2)、(3)中,得到各区块的核密度值:

?

?

结合两表数据以及各区块的分布可知,在相同的区域内,疫情后事故分布核密度大于疫情前事故核密度,空间窗宽值在疫情后也明显变小,证明疫情后事故分布更为集中在各城市中心区域。

(四)POI兴趣点与事故分布间的联系

研究发现,除了道路本身的因素外,事故的发生一定程度上与周边POI兴趣点的分布存在一定联系。POI数据全称Point of Interesting,指的是在地图上具有兴趣的地点,如商店、车站、医院、住宅小区等地点均属于POI数据。POI数据能够利用于城市规划、地理信息研究等方面,因此获取全面准确的POI数据是进行研究前的必备工作。POI数据分为23大类,查阅资料后,结合之前的聚类观察以及相关文献参考分析,少数兴趣点类型对事故发生的影响较小,对交通事故发生影响较小的类别剔除,留下影响较大的类别共8类。

由于POI数据获取的限制,POI多边形搜索一次最多返还500个同类型兴趣点,为了保证数据收集的完整性,需要将研究区域进行切割,保证每个区域内的兴趣点值小于500个,因此将研究区块划分为大小相同的500×500(单位:米)的网格。由于部分地区的兴趣点分布较为集中,可能存在部分网格的POI数据大于500个,因此对区域内的POI数据数量进行判断,若返还的数值为500,则利用四叉树索引的概念,将该网格划分成等大小的四个网格后继续进行数据搜集,直至每一个网格内的POI数据数量均小于500个,而部分地区内可能会存在POI数据为0的情况,为减少密匙利用次数,将附近的四个网格进行合并,使每个网格内POI数据数量至少为1。

利用该思想,对2019年的热点区块与2020年的热点区块进行分析。将包含区块内所有事故点的最小矩形设定为区块POI数据采集的范围,得到所有区块中8类兴趣点的数量。为了方便分析,给出2019年以及2020年各类兴趣点的个数及所占百分比,结果详见表9。

?

由于框选区域的不同,兴趣点个数并不能直观反应出各类兴趣点对交通事故发生的影响改变,因此选择所占百分比进行比较。在事故发生较为集中的区域,疫情发生后休闲娱乐类显著下降,对交通事故发生的影响力下降,汽车相关服务类、公司企业类、政治机构及社会团体类显著上升,对交通事故发生的影响力也上升。住宿类、风景名胜类、医疗保健服务类基本不变。

三、结语

本文针对20381条事故数据进行分析处理,得到聚类区块共30个,并计算出各区块内的热点位置,针对各区块内的兴趣点数量进行分析统计,得到对交通事故发生具有较大影响的兴趣点种类。研究结果表明,疫情影响下大部分的事故集中于人口密集的区域或是主要通行区域。由于疫情状况下,大部分的警力投入在疫情防控工作中,因此当再次遇到类似的公共突发事件时,能够借鉴此次事件,进行针对性的部署。此外在日常工作中,可以对事故数据进行分析处理,对事故发生热点进行计算,从而针对事故多发地点进行针对性的部署,如设置岗亭、巡逻点等,从而降低事故发生率,为交通警力的部署提供理论性支持。

猜你喜欢

热点交通事故区块
热点
区块链:一个改变未来的幽灵
不同寻常的交通事故
预防交通事故
区块链:主要角色和衍生应用
热点
区块链+媒体业的N种可能
读懂区块链
结合热点做演讲
一起高速交通事故院前急救工作实践与探讨