犯罪时空扫描统计分析研究与实践
2017-11-02鲍世方王占宏上海公安学院上海0037上海众恒信息产业股份有限公司上海0004
鲍世方,王占宏(.上海公安学院,上海 0037;.上海众恒信息产业股份有限公司,上海 0004)
犯罪时空扫描统计分析研究与实践
鲍世方1,王占宏2
(1.上海公安学院,上海 200137;2.上海众恒信息产业股份有限公司,上海 200042)
在时空分析方法中,时空扫描统计广泛应用于流行病的时空检测与预警,将时空扫描统计方法用于城市犯罪案件时空分析,并根据犯罪案件的时空特点,基于GIS编写了犯罪时空扫描统计软件,对城市犯罪进行时空扫描统计。研究对上海2016年街面诈骗犯罪案件数据进行了处理和分析,发现犯罪案件的时空变化规律,并对当前的聚集情况进行了预警,为上海警方在时间和空间上合理部署警力和科学采取预防措施提供了科学依据。
犯罪时空分析; 时空扫描统计; 地理信息系统
0 引言
任何一种犯罪都是犯罪行为者在特定的时空中进行的[1],犯罪活动无论是在时间上还是在空间上都具有一定的特征,对犯罪的时空特征已有很多学者开展研究[2-6]。
一个地区的季节性特点,不仅对人们的生产活动、生活方式有着重大的影响,而且对犯罪行为也会有重要影响,从而形成季节性规律[7]。
除了季节性规律,犯罪活动在一天中的各个时段也有明显的规律。“日出而作,日落而息”是常人的生活规律,而对犯罪行为者而言,其实施犯罪行为的时间选择往往与人们正常的生活规律相反。陈鹏等人总结了抢劫、抢夺和盗窃三类街面犯罪在一天各个时段的分布,抢劫犯罪在晨7 时至午后17 时的犯罪率较低,而在其它时段的犯罪率较高,在午夜前后达到最高,表明抢劫犯罪主要发生在夜间;抢夺犯罪在傍晚18时至午夜期间的犯罪率要高于其它时段,最高峰出现在20时,表明抢夺犯罪主要以前半夜为主要作案时间。
在空间上,由于城市中人口、财富、建筑等分布的不均匀性,从而对罪犯的吸引有所不同,其直接的表现就是城市中某些地区的犯罪率较低而有些地区的犯罪率异常偏高。Brantingham[8]指出,城市中的车站、商场、酒吧、体育场所等由于人群密集,发生人身伤害和偷窃犯罪的概率要远远高于其他地区,而居民区、偏僻的街道等由于夜间人员稀少,发生抢劫和入室盗窃的犯罪几率就会相对较高,此外,罪犯在实施犯罪过程中往往要考虑到作案后的逃逸问题,因此交通发达的地区的犯罪率往往会高于交通不发达地区。
犯罪时空热点研究可以更好地了解不同犯罪行为的时空分布特征,更好地打击和预防犯罪。通过高发热点分析,以利于公安部门精确投放和部署警力;高危热点往往是和一定的空间环境有关联,在发现犯罪的高危热点后,可进一步考察犯罪发生和空间环境的关系,比如犯罪与土地使用、社会经济、人口以及其他空间环境特征的关系.以帮助鉴别诱发犯罪的环境因素,通过改变环境来预防和阻止犯罪[9];对异常热点的分析与监测则有助于对热点的爆发进行预测和预警,实现防患于未然。
1 研究方法
1965年,Joseph Naus[10]发表了关于扫描统计的经典论文“The distribution of the size of the maximum cluster of points on the line.”,开启了扫描统计方法的研究与应用。
扫描统计通过位置和大小变化的窗口沿着时间轴、空间轴或时间和空间轴对数据进行扫描,获得每个位置不同大小窗口内的事例数,并计算统计量,确定最有可能是集聚的窗口,并对集聚窗口的非随机性假设进行显著性分析。
扫描统计包括三个步骤:1)确定扫描方式,即如何定义扫描窗口的位置和大小;2)计算统计量,根据输入数据的类型确定计算统计量的似然函数,计算每个窗口的统计量,确定最有可能是集聚的窗口(一个或多个);3)对集聚窗口的非随机性假设进行显著性分析。
1.1 确定扫描方式
对单纯的时间扫描,扫描窗口是一个起始点为t,宽为时间间隔w的窗口,记为:[t,t+w],其中,t均w可变,即窗口的位置与窗宽处于动态变化之中。在研究时间范围[TS,TE]内进行移动,从而探测出集聚存在的时间段。例如,规定最小扫描步长是天, 从T2时刻点开始扫描,最大扫描时间,即扫描窗框的最大宽度为TE-T2+1时,第一次扫描w=1天,第二次扫描w=2天,第三次扫描w=3天,以此类推,直到t+w=TE为止。
对单纯的空间扫描,扫描窗口通常为圆形窗口。其圆心,即窗位,在(x,y),半径r,视为窗宽。整个窗口记为:[(x,y),r]。(x,y)和r是可变的,代表窗口在研究区域内移动,从而探测出集聚存在的空间区域。例如,从以(x,y)为中心的区域ID开始扫描,空间扫描步长为500米时,第一次扫描r=500米,第二次扫描r=1 000米,第三次扫描r=1 500米,以此类推,直到达到事先设置的最大扫描半径为止。
对时空扫描,扫描窗口是一个圆柱或椭圆柱。首先,需要随机地在研究区域内选择一个空间点作为圆柱体扫描窗口底面的中心;然后,逐渐增加扫描窗口圆柱体的底面半径及其高,圆柱体的底面积不断变化即对应扫描窗口所覆盖的地理区域变化,圆柱的高也不断变化即对应时间片段的长度的变化,直到达到预先设定的扫描窗口最大的空间和时间上限,圆柱体扫描窗口在研究区范围内的所有位置都重复相同的扫描过程。
2.2 计算统计量
根据输入数据的类型确定计算统计量的似然函数,计算每个窗口的统计量。似然函数值反映该窗口为集聚的可能性,似然函数值最大的窗口表示最有可能是集聚。
一个区域是否是集聚除了和区域内事件数与期望值的比值有关,还和其它因素有关,因此,扫描统计的关键是确定用于计算一个区域属于集聚的概率函数(模型)。
针对不同类型的数据及分析内容,目前有很多空间扫描统计的概率模型,其中,最常用的是泊松分布模型(poisson mode1) (即事例发生的地点和时间完全是随机的),是针对离散型的计数数据,如不同地点的犯罪数,用对数似然比(log likelihood ratio,LLR)表示,计算为式(1)[11]。
(1)
式中,c为窗口内的事例数,C为研究区域总的事例数,C-c为窗口外的事例数,μ为基于无效假设的窗口内预期事例数。
2.3 集聚区域的置信度分析
在扫描统计中,一般要求随机数据集的个数不少于999个,对数据量较小的数据集,推荐9 999个,这样能更好地避免产生假的集聚。
在具体实施过程,不一定每次都产生所有随机数据集,可以设置一个阈值,如5%,当真实数据集的LLR和已产生的随机数据集的最大LLR相比,已超过这个阈值,可以终止程序的运行。
另外,还可以通过Gumbel极值分布来估计p值,该方法得到的p值没有下限(但大于0)。
3 数据处理
3.1 数据源选择
本文选择上海作为研究区域。由于上海行政区划图形状上的特殊性以及崇明县的犯罪案事件比较少,为了在地图上更清晰地展现犯罪时空聚集情况,所以本文选取局部区域作为结果显示区域,如图1所示。
本研究的案事件数据来自110报警系统。通过数据抽取、清洗、加载过程,获取2016年1月1日—9月16日的街面诈骗670件,这些数据都具有精确的空间地理坐标和实际发案时间。
3.2 数据处理及计算流程
本文在时空扫描统计的基础上,利用GIS的空间选择和空间权重矩阵,对原始案件数据和空间数据进行了预处理,从而提高了计算效率,理论值采用指数权重移动平均的方法代替,空间统计单元采用边长为2 km的正六边形,详细的处理和计算流程,如图2所示。
4 犯罪聚集性转移和预警结果分析
利用Crime Scan模型对路面诈骗案事件数据进行运算,运用ArcGIS地图展现技术展现这类案事件的时空聚集性转移规律以及当前的聚集预警情况。
(一) 犯罪时空聚集性转移规律分析
采用回顾性时空分析,掌握路面诈骗案事件的聚集性转移规律。如图3所示。
图1 研究区域
图2 数据处理和计算流程图
根据图1路面诈骗案事件时空聚集转移图可以看出,路面诈骗犯罪案事件2月份中旬主要聚集在松江区的新桥派出所和闵行区的马桥派出所交界区域,3月底4月初高发于杨浦区的五角场派出所和沪东高校派出所附近区域;4月下旬主要聚集在浦东新区的花木派出所和世纪广场派出所管辖交界区域;4月份5月初主要聚集于闵行区的莘光派出所管辖区域;5月底6月初高发聚集区域转移到闵行区的七宝派出所管辖区域;7月初聚集在普陀区、闸北区和虹口区三区交界区域; 8月底主要聚集在徐汇区的长桥新村派出所及周围区域。
(二) 犯罪时空聚集性预警分析
通过CrimeScan模型对路面诈骗案事件分别进行犯罪时空聚集性预警分析。预警分析图如图4。
图3 路面诈骗类案事件
图4 路面诈骗类案事件
根据图4路面诈骗案事件时空聚集预警图可以看出,预警区域主要发生在徐汇区的田林新村派出所、康健新村派出所、漕河泾派出所、龙华派出所、长桥新村派出所和上海南站治安派出所。
5 总结
本文将时空扫描统计方法用于城市犯罪案件时空分析,并根据犯罪案件的时空特点,采用指数权重移动平均、GIS的一些空间分析功能对时空扫描统计进行了改进和优化,经过对上海2016年街面诈骗犯罪案件的实践,证明其更能适应城市犯罪的时空分析,分析结果为上海警方在时间和空间上合理部署警力和科学采取预防措施提供了科学依据。该方法对其他具有类似特征事件的时空分析也具有借鉴意义。
[1] 卓蓉蓉,李峦峦,余斌等 21世纪以来西方犯罪地理研究述评[J]. 人文地理,2017(2):16-22.
[2] 颜峻,疏学明,袁宏永.盗窃犯罪空间分布与地理因素的关联[J]. 清华大学学报(自然科学版),2010,50(2):174-186.
[3] 颜峻,袁宏永,疏学明,等.用于犯罪空间聚集态研究的优化聚类算法[J].清华大学学报(自然科学版),2009,49(2):176-178.
[4] 陈鹏,疏学明,颜峻,等.犯罪活动在一天内的发生时间规律[J]. 清华大学学报(自然科学版), 2009, 49(12):2032-2035.
[5] 陈鹏,疏学明,袁宏永,等.时空犯罪热点预测模型研究[J].系统仿真学报,2011(9):1782-1786.
[6] 姜超,唐焕丽,柳林.中国犯罪地理研究述评[J].地理科学进展,2014,33(4):561-573.
[7] 孙峰华,李世泰,黄丽萍.中外犯罪地理规律实证研究[J].人文地理,2006,21:14-18.
[8] Brantingham P L,Glasser U,Kinney B,Singh K,Vajihollahi M. A Computational Model for Simulating Spatial Aspects of Crime in Urban Environment [C]. 2005 IEEE International Conference on Systems, Man and Cybernetics (S1062-922X), 2005: 3667-3674.
[9] 毛媛媛, 戴慎志. 犯罪空间分布与环境特征: 以上海市为例[J]. 城市规划学刊, 2006(3): 85-93.
[10] J. I. Naus. The distribution of the size of the maximum cluster of points on the line[J].Journal of the American Statistical Association, 1965,60:532-538.
[11] Dwass M. Modified randomization tests for nonparametric hypotheses. Annals of Mathematical Statistics, 1957, 28:181-187.
ResearchandPracticeofCrimeSpatial-TemporalScanStatisticsMethodology
Bao Shifang1, Wang Zhanhong2
(1. Shanghai Police College, Shanghai 200137; 2. Shanghai Triman Information & Technology Co.,Ltd, Shanghai 200040)
In the spatial-temporal analysis method, the spatial-temporal scan statistics are widely used For the epidemic detecting and warning. In this paper, spatial-temporal scan statistics is used to analyze city crime, and according to the characteristics of the crime, we develop a crime spatial-temporal scan statistics software based on GIS. It can be used in spatial-temporal analysis of city crime. In this study, Through the processing and analyzing of the data of the Shanghai street crime cases in 2016 process and analyze found the temporal and spatial variation of crimes,and give the current situation of aggregation warning. It provides the Shanghai police with a scientific base for reasonable police deployment in time and space and preventive measures.
Crime spatial-temporal analysis; Spatial-temporal scan statistics; GIS
TG409
A
2017.09.03)
鲍世方(1960-),男,讲师,理学学士,研究方向:公安信息系统研发,公安数据分析,公安信息化教学。
王占宏(1975-),男,高工,博士,研究方向:公安信息系统研发与管理,公安数据分析,警用GIS等。
1007-757X(2017)10-0063-04