犯罪热点分布与驱动因子分析
2014-08-07马国春王占宏
马国春,王占宏
犯罪热点分布与驱动因子分析
马国春,王占宏
盗窃和抢劫作为最普遍的犯罪形态,是各级公共安全部门的工作重点。而发现犯罪热点的时空分布和掌握驱动因子对于犯罪宏观规律的把握非常重要。一方面,基于特定时间尺度的连续的犯罪空间热点分析,有助于帮助公安部门发现特定犯罪类型的犯罪热点的分布形态和变化规律;另一方面,基于主成分分析法,通过对案件发生的诸多驱动因子进行选择,可以发现犯罪热点的主要影响因素;采用 Getis-Ord Gi*热点分析和主成分分析方法,对某市 2009 年盗窃、抢劫犯罪的月度数据进行了深入分析,得出了相应的结论,为警力在特定时间和空间上的合理分配以及主要的管理方向提供了建议。
犯罪热点;热点分析;主成分分析
0 引言
城市犯罪在一定的地域环境下,并不是随机分布的,而是与该地区的人口、环境、经济、政策、社会因素有着必然联系,并表现为一定的时间和空间形态[1]。掌握犯罪的时空分布规律, 对有效打击犯罪、提高民众对社会安全信赖程度起着非常重要的作用。在众多的时空分析方法中,热点分析是理解事件间隐含关系的有效工具,通过热点分析可以有效地对事件做出回归分析和前景预测,因此将犯罪治理、预防与热点分析结合起来将更好地帮助研究人员得出科学的结论[2]。
学者们就热点分析所做的研究工作大致可分为如下几类:基于网格技术、基于划分技术、基于密度技术、空间扫描技术、支持向量机技术、层次聚类技术以及空间自相关[3]。这些方法各有特点,但空间自相关不仅能够探测热点,还能够揭示事件间的联系,所以本研究中采用自相关分析方法。
本文以某市 2009 年数据为例,对盗窃、抢劫犯罪数据进行处理和热点分析,并选取了常住人口密度、来某市人口密度等可能影响犯罪发生的 18个指标进行了主成分分析,探索隐含的空间关联模式。有助于打破以往被动预防犯罪的局面,主动对重点区域、重点指标加强管理,为城市预防犯罪措施在空间上的合理布局提供决策导向和参考。
1 研究区域与方法
1.1 研究区域与数据
研究区域为某市所有区县和派出所。数据主要来源于警用地理信息系统、案件系统、人口系统、治安系统等业务系统的统计数据,根据研究需要通过ETL工具进行抽取统计,并进行了预处理。空间数据包括行政区、派出所范围。案件数据根据研究需要重点对 2009 年抢劫、扒窃数据按照派出所进行统计。人口、房屋数据包含户籍人口、外来流动人口、境外人口、出租房、闲置房、自住房、集体宿舍、工地工棚。
1.2 研究方法
(1)热点分析
本次研究采用了 ARCGIS9.3 的热点分析工具,热点分析工具为数据集中的每一个要素计算 Getis-Ord Gi* ,得到高值或低值要素在空间上发生聚类的位置[4]。
Getis-Ord 局部统计可表示为:
其中 xj是要素 j的属性值,wi,j是要素 i和 j之间的空间权重,n为要素总数,且:
(2)主成分分析
主成分分析 ( Principal Component Analysis , PCA )是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题[5]。
本次研究中,我们把盗窃、抢劫案件 1到 12月份热点区域常住人口密度、来沪人口密度、境外人口密度、出租房数、闲置房数、自住房数、集体宿舍数、工地工棚数、旅店数、娱乐休闲场所数、歌舞厅数、网吧数、桑拿洗浴场所数、游艺游戏机房数、台球厅数、酒吧数、咖啡吧数、茶室数量18 个指标,利用 SPSS 进行了主成分分析。
2 结果与讨论
2.1 犯罪热点的时空分布
计算结果得出了盗窃、抢劫案件每个派出所的 Z、P值,当 P 值<0.05 时,形成的 Z 值有两个区间,即 Z>2.58,Z<-2.58,说明两类案件都具有明显的空间聚集,即具有热点和冷点。盗窃案件和抢劫案件的热点、冷点时空分布图,图中深红色表示案件的热点区域,深蓝色表示是案件的冷点区域。如图1、图2所示:
图1 2009 年 1~12 月盗窃案件犯罪热点/冷点时空分布
图2 2009 年 1~12 月抢劫案件犯罪热点/冷点时空分布
图1显示盗窃案件犯罪热点主要以“中心城核心区”为中心,随季节变化而动态变化,前三季度主要向东西方向延伸,而第四季度向南北方向延伸,而远郊区基本是犯罪冷点。图2显示,抢劫案件犯罪热点主要集中在中心城边缘区和近郊区,而中心城核心区在大多数季节是犯罪冷点。
2.2 犯罪热点相关因素的主成分分析
分析结果显示同类案件不同时间的主成分分析结果基本一致。而盗窃案件和抢劫案件的分析结果还是有较大的差别。
2009 年 9 月盗窃案件的主成分分析结果,表2 剔除了累计贡献率大于 85%以后的成分如表1,表2:
表1 九月份盗窃案件方差表
表2 九月份盗窃犯罪因子组成成分矩阵
2009 年 9 月抢劫案件的主成分分析结果,表4 中剔除了累计贡献率大于 85%以后的成分如表3,表4
表3
表4
根据分析结果和实际调查,影响盗窃案件的主要因素是娱乐休闲场所、歌舞厅、游艺游戏机房、桑拿洗浴场所,而影响抢劫案件的主要因素是来沪流动人员密度和出租房屋数量。
结论
我们通过对 2009 年 1 月~12 月的盗窃、抢劫数据进行热点分析,发现了盗窃、抢劫犯罪的整体态势和空间上的动态变化趋势,并通过主成分分析,解析出了影响盗窃、抢劫犯罪热点的主要影响因素。
所以,我们建议在市中心区域加强娱乐休闲场所、歌舞厅、游艺游戏机房、桑拿洗浴场所等的管理,而在近郊地区加强来某市人员和出租房屋的管理和巡逻。
[1]王发曾.城市空间环境对城市犯罪的影响[J].人文地理,2 001,[4]16:1~11
[2]钟海东等.基于GIS的上海市犯罪空间特征研究[J]. 华东师范大学学报(自然科学版)2013,[2]30~37
[3]D. Zeng, W. Chang, and H. Chen, “A comparative st udy of spatio-temporal hotspot analysis techniques in s ecurity informatics,” in Proc. IEEE Int. Conf. Intellig ent Transportation Systems, p. 112–117. 2004.
[4]M. Kulldorff. “A Spatial Scan Statistic,” Communicat ions in Statistics: Theory and Method, vol. 26, no. 6, pp.1481-1496. 1997.
[5]http://baike.baidu.com/link?url=KVXkmhrYl6qI5C2XDY WmadSgizcGWgE9CIN9H7ccc5mCMilGYnPIfB-_ZEkF QWzU
Analyzing on Crime Hot-spots Distribution and their Driving Factors
Ma Guochun, Wang Zhanhong
(Shanghai Triman Information & Technology co., Ltd, Shanghai 20040, China)
As the two most common crime types, theft and robbery are the key working points for the public security department. And it is also very important to find the temporal-spatial distribution of crime hotspots and master its driving factors in learning the macro-law of crime. In one way, the continuous analysis on spatial hotspot based on specific temporal level could help the public security department find the patterns and its changing law of specified crime types; in another, the main influencing factors of the specified crime types could be discovered by analyzing the main contributors among the many driving factors based on the Principal Component Analysis (PCA). This paper has analyzed the monthly theft and robbery data by adopting Getis-Ord Gi* as hotspots analysis method and PCA and comes to the corresponding conclusion, which offers valuable suggestions not only for the distribution of police forces on specific time and space but also for the management targets of the police work.
Crime Hot Spot; Hot Spot Analysis; Principal Component Analysis
TP311
A
1007-757X(2014)02-0054-03
2014.02.25)
马国春,上海众恒信息产业股份有限公司,工程师,主研领域:电子政务信息系统,大数据处理分析技术,网格技术