不同个体特征入室盗罪犯的出行距离统计分析
2022-07-11张超鹏陈鹏
张超鹏 陈鹏
(中国人民公安大学信息网络安全学院 北京市 102600)
1 引言
当前,从空间角度研究犯罪人行为模式是国内外研究的一个重要热点领域。人们发现犯罪人在外出作案过程中普遍遵循最小努力原则,即犯罪人大部分作案地到其落脚点的距离是有限的。对此人们围绕着犯罪人的这一特征开展了一系列相关性研究。其中,对于犯罪者出行模式的研究,Lammers 等提出了就近掠夺的概念,发现犯罪人出行距离存在着明显的衰减效应。Chopin 等人通过分析法国1979-2013 年间的性侵类案件数据,发现该类犯罪中超过一半的受害人实际居住地点距离犯罪人的落脚点不超过2.5km。侯超等通过对北京市盗窃电动自行车案件统计分析,结合环境因素、个体因素、时间维度等多个特征研究了犯罪者的空间出行模式。Rengert 等研究了发案地社区周边环境因素,入室盗窃案件作案者出行距离的影响。Nobles 等研究了在同一区域内入室盗窃案发高的对出行距离的影响,案发率高地区吸引犯罪者到此处作案。赵梓渝等以长春市南关区扒窃为例,从犯罪者居住地选址与发案地机会之间研究了掠夺式犯罪出行的空间模式。此外,关于个体特征因素的犯罪人出行行为模式方面,国外的Levine 等研究了犯罪人性别、年龄等不同因素之间交互作用对犯罪出行距离的影响,方向是犯罪出行距离受犯罪人个体特征与环境特征等多种因素共同影响。Groff等通过研究侵财类案件,得出男性犯罪者的出行距离较女性更远,并指出这是由于性别差异带来的体能不同导致。国内的侯超等通过对犯罪人不同主体特征要素的精细化细分,研究了不同因素对犯罪人空间出行距离的影响,赵梓渝等从性别、年龄、教育程度、是否存在前科劣迹和户籍地等维度研究了犯罪者行为时空倾向。
从当前国内外研究现状来看,对影响出行距离要素方面的研究仍存在一定不足。一方面是犯罪人出行距离方面现有的处理方式大多使用欧氏距离或曼哈顿距离近似计算,但这种方式往往会严重低估犯罪人的实际出行距离。且对于计算罪犯的出行距离是事后补正,意在通过分析出行距离实现对各类违法犯罪活动的事后打击转为事前防控,所以仅统计欧氏距离或曼哈顿距离缺乏严谨。二是在犯罪人主体特征中目前仅考虑了犯罪人年龄、性别、犯罪经验、籍贯等社会化特征,没有对犯罪人作案特征是否为团体作案进行考虑。
基于此,本研究以北京市为例展开研究,利用2015-2017 年全北京市入室盗窃数据,提取犯罪者自身个体特征数据,包含年龄、性别、是否京籍、团伙个人等四类影响因素,利用统计和数学建模等方法对此四类个体要素的犯罪人出行距离特征进行分析,结合相关理论,从实际出发为入室盗犯罪活动侦查研判提供依据。
2 数据来源与分析方案
本文的犯罪数据来源于北京市公安局2015-2017 年全北京市入室盗窃案件数据,每个案件数据维度包含案件编号、户籍地详址、犯罪者暂住地详址、发案地详址、犯罪者身份证号码、案发时间等案件基本信息,其中从身份证号码可以进一步提取出犯罪者性别、年龄等信息。通过案件编号可以关联出犯罪人团伙关系,当某几条案件数据中案件编号、案件名称、案发时间均相同时,认为此案件为团伙犯罪,其余为个人犯罪。由于盗窃类案件的团伙作案一般有着严密的组织分工,因此本文仅将团伙落脚点为同一地址的数据予以保留。同时为了最终结果的准确性,将暂住地与发案地一致,即出行距离为零的数据剔除。最终得到有效数据共5273 条。
在分析工具选取,针对入室盗犯罪人出行距离的研究采用如下方法:
(1)描述性统计:计算所有案件暂住地与发案地出行距离的平均数、中位数、极值、方差等。
(2)犯罪出行距离计算:计算每个案件中入室盗犯罪人暂住地与发案地之间的曼哈顿距离、步行距离、骑行距离、公交距离。
其中曼哈顿距离计算的是两个点在标准坐标系上的绝对轴距总和,公式如下:
步行距离、骑行距离、公交距离是通过百度地图开放地图Web 服务API 端口,利用Python 编写爬虫将案件暂住地与发案地经纬度作为输入,计算两点间此三种距离,选择其中系统推荐最优路径返回结果,作为最终出行距离长度。具体计算方式如表1 所示。
表1:三种出行方式计算方式
在个体要素的选择上,结合已有的环境犯罪学基本理论如日常活动理论、理性选择理论、犯罪模式理等一系列犯罪地理学基础理论,犯罪人在选择作案地是受自身认知、生活习惯、作案成本等特征影响而发生变化,同时不同地域的犯罪人、不同年龄段、不同性别、团伙个人等方面也存在着一定差别。因此,本文选取了是否京籍、年龄、性别、团伙个人作为个体特征要素,分别针对此四类要素影响下入室盗出行距离进行探索分析。
3 结果分析
3.1 入室盗犯罪人出行距离整体特征分析
在入室盗犯罪人出行距离特征分析的颗粒度选择上,本文采用了5km 为一组的分组方式,对分组后数据进行统计分析和数学建模。以5km为单位统计入室盗犯罪人出行距离,这种大的分组量级可能会导致一些信息被过滤,但能有效避免分组过小带来的拟合弊端。
首先,对入室盗犯罪人的四种出行距离数据进行描述性统计分析,结果如表2 所示。
表2:四种出行距离统计表(单位:km)
由表2 可看出,四种不同出行距离中步行距离、骑行距离各项指标大致相同,平均值范围14.97 到15.7km,分布范围从0 到120km,曼哈顿距离与公交距离明显大于以上两种距离,平均值为18.95km,且分布范围从0 到145km,这是由于公交车或地铁路线并不是直接从出发点到目的地计算,中间存在转折或绕路等。曼哈顿距离最长,平均值为21.15km,分布范围从0 到155km,这是由于曼哈顿距离计算的是两个点在标准坐标系上的绝对轴距总和。总体来说,四种出行距离大致上并无太大区别。统计各组案件四种出行距离数量频率,发现犯罪出行距离小于5km 占比平均约为30%;5-10km 占比平均约为16%。约60%以上案件出行距离在15km 以内,约90%以上案件出行距离在40km 以内。接下来将四种距离的统计结果绘制频率折线图(见图1),并采用负指数函数对四种距离拟合(见表3),从结果可以看出,随着犯罪出行距离的增加,案件数量持续减少,四种距离均在0-40km 范围内下降趋势大,而后下降趋势减缓,负指数函数拟合程度R分别为0.9527、0.97768、0.97055、0.96542,拟合程度均达到了95%以上,可看出在离散为5km 这个分组上,四种出行距离间差距相差并不大。
表3:四种犯罪出行距离拟合函数表
图1:四种犯罪出行距离衰减曲线图
接下来对四种距离不同个体特征要素下入室盗犯罪人出行距离进行描述性统计分析,结果如表4 所示。
表4:不同个体特征入室盗犯罪人出行距离统计表(单位:km)
从表4 可看出,以不同年龄段为划分,26-45 岁案件数占比60%以上且出行距离平均数最远为16.42km,25 岁以下与46 岁以上出行距离较短。从性别划分来看,男性作案比例达到了90%以上且男性出行距离大于女性,不论是从平均值15.07km 还是出行最远距离115km 均是如此,女性最远出行距离仅65km。从个人团体划分来看,团体出行距离平均数16.52km 大于个人出行距离平均数14.24km。从地域籍贯划分来看,京籍出行距离平均数17.57km 大于非京籍出行距离14.47km。
3.2 不同年龄段犯罪人出行距离比较分析
将数据按不同年龄段分类统计(见表4),26-45 岁作案数量3414 起,占总案件数64%,而25 岁以下作案数量1459 起,占总案件数28%,46 岁以上400 起,占总案件数8%。26-45 岁出行距离平均数与中位数均大于其余两个年龄段。将三类年龄段案件分类进行统计与拟合,25 岁以下犯罪出行距离小于5km 占比平均约为34%;5-10km 占比平均约为16%。约60%以上案件出行距离在10km 以内,约90%以上案件出行距离在30km 以内。26-45 岁犯罪出行距离小于5km 占比平均约为29%;5-10km 占比平均约为18%。约60%以上案件出行距离在15km 以内,约90%以上案件出行距离在45km 以内。46 岁以上犯罪出行距离小于5km 占比平均约为30%;5-10km 占比平均约为24%。约60%以上案件出行距离在15km 以内,约90%以上案件出行距离在30km 以内。结合不同年龄段的距离衰减曲线来看(见图2),在不同年龄段划分上,年龄与犯罪距离呈现倒U 型关系。且25 岁以下年龄段犯罪出行距离负指数函数拟合程度达R=0.96275,26-45 岁年龄段犯罪出行距离负指数函数拟合程度达R=0.9652,46 岁以上年龄段犯罪出行距离负指数函数拟合程度达R=0.97649,拟合程度均达到了95%以上。
图2:不同年龄段犯罪出行距离衰减曲线
3.3 不同性别犯罪人出行距离比较分析
将数据按不同性别分类统计(见表4),男性作案数量4949 起,占总案件数94%,而女性作案数量400 起,占总案件数6%。男性犯罪出行距离平均数与极大值均大于女性出行距离。将不同性别案件分类进行统计与拟合,男性犯罪出行距离小于5km 占比平均约为31%;5-10km 占比平均约为18%。约60%以上案件出行距离在15km 以内,约90%以上案件出行距离在40km 以内。女性犯罪出行距离小于5km 占比平均约为23%;5-10km 占比平均约为11%。约70%以上案件出行距离在15km 以内,约90%以上案件出行距离在25km 以内。结合不同性别的距离衰减曲线来看(见图3),在不同性别划分上,男性犯罪者四种出行距离均高于女性,这可能是由于男女间不同生理差异造成。男性犯罪出行距离负指数函数拟合程度达R=0.9727,女性犯罪出行距离负指数函数拟合程度达R=0.72235,男性函数拟合程度达到了95%以上,女性函数拟合程度较低,这是由于女性犯罪者在15km 处存在明显的空间缓冲效应导致。
图3:不同性别犯罪出行距离衰减曲线
3.4 不同籍贯犯罪人出行距离比较分析
将数据按是否京籍分类统计(见表4),非京籍作案数量4426 起,占总案件数84%,而京籍作案数量847 起,占总案件数16%。京籍犯罪出行距离平均数大于非京籍出行距离。将不同籍贯案件分类进行统计与拟合,非京籍犯罪出行距离小于5km 占比平均约为30%;5-10km 占比平均约为18%。约60%以上案件出行距离在10km 以内,约90%以上案件出行距离在35km 以内。京籍犯罪出行距离小于5km占比平均约为30%;5-10km 占比平均约为16%。约60%以上案件出行距离在10km 以内,约90%以上案件出行距离在50km 以内。结合不同籍贯的距离衰减曲线来看(见图4),在不同籍贯划分上,京籍犯罪者四种出行距离均高于非京籍,这可能是由于京籍犯罪者对于城市认知程度高,更清楚了解哪里有合适的犯罪目标。非京籍犯罪出行距离负指数函数拟合程度达R=0.9763,京籍犯罪出行距离负指数函数拟合程度达R=0.96682,拟合程度均达到了95%以上。
图4:不同籍贯犯罪出行距离衰减曲线
3.5 团体个人犯罪人出行距离比较分析
将数据按团体个人分类统计(见表4),个人作案数量3585 起,占总案件数68%,而团体作案数量1688 起,占总案件数32%。团体出行距离平均数与中位数均大于个人出行距离。将团体个人案件分类进行统计与拟合,个人犯罪出行距离小于5km 占比平均约为33%;5-10km 占比平均约为19%。约60%以上案件出行距离在10km 以内,约90%以上案件出行距离在35km 以内。团体犯罪出行距离小于5km占比平均约为25%;5-10km 占比平均约为16%。约60%以上案件出行距离在15km 以内,约90%以上案件出行距离在40km 以内。结合团体个人的距离衰减曲线来看(见图5),在团体个人划分上,团体犯罪者四种出行距离均高于个人,这可能是由于团伙作案的犯罪人分工协作,流窜性高,出行距离较远。个人犯罪出行距离负指数函数拟合程度达R=0.97207;团体犯罪出行距离负指数函数拟合程度达R=0.50866,拟合程度均达到了95%以上。
图5:团体个人犯罪出行负指数函数拟合曲线
4 结论
本文通过对北京市入室盗犯罪人四种出行距离分布进行统计与数学建模分析,针对多种个体特征对出行距离的影响。结论如下:
(1)针对四种不同犯罪出行距离,在0 到120km 范围内大致相同,往后公交距离与曼哈顿距离仍存在一定比例,这是由于公交车或地铁路线并不是直接从出发点到目的地计算,中间存在转折或绕路等,曼哈顿距离计算的是两个点在标准坐标系上的绝对轴距总和造成的。因此,在不同犯罪出行距离的选择上,选择单一距离作为犯罪出行距离与选择多种距离间误差较小。
(2)针对不同年龄段,结合以往研究,犯罪人出行距离与年龄呈现倒U 型关系,低龄犯罪人出行距离短,随着年龄的增加出行距离不断增大,成年后达到顶峰,在更长的时间后有明显回落,同时作案高发年龄也处于26-45 岁这个年龄段。对于入室盗窃这一“技能性”要求较高的犯罪活动来说,犯罪人的年龄越大,其对城市环境的认知越强,也更清楚的了解哪里有合适的犯罪目标,因此其出行距离较低年龄犯罪人会更远。
(3)针对不同性别,可以看出犯罪人男性比女性出行距离较长,这是由于性别差异所带来的,男性体能普遍优于女性,支持其在更大的空间范围内寻找犯罪目标,犯罪出行距离较长,女性由于生理差异的原因更倾向于选择就近掠夺的模式。且男性作案比例远远高于女性。
(4)针对团伙个人,在个体作案中,由于缺少同伴,其“独狼”式的行为从一定程度上限制了其空间认知能力,往往选择短距离作案,而在团伙作案中,由于团伙间配合,且团伙作案流窜性高,技术性强,犯罪人之间通过信息共享了解更多的犯罪目标信息,同时团伙协作也可以支持其在距离居住地较远的地方作案能够获得较高的犯罪收益。个人作案数量大约为团体作案数的两倍。
(5)针对不同籍贯,非京籍犯罪人出行距离小于京籍犯罪人,这是由于京籍犯罪人作为本地人,在居住特征、社会关系、对发案地的认知不同造成的。且对于非京籍犯罪人来说,京籍犯罪人作案地成本相对较小。从案件统计数据可以得出,北京市入室盗案件绝大多数为人口犯罪。