系列杀人案件侦查之大数据方法与运用研究
2017-03-08刘凤珠
王 彬,刘凤珠
(1.河南警察学院 犯罪学系,河南 郑州450046;2.郑州大学 法学院,河南 郑州450001)
系列杀人案件侦查之大数据方法与运用研究
王 彬1,刘凤珠2
(1.河南警察学院 犯罪学系,河南 郑州450046;2.郑州大学 法学院,河南 郑州450001)
目前,在系列杀人案件侦查中,已经开始运用大数据方法,并且取得了不错的效果。但是,系列杀人案件侦查中有哪些大数据方法,如何运用这些大数据方法,仍然存在着一些亟待厘清和解决的问题。因此,在全面阐述系列杀人案件概念及侦查要素的基础上,系统阐述了系列杀人案件侦查中的大数据方法,即数据搜索法、数据挖掘法、数据碰撞法和数据画像法等;系统阐述了系列杀人案件侦查中大数据方法的具体运用。要加强立法以规范系列杀人案件侦查中大数据方法的运用,保障公民的隐私权、信息权,注意系列杀人案件侦查中大数据方法与传统侦查方法的结合运用。
系列杀人案件;大数据方法;侦查运用
“系列杀人是一种可怕而令人费解的现象,对刑事侦查者和犯罪学家而言,它确实是一道难题。尽管这种案件很少发生,但它会在较大的社会范围内产生影响。恐惧、厌恶、学术性的好奇以及相关的恐怖想象,都是对这类案件常见的反应。越来越多的人为这类嗜杀者的增多而忧虑”。[1]但是,进入二十一世纪后,系列杀人案件在我国仍然时有发生①进入21世纪后,在我国,相继发生了杨新海系列杀人案件、黄勇系列杀人案件、马加爵系列杀人案件、赵克华系列抢劫杀人案件和甘肃白银系列强奸杀人案件等影响全国的系列杀人案件。,相较其他类型的犯罪案件,数量虽少但社会危害性十分严重,影响极其恶劣,给人民群众的生命、财产安全和社会治安稳定带来了极大危害和严重威胁。由于系列杀人案件大多案情复杂,涉及范围广,跨越时空过长,侦查工作时常陷入困境,导致案件久侦不破,给社会带来负面影响,也影响到公安司法机关的公信力和权威性。因此,笔者认为,在社会进入大数据时代之当下①大数据时代是与小数据时代相对而言的。大数据时代以互联网、物联网、云技术为基础。数据记录了一切,人类社会的行为都变成了数据,用纸质媒体记录人类历史的时代已经过去,历史正在被数据以文字、数据、表格、声音、影像的方式记录下来;强调的是“样本=总体”,相关关系而非因果关系,预测性。小数据时代的特征是:随机采样,最少的数据获得最多的信息;要求数据精确;强调因果关系而不是相关关系;预测性差。,有必要借助大数据技术,探讨系列杀人案件侦查中的大数据方法,以服务于我国侦查机关的犯罪侦查实践。
一、系列杀人案件的概念与侦查要素
(一)系列杀人案件概念分析
系列杀人案件,是指同一个人或者同一伙人实施的两次或者两次以上的杀人犯罪案件。它是由若干起相互关联的单一杀人案件构成的,在犯罪主体、痕迹物证、侵害对象、作案时空、犯罪手段、犯罪标记等方面具有某些相同或者相似特征,是一种重复性杀人模式。
系列杀人案件有以下特点:
(1)行为具有连续性。这是系列杀人案件的本质特征,是由犯罪心理在杀人作案过程中不断强化、恶性膨胀所决定的。
(2)侵害目标的相似性。犯罪行为人每次作案选择的侵害对象虽然各不相同,但各个具体的杀人行为之间具有一定的内在联系性和特定的规律性,表现在侵害目标上就是,系列杀人案件的侵害目标具有某种相似性。
(3)犯罪特征的相对稳定性。犯罪行为人在多次作案过程中,逐步形成了思维定势、心理定势和行为定势,决定了其在作案的一定时期或者阶段的犯罪特征的相对稳定性,没有特殊变故,这种稳定性会逐渐定型,进而外化为作案习惯。
(4)犯罪时空状态的一维性。在系列杀人案件中,犯罪行为人是同一主体,在同一的时空条件下,不可能同时实施两起杀人案件,这种作案时空的非重叠次序特点,是所有系列案件必须具备的条件。
(5)犯罪要素的关联性。系列杀人案件,无论个案数量多少,持续时间多长,作案手法变化多大,都难以回避和转移事物的客观关联性。
(6)犯罪性质的同类性。系列杀人案件,犯罪行为人作案的心理动因、杀人犯罪所要达到的目的,或者变态心理的需求,通常都是一致的。因此,表现在案件性质上,一般都是同一类型的个案,如强奸杀人、侵财杀人或者同类相残等。但是,也存在一些特殊情形,例如,因为犯罪行为人生活、工作经历的关系,或者偶然因素的影响,其不同时间段实施的杀人案件,犯罪性质也可能存在较大差异。
(二)系列杀人案件的侦查要素
物质转换原理昭示,不管犯罪行为人实施杀人行为前怎样准备,实施杀人行为后如何伪装现场,犯罪行为人都会在犯罪现场留下什么,或者从犯罪现场带走什么。例如,犯罪行为人实施杀人过程中在犯罪现场会遗留下物品、痕迹,各种生物检材等。同时,杀人犯罪现场还会遗留下被害人的尸体,以及与被害人有关的各种电磁信息痕迹等。这些东西构成了系列杀人案件的侦查要素,它们对系列杀人案件的侦查起到了重要的支撑作用,是侦查系列杀人案件可以利用的重要的要素资源。
从侦查实践来看,系列杀人案件之侦查要素主要有以下几类:
1.生物检材类侦查要素。生物检材类侦查要素主要有二:一是被害人自身的生物检材;二是犯罪行为人遗留的生物检材。系列杀人案件,现场众多,既包括杀人行为实施地、抛尸地,也包括其他关联现场等,特别是杀人行为实施地、抛尸地等犯罪现场,通常都会有被害人尸体(被害人死亡的),以及被害人的血液、毛发、唾液、尿液等生物检材。同时,犯罪行为人在实施杀人行为过程中,可能会遭到被害人的激烈反抗,甚至相互搏斗,在被害人的反抗与互相搏斗过程中,犯罪现场就可能会遗留下犯罪行为人的头发、纽扣、衣服纤维,甚至是犯罪行为人的皮肤或者其他人体软组织,等等。在强奸系列杀人案件中,被害人阴道内可能会存留有犯罪行为人的精斑,被害人的臀部或者会阴部可能附着有精液、尿液、排泄物或者其他异物,等等。
2.痕迹、物品类侦查要素。系列杀人案件,犯罪行为人连续多次作案,现场众多。由于可能采取相同或者不同的杀人方式,犯罪现场可能会留下相同或者不同的痕迹、物品。例如,用枪支系列杀人的,犯罪现场通常都会遗留下相同型号的弹壳或者弹头;采取不同方式实施系列杀人的,犯罪现场遗留的痕迹物品则可能有所不同,用毒药杀人犯罪现场可能会遗留下剩余的毒药或者残留毒药的器皿等。从系列杀人案件现场勘查的实际情况来看,痕迹主要表现为:犯罪行为人实施杀人行为时留下的手、足、工、枪类印迹。物品则主要表现为:犯罪行为人和被害人的衣服、鞋袜、帽子、围巾、口罩、烟头、绳索、手套、手帕、纸张、弹头、弹壳、毒物、工具、器皿,以及其他随身物品等。
3.电磁信息痕迹类侦查要素。这类侦查要素又可以细分为以下小类:
(1)通讯电磁信息痕迹。目前,手机等通讯工具已十分普及,因此,在系列杀人案件中,不论是犯罪行为人还是被害人,或者是其他相关人员,都可能随身携带手机等通讯工具。因此,在系列杀人案件现场,通过犯罪现场之通讯机站,可以查明案发时间段内,通过该机站打出、打进或者漫游到该通讯机站的电话信息。这些电话信息则包含以下内容:手机号码,主叫人,被叫人,通话次数、时间、地点和通话时长等通信数据信息。同时,系列杀人案件中被害人的手机或者其他通讯工具内,也存储了大量的电磁信息痕迹,也是重要的电磁信息痕迹类侦查要素。
(2)网络电磁信息痕迹。目前,我国网民众多,网络成为人们交流、通讯、交友、购物、购票等活动的一个重要空间,网民不仅通过固定电脑、平板电脑、智能手机等平台在网上聊天、购物、交流和通讯,而且还可以通过微信、支付宝、二维码、QQ、MSN等网络平台进行与生产、生活、学习有关的各种活动。因此,这些网络平台中存储了大量的电磁信息痕迹。系列杀人案件的实施是一个连续的时空过程,在这个过程中,不论是犯罪行为人还是被害人,或者是其他相关人员,都有可能通过网络系统的各种平台进行与系列杀人案件有关的行为,而这些行为遗留在网络系统中的各种电磁信息痕迹,就成为系列杀人案件侦查的重要依托要素。
(3)视频电磁信息痕迹。目前,视频设备已经相当普及,不仅有遍布我国城乡、交通要道、重点区域、居民小区的视频监控系统,就是公民的家庭院落、甚至居室内外都安装有视频监控系统,这些视频监控系统无时无刻不在监视并记录着其视野范围内发生的一切。如前所述,系列杀人案件的实施是一个连续的时空过程,在这个过程中,不管犯罪行为人如何想法规避自己的行为过程,但他们的准备行为、实施行为,以及实施完毕后的处理行为,都有可能被各种视频监控系统记录下来,成为侦查系列杀人案件的重要依托要素。
此外,在系列杀人案件中,除上述三类主要的侦查要素外,还有一些其他侦查要素,如系列杀人案件中的被害人本身,以及其他随身携带的智能卡等,都有可能蕴藏着大量的与系列杀人案件侦查有关的侦查要素,这也是侦查人员在侦查系列杀人案件过程中需要加以注意并可以利用的侦查要素。
二、系列杀人案件侦查中的大数据方法
系列杀人案件属于复杂、疑难且影响重大的犯罪案件。在小数据时代,主要是依靠犯罪现场搜集到的各种痕迹物证,进行犯罪行为人刻画,从因果关系入手展开侦查,侦查过程的推进常常十分艰难,甚至案发后长时间内无法侦破。大数据时代,借助大数据及其技术,侦查人员创设了一系列的大数据侦查方法,大大提高了该类案件的侦查效率。
(一)数据搜索法
在系列杀人案件侦查中,数据搜索法主要有数据库搜索、互联网搜索和电子数据搜索三种具体方法。
1.数据库搜索。就是将与犯罪案件有关的各种数据输入数据库,将输入数据与数据库中已有的相关数据进行比对,找出与犯罪案件有关的各种数据信息的过程。犯罪侦查实践中,常用的数据库主要有公安机关数据库、社会行业数据库、政府数据库、专业“数据超市”和其他数据库。上述各种数据库中,存储了大量与社会成员有关的各类数据信息,并且各种数据库在建库时都设置了查询和站内搜索功能,有些数据库还具备强大的数据挖掘、比对和分析功能。上述各种数据库中之海量数据及其自身具有的强大功能,为系列杀人案件侦查中的数据搜索提供了强力支撑。
2.互联网搜索。互联网数据表现为文本、图像、视频、音频等非结构化数据。互联网搜索,就是将与犯罪案件有关的关键词输入互联网中进行搜索,并根据互联网反馈信息进行多次搜索分析的方法。互联网搜索,通常可以了解某个人的基本信息,甚至了解某个人较为私密的信息,如手机号码、邮箱号、网络账号等。输入的检索信息越多,搜索结果的范围就可能越准确。但是,由于互联网数据是一种非结构化数据,体量巨大,要从海量数据中找到与犯罪案件相关的数据信息,除了多次搜索外,还需要掌握一些基本的搜索技巧,如搜索引擎的选择、搜索功能的选择、关键词的设置、历史网页搜索等等。同时,侦查人员还可以采取“主动搜索”方式,即在被动搜索无法获取数据信息或者无法获取足够的数据信息时,侦查人员通过网络平台主动向社会征集与犯罪案件有关的各种数据信息。
3.电子数据搜索。电子数据搜索,就是在已有的海量电子数据中,查找、提取有关数据的方法。常见的电子数据搜索有:根据涉案地点、涉案时间、案件具体情况等进行的关键词检索;根据犯罪行为人、被害人、相关人员姓名进行的关键词检索。但是,大多数情况下,系列杀人案件都是疑难案件,侦破难度大。犯罪行为人实施犯罪行为时,常常采取某种特殊的沟通交流方式,或者以合法形式掩盖非法目的,刻意规避侦查,再加上我国地域广大,方言众多,对同一事物的表达方式有时差别很大。这些都可能给电子数据搜索带来一定的困难。因此,在系列杀人案件侦查过程中,运用电子数据搜索时,要充分考虑到搜索过程中存在的各种困难与障碍。
(二)数据碰撞法
在系列杀人案件侦查中,数据碰撞法主要有话单数据碰撞、网络轨迹碰撞、车辆轨迹碰撞、视频轨迹碰撞等具体方法。
1.话单数据碰撞。话单数据包含联系人数据、通话数据、短信数据、基站数据等内容。系列杀人案件,犯罪行为人可能在一地作案,也可能在多地作案,不管是一地作案还是多地作案,通过通讯工具进行联络是不可避免的,如联系其他犯罪行为人、被害人及其他相关人员等。因此,话单数据之多维度碰撞,很多情况下能够找出案件侦查线索。但需要强调的是,话单数据碰撞过程中,可能会遇到犯罪行为人更换手机号码的问题。对此,可以调取犯罪行为人曾经使用过的手机话单中3—5个经常联系人,然后对这3—5位经常联系人的话单数据进行碰撞,在他们通讯记录中都出现的新陌生号码就很可能是犯罪行为人的新手机号码。此外,也可以将“新号码”的通话记录曲线图谱,与犯罪行为人以前使用过的手机的通话记录曲线图谱进行碰撞、对比,如果新旧手机号码的两份通话记录曲线图谱大概一致,基本上可以认定为两个手机号码为同一人所有。
2.网络轨迹碰撞。网络在给人们带来了巨大便利的同时,也给犯罪行为人提供了实施犯罪的某些条件。网络时代,犯罪行为人可以通过网络联系其他犯罪行为人,了解被害人及其家庭情况,甚至其社交圈子;可以通过网购获得杀人工具、物品,有的犯罪行为人甚至通过网络交流犯罪经验与心得。犯罪行为人在网络上的各种行为,网络空间里一定会留下其网络行为轨迹。因此,侦查人员可以将犯罪行为人、被害人及其他相关人员的网上行为轨迹,例如,何时、何地上网,上网时长,浏览过什么网页,是否使用过QQ、微信、与何人联系过,从网上购买过何种物品等,依据时空条件等方面因素进行碰撞,从而查明和判定系列杀人案件中的犯罪行为人、被害人及其他相关人员的一些情况。
3.车辆轨迹碰撞。车辆轨迹碰撞,就是利用车载定位系统、车载导航系统等记录的犯罪行为人、被害人及其他相关人员的行踪轨迹进行碰撞。在车辆高度普及的今天,利用车辆实施犯罪的越来越多。例如,犯罪行为人在车辆内杀人、利用车辆杀人,驾驶车辆前往被害人住所地、杀人后利用车辆装载尸体、尸块进行抛尸、处理等。因此,车辆轨迹碰撞就成为侦查系列杀人案件常用的一种方法。除了将车辆轨迹数据信息进行碰撞外,还可以将车辆轨迹与犯罪行为人、被害人及其他相关人员的其他数据信息轨迹进行碰撞,如将车辆轨迹与通讯数据轨迹、网络数据轨迹等进行碰撞,能够更加准确地确定犯罪行为人、被害人及其他相关人员是否到过某地、停留多长时间、和谁在一起等方面的情况。
4.视频轨迹碰撞。系列杀人案件,被害人不可能集中在一个地方,犯罪行为人实施杀人行为时,就可能会出现在不同的地方,即使是将被害人诱骗到一个地方实施杀人行为,如黄勇、杨新海系列杀人案件,被害人也是来自不同的地方,最后在一个地方消失。犯罪行为人、被害人及其他相关人员的来去过程,都有可能被我国遍布城乡、交通要道、交通路口、重点区域,甚至是商户、居民家庭的视频监控系统拍录到。将不同区域视频监控系统存储的犯罪行为人、被害人及其他相关人员的视频轨迹进行碰撞,基本可以判断出出入不同区域的是否为同一犯罪行为人或者同一伙犯罪行为人,进而锁定犯罪行为人,侦破系列杀人案件。
除上述数据碰撞外,还有一些其他数据碰撞方法,如在盗窃、抢劫、强奸系列杀人案件中,都有可能丢失物品,由于某些物品具有唯一的“身份识别号”,如手机串号、机动车发动机号、电脑序列号等,通过公安机关数据库和社会面数据库中之数据进行碰撞,可以判明是否为盗窃、抢劫、强奸系列杀人案件中丢失的手机、车辆和电脑。
(三)数据挖掘法
数据挖掘之核心在于对海量数据进行深度挖掘、分析,探索和发现海量数据背后隐藏的深层次规律,以便为犯罪件侦查提供方向指引。在系列杀人案件侦查中,常用的数据挖掘方法主要有手机数据挖掘、话单数据挖掘和网络数据挖掘等。
1.手机数据挖掘。手机数据挖掘就是对内容数据和元数据进行挖掘和分析,厘清犯罪行为人的活动规律、社交圈子、兴趣爱好等情况,为系列杀人案件侦查提供线索。
在系列杀人案件侦查中,手机数据挖掘主要包括以下方面的内容:
(1)手机及其软件基本数据挖掘。在挖掘这部分数据时,首先必须提取包括手机版本、名称、电话号码、卡号、识别码等在内的手机基本信息。此外,还需要提取手机上安装的APP软件版本、路径数据,以及用户在各软件中的注册信息。但需要注意的是,在挖掘手机基本信息时,犯罪行为人手机版本不同,其在安装的软件里的注册账号也不相同。
(2)通讯数据挖掘。通讯数据挖掘就是对犯罪行为人的通话、短信和微信数据进行挖掘。通讯数据挖掘可挖掘出以下信息:一是联系人信息。通过对犯罪行为人通讯录中联系人之地理位置的挖掘与分析,可以了解犯罪行为人联系人的基本情况。二是每日通讯频率。通过对犯罪行为人每天各个时间段的通讯频率的挖掘与分析,能够了解犯罪行为人通话频率及时间段、发送短信的频率及时间段,微信、QQ的使用频率及时间段。三是整体通讯频率。犯罪行为人在一定时间内的全部通话频率,即整体通讯频率。通过对整体通讯频率的挖掘与分析,能够知晓犯罪行为人一定时期通过手机通话、发送短信、微信、QQ聊天等整体收发频率及其高低变化。
(3)地理位置数据挖掘。地理位置数据挖掘是利用手机本身记录的位置信息、照片,第三方软件及网站记录下来的犯罪行为人的位置信息,所进行的挖掘与分析。该种挖掘包括以下方面的内容:一是通过照片定位系统对犯罪行为人活动轨迹进行挖掘。二是通过微信及微博的定位系统对犯罪行为人活动轨迹进行挖掘。如微信系统会记录下犯罪行为人曾经共享、发送过微信的地理位置;当选择定位时,微博应用会记录下推送每条信息时用户的地理位置。最后,对犯罪行为人的所有地理位置数据汇集并按照时间序列进行排序,就能够还原出犯罪行为人一段时间内连续的活动轨迹。
(4)无线网络数据挖掘。无线网络数据挖掘是对犯罪行为人手机曾经连接过哪些无线网络之轨迹进行的挖掘。在犯罪侦查中,无线网络数据挖掘的重点是,通过挖掘、分析犯罪行为人连接无线网络的时间和地点,来还原犯罪行为人在某个时间段内所处的地理位置及场所信息,确定犯罪行为人连接无线网是在户籍所在地、经常居住地、工作地,还是宾馆以及其他公共场所,描绘出犯罪行为人的现实活动轨迹。
2.话单数据挖掘。话单数据挖掘,是对话单记录的主叫号码、被叫号码、通话时间、通话地点、通话时长、通话频率等内容的挖掘,以查明犯罪行为人的生活习性、人际关系、活动轨迹等信息。目前,我国侦查机关主要在市级的通讯服务商处调取话单,调取的只能是附属信息等元数据,无法调取短信内容、通话内容,一次可以调取6个月的通话记录。话单数据挖掘是通过专业挖掘软件完成的。这种专业挖掘软件集数据库技术、数据挖掘技术、数据可视化技术于一体,将原始通话记录相关数据导入专业挖掘软件后,软件就会自动对通话次数、通话时长、通话频率、通话地点等数据信息进行归类、分析。
在系列杀人案件侦查中,话单数据挖掘通常包括以下内容:
(1)开户信息挖掘。通过反查犯罪行为人手机号码,能够知晓犯罪行为人的姓名、性别、身份证号、开户地点、创建日期、套餐业务等开户的基本信息。
(2)地理位置挖掘。对号码归属地、基站位置等数据进行挖掘,能够查明犯罪行为人的户籍地、居住地、工作地等具体位置。在犯罪侦查实践中,经常出现这样的情形,即犯罪行为人离开户籍地,流窜作案,但他仍然会同其户籍地、工作地和经常居住地的亲友保持着直接或者间接的联系。因此,应当特别注意犯罪行为人亲友通话记录中的外地号码,特别是传统的节假日从外地打给犯罪行为人亲友的外地号码,通过对犯罪行为人亲友通话记录中的外地号码归属地、机站位置等数据的挖掘,就能够对犯罪行为人定位,确定其打电话时所处的位置,甚至可以直接找到犯罪行为人的藏身之地。
(3)人物关系分析。在通话过程中,通话的频率与通话时长,能够在一定程度上反映出犯罪行为人与通话人之间的关系。一般情况下,通话频率高,通话时间长,大致可以推断他们之间可能是亲属关系。单次通话频率高,通话时间长,多在深夜或者凌晨通话,且呈现出不眠不休的特征,基本上可以推断为情人关系。工作时间通话,通话时间不长,或者工作时间通话,通话时间较长,前者基本上可以推断是同事关系,后者基本可推断他们之间存在业务关系。在犯罪现场或者在犯罪发生前、过程中和发生后通话,通话的另一方就可能是其他的犯罪行为人,他们之间可能是同伙关系。当然,话单数据挖掘中的人物关系的定量分析,并不是绝对的,还需要结合犯罪案件本身的实际情况加以分析。
(4)活动轨迹分析。通过话单中的主叫号码归属地、基站代码的串联,可以查明犯罪行为人的以下活动轨迹:一是日常活动轨迹。通过早晚打电话的基站,可以判断出犯罪行为人的起居地;通过工作时间打电话的基站,可以判断出犯罪行为人的工作地;等等。二是案发时的活动轨迹。对于案发前和案发当日的基站信息要格外注意,它常常能够反映犯罪行为人的犯罪准备工作以及作案路线。三是案发后的活动轨迹。案发后,有些犯罪行为人会迅速逃匿或者与同案其他犯罪行为人会合。通过对案发前后基站轨迹的梳理,可以掌握犯罪行为人逃跑或者与同案其他犯罪行为人会合的一些信息。
但是,需要指出的是,在话单数据挖掘过程中,也需要注意一些特殊情形:即在案件侦查过程中,犯罪行为人的通话规律并非是一成不变的,一些特殊的通话记录反倒有可能是重要的侦查信息,需要对其进一步进行分析。例如,深夜、节假日、案发日等敏感时段的通话记录;通话频率过高,累计通话时间过长的联系人;以日期为坐标对每日通话规律进行分析,明显区别于平日通话记录的时间需要引起注意。此外,外地号码、漫游号码、座机号码、特服号码等也要注意。再者,不同类型的系列杀人案件,话单分析的侧重点是不一样的。
3.网络轨迹数据挖掘。互联网上可以用来辅助犯罪侦查的资源大致有以下几类:地图类、文字类、图片类、视频类、搜索引擎类、聊天内容查询类、IP查询类等。侦查人员利用犯罪行为人及其他相关人员在使用互联网过程中有意、无意地遗留下来的轨迹、信息,通过互联网和公安内网的反复核查、挖掘,能够发现案件线索,侦破犯罪案件。
在系列杀人案件侦查中,网络轨迹数据挖掘主要有以下内容:
(1)搜索引擎查控。互联网中,网站注册、网络报名、个人网站等都可能留下与犯罪行为人相关的数据信息。在这些数据信息中,犯罪行为人的姓名、身份证号码、手机号、电子邮箱地址、微博账号、游戏账号等,就成为搜索引擎可资利用的关键词。侦查人员通过搜索引擎,如百度、谷歌、bing、搜狗等,或者利用专业搜索软件在互联网中输入关键词进行相关数据信息检索,从中找出与犯罪案件相关联的数据信息,为犯罪案件侦查活动提供帮助。
(2)“人肉搜索”。“人肉搜索”是一种以互联网为载体,或者通过匿名知情者公开数据的方式搜集数据信息,或者通过人工方式对搜索引擎提供的数据信息逐个辨别真伪,以查找任务或者事件真相的网络搜索方法。在犯罪侦查中,“人肉搜索”能够帮助侦查人员查明犯罪行为人、被害人身份,帮助侦查人员查找目击者或者知情人。侦查人员在网上公布犯罪案件信息后,广大公民可以根据侦查人员公布的犯罪案件信息,查找犯罪行为人踪迹,帮助侦查人员抓获犯罪行为人。特别是当系列杀人案件中出现被害人“身源”无法确认的情况时,“人肉搜索”在查明被害人“身源”方面的作用十分明显,通过“人肉搜索”常常能够迅速查明被害人为何人及相关基本情况。
(3)QQ号码查控。QQ号码的唯一性、QQ号码对应网络地址的客观性、QQ包含数据信息的多样性,为侦查人员利用QQ即时通信数据信息侦查犯罪案件奠定了基础。侦查人员可以通过查获犯罪行为人的QQ号码,挖掘QQ号码背后的数据信息,对QQ号码进行定位,获取犯罪案件线索,发现并锁定犯罪行为人。挖掘QQ号码背后的数据信息,就是对犯罪行为人在QQ号码注册与使用过程中留下来的数据信息进行搜索、核查、分析,从而发现犯罪案件线索,抓获犯罪行为人的一种方法。挖掘QQ背后的数据信息,主要有三个步骤:一是获取QQ使用者的虚拟信息;二是对获取的虚拟信息进行分析;三是查找虚拟信息与真实信息间关联点。
(4)通过QQ号码定位。通过QQ号码定位,是指通过获取对方QQ号码的IP地址,通过IP地址对犯罪行为人的地理位置进行定位。具体做法为,可以通过网侦部门,对QQ号码布控并定位,最终确定犯罪行为人的位置。
(四)数据画像法
数据画像法,肇始于电子商务领域,被称为“大数据用户画像”营销模式。“用户画像能够将人物特征转化为虚拟的数据,来代表个人的背景、需求、喜好等,从而加强商家与用户之间的交流,有助于商家更好地满足用户的需求。”[2]大数据时代,数据画像被引入犯罪侦查领域。在犯罪侦查中,数据画像是指,以海量数据为基础,以犯罪行为人的数据为参照,以大数据技术为支撑,运用专业软件,刻画犯罪行为人的基本样态。
数据画像是一个从具象到抽象的动态过程,首先,通过公安机关数据库、社会各行业数据库、专业大数据公司的用户数据库,以及个人电子设备中的各种数据,侦查人员获取犯罪行为人的最基本的数据信息。在此基础上,侦查人员对已获取的初始数据进行归纳、总结,运用数据挖掘、数据分析等方法显示这些数据的特征,形成类似于商业数据画像中的"用户标签化"展示,最后逐渐完成犯罪行为人的数据画像过程。数据画像时选用的相关数据越多,对犯罪行为人特征的刻画就越清晰和具体,对犯罪行为人特征的总结与归纳就越精确。“在大数据画像技术下,犯罪嫌疑人会成为大数据下的‘透明人’,其身份信息、行为轨迹、消费习惯、经济状况、家庭关系、兴趣爱好、人际交往等特征一般都会完整地展现出来”。[3]
三、系列杀人案件侦查中大数据方法之运用
(一)数据搜索法之运用
“现在,我们可以收集过去无法收集到的信息,不管是通过移动电话表现出的关系,还是通过Twitter信息表现出来的感情。更为重要的是,我们现在不再依赖抽样调查了。”[4]大数据时代,互联网、Web2.0、社交网络、物联网、移动互联网、云计算等相继进入人们的日常工作与生活之中,人人都被"数据化"了。当下,人类社会进入到全数据模式,实现了数据由样本模式向总体模式的转化,即“样本=总体”。这就意味着,人们获取的数据不再是随机采样的样本,即小数据,而是全体数据,即大数据。目前已经建成多类数据库,如公安机关数据库、社会行业数据库、政府数据库、专业“数据超市”等,这些数据库中存储了与社会成员有关的海量数据,它们为系列杀人案件侦查中数据搜索法之运用奠定了数据基础。
系列杀人案件现场不仅包括实体现场,而且包括虚拟现场。在实体现场,犯罪行为人实施杀人行为时,通常会遗留下各种痕迹、物品、生物检材等数据资料;在虚拟现场,则会遗留下各种电磁信息痕迹。对于实体现场遗留的各种痕迹、物品、生物检材等数据资料,侦查人员可以将其输入公安机关数据库或者其他相关数据库进行数据搜索,以获取系列杀人案件侦查所需要的数据信息。对于虚拟现场遗留的各种电磁信息痕迹,如犯罪行为人、被害人及其他相关人员的手机号码、上网记录、QQ聊天记录、微信通讯内容、二维码等,侦查人员可能通过网络中的搜索引擎或者专门搜索软件进行相关数据搜索,以获取犯罪行为人、被害人及其他相关人员的电磁信息轨迹。目前,在系列杀人案件侦查中,运用数据搜索法在数据库、网络空间进行数据信息搜索,甚至是多次反复搜索,已经成为侦查人员的常用方法,它对于查明和判定系列杀人案件中的犯罪行为人、被害人及其他相关人员的一些基本情况,对系列杀人案件侦查方向的确定和侦查线索的选择,都具有十分重要的导向作用。
(二)数据碰撞法之运用
在系列杀人案件侦查中运用数据碰撞法,侦查人员的具体做法可分为以下几个步骤:一是确定查找对象。数据碰撞的目的是为了解决系列杀人案件中的某个问题或者查找线索,如系列杀人案件犯罪行为人的行为轨迹、身份信息、同行人员的查找、涉案物品的确定等。二是根据查找对象确定并筛选相关数据集。系列杀人案件中涉及的数据集很多,但并非每个数据集都有必要作为碰撞的对象,而是根据分析主题的需要确定一定时空范围的相关数据集。例如,根据已知系列杀人案件犯罪行为人的活动轨迹,就可以沿途重要地点为坐标调取手机基站数据。三是对选取的数据集之间进行碰撞比对。数据集之间进行碰撞比对,通常需要两个或者两个以上的数据集,进行两两碰撞或者多个数据集同时碰撞,匹配出的交叉数据就可能是可疑目标数据,它们常常能够说明数据之间的关联性或者同一性。四是根据系列杀人案件的具体案情,进一步对可疑目标数据进行分析研判,获取更多的犯罪案件线索,确立系列杀人案件下一步的侦查方向。
在系列杀人案件侦查中,话单数据、网络轨迹数据、车辆轨迹数据、视频轨迹数据等,都是数据碰撞的重要数据集,既可以在话单数据、网络轨迹数据、车辆轨迹数据、视频轨迹数据等内选择相同性质的次数据集进行碰撞,也可以在话单数据、网络轨迹数据、车辆轨迹数据、视频轨迹数据内选择不同性质的次数据集进行碰撞,还可以将话单数据、网络轨迹数据、车辆轨迹数据、视频轨迹数据等主数据集进行直接碰撞。在数据碰撞过程中,侦查人员应当注意以下几个问题:
一是数据碰撞是以全面的“数据化”为基础的。在系列杀人案件侦查中,犯罪行为人现实空间的活动轨迹、虚拟空间的活动轨迹、身份信息等数据被记录、存储下来,是侦查人员进行数据碰撞的前提条件。
二是用以碰撞的数据集可以是同一类型的数据集,也可以是不同类型的数据集。例如,两个同是车牌号的数据集可以进行碰撞;犯罪行为人的视频轨迹数据、网络轨迹数据、车辆轨迹数据之间也可以进行碰撞,如果三个数据集在某一个地方交汇,那么,就基本上可以确定系列杀人案件的犯罪行为人曾到过某个地方。
三是用以碰撞的数据常常是带有识别性的数据符号,也被称之为“标识数据”,如身份证号、姓名、手机号码、账号、车牌号、手机串号等,这些数据具有唯一性特征,能够直接指向系列杀人案件中对应的人或者物品。一般情况下,以“标识数据”为媒介进行数据碰撞,侦查人员能够更加快速、精确地获取系列杀人案件侦查所需要的目标信息。
四是在数据碰撞时,如果对系列杀人案件的数据信息知之有限,则需要辅之以“时空数据”作为数据碰撞的限制性条件。“时空数据”是描述事件、行为的时间、地理信息的数据,一般作为筛选数据集的依据,以提高数据碰撞的准确性。数据碰撞中所运用的时空数据越多,碰撞结果就越准确。例如,系列杀人案件发生后,如果已经掌握了犯罪行为人的活动轨迹,想找到其驾驶车辆的车牌号等信息,可以调取犯罪行为人活动轨迹道路上的各卡口车辆数据进行碰撞。但是,由于道路上的各卡口车辆特别多,如果不进行时空条件限制,而是调取每个卡口的所有车辆的车牌数据进行碰撞,很可能会出现大量的重合数据。如果结合犯罪行为人在每个卡口的时空数据,选取每个卡口对应时间段的车辆数据进行碰撞,满足时空条件的车牌号就会大量减少,犯罪行为人驾驶车辆的车牌号很快就能够通过数据碰撞查询到。
(三)数据挖掘法之运用
数据挖掘技术主要包括以下几种:一是关联性分析,目的是将一些隐藏在事物现象背后、甚至常理无法理解的关联关系找出来,以发现不同数据项之间的内在关联性。二是分类分析,即以数据的特征为标准,为每个类别建立一个模型,根据数据的属性将其配置到不同的组别之中。三是聚类分析,即将数据集中具有相似性的数据聚集在一起。四是时序分析,即加进了时间因素的关联性分析,找出数据在时间上所呈现的规律。五是异常分析,即找出数据集中明显不同于既定模式的数据。
数据挖掘分析技术,是系列杀人案件侦查中数据挖掘法运用的重要支撑,对挖掘系列杀人案件中的关键数据信息具有至关重要的作用。在系列杀人案件侦查中,可以运用的数据挖掘法包括手机数据挖掘、话单数据挖掘、网络数据挖掘等。在系列杀人案件侦查过程中,可能会采取一种数据挖掘方法,也可能是多种数据挖掘方法的综合运用。这里,以“浙江省温岭×××系列抢劫杀害出租车司机案”①2008年2月10日20日16分许,温岭市公安局接报:在太平道南屏路锦园小区外停放的浙G6××××7白色奇瑞轿车内发现一具尸体。经视频追踪和外围调查,查实:从事非法营运的驾驶员陈某某(男,50岁,温州乐清市雁荡镇人)于当日15日20分许在乐清市雁荡镇新街口搭载一名乘客后沿104国道驶往温岭太平,约16时30分抵达现场位置即遭到该乘客的抢劫杀害,犯罪嫌疑人抢走一部“摩托罗拉A668”手机及少量现金后徒步逃离现场。勘查中,在被害人指甲缝内提取到犯罪嫌疑人生物检材一份、在副驾驶室后排座位上提取到犯罪嫌疑人遗留的石头一块。法医推断,作案工具为2厘米×10厘米的单面刃刀具,死者系刀类工具刺左前胸部致肺动脉破裂死亡。2008年2月19日凌晨3时03分许,温岭市公安局接报:在太平街道南屏路五龙小区前停放的浙JA××××7出租车内发现一具尸体。经视频追踪和外围调查,查实:当日凌晨1时许,驾驶员李某某(男,45岁,河南省嫣陵县人)驾驶出租车在大溪镇附近搭载一名乘客后沿104国道驶往温岭太平,约1小时40分许抵达现场位置即遭到该乘客的抢劫杀害,犯罪嫌疑人抢走一部“诺基亚1255”手机及少量现金后徙步逃离现场,勘查中,除犯罪嫌疑人血鞋印外未提取到有价值的痕迹物证。法医推断,作案工具为2.3厘米×10厘米的单面刃刀具,死者系刀类工具刺左颈部致左侧颈总动脉及颈内静脉破裂死亡。(徐公社主编:《侦查新战法精选案件评析》,中国人民公安大学出版社、群众出版社,2010年版,第7-8页。为例加以分析说明。在该系列抢劫杀人案件侦查中,侦查人员开始采用常规侦查措施展开侦查,但几乎没有任何效果。在此情形下,在当地公安机关统一领导下,侦查人员果断采取了数据挖掘方法,以犯罪行为人活动的时空轨迹重合为突破重点,对被抢劫的两部手机、犯罪行为人逃跑沿途的视频监控系统进行了数据信息挖掘,获得了犯罪行为人操本地口音,身高约1.65米,穿一件腰部有长条形浅色图案的连帽深色夹克衫的数据信息;挖掘出了两部被抢手机的买家。特别是对QQ号数据信息的挖掘,更是本案侦破的亮点,通过对案发地区和与相关地区案发前后QQ号数据信息的挖掘、分析与研判,经落实发现,QQ号为37×××87的时空轨迹与犯罪行为人的活动轨迹相符。经深度挖掘该QQ号空间信息,发现登记使用人为“张某某”,属猴,狮子座,籍贯乐清,个人签名“通缉犯”。调取该QQ号在台州各网吧登记时间段使用者的视频监控资料,发现路桥某网吧的视频录像里出现的可疑人员所穿上衣的后背图案与犯罪行为人上衣一致。围绕上网卡调查,发现使用人为张某某本人。外围调查荻悉,张某某长期混迹于温岭泽国一带,曾因交通事故在逃,目前无正当职业,经济拮据。经抽取张某某父母血样检验、比对,进一步确定张某某为该系列抢劫杀人案件的犯罪行为人。
(四)数据画像法之运用
如前所述,系列杀人案件的完成大都经历了一个较长的时空过程,在这个较长的时空过程中,犯罪行为人的行为可分为犯罪预备行为、犯罪实施行为和犯罪完成后的处理行为。犯罪过程中每一种行为的实施都可能会在不同的地方 (现实空间和虚拟空间)遗留下犯罪行为人的痕迹、物品、生物检材,以及各种电磁信息轨迹。这些痕迹、物品、生物检材,以及电磁信息轨迹,在某种程度上能够反映一个人的身份、行为特征、人际关系、兴趣爱好、生活习惯、活动轨迹等方面的基本情况,“一种特殊的标记行为模式能够明显地表示出犯罪人的特殊需要,标记行为能够很好地反映出犯罪人潜在的人格、生活类型和经历。”[5]在对上述基本情况进行深度数据挖掘的基础上,综合各种数据信息,就可以对系列杀人案件中的犯罪行为人进行“数据画像”,勾勒出犯罪行为人的全貌。
在我国,系列杀人案件主要有心理满足型系列杀人案件和图财型系列杀人案件两种类型。这两种主要类型的系列杀人案件除在犯罪现场遗留下各种数据信息外,各自还可能会遗留下其独特的数据信息。通常情况下,心理满足型系列杀人案件,犯罪行为人杀人后,常常还会实施下列行为:刀割性器官、奸尸、异物插入行为、尸体遮盖行为、奇特的尸体摆放姿势等。图财型系列杀人案件,犯罪行为人杀人后,常常会实施碎尸、焚尸、抛尸等毁灭犯罪证据的反侦查行为。例如,甘肃白银系列强奸杀人案件,犯罪行为人在1988年至2002年间,在甘肃省白银市、内蒙古包头市连续强奸残杀女性11人,作案跨度14年,侦破跨度28年,被称为“世纪悬案”。[6]在该案中,犯罪行为人选择的杀害对象都是年轻女性,杀人后大都将被害人衣服推至双乳之上,切开颈部或者割裂颈部,挖去双乳或者身体其他部分,砍杀被害人数刀至数十刀不等,且这些独特的行为特征在该案中表现出明显的一贯性。在案发后的28年间,为了侦破该起系列强奸杀人案件,侦查人员通过不懈努力,搜集到了犯罪行为人的生物检材,如精液、血液等,并进行了DNA、Y-STR分析检验,结合犯罪行为人在杀人后所表现出来的各种行为特征,进行了数据搜索、数据挖掘、数据碰撞,最后对犯罪行为人进行了“数据画像”,勾勒出犯罪行为人高某的个人全貌,破获了这起跨度长达28年的“世纪悬案”,即白银“8·05”系列强奸杀人案。
四、结语
当下,大数据方法被广泛运用于包括系列杀人案件在内的各种犯罪案件侦查,特别是一些复杂、疑难且久拖不破的犯罪案件侦查。大数据方法在犯罪侦查中的运用,不但大大提高了犯罪侦查的效率,而且推动了犯罪侦查由小数据时代主要依据因果关系,对犯罪行为人进行“心理画像”,向大数据时代主要依据相关关系,对犯罪行为人进行“数据画像”的转化,拓展了犯罪侦查的视野与方法。但是,大数据方法在犯罪侦查中的运用也带来了一些法律问题和实践问题,如大数据方法在犯罪侦查中的运用存在着侵犯公民个人隐私权、信息权问题,通过大数据方法获得证据材料的属性如何定位问题,以及犯罪侦查实践中单靠大数据方法、轻视传统侦查方法的问题,等等。因此,笔者认为,必须加强立法以规制大数据方法在犯罪侦查中之运用,保护公民个人的隐私权、信息权。同时,在犯罪侦查中将大数据方法与传统侦查方法,如搜查、摸底排队等结合起来运用,防止仅凭大数据方法侦查犯罪案件所带来的偏狭。
[1][5][美]迪·金·罗斯姆.地理学的犯罪心理画像[M].李玫瑾等译.北京:中国人民公安大学出版社,2007:7,286.
[2]余孟杰.产品研发中用户画像的数据模建——从具象到抽象[J].设计艺术研究,2014(6).
[3]王彬.犯罪侦查中的大数据应用分析[J].中国刑事警察学院学报,2017(4):38.
[4][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].盛扬燕,周涛译.杭州:浙江人民出版社,2013:42.
[6]甘肃连环强奸杀人案告破9起案件细节暴光 [EB/OL].http://news.sina.com.cn/c/2016-08-27/doc-ifxvitex9108384.shtml,2016-08-27.
Research on the Methods and Application of Big Data in the Investigation of Serial Homicide Cases
Wang Bin1,Liu Fengzhu2
(1.Henan Police College,Zhengzhou 450046,China;2.Zhengzhou University,Zhengzhou 450001,China)
At present, in the investigation of serial homicide cases, it has begun to use the methods of big data, and achieved good results. However, what are these special methods of big data in the investigation of serial homicide cases, and how to use these methods of big data, there are still some problems to be clarified and solved. Therefore, on the basis of comprehensive exposition of the concept of serial homicide cases and the elements of investigation, it systematically elaborates the methods of big data in the investigation of serial homicide cases, such as data search method, data mining method, data collision method and data portrait method and so on. It systematically elaborates the application methods of big data in the investigation of serial homicide cases. It is necessary to strengthen legislation of the application methods of big data in the investigation of serial homicide cases, and guarantee people's privacy and information right, we should strengthen the combination of traditional investigation methods and the methods of big data in the investigation of serial homicide cases.
Serial Homicide Cases;Methods of Big Data;Investigation and Application
D631.2
A
1673―2391(2017)06―0048―09
2017-10-09
王彬(1967—),男,河南淮滨人,河南警察学院犯罪学系主任、教授,诉讼法学博士、博士后,郑州大学法学院刑事诉讼法专业硕士研究生导师,研究方向为刑事诉讼法、犯罪侦查与证据;刘凤珠(1994—),女,河南确山人,郑州大学法学院刑事诉讼法专业2016级硕士研究生,研究方向为刑事诉讼法、犯罪侦查与证据。
河南省哲学社会科学规划项目“基于大数据分析的社会矛盾预警云平台研究”(2016BSH007)的阶段性成果。
【责任编校:边 草】