数学助破凶案的奥秘之一—如何寻找犯罪热区
2016-10-20陆继宗隽武
陆继宗?隽武
侦破刑事案件,特别是杀人凶案,是电视剧的主要题材之一。因为其中不仅有扣人心弦、曲折复杂的情节,还有现代化的刑案侦破手段的介绍。然而,在十多年前,美国曾拍了一部别出心裁的侦破系列剧,名为《Numbers》,直译意思为“一些数字”,中文意译为《数字追凶》。剧中有两个主要人物,一为联邦调查局特工丹·埃普斯,一为他的弟弟数学家查利。每一集都围绕查利如何用他掌握的数学知识和数学工具来帮助哥哥破获刑事凶案,使数学成为协助破案的利器。那么,使用数学技巧来破案究竟靠不靠谱呢?数学果真是破案的利器,抑或只是为了提高收视率的一种炒作呢?为了回答这个问题,美国全国公共电台数学普及节目主持人基思·德夫林和加州理工学院数学系教授、《数字追凶》电视剧首席数学顾问合著了一本同名的书籍,解释了为什么数学知识确可用来作为破案的利器。我们将通过一系列文章,具体介绍数学在刑事侦破工作中的作用,以及围绕这一工作饶有趣味的有关知识。
如何抓住强奸杀人犯?
联邦调查局特工丹·埃普斯看了一眼平摊在他父亲家餐厅桌子上的一张大洛杉矶地区的街区图。地图上用叉号标记了犯罪地点,一个残忍的系列杀手在几个月内袭击、强奸,然后杀害了十多位年轻的女性。丹的任务,是在罪犯再次对女性发动袭击前抓住这名杀手。但是调查毫无进展——丹没有线索,也不知道下一步该做什么,真可以说是一筹莫展。
“要帮忙吗?”这是丹的弟弟查利的声音,他是附近某大学数学系的一名杰出年轻教授。丹一直对他弟弟不可思议的数学才能佩服得五体投地,希望能从他那里得到任何帮助。但是调查能从一个数学家那里得到帮助吗?
“此案与数字无关,查利。”丹语气严厉并不是由于生气,更多地是由于遇到了挫折而造成的,但查利似乎并未注意到这一点,他的回答完全是就事论事,但似乎有点答非所问:“任何事情都与数字分不开。”
丹并不信服。当然,他常常听查利说数学就是研究各种模式:辨认模式、分析模式以及预言模式,等等。但即使让一个数学天才去看杂乱无章散布在地图上的叉号,他又会看出什么奥秘来呢。没有规律性,任何人根本没有办法预言下一个叉号将打在哪个精确位置上,也就是说,下一个年轻的姑娘会在哪里被袭击,我们应当在哪里设防——这可能会出现在每个夜晚。如果叉号的排列具有某种规律性,那么倒可以用一个数学公式来描绘一个图形,就像丹在中学时代学习解析几何时所学到的知识:方程x2+y2=9 可以用来描绘一个圆周图形。
自动喷水龙头的启发
看着地图上的记号,即使查利也不得不同意,好像无法用数学来预言杀手下一次将在哪里作案。然而他们家里花园中灌浇草坪的自动喷水龙头不断喷出水珠,落在草坪上,这一现象启发了查利。因为查利知道,事实上,现代生活中几乎没有哪一个领域可以不依赖数学,但是必须建立一种模式,不然数学无法走出第一步。
他把丹拖曳到了窗前,可以看到喷水龙头正在不知疲倦地工作。“我们一直在提一个错误的问题。”他说,“从那些你已经知道的发案地点,你根本无法预言凶手下一次将在哪里作案。”他指着喷水龙头说。“这就好像,不管你对溅落在草坪上的水珠的位置研究得再多,也无法预言下一水滴将溅落在何处。”他看了丹一眼,确信他的哥哥正在听。“但是我们假定,你不能看见这个喷水龙头安装在哪里,你所能得到的是溅落到地上的所有水滴的分布模式。然后利用数学工具,你就能精确推算出喷水龙头在什么地方。你不能利用水滴的模式去预言下一颗水滴将落在哪里,但你能够用已经确定的水滴落点反推出水龙头在哪里。这只水龙头所在的地方就相当于凶手所在之处。”
丹一下子很难接受他弟弟提出的建议。“查利,你是否是在告诉我,你可以推出凶手的落脚之处?”
查利的回答很简单:“对。”
丹仍然怀疑查利的想法是否真的管用,不过他弟弟的信心和热情给他留下了深刻印象,所以他同意让查利帮助调查。
查利第一步是学一些犯罪学的基本科学知识:首先,系列杀手的行为是怎么样的。在这一点上,他作为一个数学家,多年经验教会了他如何辨认哪些是关键因素,而忽略所有其他的因素,以使一个看似非常复杂的问题能够化成一个仅包含少数几个变量的问题。例如,在与丹以及他哥哥所工作的联邦调查局办公室里的其他特工交谈后,他知道了暴力系列犯罪在地点的挑选上会呈现出某种倾向性。罪犯们倾向于靠近他们的住所实施犯罪,但不会挨得太紧;他们会环绕他们的居住所在地设立一个“缓冲区”,在此区域内他们不实施犯罪,这个区域太靠近其住处、太危险,所以他们不想在这个他们所谓的舒适区作案;而在这舒适区外,犯罪地点出现的频率是随着离住所距离的增加而减少的,这也容易解释,因为越远则意味着越不方便,而且他们越不熟悉那些地方。
然后,回到他在加州科学大学数学系的办公室,查利兴奋地认真工作了起来,黑板上布满了数学的等式和公式。他的目标:找到数学的钥匙,从而确定一个“热区”——地图上的一个区域,由作案地点反推出来,是犯罪分子最可能居住的地区。
查利得出的公式
就像他在着手解一个艰难的数学问题那样,查利尝试种种方法而没有成功时,时间在飞快地流逝。最后,他有了一个他认为可以管用的想法。他擦掉了以前写在黑板上的潦草字迹,写下了这个看起来很复杂的
公式:
下一步是对此公式进行微调,就是用由丹提供的以前系列犯罪案件来验证这个公式。当他输入联邦调查局以前破获的案件中的犯罪地点,从而证实这个公式是不是能正确地预言罪犯的住处。因为有些时候,这个公式并不能反映真实情况,比如哪些是要考虑的因素、哪些是可忽略的因素,一定要与办案人员交流后才能得知,不过,当查利根据大家的意见作了某些小的调整后,这个公式似乎就管用了。
第二天,查利在联邦调查局办公室显示了一份打印的标明“热区”的犯罪地点图。这是查利把他新的公式输到他的计算机中去时,计算机产生的一个图形:一张在丹的洛杉矶犯罪地点图上画出的一系列有颜色的区域的地图,颜色逐步向中心变化,这些区域就是杀手可能居住的热区,而中间的黄色区域是杀手最有可能居住的区域。
虽然有了这张图,也仍然还有许多工作留给丹和他的同事们去做,但是他们不需要像在大海里找一根针那样去找杀手了。感谢查利的数学公式,他们只需要在浴缸里找那根针了。
查利向丹和调查此案的其他联邦调查局特工解释,这个系列杀手,虽然在随机挑选的犯罪地点上来寻找被害人,从而试图不暴露他的住处,但是数学公式揭露了真相:以很高的概率确定了罪犯居住地点的热区。丹和他的小组决定侦查居住在这个热区中的某一年龄段的符合作案条件(比如曾有前科等等)的若干男人,并使用监视以及隐蔽的手法,从嫌疑人抛弃的烟头、吸管中获得DNA证据,看看谁的DNA与从犯罪现场侦查获得的DNA相符。
过了不多几天,经历了几次紧张的时刻,他们抓到那个罪犯,案件告破。
丹告诉他的弟弟说:“查利,这是你的公式立下的功劳。”
事实还是虚构?
除少数戏剧性情节外,上面所叙述的就是电视观众看到的系列电视剧《数学追凶》第一集。许多观众不相信数学能以这种方式帮助捉拿罪犯。事实上,整个第一集是基于一个真实案例,在此案中用了一个数学公式来确定罪犯居住地的热区。它就是观众看到的,查利写在黑板上的那个公式。
现实中,得到这个公式的那个数学家名叫金·罗斯莫。罗斯莫用来预言系列犯罪案凶犯居住在哪里的数学技巧叫做地理分析技术。
罗斯莫已在重新分析老案件上取得了一些初步的成功,在取得了他的博士学位并被提升为侦探后,他把他的兴趣倾注到了开发更好的数学方法,来进行他称的“犯罪地理靶定”,其他人则称此方法为“地理分析技术”,因为它是与那种被调查人员基于犯罪分子的行为和心理特征来寻找罪犯的、大家熟知的“心理分析技术”相辅相成的。地理分析技术由分析犯罪分子的犯罪地点来确定一个罪犯的基本行动规律。
罗斯莫早期在加拿大从事系列犯罪案件调查,但真正使他成为整个北美地区执法机构大家庭中著名一员的是发生在美国路易斯安那州拉斐特的那桩市南强奸案,这就是电视剧《数字追凶》中情节的真实来源。
十多年来,一名用头巾围着脸的不明身份袭击者一直在蹑手蹑足地跟踪小镇上的妇女,并且袭击她们。1998年,被数以千计的举报信息以及相应数目嫌疑人困扰着的警察邀请罗斯莫来帮忙。罗斯莫分析犯罪地点数据,并制成了一幅类似于《数字追凶》中查利所显示的地图,上面用有颜色的地带来标明热区以及它的更热也就是更可能的内圈。这幅地图使得警察能够把搜索范围缩小到半平方英里(约合1.3平方千米)、约十多名嫌疑犯中间,最后抓到了罪犯,而罗斯莫则迅速成为犯罪侦查圈内的著名人物。
罗斯莫公式的解释
最后,让我们来更仔细地看一下那个由罗斯莫发明,在《数字追凶》中被查利写下的公式:
为了理解此公式的意义,我们先要重温中学数学中解析几何的基础知识。解析几何的最基本设计就是设置一个由x轴和y轴构成的直角坐标系,每个xi和yj值构成了坐标系中的一个点,表达为(xi,yj)。比如方程 x2+y2=9在坐标系中就是一个由一系列点构成的圆,圆心在坐标系的原点,圆的直径为3。
现在我们用一张坐标方格纸来画刚才所说的坐标系,此时每个点就相当于一个坐标小方格。我们把一张透明的坐标方格纸叠放在地图上,用两个数字“i”和“j”来确定每一个小方格的位置:一个表明它在第几行,另一个表明它在第几列;等式的左边是杀手的住所在此小方格里的概率pij,右边表示如何计算这个概率。
我们把已经知道的犯罪地点由地图上的坐标来表示,(xi,yi)表示第一次犯罪的地点,(x2,y2)表示第二次犯罪的地点,依此类推。这个公式是说:
要计算在第“i”行、第“j”列的坐标方格中的概率pij,首先要计算从此坐标方格的中心(xi,yj)到每一犯罪地点(xn,yn)你必须要走多远。这里的下标n代表任一犯罪地点——n=1是指第一个犯罪地点,n=2指第二个犯罪地点,依此类推。必须要走多远这个问题的答案是:
| xi — xn | + | yj — yn |,
公式中有两个地方要用到此答案。
从左至右来看这个公式,它由两个分式组成。左边的分式,是把距离放在分母上,分子是。距离的幂次为f,幂次f的数值的选取如下:用过去犯罪模式的数据去检验此公式时,符合得最好的那个f值。这个公式的这一部分表达了如下思想:当处在缓冲区外时,犯罪地点的概率随距离的增大而减小。
右边的分式是概率公式中用到的缓冲区里每次犯罪“行走距离”的概念。在右边的分式中,用2B减去距离,B是选来描述缓冲区大小的一个数,并在此式中使用减得的结果。当距离增加时,公式第二项的分母上由减法给出的结果愈小,用另一幂次g加大了这个结果后,第二项的值就愈大。
这个公式的两个分式结合起来就起了一种“平衡作用”,表达了下面这一分析:当离开罪犯据点向外移动时,犯罪的概率先是增大(当通过缓冲区移动时),然后是减小。用优美的数学符号“+”把此公式的这两部分结合起来,希腊字母表示“对每一次犯罪的贡献求和,就给出了第‘ij个坐标方格中的概率的值。”两项中都出现,它是被用来增加这项或那项的“权重”的。的值选得愈大,“概率随距离的增大而减小”的现象的权重也就愈大,反之较小的值则是强调缓冲区的效应。当用这个公式来计算(当然用计算机来进行)所有坐标小方格的概率pij,制作一张热区地图就很容易了:你只要把小方格涂上颜色就行了,概率最大的涂黄色、稍小一些的涂橙色、然后是红色,如此,概率最小的留下不
涂色。
(本文材料主要取自《数学缉凶》一书,上海科技教育出版社2011年第1版)