大数据驱动的侦查思维创新与实践逻辑
2023-05-22倪春乐王泊勋
倪春乐,王泊勋
(西南政法大学,重庆 401120)
习近平总书记在2019 年全国公安工作会议上提出坚持“政治建警”“改革强警”“科技兴警”“从严治警”十六字方针。其中“科技兴警”强调,“应将大数据作为全面推进公安工作质变的动力”[1],即以大数据维护大数据时代的社会秩序,为平安中国的建设保驾护航。
存在决定意识和思维,而思维又指导着实践,数据社会的存在决定数据思维的产生,数据思维又反哺于人类的社会实践。随着大数据、人工智能等产业的发展完善与应用普及,区块链、人工智能、远程操控、共享屏幕等新技术新业态不断成为犯罪形态迭代、犯罪手法更新的技术驱动[2]。犯罪方式和态势发生深刻变化,故而,侦查工作及侦查思维也必须借助新型的基于数据的外部赋能,不断朝着人与数据、人与机器高度融合的方向演进。思维是实践的先导、行为的指南,大数据带来社会生活和犯罪生态的数据化变革,在此背景下,任何侦查思维的墨守成规皆可能强化认知主体与客体间的“代差”。一方面,侦查在与犯罪的博弈中凸显其“先天不足”,传统的基于个体认知经验的侦查思维在数据犯罪背景下已不断暴露出其局限与“无力”;另一方面,大数据内含事物相关关系的无限延伸,为思维创新提供基础与动能。侦查主体应立足对数据犯罪认知的整体性反思,借助大数据这一客观条件,形成对应于数据犯罪的同频共振与迭代升级,不断推进侦查思维的整体革新,并创设出针对不同数据犯罪模式的思维“战法”,凭借思维创新以激发效能提升。
一、犯罪演进中的侦查思维迭代
犯罪活动和侦查活动形成动态博弈,这不仅体现在器物和工具层面,也体现在意识和思维层面。信息视角下的社会迭代使得犯罪行为人的思维和行动模式不断朝着信息化、数据化演变。数据社会催生数据犯罪,进而生发出数据思维。侦查活动及其主体思维也在这一进程中迭代演进。
(一)数据信息视角下的侦查思维迭代
于侦查全过程而言,侦查实践的展开与推进对线索及证据的汲取程度具有高度依赖性[3]。侦查工作以信息为导向,侦查认知和决策行动都以有效的犯罪信息为支撑。侦查思维本质上是一种以信息为驱动力的思维。信息样态的不同决定了侦查思维的差异。
在传统的犯罪生态中,物证是犯罪信息的主要载体,犯罪信息表现为基于犯罪现场的物品与痕迹。学界有人从信息样态驱动侦查的视角出发,将其称之为物证驱动模式[4]。物证驱动模式下的侦查活动,总体上是以侦查主体对“物证”所含信息的个体化认知和对经验信息的累积利用为基础的。个体经验具有鲜活、生动的特质,它直接驱动了个体思维在有限经验信息的基础上依靠一般性的归纳、演绎探求类比化的因果逻辑。从侦查思维角度看,可以将其视为经验驱动型的侦查思维。但鉴于个体经验本身的有限性以及经验认知存在的偏差效应,随着犯罪生态的整体迭代,基于“个体小数据”的经验思维其局限性也会日益凸显。
从信息的视角看,经验驱动型思维的局限与其说是一种思维本质所致,毋宁说是数据量及其算力所致。因为“个体经验”在侦查中驱动主体思维的不是别的,正是内含于经验之中的数据信息及其所揭示的事实关系。因此,随着信息化程度的提升,“信息化侦查”“信息导侦”“信息驱动侦查”等理念和实践应运而生。究其本质,一方面,在公安信息化条件下,除传统物证外,侦查所能倚赖的数据信息在“量级”上得以极大扩容,公安数据、政法数据、政务数据以及部分社会数据都有效地驱动着侦查活动,侦查认知得到了“数据集群”的有效支撑。另一方面,基于计算机信息技术条件,侦查工作中对犯罪数据的算力得到了显著提升。在集群数据融通的前提下,数据碰撞、数据挖掘、模糊查找、精确比对等侦查技术手段得以实现,有效推动侦查工作朝着线上线下贯通的方向演进。在此背景下,信息化侦查改变了“个体经验主义”的局限,侦查思维和侦查取证建立在更加客观、科学的基础之上。但也应当看到,信息化侦查仍然立足于“有限”的数据,且数据库间存在无法避免的数据孤岛效应,这在某种程度上限制了侦查思维和实践效能最大限度地释放。
物的数据化为人类创造了数据化的平行世界,这使得“一切皆数据”“一切皆可运算”成为可能。所谓“大数据”其终极意义是指“全量数据”,在此条件下,事物关系及其内在逻辑皆可通过数据相关性得以揭示和证实。从思维属性看,大数据思维是一种将因果逻辑推演至相关关系,又进而回归因果关系的数据计算思维。它突破了人作为认知主体对数据信息的存储量局限和运算局限,使人的思维得以向事物的底层逻辑发掘和运用。侦查工作的本质是对事物因果逻辑的认知,大数据无疑在客观上驱动着侦查思维的转型。个体经验、信息(小数据)和大数据作为思维的驱动力,其最根本的差异在于数据量级和数据的可运算性两大前提,大数据驱动的侦查思维需要以全量数据为基础,将生动的犯罪事实所衍生的客观信息转变为可流通、可运算、可关联的标准数据,进而发现内涵的因果逻辑。
(二)数据犯罪背景下侦查思维革新的必要性
伴随数据社会更迭,作为特殊社会现象的犯罪活动向数据犯罪接踵,数据成为犯罪新媒介的同时亦成为犯罪新目标[5]。截至2021 年底,我国网民规模已超过10 亿,其普及率高达73%[6]。与此同时,以互联网为主要载体与媒介的数据犯罪持续高发,推动我国刑事犯罪体系质变,致使犯罪态势步入以“新型网络犯罪”为主的数据犯罪新生态。自党的十八大以来,我国公安机关共计办理网络犯罪案件已超过50 万[7]。在此态势下,我国公安机关也将始终对网络犯罪分子斗智斗勇,并不断调整策略以始终掌握主动权[8]。2022 年“全国两会”上,《最高人民检察院工作报告》明确,“将持续加大惩治网络犯罪力度,从严惩治网络诽谤、侵犯公民个人信息、电信网络诈骗等犯罪”[9];《最高人民法院工作报告》也指出,全国法院“将严惩网络犯罪,并继续保持对电信网络诈骗犯罪的高压态势”[10]。这充分说明,未来我国“公、检、法”三机关将以打击治理新型网络犯罪为主要工作抓手之一,更好维护人民利益。
拥有以数据为载体和媒介的生态给犯罪活动带来全新的条件和便利,犯罪活动的活跃性、危害性增强,类型更新等持续加快[11],使公安机关和人民群众遭遇“打不胜打、防不胜防”的境地。犯罪与侦查的对抗博弈不断升级,侦查工作面临全新的挑战。
1.犯罪活动虚拟化导致犯罪主体的对应认证困难
查缉犯罪嫌疑人是侦查环节不可或缺的任务,而其又以“揭秘”犯罪主体为前提。正因如此,无论是“一摸二排三审查”的“三板斧式侦查思维”还是“定性定向定人”的“三定法侦查思维”[12],其终究还是要“定脸谱”使犯罪行为能与之对应。在传统犯罪生态,犯罪现场遗留的痕迹、物证能以直接或间接的方式与犯罪主体同一认定,且承载着“犯罪片段”的见证人记忆也能使得犯罪行为与犯罪主体相对应。总体上,对犯罪主体的对应性认证在传统犯罪生态中拥有充足的“现实认证条件”。
但数据犯罪新生态中,犯罪空间增添了跨时空的转换环节,单一的“线下空间”拓展为“线上线下”的交互过程。犯罪活动的虚拟化意味着这种非接触式犯罪其犯罪主体的流动性更强。因此,面对数据犯罪时,虚拟身份与真实身份之间、“虚拟行为”与“真实行为”间的同一转换成为侦查推进的极大阻碍。显然,从客观痕迹、见证人出发的传统侦查思维在此类犯罪中显得“心有余而力不足”。于犯罪角度而言,虚拟网络平台赋予犯罪主体虚拟性与隐匿性的双重伪装,为侦查过程中对犯罪主体进行对应性认证增添了“虚拟认证阻碍”。
2.涉案数据海量化导致犯罪过程的精准还原困难
侦查工作的一项基本任务便是查清并证实所有的案件构成要素,因此侦查工作的开展往往聚焦于犯罪构成要素,但与此同时,案件构成要素决定侦查实践的具体展开[13]。传统犯罪生态的案件构成要素中,无论是寻找案件已知要素还是探索案件未知要素,涉案要素往往离不开传统的犯罪现场、犯罪痕迹、犯罪工具以及相关知情人,因此,相关的侦查活动便主要围绕诸如此类的涉案要素即可明确案件核心事实,足以支撑定分止争的“事实”要求。
在大数据环境下,犯罪事实会随着大数据的关联延伸发生“弥散”效应,即以核心事实为中心,依据相关度由强到弱向外无限延展。因此可以说,大数据拓展了涉案要素的范围与数量,使数据犯罪具有了涉案要素海量化的特征。尽管从某种角度看,这也给案件侦查工作提供了多源的线索信息指向,但也容易使以数据为导向的取证工作陷入大量“无效信息”或“信噪”的干扰和误导中,给精准查证和还原案件全貌带来困难。
3.犯罪证据数据化导致案件侦查的多源取证困难
侦查工作不仅要“查明案情”,还要在此基础上“证明事实”[14]。以程序为视域,侦查活动的展开服务于诉讼环节,而为达到刑事诉讼对证据真实性、合法性、关联性三方面的要求,“证明事实”的侦查活动依靠对证据链的构建与完善。在传统犯罪生态中,主要的、关键的犯罪信息蕴藏于犯罪中心现场的物质载体上。因证据与线索主要以实体化的方式呈现,在物质交换思维指导下即可完成线索与证据的发掘,侦查多源取证的范围也围绕着犯罪现场开展,从中心犯罪现场的人和物逐渐放大至关联犯罪现场。
而数据犯罪则意味着侦查过程中有待查证的线索或证据也主要以数据的形式呈现,线索及证据的数据化意味着侦查取证工作的数据化转型。然而,一方面,数据犯罪中犯罪空间去中心化的特征与以犯罪现场为中心的传统侦查思维形成矛盾,传统意义的犯罪现场并不总是伴随犯罪产生,新型的数据犯罪现场又总是碎片化浮现,侦查取证终又回到涉案数据海量化的难题;另一方面,数据犯罪中犯罪主体与犯罪行为间的“虚拟认定”部分与传统侦查思维中“触物留痕”的思维又大相径庭。相比于传统的“物物交换”,鉴于数据犯罪大部分由“虚拟行为”导致危害结果,因此还需使“虚拟行为”与“现实行为”、虚拟主体与现实主体间相互呼应。比如新型网络犯罪多有涉众型特点,要完整准确查明和证明案件,除了从网络角度进行数据证据获取外,还需要结合线下手段,针对被害人、证人等收集人证,甚至需要针对不同线下“现场”如犯罪窝点开展勘验或搜查取证工作。面对新形态的犯罪和多源头的证据信息,侦查工作面广量大,容易导致多源取证重点把握不准,取证实效不强的状况。
二、数据犯罪背景下经验驱动型侦查思维的价值与局限
传统犯罪生态中,经验累积、经验主义成为侦查主体不可或缺的“重要侦查指导”。但在数据犯罪生态中,鉴于“经验”本身的局限性,仅凭其“一己之力”无法实现对新形态犯罪侦查工作的有效指导。大数据背景下,侦查思维的数据型迭代势在必行,然而新事物的产生建立在旧事物的基础之上,侦查思维迭代亦是一个继承与发展的过程,因此需厘清其路径表达以及在此背景下的价值与局限。
(一)经验驱动型侦查思维的实践路径
通过对经验驱动型侦查思维的路径解析,发现其是以侦查主体总“知识库”为基础,通过“认知链”纽带维系整个案件的认知碎片以达到“螺旋式上升”的侦查认识水平,再凭借“整合论”在多项事实解释可能性中寻找最优解,最终以证实案件的因果必然性。
1.以侦查主体“经验库”为基础
认识路径中客观存在的物质世界并不具有唯一性,认识是属主观的[15]。侦查案件的主观认识中,侦查主体以某一客观事实为逻辑起点,一方面沿着某一假设或可能指向汇聚集中,另一方面朝外发散四射,是认知要素不断累积的过程。而欲厘清案件概貌,不仅依靠对客观事实认识水平的不断提升,侦查主体长期以往的刑事办案经验对认识要素的加工再造同样是拓展认识要素的重要源泉。侦查主体将所有获得的侦查认识要素与自身“经验库”进行交换与加工,所以案件认识要素本质是客观事实与主观认识融合物,是“客观认识的加工”和“加工后的再认识”充分结合的产物。侦查认识活动是关于案件的自我认识活动,这种自我认识由个体经验推动前进[16]。然而经验储备库又决定侦查认识要素的产出量以及有效认识要素的保留量,因此,经验是这种传统侦查思维的基础,灵感思维成为其思维导向,是认识指导实践的直接体现。
2.以线索证据“认知拱”为纽带
侦查思维是在法律背景下“产生新的想法和证据”的过程,这个过程是以客观认识、假设分析和事实解释三个环节组成的“认知拱”[17]。“认知拱”是在调查和获取潜在的现象和证据后,摸索确实的解释或假设,再在所有可能性中得到最佳解释的认知过程。每一“认知拱”背后都有所对应的事实解释,将单一“认知拱”串联为“认知链”的过程其实就是案件真相的拼凑过程。由于犯罪过程存在阶段性的分化,将这些局部分化的认识要素拼接成连贯的事实逻辑的过程,也是侦查主体在众多存在可能性的事实解释中逐渐分析得到最佳解释的过程。因此,在以线索和证据为信息基础的“认知拱”的纽带递送作用下,侦查主体对案件的思维指导形成“认识—分析—再认识—再分析”曲折上升的实践过程,是一种“螺旋式上升”思维认识。
3.以研判分析“整合论”为推进
将感性认识化为理性认识的过程中,除有效的认识论外还需科学的方法论[18],以科学的整合方法将所有认识要素所递送的逻辑信息偏差校正。单项整合中,由于“认知拱”传递的事实解释并不是单一指向性的,因此需要对各种可能性研判分析,并通过某一基础要素“合并同类项”;综合整合是在个别分析的基础上,通过排查“认知链”与“认知拱”,“认知链”与其他“认知链”的事实解释的冲突对立,得到可能性最大的最优解释。如对证据或线索A、B、C、D 分别可以得到A1(A2、A3……)、B1、C1、D1……等多项单一的事实解释,通过从整体案件事实的角度综合整合,在“合并同类项”“化简递推”“排除其他解释”等思维实践过程后,终得符合案件事实的因果关系。
图1 经验驱动型侦查思维路径表达图
(二)大数据背景下经验驱动型侦查思维的价值
经验驱动型侦查思维的价值在于经验主义、经验积累后对侦查主体产生的能动性,即使数据犯罪背景下强调数据化的侦查与数据化的分析,然而侦查决策始终是一个需要主观判断的过程。换言之,侦查过程离不开侦查主体的经验价值。大数据背景下,经验驱动型侦查思维主要表现出以下价值。
1.为数据犯罪的侦查提供因果逻辑的底层框架
整体来看,犯罪活动是一个因果性行为。在传统犯罪生态中,这种因果性行为能够通过痕迹物证等线索与证据直截了当反映出来。因此,经验驱动型侦查思维在侦查逻辑上强调犯罪行为与结果间的因果关系,进而形成因果关系的侦查逻辑思维。大数据的发展拓宽了犯罪信息的逻辑转换,原本直观的因果关系转变为相关关系[19]。而异构关系、同位关系等相关关系在本质上仍未脱离因果关系的底层框架,如“从A 到B”的因果过程变为“从A 到非C 到似B……到B”,其终究仍是“从A 到B”。因此,经验驱动型侦查思维的逻辑定势为数据犯罪侦查提供了因果逻辑的大框架,数据犯罪仍是一个由前因导致后果,从行为到结果的犯罪过程。
2.为数据生态下的证据体系构建提供主体性引导
为证实犯罪,侦查阶段需要构建完善的证据体系,侦查取证行为便围绕着犯罪构成要件开展。传统犯罪生态下,侦查取证行为围绕着犯罪现场、犯罪痕迹、犯罪相关知情人等等信息源、证据源展开,进而在人①在侦查阶段主要是指侦查人员。的观念形态的“犯罪事实”的引导下构建起证据体系,以实现司法官对案件结构性要素的认识。人的观念形态的犯罪事实来自实体法关于“特定犯罪”构成要件的认识,因此,不论是面对传统犯罪,运用经验驱动型侦查思维,抑或是面对新型网络犯罪等数据犯罪运用数据思维,归根结底都离不开认知主体关于“何谓犯罪”“何以证明犯罪”这些本源性问题的回答。继而,在侦查主体的指引下,完成案件事实的查明和证据体系的构建。离开了人作为主体的指引,离开了以经验为表征的观念事实,面对海量数据,侦查取证及其证据体系构建就可能失去方向,陷入就数据论数据的无限循环中。
3.“犯罪—侦查”的对抗博弈提供侦查主体的能动反应
“兵无常势,水无常形,能因变化而取胜者,谓之神”,思维应“活”,侦查思维亦需“活”用。无论犯罪如何演进,自始至终存在着犯罪与侦查间的动态博弈,包括谋略远见、心理素质以及思维水平。传统犯罪生态中,业已存在的侦防博弈促使侦查主体培养出挖掘客观事物与犯罪的多方联系、探究某种结果的多方原因、调查重点对象的多方路径等等主动、能动的侦查拓展,做到“从一到多”“因案而思”。数据犯罪生态下,侦查能动性同样不可或缺。尽管在表现结果上数据犯罪与传统犯罪之间存在极大反差,然而二者终无法逃离犯罪的窠臼。侦查主体依然能根据灵活、跳跃、偶发的灵感思维对数据犯罪作出能动的基于经验的侦查反应。
(三)大数据背景下经验驱动型侦查思维的应用局限
经验驱动型侦查思维的价值来源于侦查主体经验主义下的主观能动性,但是这种灵感导向思维同时会造成思维的实践掣肘。侦查活动的开展是环环相扣的,因此,侦查主体由经验驱动所产生的相关认知偏见亦贯穿于侦查活动始终,影响每一项侦查决策[20]。在社会更迭视角下,大数据社会的经验驱动型侦查思维主要表现为两方面的应用局限。
1.路径依赖
经验驱动强调的是发挥侦查灵感思维的作用,久而久之,以侦查主体“经验库”为基础的经验思维在侦查实践中形成特定的思维路径,其无法适应大数据时代犯罪各要素的变化,尤其表现为犯罪空间与犯罪行为质变后的无法有效适用。
一方面,以勘查犯罪现场为源点的经验思维无法适应互联网背景下去中心化的犯罪形态。“三定侦查法”“刑事侦查三板斧”等融会贯通的侦查方法,其前提条件皆为物理犯罪现场,即侦查主体对物理犯罪现场存在高度依赖性。然而大数据背景下的犯罪案件中却不一定存在物理犯罪现实甚至不一定存在犯罪现场。
另一方面,以查证犯罪行为为目标的经验思维无法利用互联网背景下生活行为与犯罪行为的串并关联。由于信息匮乏等客观原因,以从案到人为主的侦查思维在侦查实践中被人为简化成从犯罪行为到人[14],逐渐培养出对犯罪行为的依赖性。然而,犯罪行为人在犯罪预备阶段的行为表现通常是一种生活行为,且其具有的反侦查意识会贯穿犯罪全过程。但在大数据环境中,物的数据化结果却能够通过数据痕迹镜像地反映出承接犯罪生活行为的动态特征,然而却无法有效利用。
2.思维定式
思维定式是侦查主体在侦查过程中的一种经验性选择,在侦查路径的分叉口,大量刑事侦查的结果皆指向同一分支,因此在侦查思维层面也会人为地选择相同的形式。经验驱动型侦查思维的思维定式尤其表现在逻辑与认知两方面。
逻辑层面中,大数据间存在多类数理关系与形成因果关系的思维定式产生矛盾。由于传统侦查与小数据背景下的犯罪生态并不同于大数据时代下分化成各种复杂的表现形式,以因果关系理论为逻辑原理的经验驱动型侦查思维能指导有明显或强因果关系的犯罪侦查,但相比于犯罪大数据间多种潜在数理逻辑却显得相形见绌。虽然犯罪的逻辑亦是从因至果,相比于从行为直接到结果的传统犯罪表现,大数据背景下犯罪线上与线下的表现以及犯罪各阶段犯罪数据碎片化的分布,诸如“行为—物证—数据—数据变形—结果”,其间的要素分化不仅严重削弱了犯罪各要素之间的因果联系,同时还表现出其他不同形式的逻辑形式,如异构关系、序列关系等,大数据中的数理逻辑关系内涵更丰富。
认知层面中,大数据蕴含所有事实的全数据与形成认知困境的思维定式产生矛盾。侦查主体分析研判的结果是其认知水平高低所决定的,侦查主体在认识犯罪信息片段的前提下开展侦查工作,且不会超出“未知”范围[21]。而经验驱动型侦查思维建立在侦查主体“经验库”的基础上,因此认知的范围由其“经验库”的容量来决定。故而,基于经验主义的引导,侦查主体会产生“想当然”的认知困境,包括有罪推定、先入为主与过分自信等认知偏差[22],但在大数据环境下其最大的矛盾是诸如“隧道视野”与“锚定效应”等认知局限。置身于大数据环境,每项数据都蕴含着有待挖掘的价值,面对海量的数据时,尽管因为数据间的弱因果联系使得以因果关系为理论的侦查路径行之受阻造成短暂的认知停滞,然而在全数据的海洋里,其实从任一角度“定锚”皆可得出同一结果。因此认知困境的思维定式不仅可能造成侦查僵局,还有可能造成侦查方向的根源性错误从而使侦查主体“知难而退”。
三、大数据驱动型侦查思维实践路径及样态
大数据不仅推动犯罪革新,同时也驱动侦查思维的创新——以数据为中心的大数据驱动型侦查思维。从过程而言,侦查思维的大数据型创新,不仅涵盖对经验驱动型侦查思维的扬弃,还有对大数据思维、大数据技术实践与大数据科学理论的有机结合。其将数理逻辑赋能于侦查逻辑中,展现出侦查思维的新样态,为侦查实践提供新指引。
(一)数据驱动型侦查思维的实践路径
思维以实践为落脚点。侦查实践是一个连贯的过程,不论是在传统背景下还是在数据生态下,侦查活动和侦查人员都不会刻意用“思维”类型去机械地套用。然而,从理论研究角度看,类型化是一种有效的分析工具或分析方法,在对数据驱动的侦查思维的研究中,我们有必要对连贯的侦查实践做出一个以“思维”流程为观察坐标的剖析。
1.以物的数据化及“全量”数据为基础
数据驱动型侦查思维突破传统意义犯罪时空的局限,以“全量”数据为基础驱动侦查思维与实践。数据时代,数据成了一切的存在形式。物与数据的对应转化及数据自身独有的运动方式,应当成为我们新的认识论原理。传统犯罪数据化及新型数据犯罪的蔓延和深化,使得数据日益取代传统的“痕迹”“物品”甚至人的记忆,成为认识案件的基础。数据的连贯性能使侦查人员得以追溯“案前”和推演“案后”,“触物留痕”的条件局限也被数据的无死角捕捉所打破,物质交换演化成了数据的无损交互甚至在交互中产生更多的数据融合效应。如此种种,都为数据思维的勃发及其引导下的数据侦查的丰富发展提供了坚实的基础。
2.以全景视域下的数据关联为纽带
信息关联是因果回溯性认知的逻辑基础。而在大数据背景下,案件信息更多地表现为无限关联且可流动、可运算的数据。相较于传统案件侦查而言,其优势在于对数据信息关联关系发掘的全景视域和无限拓展。因此,在应然状态下,对数据犯罪的侦查过程是一个以基础数据为源点的,没有认知断点的溯源过程。在实然层面,侦查人员要做的就是从海量数据中梳理出与基础数据或源点数据相关、关联性强的数据,并从各个方向整合这些数据,最终绘就一幅数据事实全景图。尽管面对数据犯罪,沉浸在数据海洋中,要实现有效发掘、清洗、整合进而构建数据事实也绝非易事,但这一思维主线是清晰的,其思维方法也是数据犯罪的特点所决定的。
3.由数据事实到诉讼事实的回归
诚如前文所述,侦查和司法活动的落脚点是证明事实,不论该事实是以何种信息载体为主。传统案件中,证据事实的构建或还原以物理形态的证据或证据载体为主,物证、书证等的直观性,人证作为直接证据的串联性,都有助于司法人员(包括侦查人员)认识、接受由证据信息构建的诉讼事实,进而也就拥有了说服力和可验证性。对数据犯罪侦查而言,侦查思维的落脚点也必须跳出“数据循证”的认知圈,要在数据证据和数据事实的基础上,融合“物理证据”和“物理事实”,强化“虚”“实”证据的补强印证,夯实诉讼事实认证的基础,提升事实认知的可接受度。
(二)大数据驱动侦查思维的逻辑拓展
运动包括宇宙中发生的一切变化和过程,从单纯的位移直到思维[23],而新旧事物的变化规律又为思维运动提供指引。大数据为侦查思维的逻辑拓展提供了条件和动力[24],大数据驱动下的思维运动其广度、深度、精准度等在“经验”的基础上得以深化。
1.以因果逻辑为核心,向相关关系的思维拓展
经验驱动型侦查思维中,侦查主体对因果必然性的“执着追求”在方法上却形成了认知路径的思维定式,进而是侦查工作无法有效依托事物的普遍关联这一基本哲学原理,主动挖掘和利用与“因果事实”关联的多样信息。
大数据具有弥散性,它使得侦查主体有可能、有条件立足弥散于海量数据中的相关性数据反向还原核心事实[25]。因此,大数据背景下,侦查思维得以跳出“经验形态的完整事实”向“无限”的相关关系逻辑拓展。一方面,侦查主体可以依托因果性拓展的相关性,通过监测对应的关联要素分析现象,查证关联信息内含的因果逻辑事实;另一方面,通过数据量化形成的以数理关系为表征的事实关系,拓展到非线性的相关关系,进而通过关联要素的拓展回溯因果事实。
2.侦查思维的场域由现实空间向虚拟现场延伸
传统侦查经验主要基于侦查主体对以现实空间为主的传统犯罪的知识累积,经验驱动型侦查思维也主要适应于对以物理现场为载体的“有限”信息的处理和决策。相较而言,数据侦查思维是基于数据犯罪的特征,尤其是针对数据规格化、可量化、可计算性和流动性等特点,提炼出犯罪行为规律及对应的认知方法。网络空间或线上行为的独特性提供了特有的思维场域,使既有的以单一时空关系为基准的思维得以借助网络的存储性、记忆性、运算性而向跨时空的重组式思维方式转变。例如,传统经验侦查思维会得出这样的结论:特定人在特定时间只可能出现在特定空间中从事特定行为。而数据思维显然可以打破这一陈规旧律,因为特定人员可以借助虚拟地址同时从事数个网络行为。诸如此类,都只有立足数据思维才能实现对网络空间犯罪活动的认识,这种思维场域的转化恰恰也推动了侦查思维认知方式的革新。
图2 数据驱动型侦查思维的实践路径图
3.侦查思维的面向由被动向主动转变
在数据的量级层面,不论是个体(侦查员)经验还是群体(侦查机关)经验都属于有限数据,而对人类的认知而言,尽管有刑法指向的观念形态的犯罪事实为导引,但仅仅基于有限数据或碎片数据,是较难完成带有超前意味的预测性认知任务的。一方面,有限数据只能供侦查主体开展“似曾相识”的经验型比对,为其由果溯因的分析判断提供方向指引。这种思维认知无法达到事实查明和诉讼证明要求的高精准度。另一方面,经验本身的体悟性特点决定了它无法适应数据犯罪呈现出的“瞬息之变”,也就无法及时根据已有经验做出符合数据逻辑的前瞻性预判。正是由于这样的局限性,经验驱动的侦查思维更加适应被动性的侦查认知。相反,大数据思维最根本的优势在于预测,即从海量数据中揭示出事物发展的趋势或规律。对于侦查而言,从数据中把握犯罪趋势和规律,进而开展基于准确预测的主动侦查,能有效提升侦查工作的时间效度,使其在与犯罪的动态博弈中占得先机。需要指出的是,数据思维驱动下的主动侦查,并非是对侦查程序的突破,而是基于数据规律提升对未完成形态犯罪的感知力,进而提前介入,主动作为,摆脱传统意义上“跟着犯罪走”的被动态势。
(三)大数据驱动型侦查思维的实践样态
认识是思维的前提,思维是认知事物后产生的系列活动。大数据时代产生了新科学理论:物的数据化及数据镜像下的数据特征库建构,大数据作用论下的特定关系组合,大数据认识论下的事实创构[26],即数据镜像论、数据关联论、数据事实创构论。大数据科学理论为侦查活动提供新的认知机理,在侦查主体主观能动的表达下,侦查思维表现出新样态。总体而言,我们认为,鉴于大数据的特性,其推动侦查思维朝着全景式、关联拓展式和基于事实创构的迭代回溯不断演进。
1.大数据驱动下的全景性侦查
数据镜像论厘清物的数据化在虚拟世界中建立起平行于现实世界的数据镜像机理。在触物留痕的物理世界,所有行为都会以各种载体被保留下来,而大数据能将这些物理信息转化为数据信息,使得行为人的行为举止皆可在数据的海洋中找到与之对应的数据镜像[27]。
传统侦查思维对犯罪信息的思维处理模式可以形象地被认为是“样本抽取”思维,是一种碎片化、拼图式的认知过程。传统的案件侦查立足犯罪现场,根据现场中的痕迹信息由点到线,再形成事实的横向或纵向面,这是一种从点(碎片)到面(小事实)的碎片延伸与整合过程。而受限于信息获取及信息处理能力,侦查主体对案件的认识始终无法突破“小事实”的局限。
要真正地认识事物,就必须把握研究它的一切方面,一切联系和中介[28]。为查明和认识“大事实”,全景性侦查思维强调侦查主体全方位地认识与还原案件。大数据创造出一个平行于物理世界的数据世界,其拥有“样本”无限趋近于“总体”的规模。还原“大事实”的所有信息皆蕴藏于大数据中,侦查主体被赋予更开阔的侦查视野。为找准“大事实”,全景性侦查思维突破了时间一维性与空间虚实错位的局限。
从时间要素看,大数据侦查能实现以犯罪行为“实施时间”为源点的前后延伸式认知,犯罪行为“实施时间”在数据空间的反映可能仅仅是普通的数据结点,而只有综合这些“结点”前后的所有关联数据,并在数据镜像的基础上还原行为,才能完整反映案件事实全貌。
从空间要素看,其实现犯罪空间拓展的同时能够实现线上线下的交互式认知,侦查信息来源的拓展有利于提高案件还原的完整性与准确性;从案件构成要素看,其还能实现人、事、物的同步认知,从而最大限度实现对案件整体事实由相对模糊到精确的体系构建。
从认知视域看,相比于传统侦查思维从“(涉案)小事实”到“(犯罪)大事实”的马赛克式认知,全景性视域下侦查实践却是在“大事实(生活日常)”中提炼“小事实(犯罪)”。全景性侦查思维通过审视犯罪各阶段的相关行为,挖掘各行为要素数据并分析重组,在海量数据中萃取犯罪数据,在日常行为中挖掘犯罪行为,从大数据所反映出的“大事实”中提炼得到案件事实,为侦查实践提供全景性的新认知路径。
2.大数据赋能的关联拓展侦查
数据关联论揭示数据与数据、数据与数据集间关联性的逻辑关系。数据是蕴含事物客观规律的载体,事物发展的逻辑因循序渐进的发展过程而被阶段性地分化为不同类型但具有关联性的游离数据,而游离数据的关联整合又能还原事物的逻辑关系。
不可否认,经验型侦查思维同样有关联拓展的认识方法。但数据关联论指导下的关联性侦查思维与传统的关联性侦查思维存在本质差异。一方面,传统侦查思维的关联性表现为感性实在的“物理关联”,而前者却是通过数理逻辑表达,用机器运算,以实现数据模型的“计算式关联”。并且,这种“计算式关联”的是传统的针对物理世界的单域性关联继承与发展的结果,能同时为数据镜像后虚拟现实双重联动的双域性关联。在关联的大数据中,通过特征要素数理化后进行梳理演算式的关联,“物数”联系甚至“物数”“数数”间的潜在联系得以挖掘。另一方面,传统侦查思维的关联性是“强关联”前提下的因果关联,而前者却是依托“弱相关”联动的多维拓扑式关联,这种“弱相关”在大数据中以要素联动关联的形式得以直接体现。大数据的关联更为清晰、具体,从数理逻辑理解,某一数值的上升伴随相关数值的联动变化。如某地贩卖毒品发案率的变化应与该地区毒品泛滥程度、毒品价格、吸毒人数等变化率相对应,但此类“抽象关联”显然无法通过传统关联性侦查思维在实体空间中直观感受,但在大数据的多维拓扑式关联中,却能获取与所立足数据的关联数据类型、关联数据内容以及数据关联程度等具体数据信息,数据形象地反映出如此“抽象变化”。
大数据的相关性与传统因果关系的衔接,既可运用于侦查线索亦可运用于证据[29]。从侦查线索而言,认知犯罪活动的路径多维化了,不同方向、类型、程度的变量间的相关性能帮助侦查主体把握住传统侦查中易忽略的关联事物、事实[30]。其次,不是所有案件都存在明显的因果关系,甚至因果关系也无法总能被及时挖掘。从一味追求因果关系转向拓展出相关关系,产生“1+1 >2”的侦查认知路径。至于犯罪证据,证实犯罪活动的路径亦得以拓展。侦查主体可以通过对犯罪某一特征的良好关联物的数据监控,通过潜藏的同步联动关系来实现对犯罪行为的实时监控。如侦查主体通过监控“两卡犯罪”中某环节银行卡的资金流水亦可达到监控“两卡犯罪”活动频率、涉案金额等效果。并且,无论是由因推果还是以果溯因,只凭借单一的因果逻辑,由于以此为基础所延伸的方向是有限的,易造成证据链的不完善。单一思维逻辑下的侦查不仅致使侦查方向“南辕北辙”抑或陷入侦查僵局,还有发生“刑事错案”的可能性[31]。
3.事实创构下的迭代回溯侦查
数据事实创构论阐述大数据创构事实的机理,物的数据化后的虚拟空间终究要转换回由数据物化所嫁接的现实空间中[32]。事实创构为思维反哺实践,指导数据形态的事实认知向诉讼事实的认知需求转化提供了思维路径。透过数据世界的帷幕,我们可以发现数据、因素、事实之间存在隐性的因果关系,通过大数据的物化,即回到物理引导中完成在特定目标指向中挖掘因果并创构事实。
侦查认知是一种回溯性认知,而非探索性认识,它需要完成对事实查证的任务,即从碎片信息回归事实原点。这一任务决定了侦查思维本身的回溯性,即由果及因的思维范式。不可否认,对数据犯罪的认知仍是一种回溯性认知,因为侦查活动的任务没有改变,犯罪活动和侦查活动的时序关系没有改变。但由于数据犯罪的绝大部分行为都在网络空间中以数据活动形态出现,犯罪事实也更多表现为数字事实。因此,从某种意义上说,以“0”和“1”为原始形态的网络空间语言或者以数据为载体的行为内容,无法直接为司法人员所认知。传统意义上的“回溯”适用于物理形态的信息载体依据因果逻辑的反向推演,如果将这种“回溯”放到数据生态中,那么就可能出现从“数据到数据”的循环往复,而无法落地到可供司法主体(包括侦查人员)认知的“事实”。以数据为细胞的事实创构是一种“物理事实—数据—数据事实—诉讼事实”的反向事实构建,它是立足于数据犯罪赖以存在的数据生态特征,将平行数据世界与现实诉讼事实有效衔接的思维方法。以利用虚拟货币实施传销或诈骗等犯罪为例,虚拟货币的形成需要犯罪嫌疑人通过线上线下的行为搭建“制造”虚拟货币的平台载体,尽管虚拟货币本身表现为“一串数字”,但其中内含了基于共识机制的网络交互行为。围绕“虚拟货币”又会产生网上交易数据、钱包数据以及与之对应的资金流转数据、通讯信息流数据等。根据这些数据的性质和内容,侦查人员可在“传销”“诈骗”等观念形态事实的指引下完成数据事实的构建,进而结合物理形态信息,如线下公司、嫌疑人群、广告引流等回溯到一个在诉讼框架内可为人认知的证据事实。当然,对此类证据事实的证明必定需要借助特定的大数据证据方法,才能使认识主体得以跳出数据海洋,看清事实面貌,完成诉讼任务。
4.多维联动下的算法型侦查
在计算机领域,算法能在大量输入(input)中找到符合指令的输出(output),这与侦查中对挖掘与解析有效信息的要求相契合。总体而言,算法是在数据环境下解决问题的实践机制,对于数据犯罪侦查而言,更需通过算法明确数据运行规律,进而建立起以数据为载体的思维和实践模型,推动侦查的算法实践或算法型侦查落地。在传统的经验驱动型侦查思维指导下,侦查认知和取证实践与案件事实的契合及相互印证,更像是一种“幸运的概率”[33],尽管也有客观依据的支撑,但总体上无法达到数学科学所涵摄的精确、精准。诚然,大数据背景下,数据承载犯罪信息、数据主导侦查工作,侦查实践中开辟出数据化新路径[34],在大数据机理、大数据科学与大数据技术等多维联动作用下,经验的“幸运概率”在计算机语言的表达下得以有效转化为“可计算的概率”。查明事实在某种形式上转变为数据运算及验证其结果,算法型侦查不仅提高了认知效率,也降低了试错成本。
算法型侦查并非完全独立的侦查模式。以算法与侦查思维的深度融合为前提,算法型侦查能产生将侦查思维的过程与结果以具体化与可视化表达的效能。以构建犯罪期望效用函数为例,期望效用函数理论用以描述“理性人”在风险条件下的决策行为,其函数公式表达为U(X)= E[u(X)]= P1u(x1)+ P2u(x2)+……+ Pnu(xn)。①随机变量X 以概率Pi 取值xi,i=1,2,……,n,u(xi)为单一随机变量xi 的效用值。该公式中,效用值u(x)与每项活动收益间的函数关系用以分析决策者的风险态度。此外,其包含的最大效用原理,即在风险和不确定条件下,个人的决策行为准则是为获得最大期待效用值而非最大期望数值,对构建犯罪期待效用函数具有重要的指导意义。若将犯罪嫌疑人视为“理性人”,在理想条件下,以该函数为基础的侦查思维应发挥出预测犯罪行为决策的效能,即通过融合该函数理论与侦查学理论,分析犯罪嫌疑人在风险和不确定条件下的犯罪决策行为。然而,诚如学界对该函数的质疑,人并非纯粹的理性人,犯罪嫌疑人以及相关行为人亦是如此。此外,侦查视角下的行为环境也绝非总是以风险和不确定条件为前提。因此,算法型侦查实则具有两方面内涵,是一种虚实结合的侦查实践样态。一方面,算法型侦查要求侦查人员从数据规律的视角看待犯罪行为,即将对犯罪规律的认知从实然空间的实在行为转化到虚拟空间的数据形态,进而总结出一套针对数据犯罪的分析方法和技战法。比如在传统案件的实在状态下,我们可以根据犯罪嫌疑人在案前的活动揭示其踩点的规律进而判断其对犯罪目标的选择;而在对诸如电信网络诈骗等数据犯罪的认知中,我们可以通过犯罪嫌疑人突然启用“僵尸银行卡”并完成“1 元转账”的试探行为来判断犯罪资金转移的行为规律。②以电信网络诈骗为代表的侵财类数据犯罪中,犯罪行为人手中通常会准备大量银行卡,这部分银行卡平时一般处于已激活但不活跃状态(僵尸状态),而一旦犯罪嫌疑人准备使用大量银行卡进行短时间内转账时,为确认银行卡是否有效,他会通过“1 元转账”的方式进行验证。另一方面,它要求侦查人员能在有效衔接、融合线上线下侦查活动与认知,将传统的“案件刻画”与对数据犯罪的“数据画像”统一起来,构建融通的算法模型。
算法是基于行为规律的“数据化”规律延伸,是以物的数据化为基础的思维数据化和行为数据化的基础。算法表达的规律与以实在物或行为为表征的规律有其一致的本质,但又有不同的方式。算法型侦查是在对数据犯罪行为的规律性认知基础上的数据查证,是数据思维的侦查实践,它需要运用线上线下结合的融合思维,也需要理解和掌握不同的“物的数据化”的内在逻辑,进而实现思维的多元联动。
结语:强化经验与数据对侦查思维的融合驱动
正确的认识是认识性思维与认识性实践共同作用的结果[35]。侦查思维指导侦查实践,正确的侦查认知离不开侦查思维的选择与运用。面对新形势下犯罪数据化特征的日益凸显,侦查工作必须在数据思维的指引下以快制快、以网覆网,凭借算法对抗算法,从数据中来到数据中去[36]。经验是主体在反复的实践活动中基于体验性认知积累的有效知识,对于侦查活动而言,经验有助于简化复杂认知,使思维和行动朝着“过往正确”的方向和捷径推进。从某种角度讲,犯罪本身也是一种经验性活动,因此,经验认知、经验思维不论是在应对传统犯罪类型抑或是侦查打击新型数据犯罪时,都不会失去“用武之地”。当然,对数据行为的认知以及在此基础上积累的数据经验和孕育萌生的数据思维方法必然会与传统型经验认知和思维有所差异,这就要求我们从数据犯罪和数据侦查的博弈型实践中不断总结经验,淬炼新的思维方法和思维模式,以更好地指导数据生态下的犯罪侦查。
思维是人类认识世界的独特工具,指导人类社会具体的实践过程;实践的能动性又推动思维焕发新活力,是思维推陈出新的源泉。社会正向“智治”迈进,侦查也需不断吸收数据、算法等生产要素,进而激发出新的生产力。侦查思维需要在数据化实践中不断创新,使数据真正成为思维创新的不竭动力。当然,大数据驱动的侦查思维与经验驱动的侦查思维具有优势互补,协同发挥作用的空间。唯有在实践上的思维创新和创新思维下的生动侦查实践的有效融合,才能使侦查在与不论何种形态的犯罪斗争中立于不败之地。