APP下载

大数据证据之可行性研究

2019-02-19徐惠李晓东

山东警察学院学报 2019年6期
关键词:因果关系证据案件

徐惠,李晓东

(中南财经政法大学刑事司法学院,湖北 武汉 430070)

在大数据时代背景下,有学者提出“一切皆可量化”[1]的观点,人们在大数据中发现未知习惯、规律甚至能够在数据空间还原一个更加真实的自己。大数据作为一种技术、思维和方法逐步应用到人们日常生活的方方面面。在此过程中,人们运用海量数据进行分析,进一步挖掘数据价值,谁都难以预料到下一步数据将会如何被利用、被发掘。人们越来越关注“是什么”,而忽视“为什么”,越来越注重“相关性”,而忽视“因果性”。同时,数据的挖掘和分析可以进一步预测人们的行为,为预防犯罪的发生提供一种可能性。在当前司法实践中,大数据作为一种证据更为广泛地出现在庭审过程中。通过检索发现,大数据证据多被表述为“大数据检测技术”、“大数据分析”、“车辆轨迹分析”、“大数据搜索(查询)”、“大数据比对”、“鉴定意见”等,还有某些案件判决书中并没有对大数据进行表述,只是展示利用大数据分析所得出的相关结论。大数据证据的混乱表述直接证明大数据在法定证据种类中的定位远未明确。因此,大数据作为一种有极大应用价值的方法能否应用到证据领域,形成大数据证据这一新的证据类型,进而为犯罪预防和侦破犯罪案件提供一定程度的支持是本文所力求解决的核心问题。

一、大数据证据之独立证据种类分析

大数据的应用对传统的证据种类、证据规则造成了一定的冲击,出现了一些新情景、新问题。当前大数据证据的提出源于大数据技术的兴起,是建立在区别于传统“小数据”、“全数据”基础之上的。2016年出台的《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(以下简称《规定》)中,对电子数据的定义和分类、电子数据的收集、提取以及移送、展示等内容作了较为详细的规定。规定中明确指出了电子数据的数据性,并以之作为电子数据定义的中心语。(1)《规定》对电子数据的定义为,电子数据是案件发生过程中形成的,以数字化形式存储、处理、传输的,能够证明案件事实的数据,强调电子数据的数字化及其处理的过程,强调对数字化所形成数据的认知功用。大数据作为一种技术、思维、方法,其核心方法同样是“数字化—数据化”的过程,最终仍可能会以电子证据或鉴定意见等实体形式呈现给法庭,但是在这个过程中大数据证据并不完全等同于电子证据等证据形式。

1.大数据证据的概念

大数据证据概念的提出需要首先从语义学、内涵及外延角度进行概念界定。大数据不同于数据的概念,同时大数据证据又不同于电子数据。电子数据是指存在于虚拟空间或网络空间的具有某种特定意义或内涵的数字,既突出了其数据性又突出了其电子性。(2)刘品新教授认为,电子证据与传统证据的主要区别在于电子证据存在于不为人感知的虚拟空间、数字空间,人类必须借助某些电子设备才能予以解读,而传统证据则存在于物理空间,即便其需要借助某些工具予以认知,其本体也是存在于现实的物理世界。所谓大数据最为突出的是“大”,其中天然蕴含数据总量大(3)总量在逐步接近全数据并无限逼近。、数据类型多、进而存在着数据杂乱无章、关联度低、结构性差的特点。而大数据正因为存在于虚拟空间或网络空间才为公安机关、检察机关、监察机关侦查、调查某些案件并获取事实材料提供了无可比拟的便捷性和高效性。大数据和电子数据的共同点在于其存在的场域具有一致性,而不同点也尤为明显,在侦破和预防案件的过程中,电子数据仅仅作为一种能够证明案件事实的材料存在,而大数据不仅作为一种事实材料存在,其更大的价值性体现在作为一种思维方式、分析方法、分析技术存在,更为重要的是思维、方法、技术的理性选择对其分析结果以及数据事实材料的证据转化具有极大的影响性。大数据证据是一种兼具证明案件事实材料和分析思维、方法、技术的综合体,同时可以为预防犯罪提供一定的依据。

大数据之父舍恩伯格从证据的价值角度强调大数据是从海量数据中提取出价值和服务。[2]也有学者认为大数据就是海量的、非结构化并具有附加价值的数据。[3]2018年中国信息通信研究院发布的《大数据白皮书》从政策、技术、产业、应用等多个方面描述大数据,强调了大数据的应用价值,把大数据视为信息化发展的新阶段并作为一种国家战略。因此,本文认为大数据是一种以数据技术为引领的创造应用价值的方式、方法,其本质仍是一种方法论概念。

针对大数据证据的定义,需要有机结合“大数据”和“证据”的相关概念。本文认为,大数据证据是将大数据技术、方法、思维等方式、方法用以证明案件事实或者预测案件所得出的一切材料。对于大数据证据的外延,不仅包括最终呈现的数据材料,还应当包括关于案件的全数据,对于非结构化数据处理所采用大数据技术的说明材料,对于大数据分析方法(主要包括算法)运用合理性的说明材料,有关案件关联性、合法性、真实性的说明材料,对于案件预测结果的说明等内容的说明材料。

2.大数据证据与其他证据种类之比较界说

法定证据确认的准则在于,每种证据在其收集和认定的方法上均有区别于其他证据形态的特质。[4]大数据证据与电子证据最为相似,因此对电子数据的性质认定可以为大数据证据性质的认定提供一定的参照。对电子数据的属性认定,学界仍然众说纷纭,目前的观点包括视听资料说[5]、书证说[6]、物证说[7]、独立证据说[8]。对于大数据证据的属性首先需要明确它是借助大数据方法、技术、思维而得到的一系列与案件事实有关的材料,它所处理的关系是数据与数据之间的关系以及数据与案件事实之间的关系。在处理数据与数据之间的关系时,通过借助数据搜索、数据挖掘、数据碰撞、数据画像等方式将非结构化的数据结构化,寻找数据与数据之间的联系,进行一定关联。在这个过程中,所利用的数据之间呈现出相关、弱相关甚至无相关的关系。但是,经过一定的大数据技术处理,排除所有的虚假相关和可能引起困惑的弱相关之后,在近乎全数据的背景下,最后得到的相关性即便难以置信,其也会与案件事实有这样或那样的关系。因此,大数据方法、技术和思维指导了两个环节,一个是使得数据与数据之间结构化,另一个是将结构化的数据进行解析,形成与案件事实具有相关性的结论,而这两个过程均属于大数据证据的范畴。因此,大数据证据既包含与案件直接相关的证据,同时包含与案件事实间接相关的证据,大数据证据也因此成为一个综合体。

与大数据证据相比,电子证据更注重数据与事实的直接关联性,即通过简单的、单一的数据类型分析即可产生与案件事实相关联的关系。虽然同为对数据的应用,但是大数据证据更注重对多样化、非结构数据的分析,更关注对数据分析方法的运用,更注重对关联性的把握,更注重对未发生案件的预测,所关注的证明对象更丰富;而电子证据则更注重对单一、结构化数据的分析,更注重对数据的运用,更关注数据与案件的因果关系,更针对已经发生的案件的破获。虽然电子证据和大数据证据在呈现形式上具有一定的质性上的一致性(4)呈现形式都是依靠可认知的数据,因此虽然大数据更倾向一种方法、技术,但是其表现形式仍然需借助客观载体——数据,因此与电子数据的表现形式具有一致性。,在结构上具有一定的相似性(5)有学者将电子数据理解为原始电磁信号经过解析后的可被认知的数据,而该数据则是可以被用作证据证明案件事实的一种证据材料。因此电子证据与大数据证据所具有的“处理数据间关系以及数据与案件事实之间关系”的结构具有一定的相似性。,但电子证据是简单、结构化数据的分析,仅仅停留在大数据方法应用的最初始阶段,因此可以视为大数据证据包含电子证据。大数据证据作为一种综合性较强的证据,既需要对应用的技术、方法进行证成,又需要对数据间关系进行证成,还需要对数据结果与案件事实之间关系进行证成。在应用大数据方法进行犯罪分析、证成的过程中所形成的与犯罪事实、犯罪预测具有一定科学性、关联性和盖然性的材料进入证据领域,成为一种集物证、书证、鉴定意见等证据种类诸多特征于一体的新型证据。

有学者认为,“最好把资金大数据分析纳入司法鉴定范畴。这有利于司法实践的展开,在法律上也可以找到依据。”[9]该学者意在把大数据报告视为一种鉴定意见。无可争议的是大数据证据的核心是大数据分析报告,大数据分析报告中包含大数据分析结果、使用的算法模型以及数据的范围,大数据报告的核心在于对算法模型的分析和选择,算法模型的有效性和适用性很大程度上决定着分析结果的准确性和可采性。传统的鉴定意见大部分借助相关科学仪器以及科学知识对材料的真实性作出实质性判断(6)鉴定意见的对象既包括笔迹、痕迹、DNA等存在于物理空间的材料,又包括电子数据完整性、真实性等存在于虚拟空间的材料,均未涉及到方法论选择的鉴定。,而对于算法模型(7)算法中包括理论算法,如C4.5算法、K-means算法、朴素贝叶斯算法、最近监督分类算法、EM最大期望算法等。理论算法保证数据平台拥有自我学习、自我完善的能力。依据理论算法,结合实际案件类型则会产生更为具体的应用算法。其实,应用算法的选择是一个不断试错和纠错的过程,最终寻找到匹配度高的有效算法模型。的判断是一种对方法论的判断[10],与传统的鉴定意见在对象上具有质的差别,而且算法模型选择的有效性和适用性是依据多年来的经验或者相关数据验证得出的,因此具有一定的经验性和实验性,在一定程度上突破了科学证据的范畴。综上所述,大数据证据虽然与鉴定意见具有些许共性,但基于以上差异点,作为独立的证据种类更为妥当。

二、大数据证据的价值正当性分析

1.符合刑事司法的价值导向

有学者认为现代社会进入到了风险社会之后,经济、社会、技术和医疗结构处于高速改进过程中,社会肌体对混乱的抵抗力完全丧失,面临着越来越多的威胁其生存的由社会所制造的风险。在此观点基础上提出的预防性刑法观,将危险犯置于刑法的中心,并引起了刑法学界的持续讨论。其中所显现的通过减少、消除犯罪机会或者条件来预防犯罪理念,正在并且将来必然还会对刑法学的发展产生影响。[11]随着刑事政策从“打击犯罪”转向“预防犯罪”,证据法作为认定案件事实的依据,一定程度上应当与刑事政策相契合,以便实现整个社会对犯罪的预防控制。同时,人民警察具有预防、制止和惩治违法犯罪活动的职权。随着大数据技术在侦查部门的广泛应用,大数据侦查作为一种新型的警务模式被提出,侦查部门在很大程度上由打击犯罪向预防犯罪的终极追求目标转化。随着预防犯罪的理念在刑事政策以及侦查中被越来越广泛地应用,证据作为连接侦查和审判阶段的桥梁理应具有逐步探索预防性证据的认定标准和认定机制。大数据证据作为一种新型证据种类,符合当前刑事司法中的价值导向,能确保其在正确的方向指引下成为司法活动中的有益力量。

2.相关性作为其基础价值分析

在传统的证据三大基本属性中,最基本的属性为证据的关联性,这是证据被采纳的前提和基石。大数据证据通过对非结构化、弱相关甚至无相关数据进行结构化分析,主要运用归纳逻辑、数理逻辑以进行证成,得出人们难以发现的相关性,在这个意义上大数据证据在传统的证据理论上进行突破,相关性因此成为其核心特征。

在传统的司法证明过程中,由于获取数据手段和技术的局限性,证据获取是以“小数据”为基础,其证明规则依赖因果逻辑关系。而当前,大数据使得数据量的限制在逐步消失,通过无限接近甚至是“样本=总体”的域范围来处理数据,数据之间往往呈现“非结构化关系”、“弱相关关系”的特点。因此,大数据更注重相关性和模糊性,并不注重因果性和精确性。在实务中,大数据已经应用于侦查过程中,大数据侦查作为新兴的研究方向正在崛起[12]。大数据证据作为一种证据,关键是要解决相关性与因果性相冲突而产生的正当性问题。

在刑事证据中,旧有证明观念是建构价值无涉基础上的因果关系,其典型代表是条件因果关系说,后来相当因果关系说对条件因果关系说进行修正。相当因果关系虽以条件因果关系为基础,但解释论上的关键点在于对“相当”的解析,并呈现出与条件因果关系不同的法律判断:以一般人在日常生活中对于常见的两种现象之间所形成的因果联系观念为标准,判断行为与结果之间客观存在的必要条件联系能否成为法律上的因果关系。[13]在此基础上,相当因果关系的关键在于“相当”,即以一般的社会理性去评判因果关系,将客观盖然率引入到因果关系中,将因果关系的判断在某种程度上转化为对概率大小的判断。因此,对于因果关系的判断,既包含了对于案件事实客观性的判断,又包含了法官一定程度上的主观判断,成为客观见之于主观,同时主观又为客观所评判的综合性结构体。(8)客观见之于主观是指对于因果关系的认知,是由具有客观性的证据通过法官的逻辑、经验、科学理性对因果关系作出判断,进而反映于法官的主观映像之中。客观见之于主观是指法官所作出的因果关系判断需要接受社会公众的评判,在符合大众一般的因果关系认知时,其判断才是适当的。因果关系概念和标准的变化势必会导致法官内心确信标准的转变,进而影响到整个刑事司法过程中证明标准以及司法成本的转变。在相当因果关系概念体系下,概率从100%有所下降,人们认识因果关系成为一个盖然的关系,并可以通过相关关系进行一定的判断和衡量。美国学者通常认为优势证据意味着为真的概率大于50%,排除合理怀疑意味着为真的概率大于95%。[14]通过相关关系的强弱可以证成因果关系的强弱,这个标准需要通过法官的内心确信去判断。因此,概率为相关关系和因果关系提供了联通的桥梁,相关性与因果性的冲突问题在一定程度上得以消解掉。

3.真实性作为其最高的价值追求

真实性是证据三个基本属性中的最高价值追求。证据真实性要求证据不仅在形式上为真,而且在内容上也为真。[15]《刑事诉讼法》规定,任何证据未经法庭质证,不得作为定案依据。因此,涉及真实性的问题,必定需要经过法官的价值判断和逻辑判断的过程。人们所做的事是经过最大努力还原事实真相,但其中不可避免会存在由于主体间性所产生的认识偏差以及案件的不可还原性所产生的事实认定偏差。因此,在认定案件事实的情况下,需要将外在的证明标准与法官所形成的内心确信相统一。此时,还原案件事实的核心是理性,即通过逻辑之理性、事实之理性、科学之理性、法律之理性对证据进行判断,对案件事实进行证成。证据是一种稀缺的资源,证据短缺是人类司法的永恒规律。[16]证据的获取、案件的证成需要耗费极大的时间和成本。在不可能完全还原案件事实的情况下,借助技术、方法手段,可以在追求效益最大化的同时,最大程度地为还原案件事实提供依据。因此,大数据证据作为技术性、科学性、经验性并存的证据,在规律性总结和概率演算基础上,为具有相关性并隐藏在表象之下证据的发现提供了很大可能性,也为法官能够认识整个案件的全貌提供了可能性,一定程度上降低了司法证明的难度。

三、大数据证据的基础原理分析

1.行为规律理论

个体行为具有一定的规律性。任何犯罪行为都是在一定机制作用下形成的,各种犯罪行为既有自己的特性,又存在此类犯罪行为所具有的共性。这些共性在大数据分析方法面前是可归纳、可识别的。首先,任何犯罪的发生都有其动机形成,动机的根源在于需求的不满足。随着个体需求的欲望逐渐强化,便产生了动机,动机逐步强化为其行动意志,通过行为的方式以求满足其个体需求,因此便形成了犯罪。犯罪结果的成功与否进一步反作用于个人需求。需求是个体行为规律的形成因素之一。人类实践引起的外部环境的变化以及人所处的现实社会环境,是人产生有规律行为的又一根源。[17]犯罪分子所实施的犯罪行为是由历史环境、社会环境以及家庭环境共同塑造的。他人的犯罪行为、犯罪分子所受到的惩罚以及行为奖惩是否合理都在一定程度上影响着个体是否实施犯罪行为。个体在现实生活中不断接触甚至学习历史以及社会上的犯罪行为,其中势必会产生一定的犯罪行为规律。此观点在班杜拉的社会学习理论和哈贝马斯的行为交往理论中均有体现。每种犯罪都有一种或几种特定的行为模式,根据每种行为模式来建立特定预测模型,并将预测模型运用于对关联数据的监控中,就能够达到预测犯罪的效果。[18]刑法之所以能够诞生同样是基于犯罪行为的规律性,从犯罪过程中归纳提取出行为要素加以明晰规定。因此,基于个体行为的规律性,犯罪作为一个循序渐进的发展过程,进行预测和预警是有行为规律理论作为支撑的。

2.证明标准的差异化理论

对于已发生的案件,我们在追求案件事实本身的时候,不可能完全还原案件本身,只能尽力接近100%的真相。因此在现实证成过程中,必然涉及证明标准的问题。当法官形成内心确信,即其依据逻辑的、经验的、科学的理性认为达到了证明标准时,对案件所作出的判断即为合理。在现实中,不同的司法阶段对案件的证明标准是有差异的,不同阶段证明标准的合理化有助于我们全面认识案件,排除非法证据,认定能够作为定案依据的证据。无论是大陆法系还是英美法系,随着案件阶段的深入,不同阶段的证明标准将会越来越高,对广泛的案件材料进行排除和采纳,最终可能仅仅依靠与案件事实密切相关的法定要素证据,基本呈现一个正金字塔形状。这在美国的证据法则和证据理论中体现得非常完整[19],其将证明的程度一共分为9等。(9)9等证明标准分别为第1等是绝对确定,第2等是排除合理怀疑,第3等是清楚和有说服力的证据,第4等是优势证据,第5等是可能的原因;第6等是有理由的相信,第7等是有理由的怀疑,第8等是怀疑,第9等是无线索。由此可见,在美国开始侦查、提起公诉、作出有罪判决的标准都是不同的。[20]在审判中心主义背景下,大数据证据在与案件具有一定相关性的情况时,应当根据不同阶段证明标准的差异性不同,使其进入侦查、起诉和审判阶段。而不能一刀切,彻底否定大数据的证据作用,在事先不影响法官价值判断的情况下,依据理性对大数据证据作出正确的认定。

3.概率和博弈理论

概率本来是一个数学问题,是指在同一条件下不确定事件发生的可能性大小的比率。通过大数据技术可以获得社会中大量现象的数据,从而可以应用概率理论对数据进行分析,发现事件发生的概率。结合博弈论相关知识,进一步发现事件之间的联系。

概率论理论认为,当样本数据足够多时,样本数据中事件发生的概率接近于总体中事件发生的概率。通过大数据收集大量样本数据,利用这些数据得出事件发生的概率可以看成事件本身发生的概率。在人类社会中,不同事件之间往往是相互联系的,当一个事件发生时,会影响另一个事件的发生。通过贝叶斯公式,可以了解某个事件的发生对另一个事件发生的概率的影响。

假设事件A有a1、a2…an,n种结果,且满足三个条件:

①P(ai)>0,i=1,2…n;

②a1、a2…an之间互不相容,即ai×aj=Ø(i≠j);

③a1∪a2∪…∪an=Ω。

则对于任何一个事件B (P(B)>0),有:

上式为全概率公式,在知道事件A各种结果发生的概率以及在各种结果发生的情况下事件B发生的概率的情况下,就可以用全概率公式求出事件B发生的概率。对全概率公式进行推导,可以得到贝叶斯公式。

以上就是贝叶斯公式,可以求出在事件B发生的情况下,事件A发生aj结果的概率。若事件A和B是相互独立的,则P(aj|B)=P(aj),即事件B是否发生不影响事件A的结果。

当知道事件发生的概率以及相互间的影响后,就可以将这些概率应用于博弈分析。社会中的博弈往往是一个动态博弈,贝叶斯纳什均衡理论可以用来分析这些动态博弈。在完全且完美信息动态博弈中,可以逆推子博弈的纳什均衡,从而求出子博弈完美纳什均衡,也就是完美贝叶斯均衡。但是在现实社会中,信息往往是不充分的,所以经常会出现完全但不完美的动态博弈。我国法律界以前追求客观真实说,客观真实说所要求的完全还原已逝去案件事实的证明标准是不现实的,给案件的审理带来了极大的压力,当前是法律真实说占据主流地位,这就为借助概率论来判断具有证明责任的一方是否达到证明标准解决了理论前提上的障碍。[21]而大数据技术的应用,进一步解决了信息不对称、不完全的问题,使得尽量在全数据的基础上推出完美贝叶斯均衡,追求概率最大化,为进一步还原案件事实真相提供了有益帮助。

四、大数据证据的应用分析

1.为打击犯罪提供了新的可能

大数据证据具有全数据的特征。随着大数据技术的发展,一切皆可数据化,包括我们的文字、方位、沟通乃至生活的方方面面,[22]同时人类数据储存技术也在急速发展。(10)当前数据的计量单位可以明显体现出数据储存技术的提升,如1PiB(Pebibyte,千万亿字节,拍字节)=1024TB= 2^50 B;1EiB(Exbibyte,百亿亿字节,艾字节)=1024PB= 2^60 B;1ZiB(Zebibyte,十万亿亿字节,泽字节)= 1024EB= 2^70 B;1YiB(Yobibyte,一亿亿亿字节,尧字节)= 1024ZB= 2^80 B,参见https://baike.baidu.com/item/字节。数据化和数据储存技术的发展使得司法机关不必再拘泥于“小数据”时代储存技术的限制,而能将关于案件的所搜集到的全部数据予以保存,带来了司法机关储存技术的革新。随着数据应用价值的提升,案件全数据的储存也为未来案件的新发现、新发展提供了无限的可能性。

大数据证据所处理的是数据与数据之间的关系,真正的大数据并不仅仅是体量大,而是其数据具有多样性。大数据可以处理挖掘全数据中的大量非结构化、无关联数据,将数据结构化、关联化,进而呈现数据之间的关系。案件的发生是多方因素共同作用的结果,在分析案件时,大数据作为一项以技术为主导的方法,尽可能搜集到全部的数据样本,既包括关联样本又包括无关样本,并且主要从无关联的、弱关联的数据之间进行结构化分析、清洗,寻找到人们难以发现的数据之间的关联,力图寻找到有用的信息。在这个意义上,大数据所获得的关联性是一个大概率关联,是一个只知道“是什么”而不知道“为什么”的关联。例如,美国波士顿马拉松爆炸案发生后,警方几乎调取了与案件现场有关的所有大数据,收集了近10TB的数据量,包括案发现场周围所有的监控录像,附近12个街区居民所拍摄的有关照片、视频,社交网站上的相关照片、文字及视频信息,通过大数据技术对这些海量的、多样化数据进行挖掘分析,警方最终找到了相关证据并在3天后确定了犯罪嫌疑人,于次日将其抓获。[23]再比如2015 年公安部会同国家税务总局、中国人民银行用8 个月时间查处了一起虚开增值税专用发票犯罪案件。办案人员收集到10 亿多条资金流水,利用分析模型分析虚开公司资金流向,清楚地将涉案公司分为开票公司、收票公司、中转公司三层,根据资金流向区分出会员单位、二级单位等,绘制出资金流的闭环关系。(11)案例摘自刘品新.论大数据证据[J].环球法律评论,2019,(1):24.诸多条流水信息中,势必充斥着大量无关联、弱关联数据。然而公安机关通过数据清洗、数据碰撞、数据学习等方法选取相应的算法参数分析数据,寻找数据规律,进而厘清数据流动规律和案件层级结构。在大数据分析过程中,侦查人员并不知道资金为何会这样流动以及该案件为何形成这样的层级结构。当两行为之间发生的概率达到很高程度的时候,我们就可以说这两者存在关联,进而去对两行为进行分析,而不需要判断两行为之间为什么存在关联,不过具体关联的概率需要到达多高程度是需要不同诉讼阶段的司法实务部门通过实践去制定的。

2.预防犯罪行为的发生

通过预测犯罪进而预防犯罪是当今侦查机关乃至整个司法系统所追求的终极目标,而大数据的显著特征就是可预测性。大数据预测的原理就在于相关关系的分析,通过找出一个关联物并监控它,并对其发展的走向进行预测。大数据所具有的预测性给侦查机关预防犯罪提供了一个良好的契机,借助大数据技术,分析数据之间的关系,通过大量非结构化数据的结构化分析,借助算法对犯罪行为进行预测,找到犯罪行为的关联行为,通过对关联行为的实时监控,搜集固定相关证据材料以求作为认定案件的依据,从而对即将发生的犯罪行为进行制止。犯罪预测的理论基础是根据行为规律理论进行的。在一定程度上行为规律理论将人的行为作为可认识的、可学习的甚至是可预测的,因为个体存在于个体与个体、个体与群体、个体与社会、个体与国家、群体与群体、群体与社会、群体与国家的关系之间,其个体行为受到历史和现实中其他个体、群体、社会、国家的潜在或显著的影响,具有一定的规律性。同量刑预测系统原理(12)比如,盗窃罪的量刑预测系统为盗窃罪的知识图谱(要素)—情节提取—类案识别—模型训练(函数关系)—量刑预测—偏离预警。相类似,犯罪行为预测运行的原理为:行为规律通过大数据技术首先进行量化,随后通过算法对数据进行规律分析,提取犯罪行为的知识图谱——将分析出的规律再通过算法进行编程,应用于现实的实例进行实践修正,最终抽象出关于犯罪行为具有高概率性的数百种行为模型——最后实际应用于实际生活中,对现实生活中的行为要素进行提取,进行类似行为识别——信息库数据实时更新,可以对犯罪行为及时预警、必要时及时采取制止措施。

当前,已经应用大数据预警的犯罪防控主要集中在预防电信诈骗中,并且成绩较为显著。由于大数据技术背景下,所有的数据都是实时更新的,当大数据算法分析出潜在受害人可能陷入电信诈骗犯罪嫌疑人的圈套时,公安部门会采取预警被害人和反制犯罪嫌疑人的手段,包括对潜在受害人的短信提醒、电话提醒、电话回访、通知密切联系人等方式进行告知提醒;对潜在犯罪人通过通话切断、信息拦截、资金拦截以及通过询问、监控、盘问、检查等行政强制措施等方式进行反制。对于上述相关的犯罪预测和预警手段,一旦被调查的对象对侦查机关的行为提出异议,甚至提起相关的行政诉讼时,对于措施合理性、合法性的证明责任就需要侦查和司法机关进行解释,此时就会涉及大数据证据的取证、证成以及采信工作,因此大数据证据在犯罪预测预警之中的作用至关重要。

当然,在犯罪预测的过程中,过于依赖算法对犯罪行为规律的提炼和识别,很可能出现数据独裁(13)数据独裁就是让数据统治我们,一切依靠数据作出相应的判断和决策,不掺杂感情,属于超理性主义。的情况,进而出现错误的预判,甚至发生侵犯人权的现象,进一步消解公安机关在案件预防、制止和侦破中的主体地位。基于这种可能的现象,应用大数据预测犯罪应当慎之又慎,从保障人权的角度出发,完善各项人权保障制度和机制。同时,对于风险等级较高的潜在犯罪嫌疑人,在采取较强程度强制措施的同时应当注重对传统证据的收集提取,将大数据证据与传统的物证、书证、电子证据结合起来,形成交叉印证,共同判断是否应当根据相应的大数据预测结果采取较强程度的措施。

五、结语

在大数据时代,大数据作为一种技术、方法和思维被越来越广泛地应用到各个领域。法律人应当拥有最缜密的逻辑理性,还要拥有高尚的法价值情怀。大数据为法律人提供了前所未有的机遇和风险。在这个混沌的时代,必须摒弃固守、旧有的思想,敞开心扉拥抱大数据时代,顺应历史发展之潮流,看清已知,探索未来。大数据证据作为联结现实与未来的桥梁,作为实现人类所追求终极价值的材料,应当被发掘、探索,最终被合理利用。

猜你喜欢

因果关系证据案件
因果关系句中的时间顺序与“时体”体系
一起放火案件的调查:火灾案件中的“神秘来电”
玩忽职守型渎职罪中严重不负责任与重大损害后果的因果关系
“左脚丢鞋”案件
做完形填空题,需考虑的逻辑关系
对于家庭暴力应当如何搜集证据
HD Monitor在泉厦高速抛洒物案件中的应用
手上的证据
3起案件 引发罪与非罪之争
手上的证据