信息网络犯罪中大数据证据的定位与运用
2024-05-23李宁,梁勐
李 宁,梁 勐
(中国海洋大学,山东 青岛 266000;日照经济技术开发区人民检察院,山东 日照 276800)
一、问题的提出
近年来,“大数据技术”“互联网+”“人工智能”等逐渐成为社会热点词,展现出蓬勃的发展趋势并且对人们社会生活、国家经济发展和社会治理工作的影响愈发广泛。大数据时代到来,给社会发展带来了契机的同时,社会治理工作的难度也加大了。伴随着国家对传统犯罪的深度治理,加之受疫情影响,传统犯罪的发生率有所降低,但是以诈骗罪和帮助信息网络犯罪活动罪为代表的信息网络犯罪却呈现出高发态势。2022年8月1日,中国司法大数据研究院发布了《涉信息网络犯罪特点和趋势(2017.1-2021.12)司法大数据专题报告》(以下简称《报告》)。《报告》指出2017年至2021年,全国各级法院一审审结的涉信息网络犯罪案件共计28.20万余件,案件量呈逐年上升趋势;全国涉信息网络犯罪案件共涉及282个罪名,其中诈骗罪案件量占比最高,为36.53%,其次为帮助信息网络犯罪活动罪,案件量占比为23.76%。①参见《涉信息网络犯罪特点和趋势司法大数据专题报告发布》,2022年8月1日,载中国法院网,https://www.chinacourt.org/article/detail/2022/08/id/6826831.shtml,2023年8月16日访问。在虚拟空间和现实空间相互交织的背景下,行为人利用互联网信息技术实施的诈骗犯罪出现乘数效应。同时,信息网络犯罪案件中,海量电子数据、网络平台中的交易数据等远超出办案人员的人工算力,并且不同的机构之间存在着不同程度的数据隔离情况。由此衍生的“数据孤岛”现象导致案件相关数据调取和分析存在一定的困难。①参见简洁:《金融领域犯罪呈现八大特征》,载《检察日报》2023年2月14日,第7版。在上述背景下,大数据侦查应运而生。大数据侦查通过数据挖掘、分析、共享等方式对海量数据进行处理,从而获得能够证明案件事实的大数据证据。从理论层面来看,大数据证据作为一种新兴的证据种类,虽然理论界多有探讨,②有代表性的论述,如刘品新:《论大数据证据》,载《环球法律评论》2019年第1期;林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021年第3期;程龙:《论大数据证据质证的形式化及其实质化路径》,载《政治与法律》2022年第5期。但是对其证据属性如何定位及审查运用等尚存争议。从法律规范层面来看,法律的滞后性导致无法从现有的法律规定中找到其合法性和有效性的根据。从司法实践层面来看,大数据证据在信息网络犯罪的处理过程中发挥着越来越重要的作用,但因大数据技术的复杂性、算法黑箱、侵权风险、证据偏在等多重因素影响,大数据证据的真实性、可采性和证明力面临困境。为此,如何实现大数据证据在办案过程中全面有效地运用成为当前司法领域亟需解决的问题。
二、信息网络犯罪中大数据证据的定位
在追究犯罪的过程中,证据作为证明案件事实的依据,但并非用于证明的依据都属于法定证据种类。我国法律中对证据种类的规定采取列举式,这种方式明确赋予那些运用于司法中的证据以法律地位,但其缺点也饱受诟病,即列举式具有不周延性,如果不能根据司法实践中的新变化、新发展及时作出调整,就会导致办案人员对该类证据的运用产生疑惑和混乱。信息网络犯罪中的大数据证据正处于如此尴尬境地。我国法定证据发展史上,也曾出现过类似情形,例如视听资料和电子数据经历了很长一段时间的讨论之后才得以写入法律并成为法定的证据种类。③1996年修改刑事诉讼法时,确定了视听资料的法律地位;2012 年修改刑事诉讼法时,确定了电子数据的法律地位。视听资料、电子数据在纳入法定证据种类之前,其证据属性定位一直存有争议。同时,大数据技术在司法领域中的应用范围不断拓宽,办案人员也逐渐接受“大数据+司法”的理念。通过裁判文书网对相关案件进行检索发现,许多裁判文书中已经出现了运用海量数据作出案件说明或证明相关案件事实的情况,大数据证据正在走向司法舞台。证据作为诉讼的核心,要求司法实践中的一切诉讼活动都应当围绕证据的收集和审查展开,信息网络犯罪的特性也决定了大数据证据对于案件处理的重要性。大数据证据作为一种新兴的证据类型,各界对其争议颇多。信息网络犯罪中大数据证据的争议主要表现为大数据证据概念及证据种类的争议。当前,为尽快明确信息网络犯罪中大数据证据的法律地位,应厘清上述主要争议。
(一)大数据证据的概念
对大数据证据的概念进行明确界定,是进一步分析其证据种类定位和作用方式的前提条件,也是解决当前司法实践中运用困境的重要基础。何为大数据证据,学者们的观点不一。有学者直接将大数据证据看作侦查机关在利用大数据技术进行侦查时所收集的证据材料,并对大数据侦查进行界定,即“利用计算机技术对存储于计算机系统和网络中的海量数据进行收集、挖掘、共享、清洗和比对,从而获取犯罪线索、证据信息或犯罪嫌疑人的侦查方法与措施。”①参见程雷:《大数据侦查的法律控制》,载《中国社会科学》2018年第11期。有学者认为大数据证据是一种复合型证据,即“大数据证据是运用大数据技术、思维、方法等获取的与案件事实相关的一切材料,是集物证、书证、鉴定意见等证据种类于一身的综合体。”②徐惠、李晓东:《大数据证据之证据属性证成研究》,载《中国人民公安大学学报(社会科学版)》2020年第1期。此外,实务界的学者认为现阶段大数据证据未成为法定证据种类,同时作为新兴技术的产物,其内涵和外延会随着科技的迭代升级而不断变化,所以主张其内涵外延的开放性,即“将其界定为包括海量数据、大数据分析技术和大数据分析结果三部分的综合体。”③参见 庄伟、陈禹橦、张杨杨:《大数据证据在互联网金融犯罪案件中的审查运用》,载《人民检察》2022年第20期。
上述学者从不同的角度试图明确大数据证据的概念,有一定的合理性,但也值得商榷。其一,不能仅通过侦查手段界定证据的种类。司法实践中,并非所有通过大数据侦查方式获取的证据都是大数据证据,例如通过大数据侦查方式获取的某些信息一旦被提取,便与其来源途径和方式独立开来,以电子数据、书证等法定证据种类提交法庭审查。其二,不能简单地将处理证据的方法和技术作为界定证据种类的依据。面对海量证据,算法模型的介入和数据的结构化处理只是数据处理过程中所使用的技术,技术具有中立性原则,不做任何价值评价。其三,不能将原始大数据集等同于大数据证据。大数据侦查所面向的对象是数据库中的海量数据,这些数据集无法通过人力所分析和获取,需借助大数据算法分析模型转化成所需要的大数据分析报告,方能为法庭认定案件事实提供帮助。基于此,应当从大数据证据的特征入手对大数据证据进行界定。大数据证据需同时具备两个特征:一是大数据证据的原始数据应当来源于无法通过人力直接获取的大数据集;二是原始数据集必须通过大数据分析模型转化为能够直接被事实认定者所感知的大数据报告。根据大数据证据的上述特征,大数据证据是运用大数据分析模型,对数据库中的海量数据集进行挖掘、碰撞、分析,最终以大数据报告的形式来证明案件事实的证据。
(二)大数据证据的证据种类归属
根据《中华人民共和国刑事诉讼法》(以下简称《刑事诉讼法》)规定,我国的法定证据种类有八种。④《刑事诉讼法》第50条:“可以用于证明案件事实的材料,都是证据。证据包括:(一)物证;(二)书证;(三)证人证言;(四)被害人陈述;(五)犯罪嫌疑人、被告人供述和辩解;(六)鉴定意见;(七)勘验、检查、辨认、侦查实验等笔录;(八)视听资料、电子数据。证据必须经过查证属实,才能作为定案的根据。”这表明我国实行的是证据种类法定化模式,即只有法律明确规定的八种证据才属于法律意义上的证据,并能够依法作为定案根据。虽然在信息网络犯罪的司法实践中,法院几乎从不会因为某一证据材料是否属于“法定证据种类”而将其排除在定案根据之外,⑤参见陈瑞华:《刑事证据法学》,北京大学出版社2014年版,第165页。但从证据理论体系的发展来看,有必要明确大数据证据所属的证据种类并赋予其法律地位。
从司法实践来看,部分刑事案件已经采用大数据证据来证明案件事实。由于大数据证据的证据种类尚存争议,所以判决书中没有出现“大数据证据”这一用语,而是以“网络舆情报告”①参见陕西省洋县人民法院刑事判决书(2019)陕0723刑初14号。“大数据材料”②参见浙江省温岭市人民法院刑事判决书(2020)浙1081刑初802号。“大数据分析报告”③参见新疆维吾尔自治区乌鲁木齐市中级人民法院刑事附带民事判决书(2020)新01刑初45号。等用语加以表述。显然,判决中所提到的上述证据本质上都属于大数据证据,法院也在司法实践中认可了其证据身份。通过中国裁判文书网对与大数据证据有关的判决书进行检索并分析后,发现司法实务中对大数据证据的认定方式主要有四种:(1)作为法定证据种类;(2)列为单独的证据,没有明确其证据种类,直接结合其他证据共同证明案件事实;(3)转化为传统的证据形式,例如书证、电子证据等;(4)作为补强证据,即通过大数据分析结果来增强其他法定证据的证明力而非将大数据分析结果直接列为证据。判决书中关于大数据证据的四种认定方式,后三种出现的次数要比第一种多且没有对该证据进行证据种类的界定。这是因为《刑事诉讼法》未将大数据证据列入法定证据种类,但这类证据确实发挥了证明案件事实的实际作用,故法官依据自身经验将其归类于最相似的证据种类或者仅承认其证明力而不做归类处理。
从理论研究来看,学者们对大数据证据的证据种类尚未达成共识,具有代表性的观点有“证人证言说”“鉴定意见说”“独立证据种类说”。(1)“证人证言说”。该学说的立足点在于“机器证言”的出现,这一概念出自美国学者Roth教授。他认为随着人工智能、大数据技术的发展,机器对于法律纠纷中的事实认定发挥着越来越重要的作用,经机器智能分析、精确计算得出的客观结论可以看作“机器证言”。④参见Roth A. Machine Testimony. The Yale Law Journal, 2017(7)。将生成大数据分析报告的机器看作证人,那么大数据分析报告便可以归入证人证言范畴。但该观点不能实现当事人与证人的当庭对质权,而且法庭也难以对该证言的可信性做出准确判断,所以我国尚未普遍接受“机器证言”这一概念。(2)“鉴定意见说”。持该观点的学者认为应当将大数据证据归入鉴定意见这一法定证据种类加以适用。有学者指出,将大数据证据纳入鉴定意见的证据种类范畴有相应的法律依据,即根据《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第100条第1款,⑤《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第100条第1款:“因无鉴定机构,或者根据法律、司法解释的规定,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。”在办理信息网络犯罪案件的过程中,可以将关于资金流转的大数据分析报告看作是有专门知识的人就案件的专门性问题出具的报告,该报告利用算法分析技术对资金流转情况进行分析和处理后,能够当作证明案件事实的证据使用。⑥参见何家弘等:《大数据侦查给证据法带来的挑战》,载《人民检察》2018年第1期。如果需要对该证据进行说明,出具该分析报告的人应出席法庭进行说明并就该证据展开质证。有学者对上述学者的观点予以肯定,并指出与“证人证言说”相比,“鉴定意见说”更具合理性,因为鉴定意见和大数据证据均涉及科学问题,所得出的结论本质上都依赖于机器的分析。①参见郑飞、马国洋:《大数据证据适用的三重困境及出路》,载《重庆大学学报(社会科学版)》2021年第10期。有学者从中国现实情况出发,认为现阶段将大数据证据纳入鉴定意见的证据法定种类是较为便宜的选择。②参见刘品新:《论大数据证据》,载《环球法律评论》2019年第1期。有学者对将来大数据证据的定位进行了展望,认为随着数字技术的进步,将来大数据碰撞比对结果可以直接作为鉴定意见进行使用。③参见钟明曦:《论刑事诉讼大数据证据的效力》,载《铁道警察学院学报》2018年第6期。虽然很多学者和司法工作者将鉴定意见作为当下大数据证据在刑事诉讼中适用的出路,但是由于二者之间存在本质不同,该路径遇到现实和理论困境。传统意义上的鉴定意见是将机器作为辅助性工具,最终结果是由鉴定人员做出的,而大数据证据则是完全由大数据算法技术对海量数据集进行分析得出的结论,鉴定人员不参与其中。基于此,将大数据证据纳入鉴定意见范畴并非最终出路。(3)“独立证据种类说”。该学说认为大数据证据有其自身的特点,不能简单地将其归入传统的证据种类,主张只有将其列为独立的证据种类并赋予其法律地位,才能发挥大数据分析报告在刑事诉讼中的应有价值。持该学说观点的大部分学者主张在现有证据规范中,大数据证据与其他法定证据种类不能完全契合,大数据证据独立为证既可以通过理论证成,也有实践需求。因此,在未来应当通过修改法律将大数据作为单独的证据种类以顺应大数据技术的快速发展。④如何家弘等:《大数据侦查给证据法带来的挑战》,载《人民检察》2018年第1期;再如刘品新:《论大数据证据》,载《环球法律评论》2019年第1期;又如倪春乐、陈博文:《大数据证据的刑事诉讼应用机理研究》,载《中国人民公安大学学报(社会科学版)》2022年第2期。
结合上述观点及大数据证据同时具备的两个特征来看,大数据证据的证据种类的归属可以参照如下路径:当前阶段,为规范大数据证据在司法实践中的适用,可以考虑将大数据证据暂时纳入与其关系最为紧密的鉴定意见这一法定证据种类;待将来时机成熟时,通过修改《刑事诉讼法》将大数据证据单列为法定证据种类。
三、信息网络犯罪中大数据证据的运用困境
随着大数据技术在侦查领域的应用,其所衍生出的“司法产品”即大数据证据对查明案件事实发挥着不可或缺的作用,特别是在信息网络犯罪中,大数据证据作为一种全新的证据表现形式,备受理论界和实务界关注的同时,也面临着运用困境。学者指出我国证据的审查和运用有两道门槛:第一道门槛是从与案件相关的材料到证据,第二道门槛是从证据到定案根据。第一道门槛主要对该材料是否具有证明作用及材料的证据种类进行审查,第二道门槛主要对证据的真实性、可采性和证明力等进行审查。⑤参见吴洪淇:《刑事证据审查的基本制度结构》,载《中国法学》2017年第6期。大数据证据在实践中审查和运用的第一道门槛上面已展开了详细讨论,不再赘述,在此主要立足于第二道门槛对大数据证据在信息网络犯罪案件处理中的运用困境展开探讨。
(一)真实性存疑:技术复杂性与算法黑箱
进入大数据时代,信息网络犯罪中犯罪分子利用信息技术的便利不断更新其犯罪手段,为实现溯源治理,大数据证据应运而生,成为大数据背景下司法实践的必然产物。大数据证据作为一种新的证据种类,也应当具备证据的一般属性,即客观性、关联性、合法性等。司法人员在处理信息网络犯罪中的大数据证据时,不可避免的应当对其真实性进行审查。由于大数据技术是一种机器算法行为,通过设置特殊的代码和程序完成复杂的数据分析,所以司法人员在面对这种复杂技术时难以凭借自身经验和法律逻辑作出真实性判断。同时,算法黑箱也增加了大数据证据真实性司法审查的难度。
大数据技术的复杂性决定了司法人员在审查大数据证据的真实性时,难以从其来源过程即算法分析程序加以审查判断,不能对该证据的真实性形成内心确信。大数据技术的复杂性主要表现为三个方面:一是技术内容的复杂性。在信息网络犯罪中,大数据技术突破了时间和空间的界限,利用算法对社会生活中产生的各种数据进行大数据采集、预处理、存储和分析,最终得到证明案件事实所需要的大数据证据。数据的处理过程中涉及的机器算法、大数据分析模型等都由专业人员设计所得,外行人难以了解。二是运算过程的复杂性。大数据技术依靠各种算法模型实现相关数据集的筛选和处理,不同的算法模型所得出的结论也不同,某一结论的得出可能要多个算法模型共同发挥作用。因此,司法人员在面对大数据分析报告时,可能会陷入只知其然而不知其所以然的困境。三是分析结果的复杂性。大数据技术内容和运算过程的复杂性决定着其分析结果的复杂性。大数据技术和人工智能紧密结合,利用“数据经验”或“机器经验”对海量数据集进行分析所得到的结果,已经超出人类日常认知或生活经验所能理解的范围。例如沃尔玛曾利用大数据技术分析了蛋挞销量和飓风之间的动态关系,发现该地季节性飓风来临之前,美式早餐蛋挞的销量会增加。人们对该大数据分析结果的认知容易,却很难接受或理解这种结果。正如机器人专家霍德·利普森(Hod·Lipson)所言,计算机向人类解释事物很难,某种程度上就像是对着一只狗解释莎士比亚一般。①参见Davide C. Can we open the black box of AI. Nature, 2016(7623)。
算法的黑箱化运作加剧了司法人员对信息网络犯罪中大数据证据真实性审查的难度。“黑箱”一词最早出现在英国学者艾什比的《控制论导论》中,他指出“黑箱”是指人们只能认知它的输入值和输出值,而不知其内部结构的系统。②参见 [英]艾什比:《控制论导论》,张理京译,科学出版社1965年版,第53页。有学者将其内部结构系统比作无法洞悉的“隐层”。③参见徐凤:《人工智能算法黑箱的法律规制——以智能投顾为例展开》,载《东方法学》2019年第6期。具体到司法实践中,“黑箱”使得算法对数据的处理程序不公开,司法人员也无从得知算法的实际目的和意图,不能掌握算法推演的相关逻辑,难以对该算法分析的结果即大数据证据的真实性作出准确判断。正如学者所言,“黑箱”导致人们难以理解算法是基于何种原因得出的结论,这些原因有可能是人们较为熟悉并可以接受的,也有可能是人们无法接受的,甚至还有可能是人类无法观察到的。④参见马国洋:《论刑事诉讼中人工智能证据的审查》,载《中国刑事法杂志》2021年第5期。根据“证据之镜”原理,司法人员对事实的认定只能通过证据这一桥梁实现。⑤参见张保生、杨菁:《人工智能法律系统的一种证据推理模型》,载《证据科学》2021年第5期。显然,大数据技术的复杂性及算法黑箱的存在使得司法人员难以对作为其运行结果的大数据证据进行全面了解,算法的黑箱化运作也限制了专家辅助人对大数据证据作出合理解释的空间。基于此,司法人员在处理信息网络犯罪时,难以对案涉大数据证据的客观真实性作出精准判断。
(二)可采性挑战:侵权风险与证据偏在
证据的可采性是英美法系国家的常用语,为避免陪审团受到非法证据的干扰,英美法系国家设立了预先审核程序对证据的可采性进行裁决。只有那些具备可采性的证据,才有资格出现在法庭上。①参见陈瑞华:《关于证据法基本概念的一些思考》,载《中国刑事法杂志》2013年第3期。大陆法系与可采性相对应的概念是证据能力。有学者指出,我国刑事证据能力要件主要是指未被法律排除使用,其中包括未因取证手段、取证主体及取证程序等不合法而无证据能力。②参见艾明:《我国刑事证据能力要件体系重构研究》,载《现代法学》2020年第3期。显然,证据能力是证据的法律属性,证据是否具有可采性是由法律预先进行规定的。如果证据获取的过程中任一环节出现违法状况,该证据将不具有可采性。大数据证据因其收集程序和处理过程的特殊性,导致其出现可采性困境,特别是受侵权风险和证据偏在的影响。
大数据证据因存在侵权风险而面临可采性困境。由于大数据证据来源于海量数据集,来源范围广泛,难以保证侦查机关在获取大数据证据时对与案件无关的个人信息权益加以保护。同时,大数据侦查作为一种新型侦查手段,法律的滞后性会导致其缺乏法律规制,司法实践中可能会出现包含大数据监控信息掠夺、大数据收集信息滥用、大数据侦查缺乏规制等乱象。这导致大数据证据在收集或处理的过程中会对个人信息权益造成不同程度的侵犯,而可采性规则可将这些证据排除在司法范围之外,从而成为保护公民基本权利的利器。对此,司法机关不能只追求侦查效率而忽视公民的个人信息保护。同时,要想保证获取的大数据证据具有可靠性,就应当挖掘各数据库中更为全面的海量数据资料,有些数据资料虽与案件无直接关联,但经过拼凑、整合、分析之后却能反映一定的案件情况。大数据证据采集侵权风险和大数据证据原始数据材料的全面性要求在一定程度上具有对立性。正义是证据法的重要价值和追求,大数据证据采集过程中的侵权风险不利于正义价值的实现。司法实践中,原始证据材料的全面性往往要让位于正义价值。因此,大数据证据可能因存在侵权风险,不符合可采性规则而被排除在法庭之外。
证据偏在现象的存在也会导致大数据证据的可采性困境。有学者将证据偏在分为结构性偏在和知识性偏在:结构性偏在是指证据分布的不均匀性,即控辩双方因掌握数据库资源的差异而导致出现证据偏在;知识型偏在是指控辩双方对大数据证据的理解和运用能力存在偏差。③参见王从光:《电子诉讼中的证据偏在及其破解进路》,载《法律适用》2021年第5期。现代刑事诉讼追求控辩双方的平等武装和平等对抗,以实现控辩平衡的目标。在获取大数据证据时,一个难以忽视的事实就是辩方个人获取大数据证据的能力远落后于以国家公权力为后盾的控方。由此结构性证据偏在和知识性证据偏在现象均有可能出现,并直接对公民的权利产生影响。同时,大数据证据的获取的复杂性要求团队或者专业人员协作才能获取,故大数据证据掌握在少数有实力的人手中,进而加剧了证据偏在现象。例如,在彭某、杨某、欧阳某等网络诈骗一案中,被告人均通过微信在全国范围内发展会员,被告人彭某涉案金额共计3206335元,被告人杨某涉案金额共计1679934元,被告人欧阳某涉案金额共计1095896元。①参见山东省滨州市中级人民法院刑事裁定书(2021)鲁16刑终34号。公权力机关肩负着打击犯罪的使命,其掌握着全国范围内的各种数据库。上述案件中,涉案资金数据进行收集和处理的能力非辩方个人所能及,一般由公权力机关或大型企业进行收集。大数据证据在收集的过程中可能被隐藏或篡改,并且由该证据收集方垄断对其的解释权。显然,大数据证据因其会威胁到当事人的质证权而面临被排除的可能。信息网络犯罪中大数据证据不仅应用广泛,而且对案件事实的认定及案件处理的走向发挥着重要作用,所以受证据偏在影响会引发大数据证据的可采性困境。
(三)证明力不足:算法歧视与相关存疑
大数据的证明力大小是关于该证据对某一案件事实证明到何种程度的评价。证据的证明力受多种因素影响,其中算法歧视和相关性存疑是对大数据证据证明力影响最为显著的因素。大数据技术的复杂属性和算法黑箱化运行属于技术领域范畴而非诉讼领域,但如果不重视这些技术问题,最终可能会影响刑事诉讼程序的进展。
一是算法歧视问题。大数据证据算法歧视是指在大数据证据的收集分析过程中所利用的算法带有设计者的主观意愿或者算法分析所采用的数据是带有偏见的。②参见郑智航、徐昭曦:《大数据时代算法歧视的法律规制与司法审查——以美国法律实践为例》,载《比较法研究》2019年第4期。司法实践中,设计者偏见代理的算法歧视出现的频率较低。这是因为算法设计出来之后会经历多重审查,一旦出现算法歧视问题,该算法就会被强制披露,在某些国家算法设计者还要承担法律责任。因此,设计者基于法律责任承担的考量,不会故意设计带有歧视偏见的算法。相反,数据问题才是导致算法歧视存在的主要原因。理论上,大数据证据的原始证据来源应当是全部样本数据库,但实践中受限于技术和资源因素的影响,总是难以收集到所有证据。因此,数据收集的片面化就会形成算法歧视,影响大数据证据的可靠性和证明力。
二是相关存疑问题。除了上述提到的因数据选择目的性和片面化引发的算法歧视问题,大数据证据来源得到原始数据材料与案件的关联性也关系着该证据的证明力大小。相关性不仅是大数据证据被使用的前提,③参见自正法:《刑事电子证据的审查:学理基础、实践样态与模式选择》,载《政法论坛》2023年第2期。而且对证据证明力大小也有重要影响。证据相关性规则亦是排除那些对待证事实不具有实质性和证明性的证据规则,这也应验了华尔兹所言,“实质性和证明性加在一起就等于相关性”。④参见[美]乔恩·R·华尔兹:《刑事证据大全》,何家弘等译,中国人民公安大学出版社2004年版,第15页。在收集大数据证据时,因大数据自身体量大的特性导致收集主体所面对的对象是所有数据库中的海量数据集,故不能保证算法所分析的数据与案件事实具有足够的客观联系;在收集主体有意进行算法歧视的情况下,也会出现其有目的性地选择数据与案件事实之间相关性存疑问题。不论是算法歧视问题还是相关性存疑问题,都会对大数据证据的证明力产生影响。
四、信息网络犯罪中大数据证据的困境破局
为充分有效打击大数据时代的信息网络犯罪,结合大数据证据的特殊性,针对信息网络犯罪中大数据证据认定和审查面临的诸多困境,在此认为可分别针对大数据证据的真实性、可采性、证明力分别探索大数据证据未来的发展出路。
(一)真实性审查:探索专业人员辅助审查机制
信息网络犯罪中,司法人员对大数据证据进行审查首先应当关注的是该证据的相关性和真实性。虽然司法实践中对证明力的审查,法律一般不作规定,主要依靠法官的自由心证,但正如前文所述,大数据技术的复杂性和算法黑箱的存在已导致法官对大数据证据真实性的审查出现困境。法官难以根据自身经验和法律逻辑对大数据证据的真实性做出准确判断,应寄希望于探索大数据真实性审查的新路径。有学者指出,司法机关应当充分发挥鉴定人、专家辅助人在大数据证据审查中的作用。①参见马明亮、王士博:《论大数据证据的证明力规则》,载《证据科学》2021年第6期。因此,可以考虑在大数据证据真实性审查过程中引入鉴定人、专家辅助人等专业人员辅助法官进行审查和认定,积极探索专业人员辅助审查机制。
具体而言,专业人员可以从原始数据是否真实可靠,大数据技术的内容、运算过程、分析结果如何理解,算法黑箱测试是否达标等方面发挥解释说明的辅助作用。首先,鉴定人、专家辅助人协助法官对大数据证据原始数据材料的质量和真实性做出判断。一方面,从宏观上对原始数据材料的真实性做出判断,即审查原始海量数据是否来源于权威数据库,海量数据集在流转过程中是否存在失真的可能等;另一方面,从微观上对原始数据材料的真实性进行审查,即可以通过抽样的方式选取部分数据有目的地对原始数据材料的真实性加以验证。例如,在网络诈骗案件中,鉴定人、专家辅助人可以抽样选取部分受害人的银行流水记录与诈骗集团的网络平台数据进行比对,从而验证与诈骗数额是否相吻合。其次,针对大数据技术的复杂性,鉴定人、专家辅助人可以就大数据技术的内容、运算过程以及分析结果向法官进行专业性解释,帮助法官理解大数据技术,从而对大数据证据的真实性进行审查。例如,在对大数据证据进行质证时,法官可以要求鉴定人、有专门知识的人出庭作证,向法庭和当事人陈述选择该算法的原因和具体操作过程。最后,鉴定人、专家辅助人通过算法黑箱测试的方法帮助法官判断生成该大数据证据的算法是否科学合理。黑箱测试是指测试者在知晓该算法程序的目的和功能的前提下,检测这些功能是否能够正常运行的测试方法。通过有效键入和无效键入的方式来判断输出是否正确,保证算法功能的正常运行和大数据证据的真实可靠性。
(二)可采性保障:以控权和赋权保障控辩平衡
大数据技术的应用虽然给信息网络犯罪的处理带来了很多便宜,但其作为公权力有扩张和侵犯私权利的风险,同时加剧了证据偏在现象。我国刑事诉讼程序有保障人权和保障控辩平衡的内在要求。为保证大数据证据的可采性,一方面,应通过控制公权力最大限度地把其对私权利的侵犯降到最低,保证取证过程合法、合理;另一方面,应通过赋予个人信息主体和辩方相应的权利来实现大数据证据收集和获取过程中的权利保护。这样可以有效避免信息网络犯罪中获取大数据证据时对个人信息权益的不当侵犯,也可以推动大数据证据获取和质证过程中控辩双方的动态平衡,最终保障信息网络犯罪中大数据证据具有可采性。
我国现行《刑事诉讼法》规定,①《刑事诉讼法》第51条:“公诉案件中被告人有罪的举证责任由人民检察院承担,自诉案件中被告人有罪的举证责任由自诉人承担。”公诉案件中由人民检察院承担被告人有罪的举证责任。刑事证明责任是提供证据和说服责任的统一,否则将面临不利的诉讼后果。②参见施鹏鹏:《刑事证明责任理论体系之检讨与重塑》,载《中国法律评论》2022年第6期。为避免这种不利诉讼后果,国家赋予控方强大的公权力予以保障,这种公权力具有天然的扩张性,最为典型的是刑事案件的侦查权。③参见彭俊磊、周长军:《大数据时代技术侦查的法律规制——以合理隐私期待理论为视角》,载《山东社会科学》2022年第12期。在大数据时代,大数据侦查的广泛应用使得公权力进一步扩张,为降低其对私权利的侵犯风险,减少证据偏在现象,保障获取的大数据证据具有可采性,应当对侦查权加以控制。首先,通过立法规制大数据侦查权。为保障大数据证据合理、合法的获取,可通过立法的形式明确大数据证据收集的程序、方法及大数据证据原始材料来源的范围等,从而最大限度的降低对个人信息权益的侵犯,防止控方具有过度的证据优势。其次,完善大数据证据收集的监督机制。一方面,可以探索大数据技术风险评估系统,应用大数据技术之前对其进行风险等级评估,严格限制高风险的大数据技术的应用;另一方面,明确法官对大数据证据保密销毁情况、大数据证据收集和算法分析程序的审查和监督,法官可以通过对卷宗的实质审查,倒逼相关司法机关严格履行大数据证据收集的附随义务,避免其利用数据库资源优势形成证据偏在。最后,规定非法、瑕疵大数据证据禁止性规定。除了通过上述积极规定规制公权力外,还应当建立非法、瑕疵大数据证据的消极否定性程序。例如,对于上文提到侵犯个人信息、存在证据偏在的大数据证据应当依法予以排除。
为保障大数据证据具有可采性,另一路径是赋予数据主体和辩方能够与控方相抗衡的权利。一是赋予数据主体部分信息自决权以保障大数据证据收集过程中的个人信息不受非法侵犯。有学者提出可以在大数据证据收集过程中引入个人信息保护的基础性原则即“告知同意原则”,适当赋予数据主体信息查询权、复制权、更正权、删除权等权利。④参见卫跃宁、赵晨怡:《论个人信息的刑事法律保护——以告知同意原则的合理引入为视角》,载《福建警察学院学报》2022年第6期。数据主体的信息数据知情权不仅有利于对大数据证据收集程序进行有效监督,而且可以避免因收集主体的数据库资源优势和算法优势引发的证据偏在现象。二是赋予辩方要求证据开示权利。如果信息网络犯罪中的辩方在开庭审理前有要求证据开示的权利,便可以要求控方就所收集的大数据证据做出解释和说明。一方面,能够实现双方所持有的大数据证据信息共享,在某种程度上解决“信息偏在”问题;另一方面,可以提高诉讼效率,实现控辩双方平等武装。有学者指出,我国未来刑事诉讼程序的发展中,有必要在借鉴美、德经验的基础上,从开示条件、范围、方式、救济机制方面予以构建。⑤参见李昌盛、李艳飞:《比较法视野下认罪认罚案件证据开示制度之构建》,载《河北法学》2021年第9期。
(三)证明力强化:规制算法歧视与构建相关性规则
证据的证明力不仅取决于该证据自身的可靠性程度,而且其与待证事实之间的关联性也影响着该证据证明力的大小。大数据证据所面临的证明力困境要求审查时应当立足于该证据的获取是否存在算法歧视及其原始证据材料与待证案件事实之间的客观联系程度。为增强大数据证据的证明力,结合大数据证据证明力审查面临的困境,提出规制算法歧视和构建相关性规则两种具体做法。
一是对大数据证据获取过程中的算法歧视加以规制。一方面,明晰算法运行的基本原则。算法运行应当遵循各项法律普遍规定的平等原则,具体到大数据时代,平等原则被进一步解释为算法公正原则。该原则要求算法的设计者、运营者和监管者应当主动维护公民之间的平等权利,不能产生不合理的差别待遇。另一方面,建立算法违规追责机制。当一些预防性措施对算法歧视行为不能实现有效控制时,有必要通过追究法律责任的方式对侵犯公民权利的算法歧视行为进行事后规制。除了明确责任主体、责任划分等具体事项,还应当保障受害者权利救济途径的畅通。例如,设置充足的质询、反馈和投诉通道,建立集体诉讼制度等。
二是构建大数据证据的相关性规则。从宏观范围来看,大数据证据的原始证据材料与案件待证事实之间是弱相关关系。大数据技术内在的运行逻辑即基于海量数据的收集和处理决定了上述弱相关关系。证明力,是一种以相关性为基础的说服力,指证据对待证事实存在的可能性具有的证明作用及其程度。证明力意味着证据与待证事实之间的逻辑联系程度,是证据的相关程度或证明作用的指示器。①参见张保生主编:《证据法学》,中国政法大学出版社2018年版,第29-42页。根据上述论证,或许可以得出证据的关联性不仅仅是证据能力的要件,也是反映证明力强弱的要素。如美国联邦证据规则第403条,将证据材料的相关性划分为“自然相关性”和“法律相关性”,要求对证据相关性的审查要从事实经验判断和法律价值判断两个角度出发,而我国现行《刑事诉讼法》对相关性的理解仅局限于自然相关性。显然,大数据证据的相关性审查不应仅局限于自然相关性,还应当注重该证据证明力大小即法律相关性的判断。正如学者所说,透过现象看本质,证据制度的建构和具体诉讼中的争议都是且应当围绕证据的相关性问题而展开。②参见周洪波:《证据属性的中国法律之道》,载《中国法学》2022年第6期。未来,可立足于大数据证据发展实际情况,借鉴国外法,对大数据证据的相关性规则进行重构或完善。
五、结语
大数据时代,信息网络犯罪频发且更具隐蔽性。大数据证据作为大数据技术在刑事侦查领域运作最重要的司法成果,对于信息网络犯罪的处理发挥着至关重要的作用。大数据证据作为一种全新的证据种类,对案件处理发挥实际作用的同时,也对传统证据规则造成了一定程度上的冲击,引发理论界和实务界热议。随着大数据证据在司法实践中运用范围的拓宽,有必要尽快结束理论界关于大数据证据概念和证据种类归属的争议,为解决司法实践中的运用困境奠定理论基础。现阶段,可暂时将大数据证据归入鉴定意见这一法定证据种类,等时机成熟时,通过修改法律将其单列为法定证据种类。文章在分析信息网络犯罪中大数据证据真实性、可采性、证明力审查困境的基础上,提出包括探索专业人员辅助审查机制、以控权和赋权保障控辩平衡、规制算法歧视与构建相关性规则在内的未来发展出路。大数据证据作为一种新事物,其发展路径必然面临着曲折性,但其对刑事侦查乃至整个刑事诉讼程序的顺利进行的价值作用决定了其拥有光明的前途。