论大数据证据质证的形式化及其实质化路径*
2023-01-08程龙
程 龙
(云南大学法学院,云南昆明 650500)
一、问题的提出
近年来,随着大数据侦查的不断推行与发展,作为其最终“司法产品”的大数据证据成为了实务与理论的研究重点。实践中,浙江省的 “智慧浙江公安”、湖北省的 “智慧警务”以及山东省的 “大数据警务云计算”等大数据侦查系统发展迅猛。〔1〕参见张兆端:《智慧公安:大数据时代的警务模式》,中国人民公安大学出版社 2015 年版,第 256 页、第276 页、第286 页。但对于何谓“大数据证据”学界有不同认识,具体来看,有如下几种定义。其一,根据证据来源界定,即通过大数据侦查得来的证据即为大数据证据。大数据侦查是指“通过计算机技术对存储于网络与计算机系统中的海量数据进行收集、共享、清洗、比对和挖掘,从而发现犯罪线索、证据信息或者犯罪嫌疑人的侦查措施与方法”,〔2〕程雷:《大数据侦查的法律控制》,载《中国社会科学》2018 年第11 期。其包含数据查询、数据比对和数据挖掘等三种具体样态。大数据侦查的目标在于在上述技术手段的作用下,取得有利于查明案件真实的大数据证据。其二,根据是否有人工智能与算法介入作为判断大数据证据的标准。有别于传统刑事证据,大数据证据“突出表现为基于机器算法、机器人和高级人工智能等新兴科技的各种大数据材料”。〔3〕刘品新:《论大数据证据》,载《环球法律评论》2019 年第1 期。其三,根据数据是否经过结构化处理判断是否为大数据证据。在具体运用中,大数据证据具有层次性,单纯的数据本身并不构成大数据证据,而需要结构化处理之后成为数据信息;数据信息通过一定的证明方法的运用,方成为大数据证据。〔4〕参见胡铭、龚中航:《大数据侦查的基本定位与法律规制》,载《浙江社会科学》2019 年第12 期。其四,大数据证据不是独立证据类型,须转化为其他证据使用。从外观上看,大数据证据与电子数据证据有相当强的一致性。正因如此,在实践中对于大数据证据的定性普遍存在争议。由于我国刑事诉讼法对法定证据种类的强制性要求,实践中难以将大数据证据这一本不存在于刑事诉讼法条文中的证据类型直接运用,而须将其转化为法定证据种类后使用。有研究指出,实践中通常有四类转化应用形态:(1)作为鉴定意见或专家辅助人意见使用;(2)作为破案经过材料或情况说明使用;(3)直接转化为书证等证据使用;(4)将大数据证据作为新的证据类型直接使用。〔5〕参见林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021 年第3 期。
笔者认为,首先,作为概念提出的大数据证据不是根据侦查手段进行界分的,并非所有大数据侦查所获得的证据都是大数据证据。其次,是否有人工智能、算法的介入以及是否对数据进行结构化处理,只是证据具体使用技术而已,不能以证据的使用方法作为界定证据类型的依据。最后,大数据证据与我国刑事诉讼法所规定的法定证据种类并不是同一位阶的概念。它是站在证据生成层面,以“证据的生成是否建立在大数据原始素材基础之上”的标准对证据的概括,而不是建立一个完全独立于现有法定证据种类的、完全崭新的证据类型。诚如陈瑞华教授所言:“至于证据的载体和表现形式,一旦受到法律限制,就有可能扼杀证据制度的弹性和活力,使得大量明明记载着证据事实的载体形式被排除于证据范围之外。”〔6〕陈瑞华:《刑事证据法》(第三版),北京大学出版社2018 年版,第241 页。本文所探讨的大数据证据,不是意图从本体论上确定其静态概念,而是从实践论出发,讨论以大数据素材为证明依据的相关证据的具体运用问题。不过,从司法现实出发,不具有法定证据类型的“证据”确实在应用中会存在诸多阻碍。况且,以目前的技术水平,尚难以完全实现“强人工智能”条件下理想的海量数据证据自动化生成、运算和推断,故大数据证据通常是以电子数据的形式呈现;同时,我国对于法定证据种类的划分也具有将不同种类证据的证据方法予以规范化的效力,故按照“最接近原则”,可以勉强将大数据证据与电子数据证据不精确地等同视之。
目前,对于大数据证据的相关研究,主要围绕在大数据侦查的法律控制〔7〕例如王燃:《大数据时代侦查模式的变革及其法律问题研究》,载《法制与社会发展》2018 年第5 期;程雷:《大数据侦查的法律控制》,载《中国社会科学》2018 年第11 期;裴炜:《数据侦查的程序法规制——基于侦查行为相关性的考察》,载《法律科学》2019 年第6 期。与大数据证据的收集与技术性运用〔8〕参见林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021 年第3 期;刘品新:《论大数据证据》,载《环球法律评论》2019 年第1 期;冯姣:《互联网电子证据的收集》,载《国家检察官学院学报》2018 年第5 期。等方面。这些理论探索为奠定大数据证据的研究基调、范式与路径提供了必要的基础与支撑。不过,上述研究成果更多地将视角放在了审前阶段,尤其是侦查阶段的大数据证据取得上,对于审判阶段大数据证据运用的关照有所不足。这或许与传统刑事诉讼研究主要为破解侦查中心主义的路径依赖有关,也与大数据侦查对基本人权的侵犯隐忧密切相关。〔9〕参见裴炜:《数字正当程序:网络时代的刑事诉讼》,中国法制出版社2021 年版,第241-294 页。本文有别于既往重视审前程序的研究进路,转而通过质证这一核心概念与程序,分析大数据证据在审判程序中的运用问题,试图揭示大数据证据质证中的“形式化”不仅无助于事实真相的查明,反而有可能产生诸多意想不到的问题;在“数字审判”的未来,有可能造成新的“数据型司法不公”。故应力图探寻一条能够对大数据证据进行实质化质证的新路径,确保对这一新生事物的合理规制与正确应用。
二、大数据证据质证形式化的实践图景
目前,大数据证据在刑事诉讼中的使用方兴未艾,虽然标准意义上的大数据证据应用还不多见,但以管窥豹,通过对部分典型案例的考察,可以发现大数据证据质证实践中存在的形式化困境。
(一)大数据证据刑事司法运用的整体样态
整体上看,大数据证据在刑事司法运用中主要有两种样态:基于海量数据的数据库比对;基于算法模型的大数据分析。〔10〕参见林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021 年第3 期。这两种运用样态对应于大数据证据的两种运用方式,即直接运用与间接运用。直接运用是指将数据库的原始数据进行数据提取、比对等“粗加工”后作为证据使用,或将全样本数据副本作为证据使用;而间接运用则是指从全样本数据中筛选出小数据作为证据使用,或者将全样本数据经过算法处理后,将其分析结果作为证据使用。〔11〕参见谢君泽:《论大数据证明》,载《中国刑事法杂志》2020 年第2 期。
区分直接运用与间接运用的标准在于该大数据证据的信息是否经过了技术处理。区分的意义在于,从证据原理上看,证据与待证事实间的距离越短,则其稳定性、客观性和真实性越高,因此,对大数据证据的直接运用相较于间接运用而言,理论上更不易伪造、篡改,证明力更强。但直接运用的问题在于,数据本身不会说话,在大数据证据与待证事实间相关性较弱,或相关性必须通过一定分析手段方可识别时,对其直接运用存在识别与理解障碍。并且,大数据证据的庞大体量,使得对全样本数据的使用有可能产生“数据倾倒”现象,即诉讼中的一方(我国现实中最有可能是控方)利用数据的海量性,向对方倾倒数据,造成事实上的阅卷不能与质证不能,从而抬高诉讼成本,增强己方诉讼谈判筹码。〔12〕See Leah M.Wolfe,The Perfect is the Enemy of the Good:The Case for Proportionality Rules instead of Guidelines in Civil E-Discovery,43 Capital University Law Review 153(2015).
笔者依循上述大数据证据直接运用与间接运用的分类,挑选了15 例具有典型意义的大数据质证一审、二审案件裁判文书作为分析样本,〔13〕这15 个案例分别是“快播公司传播淫秽物品牟利案”,参见北京市海淀区人民法院(2015)海刑初字第512 号刑事判决书;“吴某某贩卖、运输毒品案”,参见广西壮族自治区玉林市中级人民法院(2019)桂09 刑初39 号刑事判决书;“解某红组织、领导传销活动案”,参见陕西省咸阳市中级人民法院(2018)陕04 刑终131 号刑事裁定书;“程某泽聚众扰乱社会秩序案”,参见山西省晋城市中级人民法院(2017)晋05 刑终271 号刑事判决书;“彭某某侵犯个人信息案”,参见四川省成都高新技术产业开发区人民法院(2018)川0191刑初94 号刑事判决书;“李某等非法吸收公众存款案”,参见北京市丰台区人民法院(2017)京0106 刑初1010 号刑事判决书;“赵某职务侵占案”,参见北京市朝阳区人民法院(2018)京0105 刑初2735 号刑事判决书;“阮某德等诈骗案”,参见宁波市江北区人民法院(2017)浙0205 刑初357 号刑事判决书;“杨某良出售出入境证件案”,参见广东省深圳市中级人民法院(2018)粤03 刑终1546 号刑事裁定书;“范某嫩非法制造、买卖、运输、邮寄、储存枪支、弹药、爆炸物案”,参见福建省宁德市蕉城区人民法院(2021)闽0902 刑初175 号刑事判决书;“陈某故意伤害案”,参见新疆维吾尔自治区乌鲁木齐市中级人民法院刑事附带(2020)新01 刑初45 号民事判决书;“高玉珍虚开增值税专用发票、用于骗取出口退税、抵扣税款发票案”,参见陕西省高级人民法院(2019)陕刑终317 号刑事裁定书;“何某盗窃案”,参见广东省广州市黄埔区人民法院(2021)粤0112 刑初425 号刑事判决书;“向某宏非法持有毒品案”,参见重庆市第五中级人民法院(2020)渝05 刑初21 号刑事判决书;“蔡某平强奸案”,参见湖北省孝感市中级人民法院(2021)鄂09 刑终119 号刑事裁定书。力图描摹现实案件大数据证据质证中的具体问题。挑选标准是:其一,具有标杆意义的、受关注程度较高的案件;其二,近三年来使用大数据证据方法较为成熟的案件;其三,尽可能涵盖不同类罪,以及覆盖全国不同地域、不同审级的案件。其四,多样化的大数据证据类型,包括大数据比对、大数据分析、大数据研判,等等。其中,既有当事人认罪案件,也有当事人不认罪或部分认罪案件,当然,本文不是一个实证研究,因此选取的案例主要是为了折射大数据证据质证中的典型问题,而非从整体上概括大数据质证的全部实践。
(二)大数据证据质证的样态与特点
1.直接运用较少,间接运用较多
在挑选的15 例典型案件中,仅有“快播公司传播淫秽物品牟利案”和“吴某某贩卖、运输毒品案”实现了对大数据证据的直接运用。“快播公司传播淫秽物品牟利案”中,控方对快播公司被扣押的7台服务器进行了全数据库筛查,共提取视频文件55016 个,查出淫秽视频38273 个。而在“吴某某贩卖、运输毒品案”中,控方直接使用广西玉林市城市大数据防控系统全部相关图片证明被告人的活动轨迹信息。在其余13 个案例中,控方都是通过对大数据本身的鉴定、分析等方式进行间接运用。
2.认证率高,辩护意见采纳率低
在“快播公司传播淫秽物品牟利案”中,辩方对侦查机关取证合法性问题提出辩护意见,法院认为在对快播公司其中4 台服务器扣押、移交、鉴定过程中,执法机关只记载了服务器接入互联网的IP地址,没有记载服务器的其他特征;同时,公安机关办案人员错误记录了硬盘数量和容量,致使扣押、鉴定的服务器是否为快播公司实际控制产生了合理怀疑,这是15 个案例中仅见的司法机关对大数据证据持怀疑态度的孤例。而在其他案例中法院无一例外地认可了相关证据并作为定案依据。
3.基本上是对大数据衍生品的质证
除在“吴某某贩卖、运输毒品案”中,辩方直接对大数据防控系统中获取的原始图片进行质证外,其他案例都是对大数据衍生品的质证。其中,以对鉴定意见、情况说明、大数据分析报告进行质证为主。同时,还有针对数据抽样、电子数据远程勘验报告等大数据衍生品的质证实践。
4.基本上是对大数据证据内容的质证,而甚少对大数据证据取证程序的质证
事实上,大数据证据的质证可以被认为是“二段式”的。第一段是质疑大数据证据获取程序的科学性、合法性。第二段才是质疑大数据证据本身内容是否真实。在全部收集的案例中,仅有“快播公司传播淫秽物品牟利案”和“李某等非法吸收公众存款案”中辩方质疑了大数据证据储存服务器的保管链条完整性、合法性;以及“彭某某侵犯个人信息案”中,辩方质疑了数据抽样的科学性问题。其他案例中的质证意见均围绕证据内容本身的真实性,以及待证事实与案件的关联性展开。
5.预测性警务中收集的大数据证据被用于定罪证明
如“阮某德等诈骗案”中,由于医保大数据平台的数据异常提示了被告人就医记录、配药情况的异常,侦查机关才发现了犯罪事实进而启动追诉程序,嗣后又以该大数据分析的异常提示信息用以证明被告人骗保事实的成立。又如“程某泽聚众扰乱社会秩序案”中,办案机关是通过社会舆情异常波动的系统提示,从而知晓被告人的行为具有扰乱社会秩序的潜在危险,随后又以该舆情异常提示用以证明被告人从事了扰乱社会秩序的行为,以及证明该行为对社会秩序所造成的严重影响。
6.质证方式传统,极少涉及专业性论证
辩方对大数据证据的质证,主要采取的是待证事实与犯罪构成的关联性质疑这一传统方式。但是对大数据的分析鉴定方法、科学原理等专业性问题几乎没有提出质证意见。而法院在阐述证据分析时,除“李某等非法吸收公众存款案”和“赵某职务侵占案”中略微涉及如MD5 哈希值检验、App数据库检索方法等专业性说理外,其他案例中均没有对专业性、科学性问题进行细致回应。
7.对质证意见的笼统式回应较为突出
尽管在上述个案中,辩方基本上提出了较为明确的质证意见,但在裁判说理中,出现了较为明显的笼统式回应趋势。即不直接回应对单个大数据证据的质证意见,而是将这一大数据证据“镶嵌”到整个证据体系中,从而认为整个案件的事实清楚,证据充分,最终证成犯罪事实的存在。
(三)大数据证据质证的形式化困境
从大数据质证实践的观察来看,存在一些较为明显的核心问题,形成了大数据证据质证的形式化困境,详述如下。
1.数据倾倒:大数据证据直接运用的质证难
在“快播公司传播淫秽物品牟利案”中,控方共计调取了快播公司控制的7 台服务器中的55016个视频文件,通过一一分析鉴定,共锁定了38273 个淫秽视频。从判决文书中难以看到这些视频的时长与文件大小。但从经验上看,一则视频的时长应在数分钟到数十分钟不等,故完全浏览完这些视频的耗时估计在数十万乃至上百万分钟左右。前已论及,在大数据证据的运用中,出于抬高对方诉讼成本的考虑,会采取所谓“数据倾倒”的方式,不顾对方的质证能力全盘倾泻“裸的”大数据证据,导致事实上的质证不能。在该案中,虽然判决书中并未记载辩方对此提出异议,但从实际出发,辩方几乎不可能完全浏览这五万多份视频文件,也就不可能对淫秽视频的界定、数量进行有效的质证。故最终的质证意见瞄准的是视频文件储存服务器的扣押、移送等过程合法性、客观性问题。
笔者就大数据证据的直接运用也向一线公诉人员进行了访谈。公诉人员普遍表示,数据的海量性导致审查极为不便。如果是文字形式的数据还可以通过关键字查找等方式搜索,但图片类型的大数据证据只能通过人工查找。特别是公民个人信息比对如果以人工为之,极容易出错。如果大数据证据的庞大体量对于有技术装备和人力物力支撑的追诉机关而言都难以应对,那么对于“个体作战”的被追诉人及其辩护人而言自然更难。实践中,容易出现“数据倾倒”的除上述例证外,还有银行流水、通话记录、数据库电子标签、个人信息记录等等,这些数据的容量常常是TB 量级乃至PB量级。〔14〕参见王燃:《大数据时代侦查模式的变革及其法律问题研究》,载《法制与社会发展》2018 年第5 期。事实上,任何机关与个人都不可能在不经过数据清洗、抽样、分析、鉴定的基础上直面大数据本身。
但是,目前我国法律并未规定,对于海量的大数据证据必须通过数据整理、分析、鉴定方可运用。相反在“最佳证据规则”的影响下,未经任何处理的“裸的”大数据某种程度上还具有更加真实、客观的传统印象。这种思维某种程度上正当化了“数据倾倒”,令人忽视其造成的辩方质证不能与控方的突袭举证等诸多弊端,致使大数据的直接运用难以得到有效、有针对性的质证。
2.黑箱效应:大数据证据间接运用的质证难
如上所述,海量的大数据对于控辩双方都是一个很大的障碍。因此,实践中以未经处理的“裸的”数据作为证据使用的情形较为少见,通常是进行整理、分析、鉴定后方以证据使用。这一间接运用虽然避免了“数据倾倒”带来的“质证难”困局,但又引发了新的“黑箱效应”问题。所谓“黑箱效应”是指数据的分析、鉴定过程并不公开,使参与诉讼的各方并不知晓对大数据的分析报告和鉴定意见究竟是通过何种方式与科学原理做出的。在“黑箱效应”的影响下,对于专业意见的科学性、真实性也难以进行有效的识别、论证与质证,最终导致对大数据分析、鉴定的质证,实际上也不可能做到。
“黑箱效应”有不完全和完全两个版本。不完全版本的“黑箱效应”是指实际上可以部分或全部了解数据分析、鉴定的数据处理过程,只是由于证据开示不足导致“透明箱”或“灰箱”变成了“黑箱”。例如案例“彭某某侵犯个人信息案”中,控方对个人信息数据进行了抽样,但却不告知辩方抽样方法与程序。抽样本身并非“黑箱”,其“黑箱”形成纯粹是因为对抽样方法与程序开示不足所致。完全版本的“黑箱效应”也称“算法黑盒”是指由于算法的不可描述性,致使数据处理过程不可为人所知。人类只能控制数据输入,获知分析结果,但从数据到分析结果的做出过程却难以呈现,这是人工智能等高科技司法运用目前的痛点之一。〔15〕参见王禄生:《司法大数据与人工智能开发的技术障碍》,载《中国法律评论》2018 年第2 期。在美国,由于“算法黑盒”缺乏司法透明,易导致刑事被告人知情权乃至正当程序权利的侵害;而被告人又不可能在技术上实现对算法本身的核验,故存在应用与限制的两难局面。〔16〕参见李本:《美国司法实践中的人工智能:问题与挑战》,载《中国法律评论》2018 年第2 期。大数据证据质证中的“黑箱效应”同样如此。例如“李某等非法吸收公众存款案”中,如何通过对数据库中的原始电子数据分析得出“e 租宝”的实际控制者以及非法获利情况,也无法获知。实践中,还有通过对个人行为偏好的大数据分析,从而预测个人的犯罪可能性;抑或犯罪后用于锁定犯罪嫌疑人的行为偏好算法比对等大数据证据的运用,其分析过程也普遍存在“黑箱效应”问题。这同样导致了对大数据证据的间接运用实际上的质证不能。
3.间接质证:大数据证据质证转化为对大数据鉴定分析的质证
正因为对大数据证据的直接运用难以进行,实践中通常在数据分析、鉴定的基础上进行大数据证据的间接运用,于是,大数据证据的质证往往针对的是大数据分析报告或鉴定意见。从本质上看,大数据证据的质证应当针对大数据证据本身;大数据本身是检材也是证据,而大数据分析报告和鉴定意见是在作为检材的大数据基础上进行推论形成的意见。〔17〕参见刘振红:《论鉴定意见质证的特殊性》,载《法学杂志》2015 年第4 期。
传统意义上的质证,既要对作为检材的书证、物证、视听资料、电子数据乃至证人证言等进行质证,又要对基于检材的鉴定意见进行质证,即前述鉴定意见的分段式质证。但由于“数据倾倒”和“黑箱效应”导致的辩方既不能对检材本身实现有效质证,又不能对鉴定过程进行有效质证,最终势必只能退而求其次地仅仅针对分析报告、鉴定意见的内容进行质证。似乎检材——即大数据本身的质量有了天然的正当性保证。现实中“以打印件形式在法庭出示的普通电子数据证据常常难以跨越真实性的障碍……但如果以鉴定意见的形式出具,专家的参与为电子数据披上了看似可信的外衣”。〔18〕刘波:《电子数据鉴定意见质证难的破解之道》,载《重庆邮电大学学报(社会科学版)》2018 年第1 期。可问题是,大数据证据的获取本身具有不确定性、不稳定性,作为检材的大数据质量并不具备当然的客观性与真实性。大数据证据的合理性不仅取决于算法本身的合理性,更取决于基础数据自身的质量。〔19〕参见裴炜:《数据侦查的程序法规制——基于侦查行为相关性的考察》,载《法律科学》2019 年第6 期。如果无法对数据进行有效质证,则不能防止大数据分析中经典的“垃圾进、垃圾出(Garbage in,Garbage out)”效应。遗憾的是,除个别案件中具有一定统计学、数学等自然科学知识的被追诉人、辩护人可以提出一些关于数据质量的质证意见外,绝大多数案件中辩方无力对数据质量提出有效质证,这就导致裁判者无法充分重视数据自身质量问题,而片面采信有潜在数据质量风险的分析报告与鉴定意见,致使误判风险大大提高。
4.数据独裁:大数据证据质证难以影响法官心证
法官对于大数据证据的采信带有较为明显的“因为是科学,所以很科学”的思维倾向。这其实并不仅仅存在于大数据证据的采信中,而是在整个科学证据的判断上,都存在着某种程度的“科学迷信”,对技术性专家意见的依赖不断增加。〔20〕参见[美]米尔建·R.达马斯卡:《漂移的证据法》,李学军等译,中国政法大学出版社2003 年版,第200-202 页。有学者主张,应当区分专家意见中的描述性主张与推论性主张,对于推论性主张而言,证据提出者应当对该专家意见的结论进行“铺垫性证明”,足以使一个持理性主义的怀疑论者相信结论的稳健性。〔21〕参见[美]爱德华·J.伊姆温克尔里德:《科学证据的秘密与审查》,王进喜等译,中国人民大学出版社2020 年版,第145-154 页。可是,目前我国的刑事司法实践中,难以找到这样的“持理性主义的怀疑论者”,现有的控辩审三方的知识结构也难以进行针对科学方法及原理的“铺垫性证明”。因此,数据为王、科学即是真理的信念贯穿在整个大数据证据的质证过程之中。有学者已经指出,在大数据侦查的过程中,出现了对大数据分析结果过度依赖的“数据独裁”现象。〔22〕参见杨婷:《论大数据时代我国刑事侦查模式的转型》,载《法商研究》2018 年第2 期。考虑到目前我国事实上存在侦审关系过度密切的诉讼结构安排,这种“数据独裁”也自然会蔓延到审判程序中来,使审判者对于大数据证据的证明力具有天然的、超验的确信。因此,即便辩方进行了较为充分的质证,也难以动摇法官“数据至上”的固有心证,质证效果最终难以发挥。
5.证据偏在:大数据证据质证中的辩方难以充分使用大数据证据
所谓“证据偏在”是指当事人能力间的不平等导致证据使用能力上的差异。〔23〕参见高波:《大数据:电子数据证据的挑战与机遇》,载《重庆大学学报》(社会科学版)2014 年第3 期。目前司法实务中,大数据证据主要由控方单方面运用以支持控诉。相反,辩方甚少使用大数据证据用以证明无罪或罪轻。这是由于进入“大数据时代”的刑事诉讼,控辩双方不仅存在既有之诉讼权利上的失衡,而且更为严重的是还存在大数据运用技术实力上的失衡。在此基础上,又附加“强职权主义”模式下我国刑事诉讼中控辩力量过于悬殊的问题,“证据偏在”效应将会进一步放大。
综上,可以看出,在大数据证据的质证中,虽有质证之行为,但缺乏质证之能力,难见质证之效果。大数据质证徒具形式,而难副其实。大数据质证成为了控辩审三方不得不走的程序,而没有将其视为证据攻防乃至整个案件攻防的重要组成。从这个意义上看,大数据证据的质证仅是形式化的。
三、大数据证据质证形式化的形成逻辑
大数据证据运用障碍的个中原因,此前已多有研究指出大数据侦查及证据制度密度不足是关键。〔24〕参见张可:《大数据侦查措施程控体系建构:前提、核心与保障》,载《东方法学》2019 年第6 期。笔者完全认可这一观点,但不意图重复类似研究进路,而力求在制度与实践的底层结构中探寻大数据证据质证形式化困境的原因。概言之,就是从传统质证模式对大数据质证的影响,以及“大数据时代”刑事诉讼整体嬗变的双重维度,挖掘更深层次的动因。
(一)传统质证模式对大数据证据质证的影响
从我国现有质证模式的传统分析维度出发,大数据证据质证的形式化困境究其原因,首先源于我国传统质证模式的固有问题加剧了大数据证据质证的形式化困境。
1.传统质证模式本身就存在形式化问题
所谓质证形式化,是对目前我国刑事庭审既有质证模式的理论概括。其核心特点有下面两个:其一,庭审基本不考虑刑事被告人质证的能力和条件;其二,不管一份证据材料内容的多少和是否复杂,辩方都只能当庭在短短几分钟之内表明有无异议和异议的内容。〔25〕参见李建明:《刑事庭审质证形式主义现象之批判》,载《江苏社会科学》2005 年第3 期。大数据证据具有比传统类型证据更强的科学性、技术性和专业性,其质证活动对于被告人及其辩护人的能力、条件的考验显然更高,那么必然应当赋予大数据证据质证更加细密的规制。然而现实却是,一方面,大数据证据的质证规范明显不足,只是散见于最高人民法院、最高人民检察院和公安部《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(以下简称:“‘两高一部’电子数据证据规定”)与《人民检察院办理网络犯罪案件规定》等规范性文件之中;另一方面,参考科学证据、鉴定意见的质证实践,不难发现,既有的科学证据质证规则严重匮乏,〔26〕参见陈邦达:《科学证据质证程序研究——基于中美两国的比较》,载《现代法学》2017 年第4 期。鉴定意见的质证普遍存在审查形式化、〔27〕参见卞建林、谢澍:《庭审实质化与鉴定意见的有效质证》,载《中国司法鉴定》2016 年第6 期。过分偏重形式审查而忽视实质审查的问题。〔28〕参见杜鸣晓:《论我国刑事诉讼鉴定意见质证的完善》,载《证据科学》2017 年第5 期。
2.传统质证模式中交叉询问缺失
传统意义上的质证规则,在英美法系制度体系中包括了到场规则、宣誓规则、面对面规则及交叉询问规则等,〔29〕参见陈永生:《论辩护方当庭质证的权利》,载《法商研究》2005 年第5 期。其中最为核心的制度在于交叉询问。〔30〕参见顾永忠:《以审判为中心背景下的刑事辩护突出问题研究》,载《中国法学》2016 年第2 期。大数据证据本身并不会说话,甚至对大数据的分析结果非经专业人员释解,也不大可能转化成控辩审三方能够识别、认知的证据材料。如前所述,实践中大数据证据通常以对大数据的鉴定意见的方式提供,故存在着明显的“专家证人证言”色彩。由此观之,作为真实发现“发动机”的交叉询问,能够确保包括专家证人证言在内的证人证言更为准确和完整,〔31〕参见[美]约翰·W.斯特龙主编:《麦考密克论证据》(第五版),汤维建等译,中国政法大学出版社2004 年版,第62 页。其在大数据证据质证中的重要意义不容忽视。然而,我国刑事诉讼的现状使交叉询问这一理想制度难以充分发挥功用。一方面,是因为强职权主义制度传统使法官在质证程序中权力过大,出于诉讼效率的偏好,往往通过压抑交叉询问而减轻审判压力;另一方面,我国控辩双方均缺乏进行交叉询问的充足训练,致使庭审中质证方主要采取直接询问而非间接询问、交叉询问的方式进行质证。〔32〕参见左卫民等:《中国刑事诉讼运行机制实证研究》,法律出版社2007 年,第344-346 页。总的来看,目前我国刑事诉讼中交叉询问无论在制度设计还是实践操作上都处于一个较为欠缺的状态,控辩审三方的庭审质证能力都不够强。〔33〕参见刘文化:《权利与规则:我国刑事被告人质证权的透视与完善——以“司法文明指数”的数据样本为依据》,载《证据科学》2016年第1 期。对于大数据证据而言,交叉询问的缺失,使得其证据合法性与真实性的判断难上加难。即便能进行有限的质证,也主要偏重于形式合法性问题。但正如鉴定意见形式上的合法性并不能保障内容上的准确性一样,〔34〕参见杜鸣晓:《论我国刑事诉讼鉴定意见质证的完善》,载《证据科学》2017 年第5 期。如果不能对大数据证据的实质内容进行深入、细致、对抗式的质证,则其准确性颇为堪忧。
3.传统质证模式中庭前阅卷制度存在缺陷
质证并不仅仅是对证据资料的简单说明、解释和辨认,其主要内容是对证据的诘问与质疑,具有鲜明的对抗性。但是,这一对抗性质证工作的前提,在于控辩双方对彼此掌握的证据材料的充分了解,这必然要求控辩双方应在正式审判前了解彼此证据并进行有效准备,在域外主要体现为证据开示的制度设计。在刑事诉讼中辩方通常不承担无罪之证明责任,因此,这一证据开示义务主要应由控方承担。美国联邦最高法院在1963 年布拉迪诉马里兰(Brady v.Maryland)案中认为控方无论出于善意或恶意而封锁有利于被告人的证据,都是对正当程序的违反。〔35〕参见[美]约书亚·德雷斯勒、[美]艾伦·C.迈克尔斯:《美国刑事诉讼法精解》(第二卷·刑事审判),魏晓娜译,北京大学出版社2009 年,第139 页。随着时代的推移,目前美国律师协会基本上要求控方全面开示所掌握的全部证据,而不只局限于有利于辩方的证据,其中,就包括科学检测和检查所获得的证据。〔36〕参见[美]约书亚·德雷斯勒、[美]艾伦·C.迈克尔斯:《美国刑事诉讼法精解》(第二卷·刑事审判),魏晓娜译,北京大学出版社2009 年,第147 页、第149 页。我国并没有证据开示规则,但有与之类似的庭前阅卷制度。对于大数据证据而言,提前进行阅卷意义重大。由于大数据证据目前基本上是不利于被告人的证据,甚至是关键性的定罪证据,出于控辩实质平等的考虑,自然应当许可辩方提前获知证据信息,从而为有效质证提前准备。而且,大数据证据超强的专业性、科技性,使得大数据证据的质证难度大大提高,非有充分准备而不可为。倘若不对大数据证据提前阅卷,而庭审时径行大数据证据“突袭”,则会导致辩方根本没有机会进行充分有效质证,进而影响事实真相的查明。然而,我国庭前阅卷制度存在一定缺陷。一方面,体现为阅卷时间偏晚,在对辩护至关重要的侦查阶段不能查阅相关大数据证据信息;另一方面,更为突出的是目前我国刑事诉讼中存在内、外卷之分,在只可阅外卷而不可阅记载详细证据获取方法、程序及证据分析依据、手段的内卷的现状下,大数据证据阅卷存在明显不足,进而产生质证流于形式之虞。况且,在大数据和司法信息化背景下,法官审理案件的信息来源实际上已经突破了卷宗的范围,海量数据的涌入使得全面阅卷已然成为美好的设想。〔37〕参见郑曦:《超越阅卷:司法信息化背景下的刑事被告人数据访问权研究》,载《河南大学学报(社会科学版)》2020 年第2 期。
(二)“大数据时代”刑事诉讼整体嬗变与大数据证据质证
从“大数据时代”刑事诉讼整体嬗变的现代分析维度出发,大数据证据质证的形式化困境还与诉讼理念、证明原理、诉讼功能、权利保障的新变化、新要求密切相关。
1.大数据时代裁判思维的变迁
归根溯源,大数据证据的司法实践根源于大数据时代裁判思维的变迁,而这一变迁强化了对数字的信念,奠定了大数据证据类似于“证据之王”的“数字崇拜”,致使对其的质证难以充分有效。
在美国,“柯林斯案”将数字引入了传统上以文字为主要论证工具的司法场域。〔38〕参见[美]理察德·伦伯特编:《证据故事》,魏晓娜译,中国人民大学出版社2012 年版,第3-18 页。以数字、数据为载体的论证工具开始进入刑事司法,并扮演着日趋重要的角色。大数据的引入是这一司法变迁的最新也是最有力的工具性支柱。由于大数据的海量性、概括性和信息的巨大储备,因此,司法开始关注如何通过对大数据的挖掘进而“映证”案件事实。实践中发现,使用单一且分散的数据并不一定能够起到多大的证明作用,因为数据并不会自动呈现事实,只能通过分析与整合,将数据碎片“镶嵌”到结构性的算法中,才能发挥其整体性价值,这就是目前大数据运用中甚嚣尘上的“镶嵌论”的要义所在。〔39〕See David E.Pozen,The Mosaic Theory,National Security,and the Freedom of Information Act,115 The Yale Law Journal 628(2005).
在“镶嵌论”的思维模式下,牵引着司法裁判思维也出现了由单个信息个别证明向大数据信息整体证明的变化。具体而言,就是裁判思维出现了“数字解决主义”的倾向,其实质在于以数据计算取代论证说理,但“这种做法,将导致对司法裁判中的因果关系和归责关系的双重无视。”〔40〕冯洁:《大数据时代的裁判思维》,载《现代法学》2021 年第3 期。与“数字解决主义”相对应的是传统裁判中的“文字论证主义”,即通过文字性叙述,呈现证据(信息)与待证事实间的逻辑联系,同时,将这一待证事实放置于规范结构中,论证事实若成立,则规范性构成要件即为满足,通过“让目光往返于规范与事实间”的涵摄工作,达致案件最终的正确处理。但在“数字解决主义”中,证据(信息)与待证事实间的逻辑联系不再是文字性论证的因果关系,而变成了基于统计学、概率论的相关关系;与此同时,司法论证也不再是从待证事实到规范要件,而是反过来先找寻证立犯罪需要什么要件要素,以此为目标再去寻找能够证实这一要件事实的数据资料。也就是说,控方为了证明有罪,可能会根据有罪证明的需求对拟提出的大数据证据进行精心挑选、整理与分析,确保提交法庭的是能够恰如其分地证明控方意图证明的要件要素的数据。以此观之,如果数据本身就是“被选择的”,那么,旨在颠覆其效力的质证,自然也就很难实质性地进行了。
2.大数据证据以相关性证明取代因果性证明
大数据侦查及大数据证据的运用,重在把握相关性而非因果性。〔41〕参见胡志风:《大数据在职务犯罪侦查模式转型中的应用》,载《国家检察官学院学报》2016 年第4 期;胡铭、龚中航:《大数据侦查的基本定位与法律规制》,载《浙江社会科学》2019 年第12 期;杨婷:《论大数据时代我国刑事侦查模式的转型》,载《法商研究》2018年第2 期。其论证并非是因为有了数据支撑,所以必然或高度可能有相应结果发生。值得说明的是,这里的“相关性”不是指证据能力判断中的证据的相关性,而是在证明范畴内讨论证据与待证事实间的逻辑联系。申言之,大数据证据即便仅仅是概率推断,也当然满足证据能力对于证据相关性的要求;此处意图指出的不是大数据证据不可采,而是认为大数据证据证明力偏弱。例如,前述“彭某某侵犯个人信息案”中,控方从公司官方的70台数据库中调出了200 条个人信息,与被告人所控制的私人U 盘中的50 条个人信息比对,发现重合率高达76%,它说明的是被告人所控制的私人U 盘中的个人信息与公司数据库中储存的、不能外泄的个人信息高度相关(相关性),但并不能证明这50 条信息就是从公司数据库中拷贝的(因果性)。况且,70 台数据库中成千上万条个人信息中仅仅析出200 条个人信息进行比对,如何排除这样的合理怀疑:是否有可能控方先了解到被告人U 盘中储存的个人信息,再以此为查询条件从公司数据库中析出这200 条个人信息?
大数据证据以相关性证明取代传统刑事诉讼所要求的因果性证明,会带来多方面的问题。其一,其与传统刑事侦查与证明所要求的精确性冲突。〔42〕参见彭知辉:《“大数据侦查”质疑:关于大数据与侦查关系的思考》,载《中国人民公安大学学报(社会科学版)》2018 年第4 期。它实现的只是基于统计学判断的“大致如此”或“大概率如此”,但刑事诉讼所要求的是“认定如此”。其二,可能降低定罪的证明标准。我国《刑事诉讼法》第55 条已明确规定,定罪量刑的证据标准须“对所认定事实已排除合理怀疑”。但相关性的特点就在于,它只是从规律上说明了数据A 与待证事实B 间高度相关,但它不能证明“因为有证据A所以可以认定事实B 成立”。易言之,相关性的特点恰恰在于A 和B 之间的因果关系是可能的,而不是一定的,由A 到B 之间可以容纳相当程度的其他可能性。在这一点上,有研究已经发现了大数据证据与品格证据有一定的近似性。〔43〕参见刘品新:《电子证据的关联性》,载《法学研究》2016 年第6 期;王燃:《大数据时代侦查模式的变革及其法律问题研究》,载《法制与社会发展》2018 年第5 期。尽管大数据证据与品格证据在笔者看来并不能简单对应,况且还存在着大数据证据究竟类似于品格证据还是习惯证据的疑惑,〔44〕在美国,品格证据因为易引起审判者的偏见而一般被禁止,但习惯证据更为中性,不易引起偏见而普遍被允许。参见易延友:《证据法学:原则 规则 案例》,法律出版社2017 年版,第169-172 页。大数据证据是否会引起类似品格证据的“道德偏见”值得思考。但不可否认的是,它可能与品格证据共享了“过度概括”而忽视概括存在“例外”的问题。〔45〕参见[加]道格拉斯·沃尔顿:《品性证据:一种设证法理论》,张中译,中国人民大学出版社2012 年版,第209-213 页。大数据的运用必然存在这样的质疑:凭什么相信,没有可能出现数据统计不到的例外情况?
当然,由于我国刑事诉讼定罪证明标准是以“整体主义”或“亚整体主义”模式要求“综合全案证据排除合理怀疑证明”,而非“原子主义”模式下讨论单个证据是否可以排除合理怀疑。因此,可能的反驳在于:讨论单个大数据证据是否排除合理怀疑是否有意义?事实上,“原子主义”与“整体主义”并不存在绝对的对立关系。“整体主义理论并不排除对于原子分析的需要,而法官在对证据进行评价时亦可将原子与整体相结合。”〔46〕谢澍:《反思印证:“亚整体主义”证明模式之理论研判》,载《华东政法大学学报》2019 年第3 期。单个证据对事实的证明存有不可排除的合理怀疑,那么若干此类证据证明的组合即便形成整体,也会对全案证明带来系统性风险。如果不能正确处理大数据证据以相关性证明取代因果性证明的正当性问题,而径直以相关性证明取代因果性证明,则其实质是降低了刑事案件的证明标准,从证据确实、充分变成了“证据相关且充分”。这会带来两方面的影响:对控方而言,既然使用大数据证据可以降低证明标准,更易于证明有罪,则会更青睐大数据证据的使用;从辩方出发,否定相关性几乎是不可能完成的任务,特别是大数据证据的整体式分析,其带来的相关性证明效力往往很高,这就导致对大数据证据的质证,实际上也是一个不可能完成的任务。
3.被追诉人的数据权利保障缺失
在大数据时代,公民个人的“数据权利”成为了一个热点话题。从宏观上看,个人的“数据权利”包括三个方面:(1)对个人数据被收集、使用的知悉权以及在此基础上的同意收集、使用权;(2)对个人数据被转让的知悉权以及在此基础上的同意转让权;(3)在个人数据发生错漏时的要求更改权。〔47〕参见程啸:《论大数据时代的个人数据权利》,载《中国社会科学》2018 年第3 期。当然,大数据证据并不局限于被追诉人的个人数据,也包括被害人的个人数据、涉案产品数据、中立统计数据等,因此,也必然涉及对被害人和中立第三方的信息数据权利的保障问题。但限于本文研究主题,主要讨论的是大数据证据运用与被追诉人权利保护相关问题。由此,对应于刑事诉讼中被追诉人的数据权利则应为:其一,被追诉人对个人数据被追诉机关收集、使用的知悉权及“收集自愿性”保障;其二,当所收集的个人数据有误时,被追诉人要求更改的权利。
被追诉人在刑事诉讼中的数据权利在我国尚未得到足够重视。首先,在大数据侦查中,对个人数据的收集、使用基本不会告知被追诉人;被追诉人也不可能有“同意”或“不同意”追诉机关收集个人数据的权利。〔48〕参见郭华、李红霞:《刑事电子数据收集中的公民权利救济》,载《广西社会科学》2019 年第11 期。如果说,在传统刑事诉讼中,被追诉人至少享有供述自愿性的保障,那么,在大数据时代作为个人隐私重要组成部分的个人数据〔49〕参见郑曦:《刑事侦查中远程在线提取电子数据的规制》,载《国家检察官学院学报》2019 年第5 期。反而可以在被追诉人不知情,或即便知情也不能自愿且自主决定是否提供的情形下获取,这是否构成对被追诉人另一版本的“强迫自证其罪”呢?其次,龙宗智教授已经发现,在“两高一部”电子数据证据规定中并未区分强制与非强制侦查措施,很有可能规避法律对强制侦查措施的限制性规定,从而威胁被追诉人的合法权利。〔50〕参见龙宗智:《寻求有效取证与保证权利的平衡——评“两高一部”电子数据证据规定》,载《法学》2016 年第11 期。更令人担心的是,因为不区分二者,则追诉机关很可能在初查时就采取大数据强制侦查,从而违反刑事立案前禁止采取强制侦查措施的基本原则。〔51〕参见龙宗智:《寻求有效取证与保证权利的平衡——评“两高一部”电子数据证据规定》,载《法学》2016 年第11 期。犯罪嫌疑人、被告人基本上不享有对个人数据信息被用于不利于己之追诉的知悉权与同意权。最后,被追诉人也不享有对个人数据错漏的要求修改权。事实上,如果被追诉人无从知悉个人数据的具体情况,也就不可能提出有效的修改要求。
正是因为被追诉人在其数据被提取、使用时缺乏必要的权利保障,这便导致其对于大数据侦查行为而言几乎没有防御能力,这大大加剧了控辩间的不平等。刑事诉讼中数据权利保障的缺失,直接降低了辩方在后续大数据证据质证时的攻防能力,使质证成为了“无尖之矛、无甲之盔”。
4.大数据处理能力的不均衡分布
除了数据权利保障缺失带来的控辩失衡外,大数据处理能力的不均衡同样加剧了控辩力量的悬殊。实践中,侦查机关收集到大数据信息后,往往利用自身资源优势,以内部委托鉴定的方式对大数据进行分析、鉴定,进而形成大数据分析报告和鉴定意见。事实上,在庭审时,控辩审三方对于大数据报告或鉴定意见的形成过程、科学原理均可谓一无所知,只能对上述报告和鉴定意见的结论展开质证与认证。但因为分析报告和鉴定意见的做出,是在控方的申请、参与乃至控制下进行,故其结论、意见基本上是不利于辩方的。尽管辩方理论上可以对大数据证据再次鉴定,但实践中甚少为之。而且,考虑到目前刑事诉讼实践中鉴定人出庭率低的实际情况,对鉴定意见的质证即便在传统刑事审判中,也是一个突出问题。
不仅对大数据的分析、鉴定辩方难以与控方匹敌,对于更基础的大数据收集而言,辩方更为劣势。大数据刑事司法中,国家机关并不掌握个人数据信息,而是由相关网络信息从业者掌握。辩方基本不享有调取大数据信息的能力;大数据的掌控者也基本不配合辩方的调取。相反的是,这些网络信息从业者却承担着协助执法的义务。〔52〕参见裴炜:《数字正当程序:网络时代的刑事诉讼》,中国法制出版社2021 年版,第49-54 页。对于控方调取被追诉人个人数据信息的要求,可谓予取予求。
5.大数据的预测性应用与刑事法基本原理的冲突
值得注意的是,大数据证据的收集,不仅存在于刑事侦查活动中,还存在于初查活动中,甚至出现在前述预测性警务活动之中。一项研究显示,在美国孟菲斯,基于大数据预测分析的犯罪预防系统使当地犯罪率下降了31%。〔53〕参见[美]埃里克·西格尔:《大数据预测:告诉你谁会点击、购买、死去或撒谎》,周昕译,中信出版社 2014 年版,第 49 页。在我国,预测性警务至少包含两种形式的运用:其一,预测犯罪发生概率,随之前置性地消除犯罪风险。这一类运用一般不会产生大数据证据的运用问题。其二,预测并提示犯罪发生,为犯罪侦查提供初查依据;在随后的刑事诉讼中,这些预测性、提示性大数据证据又会成为定罪证据加以使用。此时,预测性警务活动中产生的大数据证据有可能在后续刑事诉讼证明中发挥作用,使得大数据时代的刑事诉讼可能颠覆既往“由案到证”的取证模式,而变为“由证到案”的预测式刑事侦查模式。
暂且不论预测性警务中获取的大数据证据是否符合刑事诉讼规范中对侦查行为的规定,究其法理而言,就有颇多可质疑之处。第一,基于大数据证据的预测发现犯罪,然后又以此大数据证据在嗣后审判中证明犯罪的成立,其实是论证上的自我重复。因为传统证据证明是对过去已经发生事实的回溯性证明,而此时却是以大数据预测之结果首先预判犯罪的发生,而后又以该“预测式证据”回溯证明犯罪事实成立,证明逻辑实际是“因为他会犯罪,所以他犯罪了”。第二,预测性大数据证据在审判中的应用与无罪推定原则相违背。〔54〕参见裴炜:《个人信息大数据与刑事正当程序的冲突及其调和》,载《法学研究》2018 年第2 期。因为它的逻辑其实是建立在“有罪推定”的基础上偏见性地、预测性地收集大数据证据,然后在司法审判中加以运用。证明逻辑实际是“因为假定他将犯罪,所以他犯罪了”。第三,任何数据描绘的只能是规律,而不可能映射规则。判断一个人有罪与否,不是看他是否满足犯罪的一般规律,而是就事论事地、规范地判断他是否满足犯罪的构成要件。“预测论只是外在观察者视角的产物,它无法取代裁判者立场(内在参与者的立场)下的裁判思维。”〔55〕冯洁:《大数据时代的裁判思维》,载《现代法学》2021 年第3 期。裁判的正当性根据只能是规则,而不能是所谓的规律。〔56〕参见王洪:《制定法框架下的判决论证模式》,载《比较法研究》2019 年第2 期。也就是说,刑事司法中的证明逻辑也不能是“因为他满足了犯罪规律,所以他犯罪了”。遗憾的是,现实中大数据的预测性功能持续影响着刑事审判。强烈的有罪倾向使审判者易于产生“符合规律的,就是可以被认定的”大数据认证思维。这种“锚定思维”〔57〕关于大数据、人工智能时代基于“科学迷信”所产生的裁判“锚定效应”,参见朱体正:《人工智能辅助刑事裁判的不确定性风险及其防范——美国威斯康星州诉卢米斯案的启示》,载《浙江社会科学》2018 年第6 期。使辩方的质证更难以被接受与采纳。
四、大数据证据质证实质化的基本构造
有鉴于前述大数据证据质证的形式化问题,应进一步思考如何实现大数据证据质证的实质化完善路径。从理想目标看,所谓大数据证据质证的实质化,是指大数据证据的质证须确保:(1)辩方可以充分发表质证意见;(2)法官心证的形成须以质证为基础;(3)控辩质证权利实质平等;(4)质证相关诉讼规则完善。据此,可以从被追诉人权利保障机制、裁判规则和质证思路三方面进一步提出对策性建议。
(一)被追诉人权利保障机制的完善
大数据证据质证的实质化,首先应当从保障控辩力量平衡入手。但与传统刑事诉讼中重点保障被追诉人诉讼权利的目标不同,在大数据时代的刑事诉讼中,应重点对被追诉人的数据权利与数据处理能力加以充分保障。有鉴于此,应主要建构被追诉人的知悉权、同意权、修改与排除申请权、要求释明权、证明请求权和数据辩护权等大数据刑事诉讼新兴权利。
1.知悉权
与传统刑事侦查显明性、直接性、物理性不同的是,大数据证据的获取存在明显的隐蔽性、间接性和电子性。申言之,被追诉人通常不知道个人数据信息何时、以何种目的、以何种方法被侦查机关所获取,也不知道这些被获取的个人数据信息以何种方法、何种原理分析、鉴定。一方面,相关的侦查取证不再表现为侦查机关的直接取证行为,而转变为侦查机关通过相关数据服务机构进行间接取证;另一方面,取证行为也不再体现为物理上的实际取得,而转变为电子形态上的复制、分析等,这就使大数据证据获取的秘密性大大增加。为从根本上保障辩方对于大数据证据质证的认识基础,有必要赋予并保障被追诉人对大数据证据的知悉权。
具体来看,应当做到以下几点:其一,在侦查机关调取被追诉人个人信息数据时,应当告知被追诉人及其辩护人。其二,应建立披露制度,尤其应向被追诉人披露大数据证据的来源、类型、算法、分析鉴定结论等。〔58〕参见张可:《大数据侦查措施程控体系建构:前提、核心与保障》,载《东方法学》2019 年第6 期。其三,由于个人向公共机构、商业公司等第三方数据保管者提供个人数据前,不可能预料到其提供的个人数据今后会被用来证明自己犯罪,因此,若中立第三方数据保管者负有协助司法义务,并有可能在国家执法机关要求下提供个人信息的,应当由该中立第三方数据保管者在用户提交个人数据前充分告知这一情况,由用户自由选择是否继续提供数据。德国《联邦数据保护法》也对侦查机关向公共机关提取个人数据设定了限制,“原则上,公共机关使用个人数据的目的必须和从受影响者身上取得数据的目的相同,例外的情形是为了犯罪侦查”。〔59〕[德]托马斯·魏根特:《德国刑事程序法原理》,江溯等译,中国法制出版社2021 年版,第34 页。
2.同意权
刑事诉讼中根据侦查是任意还是强制的,应赋予被侦查人员不同的诉讼权利。具体而言,对于任意性侦查,由于不涉及对被侦查人员基本权利的侵犯,故无需征得被侦查人员的同意便可为之。而对于强制性侦查,由于往往涉及对被侦查人员自由权、隐私权等基本权利的限制,在采取相应侦查措施前,应征得被侦查人员的同意。与此同理,可以将大数据证据划分为任意获取的大数据证据与强制获取的大数据证据。需要注意的是,大数据侦查不同于传统的侦查行为,其具有前述隐蔽性、间接性和电子性等特点,故“强制性侦查与任意性侦查的区别标准,不在于是否行使了直接强制的有形力,而在于是否侵害被调查人基本权利。”〔60〕谢登科:《论初查中收集电子数据的证据能力》,载《大连理工大学学报》(社会科学版)2021 年第4 期。对于不涉及被调查人基本权利的任意性大数据证据而言,调查机关可以径行取证;但对于涉及被调查人基本权利,如隐私权、财产权、关键性个人信息权等的大数据强制调查(侦查)而言,须在持有令状的基础上,征得被调查人同意方可为之。同时,上述关涉个人基本权利的个人数据信息通常不为被调查人本人掌握,而存储于第三方机构。因此,若调查(侦查)机关要求该第三方机构提交客户上述数据时,该第三方机构不得在被调查人未同意之前擅自交出涉及基本权利之关键性个人数据。德国刑事诉讼法进一步认为,尽管追诉机关可以对计算机信息进行在线搜查和对通信进行监控,但这一措施受到两方面的限制:其一,必须限定在特定的犯罪行为;其二,数据必须是处于传输途中,而尚未被储存在私人服务器或由私人所有的信息系统之中。〔61〕参见[德]托马斯·魏根特:《德国刑事程序法原理》,江溯等译,中国法制出版社2021 年版,第41 页。
考虑到我国刑事诉讼实践情况,同意权的设立不可能一蹴而就,较为合理的是首先赋予被追诉人知悉权,在此基础上,在进行涉及被追诉人核心基本权利的强制性大数据侦查时,应征得被追诉人的同意。对此,可以设立两项例外:一是重大犯罪的例外,可以考虑在危害国家安全罪、恐怖主义犯罪以及重大毒品、贪污、贿赂犯罪中进行强制性大数据侦查无需征得被追诉人同意;二是紧急情况的例外,即如果面临“延迟即危险”的紧急状况时,侦查机关可以先强制性取得大数据证据,嗣后可考虑由检察机关对这一取证程序的合法性进行审查,如果存在非法取证行为的,可适用非法证据排除制度处理。
3.修改与排除申请权
与传统证据质证中可能存在瑕疵证据与非法证据类似,大数据证据质证中也可能存在相同情况。但不同的是,对于瑕疵大数据证据仅仅进行补正和说明是不够的,因为数据本身的些微变动,有可能引发证明上的“蝴蝶效应”,即产生对整个大数据分析结果的重大变化,因此,关键点还在于对瑕疵大数据证据及其衍生鉴定、分析的整体性修改。对于追诉机关获取的大数据证据,如果其基础数据有误,或有删改、变更、遗漏情形的,被追诉人及其辩护人应有权申请修改。这一修改权的内容包含如下两点:第一,需要建立完备的大数据证据庭前阅卷制度,确保被追诉人的知悉权,使其能够提前了解大数据证据的相关信息,尤其是要允许辩方阅见基础数据信息,并保证辩方拥有充足的时间浏览、分析上述基础数据信息。第二,辩方提出修改申请后,应由控方负责审查数据的正确性,同时,控方负有证明数据信息真实、准确的证明责任。当然,也应允许辩方自行审查数据的正确性,并有权提出数据不真实、不准确的证明。换言之,对错误数据的修改,于控方而言是“修改义务”,对于辩方则是“修改权”。
此外,与传统非法证据排除不一样的是,大数据证据的排除除了侦查手段严重违法这一基本类型外,还应新增“难以修改”的大数据证据排除制度,即如果大数据证据超过合理限度的损坏、缺失、错误时应当予以直接排除,理由是大数据证据是以大数据之整体作为证明力基础,数据之大部谬误会对整体数据证明质量产生不可预测的风险,对超过合理限度的错谬数据的修改要么难以进行,要么虽可进行但同样难以确保修改后的证明质量,因此,有必要赋予辩方对“难以修改”的大数据证据的排除申请权。当然,何谓“超过合理限度的错误”应根据具体大数据证据具体分析。
4.要求释明权
出于维护控辩平衡的考虑,对于大数据证据的获取、分析、鉴定和使用中的专业性问题,辩方有权要求承担上述职能的国家机关释明。辩方并不负有对大数据证据获取、分析、鉴定和使用中出现的专业性问题与科学原理的学习义务,而应由国家机关承担释明义务,以确保辩方能够充分了解其中的专业知识,从而实现有效应对与质证。尤其在使用算法等人工智能技术对大数据证据进行分析的场合,应当对算法的合理性、科学性和稳健性设置相应的解释要求。〔62〕See Rebecca Wexler,Life,Liberty,and Trade Secrets:Intellectual Property in the Criminal Justice System,70 Stanford Law Review 1343(2018).
5.证明请求权
证明请求权,“是指对于在认定事实上所必要的证据,应享有提出证据以证明事实的权利”。〔63〕高波:《大数据:电子数据证据的挑战与机遇》,载《重庆大学学报(社会科学版)》2014 年第3 期。其规范目的在于避免诉讼两造隐匿证据,以免有损诉讼公正与实体真实。在刑事诉讼中,由公诉机关承担证明被追诉人有罪之证明责任,且追诉机关负有的“客观义务”,因此,国家追诉机关不得隐匿有利于被追诉人的大数据证据。辩方如果知悉有利于己方的大数据证据存在,而侦查机关拒不调取,抑或公诉机关拒不移交、举证的,可以请求法院调取相关证据并当庭质证。另外,在审前程序中,也应强化公安司法机关与律师的配合,协助辩方挖掘有利于己的大数据证据,同时,科以侦查机关、检察机关在大数据证据运用中,有利于辩方证据的识别义务。〔64〕参见裴炜:《数据侦查的程序法规制——基于侦查行为相关性的考察》,载《法律科学》2019 年第6 期。
6.数据辩护权
通常认为,在刑事诉讼中,辩方没有证明自己无罪的证明责任,但辩方有权使用证据为己身开脱罪责。但传统刑事辩护的目标在于“事实无罪”或“法律无罪”,即要么从已有证据中推翻控方的事实叙事,或提出充分的合理怀疑,在事实层面否认犯罪的成立;要么虽然认可证据事实,但从法律层面论证不成立犯罪。但在大数据刑事诉讼中,大数据证据不仅可以用来证明被追诉人有罪或罪重,同样可以用来证明被追诉人无罪或罪轻,此即为“数据无罪”概念。〔65〕参见裴炜:《个人信息大数据与刑事正当程序的冲突及其调和》,载《法学研究》2018 年第2 期;See Joshua A.T.Fairfield,Erik Luna,“Digital Innocence”,Cornell Law Review 99(2014):981.“数据无罪”与传统“事实无罪”“法律无罪”的区别如下,一方面,它并不是从事实上否认犯罪发生或犯罪非被追诉人所为,而是从数据分析上推论没有犯罪发生或犯罪非被追诉人所为。对于证明犯罪而言,大数据证据仅能揭示相关性而不能揭示因果性是一个问题,但在辩护方面仅需揭示合理怀疑即可,而并不需要证明合理怀疑确实为真,故大数据证据可以通过对存在合理怀疑的概率推断进而推论无罪。另一方面,“数据无罪”也不是在法律层面证明事实与犯罪间不存在涵摄关系,而是从数据概率上推断被追诉人犯罪的概率低或无,用以提示合理怀疑的存在,进而否认犯罪。数据辩护权便是以“数据无罪”为基础,以大数据分析的概率推断论证犯罪的不成立。数据辩护权与传统的刑事辩护权利与策略具有较为明显的不同。
(二)裁判规则的完善
大数据证据的实质化质证及正确认证,不仅需要从权利保障方面对控辩力量进行再平衡,而且需要裁判主体更新裁判思维。据此,应有下述裁判规则的完善。
1.大数据证据及其衍生品只应用于补强或反驳
如前所述,大数据证据的证明逻辑其实是以相关性代替了因果性论证,故而与刑事诉讼的精确性以及无罪推定等基本原则相抵触。如若单独使用大数据证据证明定罪事实,则可能产生以概率推断替代事实推断的隐忧。但这一问题的出现,其实预设了大数据证据作为定罪证据独立存在并使用的前提条件。当大数据证据只是作为对其他定罪证据的补强证据使用时,其实与其他类型的补强证据一样,并不存在上述抵触。因为,此时大数据证据并非“原子式“地证明待证事实,而是通过概率推断,强化了其所欲补强的目标证据的证明力。换言之,此时的大数据证据是对另一份证据证明力的“证明”。
与此同时,对大数据证据的限制使用,其理论基础在于对犯罪嫌疑人、被告人的权利保障,尤其是对辩护权的保障。但如果被追诉人的辩护权已经予以保障和实现,那么出于控辩平衡的考虑,也不应当过于限制控方对大数据证据的使用。例如,如果辩方率先提出无罪或罪轻证据,则控方已掌握的可以反对该无罪或罪轻证据的大数据证据,也可以用于反驳。在补强和反驳的运用中,由于大数据证据的证明力附着于其所欲补强或反驳的基础证据,因此,它并不需要与待证事实具有因果性(该因果性是对基础证据的要求),而只需要与基础证据相关即可。具体来看,首先,大数据证据及其衍生的分析报告、鉴定意见不可作为独立的定罪证据使用,以免违背刑事诉讼基本原则。其次,大数据证据及其衍生品可以用于补强本方的其他定罪证据。例如,查获医保骗保事实后,可以利用被追诉人近几年的异常购药、申报保险的行为大数据予以补强。最后,大数据证据还可以用于反驳辩方提出的无罪或罪轻证据。例如,辩方提出不在场之证据,控方可以利用被告人行程大数据予以反驳等。
2.预测性警务大数据证据排除
预测性警务大数据证据其实是以“未来可能的犯罪”以证明“当下已经犯罪”,或以“其行为大概率符合此类犯罪规律”以证明“具体行为人大概率实行了犯罪”。实质上是以规律取代规则进行证明与裁判,以抽象的犯罪概率证明具体行为人从事了具体行为。前已论及,这与刑事诉讼法基本法理相抵触。这本质上是将大数据证据以类似于品格证据的方式使用,应参照品格证据排除规则予以处理。德国法也明确禁止将基于犯罪预防实行的在线搜查的结果转化为刑事诉讼证据使用。〔66〕参见[德]托马斯·魏根特:《德国刑事程序法原理》,江溯等译,中国法制出版社2021 年版,第42 页。当然,我国目前并未有明确的品格证据排除规则,因此,实务中可以考虑认定预测性警务大数据只是对个人行为的描摹与预判,其与案件本身并无直接关系,仅能说明行为人的行为与系统预测的犯罪具有概率上的较高符合性,并不能将这一数学上的概率与事实上的确定性建立必要的逻辑联系,故可以以不具有关联性而排除。总之,以预测为目的收集的大数据证据不应当用于证明“本案”的被告人更有可能犯罪。
3.侦查人员与分析人、鉴定人强制出庭
为配合前述被追诉人的要求释明权的要求,在大数据证据的司法审查过程中,应当要求取得大数据证据的侦查人员与生产大数据证据衍生品的分析人、鉴定人强制出庭,说明大数据证据的取得过程、方法、保管链的合法性,以及大数据分析报告、鉴定意见做出的程序、科学原理与结论的稳健性。同时,允许辩方对上述人员进行质询。对于没有正当理由拒不出庭的侦查人员、分析人和鉴定人,该份大数据证据一律排除。目前,我国刑事诉讼法已经明确规定了侦查人员出庭说明情况和鉴定人出庭的规则,因此,实践中的适用没有规范上的障碍。不过,考虑到大数据证据的特殊性,此时侦查人员和分析人、鉴定人的出庭应当是强制性的,不以辩方是否提出对证据的异议,以及是否申请上述人员出庭为前提条件。这是因为,大数据证据的专业性问题,不仅会困扰辩方,造成审判者的误解与困扰,故上述人员出庭不仅是出于保障辩护权的需要,同样也是保障审判者正确裁判的需要。
(三)质证思路的完善
除了在规范层面强化对被追诉人的权利保障,以及在裁判上明确一定规则以外,辩方也应主动适应大数据时代刑事辩护的变化与需要,合理改造对大数据证据质证的思路。
1.强化对大数据证据中个人信息保护的质证
在大数据时代的刑事诉讼中,个人信息保护成为了一个关键议题。诸多侦查手段都有可能对个人信息保护形成冲击。例如,电子监控、手机定位、远程数据提取、网络搜查等等;又如预测警务中收集海量个人信息等。〔67〕参见郑曦:《刑事诉讼个人信息保护论纲》,载《当代法学》2021 年第2 期。实践中尽管已经意识到个人信息保护的重要性,但囿于目前我国刑事诉讼规范体系中对于个人信息保护规定的零散与滞后,很难形成有效的辩护意见。
尽管如此,我们仍然可以利用现有的制度资源进行一定程度的大数据证据质证。具体来看,首先,可以通过刑事诉讼中的个人隐私保护规定进行质证。根据我国《刑事诉讼法》第152 条第2 款的规定,技术侦查对知悉的个人隐私应当保密。“两高一部”电子数据规定以及2019 年公安部《公安机关办理刑事案件电子数据取证规则》均进一步规定,电子数据涉及个人隐私的应当保密,同时还规定禁止进行可能泄露公民个人信息的电子数据侦查实验。由此,大数据证据中涉及公民个人隐私的部分应格外细致审查,对于在侦查过程中不当泄露个人隐私,或对涉及个人信息的大数据证据进行侦查实验的,应当提出侦查手段违法进而排除证据的要求。其次,充分运用比例原则的法理,对大数据证据的获取进行质证。《刑事诉讼法》第152 条第3 款规定,采取技术侦查措施获取的材料,只能用于对犯罪的侦查、起诉和审判,不得用于其他用途。由此,大数据证据本身也只得用于刑事诉讼的目的,此谓比例原则中的目的正当性。同时,大数据证据的获取手段还应平衡犯罪打击与公民信息权利保障间的比例关系,遵循最小侵害原则获取证据。此外,大数据证据的取证主体往往是第三方主体,因此,在审查相关大数据证据获取手段时,应将上述第三方主体的取证行为视为侦查机关的侦查行为,其合法性判断准用刑事诉讼法的相关规定。
值得注意的是,大数据证据的取证是否可以被解释为技术侦查还存在一定的争议。但不可否认的是,与传统技术侦查相当的电子侦听、电子监控、远程数据提取等,显属技术侦查的核心范畴。并且,从技术发展的角度看,未来技术侦查的范围将大大超越传统之监听、监视、卧底侦查等,大数据侦查、电子侦查理应被解释为技术侦查的具体手段,此处不赘。
2.强化对大数据证据中数据安全的质证
有研究指出,在司法信息化的刑事诉讼场域中,数据安全本身存在巨大风险。其中,突出表现为一是数据互联互通、共建共享中的数据失控风险;二是技术性工作外包所增加的数据泄露、“系统后门”风险。〔68〕参见郑曦:《刑事司法中的数据安全保护问题研究》,载《东方法学》2021 年第5 期。与此同时,大数据证据的物理载体也存在完整性风险,由此提示我们对于大数据证据来源、载体和保管的质证,可以有如下创新思路。
其一,大数据证据的获取通常是由技术性工作的外包或第三方数据平台企业完成,故存在数据泄露、伪造的风险。一方面,需要认真审查大数据证据提取时的技术可靠性,以及是否存在数据泄露进而侵犯个人隐私、个人信息的情况,另一方面,还要审查大数据证据提取、保存技术中是否存在“系统后门”,致使隐蔽修改数据的可能性大大增加。
其二,数据不能独立以其个体存在,而须以一定的媒介、载体存储,故数据载体是否足以确保数据的完整、准确成为了质证时的一个关键点。有实务研究发现,目前大数据取证工作面临着诸多技术挑战,例如,新型智能设备的物理封装一致性增强,芯片与储存器的剥离难度很大;云技术的发展使储存介质去中心化分布;反取证技术的迅猛发展等。〔69〕参见金波等:《电子数据取证与鉴定发展概述》,载《中国司法鉴定》2016 年第1 期。这提示我们一定要对数据储存载体持续关注。对于非破拆式原始数据载体取证,如直接扣押服务器、硬盘等,要关注原始数据载体封装的一致性、保管链条的完整性。而对于破拆式数据载体取证,如从智能手机上剥离芯片与储存器等,则还应重点关注破拆时可能出现的数据损毁等问题。同时,对于加密储存的数据,还要重视对解密过程的质证。
其三,大数据证据往往是以电子数据加以保管的,因此,要着重审查存储系统平台的互联互通性是否留有任意篡改、伪造的可能性。鉴于大数据取证时可能出现的完整性与实时性问题,〔70〕参见冯姣:《互联网电子证据的收集》,载《国家检察官学院学报》2018 年第5 期。可以从以下两个方面进行质证:在完整性方面,主要关注取证时是否完整地复制了数据;是否对数据进行了转换、修改;是否在保管、移送过程中确保了数据的完整复刻,在一些无法完整使用全样本数据的情形下,要特别关注抽样的科学性。尤其重要的是,数据即便完整复刻、保存,也要持续关注存储系统平台是否高度封闭以避免远程任意修改。在实时性方面,要注意数据取得的时间点,关注数据是否有更新、修改记录;追诉机关提取的是否是最新版本的数据,等等。
3.强化对大数据证据中数据分析的质证
大数据证据的分析、鉴定过程同样有可能因为人为因素、主观因素的影响而产生错误。这其实是所有科学证据共有的特点与质证点,在此需要强调三个方面:第一,对于大数据证据应进行全面审查、复核,在有技术困难或技术壁垒的情况下,可以选择通过第三方重新鉴定的方式予以审查,尤其与案件相关性较弱或证明力存疑的大数据证据,更应不辞其责地尽力重新鉴定、分析与检验。〔71〕参见谢君泽:《论大数据证明》,载《中国刑事法杂志》2020 年第2 期。第二,应充分发挥专家辅助人的作用,对控方提出的大数据证据从取得、保管、分析、使用的全流程进行质询。第三,在条件允许的情况下,要主动调取并掌握有利于辩护的大数据证据。对于知道有利于辩护的大数据证据存在,但因不可归结于己身的原因无法获取的,应主动请求法院调取。
五、结 语
综上,大数据证据质证的形式化会带来诸多问题,难以确保大数据时代刑事诉讼的有效、顺利进行。对此,我们需要以加强被追诉人权利保障为出发点,对裁判规则和质证思路进行重构与完善。当然,大数据证据质证的实质化改进是一个全方位、多系统的整体性优化体系,笔者也只是从分析大数据质证形式化的问题与成因的基础上,提出一个初步的、概貌式、框架性的改良方案,如何确保大数据证据在刑事诉讼中的合理运用,还需要随后进行更加深入、具体的思考与规划。未来关于大数据证据的基础性研究同样有进一步拓展和深入的巨大空间,如大数据证据的概念、大数据侦查的法律规制、大数据证据的证据能力与证明力规则的构建等,可能成为大数据证据“论域群”的核心问题源与增长点。总之,在大数据、人工智能持续影响刑事诉讼发展变化的基础上,可以结合新技术、新问题,提出更多更细致的新思维、新举措,共同迎接大数据刑事诉讼时代的到来。