海量证据审查机制的制度化构建
——以电信网络诈骗犯罪为视角
2022-02-05王勇马秦越
王勇,马秦越
(西南政法大学刑事侦查学院,重庆 404100)
一、引言
近年来,随着全国各地对传统型犯罪的深度治理,加之新冠疫情的影响,传统犯罪发生率有所回落,但以电信网络诈骗犯罪为首的信息网络犯罪却处于高发态势,“黑灰产”也随之爆发增长。在我国多数大中型城市,电信网络诈骗犯罪的全年刑事立案数已占公安机关全年立案数的50%,在部分沿海发达城市则达到70%以上。在虚拟社会和现实社会并行的“双层社会”境况下,诈骗行为得以和信息网络技术相结合产生乘数效应,其社会危害性远超传统类型的诈骗犯罪。
在实践中,一方面,电信网络诈骗犯罪涉及的被害人数量往往较大。一个运作成熟的电信网络诈骗团伙所涉及的被害人往往有数百人甚至上千人之众,涉案金额往往也相当巨大,其银行流水、通话话单、聊天记录动辄达到数十万、数百万条。另一方面,电信网络诈骗犯罪所涉及的主要证据类型为电子数据,且其体量与诈骗组织成员人数、受害人群体大小成正向变化关系。在运作形成一定规模的诈骗组织所实施的诈骗案件中,被扣押的涉案电子设备数量达几十部甚至几百部的电诈案件并不少见,[1]由此产生的聊天记录、转账记录、通话记录以及电子数据检查工作报告、卷宗及卷宗内附光盘的数量都远超传统犯罪中上述证据或证据载体的数量,用“海量”一词形容涉案证据体量并不为过。海量证据导致的审查困难、效率低下、司法资源过度占用日渐成为刑事诉讼领域面临的难题。
近年来,公安机关已经摆脱了过去对电子数据认识不足、缺乏处理手段的境况,现阶段的电子数据取证工具,诸如Encase、X-rays、FTK等,已具有相当丰富的功能和稳定的支撑能力,侦查人员在面对海量证据时无非是需要更大容量的存储介质和载体来复制存储目标镜像,以及需要性能更加优越的计算机进行处理而已。因此,侦查阶段对海量电子数据的取证已不再是过于困扰司法实践的难题。由于公、检、法三机关在刑事诉讼中证据实际证明标准的不同和技术能力的差异,当下受海量证据困扰最严重的是负责联通侦查与审判职能的检察机关。鉴于海量证据的审查要求较高的技术,因此在诉讼结构方面,缺乏对海量证据的实质审查导致侦查中心主义有所抬头。[2]因此,提升检察机关对海量电子数据的处理能力是在办理信息网络犯罪案件中贯彻“以审判为中心”要求的急务。本文认为,要在审查起诉和审理阶段对海量证据进行高效处理,同时达到随着刑事诉讼进程逐级提高的证明标准要求,首先需要对海量证据概念进行科学的梳理和界分,以起到纲举目张、执本末从的作用。
一、海量证据概念界分与内涵梳理
(一)海量证据概念之界定
“海量证据”一词不同于电信网络诈骗,并非是近30年信息网络技术发展的产物。实际上,海量证据是一个具有一定历史维度的概念,如1946年5月3日的“东京审判”中,记录法庭审理全过程的英文庭审记录达48412页,控辩双方共提交书面证据4336件,经我国整理出版的法庭受理的证据资料就达50卷,约3万页,出庭作证的证人也达到12个国家的419人,判决书长达1213页。[3]由此可见,海量证据并非仅存在于信息网络技术较为发达的今天,只是由于技术进步变相扩张了行为人所实施的欺骗行为的影响范围,海量证据问题才变得较为常见。
从概念上看,海量证据意指犯罪构成要件和量刑要素的证明需要数量极多的证据予以完成的情况。海量证据并不属于法定的证据类型,而是由一种或者数种法定证据类型糅合形成,在不同案件中其所包含的证据类型可能会发生变化。关于何为“海量”,目前在学理上和实践中尚未给出一个确定的计量标准,也正是由于计量标准的模糊、不确定,导致既往研究大都忽略对海量证据概念的界分以及与其他相近概念的辨析。
当前司法实践中案件的卷宗数量动辄达到数十或者数百卷是比较常见的现象。如笔者在工作中办理的一起非法吸收公众存款案件涉案金额达到3个亿,被害人分布于全国20多个省份,且嫌疑人人数较多,案卷卷宗数量也因此达到110余卷。虽然数十或数百本卷宗的案件证据体量已处于较多的状态且审查相对困难,但其尚处于一个配备合理数量检察人员的办案团队的业务能力承受范围之内,并不当然属于海量证据。
与之相比较,本文认为要构成海量证据,其证据体量应当达到使专业办案团队的办案人员在花费足额甚至超额工作时间后仍无法在规定期限内办结的程度,换言之,当某一案件对证据处理能力的要求已超过承办团队的处理能力上限时方可称之为海量证据,应与处理起来较为费时费力、尚处于处理能力范围内的较多体量的证据相区分。
(二)海量证据与大数据证据之界分
有学者认为,大数据证据是指数据量巨大、种类较多、价值密度低且能被编译成分析报告的证据。[4]该观点指出了大数据证据的基本特征,但是对大数据证据概念界定仍然不够明晰,因为海量证据同样具有上述3个特点,此概念并没有准确辨析大数据证据与海量证据的区别。
不可否认,大数据证据与海量证据具有许多相似之处,比如,都是众多证据的聚合,都具有证据体量巨大、价值密度低等特点,但二者实质上完全不同,并不能将二者等量齐观。表面特征的高度相似性导致二者在理论研究和实践中极易被混淆,(1)参见刘品新.论大数据证据[J].环球法律评论,2019(1):22.文中有如下论述文字,“在这里,起到证明作用的就是海量数据凝练而成的规律性认识——具体呈现为专业分析报告。这是大数据用作证据的特色及魅力所在。这样的分析报告类似于鉴定人或其他专家的意见,但也与之有明显不同,其专业化程度已经超越人类的专家。准确地说,其是借助于机器算法形成的判断。在前述e租宝案件中,北京检察机关曾经对海量的电子数据做了分类处理。其中,对于涉案人员的手机数据和产品介绍数据,主要是通过扣押、勘验、检验、远勘的方式形成扣押清单、勘验笔录、数据刻盘、远勘笔录等证据,这是以电子介质的载体和电子数据的内容来证明案件事实;对于相关的资金流水数据、OA办公系统数据,主要是通过通知调取、扣押、勘验、委托鉴定的方式形成镜像数据、扣押清单、勘验笔录、鉴定意见书等证据,这是以转化性证据来证明案件事实。它们的共同之处是利用证据所蕴含的内容或信息。回看该案的办理过程,司法证明的思路在整体上仍然是将大数据材料转化为传统证据,即以转化性证据办案。如此办案不仅费时费力,而且也呈现出‘固守’传统证据的陈旧观念。假如该案能够将基于海量资金数据的各种分析报告(其时主要是服务于侦查工作)提交法庭,那就跃升到一个更高级的司法证明层次,即将大数据用作证据证明的新境界。”文章题目为“大数据证据”,而文中“海量证据”和“大数据证据”概念交替出现,也未对二者做出一定的界定和区分。必须对二者界限清晰界分后才能有效开展进一步研究。
本文认为,大数据证据应当是指证据实际表现为数据集(datasets)的形式,其数据尺寸已经大到无法由传统的数据库软件去采集、储存、管理和分析的证据。大数据证据带来的困难是如何有效的实现证据可视化以及如何克服传统数据库处理能力不足的问题。海量证据虽然证据量巨大,但是其数据尺寸仍然能够由传统的数据库软件处理,其审查处理的难点在于非结构性、半结构性数据如何摆脱对人工审查的依赖,快速准确地完成证据审查工作。另外,大数据证据由于数据量过于庞大且常以代码的形式表现出来,根本无法实现人工审查处理,最后的结果表现为分析报告的形式;而海量证据则可以由人工逐一审查,只是在工作量上有违效率原则,难以实现高效处理。二者的数据量、对处理能力的要求、处理难题等方面完全不同。从二者关系上看,应当认为海量证据处于向大数据证据衍变、尚未突破处理能力极限的阶段。若其证据体量进一步增加超出了现存处理工具的能力范围时,海量证据则从此时转变成了大数据证据。
(三) 海量证据之分类
现阶段,学界对海量证据的分类研究较为稀少。有观点认为,可以根据证明对象的不同将海量证据现象分为“犯罪对象证明的海量化”“犯罪行为证明的海量化”和“犯罪情节证明的海量化”。[5]本文认为,理论应当指导实践并最终回归到实践中去,上述分类方式对于海量证据的研究并不具有太多的实践指导意义。司法实践中所涉及的各类犯罪,尤其是以电信网络诈骗为代表的新型信息网络犯罪,其涉案证据往往在对象、行为、情节各方面的证据体量都达到了海量的程度。而且,犯罪行为、犯罪对象与犯罪情节之间是相互结合、密不可分、动态平衡的,三者的证据体量一般是正相关关系。犯罪行为通常会影响到犯罪情节的认定,犯罪行为证据体量的增多通常会不可避免地导致认定犯罪情节的证据增多,司法实践中几乎不会出现其中一种证据体量远超其他证据体量的情况。因此,由于三者的密切结合关系,上述海量证据分类方式并无太大意义,并不能为司法实践中海量证据审查困境的纾解提供足够明确的思路。
本文认为,海量证据问题是技术进步带来的司法审查多重难题的耦合,要对其有效规制必须厘清其构成,做到有的放矢。因此,要使海量证据分类具有实践指导意义,就应当按照不同类型的海量证据给司法实践带来的不同难题进行分类。具体来说,可将海量证据分为获得性困难证据和处理性困难证据。获得性困难证据是指以电信网络诈骗犯罪中的被害人陈述、证人证言为代表的证据,由于被害人、证人往往分布于全国各地,其给司法实践带来的难题在于证据收集困难。处理性困难证据的典型代表是电信网络诈骗犯罪中大量存在的电子数据,如在涉案金额巨大的电诈案件中,聊天记录能达到数百万条,资金流水能达到上万条,通话记录等数据以TB为单位等。这类海量证据带来的司法难题不在于如何收集、提取,而在于如何实现证据的可视化以及高效地审查处理,能够从上万条低价值密度的证据中迅速锁定、提炼出有助于定罪量刑的那一小部分证据。对于获得性困难证据而言,其能否得到处理的关键与是否有足够的人财物力支持以及被害人、证人的配合程度密切相关,实践中的应对困境主要涉及体制设计问题,其解决也需要立法机关、司法机关、行政机关相互配合、统筹规划,并不属于单纯的法学问题,与证据法也并无太大的牵连,故而本文主要以处理性困难证据为研究对象。
二、海量证据审查现状
当前的司法实践中,诸如底线证明、等约计量等方法并未被司法机关工作人员所广泛接受、运用到案件证据审查中,只有综合认定法得到了一定的承认与运用。究其原因在于,司法实务部门一方面受到了简化证明思路带来的审查效率提升的吸引,另一方面又对该思路与刑事诉讼证明标准是否兼容还存在一定的怀疑,故实务部门退而求其次,在过于激进的简化证明思路和难以适应实践的传统证明思路中选择青睐居于二者之间的综合认定法。
在《刑事诉讼法》刚刚确立电子数据这一证据类型初期,实务部门对电子数据取证主要依靠引进的国外取证工具。在经过20多年长足发展后,一批具有独立知识产权、功能强大、界面清晰、操作便捷的国产电子数据取证软件被研发出来,并且相当一部分具有足够强大的运算能力能够支撑侦查阶段海量电子数据的检索、取证。(2)如以“盘古石”“取证大师”等为代表的一系列优秀国产电子数据取证软件。正如在2022年“电子证据与网络犯罪检察论坛”(3)该论坛由最高人民检察院网络犯罪研究中心、中国人民大学法学院证据学研究所、中国人民大学网络犯罪与网络安全研究中心联合主办。第20讲中,杭州市人民检察院、北京市东城区人民检察院的检察技术部门相关负责人所说,目前司法实务中海量电子数据的取证技术已相对成熟。
但是,也要看到,目前尚没有任何一款专门以检察机关工作人员为应用主体的电子数据审查软件,面对海量电子数据,检察机关工作人员只能暂时采用“侦查机关取证软件+脚本”或“侦查机关取证软件+人工”的方式进行审查。有学者将目前检察机关面对海量电子数据的主要问题归纳为“看不到、搜不着、用不好”。[6]具体来说,可概括为以下几点:
第一,检察技术力量实践中分配不均,区县的基层检察机关以及中西部偏远地区的检察机关检察技术人员配备严重不足,且能力参差不齐,导致许多基层单位在面对海量电子数据时束手无策,难以寻找到合适的工具将电子数据进行可视化处理。第二,即使电子数据可予以可视化处理,由于缺乏专业的审查工具,检察官也难以对电子数据,尤其是半结构化、非结构化的多源异构数据进行检索,不能在海量证据中准确锁定关键证据,只能靠人工手动逐页浏览翻阅,在加大检察人员工作负担的同时,也严重影响诉讼质量和效率。第三,海量证据是一座蕴含着丰富价值信息的宝库,其相当于行为人在数字领域投射的映像,往往蕴含着大量未发现的有价值的信息,只是碍于其价值密度低的特点,难以对其进行充分有效的挖掘。
上述情况也从侧面反映出我国法律职业共同体在智慧化办案进程中仍然存在着“各自为战”“烟囱林立”的现象。按照我国《宪法》有关规定,公、检、法三机关作为法律职业共同体的重要组成部分,在分工负责、相互制约的同时也应互相配合。在推行“智慧法治”“以审判为中心”改革以提高诉讼效率和质量的过程中,三机关理应形成合力、协同奋战、共享信息资源,而非各自为战,互相推诿,否则法治建设难以取得良好效果。
司法实践中检察机关内部还存在着检察业务人员和检察技术人员的工作不谐问题,许多检察机关的业务人员和技术人员无法拧成一股绳、形成合力。据某市检察机关技术处相关负责人介绍,许多检察机关的技术人员与业务人员之间缺乏互信,在日常办案工作中,业务人员往往不会主动邀请技术人员对案件审查、办理提供技术支持和建议,技术人员也不会主动提供技术帮助;许多检察机关的技术人员承担着类似于行政辅助角色的工作,对单位的电子设备进行维护和修缮,检察技术部门对办案工作的价值没有得到业务部门的充分理解,其对办案的技术支撑作用也没有得到充分发挥。因此,在实践中就形成了公安机关在将案件移送审查起诉时,只向检察业务人员汇报,而不会主动向技术人员进行汇报、讨论的做法,进而极大影响了诉讼效率的提高。(4)参见任司东.赵宪伟,刘政,徐衍,刘品新等.海量电子证据如何审?[EB/OL].http://www.360doc.com/content/22/0802/09/78204229_1042284800.shtml个人图书馆.需要明确的是,随着“以审判为中心”的诉讼制度改革和检察机关司法体制改革的不断推进,检察机关技术部门应当从司法鉴定回归到证据审查等检察监督的重心中来,检技协同、检技合作是当前检察机关面对新型信息网络犯罪唯一能够现实落地的应对路径,是提高证据审查效率、解决技术性证据审查难题的可行措施,应当在各地检察工作中予以贯彻和落实。
实践中部分检察机关已经认识到了检技配合的重要价值,也已经在其辖区范围内开展了相当有意义的尝试,并摸索出了一套属于自己的独特思路和方法。以浙江省检察机关为例,其在远程技术性证据审查专用服务器上增设ftp服务功能,并开发网络远程技术性证据审查软件与统一业务应用系统对接,能进一步完善线上线下的技术支持体系,让数据多出力,让案件承办人员少跑腿,为检察机关委托开展技术性证据审查提供了更加便捷有效的技术支撑。[7]
三、现有海量证据应对理论评析
(一) 等约计量
由于信息网络技术和传统犯罪结合产生乘数效应,不仅使得犯罪行为的危害结果成倍扩张,而且使新型犯罪出现了犯罪对象、犯罪行为海量化的特点,在进入侦查和司法程序后集中体现为证据海量的特点。
有学者认为,由于部分新型犯罪证据体量过大,司法机关工作人员在保障效率的前提下,要对全部证据进行有效审查,对犯罪数额、犯罪情节进行精确认定存在着客观不能。在对海量证据无法计量或者难以计量时,不能再按照传统犯罪的审查计量方法即人工方法进行处理,应当在海量证据案件中引入等约计量的处理方式。等约计量与精准计量相对应,要求以“可能性的计算”代替“计算的精确性”,按照“大约等于”的方式,对网络犯罪中的数额加以计量。[8]有学者认为,对海量证据在真实性方面完全查证属实存在着客观不能,“大数据”证据(5)此处的大数据证据意指海量证据。通常用概率说话,而不是板着“确凿无疑”的面孔,当我们试图扩大规模的时候,要学会“拥抱混乱”。[9]除了纠结于数据的准确性、正确性、纯洁度和严格度之外,我们也应该容许一些不精确的存在。[10]等约计量法正是上述理念的体现和反映。
对于等约计量法,我国大多数学者认为,因其强调以模糊性、可能性计算代替准确定罪量刑而存在严重的违法性隐忧,在我国司法实践中不具备可行性。这是因为,我国《刑事诉讼法》对侦查、审查起诉和审判活动都要求达到“事实清楚,证据确实充分”的程度(6)参见《刑事诉讼法》第162条、第171条、第200条。,这也是刑事诉讼中侦查机关和司法机关都必须遵守的证据判断原则,若按照等约计量法对涉案证据进行审理,则永远无法达到法律要求的“事实清楚、证据确实充分”的程度。如果司法实践中贯彻执行等约计量法,则会因其与法律冲突导致刑事诉讼各个程序出现难以进行、陷入停滞不前的情况。此外,等约计量法也与现代刑事法律的人权保障价值相冲突。因此,等约计量法并不能为我国司法机关在面对海量证据时提供有效的行为指引。
(二) 抽样证明
有论者认为,抽样证明已广泛应用于行政执法和以侵犯知识产权犯罪为代表的刑事案件办理中,业已经过实践的充分检验,变得相当成熟和可靠,并且从法经济学的角度看,该方法正是有限理性假设和效益最大化假设理论的应用结果,其适用领域和范围应当进一步向纵深发展。[11]尤其是在面对以电信网络诈骗罪为代表的新型网络犯罪案件时,在保证样本的代表性和充分性前提下,抽样证明能够有效地应对新型网络犯罪对诉讼制度的挑战,其适用不仅必要而且迫切。[12]
支持该方法的论者显然并不清楚新型网络犯罪的海量证据审查和侵犯知识产权等传统犯罪的重复性、较大体量证据审查之间的区别。在传统犯罪尤其是行政转刑事的案件办理中,证据的主要特点是体量较大但尚未达到海量的程度,仍在人工手动审查的能力范围之内,证据审查的核心问题不在于“审不了”,而在于“怎么审”才能做到及时高效,避免过于拘泥于程序以致影响国家司法权力的有效运行。而在新型网络犯罪案件的办理中,证据是海量的,证据审查的核心问题在于证据体量太过庞大,并且由于缺乏专业工具,检察机关工作人员采用人工手动审查法难以在法定时限内审结,进而衍生出一系列问题。
本文认为,抽样证明难以在实践中承担应对新型犯罪海量证据问题的重任,甚至能否在面对海量证据时起到积极作用都是有待商榷的。毫无疑问,海量证据最显著的特点之一就是其价值信息碎片式、分散式储存导致的低价值密度,如果在证据海量的案件中,采取抽样证明的方法从中寻找数十条甚至几条信息,无异于大海捞针。一旦抽样方法设置不够科学合理,便极大可能难以抽取到有效证据,如果因此得出全案证据中没有对定罪量刑有价值的证据的结论,显然十分荒谬。
除了主张以抽样方法应对被害人众多时的海量证据取得问题外,支持抽样证明方法的学者并没有提出具体的、科学的抽样程序,也未对如何构建科学的抽样程序解决海量证据的审查难题进行回答。因此,可以认为,抽样证明在处理以电信网络诈骗犯罪为代表的新型网络犯罪时,作用是相当有限的,仅能在被害人众多时发挥一定的简化流程、提高效率的作用,对于海量证据带来的主要难题——审查处理问题则无实质帮助,难以成为应对海量证据问题的有效方法。
(三) 底线证明
有学者认为,在我国司法实践中进行网络犯罪的简易化证明,最有效的选择应是底线证明。[13]底线证明是指对案件证据的收集程度仅需达到法定入罪和法定加重处罚标准的证明方式,亦可称低限证明,被部分学者认为是化解网络犯罪的新模式、新问题对旧制度、旧观念冲击的可行之道。底线证明方法被认为面对网络犯罪中的海量证据,解决了无须获取全部证据而仅依靠部分证据定案的问题,而且并没有降低证明标准,在抽取证据证明犯罪事实方面,依然坚持了主要案件事实的证明必须满足统一证明标准的原则。底线证明具有其他证明方法无可比拟的优势,在节约诉讼资源、提高诉讼效率的同时,无需进行任何制度构建就能够有效实现诉讼目的,是一条最具有前景的中国式海量证据审查之路。
必须承认,底线证明作为消减证明负担以应对网络犯罪冲击的思路影响下的产物,克服了等约计量法严重违法性的隐忧,而且由于底线证明只需变更观念、无需制度建设,其也避开了抽样取证法如何制定科学程序的难题,从表面上看确实是当前不可多得的优秀选项,应当成为今后一段时间处理海量证据的可行路径。
但是,底线证明仍具有不可忽视的缺陷,尤其是在处理“小额多笔”等类型案件时,其并不能起到消减证明负担、提高证明效率的作用。例如,在侵犯公民个人信息案件中,根据《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》(法释[2017]10号)第5条规定,认定“情节严重”标准即入罪标准需要查证行为人是否非法获取、出售或者提供公民个人信息5千条以上,认定达到加重量刑标准则需要查证达到入罪标准的10倍以上,即5万条以上的公民个人信息。(7)《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第5条第1款规定:“非法获取、出售或者提供公民个人信息,具有下列情形之一的,应当认定为刑法第二百五十三条之一规定的‘情节严重’:……(五)非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的……”第2款规定:“实施前款规定的行为,具有下列情形之一的,应当认定为刑法第二百五十三条之一第一款规定的‘情节特别严重’:……(三)数量或者数额达到前款第三项至第八项规定标准十倍以上的……”又如电信网络诈骗犯罪案件中,根据《最高人民法院、最高人民检察院、公安部关于办理电信网络诈骗等刑事案件适用法律若干问题的意见》(法发[2016]32号),认定“其他严重情节”需要查证行为人是否发送了5千条以上诈骗信息或者拨打了5百人次以上的诈骗电话;而要认定构成“其他特别严重情节”则需要查证行为人是否发送了5万条以上诈骗信息或者拨打了5千人次以上的诈骗电话。(8)《最高人民法院、最高人民检察院、公安部关于办理电信网络诈骗等刑事案件适用法律若干问题的意见》“二(四)”规定,“实施电信网络诈骗犯罪,犯罪嫌疑人、被告人实际骗得财物的,以诈骗罪(既遂)定罪处罚。诈骗数额难以查证,但具有下列情形之一的,应当认定为刑法第二百六十六条规定的‘其他严重情节’,以诈骗罪(未遂)定罪处罚:1.发送诈骗信息五千条以上的,或者拨打诈骗电话五百人次以上的”,“具有上述情形,数量达到相应标准十倍以上的,应当认定为刑法第二百六十六条规定的‘其他特别严重情节’,以诈骗罪(未遂)定罪处罚”。由此可见,底线证明减轻证明负担、提高效率的作用并不能覆盖到所有网络犯罪案件,其在面对小额、多笔或者上述定罪量刑门槛对证据数量要求较高的案件时并不能起到太大的作用。
另外,底线证明还存在一定的逻辑悖论。底线证明之所以能够消减办案人员证明负担的底层逻辑在于:通过对涉案证据按一定顺序进行审查,只要达到法定的入罪或者加重数额后即可停止对剩余证据的审查,此时已经达到了刑事政策之目的,不需要再对其余证据仔细审查,进而节省证据查证时间,提高办案效率,有效应对海量证据给审查起诉工作带来的冲击。但是,上述逻辑建立在一个重要的基础之上:价值证据是均匀分布或者按优先顺序分布于在海量证据之中的。只有对定罪量刑有价值的证据均匀分布或者集中分布于审查起诉工作中优先审查顺位的证据列表中,运用底线证明才能够实现兼顾效率与目的的功能。显而易见地是,该逻辑基础只是一个理想化或者概率性的命题,实践中价值证据的分布绝对不是以办案人员的意志为转移的。倘若价值证据分布在海量证据的较后部分时,办案人员仍需要对全部证据进行筛选、梳理、审查,并不能够达到底线证明消减办案人员证明负担的目的。
因此,底线证明的功能能否得到实现很大程度上依赖于价值证据在海量证据中的分布情况,显然带有一定的或然性,此方法的应用、推行仍然存在着相当大的问题,并不像其支持者所宣称的那样是“一条最有前景的中国式方案”。[14]
四、海量证据审查机制的制度化构建
(一)转变既往简化证明思路
坚持以简化证明思路应对海量证据难题的学者指出,以电信网络诈骗犯罪为代表的新型犯罪案件中,海量证据审查处理难题既缘于技术障碍,也缘于法律规定缺位。[15]但是,在既往研究中,碍于研究者的学科背景等多方面原因,现有解决海量证据审查困境的方案均以法律缺位作为研究的逻辑起点,以简化证明思路为总方针,在立法技术层面提出了各种消减证明负担的应对方法。实际上,只要是在简化证明思路指导下形成的方法,无论其制度构建多么合理,在证明标准层面多么接近既往刑事诉讼所坚持的证明标准,最终都会对我国长期以来所坚持的刑事诉讼证明制度带来或多或少的冲击与削弱。
简化证明思路源于社会高速发展导致司法机关无法及时应对犯罪手法、技术更新对传统的刑事诉讼制度的冲击和挑战,坚持传统的证明标准难以实现刑事司法政策打击新型网络犯罪、维护社会秩序的目的,因而便有论者提出以简化证明、适当减轻证明负担、引入推定制度的方式以回应刑事司法政策的需求。究其根源,简化证明思路始于技术缺位,即司法机关掌握的审查技术难以及时应对新型犯罪案件对证据制度方面的挑战,无法在审限内对证据逐一核查,因此,海量证据审查难题实际是由技术层面问题引发的法律制度困境。问题的来源与立法缺位、漏洞并无太大关系,问题的实质在于技术缺位。问题既然始于技术,最终的合理解决之策也应当回归到技术上来,而非使用立法技巧试图在适当消减证明负担和尽量避免与刑事诉讼证明制度基本原则相冲突之间寻找平衡点。通过立法来填补技术领域的空白,这既不合乎逻辑,实质上也无助于达成打击新型网络犯罪的刑事司法政策目标。
另外,海量电子数据是一座宝库,虽然其具有价值密度低这一影响效率的消极特征,但是同样具有其他证据类型不具备的独特优势。海量电子数据中的价值数据不但本身对事实认定具有积极作用,而且在其形成过程中所附带形成的关联痕迹证据、附属信息证据同样对案件事实认定和定罪量刑具有一定的印证和补强作用。当下人们对电子设备的依赖性越来越高,行为人在日常社会生活中几乎无时无刻不在与电子设备进行交互并留下痕迹。从行为人的电子设备中提取出的海量电子数据实际上就是其行为轨迹在数字领域的投射与映像,办案人员能够据此分析出行为人的行为模式、是否具有潜在犯意等一系列信息,这不仅有助于检察机关正确把握量刑建议和罪名,而且有助于判决结果真正体现罚当其罪,有助于充分实现刑罚的价值与目的。
综上,在现阶段应对海量证据对司法实践的冲击,需要明确证据审查工作中法律变革和技术进步二者之间的序位关系。海量证据审查问题来源于技术缺位,其治本之策仍应着眼于技术,以法律意识引导技术发展方向,以技术进步回应法律问题,切实转变当下盛行的、试图以立法技术弥补技术缺位的简化证明思路。但这并不意味着在简化证明思路指导下产生的应对方法没有可取之处,相反,在现阶段,至少在专门面向检察机关的专用海量证据审查软件研发问世之前,诸如底线证明等方法在其适用范围内仍有一定的可取之处。
(二) 加强检技协同
电信网络诈骗犯罪中的海量证据虽然被时代赋予了鲜明的独特特征,但对其仍应在传统证据审查制度的框架下建构审查机制,具体来说,对该类犯罪的海量证据审查工作仍应坚持“人、事、物、时、空”五要素相契合的原则。要贯彻实施该原则,首先需要加强检察机关业务人员和技术人员间的协同与合作,打破业务人员与技术人员之间的信任壁垒,使检察技术人员充分参与电信网络诈骗等涉及海量证据案件的办案过程,确保检察业务人员在办案之初即可获得可靠的技术支撑。尤其是在没有高度匹配检察审查应用场景的海量电子数据审查软件的当下,检察技术人员的参与对于案件的审查至关重要。在一起涉及海量证据的案件审查中,检察机关的技术人员能否及时参与不仅关系到前期数据清洗的效率高低,而且对于审查工作中能否继续深挖现有证据的深层价值也至关重要,从而对案件的定罪量刑、行为人是否涉嫌其他犯罪以及对余罪的追诉都有着深远影响。换言之,并非只有犯罪分子可以借助先进的信息网络技术升级犯罪手法,检察业务人员与技术人员之间也可以通过通力协作产生同样的乘数效应,对日渐猖獗的以电信网络诈骗犯罪为代表的新型犯罪形成有效的规制。
但是,检察技术人员并不在员额检察官之列,检察机关对检察技术人员长期按照综合管理类公务员管理,管理模式单一,行政化色彩浓厚,难以体现检察技术工作的特点和规律,难以体现检察技术人员与普通公务员的职业区别,也难以体现检察机关内部各类别人员的不同作用。[16]加强检技协同,各级检察机关首先应当加强对检察技术人员的重视程度和培养质量,细化其在不同类型案件中的工作分工,明确其定位,赋予其主动介入相关案件的权力和提供技术支撑的义务,避免将技术人员完全按照行政辅助人员对待,遏制检察技术人员沦为行政辅助人员和设备维护人员的趋势。
值得肯定的是,浙江、北京等一些互联网产业发达和经济技术发达地区的检察机关,已经认识到检察技术人员对于开展证据审查工作的重要意义,开始加大对检察技术部门的政策倾斜力度,加强本单位技术部门与其他地市检察机关技术部门、办案团队以及公安机关的交流学习,并积极引导技术人员介入案件,与承办检察官组成联合办案团队,为整个团队进行技术赋能,取得了良好的成效。上述地区的经验模式,值得其他地区的检察机关认真学习借鉴,检技配合、检技协同应当成为今后各地检察机关海量证据审查工作的一大趋势。
(三) 研发面向检察应用场景的专业审查软件
虽然检技协同是应对当下海量证据审查问题的现实可行路径,但是,一方面,业务素质和技术水平较高的检察技术人员数量较少,各地尤其是区县基层检察机关往往欠缺优秀的检察技术人才储备,而且在人少案多的情况下,检察技术人员无法及时介入每个案件协助承办检察官深挖海量证据的隐藏价值;另一方面,业务素质优秀的检察技术人员只能解决个案,难以带动全国检察机关案件审查工作效率质的提升。因此,检技协同只能作为当下应对海量证据难题的权宜之计,只有加快研发专门面向检察应用场景的海量证据审查软件,才能解决技术人员配备不足时检察官无法审查涉案海量证据的困境。
研发专业审查软件的构想并非没有实践基础。近20年来,电子数据取证软件种类无论是在国际还是国内都已经发展得相当丰富并且功能齐备,只是很多设备和取证软件厂商长期将更多精力放在“取证”上,才产生了取证软件百花齐放,而检察审查软件稀缺的局面。[17]实际上,各类取证和综合分析软件的高速发展已经为检察机关证据审查软件的研发提供了充足的技术支撑,只是需要在部分功能上作出“增、删、改”。如市面上盛行的Encase、X-Ray等取证工具,除了具有复制目标硬盘镜像、哈希值计算等满足取证工作需要的功能外,还具备初步的综合分析能力,比如能够通过设定过滤规则,对目标硬盘或者电子设备中提取的电子数据进行过滤,实现初步的数据清洗,或是可以按照使用者需求对涉案证据进行初步检索等。只要将其中大部分功能的底层技术稍加修改,即可服务于检察机关的海量证据审查工作。
首先,专业的海量证据审查软件应当具备浏览功能。浏览是案件证据审查软件的第一项功能,也是最为重要的一项,此外,还应当具备初步的分类、标记和统计功能。例如,在电信网络诈骗案件办理中,审查软件可根据行为人之间的聊天记录、资金往来等证据对行为人按照组织分工的不同进行分类和标记,将“话务员”、“车手”等人员进行初步分类和标记统计,从而实现清晰明了的可视化处理。
其次,在浏览功能的基础上,审查软件应当具备对海量证据的检索功能。由于犯罪模式和犯罪手法的多样化,检索功能不能仅局限于精确检索,还应当设置模糊检索功能以及自定义检索规则,从而实现对全案证据快捷、准确的检索识别。当然,上述功能可能尚无法完全满足司法实践需要。例如,在电信网络诈骗案件中,审查软件并不能通过检索证据,有效地对行为人的情绪、行为进行识别,进而输出办案需要的、能够显示诸如是否具有潜在受害人、主观故意等情节的判断结果。
再次,审查软件应当具备过滤功能,尤其是多组合过滤功能,以有效筛选、剔除与案件无关的证据,提高审查效率。如在电信网络诈骗案件中,对于查封扣押的电子设备中提取到的聊天记录,审查软件可将机器与数个嫌疑人之间、嫌疑人与同一被害人之间相同时间、内容相同部分的过滤剔除,只需要保留数份相同内容中的一份聊天记录以备审查即可。
(四) 循序探索刑事司法人工智能的发展路径
2017年国务院印发的《新一代人工智能发展规划》(国发(2017)35号)指出:“围绕行政管理、司法管理、城市管理、环境保护等社会治理的热点难点问题,促进人工智能技术应用,推动社会治理现代化。……促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用,实现法院审判体系和审判能力智能化。”得益于多层人工神经网络的深度学习算法,当前人工智能迎来了第三次研究高潮,[18]在当下人工智能不断引入司法领域的大趋势下,海量证据人工智能审查技术理应成为我国刑事司法人工智能建设领域的重要组成部分。
尽管我们处于“新兴科技赋能刑事司法的发展趋势,参与全球人工智能竞争的宏观背景下”,[19]但将人工智能引入较为保守的刑事司法领域只能循序渐进,不可一蹴而就,因为现阶段完全依靠机器自适应、自主学习并进行综合推理是不现实的。首先,智能模型输出的结果并不具有逻辑推理过程的可解释性,而且证据审查这一过程是综合了理性推理和感性认知的能动判断过程,是检察官在长期法律训练浸润形成的“法感”指导下实施的司法活动,不可避免地带有一定的主观性。其次,存在着数据鸿沟,因为有相当一部分未公开的、记录了检察人员逻辑思路的内部文件并不能被公众所获得,大量公开的法律文书中也抹去了载明司法机关工作人员逻辑推理的过程性信息,不足以成为机器学习的高质量样本。最后,包括证据审查工作在内的司法工作都是受法律规则和社会规则的双重制约,对于未形成明确规则的隐性规则,现阶段的机器并不能充分地理解和学习,如果仓促推进海量证据审查智能模型的建设和应用,只会影响检察人员的工作效率。
但是应当肯定,“随着机器判断、强化与迁移能力等认知智能的发展,以及人工智能在记忆能力与行为过程描述能力的提高,智能模型对知识和规则的理解能力必将获得极大提高。”[20]所以,今后可在专门的海量证据审查软件或平台的基础上,通过深化人机协同,辅之以大数据驱动知识学习,使机器深度学习,建立海量证据审查智能模型。目前的首要任务应当是在全国检察系统之间构建统一的海量电子数据审查平台,使其成为今后深入推进刑事司法领域人工智能运用的基础性平台和学习样本来源。该审查平台除了具备基本的及时性、效率性、连通性、交叉性特点之外,还应当具有细致严谨、严密周详的分类系统,对其审查对象按照其涉及的罪名进行归类,在一定时间的数据积累后,分析全国检察系统对某类罪名证据审查的关键词和重点并进行特征提取。一罪名涉及数种不同行为模式的,审查平台应对该罪进行细化,在该罪的框架内对各行为模式设置相应的子项目,方便全国检察机关工作人员准确归类、上传数据,同时有利于日后识别、提取各个罪名及其不同行为模式证据审查的常用关键词,使之作为机器学习的初步样本。如同为电信网络诈骗犯罪,虚拟货币类诈骗中由于涉及各种虚拟币的交易,会不可避免地涉及锚定货币USTD的使用,在对该行为模式的诈骗案件审查中,应将涉及基础锚定货币的证据作为审查重点之一。此外,诸如“杀猪盘”“注销校园贷”“冒充公检法”等不同的行为模式都有其各自独特的特点并反应在涉案证据中,承办检察官在审查证据时关注点和重心必然会有所不同。对全国检察机关工作人员办理同类案件时划定的相同关键词和重点,应当予以识别并作为机器深度学习的样本,使其成为未来研发海量证据审查检索引擎的底层数据,为后续对同类案件进行建模以及为办案提供指引和帮助。
在提取和学习各类案件的审查重点之外,对体量庞大的无关证据如何实现机器高效过滤、避免人工逐条低效审查也是将来证据审查人工智能技术的应有功能。将来检察机关应当在技术足够成熟以及底层数据积累足够充分时,在证据审查工作中引入人工智能技术并构建以多层卷积神经网络为代表的机器深度学习模型,从而实现机器自动对选中的涉案证据进行特征提取和对无关证据的过滤,有效提升海量证据的审查效率。
需要注意的是,由于语义模糊、法规冲突以及隐性知识、过程知识、模糊知识难以用计算机符号体系表达等问题,[21]证据审查实践中无法完全确定化的需求已突破了精准匹配和现有的模式匹配概念,未来海量证据人工智能审查平台的建设首先需要以当前比较成熟的自然语言处理、机器学习为基础,克服当下规范性法律文件无法避免的法规冲突与语义模糊问题,研究运用好人工智能经典算法,从一个小的需求切口出发,逐步积累形成成熟的战法。
虽然域外国家刑事司法人工智能领域的严格规制模式和渐进规制模式对我国具有一定启示意义,但由于我国刑事司法的独特诉讼文化和诉讼构造,以及人工智能不可避免带有的算法黑箱、数据鸿沟等问题,要创制契合我国刑事司法体系的人工智能海量证据审查方案,还需要司法实务界与科技界的长期共同努力。[22]
五、结语
检察审查业务是当下受海量证据问题冲击最严重的司法实务工作之一,检察机关要直面挑战,有效打击犯罪活动,就应当切实转变思路,加强与科技界的协同与合作,以法律与科技相结合的复合型思路应对新型网络犯罪及其带来的海量证据审查问题。须知,构建我国海量证据审查应对机制是一个长期的、渐进性工程,需要全国检察业务部门、检察技术部门和社会第三方之间的长期通力合作。但毋庸置疑,只有通过法律引导技术进步,才能从根本上对以电信网络诈骗犯罪为代表的新型网络犯罪形成有效的规制,既实现刑法打击犯罪的使命,又在保证法定的证明标准不打折扣的情况下,准确定罪量刑,充分体现刑法的人权保障使命,扭转既往刑事诉讼中“重实体轻程序、重打击轻保护”的司法观念。