大数据证据研析
2022-04-19洪涛
摘 要:司法活动正迈向数据化,传统的证据和证明活动已难以满足现实需要,利用大数据技术得到的大数据证据成为破解困境的关键。从犯罪的新变化、证明难度以及印证证明上看,大数据证据有着独特价值,其所具有的双重相关性有利于实现从“因果关系”到“相关关系”的跨越。鉴于我国要求证据形式法定,在审查判断规则的适用中将大数据证据归入鉴定意见为宜。大数据证据可信性规则的建构,应从两方面展开,即基础数据的宏观整体真实规则和技术方法的有效质证规则以及最佳技术方法。
关 键 词:价值增值;相关关系;有效质证;证据形式
中图分类号:D925.2 文献标志码:A 文章编号:1007-8207(2022)03-0081-10
收稿日期:2021-05-20
作者简介:洪涛,辽宁大学法学院诉讼法学专业硕士研究生,研究方向为刑事诉讼法学。
一、问题的提出
大数据开启了一次重大的时代转型,改变着人们的生活以及理解世界的方式,其已成为新发明和新服务的源泉,更多的改变正蓄势待发。[1]在司法领域,智慧法庭、电子数据、智能机器人犯罪等高新科技也促使着法律和法学家们不断做出改变。微观到证据法方面,如今电子数据已成为我国的法定证据种类之一,是证据法学者们讨论和争议的热点。然而,针对基于海量电子数据的大数据证据,学界的讨论明显不足。现实生活中,很多案件都需要运用大数据技术,如甘肃兰州特大“套路贷”一案,涉嫌非法放贷APP和网站1317个、贷款合同336万余份(主要是电子合同)、涉案金额达到89.6亿元、受害者多达39万余人、更有89人因逼债催收自杀身亡。如此庞大的数据,如果不借助大数据技术进行分析,不仅难以认定犯罪嫌疑人之间的层级关系,准确识别出案件的主犯和从犯,亦有可能对部分资金重复评价,违背罪责刑相一致原则,损害犯罪嫌疑人、被告人的合法权益。司法实践中,运用大数据分析技术得到的信息能否视为证据、属于什么类型的证据尚不明晰。以传销犯罪为例,山东某法院引用了运用大数据分析技术得到的会员信息,却没有明确其属性①;吉林省某法院将利用大数据得到的下线人数、下限层数等信息列入到书证之中②;湖南省某法院则将运用大数据技术提取到的信息列为鉴定意见③。
实际上,大数据证据对司法证明活动有自身的独特价值。一方面,大数据证据符合降低证明难度的趋势。证据是司法活动的根基,但复杂的现实情况和人类认知能力决定了证据资源短缺是司法活动的永恒规律。大数据证据着眼于相关关系,通过对海量数据的分析,找到潜在的有用信息,为证明案件事实提供了帮助,超越了以往的因果关系视阈;另一方面,大数据证据能更好地发挥印证证明的作用。传统证据主要具体反映案件的人、物、事、时等,而大数据证据不同,通过数据挖掘、数据对比等大数据技术,电子数据的系统特征被发挥到极致,从而能够从整体反映案件事实。大数据证据和印证证明天然具有亲和性,是印证的完美适用。从这一意义上讲,明确大数据证据属性和种类有其现实紧迫性和必要性。
二、大数据证据内涵之厘定
目前,我国学界对于大数据证据的定义有争论而无定论。如有学者将大数据证据界定为基于海量电子数据形成的分析结果或报告,[2]此观点难以充分体现大数据证据的独有特点;也有学者将利用大数据技术得到的材料皆称为大数据证据,[3]此观点太过宽泛,使得人们对于大数据证据的认识更为混乱;还有学者从方法论角度出发,提出大数据证据能产生某种实用意义上的增值价值,[4]属于一种可以产生增值的方法,此观点其实指的是大数据证明而非大数据证据。
笔者认为,对大数据证据的界定应从大数据证据的独有特点出发。其一,大数据证据的基础是海量电子数据,规模大且类型多,相较于早期一条一套的电子数据,大数据证据以信息量大为新特色。[5]其二,大数据证据不是对海量数据的简单罗列而是进一步加工。目前,将大数据证据视为电子数据二次加工的观点已为众多学者所认可和采纳,成为大数据证据的公认特点。[6]其三,大数据证据的再加工利用了高新技术,如数据挖掘、数据统计、数字模型、数据碰撞等,而这些技术的适用使得大数据证据不同于电子数据,因产生了新的价值增量而有了独立的意义。其四,大数据证据的关联性有双重表现,即基础数据的弱关联和分析结论的强关联,而传统证据的关联性只有一重,或强关联或弱关联。其五,大数据证据的可信性除受到来源的影响外更受到技术方法合适与否的影响,与传统证据侧重来源真实有明显的不同。
由此,笔者将大数据证据定义为“建立在大量弱关联的电子数据之上,通过数据挖掘、数据碰撞、模型建构等技术增值得到的具有强关联性的、能够用来证明案件事实的分析报告”。如此界定,一是可以明确大数据证据的基础是电子数据,进而对二者的关系有一个正确的认识;二是可以明确大数据证据因使用了技术方法而产生价值,故与电子数据存在差别、与鉴定意见存在交叉,突出了大数据证据种类不明晰的问题,这也点明了相关研究未来的主攻方向;三是从大数据证据的特点出发,既可以厘清大数据证据相关性的特殊表现,也有助于为大数据证据设计专门的可信性审查判断规则,还能够为以后放弃以证据种类作为证据门槛的做法进行铺垫。
三、大数据证据证据种类之辨析
在我国,依照《中华人民共和国刑事诉讼法》(以下简称《刑事诉讼法》)第五十条第二款之规定,证据包括物证,书证,证人证言,被害人陈述,犯罪嫌疑人、被告人供述和辩解,鉴定意见,勘验、检查、辨认、侦查实验等笔录,视听资料、电子数据。只有这八种证据才是法律意义上的“证据”,在此范围之外的事物、笔录、陈述等皆非法定“证据”。[7]有学者就此认为:“关于证据种类的规定实际上构成了我国证据审查与适用的第一道门槛,即只有符合法定证据种类要求的信息才有可能成为证据。”[8]目前,国内关于大数据证据证据种类的讨论有三种主流说法。一是“电子数据说”。该观点认为,大数据证据本质上属于电子数据,分析报告是对电子数据的反映,依附于电子数据,不具有独立性,属于衍生品。将大数据证据作为电子数据对待,也是大多数法院的做法。有学者通过实证研究发现,判决中将大数据证据看作电子数据的比例达到66%,[9]而侦查机关提交的犯罪嫌疑人、被告人的活动轨迹多以“情况说明”的形式列入裁判书中。二是“鉴定意见说”。有學者认为应将资金大数据分析纳入司法鉴定范畴,这有利于司法实践的展开,且在法律上也可以找到依据。[10]该观点得到了部分法院的认可,其在裁判文书中将相应的资金分析报告列为鉴定意见①。2016年修订的《司法鉴定程序通则》第二条亦规定:“司法鉴定是指在诉讼活动中鉴定人运用科学技术或者专门知识对诉讼涉及的专门性问题进行鉴别和判断并提供鉴定意见的活动。”从表述上看,大数据证据和鉴定意见的确存在相似之处,都需要利用科学技术,针对的也都是专业问题,都是对基础材料的再加工,最终形成一份有独立价值的报告。正因如此,“鉴定意见说”在学界占据着优势地位。三是“独立证据说”。该观点认为,大数据证据不同于现有的法定证据,在未来的证据法当中有必要单列出来作为独立的证据种类。[11]
在域外,关于大数据证据的证据种类有两种主流观点。一是“机器证言说”。美国学者洛斯认为,机器在确定事实上发挥着越来越重要的作用,所传达的一些信息已成为法庭上的证据,如照相机的图像、温度计的测量、专家系统的意见等。[12]因此,可将数据以及数据分析都归入到机器证言之中,作为值得依赖的、可用于法庭裁判的证据。为使机器证言符合美国的可采性要求,洛斯将机器证言视为“人证”,并设计出一个类似传闻证据的规则,目的是通过为陪审团提供关键的基本事实或背景更好地评估机器传输的准确性。二是“数字证据说”。在域外相关研究中,大数据一词经常和数字取证一同出现。因此,美国国家标准与技术研究所将“数字取证”定义为:“一门应用科学,有助于对证据数据进行识别、分类、评估和审查。”[13]实际上,该观点扩大了数字证据的范围,将对相关数据的分析也归入其中。如有学者将数字取证程序分为“识别、收集、分析、保存和陈述”,[14]其中的“分析”即是利用有效的数据挖掘工具来分析证据数据,这与大数据证据极为相似。还有不少学者认为大数据证据是数字取证之中的一项,由此将大数据取证定义为“数字取证的一个特殊分支,用来识别、收集、分析和陈述非常大规模的证据数据集,以建立犯罪事实。”[15]
法定的八种证据在载体、表现形式等方面各有特点,如何区分不同证据种类的关键在于审查判断规则。如证人证言在审查判断时主要关注证人是否直接感知案件事实、与案件事实是否有利害关系,而鉴定意见在审查判断时主要关注鉴定人是否具有资质、鉴定方法是否科学,由此可推断出二者属于不同种类的证据。判断大数据证据属于何种类型的证据,亦应从其适用什么样的审查判断规则着手。从大数据证据构成上看,既需要审查判断基础数据,又需要审查判断技术方法。基于此,笔者对国内外关于大数据证据证据种类的几种主流说法进行考量:其一,“电子数据说”和“数字证据说”。“电子数据说”尽管看到了大数据证据在审查判断基础数据时的确适用电子数据的相关规则,但却忽视了一个至关重要的问题——“同步性”。最高人民法院、最高人民检察院、公安部于2016年9月9日印发的《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(以下简称《电子数据规定》)第一条规定:“电子数据是案件发生过程中形成的,以数字化形式存储、处理、传输的,能够证明案件事实的数据。”从中可以推导出电子数据与案件事实具有同步性,因此电子数据亦被称为“沉默的现场见证人”。而大数据证据建立在对电子数据的分析之上,是事后加工得到的,显然不具有同步性。故此,在电子数据的概念没有更改之前不宜将大数据证据与电子数据等同。“数字证据说”亦是如此,其也忽略了电子数据的同步性。其二,“机器证言说”。机器证言是将“人证”进行了扩大理解,如此就需要将证人证言的审查判断规则适用于大数据证据,但司法实践中有关证人证言的审查判断规则并不适用于机器证言。一方面,证人证言的可信性要通过证人的感知、表达、记忆、诚实性等方面综合分析判断,而机器证言是由严密的编程程序得出的分析结果,显然不会受到上述情况的影响;另一方面,证人有出庭作证的义务,其证言要接受控辩双方和法官的质疑,而机器证言即便出庭也无法回应质疑。其三,“独立证据说”。将大数据证据独立为一种新的证据形式,就必须为其设计独特的审查判断规则。然而,对大数据证据基础数据的审查完全可以适用电子数据的相关规则,对大数据证据技术方法的审查判断亦可参考鉴定意见的相关规则。可见,将大数据证据独立为一种新的证据形式显然是一种逃避问题的做法,这种将难以归类的证据材料独立处理的“打补丁”方式长久来看不利于形成稳定的证据制度,甚至会给司法裁判活动造成阻碍。其四,“鉴定意见说”。有学者认为,不同于以往专家借助仪器设备作出判断,大数据分析鉴定意见书很大程度上是由机器算法给出的实质判断,这对于专家作出判断的司法鉴定体制是一个过于超前的突破。[16]实际上,这种差异并不妨碍将大数据证据归入鉴定意见。尽管鉴定意见通常是以“人”为主、以“机器”为辅,但在某些情况下也是以“机器”为主、以“人”为辅的,如DNA鉴定、血液酒精含量鉴定等。而且,鉴定意见通过辩护进行证据审查判断的规则同样也适用于对大数据证据技术方法的审查判断。加之,鉴定人在进行鉴定时遵循的是国家标准、行业标准,将大数据证据归入鉴定意见即可以适用相应标准对大数据证据技术方法进行审查。因此,将大数据证据归入到鉴定意见是可行的,不会发生严重的冲突。需要说明的是,将大数据证据归类的目的只是考察其适用何种证据审查判断规则,对大数据证据的研讨还应更进一步,即重新审视大数据证据的相关性并建构符合大数据证据可信性审查判断的规则。
四、大数据证据相关性之再解
“相关性”一词译自于英美法系国家,是指作为证据内容的事实与案件事实之间存在某种联系。英美法系国家对相关性极为重视,将其作为最基本的证据属性,如《美国联邦证据规则》在规则401、402、403中分别规定了相关证据的标准、相关证据的可采性和相关证据的自由裁量性。大陆法系国家将“相关性”亦称为“关联性”,其侧重的是证据与证明对象之间的形式性关系,即证据相对于证明对象是否具有实质性和证明性。大数据分析报告一旦作为证据,必须具备相关性。
在学界,部分学者对大数据证据的海量基础数据进行评估后发现,其与案件事实不具有通常意义上的关联,或者说相较于其他证据的关联,这些海量基础数据的关联极其微弱。故此认为,通过分析加工不具备相关性的数据而得到的大数据证据理所当然地不具有相关性,其证据资格存在重大瑕疵,不能作为证据来使用。在笔者看来,此观点对于关联性认识较为模糊且未能充分理解大数据证据的特殊性。一方面,关联性包括了弱关联和强关联,弱关联也是关联的一种,对案件事实的证明亦能起到作用;另一方面,大数据证据虽是建立在弱关联的海量电子数据之上的,但其本身与案件事实是强关联的,这正是“大数据价值增值论”的根源所在。具言之,其一,大数据证据着眼于“相关关系”。与传统证据着眼于“因果关系”不同,大数据证据着眼于“相关关系”,通过那些看似不具有关联的关系发掘背后的常态联系,用以证明案件事实,这也符合大数据的技术特点。大数据技术就是利用海量信息来挖掘潜在的相关关系,从而超越了通常的因果认知。有学者提出:“传统证据的因果关系是一种强关联关系,而大数据的相关关系是一种弱关联关系。实际上,大数据的相关性是基于机器逻辑的相关关系。”[17]大数据之父舍恩伯格同样认为:“大数据最重要的思维特征就是‘追求相关、放弃因果’”。[18]在哈尔滨市公安局交警支队原处长侯某某严重违纪案中,正是通过大数据发现侯某某任职前后的消费水平发生了变化,如航班由经济舱改为了头等舱。[19]其二,大数据证据与案件事实是强关联的。大数据证据的基础数据虽是弱关联的,但最终的大数据分析报告却是强关联的。引入相关关系,是为论证基础数据的正当性而并非大数据证据本身和案件事实也是弱关联关系。实际上,所谓的“大数据的相关关系是一种弱关联关系”指的只是基础数据而非大数据证据本身。大数据证据并不是海量数据的简单堆积,其是对海量数据的再加工,通过数据挖掘、数据对比等技术方法,大数据分析报告已然产生新的独立价值,具有了强关联性。如涉众犯罪中通过技术方法得到的人员关系层级表,立体而又生动地描绘了案件中人员的地位和受益金额,与案件事实具有强关联。美国司法中的“镶嵌论”认为,分散的信息碎片一旦被整合为整体,就能产生1+1>2的效果。在笔者看来,“镶嵌论”和“大数据价值增值论”是相互契合的,其都認为碎片整合加工之后能产生更大价值,从而具有一定的独立性。其三,大数据证据的相关性基于特殊经验。电子时代带来了新变化,新型犯罪通常涉及人数较广,案情较为复杂,相关案情信息极为庞大,已经超越了日常生活的经验范畴,单靠人力去调查研究是难以完成的。从认识论意义上讲,大数据分析运用的相关性理论是超脱于人类经验判断的“数据经验”,[20]通过大数据技术可以将那些隐藏规律外化,从而形成新的不同于人类日常经验的数据经验或特殊经验。之所以称为特殊经验,是因为该经验的得出是基于大数据技术对海量数据的分析,如果以生活常识判断并不能看到二者具有的关联。例如:沃尔玛通过大数据分析发现,啤酒和尿布放在一起售卖时,二者的销量都会增加;有学者通过实证研究发现,在上海市虹口区人民法院管辖范围内,自然人之间、自然人与金融机构之间的借款活动相较于其他参与主体借款行为更易失败。[21]
综上,笔者认为,在理解大数据证据的相关性时,既要看到大数据证据基础数据的弱关联,还要看到数据分析报告的强关联,更要看到建立在因果关系之上的相关关系。而且,要深刻理解“经验”不仅仅是人们在日常生活中所形成的经验,要扩大视野向时代看齐,承认和接纳数据经验或特殊经验。
五、大数据证据可信性规则之塑造
依据《刑事诉讼法》第五十条之规定,证据必须经过查证属实才能作为定案的根据。可信性是证据成为定案根据必不可少的条件,包括证据本身可信和证据来源可信。[22]大数据证据的可信性有其特殊性,一方面,大数据证据建立在电子数据之上,而电子数据又处于虚拟空间,与高新技术紧密相连,法官们在审查和判断时受限于专业性常常陷入窘境;另一方面,算法作为大数据技术的内核因涉及到商业秘密,通常是不公开、黑箱化运行的,故在法庭举证时控辩双方对于大数据证据的质证往往流于形式,这使得大数据证据的可信性受到质疑。故此,应科学构建大数据证据可信性的审查判断规则。
对大数据证据可信性的审查判断应该关注作为来源的海量基础数据是否可信,是否存在伪造的或者具有误导性的数据。如在“新百伦和New Balance商标侵权案”[(2015)粤高法民三终字第444号]中,原告提交的公证书提出二者的“淘宝指数”和“百度指数”曲线基本一致,以此证明二者已构成了商标混淆。然而,原告提交的指数不一定是真实可信的,亦有恶意搜索或人为趋使指数保持一致的可能。《电子数据规定》第二十二条规定:“对电子数据是否真实,应当着重审查以下内容:(一)是否移送原始存储介质;在原始存储介质无法封存、不便移动时,有无说明原因,并注明收集、提取过程及原始存储介质的存放地点或者电子数据的来源等情况;(二)电子数据是否具有数字签名、数字证书等特殊标识;(三)电子数据的收集、提取过程是否可以重现;(四)电子数据如有增加、删除、修改等情形的,是否附有说明;(五)电子数据的完整性是否可以保证。”第二十三条规定:“对电子数据是否完整,应当根据保护电子数据完整性的相应方法进行验证:(一)审查原始存储介质的扣押、封存状态;(二)审查电子数据的收集、提取过程,查看录像;(三)比对电子数据完整性校验值;(四)与备份的电子数据进行比较;(五)审查冻结后的访问操作日志;(六)其他方法。”据此,有学者提出,原始电子数据作为大数据证据的基础,只有每项原始电子数据都能符合电子数据审查规范时,这些电子数据分析得出的大数据证据才是可靠的。[23]还有学者认为,虽然原始电子数据数量是庞大的,但是通过“区块链技术”能够保证原始数据内容的可信性。[24]但在笔者看来,要求大数据证据的基础数据全部真实不现实。大数据证据的一大特点就是数据规模大、数据类型多、数据信息海量,因此在审查判断海量电子数据的可信性时应以宏观的整体真实为选择。其实,从整体真实角度考察证据的可信性也是与司法实践中的等约计量法相契合的,在面对极为复杂的案件时,对于案件事实的探求不以精准计量为导向,关注的是整体样态。正如舍恩伯格所言,大数据通常用概率说话,而不是板着“确凿无疑”的面孔;当我们试图扩大规模的时候,要学会拥抱“混乱”。[25]当然,关注宏观的整体真实并不意味着要彻底抛弃微观的具体真实。具体真实具有自身的价值,有存在的必要性,它可以用来印证整体认识的正确与否。如在“张某安、刘某伍组织、领导传销活动案”中,侦查人员先是通过对核心技术人员的讯问,确保涉案数据集整体的可信性,再通过对该组织的一个分支机构资金流水的具体查证,部分印证了数据集整体中的层次关系。
大数据证据是对电子数据的再加工,除了要审查判断作为来源基础数据的可信性之外,还要审查判断技术方法的可信性。从某种程度上说,技术方法可信性的影响力甚至大于基础数据可信性的影响力。基于大数据技术以不公开为原则,表现为黑箱化运行,有学者主张技术方法可信性的审查判断应以技术方法公开为前提,以确保技术方法透明,从而提高司法审判的透明度。笔者认为,此观点欠妥。一方面,部分技术方法无法公开,如北斗卫星的图像分析等,但不公开并不意味着不可信;另一方面,大數据技术专业性很强,即便将相应的技术算法公开,其可信性仍需进一步审查判断。如在“王某博、郑某滨侵犯著作权案”[(2020)苏刑终19号]中,就对“天天街机捕鱼”和“千炮捕鱼”的源代码的重复比产生了争执,为此控方提交多份司法鉴定意见,被告人则主张这些司法鉴定并不可信。可见,对技术方法的可信性审查,公开只是第一步,更为关键的是要建构具体的审查判断规则,即有效质证规则和最佳技术方法规则。
就有效质证规则而言,《刑事诉讼法》第一百九十二条第三款规定:“公诉人、当事人或者辩护人、诉讼代理人对鉴定意见有异议,人民法院认为鉴定人有必要出庭的,鉴定人应当出庭作证。经人民法院通知,鉴定人拒不出庭作证的,鉴定意见不得作为定案的根据。”大数据技术方法的可信性审查亦可通过有效质证来实现:在大数据研究领域中有一项“可视化分析”,通过人机交互技术辅助人们更为直观和高效地洞悉大数据信息。[26]“可视化分析”可以用来解释大数据技术的原理和分析报告的形成过程,从而实现大数据证据的有效展示,这比仅仅公开技术方法更为有效。笔者建议,提交大数据证据的一方应附带“可视化分析”,对其采用的大数据技术进行解释说明,以便法院及控辩双方理解和审查判断。此外,《刑事诉讼法》第一百九十七条第二款明确规定:“公诉人、当事人和辩护人、诉讼代理人可以申请法庭通知有专门知识的人出庭,就鉴定人作出的鉴定意见提出意见。”所以,专家辅助人同样可以适用于大数据证据技术方法的质证。需要注意的是,申请专家辅助人的质疑既可以针对大数据分析报告本身,也可以针对附带的“可视化分析”,法官在决定是否允许专家辅助人介入时应侧重保护质证方而非举证方,如此才能平衡双方的力量。
就最佳技术方法而言,目前因大数据证据的技术方法没有相应的技术标准导致产生两个疑问:一是使用的技术方法是否正确,能否得出可信的结论;二是使用的技术方法是否最合适。相较之下,鉴定意见虽然也存在疑问,但其有相应的标准,《司法鉴定程序通则》第二十三条明确规定:“司法鉴定人进行鉴定,应当依下列顺序遵守和采用该专业领域的技术标准、技术规范和技术方法:(一)国家标准;(二)行业标准和技术规范;(三)该专业领域多数专家认可的技术方法。”可见,建立相应的技术标准是破解大数据证据技术方法可信性困境的关键。但标准的确立需要经验的积累和总结,短时间内完成不太现实。对此,笔者建议可参考美国在多波特案中提出的评价标准①,即通过算法比较和事后验证来确立个案中的最佳技术方法。所谓算法比较,是指对同样的基础数据采用不同的算法进行数据分析。面对同样的数据集,采用不同的算法可能得出不同的结论甚至是截然相反的结论。大数据分析的核心同样在于对算法模型的分析和选择,算法模型的有效性和适用性很大程度上决定着分析结果的准确性和可采性。[27]故而,应多尝试算法建构,通过对比分析寻找最合适的技术方法。在进行大数据分析时,或结合现实情况选择最为适合的算法,或交叉利用多种算法。所谓事后验证法,是指通过对某一算法得出的结论进行个别验证。该方法在专业领域亦被称为黑箱测试,即在已知产品所应具有功能的前提下通过测试来检测每个功能能否正常的一种测试方法。[28]事后验证实际上属于抽样取证,通过具有代表性的一定物品作为样本证据,并据此证明全体物品属性。[29]鉴于抽样取证难以找到代表性的物品,无法正确反映情况,只能在极特别的情况下使用,因而应通过多次测试以提高正确率,同时结合整体真实性综合考虑。对于测试过程中可能出现的不相符情形,不要贸然认定结论不真实,应将其认作概率问题从整体上进行考量。
总之,大数据证据在诉讼活动中运用的主要问题在于其属于哪一类法定证据、如何展开有效的审查判断。笔者认为,相较于相关性和可信性,证据形式对证据审查运用的影响并没有那么大。而且,要求证据必须具备合法形式的规定不合理,且实务中这一规定也没有被严格地执行。如交警出具的交通事故认定书、会计事务所出具的审计报告虽然不属于法定证据,但是几乎没人会否认其证明价值进而将其排除在诉讼之外。《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释(2021)》新增的第一百零一条规定:“有关部门对事故进行调查形成的报告,在刑事诉讼中可以作为证据使用;报告中涉及专门性问题的意见,经法庭查证属实,且调查程序符合法律、有关规定的,可以作为定案的根据。”此规定已经有了弱化法定证据形式的倾向,因此笔者建议,应将《刑事诉讼法》第五十条第二款中“证据包括”修改为“证据包括但不限于”。
【参考文献】
[1][18][25](英)维克托·迈尔·舍恩伯格.大数据时代:生活、工作与思维的大变革[M].周涛译.杭州:浙江人民出版社,2012:1,68-94,46.
[2][5][16][28]刘品新.论大数据证据[J].环球法律评论,2019,(1):22-31.
[3][10][11]何家弘等.大数据侦查给证据法带来的挑战[J].人民检察,2018,(1):56.
[4]谢君泽.论大数据证明[J].中国刑事法杂志,2020,(2):125.
[6]谢君泽.论大数据证明[J].中国刑事法杂志,2020,(2):125;王禄生.论法律大数据“领域理论”的构建[J].中国法学,2020,(2):261.
[7]陈瑞华.刑事证据法(第三版)[M].北京:北京大学出版社,2018:246.
[8]郑飞,马国洋.大数据证据适用的三重困境及出路[J/OL].重庆大学学报(社会科学版),Doi:10.11835/j.issn.1008-5831.fx.2020.12.001.
[9]徐惠,李晓东.大数据证据之证据证成研究[J].中国人民公安大学学报(社会科学版),2020,(1):49.
[12]Andrea Roth,Machine Testimony,126Yale L.J.1972(2017).
[13]B.Marr,Why only one of the 5 vs of big data really matters, http://goo.gl/azsnse,2015.
[14]Dr.Tariq Sheikh,Big data and digital forensic,https://www.researchgate.net/publication/323254112.
[15]Shams Zawoad、Ragib Hasan,Digital Forensics in the Age of Big Data:Challenges,Approaches,and Opportunities, IEEE Big Data Security,August2015.
[17]刘品新.电子证据的关联性[J].法学研究,2016,(6):189.
[19]庞岚.官员有11套房自以为安全,不料这举动被大数据揪出[EB/OL].新浪网,https://finance.sina.com.cn/china/gncj/2018-05-30/doc-ihcffhsv2868843.shtml.
[20][21]周蔚.大数据在事实认定中作用机制分析[J].中国政法大学学报,2015,(6):70-75.
[22](美)特倫斯·安德森等.证据分析(第2版)[M].张保生等译.北京:中国人民大学出版社,2012:84.
[23]张吉喜,孔德伦.论刑事诉讼中的大数据证据[J].贵州大学学报(社会科学版),2020,(4):87.
[24]吴春妹等.大数据证据的定位与运用——以互联网金融犯罪案件为切入点[J].人民检察,2020,(3):57.
[26]任磊等.大数据可视分析综述[J].软件学报,2014,(9):1910.
[27]刘绪崇,苏欣,唐德权.智慧警务——大数据环境下新时代公安信息化建设模式探索[M].北京:清华大学出版社,2018:69.
[29]万毅,纵博.论刑事诉讼中的抽样取证[J].江苏行政学院学报,2014,(4):122.
(责任编辑:刘亚峰 实习编辑:王正桥)
Research and Analysis of Big Data Evidence
Hong Tao
Abstract:Judicial activities are moving towards digitization,and the traditional evidence and proof activities have been difficult to meet the practical needs.The big data evidence obtained by using big data technology has become the key to solve the dilemma.From the perspective of new changes in crime,difficulty of proof and confirmation,big data evidence has unique value,and its dual relevance is conducive to the leap from “causality” to “correlation”.In view of the statutory form of evidence required in China,it is appropriate to classify big data evidence into expert opinions in the application of review and judgment rules.The construction of big data evidence credibility rules should be carried out from two aspects,namely,the macro overall truth rules of basic data,the effective cross examination rules of technical methods and the best technical methods.
Key words:value increment;correlation;effective cross examination;form of evidence