大数据证据的事实认定原理*
2021-10-13杨继文范彦英
□ 杨继文 范彦英
内容提要 大数据时代到来,对证据和事实的关系需要重新审视。中国新时代司法体制改革的急迫性和必要性,在司法实践中突出地表现为以电子证据为核心的大数据证据新时代诉求。大数据证据是一种电子证据,具有特殊的事实认定机制,大数据的良好应用可以提升审判体系中事实认定的能力。以大数据和电子证据为主要特征的新证据时代变革,需要重点关注大数据证据的事实认定基本原理。在事实认定能力提升的目标要求下,大数据证据的良好应用有利于提高事实裁判者的司法认知能力,逐步形成从人工到智能的事实认定路径,但需要注意大数据在证据与事实关系之间的限度和保障机制。在新证据时代背景下的大数据事实认定机制,强调更新事实认定思维、重构事实认定过程、完善证据体系和优化电子证据采信规范应用。
一、问题的提出
在当今社会,科技的发展和信息技术的进步已经日益影响到人类的生产和生活活动。在信息爆炸的天文学和基因学等学科中,逐步产生和发展出了人类目前所日益期许的“大数据”概念①和“领域大数据”理论②。大数据时代的到来,使得我们的动作、行为、位置乃至每一个人的身体变化表现等构成了可以被分析和计算的数据,③应用计算机技术检索史料、收集信息,使得对史料的获取和把握与传统考据学时代大为不同,业已带来史学方式的革新。④为了适应和发展互联网大数据时代的发展,我们的法律理念、法律行为和法学研究应该进行一体融合的构建。⑤我国的司法体制改革呈现出信息时代的背景和科技性特点,目前疫情期间的线上诉讼⑥更加促使“司法主动拥抱大数据和人工智能”,并成为我国司法体制改革迭代发展和证据学转型升级的基本路径之一。例如,司法部、最高法以及相关司法案例中,都已经体现了大数据对传统审判体系和事实认定方式的革命性重构特征。在“奇虎诉腾讯”⑦一案中,人民法院肯定了大数据分析结果作为证据使用的合法性。
进而,在大数据时代审判体系的证据学应用中,传统意义上的片面数据、抽样数据乃至局部数据的证据材料,将可能发生技术迭代和转变更新。⑧证据研究和司法裁判一般通过经验法则、 逻辑推理和法律真实价值观进行事实认定。⑨而大数据证据一般都是大样本的证据数据和案件信息,并且可以通过建立智能模型以及介入案件事实认定,⑩来对案件当事人的各种信息和数据进行“电子画像”和可视化呈现⑪,从而发现犯罪线索、证据信息或者犯罪嫌疑人。⑫“线上电子方式作为一种诉讼载体,对当事人、诉讼权利、诉讼程序、诉讼阶段等其他诉讼活动组成部分产生影响,应在影响力分析基础上构建电子诉讼适用的共性规则。”⑬在当前逐步发生并发展着的大数据证据应用,并基于大数据特征创新的证明与事实认定规则⑭,形成了以大数据和电子证据为主要特征的新证据时代变革。大数据视域下的电子数据有迥异于传统实物证据的特征,并突出表现在高度依赖性、高科技性以及变动无迹性等方面。⑮例如,大数据分析技术的出现,通过对海量数据进行筛选、汇总、提炼、形成结论并作为证据在职务犯罪案件监察调查、审查起诉、审判中使用,缓解职务犯罪案件“口供中心主义”的调查惯习对被调查人权利造成的威胁⑯。
本文在智能法学⑰背景下重点关注大数据证据的事实认定问题。大数据证据及其事实认定机制研究,是国家治理现代化的时代要求,是司法现代化的现实要求,也是科学司法的内在规律要求。大数据证据的良好应用,有利于更新事实认定路径。以电子证据为核心的大数据证据的分析算法将从“因果分析”发展到“关联分析”,体现为从规范型到实证型、 从主观型到客观型和从相对型到确定型的事实认定模式转变。最终,在证据与事实关系之间的连接限度和保障适用背景下,大数据证据是一种电子证据,并具有较为特殊的事实认定原理,主要包括大数据证据的属性定位、事实认定技术逻辑、模式转型与路径依赖。
二、大数据证据属性的基本立场
一般认为,大数据证据的基础是大样本意义上的海量数据,并通过这些数据信息对案件事实进行判断、证明和认定,在司法实践中主要体现为大数据分析报告等基本形式。理论界和实务界对大数据证据存在着不同的理论争论和实务处理,如书证说、鉴定意见说、证人证言说、电子证据说以及独立证据说等。例如,有学者认为:“考虑到大数据证据具有专业性和科学性,中国现实的便宜选择是将其纳入鉴定意见的证据法定形式。”⑱还有学者认为:“面对大数据证明及其技术方法,我国的《司法鉴定程序通则》规定进行细化,使大数据证据和建模等新兴技术方法得以合规合法地进入司法鉴定领域并发挥其应有的价值。”⑲还有学者认为:“在司法实践中的资金大数据侦查,本质上是进行了模型分析和电脑算法应用,与静态意义的电子数据存在明显的区别。我认为应当将这种大数据分析纳入司法鉴定范畴。”⑳有学者认为,大数据证据的证据属性,以“综合性”和“重方法”作为其与传统证据种类的区别点,应当视为独立的证据种类。
笔者认为,对证据和事实关系的大数据分析,在新时代司法体制改革中具有急迫性和必要性,在司法实践中突出地表现为以电子证据为核心的新证据时代诉求。“在未来的证据法当中,大数据分析报告有必要单列出来作为独立的证据种类,而大数据中那些跟案件相关的数据信息,可以纳入‘电子数据’这一既有的法定证据种类范畴。”本文认为,大数据证据本质上是一种电子证据,具有特殊的事实认定机制,主要理由包括以下几个方面的内容。
第一,大数据促使电子证据的迭代发展和新证据时代变革。在当今证据法学的新时代,案件中的各种当事人信息、 数据载体和生活轨迹等日常生产生活行为都被数据化了。这些数据和信息,在智能算法和关联比对中进行串联沟通,形成证据法学所日益期许的信息资源与数据库,这将有利于克服证据法学中的信息数据资源稀缺的根本矛盾,如图一。这从技术上有力地回应了学界所强调的“证明资源有限”之基本矛盾。这种大数据证据的算法分析与事实认定,可以获得比神示证据时代、 人证证据时代和物证证据时代等都要明显的技术优势和竞争能力。因此,基于大数据信息分析而形成的报告,虽然具有鉴定意见意义上的专业性和科学性,但它只是这种证据材料的具体表现载体和形式之一,实质意义上是与案件具有关联性的信息数据,因而是一种基于关联数据性的证据材料,可以作为一种独立的证据种类。
图一 事实认定的大数据分析进路
第二,大数据证据是电子证据的一种体现。在大数据时代的证据材料,较为鲜明地体现为“线上” 的各种数据和信息,人们的生产生活方式在“线上”往往体现为“电子镜像”和各种数据资源。而这种“电子镜像”是案件当事人“人物画像”中的“数据画像”表现载体之一。“数据画像”则体现为案件中电子证据的迭代升级和大数据分析的结果。也就是说,基于电子证据的“数据画像”,与案件中的其他证据材料进行关联算法时,将产生越来越重要的案件事实判断和认定价值,形成大数据时代的电子证据新载体。
第三,大数据证据作为电子证据,具有特殊的事实认定框架和原理。一方面,作为电子证据的大数据证据,有利于司法案件中的事实认定经验推论过程的可视化。事实作为证据法的逻辑起点,包含着事实认定中各种问题的胚芽,其固有特性特别是经验性之历史展开,则塑造了证据的基本属性,也决定了事实认定必然是一个经验推论过程。例如,大数据的直接运用模式是将其原始载体或等量复制数据直接作为证据使用,而间接运用模式是将筛出的“小” 数据或分析结论作为证据使用。另一方面,对电子证据及其所要证明的事实进行大数据分析,将丰富和发展我国证据制度和证据体系的基本知识和概念结构,有利于中国证据法学者提出新的学术命题和具体应用相关证据规则体系,进而实现我国证据法学乃至司法科学的转型升级。例如,在互联网法院审判过程中,对司法中的证据和事实进行大数据分析,将提高对案件证据材料和数据信息的利用程度,实现证据材料收集的全覆盖、证据相关数据的抽象化、证据材料的数据清洗、 证据与事实之间的多维数据库建模等,在事实认定机制中实现证据与事实的可视化操作,最终能够较为精确而完整地反映互联网案件发生当时的事实情况,有利于司法工作人员科学而全面地认定案件事实。
三、大数据在证据与事实关系中的定位分析
(一)大数据在证据与事实认定之间的价值
通过大数据提升事实认定能力,是深化司法改革的迫切要求,也是信息时代我国审判体系和审判能力更新和完善的重要契机之一。一方面,通过大数据来联结证据与事实之间的关系,不仅能够实现案件证据与事实的统一认定,而且能够在一定程度上使当事人在司法过程中被平等地对待,有利于实现类案比对和同案同判。大数据证据及其事实认定机制研究,是司法现代化的现实要求。大数据时代的司法,需要重点关注的是同案以及案件事实的同判及其类案比对问题。也就是通过判例等大数据的分析和云计算,将案件事实的类案进行比对,进而达到统一适用法律和认定案件事实的目的。而且,通过大数据的实证分析,有利于提升信息时代法官事实认定能力,有利于提高我国司法的公信力和权威性。例如,在涉及证据的概率认定问题和原理中,需要明确的是这种概率证据是一种可以重复的验证过程,并通过样本空间的过程检测和观察来获得。这鲜明地体现在司法裁判过程中的贝叶斯推理中。大数据在这些概率证据体系的事实认定和贝叶斯推理方面,具有积极的可能性和可重复性。通过大数据分析和实验,可以使得任何特定“实现”都会在样本空间中产生一个特定的结果,这是一个可以检验的、理性的和可以被理解的事实认定过程。而审判体系完善和审判能力提升的关键环节是事实认定问题,其提升和完善,有助于法院合理运用证据确定案件事实,更有利于各方当事人解决纠纷和矛盾,进而推进国家治理中的各方主体之间的协调关系,有利于维护社会稳定和司法良好秩序。
另一方面,大数据证据及其事实认定机制研究,是科学司法的内在规律要求。在当前我国深化司法体制改革的关键时期,通过大数据来提升事实认定能力,有利于司法实践中的证据裁判和量刑事实等环节达到或者逐步达到“科学司法”的目的,这正如日本所谓的“精密司法”一样,追求的价值是“无限接近”的个案公平正义。进而,大数据证据分析是一种“互联网+”时代的证据方法和事实认定机制。首先,传统法院审判中的事实认定机制,主要依赖的是案件证据与事实的因果关系思维,注重的是逻辑推理和前因后果关系分析。而事实认定的大数据分析则是基于关联关系分析的“互联网+”时代的一种崭新事实认定机制,是一种各种信息整体意义上的“数据统治者”,获得的是基于各种待证数据和信息的案件整体证明结果。其次,事实认定机制的大数据分析,是一种将证据电子化、信息化和数据化的智能证据方法,有利于解决目前司法实践中的科学证据和电子证据适用等难点问题。再次,事实认定机制的大数据分析和云计算,将更新事实认定—事实认知—证据认知的体系,将会提高预测事实认定的精准程度,为案件事实的裁判提供精准决策。这正如有学者所言:“大数据与云计算是一个问题的两面: 一个是问题,一个是解决问题的方法。通过云计算对大数据进行分析、预测,会使得决策更为精准,释放出更多数据和信息的隐藏价值。”
(二)大数据证据的双重目标体系
一般认为,事实存在案件事实与法律事实的类型划分,也涉及已经生效的司法裁判与法律适用的关系问题。而在以大数据为背景知识的新证据时代,通过大数据提升的事实认定能力中的事实,主要界定为案件事实,因此与现实生活的事实及客观真实存在一定的差距,这也符合认识论的原理要求。大数据提升事实认定能力的目标体系有主要目标和终极目标两种。前者强调的是通过大数据来进行事实认定,主要目标在于无限地还原案发现场的事实状态,如案件发生时人的状态,行为人、被害人、第三人、证人的基本情况;行为的样态与结果的关系; 案件发生时的时间和地点等五核要素。由于案件事实是已经发生的历史事件,通过大数据和云计算将无限地接近于案发当时的状况,有利于法官等事实认定者以现在的眼光来认定过去的案件。而且,从技术上来看,大数据分析将突破原来的三维空间,通过大数据的云计算,即通过所谓大数据的2.0 版来实现。这正如有学者所认为的,基于语义理解和高度智能化的“大智慧”信息系统,将人类的思维推进到四维空间,有利于保存案件发生进程的原始事实状态,将已经发生的三大类纠纷,调取至云计算的信息或者数据,并从技术上“还原”案件的事实状态。后者则表现为:通过大数据来进行事实认定,不仅使得以电子证据为核心的证据体系日益科学和精确,而且它的终极目标在于通过大数据来推进和实现社会公众的法治信仰。
(三)大数据证据的良好应用,有利于更新事实认定路径
在大数据时代,大数据与司法的关系问题,本质上是科技与法律、 人工与智能的关系问题。因此,通过大数据提升事实认定能力,关键在于掌握从人工到智能的技术节点和应用规律,进而实现审判体系事实认定的相对准确性。因此,事实认定路径可以从是否适用大数据和云计算等技术工具为标准,区分为人工型事实认定路径和智能型事实认定路径。
一方面,人工型事实认定路径可能存在一定的主观模糊性,在某种意义上难以为双方当事人所接受和认同,难以实现社会公众共同的法治信仰。而这种人工型的事实认定机制,同时还存在一定的不确定性,“英美法系国家的排除一切合理怀疑,以及大陆法系国家的内心确信无疑,一般都需辅之以相关法律规则保障手段和技术保证机制”。
另一方面,以大数据分析为代表的智能型事实认定路径具有特殊的科技视角和一定的可检验性、相对确定性、还原性、可视化和多维性等特征。大数据证据的事实认定基础在于数据与事实之间实现关联和共享。而在事实认定路径过程中,基于大数据证据共享分析的“数据经验”在一定程度上有利于填补人类对繁杂信息的认知能力不足问题,能够在一个更完整的故事框架中解决案件的争议焦点,有利于避免前述贝叶斯理论中主观概率计算的参考类选择难题。“大数据相关性强调数据间的关联,基于全量数据分析,规模化数据处理能力是人的经验和理性无法胜任的任务,强调法律人的经验和逻辑理性的证据相关性规则将被取代。”
(四)大数据证据与司法认知的关系辨析
一般认为,司法认知主要涉及事实裁判者根据有限的证据信息进行事实判断决策的过程,在认知心理结构上来看是直觉心智、 算法心智和反思心智的互动结果。事实裁判者在认定案件事实时,往往应用自己的经验法则进行司法认知,但是容易出现所谓的“认知偏差”问题。这突出地体现为经验的“限制性”。在大数据证据的司法认知判断过程中,即使是在纯粹的关于计算机的技术实现问题的工作中,也是隐含的,这种限制的表现形式是每当数据机器被设计得能做“智能的” 工作时,关于任务结构的经验事实以及人类对于任务类的理解,就被偷偷地放了进去。法官作为“人”,难免受到人类思维活动的影响而出现“锚定效应”式的先见偏见和“决策惯性”式的后见偏见等。因此,在大数据证据与司法认知的关系方面,通过数据以及算法分析一定程度上能够改善经验推定的偏见弊端,尤其是体现在对法官进行统计学和决策理论的训练方面。
而在大数据证据的具体应用过程中,需要重点考量数据机器思维与事实认定者司法认知之间的关系问题。如果事实裁判者将人类的认知偏见,通过数据统计以及算法分析转移给大数据证据材料及其人工智能产品,可能会形成“认知偏见”意义上的“数据偏见”与“算法偏见”。因此,大数据证据的司法适用,需要在保证司法认知“无偏见”的背景下,进行案件事实认定的判断和证明,充分发挥大数据证据的辅助证明作用和整体主义判断思维,提高事实裁判者的司法认知能力。在人类主导的底线要求下不得动摇人类作为司法决策者的主体地位,接受来自算法的支持而非支配,避免隐藏在人工智能产品中的“认知偏见”对司法实践带来难以控制的负面效应。
(五)大数据证据进行事实认定的限度问题
一方面,大数据证据事实认定有其内部限度。首先,数据的收集、计算处理等存在技术限制。在新证据时代,由电子数据和电子证据所形成和完善的全样本意义上的法律大数据存在一些内部限度问题和困难。例如,“数据采集方式有待提高,数据的完整程度不够高和数据不开放、不贯通。”还可能出现数据信息认知的偏差问题以及信息传递和传导过程的可靠性问题等。其次,数据技术发展的滞后性,需要不断推进技术更新和完善,否则无法进行精确的类案比对。再次,数据处理系统与法律语言知识体系之间存在隔阂。也就是说,在技术与法律、系统与法律之间存在一定的不匹配。总体上看,这种大数据事实认定的内部局限性,“需要我们予以高度重视。这是因为,我们比想象中更容易受到数据的统治——让数据以良莠参半的方式统治我们。其威胁就是,我们可能会完全受限于我们的分析结果,即使这个结果理应受到质疑。我们会形成一种对数据的执迷,因而仅仅为了收集数据而收集数据,或者赋予数据根本无权得到的信任”。
另一方面,大数据证据事实认定存在外部限度。首先,需要明确的是大数据与全数据的偏差问题。例如,这种偏差或者偏差系数是否属于合理的范围。其次,需要的是全数据对大数据的检验与纠错,防止司法实践中的以偏概全。再次,现代智能法学背景下的计算法学和电子证据应用,还是没有摆脱大数据事实认定机制智能化的技术瓶颈。例如,电子数据和电子证据的大数据分析和智能算法,需要对案件各种事实进行分词运算和结构化数据分析,而目前的技术水平难以达到司法适用的智能化程度。最后,前述所强调的法律语言与计算机术语存在语义理解和编译原理的根本性差异,这将导致大数据智能运算分析难以进行对应解释,法律规范中的上下文与案件事实多样性之间难以对答和模仿。这是因为,大数据的数据标准是结构化的,类似于现实生活中的各种表格与具体内容,因此它是精确的;而现实生活中的司法案件和各种事实,是非结构化地呈现在司法者和大数据系统面前的,它是模糊的。此外,大数据证据的良好应用,需要构建大数据证据提升事实认定能力的保障机制,需要完善数据全量保障机制、数据管理与鉴真机制等。
四、大数据证据进行事实认定的学理分析
(一)大数据证据的技术逻辑
在大数据与人工智能快速发展的智能法学背景下,以电子证据为核心的大数据证据的分析算法将从“因果分析”发展到“关联分析”。在证据学的事实认定方面,大数据证据与其他社会科学的数据一样都被要求以交互表格的形式进行组织和关联分析。例如,在社会学方面,教育水平和职业的关系存在性别差异、社会网络中的友谊模式、择偶中的跨国因素和时间变化;而在心理学方面,存在关于刺激识别和刺激类化的实验数据。因此,尽管我们所关心的是探索它们的因果性质和系统性联系,但是有时应用的这种统计分析工具在理解证据与事实关系的意义及其复杂性方面却存在困难,基于大数据的关联分析和交互结构才是向前看的事实认定组织体系。进一步来看,大数据分析在证据和事实的认定方面,主要是基于数据和计算的关联分析模型。这种关联模型需要在功能、形式和维度方面进行交互和整合。对于若干证据类型和电子数据的提取以及线性方程分析,可以使得事实认定者了解案件事实信息的数据增量和单向时间发展关系。而通过混合式的多维度形式计算和大数据分析,使得案件中的证据与事实之间形成一种所谓的立体式的“交互模式”,将单向关系发展为可以表现体系性的证据信息数据的关联模型,进而可以使得事实认定者能够在复杂而难以被认知的案件证据材料当中,寻找到证据与事实之间的恰当的顺序排列。
在涉及法律和司法应用的大数据研究中,人们关注的是研究者和事实认定者是否仅是依据样本数据而非整个总体而做出判断和裁决。在证据与事实的复杂关系中,针对某一案件信息变量的电子证据数据分析和测算推断,将会受到比简单随机抽样情况下更复杂的抽样变异的影响。而且,“当案件的证据信息样本规模较小的时候,线性化方法及其渐近假定可能是有问题的。”因此,在大数据背景下的证据制度和法学研究,也将如数据的指数增长一样呈现出从传统证据形式种类转变为数字化的电子证据形式。“现在几乎所有数据的产生形式,都是数字化的。”而证据法学中的证据种类、 证据规则体系和证明路径选择也将不可避免地与大数据发生联系。大数据证据的变革与发展,将随着数据的爆炸、高清晰度的视频以及传感器的增加而逐步凸显出来。
(二)主导思维与关联辅助思维
一方面,法官思维的大数据分析应用和陪审员思维的大数据分析,是一种主导思维。在大数据时代,法官以及陪审员的事实认定的思维需要扩展,需要增加一种基于智能的辅助认定事实系统。这种大数据事实认定者在思维意义上的大数据思维,本质上是一种关联思维,具有查询和辅助事实认定的机能,目的是使法官的事实认定思维更加精确。而通过大数据对于证据与事实关系的间接分析,废除了因果类型归属思维的异质性和歧义性,使我们获得了能够较为统一地理解证据与事实之间的关系方法。另一方面,事实认定的云计算思维和大数据思维,是一种辅助思维和参照思维。它的重要依托有两个方面的内容,一是大数据,二是云计算。它的本质在于智慧法学时代背景下的大数据事实认定的关联思维和类比思维。这突出地表现在通过大数据来引导证据法学发展,也就是在讨论物理世界时极其倚重自然科学的方法,并且采取某些影响深远的“类比”,这些“类比”即便在最无关宏旨和最具个别性的问题上,也会引导现代法学。
“遵循大数据时代的关系思维进路,应避免简单的因果思维方式,寻求与事实裁判之确定直接相关的多种要素或数据。”通过大数据在证据与事实之间产生关联关系,主要运作的原理在于科学化事实认定思维,即通过法官+人民陪审员+智能计算机系统来进行事实认定的处理和运算。事实认定能力和思维与人类的认识能力密切相关。而在司法实践中,事实认定的能力又与人类认识的原始思维、经验思维和逻辑思维产生关联,这种前因后果式的线性思维,本质上是一种线性推理思维和维度。而在大数据证据事实认定机制中,存在的思维不是前因后果式的追溯性分析,而是基于关联关系的互动性推理和分析。这需要将人工事实认定思维与智能大数据事实认定思维进行互动整合。
(三)事实认定的模式转型
第一,从规范型事实认定模式到实证型事实认定模式。从传统事实认定的模式来看,法律规范解释性质的规范型事实认定模式居于主导地位。它的基础在于案件事实与证据之间的关系。而大数据分析性质的实证型事实认定模式,基础在于大量数据的统计和云计算的智能分析,具有实证的特征和思维,体现为对案件事实真实性的数据证实和信息检验,形成基于数据规模、样本检验和关联分析的大数据证据分析的意识和思维。
第二,从相对型事实认定模式到确定型事实认定模式。传统审判体系中的事实认定模式是一种相对型的事实认定模式,具有一定程度的不确定性。而大数据事实认定模式,具有一定的数据确定性,是一种科学性的事实认定模式,因而具有可检验性。前者所谓的相对型事实认定模式,主要是从人工和经验的角度进行分析,法官等司法主体的事实认定,具有相对性的如证据材料、 自由心证、证据规则、经验法则、司法前见等要素影响。而从相对型到确定型的事实认定模式,主要是从证据视角的转变来审视的,其能够基本实现法律规则所要求的“基本的可信度”,这是由大数据和智能系统云计算挖掘而产生的较为科学的事实认定机制。
第三,从主观型事实认定模式到客观型事实认定模式。由于传统事实认定模式主要依赖的是法官以及其他事实认定者的经验法则、 司法前见等主观因素,因而具有典型的主观性。而大数据的事实认定模式,具有前述所讲的智能性、可视性、还原性,因而具有相当大的客观性和科学性,是一种客观型的事实认定模式。这种客观型事实认定模式集中地体现为事实认定和司法裁判的可预测性。而大数据的科学化事实认定过程,就使得人们准确而精确地预测案件结果成为了可能,体现为法律中的心理强制力而非主观逻辑的推演。
(四)事实认定适用体系的优化
通过大数据提升事实认定能力,一方面从证据视角能够实现从证据分析到大数据分析,有利于辅助案件事实认定; 另一方面能够弥补传统证据体系的不足,实现事实认定过程中科技与法律的良好互动关系。
首先,大数据证据的事实认定分析,能够构建证据推理结构的大数据模型。传统的证据推理结构,主要依赖的是经验和逻辑,如艾伦所主张的经验推论模型、威格莫尔所强调的图式体系。这些证据推理结构都是一种因果关系性质的逻辑推演,而大数据证据体系的证据推理结构,主要为关联性类案比对模型,它不是一种回溯性推理,而是多维的、向前看的关联的立体推理。同时,大数据证据推理结构,能够实现证据推理和决策的计算模型,进而统一乃至预测事实认定的标准和尺度。
其次,大数据证据的事实认定分析,能够促使证据规则完善及其应用。第一,有利于证据制度的升级换代,实现从神示证据、法定证据、自由心证证据制度到所谓的“以电子证据为核心的新证据制度”。第二,有利于证据概念与证据属性等基本理论的更新和完善。对证据概念进行更新,由材料说更新到数据说、信息说。在大数据证据制度的证据属性方面,从大陆法系国家的证据能力理论发展到具有技术性的电子证据资料和方法,对其证明力尤其是对证据材料的证明力进行量化分析,有利于较为准确地进行事实认定。而在我国证据属性理论中的三性能够在大数据时代得到进一步发展,如真实性通过大数据进行检测;相关性可以通过大数据进行数据关联及其层级的分析和研判等。第三,对证据分类理论的发展。如对于传统意义上的直接证据和间接证据分类,可以使得证据之间的印证关系发展到关联关系; 再如有利于完善证据种类体系,提升电子证据的应用能力等。第四,对于证据调查制度的完善。例如,对于取证—质证—认证的大数据分析,有利于切实实现审判中心和庭审实质化。
(五)大数据证据采信的路径依赖
在以电子证据为核心的新证据时代,不仅需要重视的是大数据分析和人工智能的应用,而且需要在智能法学的背景下对电子证据以及采信应用原理进行科学化和精确化的审视。而在这其中,需要重点强调的是,越来越普遍的电子证据的采信原理以及标准化适用,体现为大数据证据应用中的电子证据路径依赖问题。这是因为,大数据证据作为电子证据的一种载体,具有证据法学和科学技术的双重要求,需要以复杂而大量的科学研究为基础,并进行简便化操作和应用,使得司法人员和每一个公众能够理解和接受。例如,在大数据证据的电子证据(数据)属性方面,电子数据收集、提取与技术侦查程序适用的关系较为复杂,在“大数据”时代,“网络技术不断发展,取证方法也在创新,需要在有效取证和保证权利之间达成平衡”。再如,大数据技术中的区块链等在杭州互联网法院的司法实践中得到应用,法院认可了原告采用区块链作为电子数据的存证方式,从而认定了侵权的案件事实。
从大数据时代的主要载体和基本原理来看,大数据证据的电子证据属性具有系统性、 稳定性和多元性特点,它主要涉及的是三大类型的数据基础和证据信息。一是指计算机中尤其是硬盘中所存储的电子证据和相关数据。最为突出地表现为电子表格、多媒体数码档案、应用程序、文档资料以及数据库资料等。二是在计算机运行过程中,系统和服务器所记载的记录日志。例如,服务器的数据库记录、网页服务器浏览等操作的记录日志、电脑防火墙的记录日志、电子档案传输(FTP)中的服务器记录日志等。三是由互联网经过计算机、手机等电子设备所传递的数据信息。
在大数据技术、 区块链运行和事实认定过程中,需要注意应用哈希值(HASH)的验证机制。在电子数据和电子证据的取证过程中,较为常见的的HASH 种类为MD5;它是对电子数据内容的一个校验,即内容一致哈希值相同。从计算机技术角度来看,在特殊情况下哈希值可以通过查密码表来进行破解。具体来看,应用哈希值验证电子数据和电子证据的克隆以及镜像原理方法,是基于计算机技术中的哈希值原理要求的。也就是说,任何文件都可以在散列算法中创建一个哈希值。一般认为,两个内容完全一致的文件其HASH 值相同;两个同名文件内容稍有差异HASH 值不同; 具有不可逆性,不能通过HASH 值恢复源文件内容。这种哈希值广泛应用于涉及电子数据和证据的电子签名、数据安全、文件一致性检验等领域。
例如,区块链技术背景下的“智能合约”,将证据与事实进行一种“虚拟融合”,使得计算机系统能够执行当事人之间的合约。这种电子数据性质的合约就是基于大数据的区块链程序。一旦合约上传,便永远存在区块链里。智能合约将自动执行基金账户,如果发生纠纷,智能合约将会在特定的救济程序中将合约过程的事实情况上传至开放应用程序编程接口(API),合约的基本情况将一目了然。这时,大数据带来事实认定和取证的新变化,体现为快捷发现线索、拓展证据思维、创新案件审理方式和提高事实认定效率等。也就是说,如果在基于哈希值和无法篡改的区块链上通过密码技术记录土地登记、 机密文件等权利和个人信息,那么即使不通过国家或者企业等信赖的第三方机关,也能够证明特定权利与数据的存在。同时,区块链上的权利转移不会遗漏任何数据的变更记录,可以实现彻底的追踪功能。
结 语
从事实认定模式和证据学的历史发展阶段来看,整个证据世界可能在事实认定方面可以被类型化为“无数据时代”、“小数据时代”和“大数据时代”。而在证据的无数据时代,人们期盼的是减少错误和依据神之意志的“测量过去”程式;在证据的小数据时代,以天文学家为代表的空间和时间研究,采用了更为精确的、允许一定范围内经验偏见的量化世界方式,形成了著名历史学家阿尔弗雷德·克罗斯比所谓的“测量现实”;而当历史车轮走到了当前以电子证据为核心的大数据时代,司法大数据和人工智能的学者们获取世界的方式转变为“测量未来”的、可以重复结果的、向前看的能力。
在以电子证据为核心的新证据时代,大数据证据是一种电子证据,证据与事实之间存在大数据分析与智能算法应用,事实认定思维、事实认定过程以及证据体系完善需要更新和完善。最终在电子证据采信应用的规范化路径下实现司法应用和具体操作,构建能够应用于审判体系的具体类型案件事实认定模型。
注释:
①Krish Krishnan,Data Warehousing in the Age of Big Data,New York: Elsevier Inc.,2013,p.5.
②王禄生:《论法律大数据“领域理论”的构建》,《中国法学》2020年第2 期。
③Kord Davis,Ethics of Big Data,Cambridge: O’Reilly Media,Inc.,2012,p.118.
④秦蓁:《相知与定名:人工智能(AI)时代的图像、文献与历史》,《学术月刊》2017年第12 期。
⑤钱宁峰:《走向“计算法学”:大数据时代法学研究的选择》,《东南大学学报(哲学社会科学版)》2017年第2 期;马长山:《智能互联网时代的法律变革》,《法学研究》2018年第4 期。
⑥左卫民:《中国在线诉讼: 实证研究与发展展望》,《比较法研究》2020年第4 期。
⑦参见奇虎诉腾讯滥用市场支配地位判决书,访问地址:http://www.court.gov.cn/wenshu/xiangqing-7973.html,访问时间:2019年11月2 日。
⑧左卫民:《迈向大数据法律研究》,《法学研究》2018年第4 期。
⑩栗峥:《人工智能与事实认定》,《法学研究》2020年第1 期。
⑪郭哲:《大数据时代查办职务犯罪侦查模式认识论》,《政法论丛》2019年第3 期。
⑫程雷:《大数据侦查的法律控制》,《中国社会科学》2018年第11 期。
⑬高翔:《民事电子诉讼规则构建论》,《比较法研究》2020年第3 期。
⑭王燃:《大数据时代侦查模式的变革及其法律问题研究》,《法制与社会发展》2018年第5 期。
⑮柳永:《大数据背景下电子数据行刑衔接机制研究》,《行政法学研究》2018年第5 期。
⑯丰叶:《职务犯罪大数据证据研究》,《科技与法律》2020年第1 期。
⑰智能法学,主要探究法律与大数据、人工智能的良性互动关系,体现为法律信息化建设的新阶段,表现为法学研究与法律应用的数字化、网络化和智能化。具体请参见高晋康、杨继文主编:《迎接智能法学的到来》,法律出版社2019年版,第1 页。
⑱刘品新:《论大数据证据》,《环球法律评论》2019年第1 期。