APP下载

大数据证据相关法律问题探究

2021-01-06公景钰

客联 2021年11期
关键词:大数据

公景钰

摘 要:大数据技术问世以来就对各个领域产生了冲击,那么它能否为诉讼证据带来新的变革?本文试图通过大数据在诉讼过程中事实认定的作用揭露大数据可以作为一种新的证据形式,具有证据的实质作用。并且在证据推理与证据关联性中主要起到方法论作用。在证据推理中主要用概率对法官的审判经验起到补充,大数据的相关性与证据相关性有同有异,但有学者提出可以用证据相关性审查大数据相关性。最后通过对自由心证与大数据的证明力成本收益分析得出自由心证有不可代替之处,但我们也应该考虑“机器经验”。

关键词:大数据;证据关联性;证明力

随着时代的发展,大数据逐渐深入我们的生活中。小到淘宝的“猜你喜欢”,大到办案人员用大数据追踪犯罪嫌疑人的踪迹,那么这一科技手段能否给我们的诉讼带来新的变革呢?我的回答是肯定的。本文着力于探究大数据在民事诉讼中事实认定的环节的作用,延伸到大数据与证据相关性的关系,并且通过成本-收益分析的方法总结出虽然大数据得出的结论超出人类的认知,但有时我们需要给予“机器经验”一点信任。

一、大数据在事实认定中的作用

司法裁判过程牵涉到在交互的语境中完成法律推理、价值判断、法律解释的法律发现过程,以裁判文书为例,很难简单运用一种或几种论证实现对纷繁复杂的社会活动作出裁判。{i}在民事诉讼中的审理过程中我们大致可以分为两个阶段,一个是事实认定阶段,一个是法律适用阶段。事实认定包括对案件事实的发现和对法律适用的发现。本文集中在事实认定方面,将大数据的作用分为两个方面,一是作为一种新的证据形式,二是在证据推理过程中的作用。

(一)大数据作为一种新的证据形式

证据的含义实际上就是可以决定或者证明某说法为真的一切事物。在人类产生并发展的时间长河里,我们发明了很多辨别真伪的办法。通过不断的试错,留下的经验法则成为我们当今主流的证据形式或者证明要求。证据通过命题、断言在推理或者论证中支持待证事实。

而众多形形色色的证据并不能严丝合缝的与几种命题或者推理模式一一对应,在现实生活中,关于事实推理的部分,更多还是要依靠法官的自由心证,这个过程往往很复杂,涉及到大量利弊权衡以及法官本人的生活经验判断。在完成事实判断的基础上,再对整个事实论证进行合理性构建。简而言之就是先通过法官的内心想法产生结论,而后在去填补过程。

事实认定的自由心证过程是一个基于经验的判断过程。最理想的判断场景是在法官对于案件信息和社会信息充分了解。但在这样一个信息爆炸式增长的社会中,社会生活真真假假融杂繁复,法官很难对各个领域产生一个全面的了解,而大数据让我们看到了可能,互联网作为目前世界上最大的知识库,是法律从业者可以快速获取信息的渠道,想象一下如果我们可以通过某个角度对互联网上的数据进行收集、筛选、分析,进而为法官作出内心判断时提供了解社会的工具,法官只需要按照自己的理性即可从一堆数据中作出最优选择。在这一方面中,虽然我们还是要依靠自由心证才能得出结论,但大数据可以为自由心证提供可靠的知识基础另一方面,大数据能否直接当做证据使用?互联网自问世以来,持续渗透着直至后来改变着我们的生活交往方式。我们在正常生活的同时就会产生大量的信息“痕迹”,这些痕迹都会以某种方式记录在云端。以诉讼律师的角度来看,这些痕迹往往是很重要的证据来源,例如:銀行流水、裁判文书等等。随着司法公开的推进,日益公开的文件是大数据的来源之一。诸如此类数据虽然是大数据的一种,但我们讨论的并不是这种数据的筛选与应用,这种数据我认为可以归为电子数据证据种类中的一种。

目前的大数据分析技术已经具备将各个站点的数据整合为全网数据进行筛选,并且根据通过观察数据之间、用户选择之间的联系得出一个概率结论。而我们讨论的重点就在于此。诉讼律师能否将这种概率当做证据提交法庭,并且在案件中依据这一概率证明待证事实?法庭又是否会接受?我认为这两个问题的答案都应该是肯定的。我认为这就是大数据超越人类认知之处。大数据技术从浩如烟海且杂乱无章的数据提炼出同种或者同类的数据集合供人们发现规律,而这一点人力显然不可能做到,就算是做到,成本也已经超过了能承受的范围。但很多时候全量数据分析能从趋势发展角度预测市场主体的可能行为。{ii}大数据分析仅仅是对全部数据的分析,能够帮助法律从业者拓展知识,特别是在了解证据对待证事实的关联性方面,大数据有助于法律从业者跳出以往只能依赖经验的圈子,给予了关联性一种清晰的数据评判标准。

(二)在证据推理中的作用

证据推理不仅仅是一种寻求逻辑思维的过程,同时也是主观经验的判断过程,大数据分析是针对互联网浩如烟海数据间的相关性分析,是一种概率分析。关于大数据对证据推理的作用,我认为是先将一个证据分为几个命题,然后将所有命题与待证事实之间的关系用概率表示出来,这样使得我们必须将一个命题证明过程中的所有因素以及所有步骤全部展示出来,无论是潜在还是明示考虑。命题的证明过程能够更为清晰,同时由于这种清晰增加论证的有效性与说服力。但是仅仅探究命题的证明过程无法告诉我们哪一个证明结论是更重要的或者与待证事实关联度更高的。

大数据对于证据推理的作用在于概率,通过准确的概率细化逻辑推理的种类。但是威格莫尔说过“任何一个具体推论的强度都取决于在被探索的主题上的经验,而非逻辑。逻辑仅仅在展示我们内心过程时给予帮助”iii。这句话点明了逻辑与经验始终处于不同的方向。在社会生活中虽然逻辑能够将我们的思考过程进行数据化的清晰的展示,但却一直无法涉及到推理根据是否可信。

在理解大数据是如何作用于证据推理之后,法律从业者依然需要通过自身经验对案件事实进行取舍。虽然我国法律并不承认“自由心证”,但是不能否认的是,在我国的法律实践中存在着许多自由心证的广泛存在。例如:一个案件的事实认定,可能就要靠一件证据认定,那么对这一证据采信哪一部分、可信度有多少等等一系列的问题都需要法官的主观判断,也就是需要法官的“心证”。邹碧华法官指出,“心证”形成需要必要的主观判断,如果完全抛弃主观判断,在许多案件中就会产生不公平的问题(如民事案件判断标准刑事化问题)。iv虽然主观判断并不是最优的判断方法,但是能够延续至今自然能够保证公平。这种公平的保障来自于法官的心证是通过累积大量判案经验与社会经验的沉淀,在面对案件材料的理性思考,法官这一思考机制并非类似于公式固定下来,而是会随着社会的改革发展、新思潮、新技术的出现而改变。而大数据通过概率预测社会走向,不免会给法官在判断时带来影响。

大数据在事实认定环节起到的作用主要是提供概率,无论是作为证据直接证明某一待证事实,还是作为潜在证据为法官的自由心证提供依据,抑或者是作为预测工具预测社会走向。诚然大数据想要作为证据—无论是明显还是潜在的,都需要证明其提供数据或者概率与案件有相关性,也就是说,大数据已经起到了证据的实质作用,仍需要论证其是否符合证据的形式。

二、大数据与证据相关性的关系

就如同一枚硬币有两面一样,任何一段关系都包含着同与不同。

大数据与证据都很存在相关性的问题,但两者的着力点不同。大数据关注的不是单个数据之间的关系,更多的是在庞大的数据中找出同与不同进而进行分析;而证据则注重个别数据之间的联系,或者说有无关系。换言之,就是大数据重点在于“大”;证据重点在于个别。大数据通过对概率的分析,更加擅长对未来可能性的判断,而证据只需要将已经发生过的事情尽量以最高的还原度說明即可;大数据更多强调的是基于全网数据对趋势的实时判断分析,而证据则力求基于理性思维和主观经验分析后作出最佳判断。另外,两者对于精确度的要求也不同。大数据并不要求高精度,只是要求迅速反应当下情况的全貌;而证据则追求非常高的精度,也就是正义,对于效率要求则排在正义之后,这一点可以通过诉讼时长得出。

关联性是证据能发挥作用的几个基本要求之一。只有首先具备了与待证事实的关联关系之后,才能探究其证明的逻辑、证明力等等。在大数据刚刚出现时,就有人提出在小数据世界中,相关关系也是有用的,但在大数据的背景下,相关关系大放异彩。” v但是,上文已经提出了大数据与证据的关联性有所不同,那么大数据的这种相关性能否在证据中应用呢?这个问题也就是大数据展示的关联性能否被人类经验认知所承认。

一种观点认为,“大数据相关性与证据相关性在概念上相差不大,核心差异在于面向的问题域,以及是否有人的参与因素” vi与此相对但更进一步的观点是,大数据的相关性可以援引证据相关性或者传统的相关性来审查。“传统的关联性判断标准还是可以用的,这个标准可以分为两个具体标准:一是指向标准,即这些数据和相关分析是不是指向案件的争点问题;二是功能标准,即这些数据和相关分析得出的结论对于证明对象有没有证明作用或者证明价值,亦即这个材料的存在使争议的问题变得更有可能还是更无可能。”vii或许,用传统的判断方法对大数据证据关联性的审查会成为可行之路。

太阳底下无新事。大数据揭示的关联性或许我们现在依靠已经获得经验并不能理解,但正如电子数据变成法定的第八种证据种类一样,新事物的出现会打破旧世界的认知格局,甚至说,必然会打破。英国学者维克托说“认识论意义上大数据分析运用的相关性理论是超脱于人类经验判断的‘数据经验’……”viii无独有偶,我国学者也有相似的看法。“大数据分析方法让我们看到了瞬间大批量处理非结构化信息的可能性,同时大数据分析方法能够弥补人类对庞大数据分析理解上的不足,为事实认定者提供了基于数据的‘数据经验’或者‘特殊经验’。” ix而这就是大数据带给关联性规则的关键性挑战。

大数据对于数据相关性的判断,是一种超越人类经验认知的计算判断,使我不禁让我想起“奇点理论”对未来世界的预测。美国专家在《智能机器时代》中提出:“技术不可避免地朝向机器化发展,必将大大超越人类的智能。” x奇点涉及很多方面,其发展速度是近似垂直的指数增长,技术的扩展速度也似乎是无限的。当人类有了新的认知工具,人们对于基于计算的证据有了更深层次的理解,大数据的相关性同样可以采用证据法相关性的概念框架进行理解,两者在概念构成上具有异曲同工之处,相关性由证明力和实质性构成,证明力强调的是逻辑上的因果关系以及证明力量的传递,而实质性则是事件间的牵连关系,此牵连关系基于经验判断,同样能够基于客观的全量数据计算。xi

大数据在分析数据时的确存在逻辑与经验的引导,但是在数量如此多的数据中,数据与数据之间的因果关系、认识经验已经超过了人类的认知,在计算能力达到极限时,我们可以通过大数据分析事件之间的微小关系,对复杂事件或者社会趋势提供预测。

三、成本收益方法分析证明力

上文所述的无论是大数据作为证据还是在证据推理或者在证据相关性中产生作用,归根结底都是大数据作为一种证明手段冲击着旧有的证明手段,例如自由心证。实际上无论是哪种证明手段都是人们在生活中发展筛选出来的最有效率地发掘各色证据证明力的一种方法,既然如此,我们可以通过成本收益的方法分析出两者谁的效率更高,从而希望可以为未来的证明力标准提供参考思路。

(一)关于自由心证的分析

自由心证是伴随着18世纪启蒙运动的发展而出现的,主要是为了破除当时占主流地位的法定证据模式,同时也呼应了迅猛发展的自然科学和工业革命提高人的理性的要求。

我认为自由心证最大的收益就是它的灵活度。试想一下,在自由心证产生之前,我们都是依靠着法定证据规则。无论证据多么不适应复杂的案件事实无论法官本人是否信服这一证据,只要证据符合法律的要求,我们都要承认它的证明力。这一做法显然是不合理的。而自由心证的出现一定程度上发挥了人脑处理事件的灵活性。法官在处理案件时可以观察当事人的语言、神态,或者是运用自己的逻辑思维,基于案件提出自己的意见。自由心证在对于证据真实性关联性方面,在多维度思考问题上,都体现出它巨大的优势。

值得一提的是,无论科技怎样发展,即使计算机算法达到极限,我认为自由心证的灵活性永远无法被取代。举一个例子,在《折玉龟鉴》中有这样一个案件,有一老翁去世时有一子一女,其中子年方七岁,女已嫁人成家,老翁的遗嘱写明把遗产尽数留给女儿,仅仅给儿子留下一把刀,并且儿子要到成年后才可基础。要知道在重男轻女的古代,留下这种遗嘱是非常不可思议的。我们只能用自由心证的方法来猜测这位老翁的意图,他实际上是想把遗产留给儿子,但恐惧女儿女婿为了遗产杀害幼小的儿子,为了儿子平平安安的长大,假意将遗产都留给了女儿,实则希望儿子在成年之际用剑夺回家产。无论是证据法定还是大数据都无法作出正确的判决,所以自由心证的灵活性永远都有其独特的作用。

同样,自由心证的灵活性附带的成本就是其可读性、确定性与统一性不足的成本。自由心证容易造成恣意判断,证据的证明标准难以确定等问题。而且虽然自由心证的结果可以获得公众的支持,但其证明过程的可读性大大降低,其思考过程无法直观呈现,没有一套准确的尺度,后果的不确定随之而来。长此以往,审理案件就只能依据审理过的案件摸索极为有限的经验或者规律。

(二)关于大数据的分析

大数据相对人脑的分析能够使用统一的计算方式,这对于保障评判证明力的统一性与确定性有着重要的作用。并且在知识的深度以及广度上也是远远超过人脑的极限,这一特点使我们可以在大数据中设置复杂的算法,让大数据代替人脑梳理案情以及对审判结果进行预判也具有可能性。

除去上述因素之外,大数据本身就存在着一定的价值倾向,这些倾向是基于互联网的开放平等透明等特点附着到大数据上的,换言之,这是值得我们追求的美好品质。在技术发展成熟的时候,这些品质都有希望基于大数据技术进行概括。其次,情感能力并不是人类的专属,人类情绪的产生背后都是有经济学意义的,悲伤、同情等情绪都是为了人类这个群体能够更好的生存下去。那么大数据也完全可以设置一个充满经济学的算法。人类情感智能已经成为一个新的开发领域,这是得大数据未来可能在一些数据的处理上,能够运用经济算法创造的“情感”分析判断案件。再次,大数据技术是可以随着技术的进步而随着进步的,这让大数据本身對自己的算法进行逐步优化成为可能,这种灵活性会远远优于自由心证优化的速度。并且相比自由心证,大数据出现黑箱问题的几率也会更少。自由心证的公开受到各方面的阻碍,即使公开,也无法知道法官对自由心证内容是否有所保留。

大数据技术之所以有无数可能依据的是其海量的数据范围以及独特的算法,问题(成本)也就这里。第一,大数据技术会普遍存在偏在的问题,大数据毕竟是人造之物,现实生活中我们看待事物避不可免的会带有自己固执的偏见,那么大数据在挑选数据样本的时候就带着我们的偏见,数据样本都是有偏见的,结果也必然带着偏见。例如有某种偏好的人可能被我们认为更可能会犯罪,那么大数据得出结论就会比自由心证得出的结论歧视现象更加严重。第二,大数据发展至今,依靠的技术大部分还是归纳方法与模糊处理。对于疑难案件很难提出建议。而普通案件依靠法官的自由心证就足以得出公平的结果,疑难案件恰恰是法官需要借助外力获得帮助的地方。并且遇到从未出现过的新案情也是同样的情况。最后,更为根本的问题是,无论大数据如何发展,它都无法处理法理与情理的问题,这种局限是我们寻求机器证明力标准无法逾越的鸿沟。

我们千百年来都一直追求着更为经济的证明力评判方式,现在大数据技术的出现似乎又将带来新的变革。不可否认,大数据算法倾向与知识储备会成为它独特的优势,与此同时,其技术存在的偏见问题、技术定位问题依然存在。自由心证以其无与伦比的灵活性处于中流砥柱的地位。但我们应该在心证之外,给“机器经验”留下位置。

参考文献:

i参见周蔚:《大数据在事实认定中的作用分析》,中国政法大学学报2015年第6期,第65页。

ii 参见周蔚:《大数据在事实认定中的作用分析》,中国政法大学学报2015年第6期,第65页。

iii 参见:《证据理论:边沁与威格莫尔》,中国人民大学出版社2014年版,第223页。

iv 参见邹碧华:《要件审判九步法》,法律出版社2010年版,第146页。

v参见[英]维克托·迈尔·舍恩伯格:《大数据时代: 生活、工作与思维的大变革》,周涛译,浙江人民出版社2012年版,第71页。

vi 参见周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》2015年第6期,第82页。

vii 参见何家弘等:《大数据侦查给证据法带来的挑战》,《人民检察》2018年第1期,第57页。

viii 参见周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》2015年第6期,第70页。

ix 参见周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》2015年第6期,第82页。

x Ray Kurzweil, The Age of Intelligent Machines Cambridge, Mass: MIT Press,1989

xi 参见周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》2015年第6期,第82页。

猜你喜欢

大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索