APP下载

大数据技术在刑事定罪中的运用

2021-03-13阮堂辉

湖北警官学院学报 2021年1期
关键词:定罪裁判证据

阮堂辉,张 晟

(1.中南民族大学法学院,湖北武汉 430074;2.武汉市公安局洪山区分局,湖北武汉 430070)

网络大数据时代的到来,已经深深影响乃至彻底改变了我们的生活和工作。将大数据技术运用于司法领域是值得研究与期待的。然而由于法学研究者对跨学科的大数据计算机学科不了解,现有法学研究对大数据、人工智能的运用解释常常以“黑盒”无法展示一笔带过。本文试图打破这一“黑盒”惯例,针对定罪标准这一研究对象,将网络现货投资交易案这一新型网络犯罪作为研究载体,将大数据这一新技术作为研究手段,通过数据挖掘决策树CHAID 算法对案例进行定量分析,探讨大数据技术在司法裁判定罪标准上的运用。近年来,“智慧法院”工程大力推进,为建立基于案例指导的司法审判制度提供了海量的决策数据,奠定了基础。在此,笔者试图将大数据技术运用到刑事诉讼定罪裁判中,通过算法对大量案例数据进行运算,实现基于审判规则和案例支持的新型定罪决策模式,使审判决策结果形成均衡统一的标准体系。

一、大数据技术概念及功能

大数据技术,是一种先进的信息技术,是指在各种类型的海量数据中,运用各种方法快速获得有价值信息并用于决策的技术。大数据运用于决策的概念如图1 所示。

图1 大数据运用于决策的概念示意图

如图1 示意,以具有4V特征的具体量、多种类的数据作为原料,通过数据挖掘算法进行高速度加工,从海量数据中提取规律,提升信息价值密度,用以智能决策。[1]

大数据的最大功能是预测。预测的原理基于数理统计定律——大数定律,即在一定条件下具有多种可能结果的现象可视为随机事件。随机事件的出现频率将会在某数值附近波动,随着样本次数的增加,随机事件的频率近似于它的概率。数理统计学上的经典例子是抛一枚质地均匀的硬币,在小样本实验中,正反面出现的次数是没有规律的,然而当抛掷次数达到上千万次等极大次数时,正反面出现概率达到各50%,这反映了实验条件硬币质地均匀。以司法定罪标准运用来分析,一个案件得到的判决结果是无罪、此罪、彼罪多种,其结果是或然的,然而大量重复进行这种判决实验,判决结果就会显现规律,其结果就会与固定事实构成的案件相对应。这种固定性规律便是预测依据。

二、大数据技术在刑事定罪中的运用价值

大数据能否良好作用于定罪裁判,最终还是要看其能否有助于司法裁判价值的实现。下面,笔者以大数据技术的决策树CHAID 算法在定罪裁判中的具体运用,结合司法裁判“准确、及时”两个价值,论述实务意义。

(一)大数据技术对准确定罪的促进作用

准确的司法证明依靠逻辑法则和经验法则。[2]从经验法则运用上看,笔者认为大数据背景下的证明标准与传统司法裁判天然统一。其一,裁判来源都是判例;其二,本质上都是类比推理,先归类再相比。具体识别上分三步:(1)识别出一个可以进行推理的基点;(2)描述基点情况与问题情况相同或相似及不同或不相似的那些事实情况;(3)判断这些事实上的相同点或不同点何者更为重要。[3]大数据背景下的证明标准具体运用中,算法恰恰是以类案判决为依托,通过层层计算迭代,推导出最终裁判结果的。同时需要指出的是,这种类比推理的基点就是证据链的节点,在网络现货投资交易类案中,修改后台数据、平台缺乏国家经营范围批文、资金直接打入个人账户为诈骗罪定罪证据链中的中心节点,其他证据以此进行链式发散。

从逻辑法则运用上看,笔者认为大数据背景下的证明标准与传统司法裁判有三个相通点。

一是逻辑基本规律相通。逻辑基本规律是逻辑抽象概括出来的思维活动必须遵循的原则,其归纳、概括的特征与司法证明相契合。首先,大数据背景下的司法证明满足同一律。即同一思维过程中,必须保持自身确定、同一,公式表达为A=A。在当事人与法官围绕说理和判断所形成的控辩审三方协同制约关系中,要求对争议问题予以明确界定,并在具体证明过程中保持前后一致。具体到本文研讨的网络现货投资交易类案中,纵然案件事实纷繁复杂,然而一旦这种案件类别明确,核心争议事实就是诈骗事实的认定,借助大数据手段对案件事实进行分解、组合、重构后,不难发现调控后的数据就是案件主要事实,并以此适用实体法解决纠纷。其次,大数据背景下的司法证明满足排中律,公式表示为A V『A。排中律要求主体在同一思维过程中,在相互矛盾的思想之间必须作出明确的选择,禁止在大是大非问题上骑墙居中、首鼠两端。具体到本文研讨的网络现货投资交易类案中,在根据大量案例产生的决策树图中,任何一个具体证据的输入都对应唯一明确的输出路径,而不会“骑墙”。最后,大数据背景下的司法证明天然满足充分理由律,公式表示为【A∧(A→B)】→B,充足理由律的逻辑要求理由必须真实且与推断之间要有确定的逻辑联系,从理由能够推出所要论证的论题。具体到本文研讨的网络现货投资交易类案中,就是在形成决策树拓扑中,进行IF-THEN 语句的天然展示。

IF(修改盘口数据=是)THEN 诈骗罪=是

IF(修改盘口数据=否and 平台经营批文=否)THEN 诈骗罪=是

IF(修改盘口数据=否and 平台经营批文=是and 交易流水=是)THEN 诈骗罪=是

ELSE 非法经营罪=是

二是证据的关联性阐发相通。证据必须具有关联性。英国证据法学者墨菲认为:“关联性不是一个法律概念,而是一个逻辑概念,它刻画了证明中证据和证据指向的争议事实之间的一种关系。如果从逻辑意义讲,证据在某种程度上有助于证明或反证争议事实,那么证据就与争议事实相关,否则便是不相关。”美国证据学家威格摩尔致力于评估证据的证明价值,并引进了一个或然性比例表达式。该表达式被定义为:单一证据e 在假定被告人有罪时的可能性与假定被告人无罪时的可能性的比率,用公式表达就是∧e。若∧e=1.0,则假定被告人有罪的可能性和假定被告人无罪的可能性相等,此时证据e 不具有关联性。如∧e >1.0,证据e 就是对被告人有罪的有利证据;如∧e <1.0,证据e 就是对被告人无罪的有利证据。[4]而在本文研究的网络现货投资交易类案的证据构成中,通过层层演算大量判例中输入证据与输出裁判的概率关系,从而判断出各个证据与裁判结果的关联性强弱,并迭代计算形成整体构成。在修改盘口数据、平台经营批文、交易流水三个自变量中,之所以存在修改盘口数据>平台经营批文>交易流水层次定量关系,是因为在信息增量运算中GAIN(修改盘口数据)>GAIN(平台经营批文)>GAIN(交易流水)。即修改盘口数据这个要素最能区分诈骗和非法经营二罪,关联性最强,其次是平台经营批文,最后是交易流水。这既有局部证据与裁判结果的关联性熵值,又反映了涉案构成证据的整体联系。

三是司法证明事实发现阶段的实质逻辑推理相通。任何一个证据和证明对象之间的关系实质上都是一种逻辑推论关系。这种推论依靠经验法则,但也有其内在逻辑联系。彼特·墨菲将这一推定结构称之为“涵括”(generalisation),即:

如果A,那么B,除非C

王亚新教授系统地概括如下:“第一,经验法则是根据已知事实来推导未知事实时能够作为前提的任何一般的知识、经验、常识、法则。第二,经验法则应该是人们从个别经验的积累中抽象、归纳出来的知识或常识。第三,经验法则往往不能采用全称判定的形式来陈述,而只是盖然性的命题。”[5]而在本文探讨的网络现货投资交易类案最终形成的决策模型中,其判决输出结果恰恰是以这种涵括的方式呈现的。

(二)大数据技术对有效定罪的促进作用

法律推理上,演绎是从一般到个别的思维过程。司法上,经典三段论推理就是演绎,由可适用于该案的一般性法律规定的大前提、已确定的具体的案件事实的小前提和关于该案的法律结论构成,从大小前提出发得出某种必然结论。三段论演绎推理在法律推理过程中不可或缺,能够维护法律的体系性、一致性和安全性,保证实现普遍形式正义的法律价值。然而,司法实践也表明演绎推理也有不足之处,主要表现为演绎推理主要运用于法律适用阶段,即在实在法范围内的“找法”,而法律推理的小前提仿佛是从天上掉下来的一样。实际上事实不仅是证据法的逻辑起点,也应该成为法律推理乃至整个法学的逻辑起点,而传统三段论演绎推理在事实发现方面缺乏叙述。[6]

然而,大数据背景下的定罪标准恰恰是通过归纳类案中的大量判决,形成了对传统三段论演绎推理的一种补充。归纳,是演绎的逆向思维,是从个别到一般的思维过程。笔者认为,裁判者在进行事实认定时,普遍是通过摘取可信度高的证据作为基础,构建符合心理规律和证据叙事的故事来进行裁判的。法学家彭宁顿和黑斯蒂将其概括为故事模型,即“在处理证据信息时涉及到两个背景信息,一是头脑中对于完整的故事版本的概念认识和预期;二是他曾经验过的与该案件事件类似的事件。”[7]其中第二个背景信息恰恰是基于生活经验和司法经验的对于某一类案事实构成的归纳,而本文探讨的网络现货投资交易类案之所以成为疑难案件,就在于案件过于新颖,对于一个一时一地一事的裁判者而言,缺乏事实归纳经验。大数据技术通过归纳海量案例,通过运算形成了一般事实架构,并且这种归纳是正反两面的事实归纳,既归纳了什么样的证据构成能够证明成立此罪,又归纳了什么样的证据构成不能证明成立此罪,而要成立彼罪。法官作为有着共同经验的群体,借助大量经验判例进行归纳完善事实构成,从或然走向必然。当然,归纳具有或然性,由于此种归纳是不完全归纳,确有可能被某一反例的出现而推翻结论。如图2 所示。

图2 具体类案下的归纳演绎推导

人类社会的发展途径之一就是提高效率,各种科学技术的发明运用也多为提高效率服务,大数据技术在定罪标准上的运用也不例外。一方面,从执法角度看,大数据的运用有助于帮助执法办案部门厘清事实轮廓,明确取证重点,提升办案质量。另一方面,从司法角度看,法学家贾德·赛德和J·爱德华·罗素曾进行过如下实证研究:实验组向被试者提供25 项与案件相关的证据主张,而被试者大都仅仅依据3 至5 个关键证据便作出了裁决。[8]也就是说,人们在作出判断时会选取那些更具代表性的证据,并将其作为判断基础。大数据恰恰就是辅助裁判者选取代表性的关键证据,因此有助于统一证明标准,提升审判效率。

三、大数据技术在刑事定罪中的模型构建——以网络现货投资交易案为例

(一)网络现货投资交易案的特点

笔者以新近发生的一起案件为例:2017 年3 月,武汉市某区公安分局打掉一特大网络犯罪团伙,该团伙以网络现货投资交易为包装实施犯罪。现场抓获涉案人员282 人,扣押涉案电脑上百台,涉案手机上千部。经查,2014 年以来,犯罪嫌疑人崔某等人共同出资在武汉市某区成立“浙江昊鼎聚富商品经营有限公司”,其中,犯罪嫌疑人崔某为公司实际负责人,并以“昊鼎公司”的名义先后与“浙江新华大宗商品交易中心有限公司”(现已封停,后台数据不可查)、“湖南久丰国际商品现货交易市场有限公司”(现已封停,后台数据不可查)等多家公司签约,成为其加盟会员单位,由“浙江新华大宗商品交易中心有限公司”“湖南久丰国际商品现货交易市场有限公司”提供现货交易盘(现盘面已封停,后台数据不可查),后陆续招聘犯罪嫌疑人谢某、陈某等同案共计282 人实施犯罪。上述人员在明知“昊鼎公司”与客户之间的经济利益“对赌”关系,仍通过QQ、微信等聊天工具发送虚假的盈利截图、夸大客户收益等手段,诱骗客户到该公司签约的交易平台开户以对贵重金属、原油现货等虚构的交易进行投资,再采取冒充专业投资分析师、引导客户频繁操作、故意提供反向行、止盈不止损、高杠杆重仓操作等方式,致使客户快速亏损,并产生巨额手续费,从而达到非法占有客户资金的目的。此后,根据客户交易的手续费、亏损额、过夜费等给予公司股东、总监、经理、公司其他负责人及业务员相应比例的提成。经查,利用上述手段,该团伙仅通过“浙江新华大宗平台”“湖南久丰国际商品有色平台”就先后造成被害人邓某等数万名客户亏损共计人民币8 亿余元。

从本案基本情形可以看出,网络虚拟现货交易案存在以下特征:一是涉案人数多,由于网络虚拟现货的平台公司和加盟商均是以公司方式运作,犯罪人数动辄上百。二是被害人多,虚拟平台面向社会开放,导致受害人众多。这些导致了证据体量大,调查工作量大。如图3 所示。

二是犯罪有层级,层级之间物理隔绝,数据隔离,风险隔断。平台在交易层级上设有特别会员和会员。特别会员,即“新华大宗现货交易平台”“湖南久丰国际商品有色平台”掌握核心后台行情走势数据,可以在会员赌不过投资者时,为会员对冲风险敞口,甚至修改盘面走向,在本案中,由于在案件收网时,两上级平台已被举报查封,无法获取后台行情数据。加盟会员单位“昊鼎”公司,以签订合同方式约束利益分成,会员单位是投资者的直接交易对手,投资者无论买入还是卖出都会与会员形成“对赌”。

三是平台虚拟运营。所有交易平台均不具有价格发现功能。平台现行的做法是引入外部价格,这些价格实质上是将境外实时行情价格换算为人民币价格。如“昊鼎”公司客户的任何交易手买入卖出均不影响现货价格走势,走势完全为外部数据导入。①参见该案讯问笔录。

图3 网络现货投资交易案犯罪层级图

四是指导“老师”伪造资质,在封闭平台虚拟提供交易信息,指导虚假的双向交易、T+0 连续交易、保证金杠杆交易。

五是以各种费用名义,实现非法营利。犯罪交易平台收入来源主要为交易商缴纳的会员费,以及与交易商对投资者在平台交易生成的各种交易费用(包括交易手续费、隔夜费、点差)的分成。所谓隔夜费,即客户只要持有仓位隔夜,不论是买持仓还是卖持仓,都必须向自己的交易对手缴纳一定费用。

本案焦点在于如何根据证据或有关事实进行定罪,涉及罪名是非法经营罪和诈骗罪。从中国裁判文书网公布的判决来看,网络现货投资交易案以非法经营罪判决的有32 例,以诈骗罪判决的有179 例。

分析网络现货投资交易案件的211 起判决,不难发现,商业化的同质运作使得这些平台运作模式、盈利模式、人员管理模式大同小异。然而,却出现了定罪标准不统一导致“同案不同判”的问题。例如,针对反向喊单,“对赌”协议的犯罪事实,浙江省宁波市江北区人民法院在一审周杨波、祝贺琼、张清等诈骗案中认定为诈骗罪,①从全国判例来看,存在以下七种事实之一,可能适用诈骗罪:(1)指导交易“分析师”根本不具备金融从业资格;(2)平台交易数据、K 线图与国际正规现货交易版完全同步,但是数据定期开放端口导入,交易数据封闭独立;(3)明知公司与客户之间的经济利益“对赌”关系,公司要盈利客户就要亏损,仍通过QQ、微信等聊天工具发送虚假的盈利截图、夸大客户收益等手段,诱骗客户到该公司签约的交易平台开户投资;(4)引导客户频繁操作、故意提供反向行情、止盈不止损、高杠杆重仓操作等方式,致使客户快速亏损,并产生巨额手续费;(5)名为现货交易平台,实则完全虚拟买卖交割,没有现货实物、没有现货仓储;(6)有的平台为私自架设没有省市政府批复备案,有交易平台后台商品价格数据可以修改;(7)有的平台客户在入金后,钱款没有打入公共资金池,而是进入了私人银行卡。而广东省深圳市宝安区人民法院在一审吴筱、吴一帆非法经营案中面对同样事实、证据采集时却认定为非法经营罪。②对于非法经营罪的适用,国务院文件规定:除依法设立的证券交易所或国务院批准的从事金融产品交易的交易场所外,任何交易场所均不得将任何权益拆分为均等份额公开发行,不得采取集中竞价、做市商等集中交易方式进行交易。现货交易在国际市场是合法公认受保障的,但我国此类交易制度尚未建立。我国合法的交易所只有八家,分别为:上海证交所、深圳证交所、中金交易所、上海期货交易所、郑州商品交易所、大连商品交易所、全国中小企业股份转让系统、上海黄金交易所。然而,现货交易的需求又是存在的,省市地方政府为活跃地方经济,批文设置了一批现货交易平台。但是,金融创新不足和金融监管不到位导致现货交易种种乱象的发生。“浙江新华大宗平台”“湖南有色平台”就是在浙江省杭州市、湖南省政府批文成立的交易平台。按照相关法律规定,证券、期货、保险业务,或者资金支付结算业务的批准部门为国家有关主管部门,因此,地方各级政府批文的现货交易平台均为非法经营。因此,非法经营罪可视为网络虚拟现货投资交易类案的兜底判决罪名。“同案不同判”不免导致司法机关将一些互联网创新经营模式扩大为打击对象,或者对应该予以严厉打击的罪行,由于认识不到位而予以放纵。大数据技术介入,可能会有效解决上述问题。

(二)大数据技术在刑事定罪中的模型构建

大数据在刑事定罪标准上的运用以既有刑事判决书、起诉书为研究对象,采取数据挖掘决策树CHAID 算法对类案判决进行运算,从中总结提炼概括,为审判定罪提供支撑。CHAID 算法,是决策树分类算法的一种,通过采用自顶向下的递归方式构造,以实例为依据,从一组无序、无规则的实例数据中推理出用于决策树形成的分类规则,并根据分类的结果进行预测。CHAID 算法对于离散型随机变量较为有效。如图4 所示。

图4 数据挖掘流程

定罪的对象是行为,大数据就以100 起判例进行核心谓词归纳,建立15 项多维数据,如表1 所示。

表1 实证数据项

参数项采用离散数据,设定选择项为是否,如表2 所示。

表2 变量参数

适用IBM SPSS Statistics 26 软件,对100 起网络现货投资交易案进行决策树CHAID 分析,以判决结果为因变量,以证据详项数据集为自变量。如图5 所示。

图5 SPSS 进行CHAID 决策树生成

经递归迭代后得到决策树输出,如图6 所示。

决策树结构完整地展示了网络现货投资交易案的定罪标准,即修改后台数据、平台缺乏国家经营范围批文、资金直接打入个人账户为此类案定罪规则。有必要从法理上解释下大数据规则。

法理上看,诈骗罪基本犯罪构成是:行为人虚构事实、隐瞒真相导致被害人陷入错误认识,并基于错误认识处分财产,行为人获取财产、被害人遭受财产损失。根据刑法理论,构成要件之间存在刑法上的因果关系,才能构成犯罪。行为人虚构事实或隐瞒真相亦可能是民事欺诈行为,并非刑法意义上的诈骗。相较于民法意义上的“欺诈”,“诈骗”的外延要窄得多,不仅强调行为人不法占有的目的,还强调行为造成他人错误认识从而错误处分财产。在相关交易中,如果行为人是在不明知的情况下利用虚拟交易平台,不在经过政府部门批准的交易场所交易,或者通过修改交易软件系统数据操纵行情等从中牟利,属于虚构事实、隐瞒真相,造成亏损的,因二者之间具有直接的因果关系,应当构成诈骗罪。而关于手续费及客损,对于进行涉案交易需支付手续费是明知的,虽然业务员的鼓动和诱导对其高频交易起到了一定的促进作用,但并非直接和主要的原因,并非因该行为对手续费的损失产生了错误认识进而作出相应处分。关于反向建议,分析师通过自己的分析,判断行情趋势,然后通过业务员向客户给出其自认为的反向行情。但其给出的行情显然并不必然与真实行情相反,因为分析师自认为判断正确的行情是其主观判断,而不是确定的结果,任何人都不能保证对行情的判断是百分之百准确的。具有正常、理性思维的成年人可以自主决定如何交易,且明知交易有风险。鼓动、诱导高频交易以及提供反向建议只能影响客户的判断,而不严格约束客户的交易行为。因此,提供反向建议与损失亦不存在直接的因果关系,并且还不能排除部分交易是未受上述的影响而自主决定的,从而,该部分交易费的损失以及交易损失更是与上述行为无直接关系。在案证据也证实了部分交易行为并未遵循分析师提供的建议,而是自主的操作。另外,关于业务员有采用虚假身份结识并取得信任的行为,但该行为与该损失亦无直接的因果关系,投资人的损失是因为进行涉案交易导致的,而任何交易行为都有风险,其对这一点应当是明知的。

图6 生成决策树

从运算上看,有两个层面的问题需要解释。一是根节点的提取意义。修改盘口数据、平台经营批文、交易流水进入个人账户三个自变量中,修改盘口数据、平台经营批文、交易流水层次定量高低关系,是因为在

信息增量运算中,GAIN(修改盘口数据)=0.4715(哈特利)①哈特利为10 为底的对数计量单位。,GAIN(平台经营批文)=0.09766(哈特利),GAIN(交易流水)=0.0002(哈特利),GAIN(修改盘口数据)>GAIN(平台经营批文)>GAIN(交易流水)。即修改盘口数据这个要素最能区分诈骗和非法经营二罪,在25 个自变量中,修改盘口数据对判决结果的影响最大,因此要挂在决策树的根节点上。这种运算实际上定量分析了证据的关联性,由于自变量和应变量反映的是某类证据与判决结果的关系,这实际上就是法学视角下证据关联性的含义。在通过迭代算法,在剩余24 个证据中运算,发现平台经营批文影响是剩余变量中信息增益最高的,作为二层根节点。迭代运算直到决策树再无案例可分为止。经过运算处理后,罗列出来的节点就是最影响判决的、关联性最大的证据类型。二是预测机理。大数据从大量判例中提取数据运算,实际上是把个案判决下的或然进行归纳,形成裁判职业群体的共同理性,或者类案的共同“自由心证”,由于判决案例极大,这使得数据分析的规律具有一种必然性。当再出现新的判例时,只需要对照决策树,逐一核对条件,看是否有修改盘口数据、平台经营批文、交易流水进入个人账户的证据,就可以预测裁判结果。

四、大数据技术在定罪运用中需注意的几个问题

面向未来,在新一轮科技革命浪潮和“智慧法院”司法改革的基础上,在刑事定罪领域引入大数据技术为时代所需,但其也不能“包治百病”,在未来运用中需注意以下几个问题。

(一)厘清认识,明确大数据在司法裁判中的辅助决策定位

认识是行动的先导。最高人民法院在2019 年全国“两会”报告上这样阐述大数据的作用:“全面建设智慧法院。发挥司法大数据管理和服务平台作用,为科学决策提供参考。上线‘类案智能推送’等系统,为法官办案提供智能辅助。”这表明,我国推进大数据在司法裁判中的运用时,坚持了“全面建设”的态度以及“辅助决策”的定位。

论不破不立,理不辩不明。要明确大数据在司法裁判中的正确定位,就要指出目前存在的两种片面认识:一是大数据运用会导致司法裁判变为判例法的技术恐慌认识。大数据技术运用到定罪标准时,是依靠具体类案的既往判例实现的。然而,大数据技术的运用并不会改变我国司法制度。原因有二,其一,制定法是我国基本的法律渊源,判例及习惯在我国没有法律效力。大数据的司法运用没有改变我国司法制度根本,此为根本。其二,由于判例独有的灵活性和操作性,我国本来就有司法判例指导制度。自1985 年起,《最高人民法院公报》就开始公布典型性案例,2010 年11 月26 日,《最高人民法院关于案例指导工作的规定》直接声明,“为总结审判经验,统一法律适用,提高审判质量,维护司法公正”,发布指导性案例。大数据运用只不过是对既有判例进行了深加工,把单纯的文字判决提炼抽象为拓扑结构模型以供指导。

另一片面认识,是大数据会导致陷入机械司法的技术崇拜认识。这种担忧有一定的合理性。[9]首先,数据处理是基于模式化的公式运算,由运算匹配出特有证据与输出判决之间的联系,而对联系背后的法理人情在所不问,亲历性才是司法裁判的本质,脱离真实法庭来对案件事实进行分析判断往往如空中楼阁,摇摇欲坠。其次,司法裁判具有工具理性和价值理性的双重要求。诚然,大数据在司法裁判的运用上提高了效率,符合工具理性,然而,世界上只有两片相似的树叶,却没有两片相同的树叶①选自德国哲学家莱布尼茨的法律谚语。。即使是类案,每个具体案件仍各有各的特点,个案的正确、适当裁量建立在法官长期经验积累形成的理性基础上,而这些确实是大数据的技术盲点。

域外实践经验表明,依靠法官自主裁判,而将大数据技术作为辅助工具,是弥补大数据机械裁判的有效方法。由德国人工智能技术在刑事案件办理方面的运用模式可以看出,其将智能系统JURIS定位为辅助审判,法官掌握裁量自主权,大数据作为工具听命于法官。而英国的智能审判辅助系统则会提醒法官在裁判前检视证据链是否已经形成,还需要补充哪些证据材料。总之,通过大数据智能系统辅助决策,完成程序性和基础性的证据链检验工作,再将全案推送法官裁判,使司法裁判质效提升,公正而又高效。

(二)全面采集,统一录入捕诉、审判的正反案例

对大数据运用而言,数据输入的完整性直接影响输出结果的准确性,即“无输入无输出”“错误输入错误输出”。数据采集是司法大数据运用的基础,是“源头活水”,裁判结果的精确率与输入案例的体量和质量密切相关。笔者认为,做好数据采集,要做到全覆盖、全要素、全过程。[10]

数据采集全覆盖,要求“量大”。与人类学习一样,大数据必须借助大量数据判例,形成自己的“学习经验”,才能变得智能,形成自主分析裁判。然而,现实情况却并不理想,存在大量“部分文书不上网”的情况。笔者通过统计2012-2017 年的中国法律裁判文书网中公开的刑事一审判决发现,大多年份公开的判决书占当年案件数量半数以下,有的年份甚至不足两成。如表3②数据来源于中国法律裁判文书网。所示。

表3 2012-2017 年判例采集表

由此可见,司法数据与实际数据之间差距较大,存在大量数据流失。因此,应结合《最高人民法院关于人民法院在互联网公布裁判文书的规定》要求的法定应予公布和不予公布的14 种情形,“整合法院系统的案例研究资源,将中国裁判文书网、指导性案例、全国法院案例研究资源”,依法、及时、全面采集录入。

数据采集全要素,要求“质高”。现实中,还大量存在“说理内容不全面”等问题。从中国裁判文书网的具体情况来看,由于文字记录并不涵盖庭审记录、电子诉讼文书数据化、庭审视频无法涵盖全过程,再加上有的文字记录对法官确定宣告刑“一步到位”直接给出结论,缺乏必要说理过程,这种判例质量不足以“喂养”“智慧裁判”。因此,有必要以“说理层次清晰、推理过程展示充分”为要求,从源头上提高裁判文书质量;建立文书上传管理机制,由专门机构或专门人员负责监督、管理上网文书数量和质量;实行上传裁判文书质量责任倒查追究机制,提升上传裁判文书工作质效。

数据采集全过程,要求“层清”。刑事诉讼阶段分类上的侦查、捕诉、裁判定罪是伴随着调查的深入及对犯罪事实认识掌握的深入而梯次递进的,不同的阶段所实行的证明标准显然是不同的。因此,区分捕诉、审判不同阶段是十分有必要的,要录入具体类案不同阶段采取强制措施或者不采取强制措施,判处有罪和无罪的正反案例,推广运用刑事案件智能辅助办案系统,以期丰富“大数据”预测输出,形成入罪与出罪、此罪与彼罪在不同阶段要达到的具体证明标准,作为大数据智能决策的重要参考。

(三)规范标准,实现证据规则与印证模式之间的平衡

从定罪标准上看,传统印证模式不是排除合理怀疑的自由心证。印证模式是不等同于自由心证、也不违背自由心证的证明模式存在。相互印证已经是深深扎根于广大中国执法、司法人员心中的刑事诉讼证明模式。不管是从笔者在实务部门工作经历来看,还是从中国裁判文书网上公布的判决来看,确实如此。笔者并不反对印证模式,然而从实务来看,笔者在办理网络现货投资交易类案中,遵循了传统以口供为中心,“由供到证”的模式,但收效甚微;运用大数据对办理网络现货投资交易类案进行的定量分析实验中,口供反映出的是否具有明知故意的自变量对判决结果的因变量根本没有影响。

从网络现货投资交易类案推而广之,在今天愈演愈烈的互联网犯罪、电信网络诈骗犯罪等领域,办案部门仍沿用“由供到证”的老模式,这种模式既是在浪费人力物力财力,也不利于不枉不纵地打击犯罪。同时,在全国裁判文书网中,也不乏仅仅以嫌疑人交代,辅之一些交易记录就定罪的判例,这种输入必然会导致大数据在运用定罪标准时产生有毒输出。

运用自由心证中的“心证”原则,“孤证”是可以定案的,因此其尤为强调取证的精准性,尤其强调对关键性证据事实的获取以及由关键证据阐发的证据链。[11]因此,我们要理性地看待印证证明模式,要加大对其他证据规则的适用力度,提高主观性标准的重要性。要转变裁判思维惯性,不再片面地依赖多证据间的相互印证,在对待证明力强的单个证据定案时,敢于依据证据规则与内心确信做出判断,从而真正适应当前司法证明标准的发展。

(四)深化运用,着力培养适应“智慧法院”发展的法务人才

智能化是我国智慧法院的努力方向。尽管本文在大数据的司法定罪标准上做出了一些探索,但是相比大数据的发展速度和潜力,这种运用仍然有待拓展。实际上当前大数据运用已是方兴未艾、百花齐放。本文探讨的是定罪标准的大数据运用,上海“206”刑事案件智能辅助系统把基本证据标准指引转化为数据模型,嵌入智能辅助办案系统,通过采集2800 万条判例数据,实现了71 个常见罪名的证据标准智能全指引、全覆盖[12]。量刑方面,海南省法院更是以信息化新技术深化量刑规范化改革,研发了规范涵盖2 个刑种、23 个罪名量刑的智能办案系统,除具备上海206 系统的智能提取识别事实和类案推送法条的功能外,还可以根据历史检索推送量刑建议、自动生成裁判文书。系统上线后,法官办案时间缩为原来的一半,制作裁判文书用时缩为原来的三成,制作程序性裁判文书用时缩为原来的一成。再比如评估诉讼风险,上海市徐汇区人民法院上线了全市首个诉讼风险评估系统,为了帮助当事人对自己起诉可能面临的诉讼风险有个基础的了解,合理调整期望和策略,诉讼风险指数细分为“重大风险”“中等风险”“一般风险”以及“较低风险”四级,直观地提示当事人所面临诉讼风险的严重程度。这些智慧诉讼服务、智能辅助软件有力地缓解了司法“人少事多”的顽疾,切实减轻了人民群众的诉累。

在大数据时代,建设“智慧法院”司法系统只搞外包,自己当“甩手掌柜”,是不行的,要有自己的人才队伍才行。要推动人才发展体制机制改革,培养一批高素质的信息化人才,为智慧法院建设提供坚实的人才保障。要推动法律与大数据交叉学科建设,按照国务院印发《新一代人工智能发展规划》的人才培养要求,重点培养掌握大数据+法律专业的横向复合型人才,形成“大数据+X”的培养新模式;对于在职司法人员,要坚持以大数据运用为导向,善于把司法实践中的“痛点、难点”与大数据技术对接,通过定期培训、轮值轮训等多种方式,使得司法人员能够在一线实践中运用大数据技术,努力产生经得起理论推敲、经得起实践检验的成熟大数据技术方案。

(五)提高能力,完善电子数据的证据规则

作为互联网犯罪,在网络现货投资交易类案判决中,其反应出来的证明标准体现了一种鲜明特点,那就是电子数据类证据而不是口供成为了此类非接触的互联网犯罪的核心证据。依据是通过大数据算法运算,熵值最高的是电子数据类证据,也就是说影响网络现货投资交易类案判决走向的是电子数据类证据的采集与运用,而不是数量最多的被害人询问和嫌疑人讯问笔录。这反映出对于互联网犯罪,其定罪证明主要依托电子数据这一类证据的现状。因此,研讨电子数据的证据规则是有必要的。

笔者认为做好电子数据证据的工作,要做好以下几点:一是取证上,要加强基层执法部门能力,为基层执法机构配备专业取证设备如只读锁、硬盘复制机、专业恢复软件系统、远程勘验等专用软硬件设备,下放取证资质到区县级公安机关;二是质证上,实现必要案件中的电子数据司法鉴定人出庭,电子数据鉴定人作为“法官的辅助人”有义务出庭,其庭审地位和作用是明确的;三是认证上,电子数据作为法定证据已经有7 年了,然而实务中法官对电子数据的认识是非常有限的。法官在很多案件中,对电子数据证据的审查判断还存在认知理解上的不到位,有必要培养专业领域的法官或者引入专家辅佐法官,以提升司法裁判对电子数据类证据的认证能力。

结语

刑事定罪标准,作为审判为中心的改革核心要义,纵向来看,其承载了几千年来中华民族不枉不纵、追求正义的真切追求;横向来看,其吸收了大陆法系、英美法系“排除合理怀疑”的主观标准。然而从实务上看,刑事定罪标准存在粗放、不精准的弊端。习近平总书记强调,要运用大数据提升国家治理能力现代化水平。因为“科学技术从来没有像今天这样深刻影响国家前途命运,从来没有像今天这样深刻影响着人民生活福祉”。对于法学而言,大数据作为一种外来的信息技术工具,其在算法适用上与司法裁判的逻辑法则、经验法则具有内在统一性,有助于提高裁判质效、缓解人员紧张、提升案件质量、促进不枉不纵,有利于实现“让人民群众在每一起案件中感受到公平正义”的朴素目标。面对大数据智能化浪潮,我们应该主动拥抱时代变化,明确大数据技术在司法裁判中的辅助功能定位,全面采集数据,深化算法运用,培养法务智能人才,同时提升对电子数据的证据运用能力,以适应新时代的发展需要。

猜你喜欢

定罪裁判证据
牙医跨界冬奥会裁判
裁判中存在“唯一正解”吗*——对《司法裁判中的道德判断》的批判性研读
法官如此裁判
法官如此裁判
手上的证据
家庭暴力证据搜集指南
手上的证据