APP下载

论人工智能在证据推理中的辅助性定位

2023-02-18崔世群

治理研究 2023年1期
关键词:证据司法人工智能

□ 卓 翔 崔世群

引言

2018年10月,习近平总书记在中共中央政治局第九次集体学习时强调,人工智能具有多学科综合、高度复杂的特征。我们必须加强研判,统筹谋划,协同创新,稳步推进,把增强原创能力作为重点,以关键核心技术为主攻方向,夯实新一代人工智能发展的基础。人工智能与司法证据推理的结合是未来的一大发展趋势,也是司法人工智能的核心业务领域。司法证据推理是分析证据基本属性、运用证据认定案件事实的推理活动。整体而言,证据推理大致分为两个阶段:其一是获得和分析证据,其二是证成和证明待证事实。(1)张保生编:《证据科学论纲》,经济科学出版社2019年版,第150页。一般而言,在司法过程中,法律事实认定就是证据推理的过程。自上世纪威格莫尔《司法证明科学》一书出版之后,为其他学科进入司法证明领域打开缺口,司法证据与证明问题的跨学科研究风起云涌,人工智能与证据推理的结合适逢其会。本文对于证据推理的研究将限定在证成和证明待证事实的部分,但也会对证据信息提取这一证据推理的基础性环节进行探讨,因为这一基础性环节决定了证据推理本身是否能够有效保证公正、准确、无偏见。

人工智能正由浅入深地介入司法裁判之中,从辅助性查询、审核等简单、重复性工作,逐渐向具备预测性、决策性、创造性特征的司法证据推理这一人类思维“深水区”过渡。随着司法人工智能的发展,人工智能参与证据推理的底层逻辑,逐渐从人工智能单向辅助司法人员转向证据推理层面二者之间的交互,“理性交互”是当前与未来人工智能介入司法证据推理的基本定位。本文从人工智能证据推理的司法现状、技术现状出发,首先从技术上分析人工智能参与证据推理工作中的“能”与“不能”,继而基于人工智能的技术特点与司法裁判、证据推理的一般规律,总结出人工智能辅助司法证据推理的基本原则与具体适用路径,明确人机“理性交互”的内部运行逻辑和外部边界。

一、人工智能证据推理的当前认知、现状与定位

1970年,布坎南和海德力克共同发表了《关于人工智能和法律推理的几点思考》一文,揭开了人工智能与法律推理、司法证据推理等问题交叉研究的新篇章。(2)B. Buchanan,T. Headrick,“Some Speculation about Artificial Intelligence and Legal Reasoning”,Standford Law Review,vol.23,no.40(November 1970),pp.40-62.在美国,人工智能与证据推理的结合研究成为当前证据法学研究领域的显学,而我国理论界与实务界对人工智能证据推理问题的探索与研究也蓬勃开展。在《国务院关于印发新一代人工智能发展规划的通知》中重点阐述:“建设集审判、人员、数据应用、司法公开和动态监控于一体的智慧法庭数据平台,促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用,实现法院审判体系和审判能力智能化。”(3)《国务院关于印发新一代人工智能发展规划的通知》(国发〔2017〕35号)。人工智能与司法证据推理的交叉研究形成了国内外、政府与民间、司法实践与理论研究多方联动的发展局面。当前,人工智能在证据推理的效率性、准确性、公正性保障方面既有其独特的优势,也存在短期内难以解决的缺陷和劣势。因此,在当前阶段,仍需明确证据推理中人类法官的主导性地位和人工智能的辅助性定位。

(一)司法人工智能的当前认知

人工智能是计算机科学的一个分支,也是思维科学的应用分支,属于多学科综合研究领域,涉及哲学和认知科学、数学、神经生理学、心理学、计算机科学,信息论、控制论、不定性论等学科。人工智能的定义包含“人工”与“智能”两个部分:“人工”即由人设计,为人创造、制造;(4)钟义信:《高等人工智能原理: 观念·方法·模型·理论》,科学出版社2014年版,第39-50页。“智能”即人类精神能力,大体包括逻辑、语言、空间、音乐、肢体运作、人际与自然探索。(5)“智能”一词并非没有争议,比如,H·加登纳在《智能的架构》(Frames of Mind)一书中将人类的“智能”概括为8个范畴:逻辑 (logical)、语言文字(linguistic)、空间(spatial)、音乐(musical)、身体动觉(kinesthetic)、自我认知(intra-personal)、人际(inter-personal)、自然认知(naturalist)。参见H·加登纳:《智能的结构》,光明日报出版社1990年版,第81-374页。综合而言,人工智能通过将“人类智能”的本质与计算机科学相结合,使智能机器能以“人类智能”相同或相似的方式作出反应,并应用于人类社会的诸多领域。其中,司法领域就是人工智能应用的一大重要领域,例如,司法人工智能通过司法大数据学习和知识图谱建构,建立量刑预测模型,为刑事案件量刑提供参考,推送以往相似度较高的已决案例,为法官对相似案件的裁判提供参考。(6)胡佳:《人工智能辅助刑事审判的限度》,《政法学刊》,2022年第3期。人工智能司法应用最为核心也是最具挑战性的部分就是参与司法证据推理。人工智能与证据推理的结合有其必然性。其一,人工智能与证据推理均属于多学科综合研究领域,在学科应用范畴上存在广泛的交叉地带,包括但不限于心理学、认知科学、数学、思维科学、语言学等,这使二者在研究上具有契合性。其二,人工智能与证据推理具有相同的本质,即揭示、认知、遵循人类思维的规律与方法,具有认识论层面的一致性,这使二者的结合具备了可行性。其三,人工智能参与证据推理对于司法裁判极具裨益,或可在纠正人类法官思维认知偏差、统一证据标准、提升司法裁判效率、促进公正司法等方面打开新的局面。

支撑人工智能参与司法的底层技术主要包括自然语言识别、逻辑架构设计、知识图谱构建、大数据训练等技术,但在当前,上述底层技术的完全实现皆存在较大的技术困境和现实阻碍,例如非结构性、半结构性证据信息识别能力不足,知识图谱、逻辑架构覆盖案件类型有限。

这些技术性局限导致了人工智能在司法证据推理中的定位只能是辅助性而非主导性。这也与当前对人工智能的基本认知和普遍定位相一致。辅助性定位具有不同层面的原因:一是在技术层面。目前正处在“弱人工智能”阶段,“弱人工智能”不具备完全的自主意识,仍受限于人类控制,难以具备独立的表意能力和自主意识,因此不具备法律主体资格。(7)孙占利:《智能机器人法律人格问题论析》,《东方法学》,2018年第3期。二是在法理层面。人作为唯一主体是法律存在的前提和基础,而弱人工智能由于独立意思表示能力的缺乏和法律伦理的要求,决定了它的非主体性。(8)付其运:《人工智能非主体性前提下侵权责任承担机制研究》,《法学杂志》,2021年第4期。非主体性的人工智能和主导性裁判者之间自然也存在尚难以逾越的鸿沟。三是在法律实践层面,民航局印发的《轻小型民用无人机飞行动态数据管理规定》中阐明了运行无人机之相关单位、个人是权利、义务与责任主体,从反面否定了无人机的法律主体地位。在司法实践中,无论是全国首例人工智能生成文章作品纠纷案——腾讯诉盈讯科技侵害著作权一案,(9)龙卫球:《腾讯诉盈讯科技侵害著作权纠纷案——首例人工智能生成文章作品纠纷案》,《人民法院报》,2021年1月9日第4版。还是美国联邦法院的相关判决,均否定了人工智能的著作权主体资格。

塞尔在《心灵、大脑与程序》(1980年)中提出:弱人工智能只是对认知过程的模拟,程序本身并不具有理解、认知的能力,并无“心智”。强人工智能则是具备“心智”,其具有智力、理解、感知、信念和其他通常归属于人类的认知状态。在塞尔看来,机器是否具有理解、意识 (自我意识),是衡量人工智能“强”与“弱”的唯一标准。但在之后的发展过程中,不管是大众还是人工智能领域的专家,都在借用强人工智能与弱人工智能分类的基础上,代之以新的标准:弱人工智能就是对人的局部模仿,强人工智能就是对人的全部模仿。(10)梅剑华:《理解与理论:人工智能基础问题的悲观与乐观》,《自然辩证法通讯》,2018年第1期。实则,新标准下的强人工智能既包括计算机要像人一样做所有的事情,它还须具有塞尔对于强人工智能的定义,即其要具备人类之意识。无论是塞尔的标准,还是新标准,目前的人工智能对于人类技能与自我意识均无法实现完整模拟,仍属弱人工智能体。

(二)我国人工智能司法证据推理的发展现状

2016年7月中共中央办公厅、国务院办公厅印发并实施的《国家信息化发展战略纲要》中提出:服务民主法治建设;实施“科技强检”,推进检察工作现代化。建设“智慧法院”,提高案件受理、审判、执行、监督等各环节信息化水平,推动执法司法信息公开,促进司法公平正义。根据《国家信息化战略发展纲要》要求,最高人民法院与最高人民检察院提出“智慧法院”与“智慧检务”建设的行动规划,全国各地方法院正如火如荼地推进智慧法院建设,“法律+AI”的发展趋势日渐突出。目前,人工智能在智慧法院建设中的运用贯穿整个诉讼过程,人工智能正逐渐深入地介入到案件司法证据推理中来。自2017年始,人工智能与司法裁判、司法证据推理的结合实践在全国范围内铺开,上海“206系统”便是标志性成果,“206系统”根据控辩审三方的发问,通过对语音信息的识别理解,自动抓取和展示相关证据材料,并可实现证据校验、证据链审查判断,对案件审理中显示的证据瑕疵、证据矛盾等进行重点审查。随后,全国各地司法人工智能系统如雨后春笋般迅速发展,例如:最高人民法院联合北京高院推出的“睿法官”智能研判系统,通过大数据分析和人工智能对案件证据信息进行整合和分析,对证据分析、证据链审查提供辅助性指引与预测。广州白云区法院建立起“六智一中心”“三网一平台”的智慧法院格局,具备了线上证据信息获取、同类案件分析收集、裁判结果预测指引、裁判文书生成等功能。与公安机关执法办案相结合的“TRS智能辅助办案系统”,为基层办案民警提供证据链指引、案件分类指引、案件分段指引、案件分情指引,在不同类型、不同阶段、不同情形下,均能够提供证据采集、文书制作等智能化辅助指引,同时,基于图谱化的数据,根据案件实体进行语义推理,实现案件深层次逻辑校验、完整性综合分析,如分析发现证据不完备、结论存疑、存在矛盾甚至伪造证据等问题。

2018年10月,习近平总书记在十九届中央政治局第九次集体学习时的讲话指出,要加强人工智能同社会治理的结合,开发适用于政府服务和决策的人工智能系统,促进人工智能在公共安全领域的深度应用,加强生态领域人工智能运用,运用人工智能提高公共服务和社会治理水平。在此指引下,人工智能技术呈梯度性地不断介入司法裁判、司法证据推理之中。

在人工智能与司法证据推理的结合中,随着二者的深度融合,人工智能司法证据推理所影响的价值范畴也从低阶到高阶渐次性地展现出来,这种影响包含优势和劣势两个方面。

第一阶,效率性方面。计算机的运算速度非人脑所能比拟。比如,2016年3月,世界四大会计师事务所之一的德勤与人工智能企业Kira Systems合作联盟,将人工智能引入会计、税务、审计等工作中,代替人类阅读合同和文件,将人类律师12个小时的阅读量缩短为15分钟。在 2018 年全国检察机关科技装备展中,贵州省检察院展示了通过“案件证据数据化+标准化”系统的运行,办案时间平均缩短为 8 天,办案效率提升约19%。(11)刘品新:《数据化的统一证据标准》,《国家检察官学院学报》,2019年第2期。同时,人工智能推动司法审判流程再造,促进审判高效有序运行,对刑事诉讼而言,可形成公检法上下联动、内外贯通,借助现代信息技术优化流程,提升效率。但也有学者在调研中发现,人工智能由于算法的僵化会要求办案法官作出一些无谓的解释,导致效率降低,甚至增加不必要的工作量,与其降低司法成本和负累的初衷相违背。(12)谢澍:《人工智能如何“无偏见”地助力刑事司法》,《法律科学》(西北政法大学学报),2020年第5期。

第二阶,准确性方面。人工智能在准确性方面具备人类法官所没有的天然优势。一方面,人工智能具备海量数据整合优势,通过对海量法律信息的深度学习与整合,其“大脑”中的法律数据要远超人类法官,同时具备强大的数据筛选、精确定位、综合分析的功能,在数据整合和运算精确性这一层面上,人工智能在司法证据推理上具有鲜明优势。另一方面,人工智能司法证据推理建立在数学逻辑之上,比人类的模糊性思维方式具备更高的精确性。但是,人工智能在司法证据推理中仍然存在技术上的不成熟,难以对当前所有法律数据进行完整学习,其所根基的数据库难以完整涵盖不同地域、不同时期的所有不同类型的案件。同时,证据推理的逻辑不仅仅是数学逻辑,其中的直觉思维和灵感思维是人工智能所不具备的。这就导致了当前人工智能在证据推理准确性上仍存缺陷。

第三阶,公正性方面,人工智能在保障公正性方面主要有两点优势:一是人工智能司法证据推理可规避人类法官徇私的可能,同时也可规避来自外界的不合理的非法律因素干扰,如请托送礼、领导指示、舆论压力等,能够推进独立审判、中立审判的改革进程与裁判公正性的实现。二是统一裁判,这种统一裁判建立在形成统一证据标准与证明标准的基础上,通过达成同一性的证据标准、证明标准适用效果,辅助实现同案同判,既可以通过“关联数据”分析实现与过去案件司法证据推理的一致性,也可通过“衍生数据”运用形成未来的同一类案件中司法证据推理的一致性。但需要警惕的是,人工智能可能反映,甚至放大刑事司法系统数据中的固有偏见。用于训练人工智能的数据可能倾向于某些人群,或某一时期某些地区的特定利益考量。因此,它可能把过去的不公正掩盖在计算机生成的客观性的外衣下,有可能形成公正性盲区。

2016年,美国法院便承认人工智能参与量刑裁判的正当性,人工智能开始越来越深入地介入到司法证据推理之中。(13)State of Wisconsin v. Eric L.Loomis,2016 Wis.68,881 N.W.2d.749 (2016).但值得注意的是,人工智能虽然具备上述三阶优势,当前仍处于“弱人工智能”时代,人工智能不具备完全的自主意识和完备的思维能力,仍受限于人类控制,在法律人工智能实现司法效率性、准确性、公正性等方面,相较于人类法官仍存在诸多明显劣势,比如证据信息提取不完备、经验逻辑欠缺。在输入可供分析的数据、对数据进行整合生成、表达运算结果并完成输出这三个环节,尚存在许多技术漏洞留待未来不断完善。有关人工智能在证据推理中的不足之处会在下文进行详细分析。

(三)辅助性:人工智能在当前司法证据推理中的定位

限于当前的技术阶段,无论是官方机构还是学术界,对于人工智能在司法裁判中的角色多定性为一种“辅助性”工具。而在司法辅助性人工智能的发展过程中,形成了梯次性发展格局:第一阶段是辅助法律信息检索工作。1983年,龚祥瑞和李克强就在借鉴西德JURIS资料系统(14)1977年,西德政府要求在记述罪犯和犯罪时,按照标准的格式把犯罪的时间、地点、活动、方式、人物特征、犯罪情况以及有关事实的来龙去脉通通载明。这些情报都要提供给警察信息系统,以期逐步地建立一个关于西德刑事犯罪案件的全面文献系统。转引自龚祥瑞、李克强:《法律工作的计算机化》,《法学杂志》,1983年第3期。的基础上,提出建立以计算机技术为核心的法律智能检索系统以辅助司法审判,(15)龚祥瑞、李克强:《法律工作的计算机化》,《法学杂志》,1983年第3期。1985年“北大法宝”的前身便被打造出来,之后涉外法律数据智能检索系统的建设工作次第展开。辅助司法证据推理的人工智能技术在这一阶段虽初露端倪,但仍未具有直接性、实质性的辅助作用。第二阶段是辅助证据采集指引与逆向证据链矛盾审查。这一阶段便是我国人工智能系统所处的发展阶段,无论是上海“206系统”还是北京法院“睿法官”等司法人工智能系统都基本具备辅助检查证据质与量的瑕疵,证据链的矛盾的功能,向法官提供证据可能存在的不完备之处,证据推理结论的疑问、矛盾,对于法官司法证据推理进行前置性的证据采集指引,以及后置性的证据推理过程与结论的矛盾性检讨及逆向否定性建构。第三阶段是辅助正向司法证据推理建构与形成决策。当前司法人工智能正由第二阶段向第三阶段进行过渡,例如上海“206系统”初步具备了正向司法证据推理建构与形成决策的功能,能够初步生成判决意见,但是由于诸多人工智能技术问题尚未被攻克以及机器学习不足,准确性保证尚付阙如,“206系统”虽处于相对性的世界领先水平,但距离形成证据信息全采集——证据推理全仿真——司法证据推理结果准确形成与输出这样一种全过程、高准确度的人工智能司法证据推理系统还存在相当一段历程。

在政治适当性和法哲学层面上,由于人工智能司法证据推理完全建立在数学运算的基础上,而特赖布教授反对数学审判的理由之一是在诸如给无辜者定罪风险之可接受水平等问题上,量化分析在政治上是不适当的。(16)Laurence H. Tribo, “Trial by Mathematics: Precision and Ritual in the Legal Process”, Harvard Law Review,Vol. 84, No6 (April 1971), pp. 1329-1393.政治适当性在于只能由一个依法设立的独立而无偏倚的法院,经过公正、公开的审判,才能给一个人定罪。(17)张保生:《人工智能法律系统:两个难题和一个悖论》,《上海师范大学学报》(哲学社会科学版),2018年第6期。在伦理层面上,人工智能进行司法证据推理是算法进行计算的结果,如果由算法主导司法证据推理与裁判的结果,司法裁判将由“人裁判人”转向“算法裁判人”,人面临着“客体化”的危险。在技术层面上,虽然人工智能技术迅猛发展,人工智能在司法领域应用广泛且前景广阔,但司法人工智能技术仍然处于起步阶段,在技术层面人工智能无法独立准确进行司法证据推理,相对于人类法官,人工智能在司法证据推理中只能处于辅助性地位。

基于司法人工智能在证据推理中辅助性地位的基本判断,当前理论研究和司法实践的重点应当放在司法人工智能如何有效辅助证据推理,或者说,“人工智能辅助证据推理的基本限度在哪里”这一命题之上。在技术层面,人工智能介入司法证据推理的三个主要环节分别为:提取可供分析的数据、对数据进行分析整合生成、表达运算结果并完成输出。(18)栗峥:《人工智能与法律事实认定》,《法学研究》,2020年第1期。在这三个环节中,影响最大的,也是当前存在最大技术难题和理论争议的,便是前两个环节,即提取可供分析的数据、对数据进行分析整合生成。通过分析这两个技术环节中司法人工智能的“能”与“不能”,可以明确其在证据推理中的辅助性限度和具体定位。

二、人工智能在推理信息提取中的问题与辅助性定位

证据信息的充分提取和转化是人工智能进行司法证据推理的第一步。证据信息的提取是认识案件事实的唯一桥梁。证据信息的提取转化是人工智能进行司法证据推理的起始点。同时,对于提取的证据还需要进行数据化改造,改造成计算机所能识别、运算、分析的机器语言。证据的提取转化涉及诸多法学、计算机技术、语言学、思维科学的问题。关于证据信息的收集与转化,涉及以下几个基本问题。

(一)分类别提取技术在证据信息读取中的问题

证据信息纷繁复杂,人工智能在证据信息提取分析中需要分类别进行。例如在刑事案件中,人工智能进行司法证据推理的前提是,根据特定刑事罪名的构成要件对庞杂的证据信息进行分类别提取,而这种提取的方向与内容则是提前设计在算法与逻辑模型之中的。这种分类提取主要分两个环节进行,第一个环节是针对案情按照刑法分则的不同章节不同罪名对证据信息进行梯次性初步分类,第二个环节是针对不同构成要件对符合该要件要求的词汇、图像等信息进行数据化归类提取。有学者提出,对这两个技术环节的实现可通过计算机实验法检验逻辑架构设计的合理性与可靠性,并且通过更加大量的裁判文书的文本关键词集合提取与分析的途径,进一步提升其准确度。(19)马皑、宋业臻:《人工智能“法官”的一种实现路径及其理论思考》,《江苏行政学院学报》,2019年第2期。

同时,证据信息还需要依据不同证据种类进行分类提取。一般分为两个大类对证据信息进行提取。第一大类是对文字类证据信息的提取。对于书证、证人证言、视听资料这一类图文材料中的语言文字,主要运用OCR技术( Optical Character Recognition,光学字符识别)进行处理,OCR技术传统上是指对图像进行处理及分析,识别出图像中的文字信息,广义的OCR技术是指所有图像文字检测和识别技术(简称图文识别技术),包括自然场景文字识别技术(Scene Text Recognition,STR)。(20)牛小明、毕可骏、唐军:《图文识别技术综述》,《中国体视学与图像分析》,2019年第3期。第二大类是非文字类证据信息的提取。如物证信息的提取,对于物证信息的提取是当前人工智能技术的一个瓶颈,物证作为“块结构”的证据包含着丰富的证据信息,而对于这些非文字的证据信息,如何拆解这些信息?如何从中提取有用的信息?如何运用计算机可理解的语言将 “块结构” 击破打散,形成数字化、可识别的结构性数据,以识别并提取其中的有效信息?(21)栗峥:《人工智能与法律事实认定》,《法学研究》,2020年第1期。这些都是当前亟待解决的问题,当前以“人脸识别”为代表的“智能识别技术”蓬勃发展,例如以生物大脑神经元为原型的ANN神经元模型,以信号处理(内部强度默认)——树突P(强度权重)——传递函数之间的关联搭建了完整结构,结合相关硬件技术训练图像、转化图像格式数据。(22)李环:《人工智能中人脸识别技术的应用分析》,《电子测试》,2021年第1期。这一类“智能识别技术”都为非文字类信息的识别与提取提供了可能。

不可否认,上述两大类证据信息的提取技术现在都不完善,除了总体面临的数据“结构化”改造问题,还包括在对文字类证据的提取过程中,缺乏对语言文字背景、动机的提取,以及对于被告人、证人的心理状态、情绪、微表情等人性化细节的经验性、随机性、直觉性捕捉。同时,物证识别目前不具备比肩“人脸识别”的强大数据库。此外对物证信息提取的关键是选取能为法律要件所涵摄的证据信息,如“刹车痕的长度”“刀上的鲜血”“伤口与凶器的吻合度”等,但在不同案件的不同物证中存在个性化差异,往往需要依靠控辩审三方的经验与直觉,而没有一定之规,这对固定了算法和逻辑模型的人工智能而言,不得不说是一项莫大的考验。

(二)证据信息提取转化中的语言难题

有学者认为,应当从三个层次来理解人工智能语言。最基础的层次是我们所谓的“机器语言”和 “程序语言”(23)哈罗德·埃布尔森、杰拉尔德·杰伊·萨斯曼、朱莉·苏斯曼:《计算机程序的构造与解释》,裘宗燕译,中信出版社2004年版, 第249页。,这两种语言是机器运行和程序设计所用到的指令和符号。第二层次是人工智能自然语言处理(Natural Language Processing),是通过机器对人类自然语言的学习实现人与机器相沟通,因此涉及了人类的语言知识。而第三层次的语言即人工智能不是简单地模仿人类语言,而是自己能够生成语言,实现机器“自主化”“自动化”语言表达。(24)陶锋:《人工智能语言的哲学阐释》,《南开学报》(哲学社会科学版),2020年第3期。在司法领域中,人工智能进行证据信息的提取主要围绕在前两个层次展开。

第一层面的人工智能语言问题,如何将证据信息转化为机器所能理解的机器语言或程序化语言,使非结构化数据实现结构化改造。非结构化数据是指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。书证、物证、视听资料、证人证言等证据中所包含的文本、图片、XML、 HTML、各类报表、图像和音频/视频等信息都是以非结构化数据的形态存在。第二层面的人工智能语言问题,人工智能需借助成熟的自然语言处理技术对具有法律意义的证据信息进行提取。自然语言处理技术的实质是让人工智能能够从法律文书的法律语言中(自然语言的一种状态)准确提取相应情节。(25)王禄生:《司法大数据与人工智能开发的技术障碍》,《中国法律评论》,2018年第2期。法律条文中构成要件语言表述经过高度的凝练与概括,如“自首”“认罪认罚”“紧急避险”等,甚至是一些概念化的专用法律术语,如“法律行为”“意思表示”“无因管理”等。根据高度专业化、抽象化、凝练化的法律语言抽取属于这一类表述的纷繁复杂的证据信息存在困难,而这一类证据信息往往以一种日常用语、形象化语言、俚语、方言等形式存在。对于这一类语言的识别与提取是证据信息提取的关键,只有进行证据信息全面、充分、准确的提取与解读才能实现准确的司法证据推理。

当前的语言识别提取技术,有基于模版匹配的案件要素自动提取技术(26)张德:《自然语言处理技术在司法过程中的应用研究》,《信息与电脑》,2017年第17期。,还有知识图谱的构建技术。知识图谱是结构化的语义知识库(27)张德:《自然语言处理技术在司法过程中的应用研究》,《信息与电脑》,2017年第17期。,知识图谱的架构包括知识图谱自身的逻辑结构,以及构建知识图谱所采用的技术(体系)架构。(28)刘峤、李杨、段宏、刘瑶、秦志光:《知识图谱构建技术综述》,《计算机研究与发展》,2016 年第3期。但无论是要素提取技术还是知识图谱建构技术,面对语言难题时都无法做到全面准确的识别、提取与转化,原因在于:第一,法律语言固有的抽象性、专业性、多义性、模糊性导致了语言识别、提取、转化的困难;第二,法律语言的语词、语义过于浩繁,人工标注与知识图谱构建难免有所遗漏,不全面的证据信息识别、提取、转化使人工智能主导司法证据推理的可靠性大打折扣;第三,信息双重转化加大信息失真的风险,人类语言需要转化成机器语言形成输入,继而机器语言再转化为人类语言完成输出,一次转化信息便有失真的风险,两次转化这种风险则形成了叠加。

(三)辅助性:人工智能在证据信息提取中的具体定位

前文有述,无论是从政治适当性、法哲学、伦理学的层面,还是从技术的层面看,人工智能在司法证据推理中在实然和应然的层面上均定位为辅助性。但是人工智能的辅助性定位如何具体界定,如何在实践中合理地、具体地辅助证据信息提取仍需进一步深化研究。

本质上,人工智能对证据信息提取转化是法官和人工智能之间对证据信息进行交互的过程。人工智能进行司法证据推理的前提就是证据提取与信息数据化转化,没有形成全面而准确的证据信息识别提取与结构性数据转化,司法证据推理就可能会出现偏差。但当前证据提取与转化技术仍存在诸多不足:一方面,语言文字类证据信息识别、提取和转化技术面临语言难题。另一方面,非语言文字类证据信息识别、提取和转化存在着“块结构化数据”向“结构化数据”转化的不足。人工智能进行证据信息转化是证据推理准确开展的起点,这一环节的失误造成的后续不良影响是巨大的。(29)See Citron, “Technological due Process”, Washington University Law Review, vol.85, no.6 (November 2008), pp. 1249-1314.

证据信息的提取与转化是人工智能进行司法证据推理时所需要扣好的“第一粒扣子”,是进行准确司法证据推理的必要条件。虽然证据信息提取转化技术存在不足,人工智能在法律事实认定与证据推理中实现“主导性”尚存一段距离,但将人工智能在证据信息转化中定位为辅助性角色却可以为现行司法提供极大助益。因此,“辅助性”应当是人工智能在证据信息提取乃至司法证据推理中的一个“合理定位”。在证据提取转化技术有限性的背景下,人工智能“辅助性”定位应当做如下理解:一是人工智能对证据的缺失进行预警,人工智能通过广泛的大数据学习,对类案所需具备的普遍性证据具有相对完整的了解,通过证据缺失预警机制可以有效弥补人类法官在证据提取上的疏忽。比如,上海的“206系统”成功研发出社会危险性证据模块,假如公安机关未在侦查阶段收集标注社会危险性证明材料,则系统就会自动向公安机关发出提示,通知其补正。二是人工智能辅助人类法官检视证据信息要点提取的完整性与准确性,法官通过主动比照人工智能自动提取的证据信息与自己所提取之信息要点之间的差异,实现进一步修正和补充证据信息。同时辅助检视证据能力所要求的形式性材料是否齐全, 如对于勘验检查笔录的程序、形式要求是否满足,物证、书证是否附有必要的笔录、清单,在提取、保管的各个环节是否有适格人员签字盖章等进行检视。三是人类法官辅助完善人工智能所提取的证据信息,使人工智能最大程度地实现法律事实认定的科学性、准确性,让人工智能在司法证据推理中的辅助性功能得到更大程度的发挥,通过人类法官和人工智能的协作实现优势互补。

人工智能在信息识别、提取、转化过程中的技术正在发生日新月异的变化,通过大量语言的学习与知识网络的构建进行符号信息的组合调度,逐渐建立起集合神经网络、复杂系统、遗传算法等技术的新型人工智能信息识别转化系统。人工智能在证据信息识别转化中代替人类法官逐渐掌握主导地位,在不远的将来或可预期。

三、人工智能在证据推理中的不足与辅助性边界

当前人工智能在证据推理环节的一般模式是,依照法定证明标准类型化地建构不同案件的证据推理模型,首先将法定的统一证据标准嵌入到司法机关的智能化办案系统中去,其次划分不同的案件类型,依照各自特点建构证据推理的知识图谱和模型算法。以具有代表性的上海“206系统”为例,把盗窃模型按照证据数量和种类的不同,分为当场抓获型、重要线索型和网络犯罪型三种类型,分别建构证据属性校验、证据印证和证据之间逻辑判断的算法模型。一套人工智能证据推理系统大抵建基于三点:专家经验、海量学习、模型算法。而人工智能在证据推理中的不足也恰恰产生于此:经验指引的偏狭、深度学习的不充分、算法模拟的不完整。有学者在调研中发现,在一起盗窃案中,上海“206系统”识别出证据链建构中缺少鉴定意见,但盗窃的是人民币,这是不需要鉴定的。(30)谢澍:《人工智能如何“无偏见”地助力刑事司法》,《法律科学》(西北政法大学学报),2020年第5期。这种僵化的机器结论根源在于当前人工智能在深度学习和算法建构方面的局限性,因此,探寻人工智能系统在司法证据推理中的不足和适用边界是当前研究的重点。

(一)建立在不完全思维模拟基础上的人工智能司法证据推理

思维模拟,是用机械的、电子的方法模拟和复制人类的思维,是人工智能的技术核心和发展方向。人具有形象 (直感)思维、抽象(逻辑)思维和灵感(顿悟)思维三种思维方式。(31)马林:《思维科学知识读本》,中共中央党校出版社2009年版,第125页。参见田运:《思维科学》,浙江教育出版社1988年版,第32页。司法证据推理中主要涉及两种思维,即逻辑思维和灵感思维。自由心证下司法证明的逻辑思维包括演绎推理、似真推理与非单调推理,以及印证推理、假说演绎推理与溯因推理等归纳主义逻辑路径。人工智能在逻辑推理,数学演算等方面的模拟训练成果显著,但其他类型的人类思维模拟仍待跨越式突破。

抽象思维,即逻辑思维,主要依靠逻辑来进行思维,逻辑思维过程表现为一个线性过程 ,容易形式化,借助于概念实施严格的逻辑推理从某一前提出发一步接一步地推论下去,直至结论。(32)刘泉宝、刘永清:《从思维科学看人工智能的研究》,《计算机科学》,1994年第5期。司法裁判中的证据推理与法律事实认定具有基础的逻辑性,而这种逻辑,既包含形式逻辑,也包含非形式逻辑,且主要以非形式逻辑为主。(33)张保生编:《证据科学论纲》,经济科学出版社2019年版,第158页。非形式逻辑主要包含印证推理、假说演绎推理与溯因推理等归纳主义逻辑。人工智能与逻辑思维的结合最初是在演绎推理、似真推理、非单调推理领域内展开,而未完全深入到以归纳推理、溯因推理为代表的“非形式逻辑”的领域。(34)周慕涵:《证明力评判方式新论——基于算法的视角》,《法律科学》(西北政法大学学报),2020年第1期。当前人工智能结合生物科学和计算机科学的方法,立足逻辑运算和符号操作,实现对形式逻辑思维的模拟,并逐步深入到对非形式逻辑思维的模拟。

“灵感”思维,又称“直觉”思维,是基于大量实践和认识经验的积累,以潜在性的意识结构为依据,在潜意识当中孕育成熟,在一定条件刺激下,瞬间性、突然性地涌现于意识成为灵感。(35)张保生编:《证据科学论纲》,经济科学出版社2019年版,第158页。司法过程中直觉的主要功能在于发现各种初始结论(36)李安:《司法过程中的直觉及其偏差控制》,《中国社会科学》,2013年第5期。,为证据推理提供大致的方向。(37)张保生编:《证据科学论纲》,经济科学出版社2019年版,第152页。人工智能对于“灵感”思维的模拟体现为一种“启发式算法”,2013年,帝金数据普数中心数据研究员S.C.WANG开发了一种新的数据分析方法,该方法导出了研究函数性质的新方法,新数据分析方法给计算机学会“创造”提供了一种方案。但当前人工智能对人类的“灵感”思维依旧无法形成完全模拟,与证据推理过程中的跳跃式“直觉”思维仍相去甚远。

建立在思维模拟基础上的人工智能司法证据推理,限于当前的人工智能技术短板与图灵机所固有的技术“天花板”,同时一套算法便构成一套独立的信息处理体系(38)Batya Friedman, Helen Nissenbaum, “Bias in Computer Systems”, ACM Transactions on Information Systemss,vol.14, no.3(July 1996), pp.332-345.,其往往存在一定的认知偏差,导致在实现司法证据推理准确性过程中还存在这样几项障碍:一是对人类思维的不完全模拟,当前无论是对逻辑思维的模拟还是对直觉思维的模拟都是不完整的,造成在司法证据推理过程中只能得到“盲人摸象”般的结果;二是客观世界的知识具有复杂性,并非所有知识都能转化为形式化、规则化的算法;三是当前思维科学未穷尽对思维世界的全部认识,人类思维的运行是一个极其庞杂的系统,一个思维认知结果往往是形象思维、逻辑思维、直觉思维阶段性、部分性、交错性、偶发性综合作用的结果,人工智能思维模拟建立在不充分思维科学认知的基础上,其认知结果也必然是难以尽善尽美。

(二)司法智能推理的经验化不足

法律事实认定是一个证据推理的过程,是法律事实认定者在经验基础上理解、运用证据认定案件事实的一个经验推论活动。经验是理解证据内涵的背景知识,也是证据相关性推论的基础和证明力的评价尺度。(39)张保生编:《证据科学论纲》,经济科学出版社2019年版,第150-154页。经验来源于社会知识库与个人知识库,作为社会知识的经验是对众多个别现象通过“归纳概括”得出的一般知识,而作为个人知识的经验主要包括个人生活经历、审判经验、直觉甚至是偏见。(40)张保生编:《证据科学论纲》,经济科学出版社2019年版,第151-152页。

一般而言,人工智能要获取人类经验的途径只能通过“机器学习”。机器学习( Machine Learning,ML)一般被定义为计算机程序可以在给定某种类别的任务T和性能度量P下学习经验E,如果其在任务T中的性能恰好可以用P度量,其性能则随着经验E的积累而提高。以上海“206系统”为例,提供机器学习的知识库包括法律库、经验库和判例库,通过输入法律法规、案卷材料、询问/讯问笔录、庭审笔录等样本数据,结合法官的经验常识完成对关键要素的抽取与深度学习,使其囊括业务法官(专家)经验、法律法规、专门知识、常识性知识。(41)张保生编:《证据科学论纲》,经济科学出版社2019年版,第168-176页。

但是,对于司法证据推理经验性的人工智能化仍需保持谨慎,人工智能对于经验的深度学习尚存不足,总结而言:其一,样本数据严重不足。一方面是输入计算机的案卷材料、庭审笔录规模尚小,经验的高度普遍性与高度盖然性有待加强;另一方面,法律决策过程中的关键行为如形成决策的内部讨论往往是高度非文字化、非数据化的,如合议庭、审委会的讨论、决策过程(42)左为民:《关于法律人工智能在中国运用前景的若干思考》,《清华法学》,2018年第2期。,同时还有大量“不入卷材料”潜在性甚至决定性地影响着最终裁判结果,而样本数据难以包含这些信息,必然会导致“机器学习”的最终结果出现偏差。其二,人类经验难以统计。“统计学”意义上的经验难以等同于包含社会知识与个人知识的人类经验,人工智能所能获得的数据相对于人类生活来说毕竟是有限的,人类经验是综合了民族、地方、历史、习惯、价值等因素的混合体,这些都是人工智能难以学习的。(43)纵博:《人工智能在刑事证据判断中的运用问题探析》,《法律科学》(西北政法大学学报),2019年第1期。其三,“机器学习”的方式难以避免“偏见”。以案卷材料、询问/讯问笔录、庭审笔录等为样本数据进行“统计学”意义上的归纳概括,在学习人类经验的同时,也对样本数据中的“偏见”进行归纳与使用,且因为样本数据的严重不足,可能导致这样一种“偏见”在司法决策中的影响力进一步放大。例如,美国一些州的刑事法官在评估被告或被定罪者的再犯风险时,在审前拘留、判刑或提前释放的决定中,使用COMPAS系统进行评估,使用了犯罪记录和137个问题的调查问卷中的数据,其中包括:“饥饿的人可以偷窃吗?强烈反对,不同意等等。”然而,这个工具也有它的缺陷。通过使用过去的数据,它系统地高估了非裔美国被告的累犯率。因此,通过机器学习实现在证据推理中应用经验逻辑,较难规避偏见的风险。

(三)概率运用:证据推理能否完全数学化

人工智能由于以“图灵机”作为硬件基础,人工智能也只能如同“图灵机”一样,以数学化的“机械推导”为主要的运行逻辑。(44)马兆远:《人工智能之不能》,中信出版社集团2020年版,第217-218页。所以,人工智能在进行逻辑推理时,只能将用于逻辑推理的元素转化为数据值,并在元素与元素之间通过数学的方法(如“概率”)建立起数理关系。(45)栗峥:《人工智能与法律事实认定》,《法学研究》,2020年第1期。无论是人工算法还是进一步发展出来的“生物算法”都是基于概率化的数学运算建立起来的,而人工智能进行经验学习也是建立在概率化的数学方法之上的。

数学与概率论在人类思维的定性分析与人工智能的定量分析之间架起了相互沟通的桥梁。但是进行概率化的数学运算不能代替证据推理的全貌,法律事实认定与证据推理离不开数学的辅助,人工智能证据推理依靠概率运算开展,但是证据推理本质不仅是概率运算,更为重要的是要依靠因果推论开展,因而他们无法实现完全数学化。(46)See Jason Millar,Ian Kerr, Delegation,“Relinquishment and Responsibility: The Prospect of Expert Robots”, SSRN Electronic Journal, vol.14, no.5(March 2013), pp.532-534.

原因可总结为四点:第一,形式化的概率论无法完全实现司法证明的非形式化推理。以贝叶斯分析为代表的概率论对于司法裁判可以起到“化繁为简”之功效,但是我们面对的现实世界充满了偶然性、非线性,必须在有限时间内应对不可计数、变化多端的人类社会复杂性,正如艾伦教授所言,司法证明需要运用包括概率论在内的多种认知工具以辅助似真推理,但归根结底,它不能被简化为数字和数学公式。(47)罗纳德·J·艾伦:《司法证明的性质:作为似真推理工具的概率》,汪诸豪、戴月、柴鹏译,《证据科学》,2016年第3期。第二,人工智能无法通过数学的方法实现对人类思维的完全模拟。司法证据推理中,无论是相关性、真实性、合法性还是证明力的判断,主要涉及两种思维,即逻辑思维和灵感思维,但无论是逻辑思维中的“非形式化推理逻辑”还是以“直觉”为主要表达方式的灵感思维,当前的人工智能技术都无法通过数学运算实现全仿真,甚至很多技术尚处于无法付诸实践的试验性阶段。第三,人工智能难以对主观概率和客观概率实现准确转化。在传统的证据法学理论中,有两种表达信念概率性的方式,第一种方式是使用日常语言表达信念的概率性,第二种方式就是使用数学语言表达信念的概率性,对某种信念状态进行精确的数字赋值(48)樊传明:《证据评价论——证据法的一个阐释框架》,中国政法大学出版社2018年版,第146-149页。,但是如何在精确性数字与主观性模糊概率之间转化是当前人工智能无法很好解决的问题。第四,数学概率运算导致法定证据制度之弊。人工智能在司法证据推理中通过对不同证据证明力设定不同的等级,并设定不同的法律效果,规定各种证明力的相加方式,从而得出最终的司法证据推理结果,这本质上就是一种法定证据主义的算法设计。

(四)交互理性:智能推理的辅助性边界

证据推理在诉讼程序的语境下,特定司法场域之特殊构造中诉讼参与各方的理性交互的结果,是法庭认识论的一部分。(49)卞建林编:《刑事证明理论》,中国人民公安大学出版社2004年版,第13页。司法证明系交互理性之下的他向证明,也是不同谱系知识相互作用与规制的过程,正如数学、心理学、哲学也在不断给予司法证明某种指引。(50)See Richard Lempert, “The New Evidence Scholarship: Analyzing the Process of Proof”, Boston University Law Review, vol.66, no.3 (May 1986), pp.439-477.人工智能与人类法官在证据推理这一问题上的交互受到福柯(Michel Foucault)的微观权力支配理论的影响,相互之间受到彼此的知识性“规训”。根据美国学者的一项实验,在刑事司法领域中,计算机生成结果对于法官的决策结果会形成明显影响。(51)See STARRSB, “Evidence-based Sentencing and the Scientific Rationalization of Discrimination”, Stanford Law review, vol.66, no.4 (July 2014), pp.867-869.当前人工智能技术的蓬勃发展,使人工智能介入到证据推理之中的角色已不仅仅是一种工具性的辅助,还是人类法官的法庭认识论层面的交互对象。而对于人工智能证据推理的规制,需要将这种交互行为纳入到理性主义的轨道中,以交互理性建构其在证据推理环节的适用边界。

司法证据推理,无论是相关性、合法性、真实性还是证明力的判断,均要求形象(直感)思维、抽象(逻辑)思维和灵感(顿悟)思维三种思维方式的综合性、完整性运用,要求经验推理在特定时空下具有一贯性、妥当性与全面性。然而综合上述分析,当前人工智能技术在思维模拟、经验学习等方面仍存在诸多不足。在思维模拟上将司法证据推理的处理大量建立在数学运算的基础上,这与司法证据推理的思维模式在底层逻辑上存在一定程度的龃龉。在经验推理上,具有前后裁判一贯性上的优势,但在妥当性和全面性上仍与人类法官存在较大差距。因此,单从技术视角看,人类法官所组成的审判法庭在司法证据推理中仍处于主导性地位,这是当前人工智能所无法有效取代的。但是,人工智能在辅助司法证据推理中的作用和价值是十分巨大的,需要有效的规则设计和制度引导。实现交互上的理性主义,制度核心是明确人工智能和人类法官各自的“能”与“不能”,有效预防各自的隐形偏见(52)See L. Song Richardson, “Systemic Triage: Implicit Racial Bias in the Criminal Courtroom”, Yale Law Journal,vol.126, no.3(January 2017), p.862.,建立恰如其分的优势互补。

人工智能在证据推理中的理性功能范畴可分为两个方面。第一,前置性指引。通过人工智能系统对海量大数据的深度学习能力,人工智能系统拥有更为清晰、准确、全面的案例数据库和相关知识储备,司法事实认定过程中所依据的专业知识和日常知识,人工智能系统均能提供大量的数据指引。人工智能在大量形式性、重复性、格式化的证明工作上具有高于人类法官的精确性和公正性。人类法官可借助人工智能系统在事实认定环节实现“由点到面”的指引性辅助,在“点”上,可提供对单个证据证明力的辅助判断,在“面”上,可综合所有在案证据提供全面的事实认定参考。第二,后置性纠错。一方面是进行证据证明力审查校验,提出与人类法官在证据证明力判断上的不同之处,比如,证据是否存在真实性疑点,证据之间是否存在明显矛盾无法形成印证,证据认知与常识不一致等;另一方面是进行整体事实认定的审查校验,对法官作出的司法证据推理过程和结果进行整体逆向性勘误,检查是否符合逻辑规律,是否符合经验法则,是否做到了同案同判的一致性。同时,在司法实践过程中,法官的终局裁判结果也是反哺人工智能的关键学习材料,通过深度学习对既往算法查漏补缺,建立更为高效的预测、指引、纠错乃至正向建构功能。

上述所提到的无论是前置性指引还是后置性纠错,在规则和制度层面可对人类法官的事实认定产生制约,为人工智能在事实认定中的辅助性定位附加强制力。随着人工智能技术的逐渐发展,机器深度学习的逐渐丰富,思维模拟的逐渐成熟是必然性趋势,比如人工智能的形象思维、灵感思维正在取得突破性的发展。在可以预见的将来,人工智能辅助事实认定的范畴将会越来越广,对人类法官的制约也将越来越强。甚至有观点认为,人工智能可能会成为诉讼参与者与法庭裁判者。(53)See Andrea Roth, “Trial by Machine”, Georagetown Law journal,vol. 104, no.5 (June 2016), p.1304.

四、人工智能辅助司法证据推理的适用原则与路径

(一)人工智能辅助司法证据推理的基本原则

根据人工智能技术在司法证据推理中的应用现状和技术优势与缺陷,需要在外部对人工智能参与司法证据推理建立起基本的适用原则予以制约,使进入司法领域的技术在法领域内依据法律原则与基本法律规定而行。人工智能司法证据推理需要纳入到法治框架下予以规制,而司法规制的底层逻辑便是接受司法价值的约束和引领。人工智能活动需要坚持基本的伦理原则,2019年4月,欧盟发布《可信人工智能伦理指南》(Ethics Guidelines for Trustworthy AI),提出了四项伦理准则:尊重人的自主性(Respect for Human Autonomy)、防止损害(Prevention of Harm)、公正(Fairness)和可解释(Explicability)准则。在法律领域中,人工智能参与司法证据推理,最为核心和基础的伦理准则就是公正,公正是人工智能程序性治理的最终目的,是司法人工智能运行的根本依据,是提振群众对司法系统整体信心的必由之路。(54)See Andrew D. Leipold, “Objective Tests and Subjective Bias: Some Problems of Discriminatory Intent in the Criminal Law”, Chicago-Kent Law Review, vol. 73, no.2(November 1998), p.559.人工智能司法证据推理的公正性准则可具体细化为以下四项基本原则。

第一,智能审判实质化原则。人工智能司法证据推理需要通过有效参与庭审,辅助法官在庭审中发挥其查明事实、认定证据、保护诉权、公正裁判的作用,来落实以审判为中心的诉讼制度改革。因此,需要人工智能的运行以审判程序为嵌套、以审判标准为指向、以审判实践为素材,使人工智能有效落实到以审判为中心的语境当中去。其一是坚持全面参与庭审,以审判为中心重在实现庭审的实质化,保障控辩有效对抗和当庭质证,实现诉讼证据质证在法庭、案件事实查明在法庭、诉辩意见发表在法庭、裁判理由形成在法庭,人工智能进行司法证据推理的证据材料应当在法庭上以人工输入或者智能图文、语音识别技术进行重新采集,当庭进行司法证据推理并生成认定结果,供控辩审三方参考。其二是实现证据标准的统一,完善证据制度、统一证据标准,是推进以审判为中心的刑事诉讼制度改革的核心任务。(55)秦宗文:《证据标准的双维分析:基准与动力》,《中国刑事法杂志》,2021年第3期。将统一的证据标准嵌入到司法人工智能的算法之中,通过人工智能司法证据推理系统为侦查、审查起诉、审判提供统一化的证据收集指引与证据标准指引,使被嵌入到数据化程序系统中的证明标准实现一定程度的具体化,在实现数据化的同时也实现统一化。(56)刘品新、陈丽:《数据化的统一证据标准》,《国家检察官学院学报》,2019年第2期。其三是在算法设计与样本数据学习中要规避“以案卷为中心”“以口供为中心”的实践样态,进而保障庭审实质化,要注意提供机器学习的样本数据不要仅仅局限于案卷与口供,需要提供包括案卷材料在内的询问/讯问笔录、庭审笔录等多元化样本数据,以及除口供之外的种类不同、来源不一的多种证据信息。

第二,算法公开原则。算法公开原则要求法院的人工智能参与的审判活动从参与流程到算法内容都应当向社会公开,使得人工智能的参与行为和相应算法受到社会公众的广泛监督,这是审判程序公正的基本保证。在机器学习的具体应用过程中,由于算法存在黑箱,模型机器学习在司法证据推理的可解释性等方面受到质疑。要保证人工智能司法证据推理的内容在一定程度上可以公开透明,这既是保障公正的需要,也是接受检验保障准确性的有效途径。用于构建算法模型的知识图谱具有强大的实体关系表达能力,其知识方法与人类认知模式一致,与自然语言表达语义的方式相一致,是人工智能建立证据要素关联,进行逻辑推理的基础,对于该知识图谱需要向控辩双方甚至是全社会予以公开,以监督审判权、检察权的合法有序运行,保障辩护权的有效行使。

第三,算法平等原则。刑事诉讼基本职能分为控诉、辩护和审判,控诉职能和辩护职能进行平等对抗,并贯彻于侦查、审查起诉、审判之始终是现代刑事诉讼的基本理念。(57)陈光中编:《刑事诉讼法》(第六版),北京大学出版社、高等教育出版社2016年版,第15-16页。人工智能在介入司法证据推理时需要遵守控辩平等的原则。一方面是保证算法理念的平等,在算法设计时要保证运算过程与运算结果对控辩双方不偏不倚,通过对样本数据的仔细遴选去除样本数据中蕴含的“有罪推定”“口供中心”“案卷中心”的实践弊病(58)谢澍:《人工智能如何“无偏见”地助力刑事司法》,《法律科学》(西北政法大学学报),2020年第5期。,防止出现有违“控辩平等”的算法偏见。另一方面是保证人工智能算法资源的平等配置,当前司法人工智能系统的人力物力投入巨大,主要由国家进行主导,并交由国家机关使用,在控辩关系中,无疑强化了控方的资源配置,使原本相对失衡的控辩关系进一步向控方进行优势倾斜。所以要在司法人工智能的语境下实现控辩平等原则,除了算法平等,还要保证人工智能资源在控辩双方间实现平等配置。

第四,机器有限制约原则。在司法裁判与司法证据推理领域引入人工智能系统,除提升司法裁判效率外,还需对诉讼运行过程中法官自由心证形成一定程度的监督与制约。制约性方面,正如有学者认为:“人工智能……其积极影响包括但不限于: 第一,人工智能可以对侦查阶段即存在的主观臆断或倾向性意见进行有效提示,利用相对客观中立的监控,对认知偏见进行干预; 第二,人工智能可以对证据的似真概率进行推算,避免办案人员片面相信或否定某一证据之证据能力或证明力; 第三,人工智能可以对诉讼过程中的不规范行为进行监控,避免人为因素干扰程序公正与实体公正的兑现。”(59)谢澍:《人工智能如何“无偏见”地助力刑事司法》,《法律科学》(西北政法大学学报),2020年第5期。但制约原则需要保证有限性:一方面是制约范围有限,因为当前人工智能技术尚存较大缺陷,需要区分人工智能在司法证据推理中的优势领域,将人工智能对司法权的制约性限定在其优势领域。另一方面是制约权限有限,限于技术不足、司法伦理规范,当前司法人工智能只能赋予其辅助性地位,对司法裁判、司法证据推理提供辅助性审查指引,而不能赋予其最终决策权。

(二)人工智能辅助司法证据推理的具体适用

1.人工智能辅助的梯度性

当前,人工智能正由浅入深地介入到证据推理工作中。由低阶到高阶梯度性建构起人工智能司法证据推理体系,使人工智能在不同程序阶段、不同类型案件中合理辅助司法证据推理。

人工智能在司法证据推理中的辅助性内容应当由低阶到高阶分为四个梯度:第一梯度,辅助获取证据信息。一方面建立起大数据资源库,对于证据标准的具体适用、办案经验、罪名要件、案件信息、电子卷宗、裁判文书、指导案例等进行结构化数据改造并存储,以供法官查询;另一方面,利用智能图文识别系统、智能语音识别系统参与到庭审中,对审判信息进行全场景获取与记录,以供控辩审三方随时调用。第二梯度,辅助提供证据指引。一方面对某一类案件需要哪些证据做出清单式规定,另一方面在不同诉讼阶段,分别列举证据标准,根据证据标准,从证据链条、待证事实及证据印证方面对证据收集的种类、数量作出指引。第三梯度,辅助审查司法证据推理错误。一方面是进行单一证据校验,以上海“206系统”为例,对于收集到的每一项证据均从程序、形式和内容三个方面进行比对校验,生成审查结论,做出瑕疵证据补正或说明的指引;另一方面,对于法官作出的司法证据推理过程和结果进行整体逆向性勘误,检查是否符合逻辑规律,是否符合经验法则,是否做到了同案同判的一致性等。第四梯度,辅助正向司法证据推理。基于人工智能系统的基础数据库,结合全场景获取与记录的审判中的信息,利用人工智能算法、智能图文识别系统、智能语音识别系统对于司法证据推理的过程与结果进行正向建构,并依据法律规定与具体书写规范完整生成法律文书中的司法证据推理部分。

图1 人工智能参与司法证据推理的梯度体系

2.司法人工智能梯度性辅助体系的建构

人工智能在司法证据推理中的辅助性地位,在不同类型案件、案件的不同阶段,机器辅助的梯度性和制约性应当有所区分。

第一, 在不同复杂程度的案件中,区分机器辅助的梯度性。简单案件和复杂案件的区分应当以人工智能的技术特点为标准,当前的人工智能技术长于形式逻辑推理,但由于“统计学”基础上的大数据学习存在有限性和偏见,以及缺乏对人类直觉思维、形象思维的有效模拟,人工智能并不擅长司法证据推理中的价值权衡与经验应用领域,当案件涉及这一领域,应当定性为疑难案件从而减少人工智能作为辅助工具的参与范围和对法官的制约性。在简单案件的审理中,应当让人工智能更加广泛地辅助法官进行司法证据推理,使人工智能全方位地参与证据信息获取、司法证据推理结果证成,让人工智能从第一梯度到第三梯度全面参与到司法证据推理中来。同时赋予人工智能司法证据推理一定的制约性,当人工智能在司法证据推理中与人类法官产生差异,应当建立起有效的分歧解决机制。但在复杂案件审理中,囿于当前人工智能的技术有限性,人工智能在辅助的广泛性和制约性上应当有所限缩,例如仅进行第一梯度和第二梯度层面上的证据信息的辅助获取以及证据收集指引工作,在复杂案件中应树立人类法官在司法证据推理中的绝对权威,保证诉讼公正与诉讼效率最大化,避免对法官的错误性诱导。

第二, 在民事和刑事案件中,区分机器辅助的梯度性。在案件司法证据推理中,民事案件的“优势证据”证明标准低于刑事案件的“排除合理怀疑”的证明标准,这导致了三项差异:其一是民事案件证明难度相对更低,其二是民事案件对于司法证据推理错误的容忍度相对更高,其三是民事案件对于经验推理的概然性要求相对更低。比较而言,当前的人工智能司法证据推理精度不高的技术特点更加契合民事案件的证明特点,在民事案件中的辅助性定位应当高于刑事案件,赋予人工智能系统更大的参与性与制约性。

第三, 在刑事案件的不同阶段,区分机器辅助的梯度性。在程序运行的具体层面,侦查、审查起诉以及审判程序中的一审、二审、再审程序,对于人工智能辅助办案的梯度性使用应当有所区分。首先,在侦查、审查起诉程序当中,人工智能在法律事实方面的辅助性工作应当仅限于辅助性获取证据信息、辅助性提供证据指引,而不适于利用人工智能系统进行司法证据推理正向建构的工作,即只进行第一第二梯度的辅助。一方面由于公检法往往所使用的是同一套人工智能系统,提前让人工智能完全介入司法证据推理会冲击审判中心主义和庭审实质化的基本要求,另一方面也会给法官造成不当的暗示与引导,使法官机械裁判以制造与已经生成的人工智能司法证据推理结果的耦合。其次,如果人工智能已经介入了一审审判的司法证据推理之中,在二审与再审过程中应当排除人工智能的使用,司法人工智能系统往往由高院统一发布与管控,其下各级法院的人工智能算法基本一致,如果放任同一套算法的人工智能系统反复介入司法裁判的司法证据推理之中并对审判人员形成影响,会导致当事人审级利益难以得到保障。最后,司法人工智能系统参与司法证据推理应当在庭审调查结束之后,根据录入的案卷与庭审信息对法官的判决进行逆向性勘误与纠偏,而非在法庭调查之前前置性地形成司法证据推理结果,这既可能导致庭审流于虚置,也会对法官心证造成不合理引导,放大当前人工智能算法缺陷与不足所带来的危害。当前,由于人工智能技术的不足以及政治适当性的考虑,应当将第四梯度的人工智能辅助规避在诉讼程序全过程之外。

3.人工智能辅助事实认定的程序性保障

人工智能参与事实认定就程序保障方面而言,首先要贯彻公开审判原则,公开审判过程。在刑事司法人工智能时代,在技术正当程序理论中,透明不仅包括程序公开,更涵盖司法数据的公开以及算法的开源,更多地指向算法黑箱问题。(60)李训虎:《刑事司法人工智能的包容性规制》,《中国社会科学》,2021年第2期。针对算法不透明所造成的程序不公正问题,公开计算机程序的源代码,释放更大的透明度以帮助外部研究人员进行研判,帮助诉讼各方增加对系统的知情权,使人工智能进行事实认定的过程和结果具有可论证性、可辩护性、可预测性。

重点在于保障人工智能事实认定结果的“可审查性”,建立“信息存档”机制,所谓“可审查性”与“信息存档”是指保存从证据收集到最终事实认定的所有机器信息,以便在遇到正当程序挑战时访问这些信息进行信息审查,这些信息既包括人工写入的代码,也包括机器自动生成的代码(即“代码编写的代码”),即将实现算法的完整代码集进行存档,供审查时过程重现与性能检视。(61)See John Villasenor , Virginia Foggo, “Artificial Intelligence, Due Process and Criminal Sentencing”, Michigan State Law Review, vol.2020, no.2(May 2020), pp.295-354.对于信息存档载体,应当在技术进步的今天,抛弃实物载体,如计算机存储、硬盘存储等,走向云存储,提升存储效率与便捷性,建立起司法区块链存档机制,利用签名验签、电子身份认证、数据加解码技术,结合区块链技术的“去中心化”的特点,实现安全防护、数据防篡改以及审计留痕。(62)See John D. Gregory, “The Authentication of Digital Legal Records”, EDI Law Review, vol.47, no.6(April 1999), pp.47-72.

结语

随着人工智能技术的高速发展,人工智能技术与司法裁判的结合也正如火如荼地展开,从辅助性查询、审核等简单性、重复性工作,逐渐向具备预测性、决策性、创造性特征的司法证据推理辅助这一人类思维“深水区”过渡。(63)栗峥:《人工智能与法律事实认定》,《法学研究》,2020年第1期。人工智能长于形式逻辑和数学运算,但短于非结构化数据的提取与识别,在运用经验思维、灵感思维方面尚存诸多不足。而司法证据推理需要逻辑思维、经验思维以及灵感思维的综合灵活运用。当前人工智能在证据推理中的定位应当限定为辅助性角色。在人工智能与司法裁判中司法证据推理工作的结合过程中,需将人工智能、人类思维与司法证据推理的特点进行异同分析,在对照的基础上,使人工智能在合理限度之内辅助司法证据推理活动,梯度性地介入到不同类型、不同性质的案件及案件的不同阶段当中。既最大程度发挥人工智能技术特点,提升司法证据推理效率,制约法官恣意裁判,也要守住司法裁判底线,全面贯彻公正、公开、以审判为中心等基本司法原则。人工智能深度且有效地介入司法裁判与法律事实裁判当中,需要技术发展与制度创新形成合力,辨析技术之应与实践之需,建立起人工智能分阶段、分层级的司法证据推理辅助的梯度模式,更好彰显数字之治的价值与优势。□

猜你喜欢

证据司法人工智能
制定法解释中的司法自由裁量权
司法所悉心调解 垫付款有了着落
2019:人工智能
非正式司法的悖谬
人工智能与就业
数读人工智能
对于家庭暴力应当如何搜集证据
下一幕,人工智能!
手上的证据
论司法公开的困惑与消解