计算法学:法律与人工智能的交叉研究
2019-02-18张妮徐静村
张妮 徐静村
摘要:计算法学是随着人工智能在法学中深入应用而产生的一门交叉学科,使用建模、模拟等计算方法来分析法律关系,让法律信息从传统分析转为实时应答的信息化、智能化体系,旨在发现法律系统的运行规律。计算法学的核心思想是计算思维与法学思想的深度融合,研究者通过主体的分布式实时计算来分析法律行为,从而发现法律发展的深层规律。人工智能等增强技术应用于法学有利于丰富和发展法学基础理论,提升部门法科学性及协调性,减少法律系统运行摩擦。计算法学对于提高立法与司法效率、应对和规避技术风险等均具有积极作用。计算法学涉及计算法学理论、立法实验、司法预测、法律的语义挖掘、法律逻辑分析、司法管理系统、司法证据等几方面研究。计算法学吸引着众多法学、计算机科学研究者的目光,正在形成一个新的学科分支,并有望孕育出一批新的法律职业群体。
关键词:人工智能与法律;法律逻辑;司法模型;立法实验
中图分类号:DF0-059 文献标志码:A
DOI:10.3969/j.issn.1001-2397.2019.06.06
人工智能和大数据挖掘技术渗透在社会生活的各个角落,借助视频监控、电子邮件、智能系统等,可获得长时间的、连续的、大量人群的各种行为和互动的数据,实时、在线、网络化的计算社会科学研究正在兴起。文理交叉的新文科建设正孕育着新的学科分支,计算法学作为法学与计算机科学的交叉学科应运而生。
一、计算法学的产生与现状
(一)法律与科技相结合的历史沿革
学界向来认为“保守”是法学的特征,是法学保持稳定性进而具有权威性的原因之一;然而,法学也随时保持着对知识的包容态度,吸取来自其他学科的营养,特别是自然科学、实证科学,新的研究方法不断地被法学所吸收,并因而产生了一系列新的交叉学科分支。
1.计量法学研究的起源
计量法学研究(Jurimetrics)早最可追溯至上世纪40年代,随着自然科学的突飞猛进,人们试图用自然科学的理性来减少人文社会科学研究中的不確定性,一些学者将定量和计量的方法引入到法学的研究领域中。
1949年于里·洛文杰(Lee Loevinger)提出了计量法学(Jurimetrics)的定义,即运用诸如统计等量化方法解决法律问题0。1985年何勤华教授将计量法律学定义为:“运用电子计算机等手段,将数量计算方法引入法律领域,对法律的制定、执行、遵守以及法律教育和法学研究进行数量计算、分析的科学。”
计算机革命为量化法学提供了极大的技术支持,符号逻辑的运用将法律文本从传统的概念分析方法局限中解放出来,演绎和类推等形式逻辑方法得以应用于法律信息分析之中。计量法学以具有数量关系的法律现象为研究对象,综合运用数学、统计学与计算机知识,主要采用数理建模和实证研究方法。计量法学已用于法律情报统计、犯罪率预测等领域,用以促进司法效率。
2.人工智能与法律研究的发展
人工智能与法律研究(Artificial intelligence and law)的发展可追溯至上世纪50年代,1958年Lucien提出了法律科学的信息化处理,即建立法律文献或案例自动检索模型和法官裁量模型。1970年Buchanan进一步论述了人工智能与法律推理,用计算机模拟人的思维过程和智能行为,建立基于规则和案例的法律推理模型。此后各类专家系统如HYPO,CATO,CABARET和PROLEXS等相继产生,有的已用于司法实践之中。
人工智能与法律的发展分为三个阶段:1950-1970年早期将人工智能技术直接用于处理法律数据,建立基于案例的法律辅助系统旨在预测司法判决结果,但囿于技术原因尚无法准确预测。1980-1990年研究者更多考虑价值选择和法律目的,建立人工智能系统协助司法参与人实现其主张。2000年以后研究者设计程序旨在解释预测和提出合理的法律论据。
3.法信息学的发展
信息科学(Legal informatics)是一门涉及范围甚广的学科,涵盖了信息的收集、组织、存储、检索和传播等,法律信息学主要关注法律信息获取、信息技术对法律领域的影响。法信息学是法学的学科分支,涉及法律信息的存储和自动检索、法律部门的办公自动化、司法管理以及计算机在法律领域的其他应用。法律信息学与信息科学的发展紧密相关,偏向于应用研究,譬如法律信息的语义处理、法律合同的人工智能审核、法律信息的检索等,如将人工智能应用于司法领域进行法律信息的储存、传播与检索,以及判决的预测等都包括其中。基于法律逻辑推理的法信息学应用人工智能技术极大提高了法律系统的运行效率。
法信息学建立的前提是法律法规设计是完备而准确的,但法律实践活动并非如预期的那样精确运行,法律法规为大前提、案件为小前提、依据法律逻辑进行司法解释,其机械适用往往饱受诟病。当前法信息学研究的新倾向,不再是仅从逻辑结构研究法规和原则,而是着重考虑其在现实推理中实际扮演的角色,法律信息学正在减少孤立的、代码化法律信息,转而更关注法律信息的可重复性、公正性和实用性。
4.计算法学的当今实践
2009年,哈佛大学教授拉泽尔等15名学者在《科学》杂志上提出“计算社会科学”命题后,与日巨增的数字化信息以及人们行为的在线化,使得通过应用模拟、建模等计算方法分析法律关系成为可能,在计算思维的导引下,法学与人工智能、大数据处理技术的结合日渐紧密,计算法学(Computational jurisprudence)作为法学与计算机科学的交叉研究科学应运而生。2005年Wyner首次提出了计算法学的概念,对电子化的法律法规进行逻辑分析,自动检测其逻辑性。2015年美国Oliver Goodenough教授根据人工智能技术发展经验将计算法学(Computational jurisprudence)划分为三个阶段。法律科技1.0、2.0阶段,主要在当前法律系统下应用科技增强信息处理能力,如计算机辅助法律查询、流程管理、语义处理的专家系统等。3.0阶段是利用通信、建模和执行等计算技术,深刻改变或代替现有系统,如无人驾驶技术等。2015年我们在专著《计算法学导论》一书中对计算法学产生背景、意义、定义、基本研究内容等方面探讨了计算法学的基本理论。2017年出于对动态法律大数据的关注,钱宁峰进一步论述了计算法学——基于社会计算的法学。
身处大数据和人工智能技术飞速发展的时代,无纸化诉讼、庭审语音及视频记录等为诉讼画像提供了数据支持,能否更多地利用人工智能和大数据挖掘技术实现公平正义的量化和可视化?法官判断很多时候依靠“法感”——长期法学知识浸润产生的直觉——这种思维模式能否被计算机器学习和模拟?人工智能运用与法领域,能否实现法学与计算机科学理论的深度融合,建立起法律适用的智能算法和模型,促进立法与司法的更密切互动,进而促进法系统运行的更加顺畅。
5.计算法学是法学的分支学科
计算法学(Computational jurisprudence)与计量法学(Jurimetrics)、法信息学(Legal informatics)、计算法律学(Computational law)等概念相关,这几类研究的起步时间有先后,具有一定承继关系,研究内容有交叉和融合。总体来说,这几类研究都试图用客观的或是可量化的研究减少法律体系中的主观性,增强立法与司法的科学性和实用性,是法律与技术联系最为密切的一脉研究。尽管如此,上述交叉学科与所处的技术发展水平相关,其研究基础、研究的侧重点和采用的技术路线仍有一定的区别。
首先,计量法学(Jurimetrics)旨在“对具有数量变化关系的法律现象”进行研究,建立在传统统计学与数学基础上,采用抽样、问卷调查等方式收集相关数据,对社会活动进行分析。计量法学与法律大数据相关,本质上归属于“数据密集型科学”,数据量大且实时更新,以“自然数据”挖掘为中心,实施科学研究。
其次,这几类交叉研究着重强调应用,而计算法学法虽然也是运用前沿技术对法学研究与应用进行改造与创新,但它着重于发现法学自身的发展规律。法信息学(Legal informatics)是一门内容涵盖极广的学科,是信息科学与法学的交叉分支,其关注点主要是信息科学在法律领域的应用研究。法信息学包括人工智能与法律、计算法律学(Computational law)等,人工智能與法律研究经过近30年的发展,是欧洲比较有特色的研究分支,其研究偏重于建立预测模型和专家系统,但其成果在法院或律所中实际使用的并不多。计算法律学(Computational law)以斯坦福法学院的CODEX研究中心为据点形成了由学者、公司开发人员和律师组成的团队,已将法律信息代码化,遵循逻辑推理的原则,适用法律推理,但其研究常因机械推理的原因而饱受垢病。
计算法学是法学与计算机科学、现代统计学的交叉学科,基于现代人工智能技术和大数据挖掘技术,属于法学的研究分支,通过统计学、现代数学、计算智能等技术方法模拟和预测法律事务,其核心思想是计算思维与法学思想的深度融合,主要通过主体的分布式实时计算分析法律行为,从而发现法律发展的深层规律。
(二)计算法学产生背景
近年来人工智能技术、大数据处理技术正以前所未有的广度、深度影响着人们的生活,社会生活复杂性的增长,一方面使得纠纷和诉讼爆炸式增长,法律法规应对式剧增,信息超载成为一种无形压力;另一方面案件信息的电子化、无纸化诉讼等增强技术又成为法律适用的一种客观需求。计算法学正是伴随着数据挖掘与人工智能技术的发展在法律发展及法律适用的客观需求而产生。
1.计算思维的发展为计算法学的产生奠定了思想基础
计算思维以抽象、算法和规模为特征,能够把问题及其解决方案表述为可以有效地进行信息处理的形式和思维过程。计算思维的发展,使得法律事务代码化成为可能,以计算的形式表达法律内容,完成诸如文件合规性审查、立法预测、法规分析等事务。
2.人工智能和大数据挖掘带来模拟方法和分析系统的发展
借助视频监控、电子邮件、计算机智能系统等,可获得长时间的、连续的、大量人群的各种行为和互动的数据,人工智能与大数据挖掘技术的突破性进展,使得人们能够从大量无序的数据中分析出人们的行为。将数据科学的成果用于分析法律信息,有利于形成开庭前辅助判断的证据链,庭审过程的审判提示以及审判结果的预测,庭审后的分析和司法管理。
3.认知科学的发展为计算法学提供了新的解决问题的方式
计算机科学、神经生物学以及其他学科相融合形成认知科学,探究人脑或心智工作机制,促进人类对自身认知机制的深人了解。法官对案例的审判过程,多是法官基于法律事实、法律观念、审判技能、法律法规和历史案件等“法感”形成案例初步判断,继而通过往来于案件事实与法规从而获得最终的判断。认知科学的发展,有利于突破机械推理导致的不合理现象,形成更符合人类思维的司法预测。
4.传统法学的不足为计算法学的建立和发展留下了空间
法教义学并非能对所有法律问题给出最好的解决办法,法学转而从其他科学方法汲取营养,法社会学、法经济学的蓬勃发展可窥一斑。传统法学多采用法解释学、价值分析等定性研究方法,计算法学以具有数量关系的法律现象对研究对象,运用数据、数理模型、图形、计算机模拟等方式表述和分析法律问题,这对传统研究方法是有利的补充。其他社会科学如经济学、社会学等纷纷由定性研究转向数据为导向的定量研究,若法规的制定和法律的执行仅靠命令,而不考虑到社会的可接受度,其可信度将大受影响。
5.新技术的出现为司法改革提供了契机
作为定纷止争的利器,从早期的神判、决斗等到的法教义学,法学保持着神秘的面纱。然而面对这次的科技革命热潮,执法者的危机感日胜一日,若不紧跟科技做出让众人信服的变革,传统司法裁判方法将会成为下一个被抛弃的系统,智能分析技术能让人类法官在AI专家系统面前略显黯然失色。
6.司法实践对法官提出合理期待
在实践领域,案件审判流程的公开化、判决书的公布、网上传递法律文书,以及利用知识图谱、智能检索手段,促进法律系统的便捷性、实时性、公开性,已成为新的潮流。类案类判既是法律人的不懈追求,也体现人们对司法公正、平等的渴望。凡此等等都对法官于案件的审理和裁判提出了更高的要求。
7.司法改革为计算法学的崛起提供的机遇
从司法实践来说,我国法院系统员额制改革后,办案人员大幅度减少,人们权利意识的增强,案件日益增多,面对案多人少的实践困境,各方期待有智能化的辅助装置,帮助法官承担查询、类案比对等基础性工作,特别是对于简单案例能有快速解决提示。
(三)欧美司法领域中计算法学的研究与发展现状
各国政府与研究人员对法律大数据的态度不一,欧洲和美国自上世纪90年开始进行人工智能与法律的相关研究,取得了丰硕的成果。可视化技术正在进入美国的法院,倡导证据的可视化展示以及案发现场的复原。美国法院已经明确表示在诉讼和案件审理过程中整理、搜集证据材料时可以利用预测性编程技术。Northpointe公司根据犯罪理论和再次犯罪的关键信息设计了一款风险需求评估工具COMPAS,COMPAS风险评估依照从被告的犯罪档案中得到的和从与被告的访谈中采集的信息来评估该被告犯另一种罪行的可能性以及被告如期出庭的可能性等各个因素,该系统已用于美国部分州立法院评估罪犯二次犯罪的可能性,据称的评估准确率可达70%。ROSS系统在律所中可代替律师助理查询相关案例和法条,CACTUS系统被用于犯罪的预防和调查中。IBM公司的Watson和Google公司的DeepMind的良好性能,激发了人们进一步将人工智能应用于法律领域的热情。人们设计了诸如LawGeex、CaseCrunch、Project Debater等职能系统与人类专业人员比赛。2018年LawGeex公司,让法律人工智能软件LawGeex与20名法学家、有经验的律师等同时审核五个保密协议(NDA),LawGeex仅用26秒且准确率高达94%,而人类完成此项任务需要92分钟且平均准确率比LawGee低9%。
欧洲开展人工智能与法律的研究较早,1970年Buchanan开启了人工智能与法律相结合的研究。1990年Ashley在其博士论文中设计了基于案例的HYPO专家裁量系统,其后Brewer,Bench-Capon and Sartor,Roth,Horty and Bench-Capon等继续沿此思路推进,陆续出现了CATO,IBP,CABARET、BankXX等一系列专家系统以及人工智能法律咨询系统,有些已应用于司法实践中。英国将信息保存在电子介质,通过ODR(Online Disputes Resolution,在线纠纷解决机制)应用于小额民事纠纷,已在司法领域之外取得了显著的成果。法国借助大数据工具的“预测性司法(JusticePr6dictive)”在2017年就已进入了法国法院系统的视野。2017年5月法国两个最大的上诉法院,杜埃市(Douai)上诉法院和雷恩市(Rennes)上诉法院,开始试用Pr6dictice软件辅助判案,但在计算赔偿金时仍然未能完整考虑所有相关因素,导致计算结果不够准确。2016年意大利国际律所DlaPiper在意大利的分部已开始采用由加拿大公司Kira systems开发的人工智能系统,逐句地审查分析合同语义。
二、计算法学的理论基础和现实意义
(一)自然为法立法一调和法律的模糊性与客观性
法律体系由法律、判例、理论、程序、权利分级、规则、元规则等各类知识所组成,人们期望法律概念是精确的、单义的,然而作为逻辑和规则综合体的法律概念实则包含诸多的模糊和不确定性。第一,立法语言模糊。立法是借助于法律语言对法律现象的规范化表述,法规的制定需要法律语言的桥接,而自然语言的表述常常是多义和模糊的。法官判决过程是应用各种司法解释方法将法律规范适用于特定的事实,对法规的不同的理解可能会产生截然相反的结果。第二,法律看似一个明确的体系,却与道德、习俗、宗教等有着千丝万缕的联系。第三,法律需满足不同的功能定位,如倡导、调整、建议、计划、委托、管理等。第四,司法判决语言模糊,司法中的处罚机制具有开放性,法官的酌定情节中包含了个人的价值选择。第五,司法具有高度反馈性,其执行受各种社会、经济因素的影响。
人们期盼司法判决是客观的,不受偏见或成见的影响。法官做出判决,预先存在着可适用的法律规则,法官按照三段论推论,可获得确定的司法判决必须查询和解释相关法律渊源(制定法、先例、习惯等),以此确定统摄所涉案件的原则和规则,再确定如何将这些原则和规则适用在案件的事实中。然而,法律中包含着诸多如权利、正当程序、公正补偿等评价性范畴和公平正义等价值选择,因此,法律的客观性是指相对客观性,即只要发现正确答案的机制(如司法程序、法律推理等)不受歪曲性因素影响。法律现实主义关注司法过程的心理学和社会学分析,与司法判决所引起的社会后果之间互动,特别是对于行为规则不明晰、案件处理结果有争议的疑难案件,不同的法官即便根据相同的推理规则进行司法解释获得的答案亦不统一。
耶林分别从法律、历史和哲学角度论证法学是一门科学,法国《拉鲁斯大百科全书》明确:“法学确实不折不扣地是一门科学。”屈茂辉教授对法律的社会属性进行深入分析,认为法学是社会科学的重要组成部分已是不争的事实。法律制度的产生、变迁看似是包含很多偶然因素的主观选择,但本质是历史的产物。勒内·达维说“立法者要改造法律条文本身很容易,但是法律条文背后的东西却是很难改变的。”简言之,“自然为法立法”,“自然”是指科学的自然规律,前一个“法”指我们法律制度,后一个法指“规则”。
计算法学的科学属性表现在:(1)社会科学的研究对象是社会现象,法学的研究对象是广义的法律现象,即包括立法、司法、执法等在内的法律事务,计算法学的研究对象是能用计算方法表征的法律现象。(2)社会科学的研究方法具有典型的实证性和规范性特征,计算法学采用统计学、現代数学、计算智能等技术方法。(3)社会科学的价值定位是研究与阐述各种社会现象及其发展规律,计算法学旨在发现法律系统的运行规律,提高司法公正和立法科学性,提升司法效率。
(二)法律的规范性与人工智能的学习性相得益彰
卢曼认为,法律最核心的功能是维护社会规范性期望的稳定。立法需要维护其自身的稳定性,不会经常性调整规范、原则和价值。机器学习是一种建立于统计学基础上的定量方法,根据信息、参数和数据进行反馈式调整,每一个输人的数据又会成为机器学习的内容,并影响到未来数据。将人工智能应用于法律领域,能否建立某种机制,用以协调规范性与学习性之间的矛盾,更好地扬长避短,发挥法律的功效呢?
人工智能是以生物进化的观点模拟、延伸和扩展人的智能,人工智能方法应用于法律领域将对法律领域带来极大的冲击和便利。
首先,关于司法裁量的模型如何让干瘪的法条充实起来,能够考察法律怎样运行以及运行效果。法律是一种有关预期的科学,预期将来诉讼发生时,法院将做什么。事实上,无论判决是以法规还是判例为标准,法院对个案的裁判往往与人们的预期有出入,因为法官采用的司法解释、遵循的先例可能有所不同,即便相同,也因法官个人的学习、司法经历不同,而导致预期差异。计算模型本身具有高度反馈性,适时调整司法裁量差异,透过计算模型寻优的过程,可探究大多数法官判案的利益平衡机制,能让模糊的立法更具可操作性,从而促进司法裁量的趋同性,不必强求完全一致,但不同法官对同类案件的判决差异应控制在一定范围。
其次,计算模型为立法研究者提供了一种可行的分析和考察其观点可行性的新工具。计算模型对立法的促进主要体现在三个方面:第一,立法过程从立法者角度出发,对人们行为进行规制,然而法律运行的实际效果可能与立法者的初衷相去甚远,借助计算模型的高度反馈性,可以考察其运行效果,及时进行立法评估。第二,借助网络虚拟系统进行立法实验。在网络空间构造与实际系统对应的人工系统,通过在线学习、离线计算、虚实互动,使得人工系统成为可试验的“社会实验室”,以计算实验的方式为实际系统运行的可能情况提供“借鉴”“预估”和“引导”。德国出现了实验法(experimentalrecht),设有期限、伴有评估措施的“实验法”立法可减少立法的“试错”成本。建立立法的计算模型,扩展人工智能技术的运用范围与深度,必将促进立法的实用性。第三,借助于符号逻辑和法律推理的技术,能够发现立法中的语法错误和逻辑矛盾,促进立法文本质量的提高。
(三)计算法学的现实功能意义
计算法学是随着人工智能与深度学习在法学中深入应用而产生,使用建模、模拟等量化研究方法来分析法律关系,让法律信息从传统分析转为实时应答的信息化、智能化体系。计算法学对于应对和规避技术风险、促进英美法系和大陆法系的融合、促进司法系统的运行质量、提高立法与司法效率均具有积极的作用。
1.法系融合功能
计算法学采用建模、模拟等量化研究方法,无论是基于规则、基于判例还是基于数据的法律模型,其元数据是判例、法规或二者兼有之。透过司法案例,英美法系可探索案例之间的援引关系,大陆法系可发现司法解释内在规则,而判例中反映出来的稳定规则,又可以通过立法程序将其转变为成文法规,法律的计算模型无疑将促进英美法系与大陆法系的深度融合。
2.学科融合功能
计算法学是法学与计算机科学的交叉学科,借助于数据挖掘工具以及人工智能辅助手段,有利于发现法律运行规律,拓展传统法学理论。同时,拓展计算机科学的研究领域,将人文科学代入计算机科学,增加其实用的广泛性。
3.未来法治功能
各种新生事物,譬如智能机器人的权益、无人驾驶侵权的处理、区块链技术应用等,谙熟技术与法律原理的人才能制定出更有利于人类通常利益的法律法规。
4.司法促进功能
基于非单调性法律论证建立司法裁量人工智能模型,透过模型能让干瘪的法律理论鲜活起来,能够窥探其工作的内在机制。法律检索模型、司法裁量模型、司法推理机制、法律智能回答机器人、法律专家系统等智能增强技术,将极大的促进司法效率的提高。
5.司法增效功能
从复杂系统角度,法律体系的运行可看成是一个由立法者、法官、检察官、律师等司法人员组成,通过立法、裁判、和解等方式在法律法规的治理下,并伴随着诸如上诉、再审、立法评估等一系列立法与司法的交互作用。人工智能与法律在提供计算模式时,为法律研究人员提供另一种分析路径和验证思想的新工具,可减少法律体系运行的矛盾与摩擦。
6.司法整合功能
将法律法规电子化,转化为机器可识别的代码,应用法律推理等人工智能技术在立法领域,有利于减少立法逻辑、语言的差异。
7.深度学习功能
计算法学建立的模型可以考察法律怎样运行以及运行效果,法律过程的模拟对于学习法律的学生来说提供了极大的便利,能够让学生快速掌握法律知识,积极进入法律角色。
三、计算法学的研究领域
计算法学是随着人工智能与深度学习在法学中深入应用而产生的,使用建模、模拟等计算方法来分析法律关系,让法律信息从传统分析转为实时应答的信息化、智能化体系,旨在发现法律系统的运行规律,促进立法与司法的科学性。从上述计算法学的定义可知,计算法学主要涉及理论与应用两方面的研究,一方面人工智能等新技术有利于丰富和发展法学基础理论,另一方面人工智能等增强技术将提高司法效率,减少法律系统运行功耗。
计算法学的研究内容多采用列举的方式。Kevin Ashley将涉及人工智能与法学领域的研究进行了列举:基于规则的法律推理、基于案例的法律推理、司法预测模型、法律论辩计算模型、法律本体结构、法律检索模型、法律语言的机器学习、法规中提取法律信息、判例中提取法律信息、认知计算模型等。美国斯坦福大学CODEX中心主任Michael Genesereth认为计算法律学(Computational law)旨在用计算机理解法律规则,设计自动法律决策系统,譬如智能或计算合同等。与计算法律学密切相关的法律信息检索(法律检索技术、电子文献发现技术、合同分析,合同管理系统等)、法律基础设施技术(律师匹配系统等)则被排除在计算法律学的研究范畴之外。2015年我们在《计算法学导论》一书中,综合采用了屈茂辉教授对计量法學的划分方法,将计算法学的研究内容分为:立法的科学性研究、法律实施效果评价、法律对经济社会发展影响评价、知识图谱、验证法学理论和法规的合理性、用于刑侦证据确定、实用性法律辅助系统等。
计算法学是一门新兴学科,其研究内容宜采用开放式原则,将使用建模、模拟等计算方法来分析法律关系的这类研究都可以归于计算法学。计算法学的研究目的主要有两个:一是透过模型验证和完善法学理论,发现法律系统的运行规律,二是通过立法与司法模型,促进立法科学性与司法效率的提高。因此,计算法学的研究内容重点是促进理论和提高司法两个方面。
计算法学的主要研究领域:
(一)计算法学理论研究——旨在发现法律的成长规律
计算法学作为计算机科学、法学的交叉学科,对计算机科学与法学来说都有促进作用。对法学来说,计算法学为法学理论研究提供了新的视角,透过立法模型或司法模型,有利于发现法律运行规律,可完善已有法学理论,甚至发现新的法学理论。對计算机科学来说,计算法学拓展计算机科学的研究领域,且将人文科学代人计算机科学,增加模型的实用性。
计算法学的理论研究包含三层内容。1.计算法学作为交叉学科涉及到的相关理论构建,诸如计算法学的学科地位、研究方法、研究内容等讨论尚不充分。诸如计算法学是否法学独立的学科分支,如何将计算模型融入现有的法律体制中去等基础问题,尚需认真研究。2.计算模型反映的规律性对传统法学理论的补充和完善。霍姆斯在《普通法》开篇说过:法律的生命不在于逻辑,而在于经验。作为与司法实践密切相关的学科,法学理论需要司法实践的检验。国内外目前关于计算法学的研究,多是应用研究,而关于计算法学对于法学体系的变动、法学理论的促进和完善的相关研究成果尚不多见。例如,白建军教授在《死刑适用实证研究》对法律解释理论进行发展。计算法学通过法规或案例的分析验证法学理论,无疑将促进法学理论的纵深研究。3.与人工智能等新技术密切相关的新生事物,如智能机器人的权益、无人驾驶侵权的处理、区块链技术应用等,如何将对其进行规制,也是计算法学研究的任务之一。
(二)立法研究——规则性向学习型转变
发现正确的法律是法学研究的核心任务之一。科学立法少不了对各相关社会条件精确的统计学分析、民意调查、所选行为模式的事先科学计量评估和博弈分析以及必要时的法经济学的计算机模型预演。譬如,德国出现了设有期限、伴有评估措施的实验法(experimental recht),将法律程序视为一种“社会理解的过程”,而不再是法律机构单边自上而下的规制过程。
公众的反馈与网络社会实验可提高法律对社会和法律结果的预测,减少成文法的模糊性。立法者常常困惑,采用何种方式减少罪犯的再犯。人工智能和数据挖掘技术对判决书、证据链、先例的研究,可发现法官的价值选择趋向,并促进立法的可行性。川岛武宜认为:法律学逻辑论证的三段论的大前提与数学中的公理不同,它可以被法学界改变,并且无法用实践和观察的方法去验证。虚拟网络社区与实际的社会构成了两个平行的社会,网络环境为司法实验创造了有利的环境,更有利于寻找合法与违法的零界点以及行为规制的最佳策略。同时,司法模型反映的稳定性的规律,也为立法提供了较好的立法建议,经过特定的评估程序,即可提供立法参考,转化为法律法规。
(三)司法预测研究——找寻最优的司法解决方案
实证法学家川岛武宜认为法学是一种经验科学,中心课题是裁判行为。霍姆斯主张“法律预测说”,即法律提供法官将来如何判决之预测。司法实践表明,法官的裁判与个人的预测总是不一致,建立精准类案审判规则的智能辅助系统是司法模型追求的终极目标。国外关于类案类判的人工智能系统的相关研究起步较早,1970年Buchanan开启了人工智能与法律相结合的研究。
法律专家系统对法律专家的依赖性比较高,譬如案例特征由专家确定、案例相似性由专家标注继而展开机器训练等,由此产生的智能模型,主观程度较高,且由于投人的人力过大,法律专家系统往往只对某几类案件处理效果较好,普及面不够。随着大数据处理技术这几年突飞猛进的发展,人们期望应用大数据挖掘工具,采用深度学习、知识图谱、本体技术等手段深人理解自然语言,自动提取案例特征、自动对案例相似性进行排序。此研究正在兴起,已有少量前期探索性成果,譬如欧洲研发了网上的Eunomos相似法律信息查询系统,意大利研发了诉讼案例与既往案例库的匹配系统eMediation,法律信息的深度神经网络提取等。
(四)法律的语义挖掘——结合背景的语义分析
法律信息由法律、案例、理论、程序、规则等各类法律知识组成,呈现出非结构化或半结构化的形式。譬如,案件裁判文书为半结构化数据,其中包括首部、事实(案情描述)、理由(证据部分)、判决结果等部分。多源异构的数据难以用传统符号科学表达,深度挖掘法律信息,进行诸如法律知识的语义表达、法律语义检索和查询、法律信息管理等研究,是建立司法模型的研究基础。
结合语义的背景和关联研究,法律本体论已被广泛应用于文献查询、数据和文件挖掘、计算机辅助拟定法律,法律汇编、建立裁量模型、多主体模拟以及环境资源管理的决策系统等。1999年莱布尼兹法律中心开发的FOlaw系统,从法律功能的角度将知识分为规范知识、世界知识、义务知识、反应知识、元法律知识、创造性知识,系统描述和解释法律推理中各种知识的运用及其相互关系。
(五)法律逻辑分析——转向法律论辩逻辑
法律逻辑推理是建立法律模型的基础。形式逻辑推理方法有归纳、演绎、类比推理,然而三段论的推理在司法实践中并不尽如人意,除了立法不能达到预期的那样“完美”以外,司法裁判过程也并非如形式逻辑预设的那样,实际裁量过程仅是法官进行利益协调和平衡的过程,法律形式逻辑背后并存着各种立法和司法理由的相关价值和重要性的判断,这种推理并非是一一对应的单调推理,而是具有不确定性、语境依赖性和容错性的非单调推理。
司法模型是模拟法官作出司法裁判的过程,法律推理一直是法律与人工智能研究的核心,法律逻辑直接决定了司法模型的实用性。2012年Prakken采用可废止演绎推理,对社会法律的价值和先例的学习利用,推论出法规的有效性。确认以法律辩论(argument-based)为中心的法律推理能更好的刻画案件的情节。
(六)司法管理系统——提高效率
人工智能增强技术对司法管理系统有着重大的影响,各国纷纷进行无纸化诉讼、审判文书的电子化处理,极大提高司法管理的效率。2016年我国以大数据和人工智能技术为支撑的“智慧法院”建设列人国家信息化发展战略,一些智能辅助办案系统进入我国法院,融入立案、侦查、起诉、审判等司法权利运行系统全过程。
“智慧法院”系统不断发展,有效推动了司法领域的智能化实践。以上海“206系统”为例,以人工智能为基础的庭审语音转文字、裁判文书或起诉书的自动生成、法律文件辅助审阅、裁判文书证据材料自动抽取等,为“智慧法院”的审判质量评估、精准分案和辅助审判等应用需求提供了核心技术支撑。这些管理性系统对法官的工作效果进行评定,有效地提高法院管理和行政效率。在线调解系统、司法管理系统、司法信息輔助系统等这类管理系统功能明确,涉及的领域相对集中,在实践中取得了较好的实施效果。
(七)司法证据——辅助获取证据
证据是诉讼的灵魂,是案件审理与裁判的核心和基础。现代人工智能技术和信息挖掘技术已用于收集、获取、检验、鉴定犯罪嫌疑人在犯罪过程中形成的各种痕迹、物品、物质、文书,为刑事案件的侦查破案、检察起诉、法庭审判提供一种科学的司法证明。譬如,在司法审判阶段,智能辅助办案系统可针对实践中取证环节易发、多发和常见问题,根据以往证据收集和采信的经验教训并结合法律及司法解释确定的程序性规则和合法性要求,引导办案人员依法采信证据。值得注意,人工智能虽然可用于证据链的印证和逻辑判断,但自动提取的核心要素是否全面客观、比对是否准确有效,证明力有无和大小仍由法官自主判断和采信。
四、计算法学研究面临的问题与发展前景
(一)计算法学研究面临的问题
人工智能应用于法学领域,一方面享受着人工智能带给司法的高效和便利,另一方面也不可避免地承担着数据、技术不完善性带给司法的巨大技术风险。计算法学以法律数据为中心,使用建模的方式对数据进行分析,数据问题是计算法学研究面临的核心问题。当前我国法律数据面临的主要问题是:
1.司法数据来源的全面性、真实性和客观性有待提高。全国裁判文书网上公布的数据并非全样本数据,且公布数据缺乏规范性指引和准确性审核,目前全国裁判文书网上的法院判决书有的存在一些错误,不能正确反映相关数据。人民法院、人民检察院、公安机关等机构之间的数据不能兼容和共享,阻碍了数据的充分使用。
2.法律相关数据多为半结构化、非结构化的多源异构数据,数据特征隐藏较深。裁判文书中所记载的判决信息并非中国司法决策过程中的关键信息,合议庭或审判委员会中法官的讨论过程、法官判决后所撰写的审判报告或许才记载了判决形成过程的相关信息,如一些酌定情节及其理由并没有列入判决书中,因此必然造成语义分析不清、模型构建特征不明显,直接影响法律模型结果的实用性。鉴于法律信息的复杂性,目前尚未发展出将自然语言处理技术、知识图谱、深度学习、认知智能等技术深入融合法律系统而形成的独特算法。
3.法律数据涉及面广、敏感度高,迫切需要保障数据安全和隐私。法院信息的数字化是每个法院面临的问题,有的法院将数据电子化交由数据公司完成,数据公司对法院数据有掌控权,甚至有法院的电子数据因更换数据公司而丧失。虽然可通过数字签名、访问控制、对称加密、Hash算法等数据安全防护中常用的方案,结合差分隐私、隐私量化、匿名技术、泛化技术等隐私保护技术等保护司法数据,但目前的技术仍未能完全解决多源数据融合过程中的数据安全防护与隐私保护问题。
4.人工智能技术产生的时间只有短短几十年,其“鲁棒性”(Robust,即系统的健壮性)和可解释性存在局限,系统被当做一个“黑箱”(black-box)进行处理,中间的分析、决策过程对用户来说密不可见,也缺乏可交互性和操作性。美国卢米斯案中智能辅助量刑引发的争议可知,美国罪犯再次犯罪的评估软件COMPAS报告,仅提供了与特定群体相关的数据,且作出报告的方法是保密的。虽然目前人工智能模型能具有提高效率、减少重复工作和简单推理等优势,但将知识与数据融合进行复杂推理的技术还不成熟,缺乏确定性处理能力,距离拥有认知和决策能力的智能技术还差之甚远。
5.人工智能辅助刑事裁判模型将继承所录人的种族和性别歧视信息。司法判决透过裁判,平衡各方利益,彰显正义,裁判文书中隐含了立法者或法官的价值选择,不可避免地存在歧视和偏向。来自ProPublica的COMPAS报告明确地指出,佛罗里达州的黑人被告人比白人被告人被错误地判断为“有罪”的概率更高。若对此不加以纠正的话,种族歧视成为了人工智能的运算逻辑。
借助深度学习、语义分析、知识图谱、认知智能等关键技术可构建“精准分案”和“智能化推荐”等可视化系统,提高司法审判的效率和质量。但是,我们也应当注意到人工智能辅助刑事裁判的不确定性风险和可解释性风险,预设法律程序和纠正措施避免出现新科技应用带来的裁判不公和裁判失灵现象。
(二)计算法学发展前景——方兴未艾的新兴学科领域
法学与人工智能、数据挖掘等最新技术与法学的对接可能为法学中的根本性、基础性和前沿性的问题提供新的视角,跨学科研究领域的拓展有助于完善法律制度和法学基础理论,为司法实践提供更具可行性的解决策略与方法,促进立法的科学性与司法的公正性、效率性。
“人工智能热”也带动了“人工智能与法律的研究热”,人工智能与法律的结合在我国司法实践领域取得了令世界瞩目的成绩。2018年最高人民法院正式上线运行了案情事实、争议焦点、法律适用等为要素的“类案智能推送系统”,2019年1月上海“206系统”推出“刑事案件智能辅助办案系统,安徽、贵州、重庆等地方法院纷纷推出了针对某类案件的类案指引。
计算法学的研究需要法学家与计算机科学的学者深度合作,正在吸引着众多法学、计算机科学的研究者的目光,并将形成新的法律职业。目前已形成了诸如斯坦福大学法学院Codex中心,欧洲人工智能与法律的专委会等专门研究团体,正在吸引着更多交叉学科研究学者的加入。2018年清华大学成立了“计算法学”专业、四川大学开设了“计算法学”课程,进行人工智能与法学的交叉研究和人才培养。
人工智能引发的伦理问题譬如机器人的主体地位、无人驾驶车的侵权责任、机器作品的版权等,人工智能在法学领域的具体应用譬如建立司法裁判模型、语义分析模型、立法实验等,人工智能产品进入法学领域引发技术风险防控机制与传统司法协调机制改革等问题,正有待于我们进行更为广泛和深入的研究。