人工智能、法律解析与未来法律实践*
2022-08-16邱昭继
邱昭继
(西北政法大学高等教育研究所,陕西 西安 710063)
法律人工智能是法学研究的一个热门话题。这是诞生于20世纪70年代初的新兴研究领域。①法律人工智能研究的首要目标是建构良好的法律应用程序,生成能够在计算机程序中实现的模型。[1]P4研究者开发出了法律推理的计算模型和法律论证的计算模型。这些模型是用于实现人类法律推理和论证的过程的计算机程序,它们可以和法律职业者一样执行法律推理、法律解释、法律论证和法律预测等智能任务。虽然法律人工智能研究发展迅速,但知识表示的瓶颈阻碍了它们在法律实践领域的应用。法律推理和论证的计算模型使用的法律知识必须从法律渊源中手动提取。法律专家必须阅读法律文本并用计算模型可以使用的形式表示法律知识。研究者无法将法律推理和论证的计算模型直接自动地连接到法律文本。[2]P5历史上,法律人工智能更多地关注论证和推理,而不是基于经验和基于语料库的法律方法。然而,以数据为中心的新技术的快速发展为法律问题解决和分析的新算法方法打开了大门。大规模存储能力的最新发展和法律数据解析的相关进步已经创造了前所未有的工具,用于识别大型法律数据存储库中的模式。这些发展导致了对权威法律文本与法院、立法机构、律师和其他法律专业人员行为之间相互联系的新见解。[3]P99本文首先概述了法律人工智能从法律专家系统到论证检索和认知计算的转变。然后阐述了法律解析的概念、核心技术及其作用。接着论述了人机协作时代法律实践的新变化。
一、法律人工智能:从专家系统到论证检索和认知计算
(一)法律专家系统
法律人工智能之前的典范是法律专家系统。专家系统是使用人工智能来模仿法律职业者解决超出其知识或专长范围的法律问题的计算机应用程序。专家系统可以根据用户的问题定制答案,并对推导出答案的推理路线作出解释。专家系统用经验性和程序性知识进行推理。[4]P173这些知识常常用启发式规则表示。启发式规则用“如果……那么”的形式表述,说明规则的条件和结论。沃特曼的产品责任专家系统是20世纪80年代法律专家系统的典范。沃特曼专家系统用三条启发式规则表示损失的定义,用一条启发式规则表示严格责任的定义。这个专家系统的推理引擎循环执行这些启发式规则。如果数据库中表示当前问题的事实符合规则的条件,那么适用的规则就会触发,并将推断结果添加到数据库。推理引擎反复循环执行启发式规则,直到没有更多的规则可以适用为止。根据规则推导出来的结论就是用户问题的答案。沃特曼在开发法律专家系统时面临三个设计限制。第一,不同州的产品责任法律规则不同,例如,适用混合过失还是比较过失。第二,法律规则采用了一些法律概念却没有定义它们,例如“合理和恰当”或“可预见的”。第三,诉讼律师对所证明的事实问题和适用的法律教义是不确定的。[2]P11-12
法律专家系统还被广泛运用于非诉讼领域。公司采用专家系统来确保公司业务流程符合法律和公司章程的规定。为降低法律风险,公司将法律要求和规章转化为业务规则。只要公司在开展业务时遵循这些规则,则可降低或避免法律风险。一旦制定了业务规则,人事经理就可以通过公司的普通管理层级将其强制执行。业务流程规则也可在专家系统中实施。人事经理通过专家系统向公司的不合规政策或管理者的不合规行为发出警告。这些业务规则可以用逻辑形式表示,也可用启发式规则表示。这种业务合规专家系统在商业领域得到广泛的应用。如今,律师事务所和公司可用新技术轻松创建自己的专家系统,以实现业务合规。例如,福利与拉德纳律师所开发了基于网络的专家系统模块,以指导客户确保遵守“反海外腐败法”和联邦反腐败/反贿赂法。[2]P69-70虽然法律专家系统仍被广泛使用,但它还不是法律领域“杀手级应用程序”的典范。这至少有三个原因:第一,用专家系统开发的技术去处理不确定和不完整信息往往是临时的和不可靠的。第二,知识获取瓶颈限制了专家系统在法律和许多其他领域的效用。第三,文本解析技术还不能提取专家系统规则。[2]P13
(二)论证检索
论证检索是法律人工智能的新典范。它是指能够检索到命题在法律论证中的角色信息和其他与论证有关的信息的概念法律信息检索。与论证有关的信息包括命题在法律论证中充当前提、结论、规则陈述、事实发现、证据因素等角色的信息。论证检索是一种新型的概念法律信息检索。概念法律信息检索是概念信息检索技术在法律领域的应用。“概念信息检索与人工智能领域中的自然语言处理在语义层次上的分析和理解有着密切的关系。这也是概念信息检索与传统信息检索的分水岭。”[5]传统信息检索只能检索出文本中带有突出显示术语的句子,至于该句子是否与用户的问题相关则需用户阅读之后才能决定。概念信息检索可以从文本中识别和提取语义要素,例如概念和概念间的关系,进而归纳成对用户问题的直接回答。概念法律信息检索根据概念及其在法律论证中的角色自动检索与用户问题相关的文本法律信息,然后向用户返回与问题相关的答案。多年来,基于概念法律信息检索的目标,从自然语言文本提取概念信息和与论证相关信息的可靠方法一直找不到。现如今,法律解析技术可以自动地识别案例文本中与论证相关的信息,随之产生了基于与论证相关信息的概念法律信息检索,即论证检索。[2]P15
万律进阶和律商联讯等主流法律信息检索系统已实现了论证检索。代理商事案件的律师特别关注商业秘密盗用案件。他只需在万律进阶检索系统对话框里输入问题“复制饮料秘方是商业秘密盗用吗?”系统立即返回上万个案例,排第一位的是托尼·梅森诉杰克·丹尼尔酿酒厂案,这是一个典型的商业秘密盗用案件。②看看这个判决中的如下句子:
句子1: 我们发现一些因素支持林奇堡柠檬水是梅森的商业秘密的结论,而一些因素否定这个结论。
句子2: 他[梅森]作证说他只告诉了他的一些员工——调酒师——秘方。
句子3: 我们对该记录的审查表明,原告确实提供了一些证据证明他的林奇堡柠檬水秘方是商业秘密。因此,初审法院在否认被告人提出的基于不存在商业秘密的定向判决的动议上没有错。
万律进阶检索系统要回答律师的问题,仅仅依靠关键词匹配是不够的,还必须具备识别判决文本中的概念及概念之间关系的能力。系统识别的概念包括:饮料,秘方,商业秘密盗用。而且系统要能判断概念与概念之间的关系。系统还要具备识别命题在法律论证中充当何种角色的能力。在上面的判决中,句子1是表示基于证据的事实发现的句子,句子2是表示证据的句子,句子3是表示法律裁决的句子。这三个句子都是与法律论证相关的信息。这三个句子都与律师的问题密切相关。具备这些能力的概念法律信息检索就是论证检索。
(三)认知计算
认知计算是法律人工智能的另一个新典范。认知计算时代始于2011年,标志性事件是当年2月IBM开发的认知系统沃森在“危险边缘!”节目中一举击败两位人类冠军。认知计算是由数据科学演进而来的一种技术,它借助认知科学理论来构建算法,从而模拟人的客观认知和心理认知过程,使机器具备某种程度的“类脑”认知智能。[6]PI认知计算模拟人脑的认知过程,使应用程序具备某种程度的“类脑”认知智能。认知计算代表一种全新的计算模式,不同于传统计算模式。传统计算机必须先由人类编程才能执行某项特定任务;而认知系统则会从与数据和人类的交互中学习,从某种意义上说,它可以自行编程执行新任务。传统的计算机被设计用来进行快速运算;而认知系统则被设计用来从数据中推出结论并达成指定目标。在认知时代,计算机将会适应人。他们将会以我们与生俱来的方式和我们进行互动。[7]P2
法律人工智能研究者和技术专家研发了大量的法律应用程序,比如罗斯、法律机器和拉威尔等。这些法律应用程序可以实现认知计算,从而完成许多以前只能由人完成的任务。认知计算技术需要“理解”信息和在人类解决问题过程中的信息相关性,还需要让信息便于人们获取。在认知计算典范中,专业知识体现在法律文本电子库中,法律应用程序从中提取候选解决方案,并根据它们与问题的相关性对解决方案进行排序。[2]P16构建和测试关于法律论证的假设就是一种典型的认知计算活动。法律假设是指对一个法律问题应该或可以怎么样合理地决定的预测。比如,原告的前雇员向被告提供产品开发信息,在这种情况下应该判决原告赢得商业秘密盗用诉讼。测试法律假设不仅是评估预测是否正确,还要检索法律假设的正例和反例并考虑到法律论证的正方和反方。这些论证可能导致人们修改和重新评估假设。在帮助人类构建、测试和评估法律假设时,认知计算法律应用程序将使人类参与协作活动。人类更善于想象有趣的假设。计算机将快速解析大型文本语料库,以寻找与人类假设相关的证据。[2]P428
二、法律人工智能的新技术:法律解析
法律解析为论证检索和认知计算提供了强大的技术支持。法律解析是从法律文本数据库中提取有意义的知识和模式,以辅助法律决策者就事项预测、流程改进、法律战略、比较法律成本、计费优化、资源管理和财务运营等不同主题的优化管理。法律解析是文本解析技术在法律领域的运用,又被称为法律文本解析。法律解析提取和挖掘法律文本中与法律论证相关的信息,这些信息将法律信息检索转换为论证检索。认知计算法律应用程序是法律解析与法律推理和论证的计算模型相结合的产物。法律应用程序用于评估候选解决方案的知识是运用法律解析技术从法律文本语料库中自动获取的。
(一)法律解析与文本解析
文本解析是指用语言的、统计的和机器学习的技术在文本档案中发现知识,它将文本的信息内容模式化、结构化,以用于商业智能、探索性数据分析、研究或调查。[8]P387-388文本解析致力于从非结构化数据或半结构化数据中挖掘先前未知、隐含而有用的知识,因而也被称为文本知识发现。文本解析技术的突破源于IBM公司于2011年、2014年研发的沃森和辩论者程序。沃森掌握了深度问答和信息提取技术,辩论者掌握了论证挖掘技术,这些都是文本解析的核心技术。文本解析技术的突破为法律人工智能的发展带来革命性变化。法律解析和文本解析的对象都是非结构化的数据。两者都使用语言的、统计的和机器学习的技术。比如自然语言处理中的问答系统、语境识别与消解、文本摘要和文本分类等,逻辑回归、朴素贝叶斯、决策树、支持向量机等统计技术,以及深度学习、人工神经网络、聚类分析等机器学习技术。
文本解析与法律解析在对象、服务主体、和应用等方面有着明显的区别。文本解析处理的是普通文本,比如电子邮件、网页、推文、微博、论坛帖子等文本,而法律文本解析处理的是特殊文本,比如法律、法规、规章、案例、合同等法律文本。文本解析服务的主体是社会大众,法律解析服务的主体主要是法官、律师、检察官、法学研究者等法律职业人士。文本解析的应用要比法律文本解析的应用广泛。文本解析已应用于垃圾邮件检测、新闻分类、社交媒体分析、医疗卫生、安全智能、市场营销、客户关系管理、广告投放、聊天机器人等领域。法律文本解析应用于万律进阶、律商联讯法律信息检索服务,以及罗斯、法律机器和拉威尔等法律应用程序。
(二)法律解析与数据解析
数据解析也称为数据挖掘或数据知识发现。它通常是指从数据源中探寻有用的模式或知识的过程。[9]P4数据解析所处理的数据属性是结构化的数据。因此必须对原始数据进行预处理,最好原始数据本身就是高度结构化的。虽然数据解析与文本解析处理的都是数据,也分享一些共同的方法和技术,但数据解析不同于文本解析。其一,数据解析针对数字,而文本解析专注于文本。通常,文本是非结构化文档集合,对以何种格式组成文档没有特殊要求。而数据解析应用程序仅接受结构化信息作为输入。其二,经典的数据解析和文本解析的数据表示有很大不同。文本解析方法想要看到文档格式,而经典数据解析方法着重于处理电子表格格式的数据。[10]P1-3法律文本解析与数据解析同样有着这些差异。
(三)法律解析与法律分析
分析与解析这两个词的涵义很不一样。分析是“将一个整体分解成其构成部分及构成部分间的关系的理智过程。”[11]P41解析是从数据中发现和解释有意义模式。分析试图解释过去发生的事情,解析需要预测未来会发生什么。法律分析是一个比较宽泛的概念,它既指法律推理,又指法律研究。比如,昂格尔把律师与法官进行实践推理时采取的方法称之为理性化法律分析,这种法律分析在美国以及其他地方取得支配地位。[12]P55法律推理是在法律过程中把法律适用于事实的法官、检察官和律师所运用的各种形式的分析。法律推理是法律人必须掌握的一种法律方法,法律推理既包括演绎推理、归纳推理、类比推理等形式法律推理,又包括辩证推理、可辩驳推理等实质法律推理。无论形式法律推理,还是实质法律推理,都属于法律分析的范畴。数百年来,律师运用法律推理为客户提供法律服务。他们从浩如烟海的法律渊源中寻找适合手头案件的法律、法规和案例,结合手头案件事实做出合理的分析,从而给客户提出最佳的法律意见。法官根据法律规定演绎地作出判决,或者从案例中归纳概括出适合手头案件的规则,或者去寻找与手头案件类似的先例然后根据先例做出判决。法律分析一直以来都是法律人的看家本领。
但法律解析技术的出现改变了这一切。它成为了法律实践提供的一种新工具。法律解析挖掘案件文件和案卷条目中包含的数据,然后汇总这些数据,为法官、律师、法院、律师事务所等个人和组织提供先前未知的洞见。诉讼律师用法律解析揭示过去诉讼中的趋势和模式,这些趋势和模式告诉律师手头的案件应当采取哪种法律策略。法律解析为诉讼律师在诉讼期间出现的关键问题提供基于事实的答案:法官X的偏好是什么?我们应该申请变更管辖法院吗?对方律师在类似案件中使用过哪些具体策略?当事人Y是否曾打过这方面的官司?如果打过,结果是什么?公司内部法律顾问使用法律解析为关键业务决策提供信息,例如聘用谁当外部法律顾问,哪家律师事务所在这方面经验最丰富。诉讼律师可以运用法律解析快速准确地回答这类问题。[13]
法律解析和法律分析的差异表现在如下几个方面:第一,两者的主体不同。法律解析的主体主要是计算机程序,比如加拿大多伦多大学法学院学生团队创建的罗斯,这是一款以IBM沃森为基础的法律应用程序,专门提供法律问答服务。法律分析的主体是法官、检察官和律师等法律人。第二,两者采用的方法不同。法律解析采用关联分析、文本分类、关键词聚类、贝叶斯网络、渐进式学习、布尔查询等方法。而法律分析采用的是演绎、归纳、类比、假设、拟制等方法。第三,两者的运行机制不同。法律解析是自动运行的,计算机程序自动地从法律文本语料库中提取出与法律推理和论证相关的信息并得出结论。法律分析是手动运行的,法律推理不是输入了法条和事实后就能自动得出案件判决的自动售货机,法律推理的大前提和小前提都是法律人手动建构的。第四,两者的效率不同。法律解析解决法律问题的效率比法律分析的效率要高得多。对于很多法律问题,计算机程序几分钟之内就能得出全面的答案,而律师人工去寻找答案的话,则需要花上数周甚至更长的时间。第五,两者的成本不同。由于法律解析是计算机程序自动提取相关的信息,而法律分析是法律人手动发现法律、建构推理的前提,所以法律解析所花费的成本比法律分析的成本显然要低得多。一台计算机(或机器人)在短短的几分钟内可以完成一位律师数周才能完成的工作。因此,人工智能将替代法律人解决法律问题完成法律任务,这将减少法律市场对法律人的需求,也将导致法学院申请人数的减少。第六,两者的权威性不同。虽然法律解析具有高效准确的优点,但它却不如法律分析有权威。因为法律解析是由计算机做出的,而法律分析是由人做出的。如果某个案件的判决是由计算机做出的,那诉讼当事人是很难接受的,如果判决是由法官做出的,那他们就可以接受了,这是因为法官是法律纠纷的权威裁判者,而计算机却不是。因此,“来自法律解析的数据驱动的见解不能取代法律研究或推理,也不能取得法律人本身。这些见解是诉前和诉讼期间的补充。”[13]法律解析只是为法律实践服务的一种新工具。
三、法律解析在法律实践中的作用
法律解析实现了自动的知识表示、信息提取和论证挖掘的目标,解决了法律人工智能研究面临的法律问答挑战、知识获取瓶颈、论证检索等难题。法律人工智能研究者和技术专家将法律解析技术与法律推理和法律论证的计算模型整合在一起,提供了用于包含论证检索在内的概念法律信息检索新工具,并创建了新的法律应用程序。
(一)法律概念和关系的知识表示
知识表示一直是法律人工智能研究的核心问题。知识表示是基于一组标准化的术语词汇集合,表示某一特定领域的实体类型及其之间的关系。[14]P1法律解析技术一直致力于完善法律概念和关系的知识表示。20世纪80年代以来,人工智能研究者开始用本体表示概念和关系。在计算机科学中,“本体是给定领域中对象概念化和这些对象之间的结构性关系的明确的、形式的和一般性规范。”[15]P362概念化是指世界某些现象的一个抽象的模型,这个模型定义了与现象有关的概念。本体使一个领域中的概念变得明确,因此计算机程序可以用这些概念进行推理。一个典型的本体中应该包含:类和个体、类之间和类与个体之间的严格分层子类和实例关系说明,以及对每个类的性质说明和值限制说明。[16]P5本体包含5个基本要素:类/概念,关系,函数,公理,实例。类/概念之间基本的关系有4种:包含关系,表示概念之间部分与整体的关系;成员关系,表示概念之间的继承关系;实例关系,表示概念的实例和概念之间的关系;属性关系,表示某个概念是另一个概念的属性。[17]P114-115
法律本体一直专注于法律概念及其关系的知识表示。法律本体包含用于表示法律概念和规则的信息。在“合同成立”的样本本体中,“口头承诺的接受”、“非口头承诺的接受”与“承诺接受”是一种成员关系,“口头承诺的接受”、“非口头承诺的接受”是子类,“承诺接受”是父类。“特定个体的要约与承诺”与“承诺接受”、“履约接受”和“默许接受”之间是包含关系,“特定个体的要约与承诺”包含后面三个部分。人们可以将“合同成立”的法律本体向左扩展,从而为合同法和一般性的法律提供概念框架。例如,与“合同成立”平行的法律概念“合同履行”和“合同不履行”可以用法律本体加以说明,它们的上位概念“合同义务”也如此。“合同义务”的姐妹概念“侵权义务”、“刑法中的义务”也可以用同样的本体加以说明。本体的作用是提供用于表示计算机程序处理的知识的概念词汇表。[2]P211-212
法律本体传统上是手工建构的,自然语言处理和机器学习越来越多地提供自动化帮助。法律解析技术打开了长期以来阻碍智能法律应用进展的知识获取瓶颈。自动化方法可以基于统计分析识别语料库中显示重要的概念和关系。然后,自动化可以标记候选概念和关系,供人类专家考虑。类型系统就是可以自动表示法律概念和关系的特殊种类的本体,它是一种基本的文本解析工具。类型系统支持根据概念及其关系自动标记或注解法律文本,他们将在论证检索和认知计算中发挥关键作用。[2]P209-217在类型系统非结构化信息管理架构中,被称为注解者的软件组件集合组织成文本处理管道,解析文本并提取与类型相对应的信息。每个自动注解者以特定方式解析文本的某些区域,为其分配语义,并生成有关文本的注解或断言。其他注解者完全可以使用注解来得出关于文本语义的附加或更抽象的推论。类型系统作为文本解析的一种本体发挥作用,定义文本中可能出现的各种注解、概念和关系。[2]P245-246例如,类型系统可以将合同文本中出现的“电报交易”、“完成采购订单”、“口头协议声明”自动注解为“通过口头承诺接受”的一些手段,将“广告”或“提供奖励”注解为“一般公众的要约与承诺”的方式。如果计算机程序检索到一个电报交易,就可以推出如下结论:这个合同采取“特定个体的要约与承诺”的方式,这是一个关于口头承诺接受的合同案件。
(二)自动的信息提取
信息提取是计算机应用程序从非结构化文本中自动提取结构化信息的过程。长期以来,法律人工智能致力于从法律法规、案例文本语料库中自动提取有关规则要求的信息。传统上法律信息是由人类专家手动提取的,这极大地影响了法律人工智能的智能化发展。IBM沃森研发团队实现了信息提取技术的突破。沃森基于文本的信息提取技术展现了不同凡响的深度问答本领。沃森的信息提取技术具备了自动从法律法规、案例文本语料库中提取的功能。沃森掌握的信息提取技术就是法律解析的一项核心技术。沃森具备识别和提取法律概念之间语义关系的能力。“从制定法文本中自动提取信息的技术也可以通过各种其他方式支持认知计算。自动提取有助于从制定法文本的语料库中检索概念信息。”[2]P316
计算机系统可以从制定法文本中提取以下信息:1.法律部门或法律领域信息,如宪法、民法、刑法、环境法、卫生法、科技法等;2.法律规范的功能类型,如包含“可以”的授权性规范,包含“应当”的义务性规范,包含“不得”的禁止性规范;3.法律规范的逻辑构成信息,比如法律规范的假定和法律后果;4.与法律规范功能相关的特征信息,如义务或责任的承担者和受益人。计算机系统可以从司法裁判文本中提取案件的初审法院、二审法院、审判日期、案件类型、当事人、审判员、案卷号、案件事实、引用的法律法规、判决结论等信息。法律人工智能研究者将机器学习和知识工程技术应用于法律文本的信息提取。
对于企业合规,研究人员尝试从制定法文本中自动提取规则,并自动用这些规则检测设计方案是否符合法律规范要求。针对建筑工程设计方案的合规性,研究者开发了自动化合规性检查的项目。[18]这一项目采用如下方法:1. 文本分类:基于机器学习的文本分类识别包含与自动合规性检查相关的要求类型的句子,例如建筑行业的监管要求;2. 信息提取:基于规则的语义自然语言处理在相关句子中识别携带目标信息的单词和短语,并用预定义的信息标签对其进行标记;3. 信息转换规则:语义自然语言处理算法采用模式匹配规则将提取的信息转换为逻辑陈述,逻辑程序可以用逻辑陈述进行推理。根据这一方法,建筑法规“天井宽度不应小于3英尺”将转换为可以直接用于自动化合规检查的逻辑子句:符合-天井-宽度(天井)如果宽度(宽度),天井(天井),具有(天井,宽度),大于-或-等于(宽度,数量(3,英尺))。
(三)挖掘与论证相关的信息
法律人工智能的目标是实现自动的法律推理、法律预测和法律论证。法律应用程序不仅要自动识别和提取法律概念及其关系,还要挖掘与法律论证相关的前提、结论、论证型式等信息。IBM公司2014年推出的沃森的兄弟程序辩论者恰好掌握了论证挖掘的本领。论证挖掘的目标是借助计算机程序从自然语言文本中自动提取和识别论证结构。这种论证结构包括前提、结论、论证型式以及主要论点和次要论点之间的关系或话语中的主要论点和反论点之间的关系。人工智能与法律研究长期以来致力于从法律文本语料库中自动提取与法律论证相关的信息。从法律文本中提取的信息可以用于自动法律论证。论证挖掘技术已被用于法律解析。论证挖掘技术自动地识别案例文本中最终可用的与论证相关的信息。论证挖掘支持律师从法律文本中提取信息建构回答手头问题的论证。有关法律主张、判断、决定或裁判的证明或辩护就是法律论证。论证挖掘就是要识别和提取法律文本中与法律论证有关的信息。
法律人工智能研究者开发了一个用于法律领域的非结构化信息管理架构类型系统(LUIMA,简称为卢依马)。卢依马具备挖掘司法判决文本中句子的论证角色的功能。卢依马可以识别司法判决中的表示法律规则、法律裁定、基于证据的事实发现、基于证据的中间推理、证据、法律政策、基于政策的推理等具有不同论证功能的句子。在法律人工智能研究者阿什利看来,卢依马系统将句子在法律论证中扮演了9个重要角色,见下表:[2]P248-250
卢依马类型系统:句子层级类型
卢依马系统挖掘并识别出这些句子在法律论证中扮演的角色对于论证检索非常有用。司法判决中有些句子陈述法律规则,有些句子陈述法律裁判,有些句子报告案件中的证据,还有一些句子宣称基于证据的事实发现满足了法律规则的前件。卢依马系统接下来要根据句子在法律论证中发挥的作用来对案例文本进行语义注解,并根据注解检索句子。三种句子类型将成为注解的焦点:1.法律规则句子:在摘要中陈述法律规则,而不将其应用于特定案例的事实;2.基于证据发现的句子:报告事实发现者的发现,这一发现关乎特定案例中的证据是否证明规则条件或结论已被满足;3.引用句子:指权威文档和来源,例如法院判决(案例)、法规,规章、政府文件、条约、学者著作或证据文件。卢依马系统使用两种方法注解案例文本的模块:一是基于规则的子句注解,其中人通常基于一些示例的检查手动构建注解规则的语法;二是机器学习,其中机器学习算法从人注解的示例的训练集自动构建区分正面示例和负面示例的模型。卢依马系统采用论证挖掘技术提取与法律论证相关的信息,并将他们集成到概念法律信息检索的原型系统中。原型系统将法律信息检索转换为论证检索。为了在概念法律信息检索中使用与论证相关的信息,卢依马系统的架构将文本注解卢依马注解管道与信息检索系统相连接,该系统包括卢依马搜索和卢依马重排两个组件。卢依马搜索包含搜索引擎和案例数据库。给定一个查询,它检索并排列响应最快的文档,并将它们传递给下一个组件。卢依马重排根据相关性对文档进行重新排列。卢依马的设计者已经应用法律专业知识来智能地设计论证挖掘的功能,从而产生更智能的机器学习和更智能的文档排名。[2]P382-396
知识表示、信息提取和论证挖掘是法律解析的核心技术。自动的法律概念和关系的知识表示、自动的信息提取和挖掘与法律论证相关的信息是法律解析技术在法律实践中发挥的关键作用。法律解析也有一些自身局限性:其一,解析的准确率取决于电子化法律文本语料的多寡。只有建立了法律文本语料库,法律解析技术才有用武之地。而且,还要给法律文本注释,这是训练机器进行自我学习的必要前提。法律文本语料库的数据越丰富,法律解析的准确率越高。其二,法律解析技术不能像人类一样阅读法律文本。法律解析基于智能技术识别法律文本语料库中的知识和有用的模式,但无论信息提取还是论证挖掘都不能真正理解法律文本中概念及命题的意义。其三,法律解析可以实现自动化的信息提取,但对所提取的答案无法做出说明。法律解析不会告之为什么这个答案置信水平高,而另外的答案置信水平低。
四、人机协作时代的法律实践
技术的改变必将改变生产关系,也将深刻地改变人与机器的关系。具有认知计算功能的机器把人类从无意义的、重复性的思维模式中解放出来。机器不会取代人,但人也离不开机器,而是人与机器相互协作,在协作中发挥各自的优势。机器将会更加理性和善于分析,也拥有百科全书般的信息储备和强大的运算能力。人类则在专业知识、判断力、直觉、移情、道德准则以及创造力方面提供帮助。[7]P10-11法律人工智能的飞速发展将给法律实践带来革命性的变化。法律人工智能将法律实践带入人机协作时代。传统上,法律实践是由法官、检察官、律师、立法者、仲裁员、公证员等法律职业人士完成的。未来的法律实践将由法律职业者与机器共同完成,部分工作将完全交给法律应用程序处理。但是,机器并不会取代法律人。正如第17届国际人工智能与法学术大会主席弗洛里斯·贝克斯教授所言,就机器人法官而言,即便到2080年(也许是2100年,但不会更早),法官也不会完全自动化,机器人法官可能永远不会成为现实。[19]
(一)法律应用程序的广泛使用
法律解析技术为法律实践带来了革命性的变化。IBM沃森、辩论者和非结构化信息管理架构等为这种变革种下了革命的种子。法律解析技术与法律推理和法律论证的计算模型的结合催生了一大批具有认知计算功能的法律应用程序。法律应用程序运用卢依马类型系统帮助人们构建关于法律论证的假设,根据法律语料库中的文档对假设进行测试,然后为人类用户量身定制法律答案。构建和测试法律假设是一种典型的认知计算活动,人类和计算机可以在这些活动中协同工作,彼此执行最擅长的智能活动。[2]P421法律应用程序能够识别包含法律规则、法律裁判和事实发现的文本内容,还能识别证明结论的论证、理由的解释以及特定的法律因素和证据因素。这些法律应用程序能完成许多传统上只能由人完成的智能任务。法律应用程序在定制商品化法律服务中发挥重要作用。它能用法律文本推理,使实践系统能够根据人类用户的特定问题定制其输出。“法律应用程序不仅会以适合人类用户特定问题的方式选择、预订、突出和汇总信息,还会探索信息并以前所未有的新方式与数据互动。”[2]P16近些年,法律应用程序如雨后春笋般涌现。法律机器③对大量的知识产权案件语料库进行法律解析,提取诉讼参与者的行为特征,然后对知识产权案件的结果做出预测。相比传统的法律研究工具,法律机器有了很大的改进。传统的法律研究工具专注于简单的数据提取,但无法清理和建构数据,止步于向用户提供一个案例列表,这些案例难以收集有意义的信息,还需要用户对案例进行仔细的研究。法律机器走得更远。法律机器运用法律解析技术挖掘诉讼数据,揭示关于法官、律师、当事人以及案件本身的洞见,从数百万页的诉讼信息中挑选出有意义的数据模式。律师使用法律机器为用户提供法律意见并赢得诉讼。公司法律顾问使用法律机器来选择和管理外部法律顾问并制定诉讼策略。法律机器首先创建了一个无与伦比的法律信息数据库。法律机器昼夜不停地通过抓取软件捕获美国国际贸易委员会的电子文档信息系统、美国专利商标局和州法院的数据,确保没有遗漏任何信息。然后法律机器使用它们专有的自然语言处理和机器学习引擎工具“法律表达”清理、编码和标记所有数据。对于每一个案例,法律机器都会提取相关人员,包括律师、律师事务所、当事人和法官。法律机器识别所声称的属性(例如专利)、发现和结果(包括损害赔偿)。它们还建立了详细的时间表,将每个案例的所有摘要、申请、法庭命令、意见和其他文件联系起来。法律机器然后通过网络应用程序为客户提供法律解析见解。
法律概念、法律推理和法律论证是法律思维和法律方法的核心内容。表示法律概念、做出法律推理和法律论证过去一直被认为是专属于法律人的技能。现在,机器运用法律文本解析技术也能做到,这将让法律市场和法律职业产生翻天覆地的变化。
(二)律师工作方式的改变
数百年来,律师运用法律推理为客户提供法律服务。他们从繁多的法律渊源中寻找适合的法律、法规和案例,结合手头案件事实做出合理分析,从而给客户提出最佳法律意见。法律服务工作将经历量身定制、标准化、系统化、分包和大宗商品化五个阶段。传统上,法律建议由律师通过一对一形式提供,交付物为文件文档。诉讼律师为深入了解特定律师事务所、律师、法官或当事人的行为,不得不查阅大量资料,询问曾经与他们打过交道的同事。这一传统模式的最大压力就是成本,大多数法律服务变得让人无法负担,无论是个人消费还是全球性的商业客户。[20]P73-74
人机协作时代,人工智能不会取代律师,但使用人工智能的律师将取代那些没有使用人工智能的律师。认知计算法律应用程序的出现改变了这一切。现在,法律服务可分解成更小的组成部分。诉讼可分解为文件审阅、法律研究、项目管理、诉讼支持、电子披露、策略、战术、谈判和法庭辩论等部分。法律交易可分解为尽职调查、法律研究、交易管理、模板选择、谈判、针对性起草、文件管理、法律意见和风险管理等部分。诉讼和交易的许多任务不是只能由律所来完成,很多重复性及事务性的工作完全可用不同方式分包出去。替代性的法律服务处理方式包括内部处理、非律师化、异地、离岸、外包、转包、共同处理、近岸、租赁、在家处理、公开处理、众包、计算机化、单包和不处理等。对任何纠纷或交易而言,法律服务的成品都是结合几项或更多处理方式的结果。[21]P42-50律师在提供法律服务时会把大量的工作交给法律应用程序来完成,这既提高了效率,又节省了成本。
法律解析是法律服务工作从量身定制走向大众商品化的技术推手。技术在律师执业转变的过程中扮演了核心角色。律师和当事人过去在类似案件中的行为以及未来在类似案件中的可能行为这类信息无需诉讼律师花上数周或更长时间去了解,法律解析在几分钟之内就能向诉讼律师提供数据驱动的见解。虽然技术不能准确无误地预测特定案件的结果,但它提供的见解可以增加准确预测的概率,律师可以据此制定更有可能胜诉的诉讼策略。例如,如果一个诉讼律师代表证券案件的客户,并且可以确定哪些动议或策略在同一法官的其他证券案件中最成功,则可以合理地预测类似的动议或策略在当前案件中或许会成功。传统的法律研究工具无法量化动议或策略的结果,法律解析却能轻松完成这一任务。使用认知计算法律应用程序的律师能够向当事人提供低价格高效率的法律服务,让优秀的律师变得更优秀。同时我们也要认识到,法律应用程序的数据驱动见解不能取代律师,它们是诉讼前和诉讼期间的补充。法律解析就像是律师的钱球(Moneyball),钱球方法通过数据驱动的见解补充了经理、球探和球队管理人员的智慧,法律解析同样只是补充了律师的法律智慧。[13]
人工智能将给法律职业带来巨大的冲击,许多传统法律服务机构将被淘汰出局,部分律师将因此失业。人类获得法律服务的方式将发生根本性的改变。未来法律服务将变成一种可以购买的商品。当事人遇到法律问题后可以不找律师,直接把法律问题输入到法律应用程序中,法律应用程序会迅速地向当事人输出法律答案。新技术对律师带来的一大挑战在于,如何尽快采纳市场上涌现的法律应用程序,及时发现和把握新技术带来的机遇。挑战更在于创新,以过去做不到的方式来从事法律业务。[20]P22-23
(三)审判方式的改变
法律解析可以实现自动的法律推理和法律论证,因而为智能审判提供强有力的技术支持。法官审理案件要经过处理事实、提出案件问题、寻找法律规范、分析案件的事实构成、建构大前提、涵摄和作出结论这些步骤。[22]P35人工智能与法律研究者创建了一些新的法律应用程序,这些法律应用程序能完成许多传统上只能由法律人完成的智能任务。智能审判是法律应用程序在司法裁判领域的应用。我国智能审判的研发起步晚,但进展神速。智能审判系统如雨后春笋般涌现,包括北京法院的大数据研究平台,河北法院的“智审”系统,天津市第一中院的新一代法院工作平台,上海法院的智能辅助办案系统,以及杭州互联网法院的诉讼平台等等。杭州互联网法院打造的“杭州互联网法院诉讼平台”是一个典型的智能审判系统,该系统已实现起诉、调解、立案、举证、质证、开庭、判决等全程在线,当事人足不出户便可完成诉讼全部过程。该系统利用法律文本解析等信息技术实现了诉状智能生成、在线举证、在线质证、在线调解、电子送达、庭审语音自动转换、网络庭审围观、智能裁判文书生成和类案推送等功能。
上海市高级人民法院2017年研发的“上海刑事案件智能辅助办案系统”、“上海民商事案件智能辅助办案系统”和“上海行政案件智能辅助办案系统”是典型的智能审判应用程序。法律文本解析是这些智能辅助办案系统运用的核心技术。研发智能辅助办案系统的基础工作是建立法律文本语料库。就刑事案件智能辅助办案系统而言,法律文本语料库包括证据标准、刑事案例、法律法规、法律文书、办案业务文件、电子卷宗、审理报告等语料。这些语料需要法律专家进行文本分类,比如证据语料就要按照法定的八大证据种类进行分类,盗窃案例按照证据数量和种类的不同可以分为当场抓获型、重要线索型和网络犯罪型三种。这些法律文本语料是非结构化的数据,只有注释后才能成为法律应用程序能够识别的数据。注释需要花费法律专家大量时间,但这是一个过渡阶段,人工智能的学习有一个过程,法律专家前期的注释是为机器学习提供样例,当积累到一定程度后,机器学习就可以自动识别,从而大大减轻法律专家的工作量。[23]注释的目的是标记出法律文本语料库中的术语类型、提及类型、表述类型和句子层次类型。注释好的法律文本语料库建成后,下一步是由技术人员建立模型算法。模型算法自动从法律文本语料库中识别并提取与法律推理和法律论证相关的信息,从而实现智能审判。法官办案时,辅助办案系统自动识别电子卷宗,根据法律文本语料库自动提取电子卷宗的当事人、诉讼请求、争议焦点、事实理由、控辩主张等信息,并对法律文本内容进行解析,以帮助审判人员进行关键信息的归纳梳理及汇集分析。智能辅助办案系统运用论证检索、认知计算、法律解析等技术实现对起诉状、答辩状、庭审笔录等卷宗信息的智能解析和信息提取,提取各类卷宗材料文书所需的核心信息,然后自动生成判决、裁定等法律文书。
智能审判将司法实践带入一个人机协作的时代。智能审判通过数据驱动获取法律知识,它们获取法律知识快速、准确、全面、系统。智能审判系统在推进案件简繁分流,提高审判效率,辅助法官归纳争议焦点、采信证据、认定事实、适用法律、公正裁判等方面发挥了重要的作用。[23]智能审判系统有助于解决我国司法实践中案多人少的问题,有助于提升法官的司法能力和水平,有助于增强人民群众对司法公正的获得感。智能审判系统是人工智能,充分证明了人类的理性能力。但它们仅仅起到辅助性作用,它们只是辅助法官办案,不是替代法官办案。法官借助智能审判系统进行法律判断、法律推理和法律论证,而不是完全交给系统来办案。智能审判系统也有自身的许多局限,它们解决不了疑难的法律问题,法律的歧义、法律的模糊性、法律自身的矛盾、法律漏洞、法律与道德、情理的冲突等问题需要法律人依靠解释技艺、道德、习惯、正义观念和同情心等因素创造性地解决。智能审判系统具有人类的理性,但不具有人类的心性和灵性。它们只是法律人的辅助工具。
智能审判的一大挑战在于如何确保司法的独立性和公正性。司法的独立性和公正性要求法官不受意识形态、领导意志、个人偏见等非法律因素的干扰,不偏不倚、客观中立地做出裁判。虽然智能审判系统仅仅辅助法官判案,但法官最终的法律判断和司法裁决难免受其提供的结论的影响。因此,智能审判系统自身的公正就显得尤为重要。法律文本解析技术支持的智能审判系统是由各种各样的算法组成的,因此,智能审判的实质是算法的审判,如何避免算法的暴政和黑箱操作是智能审判面临的一个新问题。算法设计的不公会导致智能审判的不公。法律专家和技术专家设计算法时必须将平等、自由、人权、秩序、正义等价值考虑进去,避免算法带来的歧视和不公。智能审判也有可能被怀疑为黑箱操作,保持算法的公开和透明是消除当事人和公众疑虑的必然条件。有论者指出,“杭州互联网法院诉讼平台”就是在阿里巴巴公司的技术帮助下建立起来的。在技术便利,降低成本的同时,至少也会带来一些问题。法院的审判信息包括当事人的证据信息,理论上存在会被阿里巴巴监控或不当操作从而影响公正司法的可能性。[24]而且杭州互联网法院审理的大量案件都与阿里巴巴有利害关系,法院的网上诉讼平台又依赖这家公司的技术,技术的透明和中立是非常重要的,否则很难让公众相信法院判决的独立与公正。
结语
论证检索和认知计算是法律人工智能的新典范,法律解析是论证检索和认知计算依托的人工智能技术。论证检索、认知计算、法律解析与法律推理的计算模型相结合产生的法律应用程序是法律人工智能产品。法律应用程序的智能化程度相当高,它们可以自动地表示法律知识、提取法律信息、挖掘与论证相关的信息,从而帮助人类用户完成概念法律信息检索、法律预测、法律推理和法律论证的任务。论证检索、认知计算、法律解析等新技术的迅速发展深刻地改变了法律知识的生产方式,同时催生了新型的法律服务机构和法律职业。
新型的法律职业的出现和法律人工作方式的转变要求法律人才具备不同以往的法律技能,进而要求法学院改革法律人才培养模式。在人工智能时代,一批新型法律服务机构应时代而生。国际会计师事务所、大型法律出版商、法律流程外包商、商业街零售商、在线法律服务提供商、法律管理咨询公司等机构进军法律服务市场。新型法律服务机构呼唤新型法律职业人才。法律技术专家、法律知识工程师、法律流程分析师、法律项目管理师等新型法律职业人才便应运而生。在人机协作时代,律师、法官、检察官等传统的法律职业者运用认知计算法律应用程序从事法律实践工作也将成为新常态。法律服务市场和法律职业的变化反过来对法律教育提出新的要求。
传统的法律教育在于培养精通法律、具有法律思维并掌握法律方法的法律职业者。未来的法律教育应该在此基础上增加对学生法律技术方面的训练,让他们在学习期间掌握论证检索、认知计算和法律解析等新兴技术的运用,增强法科学生在未来法律服务市场的竞争力。法学院不仅要培养适应未来法律实践的律师、法官和检察官等传统法律职业人才,还要培养面向新型法律服务机构的新型法律职业人才。法律人工智能方兴未艾,这是我国法治发展的重大战略机遇。法学院、司法实务部门和人工智能公司应该通力合作,发挥各自的专业优势,尽快研发出更多具有强大认知计算功能的法律应用程序,实现智慧法院、智慧检察院和智慧律所建设的追赶超越。
注释:
① 布坎南(Buchanan)和黑德里克(Headrick)1970年发表了“关于人工智能和法律推理若干问题的一些考察”一文,该文被认为是法律人工智能领域第一篇文章。见,B. G. Buchanan & T. E. Headrick, “Some Speculation about Artificial Intelligence and Legal Reasoning”, Stanford Law Review (1970), Vol. 23, pp. 40-62.
② Tony Mason v. Jack Daniel Distillery 518 So. 2d 130 (1987) Court of Civil Appeals of Alabama. August 5, 1987.
③ 法律机器公司是一家专注于知识产权诉讼的网络公司。法律机器最初是美国斯坦福大学于2006设立的一个公益项目。该项目由斯坦福大学法学院和计算机科学系共同开发,是知识产权诉讼信息交换项目的子项目。法律机器公司成立于2008年,并于次年推出。“Lex Machina”这个名字是拉丁语,意思是“法律机器”(“law machine”)。法律机器公司于2015年11月被律商联讯公司收购。见法律机器官网的介绍,https://lexmachina.com/what-we-do/how-it-works/.访问日期2022年5月2日。