“弱”法律人工智能研究的逻辑起点
2020-02-21孙培福付卓然
孙培福,付卓然
(山东政法学院,山东 济南 250014)
Alphago在围棋领域的成功产生了极强的舆论影响,“奇点”①“奇点”(Singularity)这个词是由科幻作家弗诺·文奇首先提出的,指的是人工智能发展会经历的一个阶段,当AI的发展达到奇点时,人工智能将会出现爆炸式的增长,并且将在事实上取代人类在智力领域的地位。已至的言论在国内也开始流传。一时之间,各种与人工智能交叉的研究方向,如雨后春笋般层出不穷,其中自然也不乏来自法律人的活跃表现。在中国知网中搜索“法”加“人工智能”的关键词,便可以看出2016年前后,相关论文的数量差别极大。在2016年之前总共也只有几十篇相关论文,在这之后,仅2017年便有近300篇的论文发表。这前后的冷热反差正昭示了对于当下的国内法学界而言,“人工智能与法”是一个逐渐兴起且热度很高的前沿研究领域。
但应当明确的是,在“人工智能与法”这个新兴且蓬勃发展的交叉领域,存在着两个截然不同的分支。其一,是人工智能法学,内容以人工智能引发的法律变化为主,比如人工智能立法、人工智能产品侵权等,整体研究基于法学理论层面,并可以引入哲学、逻辑学、伦理学的相关理论进行补充;其二,则是法律人工智能,内容以人工智能进入法律领域的实际应用为主,具体而言是人工智能对原本法律领域内的功能角色进行辅助、增强甚至替代,比如智能咨询律师,其研究内容有极强的技术色彩,与传统的法学领域研究差别极大。有些学者会持不同意见,认为法律人完全可以不去理会法律人工智能的应用原理问题,因为该问题完全可以交由人工智能学者去完成,而法律人只需要对现象进行观察,继而做出评判式的研究即可。这种理念在传统的法学研究中是合理的,法律人通常不需要去钻研非法律领域的知识,只需要立足于法学领域本身,便足以应对各种跨领域的法律挑战。比如法律人面对医疗纠纷时,哪怕自身不具有医学专业知识,只要征询专业的医学意见,就可以通过这意见做出基于法律的准确评判。同样的研究逻辑也可以应用于人工智能领域,在2018年美国亚利桑那州发生的“自动驾驶汽车撞人事件”中,法律人就是从传统的侵权责任理论出发,进一步展开各种学理上的探讨。[1]而在这过程中,并没有对无人驾驶系统的算法构成进行深入研究。所以,得出法律人无需对别类专业领域进行深入探究的结论,在一般的法律语境中显然是正确的。
但是,法律人工智能并不是法学领域以外的存在。它是一个尚未发展成熟,就已经对法律既有存在形式与逻辑产生挑战的事物。[1]大部分的非法学领域(包括人工智能领域)与法学领域是没有专业知识层面的交集。它们与法学产生联系的根本原因在于,这些专业领域都处于或将要处于相关法律的规制之下。但是法律人工智能是不同的,它是嵌套在法律领域内部的,会演变成为法律领域的一部分,比如司法辅助审判系统之于刑事审判。甚至其本身的构成也天然带有着法律的部分——一个通过学习法律数据库,应用适合法律问题的算法而存在的“专门的人工智能”,将它定义为完全的另一个领域的事物是不可取的。法律人可以不去关注有关无人驾驶汽车的人工智能技术,但是不能放弃对于法律人工智能的技术研究。现如今学界将视角集中在了人工智能法学的方向,而却明显忽略了对于法律人工智能的研究。而实现法律人工智能技术的发展与成熟,才是保证“人工智能与法”的研究领域具有长久的生命力,以及存在价值的关键。因此,有必要梳理人工智能的基本理论,并进一步探讨法律人工智能的研究逻辑,为相关研究确定立足点。
一、人工智能的发展与“弱智能”产生
若要追溯人工智能的源起,就不得不提到艾伦·图灵。他在1950年发表的著名文章《计算机器与智能》中[3],提出了“图灵测试”①即一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。的概念。他认为“机器能够在纯智能领域与人类竞争”。②参考《计算机器与智能》(Computing machinery and intelligence),MIND(1950).而对于当时正在兴起中的“认知主义”学派而言,图灵的学说给他们提供了重要的理论工具。在20世纪的四五十年代,正是“认知主义革命”全面展开的时间。这场源自心理学的一场变革活动,本意是通过新的研究范式来探究人类的心智内部构造和心理变化过程,却意外地推动了人工智能的发展。在1956年的达特茅斯会议,③参见《达特茅斯会议:人工智能的缘起》,载“搜狐网”https://www.sohu.com/a/63215019_119556,最后访问日期 2020 年 8 月 20 日。以约翰·麦卡锡、马文·明斯基、克劳德·香农、艾伦·纽厄尔、赫伯特·西蒙等人为首的认知科学家通过足足两个月的时间讨论着机器模仿和学习人类智能的相关议题,并在最后用“人工智能”(Artificial Intelligence)④该名称由麦卡锡提议,并最终被众人认可,这也是他被称为“人工智能之父”的原因之一。这个全新并带着挑衅色彩的词汇,对相关会议内容做出了概括性表述。人工智能的概念得以确立,于是这一年被后来人称为“人工智能元年”。而同样在1956年,第一个人工智能程序“逻辑理论家”由认知心理学家纽厄尔、赫伯特·西蒙等人合作编制成功。正如其名字所表明的那样,“逻辑理论家”在逻辑领域展现了令人惊艳的能力,它不仅成功证明了罗素的18个关键的命题逻辑定理,甚至更进一步,对其中某一定理的证明过程进行了改写,使证明变得更为恰当且有效。[4]
“逻辑理论家”的成功对于“符号主义”的人工智能学派是一种有力的鼓舞,这些“符号主义”的人工智能学者倾向于将现实世界的概念、知识用物理符号进行表征,其理论来源自笛卡尔的哲学思想,即“所有的理解都是形式化的并可以使用恰当的符号表征”,⑥笛卡尔认为这些表征是由原始理念和要素实体所构成的复杂描述。而通过将这些表征用一些规则连接,构成一个立体的形式化的表征结构,则成了“符号主义”人工智能的基本技术路径。而这一理念通过“知识图谱”的技术得以实现。事实上这一流派与心理学、逻辑学、哲学等人文社科领域有密切的联系。符号主义者试图通过知识表征来复刻人类的心智体(一种哲学概念,用以描述了人类的意识存在形式)。[6]
在很长的一段时间内,“符号主义”几乎成了人工智能领域的正统学说。直到20世纪七八十年代,“符号主义”在难以克服的困境面前不复往日荣光——机器无法去表征常识(常识并不是单纯的知识,更类似于人类理解某些知识所需要那类先验化的意识规则)。[4]最后,符号主义者试图将数以万计的人类常识分别予以表征,然后向计算机灌输这些知识,然而受限于硬件等因素这种常识的灌输很大程度上会超越计算机自身的计算能力。此外,上下文问题⑤上下文,即语境、语意,是语言学科(语言学、社会语言学、篇章分析、语用学、符号学等)的概念。更是其难以跨越的高山。举个例子:“小明看到一只猫趴在玫瑰花丛旁边,它很漂亮。”而其中的“它”对于机器来说,就是一个很难理解的对象,“它”是指猫还是玫瑰?
基于“符号主义”的高开低走,约翰·豪奇兰德给予了“符号主义”一个称谓——Good Old-Fashioned AI(简称GOFAI),也就是所谓的“老旧的”但是“有效的”人工智能。这一称谓带有很明显的“退化的研究纲领”色彩——因美好的愿景而开始,被特化难以推广的成功个例而激励,又因某些难以克服的冲突而被新的纲领淘汰。
而与GOFAI相对应的一个概念则是“新式AI”(NFAI,New-Fashion AI),但是这个称谓也只是为了与GOFAI进行区分罢了。因为NFAI中占据主流的联结主义,并不是真正意义上的“新”理念。早在五六十年代,联结主义①1955年,美国西部计算机联合大会在洛杉矶召开,会中还套了个“学习机讨论会”。讨论会的参加者中有两个人参加了第二年的达特茅斯会议,他们是塞弗里奇和纽厄尔,塞弗里奇发表了一篇模式识别的文章,而纽厄尔则探讨了计算机下棋,他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨,他最后总结时说:“(一派人)企图模拟神经系统,而纽厄尔则企图模拟心智……但殊途同归。”这里的两派,便是“符号主义”和“联结主义”的雏形。就已经有所发展,只不过在如日中天的“符号主义”面前难以展现其价值。而联结主义,或者说是人工神经网络理论,是随着分布式并行处理(PDP,Parallel Distributed Processing)的潮流,而在八十年代重新回到人们的视野中。如果说,“符号主义”是以哲学和逻辑学这类传统的人文社会科学作为其前进的旗帜,那么支撑人工神经网络的理论根基正是在当时日益蓬勃的神经科学,而其运行理论更是基于纯粹的数学和统计学范畴。
人工神经网络(Artifical Neural Network,ANN),即通过仿生研究,用计算机模拟人类的脑神经网络,从而实现类人智能。具体来说,就是将微小且数目众多的单个神经元相联结,形成具有强大计算能力的神经网络。并且神经网络可以有多个层级,各个层级之间也是相互联系的。它们的运行方式与“符号主义”差别很大,用分布式并行处理模式替代了串行计算,正向/反向传播算法替换了线性的控制指令,概率和统计替代了逻辑。最为重要的是,人工神经网络是动态的,它可以从随机的输入开始运行程序,在过程中通过机器学习,来调整不同层级网络之间的联结权重,并且可以利用监督学习不断修正输入输出过程中的误差,进而持续实现自我完善。而GOFAI则是一个精密却静态的程序,严格按照既定设定运行着整个程序,一旦运行中丢失某些节点或是发生意料之外的错误,就会面临程序崩溃的悲惨结局。
但是,据此而认为人工神经网络完全优于GOFAI则是武断的,尽管它具有很多优点,但同时也具有显而易见的缺陷。由于整个神经网络的运行计算是建立在统计学、概率论框架之上的,这就导致它无法像GOFAI那样,依据严密精准的逻辑路径得到精准的输出内容。举个例子:如果询问机器1+1等于几?那么GOFAI会告诉你等于“2”;而人工神经网络则会告诉你大概率等于“2”。[4]换言之,人工神经网络输出内容通常是一种概率的描述,而不是准确结果。并且,尽管神经网络企图通过模仿人脑的神经系统,来实现人工智能。但事实上,神经网络与人脑神经系统,完全是不同的东西,甚至在某些构造上是截然相反的(比如,人脑的神经节点是固定的单方向传播,但是人工神经网络节点却往往是多向传播)。最关键的是,人工神经网络始终面临着计算能力的桎梏。这并非硬件层面的因素,而是因为基于旧理论难以构造足够复杂的人工神经网络,而神经网络的复杂程度与层级数量又决定了其“智能”上限。但是,随着“深度学习”(Deep Learning)的横空出世,人工神经网络却成了“元年”以来,最有应用价值的技术。
“深度学习”是自“机器学习”理论中发展出来的,建立在人工神经网络(人工神经网络的一大特性就是可以进行“机器学习”)的基础之上,可以通过进行知识表征,将初始的低级特征不断抽象为更高级的表征。相比于人为构建的表征,机器通过大数据获得的表征具有更丰富的特性,其本身是一个动态的过程。②可以通过例子来进一步说明:存在“深度学习”机A,建立最先的表征“猫”,然后输入大量白猫的照片进行学习,并得到输出结果为“猫”。然后输入大量黑猫的照片进行学习,同样得到输出结果为“猫”。最后会出现的结果是,你将一张花猫的照片输入A中进行识别,A会告诉你,这是猫。很明显,A通过深度学习,掌握了猫的特征,并且知道“是否是猫与颜色无关”。并且,“深度学习”使得神经网络的层级数量突破原有的限制,大大延伸了神经网络的“深度”③输入神经元到输出神经元的最大距离。,从而让神经网络具有了更高的“智能”上限。尽管“深度学习”对于知识表征④在神经网络中的知识表征,技术上表现为很多人耳熟能详的知识图谱。同样很倚重,因此会造成一定的混淆,使人认为“符号主义”与人工神经网络有所结合。事实上,两者的表征是不同的,GOFAI是集中式的表征,每一个单独物理符号表征一个单独的概念,但是人工神经网络却可以实现分布式表征,将一个概念分布式表征在数量庞大的神经元中。而这个概念是否会在输出中出现,要仰仗与之相关的神经元被激活的数量,神经元数量越多,则关联性越强,算法权重也随之上升,概念最终被输出的概率也就会上升。这也是为何需要强调人工神经网络的统计学特征,因为从技术原理上来说,精确的自分析、自推理就不是该类人工智能所能具备的特质。人工神经网络的特质,是基于数据库进行大样本的训练学习,进而完成特征提取和规则构建,最后进行统计学意义上的概率分析。而这往往会成为研究者对于法律人工智能进行分析时的混淆点。
而在“符号主义”和“人工神经网络”之外,还有人类行为主义理论(控制论)。该理论基于“具身智能”①具身智能理论认为智能不仅仅是大脑的智能也是身体的智能,其形成和发展与身体、环境联系密切。的理论,主要研究方向在运动感知、情境机器人等领域。但是该理论在现阶段与法律人工智能的关联性不大,主要成就也体现在工业领域的低级智能机器人,所以不做过多阐述。
总之,无论“符号主义”、“联结主义”还是“人类行为主义”,它们都有着相同的目标:在计算机上构建真正的人类智能。而这类具有完全人类思维能力的智能机器,可以称之为“强人工智能”(Strong-AI)。[7]该称谓最早由约翰·西尔勒提出,用以代指“拥有人类思维的智能机器”。②西尔勒本人是站在否认人工智能能够拥有人类思维的立场,创造了强弱人工智能的概念。而与之相对应的“弱人工智能”(Weak-AI),则是不具有真正人类思维,但却可以有类人的行为能力的智能机器。不过,在国内“强人工智能”经常与“通用人工智能”(AGI)产生概念混淆。这其中很大一部分原因需要归咎于翻译,很多未学过系统理论的译者,将AGI直接翻译为“强人工智能”。然而它们是截然不同的概念,“通用人工智能”是可以胜任所有领域内工作的AI,这点区别于所谓的“专家系统”。AGI注重的是人工智能的应用广度,而“强人工智能”关注的是机器的思维强度。[8]
纵观人工智能的发展过程,那些形形色色的理论都无法创造出“强人工智能”,而仅能构造“弱人工智能”;也无法有效模拟人类的全局性思维来制造“通用人工智能”,只能制造以专家系统的模式存在的“专门的人工智能”。因此,现阶段具有实用性的人工智能,就是以“专门人工智能+弱人工智能”的形式存在的。所以,“弱人工智能”就是当下乃至未来一段时间内,人类在人工智能领域的极限。而被人工智能学者、未来学者所期待的“短期内的指数级技术增长”,根本是缺乏理论依据与严谨逻辑的。毕竟,关于人工智能的理论研究已经持续了近七十年,其研究历程的漫长性、曲折性,③人工智能理论经历过两次“寒冬时期”,最近的“深度学习”浪潮,是理论发展历程中第三次复兴。都是人类研究中极为少见的,基本可以排除短期内技术爆炸的可能性——至少在当前不具有这种征兆。同理,在学科交叉领域中去进行的基于“强人工智能”的理论研究,也在一定程度上超脱了理论所允许的前沿性,因而更似一种浪漫主义的科幻设想。尽管“弱人工智能”并非人工智能理论追求的方向,但是人工智能理论的前进方向似乎从未指向“强人工智能”。人工智能从诞生起就是“弱智能”,纵使它没有人类思维的广度,也没有人类思维的强度,但是并不意味着它没有辅助增强人类的价值。而这也是法律人工智能被重视的原因所在。
二、“弱”法律人工智能的技术实质
法律人工智能作为人工智能对法律领域的赋能产物,其通常是以“专家系统”的形式存在,其运行程序只能对法律领域的事务进行服务,本质上是“弱人工智能”。其发展始于20世纪50年代末,梅尔发表了《法律世界的自动化理论》,初步探讨了法律与新兴技术结合的可能性。但是该领域的标志性开端,却是20世纪70年代,布坎南和海德利克发表了《关于人工智能和法律推理若干问题的考察》。[9]而约翰·麦卡锡研制出的TAXMAN是第一个真正意义上的法律人工智能,其专注于美国企业税法的相关法律推理。[10]70年代盛行的是“符号主义”,所以在TAXMAN的程序中充斥着大量的知识符号并辅以规则联结。该程序对于法律的推理论证所使用的是基于传统演绎推理的线性论证模型,这符合当时人工智能学者对于法律的整体认知:法律有清晰的结构和证成的标准,适合模型化构建。因此,研究人员更关注于逻辑论证问题,希望在符号表征系统中,建立一个真正符合法律特质的逻辑推理模型。但是这一尝试只在成文法上有所突破,用严密的规则建构的逻辑模型却在案例法面前遭遇了挫折。在案例法的情境中,人为进行知识表征变得格外复杂,于是学者们转变思路尝试通过建立数据库进行类比推理的方式,终于有所突破。但是让局面变得无比尴尬的原因在于,这两种模型难以兼容,尽管有些关于混合系统的尝试,但是最终结局是研究者无法建立一个涵盖整个法律领域的法律论证推理模型。[11]
“符号主义”在法律人工智能上的失败,部分可以归结为与生俱来的“原罪”——无法解决常识的知识表征难题,但也可归责于因专注构建法律论证模型而导致陷入一种不断自圆其说的境地。直到现在,相关理论界依然不乏利用新的逻辑命题形式,来企图克服人工智能在法律推理论证方面的难题。但是,所有这种企图——用写入机器的符号化、数字化的逻辑命题,实现对自然逻辑的完美替代,都难以取得决定性的成功。[12]尽管失败的原因是由于现有的法律论证模型无法应对法律推理中的复杂变量,但其根本症结在于计算机不能真正拥有人类的认知与思维,因此自然不能够真正像人类一样去进行法律推理。人类法律工作者在面对各种意外因素以及法律本身的不确定性时,可以基于人的朴素认知造就出来的自然逻辑,去推理出一个符合当前情境的最优解。但是应用现代人造逻辑的计算机却做不到,当不确定因素产生严重干扰时,只会导致人工智能宕机,相关程序“闪电崩溃”。[13]因此,就目前来看,试图建立一个完美的证明推理模型,来构建具有专业普适性的法律人工智能,其前景并不明朗。尽管相关理论建模可以取得特定的成功,但是终究难以突破“弱人工智能”的上限。因此,一个“悖论”产生:想要使人工智能可以像人类一样完美解决法律问题,就需要它具有起码的人类思维能力,这意味着机器具有“强智能”。但是,现有理论只能达到“弱智能”的初级阶段,试图应用“弱智能”阶段的理论去完成“强智能”的类人思维,无疑是矛盾的。况且,强弱人工智能之间本就不存在直接的理论递进联系。换言之,现今的“弱智能”理论未必可以直达“强智能”,“强人工智能”与“弱人工智能”之间的不同,是根本性的。[14]
但是,智能律师ROSS、上海“刑事206系统”[15]等国内外较为成功法律人工智能的出现,展现出了另一条路径。它们都是以人工神经网络为基础的“深度学习”人工智能,相较于“符号主义”,神经网络巧妙地绕开了直接复现人类思维的障碍。它用分布式的概念表示,基于大数据的特征学习和统计学的算法构造,使法律人工智能可以通过统计学的逻辑进行推理,避免了用机器智能模拟人类思维逻辑方式所面临的悖论,从而可以实现“弱人工智能”层次的应用成功。所以,在技术实质上来说,如今所见的种种法律人工智能就是“深度学习”式人工神经网络。
三、“弱”法律人工智能的内涵
现如今,法律人对于法律人工智能的认知,存在着很多混淆,比如将区块链、大数据、云计算等概念归入人工智能的情形。尽管现行的人工智能技术与大数据、云计算、计算机网络等技术内容联系密切,人工智能的计算能力与学习能力都需要来自最先进的计算机技术的支持。但是这并不意味着它们就是一类事物。人工智能是由认知科学、计算机科学、哲学、心理学、脑神经学等多学科混合的产物,而并非是单纯的计算机信息技术的产物。秉持着这种混淆认知来进行法律人工智能的研究,显然是存在着很大瑕疵的。所以,界定法律人工智能的内涵需要区分混淆点,并在此基础上梳理其基本特征。
(一)区分法律人工智能与计算机新技术
人工智能的发展是与计算机的发展息息相关的,并且人工智能的每一步突破往往离不开计算机技术的进步。云计算、区块链、大数据、虚拟现实、人工智能等新技术的发展都需要依托于计算机。但是这并不意味着,它们可以实现宏观上的统一。尤其是人工智能,它和其余的计算机新技术有截然不同的定位。
美国学者恩格尔巴特曾提出过一个“智能增强”(IntelligenceAugmentation)的概念,[16]认为应当用计算机去辅助增强人的智能,正是在这种理念的推动下,促进了诸如互联网、人机交互系统等计算机领域的典型技术成果的诞生。[17]简而言之,那些带有计算机和互联网色彩的技术概念,可以统统被认定为IA(智能增强)。智能增强和人工智能在概念内涵上去考量,甚至是完全相悖的。IA是纯粹的计算机技术产物,其诞生目的就是服务人类。尽管当前“弱人工智能”的现状也决定了其只能扮演辅助工具的角色,但是在人工智能理论内涵中,天然带着对人类智能的挑战色彩。虽然随着计算机技术的发展,人工智能和智能增强之间的技术边界正在模糊,但是这不意味着可以放任这种混淆,而不做明确区分。两个截然不同的技术分类,其研究逻辑与定位,也是必然不同的。况且,针对法律人工智能的研究,最后却聚焦于计算机网络技术的领域,通篇都是虚拟现实、区块链、即时网络庭审等技术,无疑是有些滑稽。
但是,存在着比较特殊的情况,法律人工智能和两种计算机新技术存在伴生关系,那就是大数据和云计算。大数据[18]指的是一种用传统技术手段无法处理的海量数据集,数据集内的数据内容不仅是庞杂的,而且是有价值的。通过新技术的处理模式可以实现对于大数据的分析、提取,使其成了具有多样化价值的信息资产。其技术核心不在于数据规模,而在于数据挖掘。而使大数据的搜集与处理成为可能的就是云计算以及它的劣化版“雾计算”。因为云计算的出现,使得物联网成为可能,成千上万的机器设备、云端服务器互相联结,彼此之间传输数据信息,这使得大数据搜集具有了稳定的途径。而神经网络式的人工智能,正是在这海量的数据库提供的丰富样本种,才能实现“深度学习”。正是由于人工神经网络对于云计算和大数据的依赖,才用伴生关系去形容三者之间的联系。因此,对于人工智能的讨论往往绕不开大数据、云计算,但是这不意味着“人工智能=大数据+云计算”。三者之间的联系是建立在数据的收集过程中,云计算推动大数据的建立,大数据供人工智能进行学习。人工智能处于整条数据处理链条的终端,享受着前两者的数据成果。所以,大数据和云计算并非与人工智能的附庸技术,反而是现阶段的人工智能利用它们达成运行的前置条件。由于云计算与人工智能没有直接的技术联系,因此实践中需要注意的是人工智能与大数据的关系。以法律人工智能的视角出发,应当将大数据技术视为人工智能的辅助工具,而非将二者并列,混为一谈。
(二)“弱”法律人工智能的根本特征
在对相关概念明确区分的前提下,可以进一步阐述法律人工智能的根本特征和研究逻辑前提。
首先是“弱智能”。这是当前研究法律人工智能最重要的特征,法律人工智能本身属于技术赋能产物,是一种应用研究。既然如此,就不宜脱离其现实技术的根基,对于它的相关讨论应当基于“弱智能”。“弱智能”在此的内涵,不仅是指“弱人工智能”的概念,还包括“专门人工智能”的概念,是对当前人工智能整体的技术现状的概括式称谓。人工智能在当下就是一种低级的智能,甚至可以说是“虚假”的智能。
其次是辅助工具定位。将法律人工智能置于“弱智能”的角度去认知便会发现,其当前的本质特征就是对人辅助与增强,而非对法律领域功能角色的全面替代。换言之,要将法律人工智能准确定位成辅助工具,而不是一个所谓的“具有法律上独立主体地位”的智能机器。通过构建法律论证推理模型,试图以计算机代替法官,构建所谓“自动贩售机”式[19]的机器人法官的行为,已经被证明难以通过现有的理论来实现。而如“上海刑事206”司法辅助系统的成功问世,证明了辅助工具型的法律人工智能在实践中具有的实际价值。所以,进行辅助式的法律人工智能研究,探寻人机合作式的法律实务模式,才是符合法律人工智能在现阶段辅助增强定位的研究逻辑。
至此,“弱”法律人工智能的内涵已经显而易见了。那就是,处于“弱智能”的人工神经网络,通过大数据进行“深度学习”,以现代计算机技术提供的强大计算能力提取相关特征,建构知识表征框架,进而以概率可能性的内在逻辑表达,去解决实际的法律问题。这既是法律人工智能的准确内涵,也是进行相关研究的逻辑前提。
四、研究“弱”法律人工智能的思路
(一)立足于技术特征
当前的法律人工智能就是“深度学习”与人工神经网络技术的具体应用。其算法本质就是统计与概率,不存在真正意义上的人类逻辑思维。所以法律人在谈论法律人工智能时,往往会出现的思维误区,就是将其对标人类的思维,殊不知这正是混淆了基本的技术特征。人工神经网络本就不是一个模仿人类思维逻辑的造物,通过该技术路径不能构建具有逻辑思维能力的智能机器,因此也无须在理论的短板处过度批判。因此,对于法律人工智能的相关应用研究,应当建立在具体的技术特征上。具体而言,人工神经网络更适合在信息检索相关的功能上解放人类的脑力,比如类案检索系统、法律咨询律师等。在这些功能模块中,法律人工智能可以充分利用大数据进行学习,凭借自身的计算能力,以超越人脑的信息检索效率,对历史信息进行特征提取,最后对比得出一个概率最优解。而对于需要分析决策的功能部分,诸如判决偏离预警、自动量刑等,法律人工智能会发展较为艰难。因为,如自然语义识别、证据信息结构化表征等较为难以攻克的问题,大多集中在需要决策分析的法律人工智能功能模块中。所以,法律人在法律人工智能的研究中,不应陷入对于技术路径固有缺陷的过度批判之中,而应该着眼于优势技术与法律实践的有机结合。
(二)统计学知识的辅助
由于,法律人工智能对于统计学知识的倚重,要想有效开展相关研究,需要进行专业统计学知识的学习。但是,当前法学界中的大多数人没有经历专业的统计学、高等数学的学习。凭借传统法学的知识体系,的确难以有效开展法律人工智能的技术研究。在这一点上,我国已经与欧美学界拉开了差距。在国外,由于法律实证主义的盛行,使得学者们通过统计学的相关学习来提升实证能力的情况非常普遍。受益于此,国外学者可以通过统计学工具,以实证模型的形式来论述理论观点,研究先进算法与法律之间的关系。相较而言,国内学者在实证主义法学方向也多有尝试,但是理论证成效果却相对一般。这与研究范式的落后,以及专业的统计学知识的匮乏有直接关系。因此,引入数学、统计学工具,对于法律人工智能的研究来说,是至关重要的。令人觉得比较欣慰的是,自2018年开始,以清华大学、四川大学为首的几所国内顶尖高校,已经陆续开始就“计算法学”,创立相关专业或开设相关课程。国内的法律学者游刃有余展开法律人工智能应用研究的时刻,应当不再遥远。