APP下载

人工智能视域下计算法学的概念、探究及趋势

2023-06-18张瑞祥赵志枭

图书与情报 2023年1期
关键词:人工智能算法

张瑞祥 赵志枭

摘   要:人工智能、大数据不仅重塑人类生活,也在重塑学术研究。当前,计算社会科学、计算人文以至“计算X”正在如火如荼展开,计算法学由此应运而生。由于法学具有较强的实践性,与计算相遇、相融的时间较早,在经历了计量法学、法律信息学等发展阶段后,学术界往来反复地辩难,计算法学的相关概念逐渐被厘清,近年终于以计算法学学科的创立迎来重大突破。当计算法学不再需要通过不断为自己正名而具有学科支撑后,学界也将更加关注其实践的有效性。为了呈现我国计算法学研究现状,合理预测其发展前景,文章对近年计算法学相关中外论文进行聚类分析,最终揭示计算法学在数据集、算法以及应用等领域的重要成就,并阐释其未来发展趋势。

关键词:计算法学;人工智能;计算人文;算法;数据集

中图分类号:D90   文献标识码:A   DOI:10.11968/tsyqb.1003-6938.2023005

Abstract Artificial intelligence and big data are reshaping not only human life but also academic research. Flourishing disciplines like computational social science, computational humanities, and "computational X" demonstrate this phenomenon. Computational Jurisprudence is also on the rise, as law has a strong practical aspect and has been intersecting with computation for a long time, going through various development stages such as Jurimetrics and Legal Informatics, and undergoing repeated debates in the academic community. The relevant concepts of Computational Jurisprudence have gradually been clarified, and with the establishment of the Computational Jurisprudence discipline in recent years, a major breakthrough has been achieved. With the support of a disciplinary foundation, Computational Jurisprudence no longer needs to constantly justify itself, and the academic community can now focus more on its practical effectiveness. To present the current research status of Computational Jurisprudence in China and predict its future prospects, a clustering analysis of recent domestic and foreign papers on Computational Jurisprudence was conducted. Finally, the important achievements of Computational Jurisprudence in the areas of data sets, algorithms, and applications were revealed, and future development trends were discussed.

Key words computational jurisprudence; artificial intelligence; computational humanities; algorithm; data set

隨着人工智能的不断发展,人类社会与人工智能的联系越来越紧密,法律作为现代人类社会治理的重要基石,其与人工智能的结合已是大势所趋。将人工智能应用到司法实践,可以极大提升法律实施效率,为立法、司法提供参考和决策依据。而在法学研究中,随着人工智能特别是ChatGPT等基于自然语言处理的标志性产品推出,计算法学作为法学与计算跨学科结合的新方向和新方法,受到了进一步的关注。计算法学也得益于计算社会科学与计算人文的长足进步,“计算社会科学”这一名称2009年在《科学》上被系统地提出并作了阐述[1]。在大数据迅猛发展的推动下,数据驱动、第四范式等研究模式在社会科学领域得到广泛而深入地应用。人文学科与计算相遇甚早,但是迈出的脚步却逊于社会科学,近年来,计算在人文学科研究中所扮演的角色越来越重要,主要表现就是“数字人文”崛起。对于以数据驱动、人工智能为突出表现形式的人文社会科学新的研究内容、领域和方法以及体系,黄水清等从问题定义、数据集构建、技术实现、问题求解、结果评价及呈现等五个方面对这一人文社会科学的研究范式进行了概括和总结[2-4]。在社会科学、人文科学与计算相融合的过程中,涌现出了计算人文、计算社会科学、数字人文、人文计算等相对宏观而具有概括性的概念。但根据黄水清对人文社会科学与计算相融合的五个组成部分来看,“计算人文”这一概念在大数据、人工智能与人文研究融合的背景更加合理科学。法学既有人文科学属性也有社会科学属性,因此计算法学一定意义上也可以纳入计算人文的学科体系,如针对法哲学、法律史等问题的计算人文研究,即是计算人文与计算社会科学学科相关性的具体呈现。不过,据分析计算法学[5]目前主要面向法律文档的分析与计量,逐渐形成了包括海量判决书分析、自动化法律推理、裁判文书推荐等独具特色的研究方向[6-7]。

在人工智能蓬勃发展的时代背景下,通过梳理计算法学概念界定的过程,本文梳理了计算法学相关研究,并从数据、算法和具体应用的角度对计算法学所取得的成就进行总结,进而对人工智能视域下的计算法学发展趋势进行初步研判。

1   计算法学何以可能

在法学研究和实践中使用计算方法并非新事物,20世纪40年代,西方计量法学(Jurimetrics)、法律信息学(Legal Informatics)就已经出现,而被称之为学科的“计算法学”(Computational Jurisprudence)则是近十年来学术界才开始讨论的话题,在人工智能、大数据技术兴起和我国“新文科”建设的时代大背景下,传统人文社会科学都将或主动或被动地接受数据化的洗礼,作为社会科学属性尤为显著的法学势必首当其冲。有鉴于此,计算法学在我国也迅速成为研究热点,涌现出了一大批成果,其中《计算法学导论》首先明确提出了计算法学概念[8],并对相关概念、发展史、实践等做了充分论证。尽管有学者非常谨慎地承认计算法学只是一种新的法学研究方法[5],但并未阻挡计算法学快速前进的步伐。

从目前的发展趨势看,我国法学界已经非常积极主动地探究法律实证研究、计算法学等相关问题。而有关计算法学的讨论套用康德式的提法,可以表述为“计算法学何以可能”的问题,核心问题包括计算法学是什么(What)与计算法学如何计算(How)。

(1)计算法学是什么。通常展现为法学与计算机、信息技术相融合的发展史,由最初算法驱动、数据驱动的计量法学逐渐演变为数据驱动、算法驱动与问题驱动相平衡的新兴交叉学科[9]。从学科门类看,计算法学仍然属于实证法学的范畴,与法律实证研究一样都是具有数据计算基础的量化研究,而且“计算法学与法律实证研究在研究对象、研究方法和研究领域上相通,其本质上是实证研究在新材料、新方法兴起后的应用与拓展。”甚至可以说计算法学就是“法律实证研究的衍生或者2.0版本”[10]。当然,计算法学并不是以数据计算取代传统思辨、推理研究,而是借助大数据技术辅助和丰富法学研究和实践。面对人工智能、大数据浪潮,没有人会视而不见,法学界在计算和法学深度交汇融合的时代趋势中,既热情拥抱数据技术之长也冷静思考发展之不足。考虑到我国现实情况,无论是法学研究还是实践都离不开人的参与,但若只有人参与其中,效率和客观性可能都得不到保证,相形之下大数据参与法学研究和实践都更加高效而客观。事实上,我国法学研究和实践也的确具有大数据化倾向,可以说走向计算法学也将是大势所趋[11]。

(2)计算法学如何计算。可以展开为三个问题:主体、对象和制度。首先,计算法学的主体并不仅是从事法学研究和实践的人,法律和技术本身也构成主体。计算法学的主体之一人要具有计算思维和跨学科思维[12],作为融合法学、数学、统计学、计算机科学与技术等跨学科研究,只有思维转变才能推动研究与实践的实质性进步[13]。思维转变的核心还包括承认技术的主体地位,人工智能作为技术引起了学术界有关技术是否有意识、情感的哲学大讨论,这个问题证实和证伪均有难度,但它对人的冲击力乃至造成的危机感却是实在的。因此,我们不妨暂且搁置这一问题,姑且从技术工具论转向技术主体论,在实践中检验完善;其次,计算法学的对象即是数据,不同于常规数据库建设,计算法学所需的数据是动态变化的[10],而且与纯学术研究不同,法律直接关系到国计民生。因此,计算法学数据源建设必然需要政府、研究机构等多方同心同力;最后,计算法学的长足发展还需要顶层设计和制度保障,作为学科进行建设非常有必要,而且计算法学作为学科加快发展建设也是顺大势而为,也有助于我国社会主义事业建设[14]。当计算法学不再需要通过不断为自己正名而具有学科支撑后,学界也将更加关注其实践的有效性。

2   计算法学的发展

融合人工智能和法学的计算法学作为一门涉及多学科知识的综合性交叉学科,其研究不能只看做人工智能与法学两个领域知识的简单堆砌,更重要的是人工智能与法学两个学科的相互融合和促进。从计量法学到计算法学,并不是传统法学研究的落寞,而是计算法学为传统法学研究提供更多的道路和方法[15]。当然计算法学美好广阔的前景不会一帆风顺,其发展历程也不是一蹴而就的,在法学研究和实践中引入计算方法,到最终形成计算法学经历了多个阶段。

鉴于法学的实践维度,面对海量法律文书时人力显得极其渺小,因此当计算机出现后,法学界很快将其引入法律实践。通过计算机建构法律模型辅助法律判案,随着20世纪70年代Buchanan和Headrick有关法律推理模型的可行性探讨,标志着计算法学作为法学学科研究分支的诞生[16]。之后越来越多的法学工作者将计算方法应用到法律实践中,用于提升法律案件处理的效率。而计算方法的大规模应用,确实在短时间内优化了法律实践工作,为司法、执法、辩护提供了行之有效的辅助作用。无论是Deedma和Smith以加拿大法律案件为基础构建的专家断案系统[17],还是Biedermann等使用贝叶斯网络针对火灾事故的法医调查[18-19],亦或是Riesen和Serpen在犯罪数据(NCVS)中引入贝叶斯信念网络(BBN)以促进自动分析的方式向非专家表示复杂的数据集[20],均非常优秀地使用计算方法解决法律问题。

在法律实践具体层面之外,计算也为法学理论研究提供了新方法新思维,法理犹如法哲学是纯思辨性的,但是法理基础一旦成为共识进而成为法律,那么其运作如“依法治国”就要依靠法律进行逻辑推理,而逻辑推理正是计算擅长的领域。在不借助计算以前,法律实践全凭法官、律师个人的博学才智,但是法律实践的规则仍然是依靠法条的逻辑推理。正如史学研究最理想的状态是穷尽史料,法学研究和实践同样如此,因此海量法律文本的数据化和计算分析也逐渐成为法学研究热点。Hamann等引入计算机辅助法律语言学作为一种半自动化方法,通过系统地分析大量法律文本来“理解”法律话语,使用统计算法来分析大量文本满足了律师对经验数据日益增长的需求[21];Giacalone等基于司法判决评估的web数据构建调查系统,旨在通过文本挖掘技术提升法律实施效率,并进一步构建关于事实和判断的智能系统[22],均是借助大数据计算方法辅助法律实践的代表成果。事实上,计算方法不仅促进了法律实践的进步,有研究表明,大数据技术对于处于发展初级阶段的律师事务所亦有着非常重要的积极影响[23]。

人工智能、大数据、云计算等技术对于法律信息化的实施有着极大的推动作用,通过现代计算技术,可以加速推动司法系统的完善,從而支持立法者对相关法律做出调整。与此同时,人工智能的飞速发展带来的法律、伦理道德等影响也成为法学研究的重要内容,对于人工智能的监管规范以及数据获取过程中的信息问题亟待进一步解决完善。在时代的浪潮下,人工智能与法律的融合已是必然,在不断完善法律人工智能体系的同时,法律对于人工智能的约束也应放在重要地位。无论是国内外有关计算法学的学科属性的探讨,还是对计算大数据的法律思考,都指向一个主题,那就是“为计算立法”。在计算法学发展的初期,学界主要关心甚至担心数据化、信息化浪潮对于人类社会的挑战,更希望通过法律约束计算。正是在此时代背景下,20世纪末,周庆山看到社会信息化带来的各种信息矛盾,提出了加强信息法学研究和教育的建议[24];马海群和乔立春则通过对中国信息法律和信息立法研究的历史、现状、主要成果的考察,分析了中国信息法学的研究基础、重点领域和研究缺陷,提出要明确信息法学学科归属,强化信息法学概念认同,以解决综合性现实问题为研究目的[25]。不过,随着人工智能大数据的突飞猛进,尤其是国内学界的认知也从“挑战”演变为“机遇”,从警惕信息化的法律风险转变为建立计算法学学科。国内众多学者[5,11,26-28]均做出了有益的尝试,而曾赟则更进一步,他基于科学研究的“第四种范式”(数据科学)提出了“数据法学”[29]。

可以看到人工智能技术与法学研究的相互影响成就了当前的计算法学,计算法学的相关理论已经获得了法学、人工智能、计算机、数学等领域的广泛认可,这是计算社会科学的重大突破。与此同时,国内的相关研究则呈现出比较奇特的景象:一者国内在计算法学的实践应用上,与国际相比仍然处于较为落后的阶段;二者国内计算法学制度设计的探讨却遥遥领先。这也是由我国实际情况决定的,就学术而言,计算法学需要法学领域和人工智能领域专家的深度合作,只有如此才能真正实现专业化突破;而在我国想要更快实现研究成果转化,改革法律人才培养模式,让计算法学切实改变法律社会的运行模式,为全面依法治国服务,就需要学科体制的支撑。所以当西方法学界更多用力于即时的法律实践研究时,我们则更偏重于计算法学学科体制建设的讨论。

当然,计算法学的发展并不意味着传统法学的落寞,恰恰相反,作为法学研究的分支,计算法学的发展为传统法学开拓了前景,最新的人工智能技术让法学研究能够更加快捷地处理批量的法律数据,从而更好地适应新的时代变化。而这一趋势正随着国内外学术交流相互促进,全球人工智能技术大会特设了“法律人工智能”专题、人工智能与法律国际会议、计算法学国际会议等均以稳定的形式召开。在法律人工智能热潮下,形而上学的冷思考也浮出水面,计算法学及其相关的人工智能法律、伦理道德、人类命运等问题变得日益紧迫。毫无疑问,当前人工智能技术与计算法学仍存在较大局限需要改进:一方面,现有技术仍然无法替代人的思考,仅在重复劳动和知识储备等方面表现突出,在提升计算法学与当前社会兼容性方面的技术需要较大改进;另一方面,法律的主体仍然是人,目前来看,计算法学可以通过数据支持辅助决策,但法律的制定者、执行者仍然是主体性的人。如果说计算法学的加入为法学研究增添了更多理性,那么人的参与就让法学研究兼有理性与感性色彩,而“感性”恰恰是当前人优于人工智能的关键所在。

3   计算法学的数据、算法和应用

2022年底,ChatGPT的横空出世,让人工智能进入了一个新的阶段,随着人工智能的发展,社会各界与人工智能的联系也越来越紧密,法律作为人类社会的伴生物,其与人工智能的结合已是大势所趋。将人工智能应用到司法实践,可以极大提升法律实施效率,为立法者提供立法参考和决策依据。人工智能下的计算法学在法律领域的实践主要包括三个方面:数据集的构建、智能处理算法的研究、计算法学在法学领域的实践应用。

3.1    计算法学的数据集

无论是传统机器学习还是深度学习,数据质量都是影响模型、算法性能的重要因素。法律文本作为专业性较强的规范语言,法律文本数据集的构建往往需要法律专家的参与。在现实研究中,不同研究团队的专业背景和社会资源不同,所以数据集构建方法也有所不同。

在纯手工标注方面,Du等通过人工注释的方法构建了法律领域的第一个中文问答数据集(LawQA),用于评估模型的有效性[30]。Sharafat等基于巴基斯坦法院公开的判决数据,编写法律实体标注指南,构建了用于提取各种法律实体的标注数据集,并使用条件随机场(CRF)在数据集上进行自动命名实体识别[31]。Duan等提出了一个中文司法阅读理解(CJRC)数据集,其中包含大约10000个法律文书和近50000个带答案的问题,其中文书来自裁判文书,问题由法律专家批注,在该数据集上基于BERT和BiDAF构建了两个模型[32]。Ma等构建了中国法律案例检索数据集(LeCaRD),其中包含107个查询案例和超过43,000个候选案例,查询和结果采用中国最高人民法院公布的刑事案例。在相关性定义方面,提出了一系列判断标准,并由法律专家进行相应的候选案例标注[33]。Urchs等基于德国32个法院的748131项判决,构建了两个德语法律文本语料库,第一个语料库为所有判决及其元数据,第二个语料库包含随机抽取的200个判决文本,语料库由法律专家进行人工标注[34]。

人工标注可以获得较为准确的数据集,但也会耗费大量的时间和资源,有一些学者通过半自动化的方式构建数据集。如Boonchom和Soonthornphisaj开发了一种蚁群算法用于自动扩展最初由法律专家创建的种子本体,基于继承法和家庭法两个种子本体,使用最高法院判决作为语料库进行扩展,通过向本体中嵌入权重值,提升了建设系统的性能[35]。Chen等提出了一种半自动化的机器学习框架用于大型数据集的数据增强和质量评估,通过创建小量的初始语料库,使用生成对抗网络(GAN)进行数据生成和增强[36]。

也有学者通过对已有信息进行自动化组织处理,构建无标注数据集,如Dydare和Lampach基于欧盟存续期间向欧洲法院移交案件的整個法院的地理坐标构建了法院地理坐标数据集(GEOCOURT),用于探索跨时间、成员国和法院层级的空间差异和集群效应[37]。Bradford等引入了两个关于全球竞争法制度的数据集——竞争法数据集和比较竞争执法数据集,数据涵盖了1990年-2010年间的竞争法和相关竞争机构数据,提供了较为全面的竞争法图景,为市场监管的法律制度实证研究提供了基础[38]。

数据集构建是人工智能应用于法律的第一步,在大数据时代下,虽然每天产生的数据量非常巨大,但其中大多为非结构化、非专业化的数据,难以应用到法律领域研究。如何将零散的数据结构,形成可供研究使用的高质量规范数据集,是当前人工智能领域需要解决的问题。

3.2    计算法学相关的算法

法律数据集的构建为人工智能技术在法学领域的应用提供了基础,由于法律文本的特殊性,往往需要对当前的技术进行优化,针对不同类型的法律,使用不同的方法,在推动法律智能处理技术发展的过程中,也完善了法律人工智能体系。

有些学者将多个模型进行组合以提升模型性能,如周晓辉提出了一个基于隐式马尔科夫的法律命名实体识别模型,使用多个HMM模型串联对文本进行由浅至深的实体识别,并利用搜索引擎识别并消解同义命名实体,从而完成针对法律文本的命名实体识别过程[39]。韩金波以故意杀人案和继承案为切入点,分析了故意杀人案与继承案在样本集中的差异,发现了继承案样本分布不均匀、样本数量过小的问题,提出一种基于Siamese网络和多核CNN模型相结合的案件判决区间预测模型Siamese-CNN[40]。张虎等分析了法律文书的事实描述和法条的具体司法解释,提出了基于多模型融合的法条推荐方法,将不同参数的CNN或RNN通过概率相加的方式进行融合,以达到模型互补的效果,提高法条推荐的准确性[41]。Pande和Alam基于新西兰就业局(NZERA)数据集,使用LDA结合RNN、CNN和CapsNet模型,首次进行了就业相关的司法案件结果分析和预测,研究发现,基于CapsNet的LDA模型具有最高的准确性和一致性[42]。郑洁等基于BERT模型,将法律知识与案情文本拼接,让模型同时学习法律知识和文本信息的特征,并使用LSTM网络对文本进行分段建模,之后,结合三元组损失和基于对抗的对比损失共同训练模型,提升了相似案例匹配任务的准确率[43]。

也有一部分学者尝试在已有方法的基础上,针对特定领域的法律问题进行改良优化,如杨超群等提出了一个基于法律事实的适用法条推荐模型,选取了刑事诈骗罪和民事离婚纠纷两个案由的裁判文书数据集,使用FastText模型,基于迁移学习方法从预训练的通用词向量出发训练法律词向量,再以此为基础进行文本分类[45]。Vuong等提出了一种新的方法(SM-BERT-CR)用于解决法律案例检索过程中的长文档和相似度匹配问题,并提出一种自动创建大型弱标记数据集的方法,用于解决数据匮乏问题[45]。Juang等提出一种解决法律文章不平衡问题和判决缺失值问题的智能法律文章预测方案,通过向量相似度加权机制解决判决缺失值问题,通过权重共享和迁移学习解决法律文字不平衡问题[46]。Sovrano等基于法律语言在文本结构和单词方面的特殊性,将深度学习的准确性与浅层学习处理少量数据的能力相结合,提出了一种可以在较小数据集上执行较为准确的分类或问答任务的新技术(SyntagmTuner)[47]。

过去几年,基于BERT模型的文本分类和命名实体识别技术受到广泛的关注,ChatGPT的诞生或许会改变自然语言处理的发展方向,让更多人投身到文本生成的研究中,法律判决文本、律师辩护文本的自动生成也存在一定的可能性。但有一点是肯定的,无论技术的发展方向是什么,其最终目的都要回归现实,推动法律人工智能的发展,让人工智能切实解决现实生活中的法律问题。

3.3    计算法学领域的具体应用

相较于针对某一特定任务的法律自然语言处理技术,人工智能在法学领域的实际应用要涉及更多的内容和工作。其中主要包括:原始数据的获取、数据集的构建、算法的选择和优化、功能模块的划分、前端搭建等等。根据实现的功能和目标用户的不同主要可以分为:针对普通人的法律咨询系统和针对专业人士的决策辅助系统。

在法律咨询系统方面,王海亮基于对判决文书的挖掘分析,研究并构建了法律咨询系统,基于Word2Vec词向量技术,提出了一种新型的文本表达形式(World2Vec_GL),系统还根据案件的困难指数,提出了一种新的律师推荐方法,律师推荐、关键词检索、文书统计、文书推荐、信息抽取共同组成了该系统[48]。Seeam等探讨了针对劳动法和就业法的专家答疑系统的构建,该系统基于机器学习技术,通过Web页面为用户提供法律答疑,同时,该系统配备的庞大知识库使其能够自行学习就业法相关知识,可以通过对知识库的及时更新保证系统的时效性[49]。

针对专业人士的辅助系统构建往往需要法律专业人士的参与,Barros等基于监督机器学习方法,通过文本提取、文本分析、数据标注、机器学习的模式,将知识发现应用于司法判决数据库,提供了一个帮助律师以快速、可视化、探索性的方式获取信息的应用程序[50]。Mokanov介绍了Lexum实验团队在法律人工智能方面的优势和成果,Lexum基于CanII数据库中数百万份法律数据及其元数据,结合蒙塔利尔大学算法研究所团队的技术经验,构建了一个用于将事实推理到法律的应用程序(Facts2Law),该程序可以为任何给定的文本预测最相关的法律来源[51]。Fernandes等构建了一个法律判决系统以执行上诉法院修改提取任务,该系统基于法律文本信息提取相关研究,以巴西上诉法院的判决文本为语料库,尝试了多种机器学习和深度学习方法,并使用里约热内卢州上诉法院判例数据库的公开数据构建了Kauane Junior语料库用于训练和评估系统[52]。

人工智能在法律实践方面的未来是非常广阔且潜力巨大的。当然,完备、时效性强的数据和技术是人工智能更好地应用到法律事件中的基础,在当前这个信息和技术快速迭代的时代,系统的构建固然重要,对系统的更新、维护也值得更多关注。我们也需要明白,在人工智能为律师、法官、个人提供便捷、高效服务的同时,伦理、隐私问题也是不可避免的,如何让人工智能戴着“镣铐”起舞,需要从法律和人工智能双重角度进行深入探讨。

4   计算法学的发展趋势

从法律文本智能处理来看,国内研究更加侧重于法律文本分类,国外研究更加侧重于法律文本特征提取。在技术发展方面,国外研究已经开始重视基于少量样本的训练方法,随着研究的不断发展,高质量的可用数据集会愈加匮乏,确实有必要开辟一条新的“数据之路”;在实际应用方面,国内研究更加注重量刑、法律咨询等案件预测相关内容,国外研究对于人工智能辅佐数字取证更感兴趣。总的来说,人工智能技术在法律层面应用即计算法学的进一步发展离不开以下几个方面的支持:

第一,高质量、高标准的法律数据集。这可以说就是计算法学的“语料”,但由于法律既有极强的学理性,法律事件又需要极高的专业素养,因此高质量法律数据集的采集建设就需要法律专业人士和信息资源管理相关研究人员的通力合作。而在法律数据标注层面,可以探索更多半监督、弱监督的数据标注方法或者针对较小量样本的训练模式。借鉴西方经验和我国实际情况,高质量法律数据集建设尤其离不开党和政府的支持,不同于纯理论研究,法律的应用性较强,除了学术研究成果外,法律事件中形成的法律数据就极其庞大,但这些数据各有所属,其中人民法院、检察院的法律数据尤为丰富,这也将是未来计算法学研究的重要素材。而且国内除了有普通法还有“党内法规”[53],也是我党治国理政的重要组成部分,这类数据若没有党和政府的支持,也将很难纳入研究。

第二,在算法层面针对特定法律案例做出改进优化。人工智能ChatGPT掀起了生成式语言模型的热潮,让我们看到人工智能超乎想象的理解力和创造力,这样的应用也为法律文本的自动生成技术提供了更加广阔的前景。现代法律在我国的研究和实践时间还比较短,尤其是普通民众对于法律的认知度、认可度还不够,虽然经历了数十年的普法宣傳教育,但民众真正需要法律支持的成本依然较高,这也客观上阻碍了民众对于法律的热情,极不利于“全面依法治国”的推行。可以预见,法律自动生成语言模型建设将极大降低民众法律学习实践的成本,也将极大降低司法、执法成本。

第三,将理论与实际结合,实践是检验真理的唯一标准,将法律智能化相关技术应用到现实生产生活中,通过在现实环境中的表现提出进一步的改进措施,逐步完善法律人工智能体系。在政府公权力的监督下,还可以引入商业运作模式,由政府、学者、商业、民众等多方参与,在不断训练的基础上提高法律智能化水平,也可以让法律真正起到维护国家社会安定、人民幸福安康的作用。

5   结语

高质量法律数据集建设不同于相对稳定的古籍数据库,它具有动态特性,既需要处理过往法律数据,也面向不断增加的法律数据。法律实践是“理”与“情”的统一,在司法执法过程中因为离不开人的参与,而人的主观情感总难免掺杂其中。随着计算法学深入研究提供的理论基础不断完善,人工智能技术实践日臻成熟可靠,也许在不久的将来人工智能会在司法裁判中起到必要的辅助作用,从而规避因为人的主观情感带来的主观误判。

但这一过程不是一蹴而就的,计算法学尚且处于起步阶段。正如学者一再提醒,目前能做到发现法律中的“相关性”而难以解释法律中的“因果律”。我们也应看到人工智能凭借超乎人类想象的学习能力,以往观念认为人工智能很难充分掌握或模拟人的思维和意识,但现在看来或许并不难实现。ChatGPT、百度的ERNIE Bot(文心一言)、复旦开发的MOSS等产品不断刷新人们认知,届时我们可能最急迫的工作不再是探究人工智能与人的差异,法学研究和实践中是否要或如何应用人工智能,反而更需要注意的可能是还有什么是人工智能不能做的,进而将进一步考虑如何为人工智能立法。

参考文献:

[1]  David Lazer A P,Lada A,Sinan A,et al.Life in the network:the coming age of computational social science[J].Science,2009,323(5915):721-723.

[2]  黄水清,刘浏,王东波.计算人文的发展及展望[J].科技情报研究,2021,3(4):1-12.

[3]  黄水清,刘浏,王东波.国内外数字人文研究进展[J].情报学进展,2022,14(1):50-84.

[4]  黄水清.回归人文:从人文计算到计算人文[N].社会科学报, 2021-09-09(5).

[5]  邓矜婷,张建悦.计算法学:作为一种新的法学研究方法[J].法学,2019(4):104-122.

[6]  申卫星,刘云.法学研究新范式:计算法学的内涵、范畴与方法[J].法学研究,2020,42(5):3-23.

[7]  梁柱,沈思,叶文豪,等.基于结构内容特征的裁判文书自动推荐研究[J].情报学报,2022,41(2):167-175.

[8]  张妮,蒲亦非.计算法学导论[M].成都:四川大学出版社,2015.

[9]  于晓虹,王翔.大数据时代计算法学兴起及其深层问题阐释[J].现代法学,2019(3):110-117.

[10]  左卫民.中国计算法学的未来:审思与前瞻[J].清华法学,2022,16(3):196-208.

[11]  钱宁峰.走向“计算法学”:大数据时代法学研究的选择[J].东南大学学报(哲学社会科学版),2017,19(2):43-50,146.

[12]  张妮,徐静村.计算法学:法律与人工智能的交叉研究[J].现代法学,2019,41(6):77-90.

[13]  辛巧巧.论人工智能时代的计算法学方法[J].人民论坛·学术前沿,2020,(18):120-123.

[14]  于寅虎.加快计算法学学科建设 助力数字经济发展[J].网络安全与数据治理.2023,42(1):1-3.

[15]  张妮,蒲亦非.计量法学、计算法学到认知法学的演进[J].四川大学学报(自然科学版),2021,58(2):7-12.

[16]  Buchanan BG,Headrick TE.Some speculation about artificial intelligence and legal reasoning[J].Stan L Rev,1970,23:40.

[17]  Deedman C,Smith J.The nervous shock advisor:A legal expert system in case-based law[J].Operational Expert Systems in Canada,1991.

[18]  Biedermann A,Taroni F,Delemont O,et al.The evaluation of evidence in the forensic investigation of fire incidents(Part II):Practical examples of the use of Bayesian networks[J].Forensic Science International,2005,147(1):59-69.

[19]  Biedermann A,Taroni F,Delemont O,et al.The evaluation of evidence in the forensic investigation of fire incidents (Part I):an approach using Bayesian networks[J].Forensic Science International,2005,147(1):49-57.

[20]  Riesen M,Serpen G.Validation of a bayesian belief network representation for posterior probability calculations on national crime victimization survey[J].Artificial Intelligence and Law,2008,16:245-276.

[21]  Hamann H,Vogel F,Gauer I.Computer Assisted Legal Linguistics(CAL(2))[A].Bex F,Villata S.Legal Knowledge and Information Systems:294[C].Amsterdam:Ios Press,2016:195-198.

[22]  Giacalone M,Cusatelli C,Romano A,et al.Big Data and forensics:An innovative approach for a predictable jurisprudence[J].Information Sciences,2018,426:160-170.

[23]  陈亮,郭佳雯,武建功,等.基于法计算学理论的人工智能辅助决策算法研究[J].华东师范大学学报(自然科学版),2019(5):85-99.

[24]  周庆山.面向21世纪的信息法学[J].情报理论与实践,1998(1):10-13.

[25]  马海群,乔立春.论我国信息法学的研究基础与学科建设[J].中国图书馆学报,2001(1):16-20.

[26]  張妮,蒲亦非.计算法学:一门新兴学科交叉分支[J].四川大学学报(自然科学版),2019,56(6):1187-1192.

[27]  刘艳红.人工智能法学研究的反智化批判[J].东方法学,2019(5):119-126.

[28]  左卫民.热与冷:中国法律人工智能的再思考[J].环球法律评论,2019,41(2):53-64.

[29]  曾赟.第四种法学知识新形态——数据法学的研究定位[J].法制与社会发展,2023,29(1):41-59.

[30]  Du W,Li B,Yang M,et al.A Multi-Task Learning Approach for Answer Selection:A Study and a Chinese Law Dataset[A].Thirty-Third Aaai Conference on Artificial Intelligence/Thirty-First Innovative Applications of Artificial Intelligence Conference/Ninth Aaai Symposium on Educational Advances in Artificial Intelligence[C].Palo Alto:Assoc Advancement Artificial Intelligence,2019:9935-9936.

[31]  Sharafat S,Nasar Z,Jaffry SW.Data mining mining for smart legal systems[J].Computers & Electrical Engineering,2019,78:328-342.

[32]  Duan X,Wang B,Wang Z,et al.Cjrc:A reliable human-annotated benchmark dataset for chinese judicial reading comprehension[A].Chinese Computational Linguistics:18th China National Conference,CCL 2019[C].Kunming,China,Proceedings 18.Springer,2019:439-451.

[33]  Ma Y,Shao Y,Wu Y,et al.LeCaRD:A Legal Case Retrieval Dataset for Chinese Law System[A].Sigir21-Proceedings of the 44th International Acm Sigir Conference on Research and Development in Information Retrieval[C].New York:Assoc Computing Machinery,2021:2342-2348.

[34]  Urchs S,Mitrovic J,Granitzer M.Design and Implementation of German Legal Decision Corpora[A].Rocha AP,Steels L,VandenHerik J.Icaart:Proceedings of the 13th International Conference on Agents and Artificial Intelligence-Vol 2[C].Setubal:Scitepress,2021:515-521.

[35]  Boonchom V sit,Soonthornphisaj N.Thai Succession and Family Law Ontology Building Using Ant Colony Algorithm[A].Nakakoji K,Murakami Y,McCready E.New Frontiers in Artificial Intelligence:Vol 6284[C].Berlin:Springer-Verlag Berlin,2010:19-32.

[36]  Chen H,Pieptea LF,Ding J.Construction and Evaluation of a High-Quality Corpus for Legal Intelligence Using Semiautomated Approaches[J].Ieee Transactions on Reliability,2022,71(2):657-673.

[37]  Dyevre A,Lampach N.Subnational disparities in EU law use:exploring the GEOCOURT dataset[J].Journal of European Public Policy,2021,28(4):615-631.

[38]  Bradford A,Chilton AS,Megaw C,et al.Competition Law Gone Global:Introducing the Comparative Competition Law and Enforcement Datasets[J].Journal of Empirical Legal Studies,2019,16(2):411-443.

[39]  周晓辉.基于隐式马尔科夫模型的法律命名实体识别模型的设计与应用[D].广州:华南理工大学,2017.

[40]  韓金波.Siamese-CNN算法研究及其在法院裁判预测中的应用[D].大连:大连理工大学,2018.

[41]  张虎,王鑫,王冲,等.面向法律裁判文书的法条推荐方法[J].计算机科学,2019,46(9):211-215.

[42]  Pande R,Alam S.Predicting the outcome of judicial cases using semantic analysis[A].2020 Ieee Symposium Series on Computational Intelligence (ssci)[C].New York:Ieee,2020:1757-1761.

[43]  郑洁,黄辉,秦永彬.一种融合法律知识的相似案例匹配模型[J].数据分析与知识发现,2022,6(7):99-106.

[44]  杨超群,庞彦燕,严若冰,等.基于迁移学习的适用法条推荐模型[J].四川大学学报(自然科学版),2021,58(2):13-18.

[45]  Vuong YTH,Bui QM,Nguyen HT,et al.SM-BERT-CR:a deep learning approach for case law retrieval with supporting model[J].Artificial Intelligence and Law,2022.

[46]  Juang TY,Hsu CS,Chen YS,et al.A concurrent prediction of criminal law charge and sentence using twin convolutional neural networks[J].International Journal of Ad Hoc and Ubiquitous Computing,2022,41(1):29-43.

[47]  Sovrano F,Palmirani M,Vitali F.Combining shallow and deep learning approaches against data scarcity in legal domains[J].Government Information Quarterly,2022,39(3):101715.

[48]  王海亮.基于文本挖掘的法律咨询系统研究和实现[D].北京:北京化工大学,2017.

[49]  Seeam P,Teckchandani N,Booneyad H,et al.Employment Law Expert System[A].2018 International Conference on Intelligent and Innovative Computing Applications (iconic)[C].New York:Ieee,2018:358-363.

[50]  Barros R,Peres A,Lorenzi F,et al.Case Law Analysis with Machine Learning in Brazilian Court[A].Mouhoub M,Sadaoui S,Mohamed OA,et al.Recent Trends and Future Technology in Applied Intelligence,Iea/Aie 2018:Vol 10868[C].Cham:Springer International Publishing Ag,2018:857-868.

[51]  Mokanov I.Facts2Law-Using Deep Learning to Provide a Legal Qualification to a Set of Facts[A].Araszkiewicz M,RodriguezDoncel V.Legal Knowledge and Information Systems (jurix 2019):Vol 322[C].Amsterdam:Ios Press,2019:247-250.

[52]  Fernandes WPD,Silva LJS,Frajhof IZ,et al.Appellate Court Modifications Extraction for Portuguese[J].Artificial Intelligence and Law,2020,28(3):327-360.

[53]  夏錦文,张瑞祥.我国党内法规研究的文献数据分析(1992-2021年)——基于核心期刊数据和内容分析法[J].学海,2021(3):14-21.

作者简介:张瑞祥,南京师范大学法学院博士研究生;赵志枭,南京农业大学信息管理学院硕士研究生。

猜你喜欢

人工智能算法
我校新增“人工智能”本科专业
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
2019:人工智能
进位加法的两种算法
人工智能与就业
算法初步两点追踪
数读人工智能
基于增强随机搜索的OECI-ELM算法
下一幕,人工智能!