类案检索要素图谱构建
2023-01-05王冉冉
闫 丹 王冉冉
引 言
最高人民法院《关于统一法律适用加强类案检索的指导意见(试行)》(以下简称《类案检索意见》)为类案检索提供了“关键词检索、法条关联案件检索、案例关联检索等方法”,并对类案检索智能化、精准化提出未来展望。然而,检索方法指引性不强、法官检索体验感不足、检索平台精准性不高等现状,映射出现有检索方法尤其是关键词检索无法精准定位类案的难题。“关键词过多或者过少都不利于获得有效类案,类案的搜索方法虽各有优势,却也有着各自的缺陷”,而且“在运用检索方法获得初步范围之后,数据清洗工作也带有一定不确定性”①孙光宁:《类案检索的运行方式及其完善——以〈关于统一法律适用加强类案检索的指导意见(试行)〉为分析对象》,载《南通大学学报(社会科学版)》2022年第1期。。
按照“全面推广类案强制检索、文书辅助生成、加强要素式智能审判等应用,提高审判执行智能化水平”②《人民法院信息化建设五年发展规划(2021—2025)》。的建设要求,本文从请求权基础理论即“真正的争议焦点未必在请求权基础本身,而在其构成要件(T)及构成要件要素(M)的认定上”③许德风:《法教义学的应用》,载《中外法学》2013年第5期。出发,以要素式审判为方法指引,遵循法官认知逻辑思维的路径,构建全流程、全要素的检索模式,并将该逻辑思维赋能机器算法,实现人工与智能的最优解。
一、类案检索实践运行样态检视
类案检索,是对待决案件在基本事实、争议焦点及法律适用等方面具有相似性的案例进行检索、识别和运用的主观能动性活动。依据检索需求不同,类案检索可分为事实查明型、法律适用型以及复合型检索等类型。自《类案检索意见》施行以来,部分地区的高级人民法院纷纷出台了相关的规范性文件,保障类案检索机制的规范化运行。就法官而言,类案检索既可有效破解待办案件的裁判困局,又可有效抵御外界的不当干预,具有“智囊团”“避风港”等多重价值。下文从检索模式方法、检索主体体验以及典型检索平台三个维度考量类案检索机制的实践样态。
(一)从检索方法的灵活度窥探类案检索
类案检索人工模式,即法官通过查阅资料、翻阅卷宗、咨询讨论、会议讨论等方式,找寻与待决案件最相类似已决案件,作为裁判参考依据。类案检索在线模式,即借助内网办案平台、专门检索平台等,将人工智能技术应用于司法活动,发现类似案件的路径。
1.线下检索模式层面。以不同年龄段的法官采用类案检索模式为例,基层法院年长型法官受信息素养差、无法熟练运用检索平台的限制,更愿凭借查阅资料、咨询经验丰富的法官、法官联席会议讨论等方式寻找类案。该检索方式下,法官需翻阅《人民法院案例选》《人民司法·案例》《人民法院报》等杂志报刊,安排咨询或者联席会议的时间地点,除耗费时间外,在法律及司法解释更新、裁判规则变更的时下,即便寻找到类似已决案件,还要花费精力核实类案的裁判要旨是否有效,效率低下、错误率高、科学性差。
2.在线检索模式层面。与年长型法官检索习惯不同,年轻型法官更愿通过在线检索方式,运用信息化手段检索相关案件,将类案检索作为形成裁判结果的辅助工具。现有类案检索平台有中国裁判文书网、法信、北大法宝、聚法、无讼、威科先行、元典智库等十余个官方、非官方平台。经调研发现,检索平台受欢迎程度分别为:法信、聚法、北大法宝、中国裁判文书网。各个检索平台信息资源丰富的背后,却是信息洪流下不可避免的数据冗余、碎片化信息、无效数据充斥等问题,产生了信息传播中短暂的“烟花效应”。
3.类案检索方法层面。《类案检索意见》第5条规定:“关键词检索、法条关联案件检索、案例关联检索等方法。”相较于关联检索方法,关键词检索方法更为便捷。关键词,即从待决案件事实、拟适用的法律条文中选取的特征性词汇。比如当事人双方达成一致意思的书面形式效力问题,有的法官总结为“合同效力”,也有法官提炼为“协议效力”。尽管二者在法律术语层面并无二致,但是对于机器学习来说,二者并不完全相同。再如,待决案件为一起工伤保险合同纠纷,法官选取“工伤认定”术语作为关键词,但在检索时却将“工伤”键入为“公伤”,此时机器学习的语言便是“公伤”,差之毫厘,谬以千里。
(二)从检索主体的体验良莠审视类案检索
1.法官的痛点:逃避类案检索
根据2022年7月《聊城市中级人民法院审判管理工作通报》,聊城市法院自2022年1月至6月累计受理案件40649件,结案41643件,员额法官411名,人均办案102件,平均办案周期为53.85天。繁重的办案压力下,法官在检索类案时还要直面案例数据库平台的选择困难、必备检索方法和能力的欠缺等问题。于是,部分法官“应检不检”,逃避检索。
2.法官的难点:隐形式类案检索
根据《类案检索意见》第2条、第7条、第8条、第10条规定,承办法官应区分检索类型制作类案检索报告,在当事人提交类案检索报告时,对是否为类案、是否适用类似判例及缘由以及不适用的理由给予必要的回应。但类案检索报告以何种形式、如何针对类案检索进行裁判说理,有赖于各地法院的实践探索。于是,有的法官检索类案后担忧类案识别不准确,运用类案裁判说理不充分、不恰当,便在裁判文书说理部分隐去了检索、类案识别运用等过程。
3.法官的堵点:能力不足型检索
以关键词检索法为例,该方法围绕基本事实、争议焦点、法律适用等方面进行。实践中关键词的提取技巧、词语转换技巧以及关键词与关联检索的灵活运用技巧,均需在检索实践中步步训练并养成。若关键词选取不当,容易导致误检漏检;若关键词选取不准,又容易导致错检、检索不全面;关键词选取过多,还将导致无功而返的徒劳检索。笔者曾与基层法院43名法官在座谈时,90%以上法官表示类案检索能力不足,并期望让大数据、人工智能改变类案检索智能不足的现状。
(三)从检索平台的精准程度测量类案检索
1.检索查全率、查准率低。表1中的检索平台看似提供了常规检索、高级检索等人性化、便捷化检索服务,像法信、北大法宝、聚法等平台还提供了裁判文书维度检索、设置案例标签等特色服务。经分别选取简案“买卖合同违约金确定”为关键词进行检索,表1平台中法信检索命中权威案例11条、一般案例3461条、北大法宝检索命中1756条、聚法检索命中2368条,尚需人工二次筛选检索结果。按照《类案检索意见》要求,法官需比对待决与已决案件事实、争议焦点和法律适用的相似点、不同点,比对后选择与待决案件相似性最强、关联度最大的案件。最后,还需按照检索范围层级,最终筛选得出最具权威性类案,人力资源耗费大。
表1 各类检索平台直观对比
续表
2.技术深度与技术广度低。除关键词检索外,河南省高院发布的《关于进一步规范和完善类案检索工作的通知》还提出了“定位检索、反向检索等方法”。然而,考察表1平台提供的检索服务,目前尚无平台对该方法进行回应或提供技术支持。以表1中简案的检索结果为例,平台响应速度虽快,但检索到的案例量大、质量不一。这凸显机器学习浅层化表面化,机器深度学习积累水平低,呈现出“有多少人工就有多少智能”的样态。
类案的深层次意义在于,探究类案裁判背后的价值理性,实现类案同判、质效提升双目标。“智慧法院信息化4.0版下,人工智能将把法律带往何方,取决于我们对一些法学根本问题的思考以及基于这种思考而做出的选择。”①郑戈:《在法律与科技之间——智慧法院与未来司法》,载《中国社会科学评价》2021年第1期。法官作为类案检索的主要使用者和最终判定者,如何充分满足其精准化类案检索的迫切需要,值得学界和实务界探索。
二、类案检索智能不足的症因
“所有经法律判断的案件事实都有类似的结构,都不仅是单纯事实的陈述,毋宁是考量法律上的重要性,对事实所作的某些选择、解释及联结的结果。”①[德]卡尔·拉伦茨:《法学方法论》,陈爱娥译,商务印书馆2013年版,第161页。类案检索本质上是寻求与待决案件最为相似已决案件的识别判断过程,是高度依赖法官认知理性的实践活动。类案检索的关键节点在于输入端和输出端,而这两个端口的口径则是检索的关键要素。当下类案检索智能不足症因主要表现在三个方面:
(一)法律语言精准提炼缺位
“语言(语词)在不同的使用中其含义是不断变化的,命名还根本不是语言游戏中的任何步骤,只有在一个命题的关联中一个词才具有意义。”②[奥]维特根斯坦:《哲学研究》,韩林合译,商务印书馆2013年版,第47页。与自然语言的随意性、口语化不同,法律语言作为表述法律意义内容的符号集合,应然具备规范化、标准化、语境化的属性。
1.法律语言精准之要。类案检索的启动、识别依赖于检索要素的确定,检索要素的提取有赖于法律语言的精准提炼。所以法律语言提炼越精准,检索要素越准确,检索到的已决案件相关性越强。关键词,即从案件构成要件中剥离出来的具体要素所对应的词或词句。表面看,类案检索智能不足在于检索平台的智能化、精准化缺位,但深层次类案检索症结根源在于检索要素的提炼与判断,在于法律语言有效转化为检索要素。
2.法律语言提炼之术。智慧法院建设背景下,如何精准提炼法律语言,是对法官总结归纳和办案业务水平的双重考验。对办案经验不足的法官而言,从请求权基础理论出发,到归纳案件争议焦点,完成要件归入的涵摄流程尚未熟练掌握,类案检索关键词的精准提炼能力并非朝夕就可实现。
以买卖合同纠纷中常见的违约金条款为例,检索时法官分别选取“违约金”“违约金条款”“违约金确定”等作为关键词,在法信平台进行检索,命中条数分别为7646567条、90739条、4479条(数据统计截止2022年8月17日)。关键词选取的随意性,让海量的数据资源增加了法官主体的识别负担,无法精准定位推送相似已决案件,减损了类案检索的制度效能。
(二)检索语言精准选取缺位
“时代的发展与变化使现在的信息检索实质上成为一种相关性检索,是一个提取与用户提问请求最相关信息的过程。”③于春、彭爱东等:《信息用户对信息检索相关性判断的因素分析》,载《信息技术》2009年第3期。类案检索中的检索语言,是围绕待决案件基本案情、事实争议焦点,或者拟适用的法律条文、法律适用等检索需求,所使用的专用语言。
1.检索语言精准之要。基于检索语言的功能,检索语言选取的相关性程度,直接关系到能否检索到类似已决案件。而且,检索语言选取的精准程度,直接影响法官检索的积极性。司法实践中,检索词冗余缺乏、以偏概全、任意拆分等问题,严重影响了类案检索的体验。以损害赔偿请求权为例,该请求权不仅存在于生命权、身体权、健康权纠纷中,还适用于机动车交通事故责任纠纷。若仅选取“损害赔偿金请求权”作为检索式而忽视案件类型,则检索结果不仅包含生命权、身体权、健康权纠纷,还会出现机动车交通事故责任纠纷,检索结果精准性差。
2.检索语言选取之术。机器能够深度学习的数据,应然具备结构化、要素化、图谱化、符号化的特征。以上文讨论的买卖合同违约金条款适用为例,参照布尔逻辑运算符规则,分别选取“买卖合同违约金”“买卖合同‘□’违约金”“买卖‘□’合同违约金”作为检索式,在法信平台检索得到的命中条数分别为:3414条、2275660条、3277215条(数据统计截止到2022年8月17日)。检索词简单程度、检索词的截词方法、分解单元精细程度,直接影响着检索结果的质量。
(三)算法推荐精准过滤缺位
“机器学习预设了世界的离散性,它假定世界可以被一种数学机制来完全化约,如著名的丘奇—图灵论题就宣称所有足够强的计算装置都可以相互模拟,正是在这个意义上,法律系统也认为可以被机器学习所模拟。”①尼克:《人工智能简史》,人民邮电出版社2017年版,第196-197页。算法推荐作为精准推送的重要手段,一旦核心算法的“看门人”缺位,将会干扰检索预期轨道的精准度。
1.算法黑箱的威胁。“数字媒介的硬件和软件(图形用户界面)都有隐蔽性,在软件的遮蔽下,用户看不到自己受到了硬件的限制,而软件本身虽可以实现用户与计算机的交流,但用户却并不知道这种开放的表象背后的详细过程。”②周建明、马璇:《个性化服务与圆形监狱:算法推荐的价值理念及伦理抗争》,载《社会科学战线》2018年第10期。类案检索是依从检索者的检索需求完成个性化定制的相似案件推荐的实践过程,算法推荐有助于提高检索信息的精准分发效率,有效对接检索者的个性化检索需求,却也造成了算法推荐的“黑箱”,将检索者置于“信息茧房”之下。算法的不透明,致使检索者只知最终检索结果,却并不知晓检索算法及推送全过程。
2.算法歧视的挑战。单纯大数据的简单堆积,并不能自动产出人工智能。“相关性理论认为,随着网络环境下人机交互性的加强,系统的评价应以用户为中心,人是检索过程中最活跃的因素,只有充分考虑人的因素,才能有目的地改进检索系统的功能,进而准确、快速的查找到所需要的信息。”③周智佑:《信息检索理论年度述评》,载《情报学进展》1995年第1卷。法律人工智能,需要从巨量司法数据中提炼出共性规则,进行数据标注后形成。面对如此海量多元的数据,算法并不能保证抓取到每个数据,“技术逃避”式的算法偏见问题难以避免。
“与其说司法人工智能以数据为中心,毋宁说是以知识为中心。”①高翔:《人工智能民事司法应用的法律知识图谱构建——以要件事实型民事裁判论为基础》,载《法制与社会发展》2018年第6期。智能类案检索,就是通过将数据的本质特征构建成以节点形式连接的知识图谱,让机器模拟人类神经网络的学习原理,学习感知司法大数据的本质特征后,用于分析预测待决案件的数据特性,从而完成自动提炼、识别、比对等工作过程。
三、法官认知视角下全要素检索的逻辑演进
“法官的认知本质是法官内心对于案件事实和所涉法律的一种认定和适用的过程,包括对案件事实的认知、对案件所涉法律的认知以及对案件事实和法律关联的认知三个层次。”②王淑俐、王继余:《法官认知中的利益衡量与法律适用》,载《中国应用法学》2018年第5期。个案裁判的过程是法官认知的过程,也是法官对于事实要素、法律要素等归纳总结后,与构成要件要素一一对应的过程。也即,要素式审判是法官对案件事实、法律适用等要素的发现、提取以及涵摄的过程,这也为构建类案检索要素图谱提供了可靠路径。
(—)从关键词限缩到全要素演绎
现有的类案检索方法,无论是关键词检索法、关联检索法,甚至于反向检索法,均是围绕待决案件的基本事实、争议焦点、法律适用等方面进行。尽管可以通过关键词限缩的方式,逐渐接近类似案件,但受制于语言、技术、平台等各方面的瓶颈,无法满足检索查全性、查准性的需求。相较之下,全要素检索模式,不仅契合了法官裁判的逻辑思维过程,也更趋近于精准识别类似案件。
1.全要素检索的体系性。不同于关键词检索随意性,全要素检索的要素,源于要素式审判下的待决案件事实要素、证据要素、法律要素、管辖要素等。这是演绎推理下的事实整理与法律要件归入的生动应用,是对大前提—小前提—结论这一演绎思维的严格遵循,要素的提炼、分类、归纳更富有体系性。
2.全要素检索的逻辑性。不同于关键词检索下关键词的简单罗列,要素式审判下的事实要素、证据要素、法律要素、管辖要素等具有逻辑性和图谱化的典型特征,要素之间具有内在关联,汇聚形成待决案件的精准画像。
3.全要素检索的扩展性。依托于要素式审判在类型化案件的深度应用,法官可在审判全流程、全方位提炼案件全要素,形成结构化的案例结构,完成无争议要素、争议要素的标签设置,为机器深度学习提供充足的案例数据库资源、图谱化的案件全要素、精准的要素标签,也为类案的精准识别比对提供了最优方案。
(二)从要素提炼到要素比对
1.要素的提炼
“判决依据的确定来源于关键事实的提炼。”①[英]克罗斯·哈里斯:《英国法中的先例》,苗文龙译,北京大学出版社2011年版,第60页。法官运用要素式审判法,从请求权基础分析方法出发,通过庭前初步确定、庭审复核、庭后最终确定,运用演绎推理方法完成待决案件无争议要素、争议要素的提炼过程。要素的提炼流程,同时是法官审判思路具象化的过程。“要素表”不仅是要素提取的生动载体,而且是兼具诉讼指引与庭审提纲的完美结合体。
请求权基础分析方法通过对事实(小前提)的整理与说明,通过对法律(大前提)的解释,建立起大前提与小前提之间的联系。②参见王利明:《民法案例分析的基本方法探讨》,载《政法论坛》2004年第2期。邹碧华提出的要件审判九步法,是对请求权基础分析方法的发展,从原告确定诉讼请求起,“按照明确法律规范大前提、查清案件事实小前提,最后将案件事实小前提归入法律规范大前提,得出裁判结论”③邹碧华:《要件审判九步法及其基本价值》,载《人民司法·应用》2011年3期。的演绎推理方法。
要素式审判是“审判程序中的当事人陈述、举证质证、询问调查、辩论等行为,实质上是为个案裁判提取法律要素的过程”④王猛:《智能化助推司法体制综合配套改革》,载《河北法学》2018年第5期。,是对请求权基础分析方法、要件审判九步法的继受创新,是一种解构案件各要素、提炼关键要素并最终形成要件归入的新式审判方法(见表2)。
表2 要素式审判法与要件审判九步法比较
2.要素的比对
“要素式审判法的要义在于法院审判时,紧紧围绕案件的要素予以展开,非要素的部分从简从略。”⑥汤维建:《如何理解要素式审判》,载《中国审判》2016年第4期。两个案件相似,裁判结果也应相似。因此,要素式审判下判断是否为类案时,可以将两个案件的大前提和小前提细化为若干类型化的要素,通过对类型化的要素进行一一比对,寻找差异和共同点。全要素检索理论源于构成要件下的各要素,实践源于要素式审判的适用,具有对基本事实、争议焦点、法律适用三方面相似性比对无法比拟的精准性(见表3)。“最高人民法院可在发布的司法文件中要求:类案检索须以类型化要素作为识别类案的标准。这可防止类案检索成为应付式检索的形式主义做法,甚至于成为法官把类案检索结果作为滥用自由裁量权的理由。”①高一飞、相晓璐:《类案检索机制的设计原理与实施评估》,载《时代法学》2021年第1期。
表3 传统检索与要素式审判下检索比较
(三)从个案推演到类案普适
要素式审判围绕案件全要素进行,通过将自然语言处理与文字识别、声音识别等技术相结合,区分案件无争议要素和争议要素,完成案件各要素结构化标签设计,初步形成争议要素。法官经审理确定争议要素后,即可完成检索全要素的准确提取。要素式审判下,法官的重点在于对案件全要素的审查核实,无论简易程序、小额诉讼程序,甚至于普通程序的案件均可适用。采用“全要素检索”,在无争议要素限缩、争议要素比对下可避开案件不必要的事实情节干扰,提高检索的准确性和精确度。
四、类案检索要素图谱构建路径
基于要素之于类案检索的重要意义,构建类案检索要素图谱势在必行。要素图谱是一个抽象的逻辑概念,是一种结构化的检索流程。法官在审判活动中,通过智能提取和人工介入方式,把事实要素、法律要素等无争议和争议要素提炼出来,形成待决案件虚拟结构化的可视图谱作为输入端口径。然后,由机器依托于先行设置的案例推送顺位的算法,与海量案例数据库进行精准比对后作为输出端口径,从而对接实现类案检索精准化。
(一)案情+要素——输入端要素图谱构建
1.案情简介:2021年12月9日20时许,李某某驾驶鲁A×××××的小型客车(在保险公司投保有交强险及100万元商业第三者责任险),与卢某某驾驶的电动车发生碰撞。经交警部门认定,李某某负事故全部责任。卢某某住院治疗46天,支出医疗费24943.93元,伤情经鉴定被评定为十级伤残,误工期限180天,护理期限90天,营养期限90天。卢某某诉至法院,请求李某某、保险公司赔偿残疾赔偿金等共计167021.39元。经补充鉴定,卢某某损伤参与度评定为50%。
2.要素提炼:要素提炼的过程就是将当事人陈述的案件基本事实进行提取、简化、归类的过程。从演绎推理方法层面考量,要素的确定要与法律要件的确定相结合,运用好大前提—小前提—涵摄的逻辑,在事实整理与法律要件匹配中形成有效穿梭路径(见表4)。
表4 案情+要素表
(二)标签+算法——输出端要素图谱构建
1.增设标签:无争议要素、争议要素
一方面增加案例的可识别特征,即对案例库中的指导性案例、典型案例、参考性案例设置“无争议要素”“争议要素”标签,达到便于识别查找的检索目的。另一方面,建立司法案例库的涤除机制,及时淘汰“引用不规范”“缺乏参考价值”的案例,给司法案例库“瘦身”“减负”的同时“提质”“增效”。
2.优化算法:重置案例层级
法官提取案情要素图谱后,先行确定案件无争议要素和争议要素,按照优先匹配争议要素、兼顾《类案检索意见》及“最高人民法院发布的指导性案例(简称Z)—最高人民法院发布的典型案例及裁判生效的案件(简称D)—本省、自治区、直辖市高级人民法院发布的参考性案例及裁判生效的案件(简称C)—上一级人民法院及本院裁判生效的案件(简称S)”,提高输出端的精准化(见表5)。
表5 类案智能推送要素比对表
(三)类案检索现实图景演示
以“中国裁判文书网”作为检索平台,采取全要素检索法,即依次键入“交通事故”“参与度”“特异体质”,得出58篇裁判文书(表6为人工选取四份代表性裁判文书)。
表6 中国裁判文书检索的案例情况分析(节选)
基于以上检索结果,本案中尽管卢某某个人体质对案涉事故损害后果具有一定影响,但因其对于事故的发生并无过错,参照最高人民法院第24号指导性案例,卢某某体质状况不属于《民法典》第1173条规定的“被侵权人对同一损害的发生或扩大有过错的,可以减轻侵权人的责任”情形,不应减轻李某某的赔偿责任。
结 语
类案检索精准化智能化,不但可加强对法官自由裁量权的监管,实现类案同判的既定目标,助推审判管理体系的精细化,还可赋能审判体系和审判能力现代化。立足于当前类案检索智能不足的样态,着眼于以要素化赋能类案检索,在法官认知逻辑思维下,探究类案检索与要素式审判全流程、全方位的契合点,实现司法案件要素化图谱化,以现代信息技术助推司法审判现代化。