人工智能介入量刑机制研究
——以认罪认罚案件为适用场域
2023-01-05李序尹邓保阳
李序尹,邓保阳
(1.中国人民公安大学,北京 100038;2.平顶山市人民检察院,河南 平顶山 467000)
2018 年修订的《刑事诉讼法》从立法层面确立了认罪认罚从宽制度,以犯罪嫌疑人是否自愿认罪认罚为分界点,对程序进行繁简分流,在实现公平正义目标的同时兼顾效率。在全面实施的背景下,适用认罪认罚从宽处理的案件数量不断上升,其成为司法机关当前主要的一种办案手段。对于适用认罪认罚从宽的案件,由于控辩双方对于定罪问题基本上没有争议,其重心主要集中在量刑上,因而如何在量刑协商的过程中提出规范、精准的量刑建议就显得尤为重要。[1]
早在2017 年,最高人民检察院就提出了检察大数据建设的总体思路,形成类案推送、量刑建议等各项应用需求①参见2017 年6 月12 日最高人民检察院印发《检察大数据行动指南(2017-2020)》,载http://www.spp.gov.cn/xwfbh/wsfbt/201706/t20170612-192863.shtml#1,2021 年9 月23 日访问。。随后,在2018 年的全国检察长会议中,曹建明检察长指出,各级检察机关要积极推动人工智能和检察工作深度融合,提高检察工作信息化、智能化和现代化水平。[2]这有力地说明了人民检察院高度重视智慧检务的建设与发展。其中,认罪认罚从宽智能化量刑建议是建设智慧检务的关键所在,也是难点所在。2019 年4 月12 日,在全国检察机关贯彻落实认罪认罚从宽制度电视电话会议中,陈国庆检察长强调要加强量刑建议规范化建设[3]。同月28 日,在全国检察机关“量刑建议精准化、规范化、智能化”网络培训中提出,各级检察机关要适时组织研发可以普遍适用的智能量刑系统。[4]这些会议的召开为人工智能介入认罪认罚案件提供了方向和指导。此外,在2020 年1月2 日,全国检察机关统一业务应用系统2.0 版在贵州、海南两省的检察机关全面上线试点运行,标志着检察机关正式迈入了检察工作2.0 时代。[5]这些试点的成功实践为智能量刑机制在认罪认罚案件中的大力推行适用提供了参考。
在国家和最高人民检察院的号召下,各地检察院和民间人工智能研究机构积极拥抱大数据和人工智能技术,以解决当前所面临的规范量刑难题。例如,广州市南沙区人民检察院的“智能量刑辅助系统”[6]、北京博雅英杰科技股份有限公司研发的“大法师”①参见大法师量刑规范化智能辅助系统,载https://new.qq.com/omn/20200921/20200921A04NH L00.html,2021 年9 月23 日访问。,通过在局域网建立BS、CS 架构软件,将大数据与NLP、OCR等人工智能技术相结合,通过数据跨网交换、统计系统衔接,对认罪认罚从宽的案件进行智能抓取、情节分析、类案推送、人罪关系图谱展示并自动生成量刑建议。实践证明,智能量刑机制对于缓解我国案多人少、同案不同刑等问题具有积极作用。
虽然智能量刑机制在实践中被证明效果良好,但就目前而言,由于现阶段我国法学知识与技术知识尚未实现深度融合,且大部分学者主要侧重对智能量刑机制的技术改良研究,而对于智能量刑机制的理论依托、量刑原理等研究相对薄弱,甚至在司法地位认定等基本问题上都尚未形成共同认识。算法自身的技术性难题、可靠性难题、不周延性难题等会对量刑规则与正当程序产生何种冲击?对于智能量刑机制运行过程中存在的问题该如何进行规避?对上述问题的解决是高科技时代下智能量刑机制进行自我革新的关键命题。随着认罪认罚从宽制度的全面实施,精准量刑建议的改革要求昭示着认罪认罚案件的量刑是未来智能量刑机制的主战场。因此,本文将智能量刑机制的适用场域限定在认罪认罚从宽案件中,并辅以实证研究以剖析智能量刑机制在实际运作过程中可能或已经存在的司法困境,据此为基础提出切实可行的改进建议。
一、人工智能介入认罪认罚量刑机制的司法逻辑
认罪认罚从宽制度全面实施后,在国家和最高检的号召下,各地检察机关开始着手对“智能量刑机制”的开发研究,如哈尔滨市人民检察院研发的“智慧公诉系统”、上海市虹口区人民检察院研发上线的“智慧量刑小程序”等,象征着我国的“智慧检务”建设正在有序推进。但由于目前关于人工智能介入智能量刑机制的司法逻辑尚未形成共同话语,使得理论界和实务界存在较大的争议,亟待释明新的理论体系来推进智能量刑机制与现有诉讼制度之间的衔接。
(一)智能量刑机制的主体性逻辑
虽然在认罪认罚领域引入智能量刑已被多地检察机关证明效果良好,但关于智能量刑机制的主体性讨论,即智能量刑机制在刑事量刑过程中究竟充当的是独立量刑者的角色还是辅助量刑者的角色,仍是一个颇具争议性的问题。对于人工智能量刑机制介入认罪认罚从宽制度的研究,首先要对其体系地位有一个清楚的认识,才能摸索出具有“中国智慧”的智能量刑系统。
目前法学界的主流观点认为,虽然智能量刑机制可以依据大数据、算法、机器学习推导出量刑结果,但是就目前而言,由于人工智能技术及其应用发展具有其局限性,如算法歧视、算法黑箱等不可控风险,将智能量刑机制定位为辅助角色是当下较为明智稳妥的选择[7]。尤其在认罪认罚案件的量刑过程中,仍然是检察官主动量刑、组织犯罪嫌疑人签署具结书,即使智能量刑系统依托大数据、算法推导出量刑结果,最终还必须经过检察官的二次核验。“被动式量刑”决定了其只能充当辅助角色,以辅助量刑活动的顺利进行,尚无法做到依法独立量刑。[8]
但是,也有学者对此提出了质疑。其认为,智能量刑机制引入认罪认罚领域的主要目的是为了缓解“案多人少”的矛盾,将检察官从繁重的简易案件中解放出来。若将人工智能量刑机制定义为“量刑辅助工具”,则意味着每一次的量刑建议都要进行两次“重复认定”,即检察官人工认定和算法智能认定。如若两种结果验证结果一致,则不仅验证了检察官量刑建议的正确性,更验证了人工智能量刑机制作为“独立量刑者”的可行性;假若两者给出的量刑建议无法相互验证,那么检察官不仅要证明自身给出量刑建议的适当性,同时还需要积极证明人工智能量刑可能存在的算法错误。将人工智能量刑机制定义为“量刑辅助工具”,不仅不能将检察官从简易的认罪认罚案件中解放出来,反而在无形之中给本就具有众多任务的检察官增加了额外的检验工作,这与设计该机制的初衷背驰而行,而显然有必要赋予其独立量刑者的主体地位。[9]
对于上述争议,笔者认为可以从以下几个角度来厘清智能量刑机制在认罪认罚案件量刑过程中的角色:
第一,可以从设计研发智能量刑系统的初衷和目的进行研究。自认罪认罚从宽制度施行以来,检察机关作为该制度实施的主力军,面临着“案多人少”和“同案不同刑”的问题,如何在追求效率的情况下最大限度地保证公正成为困扰当代检察机关的一个主要难题。如此的司法改革背景催发了对人工智能介入量刑机制的研究,以期将检察官从繁重的简易案件中解放出来。因此,人工智能介入认罪认罚量刑机制打破了以往检察官单一提出量刑建议的局面。为更直观地证明智能量刑机制本身的独特优势,英国研究者让智能量刑系统与100 名检察官同时对一起盗窃案提出量刑建议。结果显示,智能量刑系统的准确率高达86.6%,相比之下,检察官的准确率只有66.3%。[10]除此之外,法官对于智能量刑机制推导出的量刑建议也予以高度认可,如安庆市怀宁县人民检察院从2019 年11月以来,运用智能量刑系统对犯罪嫌疑人自愿认罪认罚的案件提出量刑建议的案件共有160 件,法院对其提出的量刑建议全部予以采纳①参见安徽省人民检察院:《安庆怀宁:智能定罪量刑辅助系统软件助力量刑建议》,载www.ah.jcy.gov.cn/dwjs/dfdt/202006/t20200620-2859262.shtmi,2021 年9 月24 日访问。。也就是说,在简单案件的量刑上,智能量刑机制其实已经足以胜任“检察官”的角色,独立承担量刑工作。
第二,可以将焦点转至对检察机关的公诉权权威上进行讨论。大部分法学家和司法实务部门认为将智能量刑机制定位为“量刑辅助工具”是有效规避算法暗箱、算法歧视等算法风险最为稳妥的做法,但这种做法未必在逻辑上就是可行的。对此我们可以换种思维方式,将焦点转至检察机关公诉权的权威上。面对人工智能快速发展、案多人少的司法矛盾,检察机关该如何维护其公诉权?一方面,从检察官的量刑能力入手,提高检察官整体量刑建议能力。另一方面,探寻以“智慧检务建议4.0案例”为典型的技术改革路径。其中,前者着力解决偶发、复杂的同案同判;后者则致力于解决频发、简单的同案同判。既然人工智能量刑系统在理论上可解释,在技术上可实行,那么赋予人工智能量刑机制以独立主体地位就变得可以接受。
基于上述分析,笔者认为虽然认罪认罚人工智能量刑机制在当下是辅助性的,但其趋势必然是独立性的。只是人工智能量刑机制的“独立量刑者”定位仍需要建构一系列的衔接程序。
(二)智能量刑机制的矢量量化逻辑
现代刑罚体系是以罪行、罪名、罪责为要件设计的一套刑事惩罚制度。其中每一个罪行对应一个罪名并衍生出相应的罪责,环环相扣形成一个闭合模式来实现公众的正义价值。如何有效认定罪行、确定罪名、量化罪责就成为了司法机关的主要任务,而在认罪认罚案件中,如何协商量化罪责则是重中之重。因此,智能量刑机制在量刑过程中应遵循什么样的量化逻辑,是本章讨论的重点。
认罪认罚从宽制度的推行使刑事诉讼的程序产生了“二元裂变”的效应,即对于普通刑事案件,如何准确认定罪名和犯罪事实是检察官的首要任务;而对于认罪认罚案件,如何协商量刑、规范量刑成为了主要问题。[11]检察官的量刑工作就好比一场“拼图游戏”,检察官首先根据大致轮廓(定罪)抽选出适当的拼图模板(即“罪名”),其后将零散的碎片(即“各种有效的案件事实”)组拼起来,使其与模板相契合,而这个组拼的过程实际上就是“量刑”的过程。幸运的是,我国对于一些高发、频发的罪名确定了明确的量刑标准,检察官可以相对轻松地完成;但是对于一些没有具体规定量刑建议的“其他罪名”,检察官只能根据自己的量刑经验、量刑惯例行使量刑权,在这个过程中又很容易受到即时情绪、家庭背景、成长经历等主观情绪的影响。可见,传统“拼图”量刑模式已经无法回应“量刑规范化”的时代需求。
上述的比喻虽然是假设的,但是其背后所掩饰的司法风险确是客观存在的。检察官由于自身局限性,只能通过套用模板来实现一般量刑与个别量刑的辩证统一。但采用这种模式提出量刑建议的弊端却显而易见,即相对独立的量刑活动容易造成量刑不规范的司法风险,只不过这种风险通常容易被“法官享有最后的量刑决定权”这一制度安排所掩盖。[12]随着“检务公开”的不断改革,检察工作在12309 中国检察网的公开让“演绎式量刑拼图”的可行性受到了质疑:即同类案件为什么具有相差较大的量刑建议?虽然将量刑建议权交由检察机关行使能够对审判机关形成制约,但是对于实践中出现的“量刑不规范”问题却始终无法予以正面回应,而智能量刑机制的意义恰在于此。
虽然智能量刑算法所采用的“归纳算法”与传统的“演绎量刑”大相径庭,但是在大数据的支持下,量刑规范化得以实现,而这主要归功于智能量刑机制的矢量量化逻辑。所谓“矢量量化逻辑”是指以司法大数据为依托,将认罪认罚起诉书中的事实证据、罪名认定、认罪认罚情况、刑事责任、法律依据等量刑建议构成模块化;同时以频繁项集算法(Apriori 算法)、K-Means(k 均值聚类算法)为规则,挖掘出一个罪名及其量刑出现的频率,确定罪名与量刑之间的关联程度,简单地说,就是指罪名x 与量刑y 同时出现的概率;之后根据不同模块之间的关联度(association)匹配出合适的K 值,即在没有任何条件的影响下,需要给与罪行B 的最佳量刑值。这意味着,检察机关提出的量刑建议是被算法反复验证匹配后得出的最恰当的结果。智能算法的量刑逻辑并非基于规范性法律文件,而是立足于大量已决个案。将经验作为量刑逻辑的经验主义论显然是法律形式主义者的直接批判对象。①法律形式主义认为,法官以理性、机械、深思熟虑的方式将法律推理应用于案件事实,法官在量刑时受到诸多规则和指引约束。由于认罪认罚案件大多数是“典型类案”,如果放任由经验算法主导量刑逻辑的话,可能会直接导致某一罪名的法定刑发生变化,更有甚者,可能会与立法本意相背驰而行。因此,应当对认罪认罚案件中的矢量量刑逻辑进行功能限定:即存在类案,且此类案件也是如此量刑的,同时不得附加任何主观判断。
二、人工智能介入认罪认罚量刑机制的司法适用难题
湖北省、安徽省检察院已经陆续开展相关的试点工作,使智能量刑机制介入认罪认罚领域从理论探讨拓展到司法实践反思,结合智能量刑机制在认罪认罚案件的司法实践情况以及社会反馈的情况来看,智能量刑机制在实际运行中仍然存在一些问题。
(一)人工智能技术应用于认罪认罚量刑机制的技术困境
近年来,最高检高度重视科技强检工作,加强人工智能技术检察应用的顶层设计,实现基层检察工作的转型升级。然而,将人工智能技术应用于认罪认罚案件的量刑过程中,至少存在以下技术性难题:
1.数据的技术性难题
人工智能介入量刑领域遇到的第一个技术性难题就是数据难题。智能量刑机制的数据难题具体概括为以下几种情况:其一,数据滞后。大数据的前提条件是拥有海量数据。由于我国特殊的司法体系,检务公开的力度本身就不是很大,不同环节的司法数据以及涉及个人数据方面的统计很多都不全面,导致我们目前关于检务方面的数据更新相对比较滞后。其二,检务数据不真实。司法数据的实质是大量数据的组合,但是大量的司法数据并不是真正意义上的司法数据。其三,检务数据不客观。不同的检察官会秉持不同的刑罚理念,而不同的刑罚理念往往会产生不同的量刑结果[13]。其四,自然语言处理基础技术不成熟。虽然很多研究机构宣称自主研发的智能量刑机制已经通过了图灵测试,但是仍有很多制约因素,如中文分词、词义消歧等问题都会直接影响到计算机对人类语言的理解。智能量刑系统数据难题的产生原因,除了现有的技术发展水平不足外,还有一些政策性原因,如根据我国保密政策要求,我国各级检察机关构建的统一业务应用系统在保密级别上属于机密级系统,无法实现不同机关之间的数据共享。
2.算法的技术性难题
人工智能介入量刑机制领域所遇到的第二个技术性问题就是算法难题。算法的技术性难题主要包括两个方面:一是由算法技术水平的落后所导致的系统整合问题;二是由于算法的封闭性和秘密性所引起的算法黑洞问题。就第一个方面而言,现代司法领域中所适用的智能量刑系统主要以贝叶斯分类算法为基础算法,利用概率统计的知识对司法大数据进行分类;再辅以知识图谱算法对分类数据进行分析,并利用可视化的图谱形象地展示量刑规律。但是,由于法律知识与技术知识割裂,这两种算法在系统整合上存在脱节的情况。此外,知识图谱在构建过程中,其信息抽取能力的精准度与预期相差甚远,使得智能量刑系统还处于一个初级阶段。另一方面,基于技术保密、商业利益等因素所引起的“算法黑箱”(black-box)①算法黑箱是指在人工智能输入的数据和其输出的答案之间存在我们无法洞悉的“隐层”。导致检察官、诉讼当事人对于人工智能介入量刑建议领域心存顾虑。2016 年美国的Loomis 案正是算法黑箱在司法领域的典例[14]。在State v.Loomis 案中②See State v.Loomis,371 Wis.2d 235(2016).,卢米斯认为初审法院在量刑判决参考了COMPAS 风险结果,侵犯了其正当程序权利。虽然该案最终以威斯康星州最高法院驳回上诉终结,但是针对该案所引起的争论和探讨却并未随之结束[15]。许多专家和学者对该案的最终判决提出了质疑,认为此裁判无论从程序上讲还是从实体上讲都是不公正、不客观的[16]。该案说明,将人工智能技术引入量刑机制可以在一定程度上缓解司法机关目前所面对的“案多人少”的矛盾,加快刑事诉讼活动的进程,但是人工智能技术中所隐藏的“算法黑箱”也有可能存在损害公民基本权利的风险[17]。
(二)人工智能技术应用于认罪认罚量刑机制的可靠性问题
当今我国将人工智能技术应用于司法领域正在如火如荼地展开。日媒称,“中国在司法领域的人工智能正在伺机赶超美国……”,肯定了中国的司法人工智能技术,但从人工智能技术的实际现状来看,现有的人工智能研究主要侧重于性能方面的突破,其可靠性也是一个不容忽视的问题。
1.数据标准多样化引起的智能量刑机制可靠性问题
在司法实践中,以智慧检务的应用为例,人工智能在检察工作中的司法应用所涉及的人工智能算法要素可能包括犯罪嫌疑人的出生年月、家庭住址、经济状况、犯罪前科等内容。但是,由于我国目前并未制定统一的算法适用规则或算法适用标准,因而各级检察部门在研发智能量刑机制的过程中,都是各自寻找各自的开发商进行智能量刑机制的研发,开发商在研发的过程中都是根据自己的水平和认知进行设计,再加上很多检察机关对自己需要什么样的科技产品或者技术创新并没有清晰的认识,这样,不同的人工智能公司在研发设计智能量刑系统时就无法遵循通用的或者统一的数据规范。不同的检察机关与不同科技开发商合作的结果可能会导致不同的数据,而不同的数据又可能出现严重的质量异化问题,如可能存在使用大量的静态代码进行分析,而同一个自然人的年龄、住址等信息由于不同代码的区分,会在不同的应用系统中出现权重或者数据对比不一致的问题。这些不同级别检察机关构建的大量质量迥异的数据就会直接影响到根据人工智能技术得出的量刑建议的可靠性。
2.算法歧视引起的智能量刑机制的可靠性问题
算法歧视(Algorithmic Bias)又被称为“大数据杀熟”,是指人工智能在算法演算的过程中可能会侵犯到公民的基本权利。为了避免检察官在进行量刑时受到法律之外因素的影响,Northpointe 公司研发COMPAS 系统对犯罪嫌疑人进行风险评估,即是否有再次犯罪的可能。但是,ProPublica 却发现,该系统在实际运行中存在严重的种族歧视问题①ProPublica 组织通过跟踪调查7000 多名犯罪嫌疑人发现,COMPAS 这一算法系统性地歧视了黑人,白人更多被错误地评估为低犯罪风险,而黑人被错误地评估为高犯罪风险的概率是白人的两倍。。[18]更应予以注意的是,由于算法的设计、数据的选择、数据的输入都是由技术人员进行操作的,而技术人员是否能正真理解公平的内涵,是否能够客观公正地将规范性文件、指导意见和相关政策不偏不倚地转化为代码,都值得怀疑。倘若智能量刑机制的开发者在设计算法之初就将自己对某一社会问题的刻板印象,如对从事性服务行业人员的鄙夷、对同性恋群体的歧视,抑或对虐童案件、性侵案件、情杀案件的深恶痛觉导入智能量刑机制中,那么根据存在算法歧视的智能量刑系统得出的量刑建议本身的可靠性、公平性就值得认真审查和研究。
(三)人工智能技术应用于认罪认罚量刑机制的周延性问题
智能量刑机制的周延性问题主要探讨的是认罪认罚量刑理念在智能量刑理念中出现时,智能量刑理念是否能够反映认罪认罚量刑理念的全部外延。研究人工智能技术应用于认罪认罚量刑机制的周延性问题,实质上就是研究演绎推理与归纳推理之间的关系。
1.不完全周延是归纳推理的通病
人工智能介入认罪认罚领域主要是为类似、频发的案件提供一种解决方案。当检察官与当事人达成量刑协商来解决纠纷时,总是倾向于采用“演绎推理”的方式。所谓“量刑演绎推理”是指在量刑过程中的推理,用三段论来表达法律、事实和量刑上的逻辑联系。检察官在采用演绎推理方式进行量刑时既可以遵守一般的法律规定,同时又能够充分考虑个案情况,实现个案公平正义。[19]恰恰相反的是,智能量刑系统却是以归纳推理为基础而建立起来的,通过对海量案件的整理归纳、分类分析总结出众多案件的量刑逻辑以及案件之间的关系。它在享受归纳推理经验性优势的同时,也承继了归纳推理容易出现的不完全归纳的通病。换句话说,即智能量刑机制虽然能够以归纳推理的方式从众多案件中筛选出与之相类似的案件,并依经验法则提出适当的量刑建议,但值得注意的是,它对于个案中存在的具体差异始终无法予以正面的回答。
2.不完全周延所引起的程序回转问题
司法个案公平作为司法工作的生命线,以归纳推理为基本逻辑研发的智能量刑机制必然会对其“周延性”提出质疑。法律上存在因果关系影响量刑客观基础,即量刑的“果”是由犯罪行为这个“因”所造成的。这就意味着归纳推理中的因果关系必须是一个全称判断,即所有的S 是(不是)P①全称判断是指断定一类事物全部都具有或都不具有某种属性的判断。,由此引发出“休谟问题”②休谟问题即所谓从“是”能否推出“应该”,也即“事实”命题能否推导出“价值”命题。:能否根据有限经验而获得一项全称判断[20]?在认罪认罚量刑活动中,检察官在量刑协商的过程中由于受到有限认知与既往量刑经验的影响,所提出的量刑建议往往也会获得犯罪嫌疑人的认可,而以归纳推理为算法逻辑的智能量刑机制所推导出的量刑建议往往容易受到当事人和其他诉讼参与人的质疑。我国在大力推进“智慧检务建设4.0 案例”的构建,尽管考虑到归纳推理所存在的天然不周延的问题,只能“参照适用”而非“一定适用”,但是对于智能量刑周延性问题,有学者认为在人工神经网络、深度学习算法、海量案例数据的共同作用下,智能量刑机制的不完全周延最终会被有效完善。有效完善不等于彻底解决,智能量刑机制的周延性问题往往是导致程序回转的重要因素,而这恰恰与在认罪认罚从宽制度中引入智能量刑机制的初衷背驰而行。
三、人工智能介入认罪认罚量刑机制的实施路径
(一)建立理论预测与实证预测并轨的验证程序
为避免智能量刑机制陷入纯经验式或者纯理论式研发,可以建立理论预测与实证预测并轨的验证程序,确保输出的量刑建议是建立在理论支持、实证支撑、相互验证等环节下推出来的合理的预测结果。
1.理论预测
理论预测是指将量刑基本原理导入人工智能技术,运用技术手段对量刑的原则、方法、情节以及基准等要素进行分析后输出理论上的预测量刑建议。在构建智能量刑理论预测时要注意以下问题:
一是量刑规则是量刑建议规范化、精准化的基础。智能量刑机制在设计过程中,要不偏不倚地将刑法、司法解释、各级量刑规范指导文件、指导案例等规则转化为编程语言,确保量刑预测是在量刑规则的统一指导下得出的规范结果[21]。同时要以地域为分割点,根据个案情况自动检索匹配到各省的具体量刑情节,以刑法、司法解释为最高指令,以各地量刑指导意见实施细则为运行指令,根据具体情况给出适当的量刑建议。
二是算法设计与知识图谱的整合。由于认罪认罚案件不同于普通的量刑案件,在构建知识图谱时,可以利用大数据技术,将数据挖掘、信息处理、引文分析、共现分析、知识计量等方式结合,并利用可视化的图谱展示认罪认罚案件中量刑活动的核心结构、条文适用、判断逻辑、量刑规律等。[22]此外,由于智能量刑机制研发的最终目的是为认罪认罚从宽制度服务的,智能量刑机制的设计者在设计算法的过程中,应与检察官、司法工作人员通力合作完成数据治理、知识加工、算法设计以及样本标注等工作。在预测结果输出后,还要对预测结果进行评估、问题反馈,供工程师们进行迭代优化。
三是提高自然语言处理水平。不同于普通语言,起诉书中的法律语言是检察官经过反复斟酌后选择的最严谨、准确的法律术语,如何使用计算机算法去分析和理解法条表述、法律语言、思想理论,是实现机器深度学习的前提条件[23]。具体包括以下步骤:其一,根据起诉书的行文特点设计专门的分词系统。相较常规语句的分词规则而言,法律法规、法言法语的分词断句是依托于每个法律术语背后的法律逻辑,因而显然有必要设立专门的分析系统来帮助计算机理解法律语言。其二,建立法律概念语料库,将法律领域语料库作为训练语料,避免陷入词汇的表层理解。其三,使用LSTM(长短期记忆网络)、BMES 模型对法言法语进行序列标志,解决依存句法问题。其四,将具体的法律词语转化为词向量后映射到具体的案件中,深度学习法律语言背后的法律思维和原理。系统层层递进衔接,反复计算矫正,计算机的自然语言处理能力就会越来越强,使量刑建议的输出越来越规范、精准。
2.实证预测(数据预测)
起诉书中蕴含着丰富的信息,包括当事人的犯罪行为信息、认罪认罚信息、量刑协商信息、法律适用信息等,而这些恰恰是聚集检察院“大数据”的核心要素。深度挖掘起诉书背后所蕴含的“数据红利”来分析量刑态势和总结量刑规律,无疑为智能驱动量刑规范化发展站在更高的起点上出奇制胜,提供了独一无二的量刑经验。具体包括以下内容:
一是实证挖掘司法大数据的经验和规律。采用关联规则挖掘算法在海量的认罪认罚大数据中提取相关的内容,并在此基础上通过基于平衡树的索引来发现隐藏在司法大数据中难以直接用肉眼进行观察的量刑经验与规律。
二是实证辅助确定量刑参数。量刑模型的构建是以量刑参数为“地基”,参数的选取直接关系到量刑建议的公平性。由于不同的地区对具体量刑参数设置了不同的系数值,智能量刑系统如何从海量数据中抽取相关参数成为困扰实证预测的主要难题。具体可采取以下步骤:(1)利用NLP 算法,以地区、罪名、罪行为关键词进行多条件检索抽取,锁定参考案例范围;(2)采用算法清洗对海量经验数据进行分析、清洗;(3)适用聚类分析法、通线性回归分析法将同时满足量刑情节的类案聚类分析,计算该组案件的量刑参数,并生成量刑情节与量刑参数之间的调节比例。此外,为规避系统在进行实证预测的过程中出现算法风险,在实证预测系统中可引进无监督预警机制。如若实证预测系统生成的推荐值偏离法律法规、地方量刑规则的规定,实证预测将会展开二次预测。
三是个案与类案的精准匹配,具体包括定罪事实的匹配和认罪认罚态度的匹配。不论是犯罪嫌疑人主观认罪、悔罪的积极态度,还是赔偿损失、退缴赃款、达成和解等表现行为,都是具体个案与司法数据库快速匹配的对象和参考依据。只有在量刑情节上做到精准匹配,才能够充分保障人工智能辅助认罪认罚量刑预测的精准性,从真正意义上实现“同案同判、类案类判”的实体公正。
3.相互检验
为防止量刑预测走向“纯实践性”或“纯理论性”两个极端,显然有必要采用理论与实践并行的预测系统。只有输出的量刑预测不存在不合理的差异,才能保证该量刑处理能够最大限度地接近司法正义。
理论预测与数据预测两者之间从本质上讲是实然与应然之间的关系。理论预测属于应然层面的做法,即对量刑进行理论上的预测,推导出量刑建议,其建议并未受到司法实践的检测。实证预测则属于实然层面的做法,即根据实践情况对量刑进行预测,但是其推导出的量刑建议并不一定能够得到理论上的支撑。由于理论预测与实证预测之间存在天然的瑕疵,若是将两者进行割裂,显然会破坏智能量刑系统的整体运行。故应以理论预测为基准与“活着的”量刑经验和规律互相矫正,形成一个完整的逻辑验证链条,以排除、修正预测结果之间存在的偏差或漏洞。
(二)重视算法的伦理设计与当事人的诉讼权利保障
1.重视算法的伦理设计
一是增强算法的透明性。按照透明性原则,检察机关需要对智能量刑系统的数据质量、可信度、准确性、误差范围、采样范围、缺失值、机器学习过程中训练数据的规模等进行必要的说明。此外,检察机关还应当在特定条件下向公众公开那些统计模型、源代码、语义分析时的关键变量值、特征权重等信息,让公众和当事人明白智能量刑机制在执行的计算过程的具体运行步骤,从步骤A得到步骤B,推导出C,得出D 的结论,改变以往直接根据A 得到D 的算法模式。
二是加强算法的可解释性。为了改变当事人和公众的“算法盲区”,需要检察官对智能量刑系统的算法计算进行解释,在具体的实施过程中可以采用“概念激活向量测试”(TCAV),直观显示运算所依据的量刑逻辑、量刑参数、量刑基准、数据库范围等,以避免模型算法的一些短板问题。此外,要求检察官对量刑建议结果进行解释的另一个深层次的原因在于,需要检察官通过对拟合插值的分析来向公众解释各个变量之间的关联性,从而使该量刑结论成为合法的结论。
三是算法审计制度。定期对人工智能系统进行算法审计已经成为世界各国的通行做法,在认罪认罚案件中引入人工智能量刑机制与公民的人身权益息息相关,因而显然有必要构建算法审计制度。具体而言,可以从以下两个方面展开:一方面,智能量刑系统的开发商和检察机关要定期进行自我审查,如小包工的同步系统升级;另一方面,充分发挥第三机构在算法审计中的作用,如ProPublica组织。因此,在完善我国智能量刑机制的过程中,检察机关和有关开发商可以将智能量刑系统交由第三方机构进行定期审查,建立开发者自律与第三机构共同参与的多元主体协同算法治理模式。
2.加强对当事人诉讼权利的保障
虽然智能量刑机制是检察机关为解决同案不同判、案多人少等司法矛盾而发动的一场技术革命。但是,量刑建议的后果却“实实在在”落在了社会普通公众身上。因此,如何加强对当事人诉讼权利的保障、提高当事人对“智能量刑”的信心是推行“智能量刑机制”过程中不能忽视的一个重要问题。
一是为当事人提供专业人士的帮助。当事人、辩护人和诉讼代理人往往会因为自身对智能量刑机制的知识盲区而陷入“信息茧房”。检察官在履行信息开始义务对诉讼当事人进行量刑解释时,很可能会将当事人置于汪洋数据中,使其很难从中检索真正有用的信息。因此,为当事人提供专业人士的帮助就显得尤为重要。允许当事人寻求“专家帮助”来弥补自己因“技术文盲”而陷入“算法盲区”。
二是增加智能量刑算法选择程序。智能量刑机制是在审查起诉阶段嵌入了一种全新的“决策方式”,即在检察官之外重新确立了一个“案件决策思维”。虽然为当事人提供者专家辅助帮助有助于保障当事人的知情权,但是由于这是一个“全新的量刑方式”,应当赋予社会公众选择权。具体设置为:在检察机关审查所有的证据材料之后,由检察官直接向犯罪嫌疑人提问“是否接受预测的量刑”。若犯罪嫌疑人同意,则检察官直接将预测量刑写进认罪认罚具结书中交由当事人签名盖章算法。智能量刑机制在分析案情、预测量刑的过程中,检察官不得主动干预、审查预测结果。实现智慧检务的高效性也是为了保障“同案同判”和“量刑规范化”。
结语
在人工智能技术高速发展的时代背景下,探索检务工作智能化的工作也在如火如荼地进行。在此环境下,通过智慧加持量刑助力认罪认罚从宽制度更具其现实需要。当前检察机关已经自上而下地认识到智慧检务的构建需要智能量刑机制的加持,并根据有关指示和要求研发设计智能量刑系统,这为人工智能介入认罪认罚案件量刑领域提供了有力的政策保障。在此条件下,如何论证智能量刑机制加持认罪认罚案件的司法价值,从理论上阐明其司法逻辑、从实务中归纳其司法困境、从根本上提出解决路径具有非常重要的现实意义。