现实与理想:检察机关智能建设现状考察与未来展望
——以Z市G区检察院智慧检务试点为分析样本
2021-05-25杨焘,杨宁
杨 焘,杨 宁
(1.吉林大学 法学院,吉林 长春 130012;2.四川省自贡市贡井区人民检察院,四川 自贡 643101)
引言
拥有人工智能则拥有未来,法律人工智能成为近两年中国法学理论界和实务界的热点话题。理论界探讨人工智能对整个法律体系、法律制度及部门法等传统法学理论方面的影响①例如,李晟教授认为人工智能的广泛运用将会重构公众认知法律的模式,重构法律规则本身的形态进而重构法律的价值导向,参见李晟:《略论人工智能语境下的法律转型》,载《法学评论》2018年第1期,第98-107页。王利民教授提出民事法律制度中的人格权制度、知识产权保护、侵权责任认定和承担等都需要随着人工智能技术的发展而进行必要的调整,参见王利民:《人工智能时代对民法学的新挑战》,载《东方法学》2018年第3期,第4-9页。马长山教授提出人工智能在带给人类巨大进步与福利的同时,也带来了不可忽视的伦理风险、极化风险、异化风险、规制风险和责任风险,需要塑造风险社会的法律理念,参见马长山:《人工智能的社会风险及其法律规制》,载《法律科学》2018年第6期,第47-55页。,实务中最高人民检察院检察长张军强调“要紧紧抓住信息化建设带来的机遇,大力加强智慧检务建设”,各地各级检察机关纷纷研发种类繁多、功能各异的人工智能系统。然而,理论界对于这道热题的研究路径仍局限在话语层面反复讨论司法人工智能的可能性、风险性等通用、概括的问题,对于司法人工智能的实践运用现状及效果的考察提之甚少。实际上,基于长期实证研究训练得以成就的统计分析能力,能够成为与人工智能界跨界合作的关键性助手②左卫民:《从通用化走向专门化:反思中国司法人工智能的运用》,载《法学论坛》2020年第2期,第22页。。通过对S省Z市G区检察院人工智能具体运用的实证分析,可以探究检察机关的人工智能建设是否取得了实质性突破,从而正确认知话语层面轰轰烈烈的热闹景象背后司法人工智能的运用实践。
一、研究样本的选取及试点实践
为探究地方检察机关在人工智能建设中的实际成效,本文选取了S省Z市G区检察院的相关数据为样本进行分析。G区检察院位于Z市中西部,地处川南中心地带,在全省215个检察院中脱颖而出,被确定为全省唯一的智能语音识别系统建设试点单位,成为S省检察机关推广人工智能系统建设的经典模式,具备研究样本选取的典型性与代表性要求。为了探究G区检察院智能系统研发与运行的实际状况,课题组采用文献收集、阅卷、访谈、实地观察以及问卷调查等多种调研方法,选取跨越智能系统适用前后的2017年1月至2019年8月为研究时间段,采用全样本调查和随机抽样调查等方法,将动态数据与静态数据相结合,尽量避免抽样可能带来的误差,以保证数据的全面性与代表性。③通过对G区检察院58位干警发放电子问卷的方式进行全样本调研,问卷内容涉及智能系统的识别准确率、故障解决、使用培训、对人工智能的态度等多个方面,调研对象包括检察官、检察官助理及行政人员,年龄涵盖20岁到60岁群体,收回有效问卷58份。第一次随机抽取10位检察官,通过集体访谈与个别交流的方式了解其工作内容与时间分布,对使用智能系统前后的阅卷时间与讯问时间、智能系统使用率及参与智能系统研发等方面进行调研与访谈;第二次随机抽取10位检察官助理,通过集体访谈与个别交流的方式了解其工作内容与时间分布,对使用智能系统录入盗窃罪与交通肇事罪等案件的录入与修正时间进行访谈与统计;第三次随机抽取10位检察官,观察其2017年至2019年检察官个人收案、结案与所属部门收案、结案之间的关系。G区检察院截至目前已建立智能语音系统、要素式审讯系统等智能系统并投入运行,以机器换人力,以智能增效能。
(一)智能语音系统
智能语音系统通过机器学习联想、语音识别,将输入的语音实时转写为文字,并根据不同检察工作场景生成特定化笔录。目前已建设完成5个智能语音讯(询)问室、4个智能语音会议室,70台客户端安装智能检务输入法,广泛应用于案件信息录入、阅卷笔录制作、法律文书起草、文字材料撰写等检务工作,快速精准定位和比对录音录像数据材料,帮助检察官快速审理多个案件,缩短审讯周期,提高办案效率。
国内使用智能语音系统的司法机关不在少数,但办案人员和犯罪嫌疑人的普通话水平差异较大,在一定程度上影响语音识别的准确率,还有许多司法机关在实际工作中会大量使用方言办公,并且在越接近群众的基层机关使用方言办公办案的现象越普遍,例如G区检察院88%的办案人员在检察业务中的第一工作语言为本地方言。①采用全样本调研的方式对G区检察院58位检察干警发放调查问卷,调研其工作中适用的语言主要为自贡地区方言还是普通话或其他,51位被调查对象表示其工作中的第一语言为自贡地区方言。对此,G区检察院在成功研发普通话智能识别技术的同时,将智能语音识别与本土方言相结合,成功研发自贡地区方言语音识别技术,每分钟识别字数约为400字,识别准确率达85%以上,产生的垃圾信息控制在15%以内。②采用全样本调研的方式对G区检察院58位检察干警发放调查问卷,调研智能系统产生垃圾信息的比例,47%的被调研对象表示垃圾信息控制在1%-5%,41%的被调研对象表示垃圾信息控制在6%-15%,10%的被调研对象表示控制在16%-30%,仅有2%的被调研对象表示垃圾信息会超过30%。这种将普通话与方言双重语音识别系统创新运用于检察实践的举措,促进了智能系统建设的人性化与科学化,实现了检察办公办案智能高效化。
(二)要素式审讯系统
基于检察工作审查证据、排除非法证据、合理怀疑,形成证据链的核心需要,G区检察院与科技公司合作,通过与检察统一业务平台对接,自动同步录入5000余例盗窃类案件材料,通过OCR自动识别将讯问笔录整理成文字,并按照文书类型、卷宗文书段落内容等进行自动分类与归档处理,把文本中无结构化信息进行结构化或半结构化处理,由人工智能专家对关键要素进行词法、句法、语义等标注并进行统计模型的训练,通过关联分析、序列挖掘等数据挖掘算法完成要素提取模型的构建,检察官点击鼠标选中目标笔录,系统会自动识别其中的作案时间、作案地点、共同犯罪、作案手段、作案工具、财物损失、赃物去向等核心要素,直接生成要素明确的Excel列表,整个过程仅需几秒钟时间,即使一位从未阅卷的检察官也能够依据该要素表直接对案件进行针对性审讯。③课题组随机抽取一份盗窃罪的六份讯问笔录进行智能要素提取,整个过程耗时约5秒钟,关键要素按照讯问次数、作案时间、作案地点、作案手段、作案工具、赃物去向等六个要素依次排列,案情清晰明了。相较于办案人员依赖个人能力和经验对几百页甚至几千页的案卷材料手工排查证据间矛盾的传统提取方式,智能要素系统大幅度缩短办案时间,提高提取精准性,提升讯问针对性。目前G区检察院研发的要素式审讯系统已覆盖所有类型的盗窃案件,并将继续进行案由拓展,最终实现覆盖基层检察机关常用的二十多种案件类型的审讯工作,助力智慧检务。
二、人工智能系统的效果评述
(一)检务工作效率提升
效率是刑事司法追求的目标之一,检察工作效率的提高对于提升整体司法活动的效率具有重要意义。以G区检察院为例,目前检察机关致力于提升检务工作效率,通过人工智能系统实现语言转换、模板填充、要素提取等功能,大幅度缩短信息录入时间,打破传统庭审壁垒,减少因空间产生的非必要损耗,减少检察人员在大量重复性、机械性事务中的时间损耗,将有限的精力集中于创造性与能动性事务。
1.案件办理时间减少
随机抽取10位检察官进行访谈,了解检察官的工作内容一般由阅卷、讯问、会见律师、汇报或讨论案件、制作法律文书及出庭支持公诉等方面组成,其中阅卷、讯问、制作法律文书耗时占比高达60%,这类准备工作量大耗时且结构性特征明确,在这些领域借助人工智能语音识别、要素提取、模板填充等功能,能够大幅度缩短准备工作耗时,缩短办案周期。G区检察院适用智能系统后,平均办案周期缩短约20%-30%,大约缩短2-3个工作日。①课题组分别随机抽取10位检察官与检察官助理进行调研与访谈,了解其办案周期在智能系统适用前后的变化,80%的被调查对象表示办案周期平均缩短20%-30%,大约缩短2-3个工作日,15%的被调查对象表示有些简单案件能够缩短5-7个工作日,5%的被调查对象表示缩短时间难以量化。
具体而言,交通肇事类案件贴近日常生活且难度较低,适用智能系统识别准确率较高,过去对交通肇事罪进行讯问一般需要2.5个工作日,形成2000-3000字的讯问笔录,而适用智能系统后同类案件办理时间相应缩短至1.5个工作日,节省40%的工作时间。②课题组随机抽取了办理交通肇事罪的三位检察官与三位检察官助理,就适用智能系统前后整理提纲及讯问时间的变化进行访谈,被调查对象均表示通过传统方式对交通肇事罪进行讯问,需要耗费2个工作日进行提纲梳理,0.5个工作日用于路途往返及讯问,其中讯问的时间仅仅2小时左右,而适用智能系统后仅需1.5个工作日进行提纲整理工作,通过远程讯问仅需1小时,节省了往返路途的不必要时间耗费。特别是针对基层检察机关常见的盗窃罪研发智能要素提取模型后,将依靠工作人员手动对几百页甚至上千页的案卷材料进行人工审查与要点提取的方式以系统自动提取犯罪金额、赃物去向、作案手段、作案方式等要素的方式替代,将工作耗时由2-3个工作日缩短至几秒。调研统计了部分检察官就盗窃罪适用系统前后阅卷时间与讯问时间的变化情况(参见图一与图二),对于简单盗窃案件,适用系统之前的阅卷时间一般为4-8小时,讯问时间为1-4小时,适用系统后的相应耗时均缩短近一半,效率提高50%左右,对于某些复杂盗窃案件而言,节省阅卷时间的效果更为明显。对于证据材料多的案件适用要素提取系统之后阅卷时间由15个工作日缩短至4个工作日,效率提高近70%。案件的阅卷与讯问耗时缩短,办案周期缩短,效率提高。
图一:简单盗窃案件的阅卷与讯问时间(小时)
图二:复杂盗窃案件的阅卷与讯问时间(工作日)
2.检察官与检察辅助人员比降低
检察机关采用检察官+检察官助理及书记员(以下统称检察辅助人员)的工作模式,由检察辅助人员负责接收案件、辅助阅卷及讯问、记录、制作法律文书及文书送达等准备工作,此类辅助性工作量大耗时,导致检察机关对检察辅助人员的需求量较大,实践中有的检察院通过向法学院校临时聘用法学生作为实习助理的方式分担检察辅助人员的工作。①例如笔者曾经实习过的C市某基层检察院长期与法学院校建立长期的临时实习助理合作,由法学院校派遣优秀的法学生前往检察院担任为期6个月的实习助理一职。G区检察院2017年1月至11月检察官与检察辅助人员的比例为1,年底突击清案阶段对检察辅助人员的需求量骤升,比例增加至1.29。当人工智能系统语音识别、模板填充等功能大范围适用于笔录、法律文书制作等机械性、重复性事务,解放了检察辅助人员的双手后,2018年适用人工智能系统后年末突击清案阶段检察官与检察辅助人员比例不升反降至0.91,与2017年同期相比降低0.38个百分点,特别是2019年要素式审讯系统运行后,同年7月与8月的检察官与检察辅助人员比例降至0.75,与2018年同期相比降低0.36个百分点(参见图三),这一举措大幅度降低了检察官对检察辅助人员的需求和依赖,提升了检务工作效率,节省了人力资源。
图三:检察官与检察辅助人员比①特别说明:调研数据统计截止至2019年8月,所以9月至12月的数据无法提供。
3.积存案件比降低
检察院的收案数由上期未结案件数(以下简称积存案件)与新收案件数构成,积存案件的数量能反映一个检察院的办案效率。分析G区检察院2017年至2019年8月的存案情况,发现该院往期存案主要有盗窃类、交通肇事类、侵犯财产类、妨害社会管理秩序类等9类案件,其中以盗窃、交通肇事及毒品犯罪等三类为主,各类型案件的积存案数在2017年至2019年总体呈现下降趋势,2019年1月至8月积存案件数为148件,占总收案数的59.44%,与2017年同期相比降低9.73个百分点,总体下降趋势较为平缓,但是盗窃类和交通肇事类案件呈大幅度下降趋势。以交通肇事类案件为例,2017年1月至8月积存案件数为29件,占总收案数的80.56%,2018年1月至8月与2019年1月至8月的积存案件率分别比2017年同期降低20.56个百分点、37.7个百分点(参见图四与图五),经分析,此类大幅度下降是因为引入了智能系统。②2017年至2019年8月的新收案件变化不大,分别为90件、92件及101件,交通肇事罪的新收案数分别为7件、4件、8件,且案件难度较为稳定。通过前文的分析可知,检察官与辅助人员的配比从1降至0.75,因此办案人员、新收案件数及案件难度等因素对积存案件量变化的影响并不明显,从而可以判断这样大幅度的下降趋势由智能系统介入所引起。数据来源:G区检察院内部案管数据库。
图四:G区检察院2017年至2019年1-8月各类案件存案情况
图五:G区检察院2017年至2019年1-8月的积存案件情况
智能系统介入检察业务缩短案件平均办理时间,提升工作效率,使单位时间内办理更多案件成为可能,从而使收案在规定时间内办结,正常审限内结案率①正常审限内结案率=正常审限内结案数÷结案数。上升,减少了案件积存量。G区检察院自从2018年逐步运用智能系统辅助办案后,正常审限内结案率不断上升,特别是2019年4月要素式审讯系统投入运营后,呈现智能语音、远程提讯与指挥系统三位一体辅助检察业务的模式,正常审限内结案率基本呈直线上升趋势,2019年5-8月的正常审限内结案率增至72.88%,较2017年同期增长24.96个百分点(参见图六),2019年5-8月盗窃类案件正常审限内结案率增长至95%,比2019年1-4月环比增长57.5个百分点(参见图七)。正常审限内结案率提高,积存案件数则相应减少,从侧面反映出智能系统对检务工作效率的提升。
图六:整体审限内结案数
图七:盗窃罪正常审限内结案情况
(二)检察官规则意识增强
智能系统对所有案件统一按照法律规定进行要素划分与关键信息提取,从程序与实体层面保证同类案件所运用的标准为统一标准,按照法律规定的审限控制案件办理进度,维护当事人的时限利益,在确保程序公正的前提下追求实体正义。
1.程序预警,严防违规
检察实践中存在部分检察官为了节约办案时间、节省精力而忽略某一程序、遗漏某一程序的现象,特别是员额制改革减少了检察官数量,案多人少矛盾愈发凸显,某个检察官分担部门大部分案件甚至一个部门只有一个办案检察官的情况较为普遍,为了节省办案时间而忽略对某些信息核对或忽略审限的情况常有发生。随机抽取10名检察官了解其2017年与2018年个人收案与对应部门收案的情况,有两名检察官连续两年的收案量占据部门收案量的一半以上,有三名检察官连续两年办理整个部门的案件,案件量多时高达125件,80%的检察官表示在案件办理过程中曾遗漏对犯罪嫌疑人身份信息、是否委托律师、是否同意适用简易程序以及是否有前科等情况的讯问与核对,60%的检察官表示案件量较多的情况下会对某些案件的审限发生记忆混淆,以致有的案件超过审限而得不到处理。①在调研过程中随机抽取10位办案检察官,了解其2017年与2018年的收案数、办案过程中是否有遗漏当事人信息核对或超过审限等情形,8位检察官表示曾遗漏对犯罪嫌疑人身份信息、前科情况、委托律师等信息的核对,6位检察官表示其在办案过程中曾存在超过审限的情形大约为50%,两位检察官表示超过审限的情形约为66.67%。
适用智能系统后,所有案件在平台全程管控,自动对当事人信息进行核对与空缺填补,程序之间环环相扣,缺少上一环节则无法进入下一环节,确保每一个重要信息都经过办案人员的核对,细化办案流程,杜绝因为案件简单、易办而使检察官在心理层面放松对案件关键信息的审查,导致遗漏或错误识别案件重要要素的情况。如果有违反程序的操作则会收到系统自动预警与提示。同时系统首页显示每个案件的办理期限,自动向办案人员推送临近审限的案件,超过审限的案件必须进行情况说明并报请部门负责人批准才能延长。G区检察院适用智能系统后,2019年1月至8月,在结案数保持基本稳定的情况下,审限延长率②审限延长率=审限延长数÷结案数。降至37%,比2017年同期降低14.3个百分点(参见图八)。因此,我们必须承认没有物质欲望和感情生活的机器可以比人更少地受到外界因素的干扰③参见张保生:《人工智能法律系统的法理学思考》,载《法学评论》2001年第5期,第14页。,从办案基本操作层面增强检察官的规则意识,减少办案过程中程序随意省略与交叉的行为,保障程序公正。
图八:2017年至2019年1-8月审限延长情况
2.办案质量提升
智能系统介入检察业务,将检察官与辅助人员从大量烦琐而重复性的各类文书制作、阅卷提取关键要素等工作中解放出来,检察官将更多精力集中于检察监督工作和提高案件质量上,在提升办案效率的同时也保障了个案程序公正的实现。G区检察院2017年的上诉率呈现直线上升趋势,并在2018年1-4月达到最高值16%,2018年智能语音识别系统、远程提讯与指挥系统投入运行后上诉率开始呈现下降趋势,并于2019年1-4月降至最低点,与2018年同期相比下降16%。虽然2019年5-8月上诉率有上升趋势,但是幅度较为平缓(参见图九)。尤其是盗窃类案件,自2018年初智能语音识别系统投入运营后开始呈现下降趋势,并在2019年1-4月与5-8月下降至最低点,与2017年9-12月相比降低了30.7个百分点(参见图十)。虽然上诉率的大幅度下降难以排除其他因素的作用,但从一个侧面反映了智能系统在提升办案质量方面的效用。
图九:2017年-2019年整体上诉情况
图十:2017-2019年盗窃案的上诉情况
三、有效但有限:当前人工智能建设的局限及其原因
基于前文的描述与分析,发现当前法律人工智能在一定程度上增强了司法人员的规则意识,在技术性及辅助性工作中发挥了提高工作效率、节约司法资源的积极作用,但这并不意味着我国检察领域的人工智能建设已取得实质性突破,实践中真正有用并投入常态化运营的智能系统并不多,在关涉效率与公正等司法决策的真正难题上仍是浅尝辄止,普遍存在盲目追求智能范围的广度而忽略深度、忽视司法活动的多元化与差异性、技术开发与一线需求断层等问题。
(一)认识误区:追求智能范围的广度而忽略深度
在我国“要紧紧抓住信息化建设带来的机遇,大力加强智慧检务建设”与“将积极推动人工智能在司法领域应用”的背景之下,各地各级检察机关独立与科技公司合作研发智能产品数量多、涉猎范围广,但研究深度令人担忧。首先,对人工智能的认识不足,导致市场上充斥着大量“伪人工智能”。所谓人工智能,其核心特征是能够如人类一般进行自主思考的“拟人性”,人工智能的自主性不同于机械的自动化。①参见刘艳红:《人工智能法学研究的反智化批判》,载《东方法学》2019年第5期,第120页。当前,检察机关的某些产品虽被冠以“智能”标签,但“人+电子化”的运作模式揭示其仅仅是一种电子化的信息办公方式,将办案方式由线下转化为线上,虽然信息化办公方式是建立在人工智能运用基础之上,是信息化时代纠纷在线解决的一种发展方向,尤其今年特殊的疫情形势促使全国不少法院大力开展广泛的在线诉讼②参见左卫民:《中国在线诉讼:实证研究与发展展望》,载《比较法研究》2020年第4期,第167页。,但这并不意味着能够等同于人工智能本身。例如,G区检察院研发并投入使用的远程庭审与指挥系统,突破传统庭审模式的空间局限,实现法官在科技法庭内部、公诉人员在检察院远程庭审室、被告方在看守所远程庭审室以网络视频的方式进行提审、庭审和宣判等活动的远程同步,将公诉人从往返法院、等候开庭等环节中解脱出来,使各类诉讼数据流在法院、检察院、看守所 “三点传递”实现跨界融合,号称让出庭公诉人具备连接“外脑”③赵志刚:《智慧检务的五个“A”》,载《中国检察官》2018年第6期,第37页。的能力,能够提升重大案件的公诉质量。但整个过程以网络视频、诉讼数据在线传递以节省“非必要时间损耗”为主,并未产生经过计算机自主思考的“额外知识”,其实质仍是信息化时代办公方式的数字化或在线化。④参见左卫民:《从通用化走向专门化:反思中国司法人工智能的运用》,载《法学论坛》2020年第2期,第18页。其次,个别化的投入模式使得投入产出率不高,甚至许多智能产品由于技术缺陷或违反诉讼规律而并没有适用的土壤。例如,G区检察院在盗窃罪智能要素提取模型投入使用并取得良好效用的情形下,进一步规划研发非法吸收公众存款罪的智能要素提取模型,但数据反馈该院2014年至2018年非法吸收公众存款罪案件数仅3例,涉案人数仅8人⑤数据来源:G区检察院内部案件管理系统。,即使耗费高昂的人力、财力突破技术障碍研发成功,也难以得到高效适用。申言之,忽略实践适用的土壤,盲目追求智能产品的数量与范围的广泛性,耗费有限的人力、财力制造出无用武之地的科技产品,既无法充分满足社会公众对便捷化、个性化司法服务的需求,也无法有力回应司法人员对智能化司法的期待。①左卫民:《大数据与人工智能的司法实践》,载《中国法律评论》2018年第2期,第25页。
(二)直接复制通用技术:忽视了司法活动的多元化与差异性
毋庸置疑,当前智慧检务建设在文书制作、语音识别、要素提取等辅助性检察活动中取得了一定的成功,大幅度提升了办案效率,但是不论智能语音识别还是智慧要素提取,皆是对通用技术的直接复制,而非专门针对检察活动开发的专业化法律人工智能,围绕通用技术进行的外围研发并未触及检察活动的核心业务,忽视了司法活动的多样性与差异性。智能要素提取系统基于5000份判决进行结构化或半结构化处理,通过数据获取、模型训练、关联分析、序列挖掘等数据挖掘算法完成要素提取模型的构建,其实质仍是对“通用技术+通用流程”的直接复制②参见王禄生:《论法律大数据“领域理论”的构建》,载《中国法学》2020年第2期,第263页。,强调从海量数据中自动提取知识,追求算法的准确性而忽略了法律语言背后的法律条文及法学理论。就智能要素提取系统中证据提取及校验审查功能而言,清单式指引虽然能够为办案人员收集、固定证据提供指引,对证据进行校验、把关、提示与监督,确保侦查、审查起诉的案件事实及证据经得起法律检验,但不可否认,上述指引及校验要素皆是利用通用技术对海量数据进行的表面化提取,将海量数据中的高频要素进行琐碎化与形式化列举,至于这些要素在不同的犯罪构成要件说、不同案件程序之中的差异化表现则不予过问。其实,证明活动是刑事司法的核心,而刑事诉讼中的主要证明事项就是构成要件事实③参见[日]小野清一郎:《犯罪构成要件理论》,王泰译,中国人民公安大学出版社,2004年版,第241页。,当前智能要素提取系统按照“犯罪构成——证据分布——证据收集指引”的模式指导证据收集④参见冯俊伟:《刑事证据分布理论及其运用》,载《法学研究》2019年第4期,第182-183页。,但是犯罪构成在理论界一直存在四要件说、三阶层说及两阶层说的争议,选取哪一种学说作为证据指引与校验的起点,所对应的证据收集截然不同。侧重于入罪的四要件与侧重于出罪的三阶层构成要件设计决定着证明的方向、证明范围及举证责任的分配。两种学说各有利弊,在当前刑事司法中未形成通说认识,证据要素智能提取的制定者应该采用哪一种学说进行证据清单式列举并无定论。再者,所有刑事案件都可以粗线条地划分为认罪案件与不认罪案件,根据认罪与否决定其所要适用的诉讼程序,适用的诉讼程序不同,所要证明的程序性事实及实体性事实也不同,所对应的证明对象亦不同。普通程序需要对指控的犯罪事实进行严格证明,以法定证据形式及证据能力的证据作为证明的根据,而适用简易程序的案件在证据范围、证据调查程序及有罪证明标准等方面都出现了不同程度的松动,简化证据调查程序⑤参见闵春雷:《严格证明与自由证明新探》,载《中外法学》2010年第5期,第695页。,适用不同程序所需要收集的证据及审查校验侧重点显然不同。当前“通用技术+通用流程”在存在犯罪要件学说争议及案件程序适用多元化的情形下进行差异化的证据提取,忽视了法律领域对知识获取过程因果性和可解释性的特殊需求。
(三)双向度障碍:技术开发与一线需求断层
目前,我国法律人工智能系统主要由检察院等司法机关与科技公司合作研发,研发人员以技术公司的专业技术人员与检察院内部的技术人员为主,真正使用智能产品的一线办案人员则几乎没有参与研发。例如,G区检察院智能语音系统研发周期约为60天,研发人员主要为科技公司技术人员5人及检察院内部技术人员10人,真正使用系统的一线办案人员则很少参与研发,这就导致出现技术人员与法学专家脱节、技术开发与一线需求断层的现象。①参见王禄生:《论法律大数据“领域理论”的构建》,载《中国法学》2020年第2期,第258页。这种现象是直接复制“通用技术+通用流程”导致智慧检务建设在方法论层面过度关注技术逻辑,忽视法学理论的嵌入与支撑的必然结果,技术主导需求,出现完全不考虑法学理论而进行应用开发的危险倾向,使得某些在通用领域取得巨大成功的技术在法律领域无用武之地。例如,现阶段种类繁多的智能系统几乎都包含类案检索功能,通过设置关键词进行类似案件的检索以供司法人员参考,从而保证结果的一致性与司法的权威性,但不论是基于“词频—逆文本词频模型”(TF-IDF)②TF-IDF 模型将文本划分为词与词的组合,根据不同词出现的词频计算两篇文本之间的相似度。进行词向量维度案件的相似度计算还是“基于Transformer 的双向编码器表示模型”(BERT)③BERT模型把法律文本转换为向量进行表示,关注词、句子、段落、位置等信息,通过双向编码、三层嵌入等方式完成向量表示,进而通过不同文本之间的向量计算相似度。计算不同文本向量维度的相似度,均没有实现法律领域专业知识的介入,不同法律表述、法律与事实之间复杂的相互作用并未得到揭示与分析,基于此得出的“类案”只是法律表述高度一致的相似案例,而非真正意义上的“类案”④参见王禄生:《论法律大数据“领域理论”的构建》,载《中国法学》2020年第2期,第264页。。访谈过程中了解到该系统的实践效果并不如预期,通过该系统检索出大量法律表述相似的案例,需要耗费大量时间与精力进行法律角度的解读与分析,以找到真正的类案予以参考。可以说,该智能系统仅发挥了从海量案例库进行粗略信息筛选的初步作用,其准确性与可解释性无从谈起,在实践中得到适用的机会与效果并不如预期。而脆弱性是人工智能系统的一个关键特征,人工智能系统能够在非常狭窄的任务上胜过人类,也可能在看似微小的细节上轰然失败⑤熊秋红:《人工智能在刑事证明中的应用》,载《当代法学》2020年第3期,第88页。,如果任由技术主导需求,过度关注技术逻辑而完全不考虑法学理论进行应用开发,必然会导致因某个数据细节干扰了其内在逻辑的错误结果却通过人工智能的反复应用而予以固化,造成对犯罪嫌疑人、被告人、被害人不可估量的伤害。
四、法律人工智能系统建设的未来展望
从某种意义上而言,法律作业方式的工业革命已经展开,并逐步向纵深延展⑥左卫民:《关于法律人工智能在中国运用前景的若干思考》,载《清华法学》2018年第2期,第121页。,可以预见在人工智能时代背景之下,法律领域人工智能化从处于辅助工具地位的“弱人工智能”阶段发展至完全脱离人类而产生独立意志的“强人工智能阶段”甚至“超人工智能阶段”将是时代发展的必然趋势。法律人工智能未来到底怎么做、朝哪个方向前进、限度为何等问题,需要从增强顶层设计、推动专门化技术创新、提升法律人的参与度等方面进行探索。
(一)增强顶层设计,明确法律领域人工智能的限度
目前,由地方独立进行法律智能系统研发的模式使智能产品遍地开花,建设主体多元化、标准差异化的研发模式使得智能系统涉猎范围广度有余而深度不足,数量繁多的智能系统之间存在一定程度的重复性建设,研发深度欠缺,使检察系统政策强调的一体化建设预设并未落地,智慧检务的潜能未被充分挖掘。智能产品贵在质量精而非数量众,因此,需要从地方、部门参与研发转变为官方高层统一规划,基于实践需求统一规划智慧检务的发展目标,各地在顶层总体规划的引导下结合本地实践及本院办理案件的特点进行特色化的针对性研究与创新。同时,“要紧紧抓住信息化建设带来的机遇,大力加强智慧检务建设”和“将积极推动人工智能在司法领域应用”的政策的大力支持并非意味着法律领域的人工智能建设不受限制。法律活动是在严格的三段论逻辑框架下进行的演绎推理,任何决定都必须在证明、推理与审议的基础上作出①参见季卫东:《人工智能时代的司法权之变》,载《东方法学》2018年第1期,第132页。,介入刑事司法系统的人工智能技术需要进行反复的法学理论论证,论证智能技术如何实现控、辩、审各方有效参与,对司法公正及人权保障的冲击与影响,全面确保技术的稳健性与可靠性,这也是域外人工智能研究历时已久且成果丰硕,但在刑事司法领域比其他领域更慢地采用人工智能技术的原因之一。因此,如何在智能技术与司法活动存在演绎思维冲突、说理思维冲突的情形下,尊重司法领域逻辑性与论证说理特殊性,明确法律领域人工智能化的限度,是需要法律人持续思考与探究的问题。
(二)推动法律领域专门化智能技术的创新
通用技术在其他领域获得的巨大成功并不意味着其在法律领域也能够大放异彩,法律尤其强调逻辑性与论证说理,是一门富含主观性与客观性的科学,既有可以量化的客观内容,也有无法形成统一认识的主观方面。直接复制“通用技术+通用流程”的研发方式,通过对海量数据进行表面化提取而将高频要素进行琐碎化与形式化列举,并未触及司法活动的核心,难以满足社会公众对便捷化、个性化司法服务的需求。今后,法律人工智能技术的发展应该立足于挖掘检察活动的专业特性,就证据收集及校验功能而言,需要遵循基本法理,承认司法活动的不确定性与复杂性,在“审判中心主义”与“认罪认罚从宽制度”二元机制的情形下,对数据库中的案件按照认罪与不认罪进行抽取与分类,再根据一审程序及二审程序或者简易程序、普通程序、速裁程序、特别程序进行二次筛选与分流,区分不同程序对应的证据数量、证明对象、事实性证据和程序性证据,对法律表述背后的法律条文与法学理论进行深度挖掘,对不同法律表述背后的法律关系、法律与事实认定的相互作用进行剖析,从而构建符合多元程序的差异化证据清单及校验审查指引模型。再者,量刑推荐作为司法大数据和人工智能开发的核心模块之一,实践中已有根据罪名、情节分类进行智能系统的构建,但在大力推进认罪认罚从宽制度实施的背景之下,目前利用通用技术构建的粗线条智能系统难以满足认罪案件量刑建议精准化的需求。量刑是一个非常复杂的问题,检察院与法院之间、法官之间、检察官之间产生的差异皆会影响量刑建议的精准性①参见左卫民:《量刑建议的实践机制:实证研究与理论反思》,载《当代法学》2020年第4期,第53页。,如何通过法律领域专门化智能技术将办案中形成的影响量刑的因素进行收集与整理,进行大数据分析后嵌入公诉案件智能审查辅助系统,设置统一的量刑建议标准,应是未来法律领域人工智能技术发展的重中之重。
(三)提升法律人在智能建设中的参与度
卡多佐大法官多次强调,“法学发展的真正源泉,法律真知的真正来源,必定是法律的实践和社会现实”②[美]卡多佐:《司法过程的性质》,苏力译,商务印书馆1997年版,第4页。,而精通法律实践与社会现实的无疑是法学专家、一线实务工作者。因此,应当注重提升法律人在智能建设中的参与度,以“需求主导,技术统筹”为原则,从法律人的真正需求出发,对表象数据背后的法律条文与法学理论进行深度挖掘与分析,让技术研发从法学家、实务工作者的专业角度出发健康发展。值得注意的是,虽然当前我国检察官的素质不断提高,本科学历已成为检察官的基本学历要求③左卫民,谢小剑:《检察院内部权力结构转型:问题与方向》,载《现代法学》2016年第6期,第18页。,但是检察人员的计算机水平差异较大,对智能系统几乎是外行,缺乏对智能产品基础知识与技术的掌握,96.55%的基层检察人员表示人工智能系统出现问题时只能求助于专业的技术人员解决障碍④课题组对G区检察院58位干警发放调查问卷,了解人工智能系统出现故障时的解决方式,收回有效问卷58份,其中约56人表示通过求助专业科技人员解决,占比96.55%。,维护与更新智能系统只能依赖于专业科技人员。因此,要重视通过培训与宣传等途径增强法律人的大数据与人工智能意识,不断提升法律人的科技水平,使法律人才与技术人才紧密结合、相互理解,充分获知对方的需求与期待。同时,要注重革新法学研究方法,培育复合型人才。使用法律科技工具,或许未来成功的希望难以确定,但不使用法律科技工具,将永远没有成功的希望。⑤左卫民:《如何通过人工智能实现类案类判》,载《中国法律评论》2018年第2期,第32页。传统方式培育的法律人才缺乏人工智能及大数据知识,很难符合人工智能时代对人才的需求。而法律大数据的出现,使得基于法律大数据的司法实践与新型实证研究成为可能,并可能带来法学研究方式的革命性变化。⑥左卫民;《迈向大数据法律研究》,载《法学研究》2018年第4期,第139页。法律研究者应搭乘大数据发展的快车,创新法学研究方式,从研究和教育的源头培育符合新时代需求的法律与人工智能交叉的复合型人才。
结语
法律人工智能建设在全国如火如荼地推进,智慧检务建设要求抓住信息化发展的机遇,将人工智能科技与检察工作深度融合,解决依托传统方式难以解决或解决不好的问题,现阶段检察系统的智慧检务建设与探索虽取得了一定成效,但智慧检务建设是一项长期性的工程,机遇与挑战并存。通过从类案大数据检索、文书智能生成、程序智能预警、办案质效提升等方面对G区检察院人工智能系统建设现状进行数据分析,破解基层检察院人工智能建设进程中存在的盲目追求智能范围广度而忽略深度、忽视司法活动的多元化与差异性、技术开发与一线需求断层等问题,从加强顶层设计,明确总体的发展目标与法律人工智能的限度,强化法律领域专门化技术创新,提升法律人参与度及人才培养等方面对法律人工智能未来到底怎么做、朝哪个方向前进进行探究,使未来法律人工智能建设更为科学化、智能化、人性化,更好地服务于基层检察机关。