我国智慧司法研究的科学知识图谱分析
2023-01-03陈泓昊
付 凤,陈泓昊
(中南财经政法大学,湖北 武汉 430073)
党的十八大以来,习近平总书记把握时代大势、着眼当代中国司法发展新要求,提出“推动大数据、人工智能等技术创新成果同司法工作深度融合”。全国各地司法机关积极响应,逐步形成“大平台共享、大系统共治、大数据慧治”的信息化格局,研发出多款智能服务系统,例如江苏省检察机关的“案管机器人”、北京市高级人民法院的“睿法官”、浙江省监狱智慧矫治系统等。与此同时,这一理念在学术界掀起了一股研究热潮,产生了许多兼具理论价值和实践意义的研究成果。对学术文献的回顾与梳理,有助于突破现有研究局限,改进和提升智慧司法理论研究品质。为此,本文运用CiteSpace软件对我国智慧司法相关文献进行可视化分析,刻画该领域理论研究的发展进程、研究机构与主体、研究热点与主题,在此基础上对现有研究的局限及可能的改进路径进行反思,希冀能为后续研究提供有益参考。需要说明的是,为与当前我国智慧司法改革实践保持一致,本文“智慧司法”采用广义的司法概念,不单指审判环节,也包括审前和审后不同的诉讼阶段。
一、样本与分析方法
笔者分别以“智慧司法”“智能司法”“人工智能司法”“大数据司法”“司法”“算法”“人工智能”“大数据”“智能化”为主题词,截止日期为2022年4月7日,检索中国知网(CNKI)收录的CSSCI来源期刊和中文核心期刊,共检索到312篇文献,剔除新闻报道、书评及重复文献,得到有效样本291篇。
文献分析工具选择CiteSpace软件5.8.R3版本,该软件具有核心作者、研究机构以及关键词共现分析、关键词聚类、时间轴等功能,可以直观反映研究领域的热点话题、演进趋势以及未来走向等知识全景,亦能发现领域内部各关键词的相互联系及交互情况。[1]由于CiteSpace软件不具备直接分析CNKI数据库文献的功能,需先将筛选的文献从CNKI数据库中导出为Refworks格式,通过CiteSpace软件自带格式转换功能,将导出数据转换为软件可识别的格式。参数设置按照时间跨度为2001—2022年;时间切片值为1;分析对象选择关键词、作者、发文机构;其他设置不变,进行图谱可视化分析。
二、研究时间和研究力量分析
(一)发文时间和数量
2001—2021年,我国智慧司法文献发文量的时间分布图,(见图1)能够直观反映出该领域每年的学术研究情况和发展速度。
图1 2001—2021年智慧司法领域国家政策与文献数量趋势对比图
从图1中的“发文量”折线可以看出,尽管我国有关智慧司法的文献最早出现在2001年,但其后13年间,该领域的研究成果屈指可数。2014年始,有关智慧司法的文献开始出现增长趋势。进入2016年后,智慧司法领域的文献数量更是增长迅猛,从2016年的5篇增长至2021年的80篇,5年时间提升了15倍。为剖析不同时期有关智慧司法学术研究产出量不同的原因,笔者尝试对我国各时期相关国家政策进行了梳理,形成了图1中的“国家政策”折线。将“国家政策”折线与“发文量”折线进行对比分析可发现,智慧司法的文献数量总体上呈现出“与策同行”的特点,说明我国当前理论研究更关注司法实践的发展动态,有针对性地进行政策解读与知识生产。
为进一步梳理理论研究与国家政策间的关联性,本文对我国不同部门国家机关颁布的政策及其核心内容(关键词)进行了系统整理,形成表1。(见表1)
表1 我国智慧司法相关政策发布时间与部门
续表
不难发现,尽管早在2001年,张保生教授就在《法学评论》发表了《人工智能法律系统的法理学思考》一文,探讨了人工智能法律系统的历史及发展动力,人工智能法律系统研制对法学理论和法律实践的价值和意义,以及人工智能法律系统研发的困难、策略和应用前景。[2]该文也是我国智慧司法研究领域发表的首篇论文,被引次数高达237次,是该研究领域当之无愧的奠基之作。但从国家政策层面看,同时期智能技术尚未纳入国家重大战略决策范畴。随着大数据、人工智能从最初的抽象概念变成切实可行的应用技术,有关智能技术研发应用的国家政策自2010年开始增多,如公安部于该年颁布的《关于进一步规范和加强公安机关执法信息化建设的指导意见》。相较而言,公安部颁布的相关政策早于最高人民法院和最高人民检察院,并集中于大数据、公安信息化建设领域。2015年9月,国务院也印发了《促进大数据发展行动纲要》,部署大数据发展国家战略,这使得2014—2016年间大部分文献研究主题都与大数据应用有关,特别是大数据在侦查及其他警务工作中的运用。
2016年5月,国务院颁布《“互联网+”人工智能三年行动实施方案》;2017年国务院发布《关于印发新一代人工智能发展规划的通知》,确定了新一代人工智能发展三步走战略目标。相应地,自2016年起智慧司法领域发文量也保持连续上升态势,研究内容也从大数据的应用转变为“数据”与“算法”相结合的研究。
(二)研究者与研究机构
通过CiteSpace软件对样本文献的发文作者进行共现分析,(见图2)共现图谱中共有节点156个,说明我国智慧司法领域内发文作者数量较多,研究群体初具规模。具体而言,发文量排名前十的作者均来自高校,其中发文量最多的作者是刘艳红(6篇);其次是胡铭(5篇);左卫民、刘品新、宋业臻发文量也位居前列。共现图谱中节点间连线有41条,网络密度为0.0034,说明作者间的连线较少,网络密度一般,未形成高通达性的合作网络。申言之,合作关系多为两人间的合作且大部分局限于单次合作,尚未形成稳定且具有影响力的核心合作群体。同时,合作关系大都建立在高校研究人员之间,鲜有理论界与实务界的合作联动。
图2 智慧司法研究作者合作网络图谱
通过CiteSpace软件Institution模块对发文机构进行可视化,生成我国智慧司法领域研究机构合作关系图谱。(见图3)图谱中共有144个节点,57条连线,网络密度为0.0055,表明我国研究机构尚未形成较为稳固的合作群体,各机构之间缺乏深入的合作交流。其中,东南大学法学院、浙江大学光华法学院、中国人民大学法学院的研究成果显著,发文量均在10篇以上。按各类机构的发文量看,研究主体仍集中于高校。政府、社会组织、科技公司等机构在智慧司法方面的研究相对较少。除高校外,发文量最高的机构为上海市高级人民法院,排在第8名(3篇)。就地域分布而言,发文量较高的机构大部分集中在北京与江浙沪地区,这些地区较早开展智能化司法实践,合作关系也基本出现在以上地区的研究机构间。合作形式方面,除形成高校间研究型合作外,也形成了有限的其他类型的合作关系:比如,高校与实务部门之间(中国人民公安大学侦查与反恐学院和昆明市公安局);高校与科技企业之间(北京邮电大学和中国电子科技集团有限公司发展战略研究中心)。但不同类别机构间连线稀疏,成熟的合作研究团队较少,合作广泛程度也有进一步提升的空间。
图3 智慧司法作者发文机构合作网络图谱
三、关键词共现与词频中心性分析
(一)关键词共现分析
关键词是对论文主题的高度凝练与概括。[3]通过分析关键词出现频次和中心性,可揭示该领域具有代表性的研究热点及其关联程度。运用CiteSpace形成的关键词共现图谱中,(见图4)关键词的节点越大,则该关键词在文献中出现的频次越高。图中连线将文献中同时出现的关键词连接起来,从而构成我国智慧司法关键词共现图谱,连线越粗,说明关键词的共现关系越强。图谱中共有234个节点,279条连线,网络密度为0.0102,说明我国智慧司法领域研究大多集中在单一的主题和难点的探索中,尚不具备宏观的研究体系将研究领域中各微观主题涵摄在一起。
图4 我国智慧司法研究文献关键词共现图谱
(二)关键词词频和中心性分析
利用CiteSpace软件Keyword模块对关键词进行可视化,整理所得2001—2022年智慧司法领域词频前20的热点关键词及其中心性。(见表2)
表2 2001~2022年智慧司法领域研究文献的关键词词频与中心性汇总
在关键词词频方面,根据多诺霍公式可将我国智慧司法研究领域内词频大于22的关键词视为该领域的高频词。①表2显示,频次大于22的高频关键词有“人工智能”“大数据”“智慧司法”和“智慧法院”。其中,词频最高的关键词是“人工智能”,达到了130次。此外,“司法改革”“司法裁判”“司法”的词频均大于10次,说明司法改革作为推动智慧司法建设的源动力,亦受到了极大的关注,且智慧司法领域研究偏重法院审判方面。“算法歧视”“司法公正”“同案同判”“数字正义”等关键词,表明现有研究对如何保障智能技术应用的公平公正性也予以了较多关注。关键词中心性方面,中心性能够衡量一个关键词在整个研究网络中作为“桥梁”的能力,也就是连接其他两个节点之间最短路径的能力。表2中,“司法”“大数据”“人工智能”“算法”“司法公正”五个关键词在共现图谱中的“桥梁”作用明显,中心性均大于0.4。由于“大数据”“司法”以及“人工智能”是文献检索的主题词,排除主题词影响,可以发现“算法”和“司法公正”是构成智慧司法领域理论研究的核心词汇。此外,“智慧法院”“数字正义”的中心性也较高,均大于0.3,再次证明我国智慧司法领域的理论研究,着重思考如何保障审判环节的公平正义问题。
值得关注的是,就关键词词频与中心性的关系而言,从表2可以看出,词频与中心性两者之间不存在直接对应联系。一些关键词词频高,但中心性低,如“司法裁判”;也有一些关键词词频低,但中心性高,如“算法”。这主要是因为智慧司法的研究并不局限于裁判领域,还涉及侦查、刑事执行阶段再犯风险评估等内容,“司法裁判”显然难以作为关联这些内容的“桥梁”。但无论是辅助量刑、智能分案还是再犯风险评估的研究,都离不开算法的规制设计。
在关键词首次出现的年份方面,“大数据”首次出现在样本文献中的年份为2014年,有关“大数据”的研究先于“人工智能”“智慧法院”“智慧检察”。2018年前后,涌现出“智慧司法”“智慧法院”等关键词。“算法”和“数字正义”是2020年以来我国智慧司法领域又一具有强中介属性的研究视角。
综上可得出,“大数据”和“人工智能”在我国智慧司法研究网络中占据核心地位,不仅出现频次高,在知识网络中桥梁纽带作用突出。“算法”是我国智慧司法研究的基础性要素和关键支撑,虽然出现次数不多,但绝大多数研究的展开,都要以其作为基石。一方面,智慧司法研究起步于对大数据的挖掘与运用,时至今日,研究重心逐渐转向有关智能化的研究,即“大数据”+“人工智能”+“算法”。另一方面,我国现有智慧司法研究侧重法院审判环节,且如何在保持审判公正的前提下发挥算法优势,避免“算法歧视”,保证“司法公正”“数字正义”等,是理论界研究的重中之重。
四、关键词聚类分析
(一)智慧司法研究的知识组别
不同于核心知识的零散罗列,知识组群可通过关键词聚类,将处于离散状态的具有关联性的知识单元进行归类。[4]与共现分析相比,聚类分析可以根据数据的特点、规律等,对人、物及多种影响因素进行多元统计,把联系密切的关键词聚集在一起形成类团。因而聚类分析常被用于系统归纳研究主题,也可以直观揭示某一领域研究的主题演化路径。基于此,本文对样本文献也进行了关键词聚类分析。(见图5)
图5 我国智慧司法文献关键词聚类图谱
需要说明的是,聚类图谱主要依据模块值(Modularity简称“Q值”)和平均轮廓值(Silhouette简称“S值”),来衡量聚类的科学化水平。Q值>0.3说明聚类结果结构显著,S>0.5表示聚类合理,S>0.7表示聚类高效且令人信服。[5]对样本文献进行关键词聚类,形成图谱的Q值为0.8451,S值为0.9761,表明该聚类图谱划分出的类团结构是显著的,且聚类是高效、令人信服的,可据此对我国智慧司法研究的总体特征和发展趋势进行归类和分析。
结合关键词聚类图谱(见图5)和关键词聚类信息,(见表3)可对所得的11个聚类主题进行归纳分析。表3中聚类序号越靠前,表示聚类中的关键词越多,聚类规模越大。②
表3 我国智慧司法文献关键词聚类信息表
聚类0、聚类1、聚类3、聚类5、聚类6,从宏观的角度关注智能技术嵌入司法程序的基础理论研究,探讨智能技术运用于司法程序的可能性和正当性。其中,聚类0、聚类1、聚类6聚焦智能技术在司法实践中的应用领域,如数据分析、智能量刑、辅助执行、类案检索等;智能技术介入司法程序的实现路径,如案件要素标注、法律知识数据库建构、算法设计等;智能技术在司法程序中运用的风险与挑战,如算法的隐秘性与可能存在的偏见、复合型人才匮乏、数据运用的成本高昂与技术垄断等。聚类3则对智慧司法体系建设进行研究,主要探讨了智慧司法建设的伦理问题、智慧司法的价值功能等。③特别是智能技术在刑事司法领域应用的限度与定位,引发学术界广泛讨论。与技术界认为只要技术可以实现,人工智能在司法领域的应用就不应有所限制的观点不同,司法界对技术应用持“谨慎乐观”的态度,更认同司法领域的“有限智能化”。[6]聚类5关注刑事司法体系的智能化,即技术在刑事司法程序中应用的研究,既包括犯罪情报信息收集与分析、大数据侦查,也包括刑事执行阶段的犯罪矫治等。
聚类2、聚类4、聚类10,从微观角度关注智慧司法在具体场景中的运用。其中,聚类2围绕智慧法院建设进行展开,智慧法院是一个从国家顶层战略设计中提炼和凝结出的概念,被理解为一种新的法院运作形态,具有网络化、智能化、规范化和公开化等特征。[7]文献多探讨了智慧法院建设的主要目标、实施进路以及智慧法院运行中的挑战与应对。不少学者从我国国情出发,结合各地司法实践,提出了一系列具有本土化特色的智慧法院建设方案。例如,少数民族地区开展智慧法院建设,需要在尊重当地的风俗习惯和司法特性的前提下,从基础建设、规划设计、民族关照、协同治理、法治建设等方面进行总体构想和实践探索。[8]聚类4和聚类10偏重检察视角。聚类4较关注信息化对智慧检务建设的正面影响,如为检察工作减负增效,让监督管理更加精准,使诉讼监督程序更加公开透明等。而在聚类10中,多数文献就目前我国智慧检务发展的风险进行了研究和探讨,指出目前存在的隐患包括:信息共享与数据安全的矛盾、客观数据与主观输入的矛盾、技术研发中的重复建设以及科技进步与基础落后的矛盾等。[9]针对智慧检务不断上升和变化的各种挑战,学者们也从不同角度提出了应对路径,如合理界定智慧检务案件的适用范围,不断协调审判量化与自由裁量的矛盾,优化检察建议生成机制,实现信息共享,加强执行监督等。[10]
聚类7、聚类8则进一步细化对智慧司法功能和风险的研究,特别是智慧司法对“同案同判”“个案正义”的促进作用,以及智能技术对引导法官形成正确价值判断的实现路径。同时,也关注智能技术介入司法程序的时机、限度、路径等问题。有学者从司法审判的角度,提出应“将差别审判与事后监督相结合,即在明确人工智能适用范畴的同时,辅之程序性保障,以期规避实践中可能产生的种种缺陷,最大程度地发挥其价值。”[11]
聚类9关注区块链技术对证据认定与证据标准制定的影响。当前我国区块链技术在司法系统中主要运用于存证、验证和传输证据方面,具有分布式账本、智能合约、产生的数据可溯源和不可变性、信息对称和信息透明、技术信用、自动处理等独特功能,有助于保障司法公正和提升司法公信力。
(二)智慧司法研究的发展进程
通过时间线视图(Timeline View),可以分析我国智慧司法理论领域研究热点的演变趋势,回顾我国智慧司法研究的发展进程。(见图6)从时间维度来看,我国智慧司法研究领域的理论成果可以归纳为两个阶段。
图6 我国智慧司法研究领域文献关键词时间线视图
1.萌芽起步阶段:2014—2016年。图6所示,2014—2016年关键词数量较少,关键词“大数据”在2014年首次出现,以其作为核心内容的理论研究初见端倪,研究内容集中于大数据技术在职务犯罪侦查和检察工作中的应用等。且“大数据”这一关键词的延续性较好,虽然其首次出现的年份较早,但与2021年最新产生的关键词仍存在共现关系,作为桥梁纽带,串联研究领域内各关键词,推动了智慧司法研究向前发展。
2.蓬勃发展阶段:2017年至今。2017和2018年,最高人民法院和最高人民检察院分别提出了建设“智慧法院”和“智慧检察”的行动方案;(见表1)同时,公安部也有类似的大数据与信息化建设规划④,以大数据、云计算、人工智能为技术驱动的警务改革也取得迅猛发展。[12]这些都为我国智慧司法领域理论研究的蓬勃发展奠定了实践基础。图6中,该阶段以“人工智能”作为核心节点,小影响力节点不断涌现,研究热点的多样化逐渐形成,研究领域走向多元。“数字正义”“同案同判”“个案正义”等关键词的出现,体现了理论界对实务工作的积极关注与回应。未来,伴随着我国政策导向与实务界的积极探索,智慧司法领域理论研究也必将保持现有上升态势,进入深化拓展阶段。
五、结论与建议
(一)我国智慧司法领域的研究和应用前景广阔
从文献和相关政策的发布时间来看,理论研究时常对政策实践做出回应,大数据、人工智能相关政策、实践规范的形成,对我国智慧司法的理论研究起到一定促进作用。正如左卫民教授所说,纵览全球,中国通过官方顶层设计支持司法和公共领域大规模运用人工智能技术的力度远超其他国家。[13]“互联网+”“信息化”“数字中国”等关键词,连续多年被写入政府工作报告。从发文作者和发文机构来看,虽然我国智慧司法研究力量间暂时缺乏更多跨领域、跨学科的合作交流,但研究群体已初具规模。随着智能技术在司法实践中运用领域的不断拓展,应用能力的不断增强,智慧司法领域的理论研究热潮也必将延续下去。
(二)我国智慧司法领域研究的短板
当前我国智慧司法领域理论研究的不足,集中体现在以下三个方面。
首先,我国智慧司法的主流研究方法以思辨式研究为主,缺少实证化研究方法的运用。文献关键词共现、聚类及词频中心性分析表明,我国学者多从一般逻辑层面探讨人工智能、大数据、算法在司法程序中应用的可能性与正当性,鲜有文献从技术逻辑切入,研究当下智能技术在具体司法场景中应用存在哪些特殊问题。理论研究还停留在传统法学圈子内,缺少从统计学角度阐释智慧司法实务现状、未来发展方向的学术成果。此外,目前智慧司法的域外研究多局限于对域外经验的介绍、评述,缺乏立足本土化,将域外经验转化为具有中国模式的智慧司法研究新思路。
其次,我国智慧司法的研究者与研究机构缺乏跨领域、跨学科、跨地域的合作。理论研究理应为制度优化、实务工作提供前瞻引领,但现有多数成果限于研究者自身专业领域,在合作关系上没有取得突破,无法在视角和技术路径上有所创新,降低了理论研究对智慧司法实践中新变化、新情况的识别能力,难以为实务工作提供及时充分的理论供给。
第三,智慧司法研究方向集中于审判阶段,审前阶段和执行阶段的研究相对欠缺,不利于智慧司法全流程的均衡发展。
(三)完善我国智慧司法领域研究的具体建议
1.丰富研究范式,凸显本土化特色。随着智慧司法发展的纵深推进,对不同场域的智慧司法运行效果及影响因素的研究将成为未来研究的重点,未来可以更多地运用实证研究范式,从不同角度考察智慧司法的运行效果,为完善智慧司法制度设计、提高智慧司法运行效能提供更多的实证数据支撑。此外,在比较借鉴域外成功经验的同时,也应立足我国的基本国情,结合现实情况,化育具有中国特色的智慧司法理论研究成果,促进我国司法体系的现代化转型。
2.整合研究力量,促进政产学研一体。智慧司法是一个涉及多学科交叉互融的综合性研究领域,既包含人工智能、大数据、算法、区块链等新兴科技的设计和解读,也包含运行风险、法律规制、法治难题、治理理念等法律层面的考量和完善,对智慧司法具体实践的深入剖析,需要精通法律又懂技术的复合型跨界研究团队。知识积累和创新,也需要不同领域研究机构和学者之间的交流合作,形成核心学术群体和多机构的协同研究平台,构建高效的学术交流机制,促进学术研究的良性发展。因此,今后应加强司法机关、技术公司和高校研究机构间的合作:司法机关最了解智慧司法实践应用中的痛点、症结所在,更能客观科学地验证理论成果及高新技术产出的实效问题;技术公司为高校研究机构、司法机关提供实践数据支持、技术指导、技能培养;高校研究机构在司法机关与技术公司之间发挥“桥梁纽带”作用,即通过司法机关了解实务中的具体应用场景,探求实践对智能技术的切实需求,同时,通过技术公司厘清各类智能技术的应用特性,探明智能技术在运用时存在的风险,并从制度设计的层面进行风险规避。易言之,高校研究机构能够凭借其在协调双方需求时所具有的天然优势,进行知识生产和理论供给,促进智慧司法三方研究机构的协同发展,实现应然层面与实然层面、技术层面与理论层面的互补。
3.拓宽研究视角,推动理论体系均衡发展。随着智慧司法实践的不断深化,智慧司法研究不应局限于审判环节,还应关注诉讼不同阶段智能化、信息化的理论研究,实现研究体系的平衡发展。且智慧司法的理论研究还应考虑不同地域的发展情况,致力于打造全国性、区域性的研究合作团队,针对不同地域智慧司法的实践情况,对症下药,给出高质量、有针对性的学术研究成果,弥合不同地区理论研究水平的差异性。同时,在理论体系建构方面,应进一步细分智能技术的应用领域,深入比较通用技术(如人像识别、图像识别、智能转写)和专门技术(如证据指引、量刑辅助)在司法领域应用中产生的问题的共通性和特殊性。明确不同阶段智慧司法的研发目标,厘清不同概念间的表达龃龉,如“法院/检察院信息化2.0”“法院/检察院信息化3.0”的界定,为进一步解决实践掣肘筑牢理论根基。
六、结语
本文采用文献计量和精读代表性文献相结合的方法,回溯我国智慧司法的研究历史,梳理研究脉络,归纳热点主题,反思研究存在的问题并提出相应的对策建议,旨在推进我国智慧司法理论研究不断发展。当然,本文所采取的研究方法虽能快速呈现该领域的研究概况,但也存在局限性:如基于CiteSpace软件性能,本文仅针对期刊文献,无法对著作、研究报告等进行全面分析,可能导致部分核心研究者和研究机构的分析结论有失偏颇;对于热点主题的分析以关键词为切入点,但期刊文献可能存在关键词与研究内容不能完全对应的情况,希望后续研究中能通过其他研究方法予以完善。
注释:
②根据聚类结果,第11及以后的聚类所包含的关键词频次较少,对研究结果影响甚微,故只取频次前11的聚类。
③其中较为典型文献,参见罗洪洋、李相龙:《智能司法中的伦理问题及其应对》,《政法论丛》,2021第1期,第148-160页;冯姣、胡铭:《智慧司法:实现司法公正的新路径及其局限》,《浙江社会科学》,2018第6期,第67-75、85页。
④时任公安部部长郭声琨在全国公安科技信息化工作会议上表示,要“积极适应大数据时代信息化发展新趋势,大力实施警务大数据战略,大力加强科技成果运用,强化顶层设计,避免重复建设,不断提高公安工作信息化、智能化、现代化水平,为公安事业发展进步提供有力的科技引领和信息支撑”“要主动拥抱大数据、人工智能新时代,树立前瞻性的思维与眼光”。参见《全国公安科技信息化工作会议在京召开 孟建柱提出要求 郭声琨讲话》,《人民日报》,2017年6月21日第4版。