大数据分析在法律监督中的应用
2024-05-10翁跃强
翁跃强
实施数字检察战略是检察机关深入学习贯彻习近平法治思想和习近平总书记关于大数据战略重要论述,适应数字时代发展新趋势,实现法律监督高质量发展,助力法治监督体系建设效能提升的重要举措。应勇检察长指出:“数字检察是数字中国的重要组成部分,是数字中国在检察机关的具体体现,其根本是赋能检察机关法律监督,促进检察办案更加公正、检察管理更加科学、检察服务更加精准,推进检察工作现代化。”〔1〕巩宸宇:《应勇在北戴河与数字检察工作专题研修班学员座谈》,《检察日报》2023 年6 月20 日。大数据之于新时代检察机关法律监督,既为监督质效提升释放出前所未有的动能,也为基层法治实践和社会治理提供了重要启示和路径。本文着重围绕“大数据分析在法律监督中的应用”开展研究,以期通过研究建构大数据分析在法律监督中应用的具体路径和长效机制,助力加快推进“数字检察战略”,实现法律监督模式变革重塑,以检察工作现代化更好服务中国式现代化。
一、大数据分析在法律监督工作中的应用现状
2017 年6 月,最高检印发《检察大数据行动指南(2017—2020 年)》,并正式提出“检察大数据战略”。2021 年6 月,“大数据”在中共中央《关于加强新时代检察机关法律监督工作的意见》中被赋予新时代法律监督路径方法的重要角色。2022 年1 月全国检察长(扩大)会议上,检察大数据战略在“以大数据法律监督赋能新时代检察工作高质量发展”的学习研讨中被提升到新的高度。同年11 月,最高检成立数字检察工作领导小组及其办公室,推动实施“数字检察战略”〔2〕2022 年11 月最高检成立数字检察领导小组及其办公室后,“检察大数据战略”更名为“数字检察战略”。。应勇检察长先后于2023 年3 月17 日全国检察机关学习贯彻两会精神会议、4 月21 日调研北京市检察院第二分院、6 月19 日在北戴河与数字检察工作专题研修班学员座谈、7 月19 日大检察官研讨班、9 月13 日调研山西检察大数据中心等重要会议、场合下,通过一系列的讲话释放数字检察战略走向纵深发展的强烈信号。应勇检察长在北戴河与数字检察工作专题研修班学员座谈时深刻指出,“推进数字检察战略,重心是立好数字检察的‘四梁八柱’,形成‘业务主导、数据整合、技术支撑、重在应用’的工作机制。‘重在应用’是目的。要聚焦以检察工作现代化服务中国式现代化这个检察中心任务,聚焦更好履行法律监督职能,聚焦‘高质效办好每一个案件’,充分发挥数据要素效能,以数字检察辅助监督办案、优化检务管理、助力检察为民、深化诉源治理,促进检察机关依法一体履职、综合履职、能动履职。”〔3〕同前注[1]。这深刻阐释了何为数字检察战略、数字检察战略何为的具体思路。通过多年的实践探索,数字检察不再是个别先行地区的探索创新,大数据已深入检察业务工作的方方面面,“数字革命”已成为驱动新时代检察机关法律监督整体提质增效的关键变量,数字检察工作在全国检察机关各个业务领域广泛开展,并逐渐形成一套科学、成熟、高效的工作体系。
(一)运用大数据开展法律监督的目标任务
运用大数据开展法律监督,大数据是手段,法律监督是目标,核心价值就是通过大数据运用与检察办案的深度融合,实现法律监督模式的重塑变革。实现这一核心价值,需要三个层面的支撑。一是能够获取执法司法信息和第三方数据。要通过建立健全司法各单位协同办案机制,打通部门间的数据壁垒,解决“数据孤岛”问题,实现检察业务数据、政法协同数据、行政协同数据、第三方公共数据的集纳与管理。二是要有“个案办理—类案监督—系统治理”的监督思维。大数据思维的核心内容,是在个案办理过程中发现典型性、规律性问题,通过特征梳理、归纳分析,从海量数据中筛选批量监督线索,开展类案监督,再从中发现制度机制、管理治理等方面的典型性、普遍性问题,从法律监督视角提出社会治理检察建议,办成一批案件,促进一域治理。三是形成贯通“四大检察”的融合监督模式。在2023年的大检察官研讨班上,应勇检察长特别强调,“新征程上推动‘四大检察’全面协调充分发展,要坚持依法一体履职、综合履职、能动履职,真正做到既敢于监督、善于监督,又依法监督、规范监督。”通过建立审查、调查、侦查“三查融合”机制,大力推进“四大检察”之间的协调配合,有利于优化检察资源、完善内部制约、提升监督效果。
(二)运用大数据开展法律监督的客观基础
随着信息技术飞速发展和国家大数据战略深入实施,大数据在经济社会高质量发展中的作用愈加重要。新形势对检察机关也提出了新的更高要求,检察机关在推进法治体系建设、推进国家治理体系和治理能力现代化等方面的作用日益凸显。回顾我国检察机关大数据法律监督工作的历史沿革及工作依据变化,无不为今天的数字检察战略奠定了深厚底蕴。
一是技术基础。近年来,检察机关深入贯彻习近平法治思想,加快智慧检察建设,推动大数据管理与检察办案和服务平台建设,形成涵盖“四大检察”的数字化检察产品,基本构建了功能完备、便捷高效、线上线下相结合,具有普惠性、公益性、精准性、便捷性的公共检察服务体系,总体上使得内部流转更顺畅,外部参与更充分,满足了检察环节全过程不同人员角色的实际需求,用数字化方式进一步拉近检察机关与人民群众的距离。如部分检察机关通过微信、支付宝等软件打通与外部的交互通道,通过开发APP、小程序等辅助检察技术开展线上服务等。与此同时,大数据、云计算、区块链等技术作为数字检察的重要手段,如政法一体化办案、律师网上阅卷、电子卷宗等系统的开发,成为推动检察工作改革发展的主要助力。
二是制度依据。党的二十大报告专门强调“加强检察机关法律监督工作”,中共中央《关于加强新时代数字机关法律监督工作的意见》为理解检察机关作为国家的法律监督机关的宪法定位提供了新场景,也赋予检察工作新的政治责任和历史责任。中央政法委《关于加强政法领域执法司法制约监督制度机制建设的意见》提出,“健全完善智能化制约监督体系,全面建成政法各系统内网、电子政务外网为主干的政法网络格局,推进执法司法业务线上运行、线上流转,实现实时记录、全程留痕。”中央政法委《关于充分运用智能化手段推进政法系统顽瘴痼疾常治长效的指导意见》也提出,“探索建立检察大数据法律监督平台。充分发挥检察机关法律监督职能,围绕‘四大检察’监督需求,畅通检察监督大数据归集调用,收集公安机关受立案数据、法院裁判文书和刑罚执行机关罪犯考核奖惩等执法司法办案数据,以业务应用场景为主导,打造专题监督模型,通过对海量数据的智能筛查、对比分析,发现异常线索,实现精准监督。”检察机关法律监督必须适应数字时代发展的需要,既要抓本的提升,以求极致的精神强化法律监督,做到止于至善;又要抓质的嬗变,以“数字革命”驱动新时代法律监督整体提质增效。〔4〕参见贾宇:《论数字检察》,《中国法学》2023 年第1 期。相关政策、要求对大数据法律监督提供了更明确的依据和更丰富的内涵,提出了更深层次的期许,不仅破解了大数据法律监督探索实践的依据争议,也与当前法律监督工作流程重塑的逻辑相匹配,充分调动了检察机关的履职能动性,推动数字检察工作不断走深走实,开启了大数据法律监督更高质量发展的新阶段。
三是数据积累。构建大数据法律监督模型以数据为基础,检察机关通过信息技术开发、信息资源利用和合理化改造,在业务数据化的过程中逐步形成了检察大数据库。2014 年检察业务应用系统1.0 上线运行,全国检察院在同“一张网”上完成全流程办案,开启了检察业务的大“数据”时代,截至2021 年检察业务应用系统2.0 上线前,全国检察机关共办理各类案件5100 余万件,生成法律文书超过1 亿份。〔5〕参见史红美:《全新迭代,亮点满满!检察业务应用系统2.0 来了》,微信公众号“最高人民检察院”,2021年11 月3 日。2.0 上线后,进一步实现了检察业务平台与政法平台、行政执法平台对接,巨大体量的业务数据仍在源源不断地进入数据库。2021年浙江省检察院启动检察大数据法律监督平台建设,对接内外部数据需求,目前“浙江检察数据应用平台”(以下简称数据应用平台)已上架80 项2.54 亿条标准化数据〔6〕参见吴帅帅:《数字检察如何磨砺法律监督之剑》,《新华每日电讯》2023 年5 月6 日。。这些数以亿计的检察机关内部数据、其他司法执法机关业务数据甚至是互联网开放数据,为开展大数据法律监督提供了充分的样本数据。
(三)运用大数据开展法律监督的实践探索
近年来,全国检察机关深入贯彻中共中央《关于加强新时代数字机关法律监督工作的意见》要求,以进一步加强为目标,积极探索构建大数据法律监督新体系,引领检察工作实现高水平飞跃,逐渐将数字检察优势转变为数字赋能检察工作胜势。一是形成“数字赋能监督,监督促进治理”的监督路径。各地检察机关探索运用大数据推动类案监督线索的分析研判,逐步放大个案的办理效应,特别是着眼于司法执法权力运行及社会治理的难点堵点淤点,通过数据共享、场景多跨、工作协同,以高质量法律监督助力提升国家治理体系和治理能力现代化水平。如某基层院针对办案发现的随迁子女辍学失管、非法用工、违法犯罪等问题,构建“随迁子女权益保护”数字场景,发现辍学失管、非法用工、强制报告等线索100余条,开展融合监督,推动职能部门建章立制、协同处置,打造随迁子女权益综合保护体系,有效破解城市发展进程中特殊群体保护领域的社会治理难题。二是架构“一域突破,全域共享”的监督格局。打通多级数据,避免重复建设,提升大数据法律监督规模效应。如山东省检察机关在本地部署应用一体运行的数据应用平台,为办案人员申请数据、构建模型、打造场景提供“一站式”平台支撑,全省检察机关已利用该平台建立近百个大数据法律监督模型,部分使用频次高、跨区域复用性强、监督成效显著的场景在该平台上线,实现全省贯通。三是打造“办理一案,治理全域”的监督生态。充分发挥检察一体化优势,通过综合履职、一体履职、系统履职,实现“由案到治”,最大限度履行好检察机关法律监督职责。如浙江省杭州市检察院打造的“全域数字法治监督应用(市域平台)”,收录全市两级院各类大数据法律监督子场景。与数据应用平台更专注模型构建不同,该模式中,市级检察机关充分发挥市级层面数据需求、线索流转、机制共建、优化配置等方面的作用,实现数据集纳、线索下放、分析研判的全市统筹,解决了基层力量有限、监管手段落后、数据协同难度大、无法全面履职到位等问题,打造出持续有力、应用高频、良性互动的法律监督生态,办理出一批高质量的案件。
二、大数据分析在法律监督中的应用方法
大数据法律监督的落脚点是办案,如何让数据为监督说话,成为检察办案大数据运用的重要课题。实践中,办案人员一定程度上存在对大数据法律监督认识理解的盲区或方式方法的误区,以下通过业务逻辑、思路拓展、模型构建来系统解构大数据法律监督的工作方法。
(一)运用大数据开展法律监督的业务逻辑
首先,立足个案办理,梳理类案监督规则。无论是发现了案件中的非典型性问题,还是通过同类案件办理归纳出典型性的特征和规律,实际运用中,一般都可以按照“发现问题(what)-查找原因(why)-解决方案(how)”的“3W”法则,从某些异常数据入手,一步步推断出关键线索。如组织卖淫案件中对犯罪嫌疑人的手机数据进行筛选,根据代收嫖资人员固定时段、固定金额、固定收款方式推算嫖资,根据固定分成比例、资金走向、结算金额推算卖淫团伙的合作模式,从而推导出组织卖淫的人员架构及上下链模型,对不在案的高频交易对象进行同类案件串并,从而发现遗漏的犯罪嫌疑人或犯罪事实。又如,在某一民事裁判监督案件发现虚假诉讼线索,梳理出多个显著异常的特征点,以相关特征点为参照,在民事裁判文书库中摸排高度匹配的同类案件,进而发现批量虚假诉讼线索。
其次,了解字段信息,明确数据需求。对于办案人员来说,一是要善于分析案件问题、成因,梳理与线索高度关联的关键信息或高频字段,建立显著异常指标,进而锁定数据需求,解决要什么数据的问题。二是要提前调查了解所需数据由哪些行业或部门掌握,知悉这些数据在持有部门或行业的系统内以结构化还是非结构化类型展现,解决数据向谁要和要什么类型数据的问题。三是遵循数据最小化原则。大部分数据持有部门必然考虑数据安全和隐私保护问题,因此数据的敏感度、多维度、完整度一般与获取数据的阻力成正比。强调数据的“必要性”“最小化”,即可以降低数据泄露的风险,也可以减少对海量数据或无价值数据进行审查的精力消耗。
由于不同工作网络之间的数据孤岛问题,难以避免工作网和互联网的数据交互,进而出现高密级向低密级网络传输数据的困扰,对此基层检察机关通过实践提出了相应的解决方案:一是对高密级数据的脱密。如某基层院建设“特定行业准入码”数字场景应用,特定从业人员在查询端口输入的身份信息经与犯罪记录库碰撞后,仅反馈准入、尚在禁入期限或终身禁入的结果,但不反馈或留存具体犯罪记录。二是对提取数据进行“阉割”。即把一条全量信息切割成零散片段,只留下用于数据比对的关键片段,往返于不同工作系统之间进行碰撞,直至线索符合精准度的目标要求,再基于有效线索获取符合监督最低需求标准的相对全量数据。如某基层院构建的“控辍保学动态监测”监督模型,在对义务教育适龄人员的基础人口信息数据和学籍数据进行碰撞时,仅以身份证号码作为碰撞点排查高度疑似辍学失管人员的线索,不提取全量信息,充分保障了数据安全和个人隐私。三是运用“隐私计算”技术。这项技术以软件或硬件方式实现数据“可用而不可见”。2022 年,国内多部门密集出台一系列政策文件,提出支持隐私计算技术探索,随着相关产品的技术能力和应用模式的不断成熟,数据共享协同安全性将大大提升。
最后,开展数据清洗,筛选监督线索。对获取的数据进行“清洗”,即通过单独或复合运用筛选、碰撞、关联等监督模型构建方式,顺藤摸瓜,抽丝剥茧,使监督线索越来越清晰,证据体系越来越完整,并转化成监督成果。例如,非法占地耕地税费征收类案监督模型,通过非法占地行政处罚案件当事人数据与非法占地行政非诉执行案件当事人数据的比对碰撞,剔除案件名称不一致、当事人为自然人、企业已注销或破产的案件,形成正常经营且存在非法占地情形的企业及其他组织清单列表,再与税务部门税收征管系统检索出的企业、组织耕地占用税缴纳情况清单进行比对,最终确定非法占地未缴纳耕地占用税企业名单,线索在不断对比排查中逐步清晰明确。
(二)拓展大数据类案监督领域的有效思路
大数据法律监督的领域涵盖了“四大检察”,并且往往是切口越小精准性越强。如果把法律监督领域视为“面”,那么监督场景就是其中的“点”。结合现有的大数据监督实践,充分运用大数据思维是拓展监督领域的重要前提。与技术语言不同,办案人员的数据思维是可以通过了解、研究案例模型而习得的。以浙江检察机关为例,这项工作起步较早,但因各地重视程度不一、经济社会环境差异、对检察数字化存在不同理解等原因导致地区发展不平衡不充分。浙江省检察院通过定期发布数字监督办案指引等方式,指导地方检察机关开展同类监督,并鼓励举一反三、因地制宜,构建特色模型,再反哺其他检察机关创新办案模式。2021 年3 月至2023 年12 月,浙江省检察院已发布九批共计91 个数字监督办案指引。
早期监督模型简单,数据碰撞步骤少,监督成效相对单一,后期则已实现多领域融合监督甚至是“四大检察”的全面融合监督,一个类案监督模型由多个子模型组成,形成庞大、整体、系统的业态治理场景,产生的数据效应大大增加,实际办案成效、社会治理价值、技术可行性、模型可复用性等都达到了较高水平,显示出基层检察机关对新生事物强大的吸收能力,涌现出一大批既懂业务又懂数字化的办案人才,也展示了检察机关在数字化改革、大数据理念上不断自我修正提升的过程。以某基层院“非标油”监督模型为例,办案人员通过调研,从用油企业通常需要抵扣税款这一行为特点,以税务部门抵扣发票数据作为切入口,筛查出购买使用“非标油”的企业,办理了一批案件。第二阶段又以源头治理为目标,对监督模型进行了迭代,利用交通部门的油罐车行使轨迹和卫星时空信息三方数据,得出危化品车运输的时间、起点和终点,比对加油站入库数量与税务申报数,测算出逃税额,进而挖掘出涉及逃税的行政、刑事案件和走私案件。该模型能够上升为更高版本,实际上是办案人员在“非标油”治理监督工作中找出了事物发展的基本规律,并随着思考的深入在初始模型上寻找新的切入点,利用轨迹信息将模型从扁平变为立体,数据画像也更为精准,为其他检察机关运用轨迹数据深挖水运、陆运相关违法犯罪行为,办理如危险废物、非法采矿等案件,打开了巨大的监督领域拓展空间。
(三)构建大数据法律监督模型的基本方法和路径
各地在探索运用大数据开展法律监督,构建监督模型的过程中,也逐步摸索出一套行之有效的方法和路径。
一是建立基础数据库。早期的大数据法律监督探索基本表现为“单兵作战”,即先确认业务规则,后确定数据要素,再向外部调取数据,理想状态下通过一次数据调取,即可保证后续数据的筛选、碰撞、关联等操作。实践中,因前期对数据要素预判不全面或后期在数据比对过程中出现新的线索点等情形而延伸出的二次、甚至多次数据调取仍不可避免。不过,这种耗时费力的过程是任何创新的必经之路。中国搭上了全球大数据经济的时代快车,几乎所有行业、部门基于业务需要都拥有一套独立、完整的系统,也就是说,除了部门、系统之间形成的数据壁垒以外,获取数据的过程中还会遇到的问题包括但不限于以下情形:一是或因双方对数据的表述或定义不同,或因需要通过关键字搜索等方式从非结构性数据中提取数据,数据需求与目标系统中的数据并非一一对应;二是所需数据无法在目标系统中直接提取,而是要依靠现有数据先构建一次分析模型甚至是多次构建模型得到目标数据;三是考虑公民个人信息保护、数据安全问题,遵循数据最小化原则,须考虑多方的数据安全需求以确定最小范围数据信息的迁移或者选择不需要迁移数据的方案。
伯努利的大数定律是统计学的重要理论,该定律表明,样本数量越多,结论就越接近真实的概率分布。同样,大数据监督模型建立在数据基础之上,数据类型越丰富数据体量越大,行为预测则越准确,数据匹配越精准,大数据法律监督模型的输出效率越高。对零散的、碎片化的数据源统筹分类后,导入法律监督“大数据中心”,实现数据贯通和处置闭环,就形成了全域数字法律监督体系的基本构架。以开展大数据法律监督工作较早的浙江省检察机关为例,数据应用平台可以完成检察机关全部自有数据的查询,并接入一体化智能化公共数据平台、政法数据中心及浙江省大数据局公共数据平台等,实现数据的统一归集、管理和应用,为“大数据中心”应当收集的外部目录清单梳理提供了实践经验和有益参考。
受限于数据壁垒、技术瓶颈等现实因素,针对未实现一体化协同的数据,构建导入式的“大数据中心”是现阶段开展法律监督的主要模式,即从第三方获取数据,形成数字资源,在本地网络中开展数据调用、分析及模型的构建。程序正当性要求数据使用应遵循合法公开、目的限制、数据安全、最小化、限期存储等原则,并兼顾数据质量、储存成本和使用效率。因此一体化平台建设同时应考虑提高数据活跃度(即实时、高质量的数据)、降低数据迁移风险、避免数据再次沉睡等问题。理想化的“大数据法律监督平台”,应该不再作存量数据导入,而是打通内外数据获取通道、实现依权限实时数据共享、开展监督模型演算、进行线索流转协同,但不留存数据的智能化、信息化、数字化的全流程平台。
二是确认数据规则及要素。大数据的核心是关系,建立模型的前提在于理解人与人、人与物、物与物之间的内在联系,这种联系包括语义的理解、事物的规律、行为的预测等,因此模型构建的实质在于揭示这些数据与数据背后的联系。在大数据法律监督模型中,可以把数据规则理解为一种数学公式或用于数据分析的统计学过程,数据规则将各个数据要素串联起来,单一或多个数据规则构成合理的逻辑,形成大数据法律监督模型的基础形态。实践中,常见的数据规则有数据碰撞、关联分析、异常统计、要素筛查等。如,看守所刑拘人员数据与提请审查逮捕、起诉人员数据进行比对去重,可以得出“刑拘下行”案件的数据,这是数据碰撞;对“刑拘下行”案件进行统计,发现故意伤害案件占比最高,因此以该罪名为切入点进行溯源,这是异常统计;溯源时主要针对伤势鉴定、伤情检查报告等要素进行筛查,发现大量应当追究刑事责任但违法下行的伤害案件,这是要素筛查;再将其中的涉案人员与公安治安处罚案件行为人进行碰撞比对,进而发现涉案人员有多起殴打他人事实均以和解赔偿刑事结案,深入调查后又发现涉黑涉恶团伙案件和职务犯罪案件,这是关联分析。随着新线索的出现,数据规则层层递进,数据要素不断增加,实现了监督线索的精准研判和监督案件的类型拓展。
这种思维方式映射到工作中,实际上与侦查活动有相通之处。侦查人员基于办案经验,就已有线索预判侦查对象的心理活动、行为模式,进而确定突破方向、拟定侦查思路、制定应对预案,并视情实时调整,从小线索到破大案。由此可见,办案人员树立侦查意识对于大数据法律监督建模具有非常重要的作用。随着大数据法律监督实践的不断深化,数据规则将出现由少及多、传统向新型、单一向复合的转化。但是,数据规则的运用并不意味办案人员一旦构建出模型就可以“躺平”,更不是对实质审查的摒弃。大多数情况下,数据规则的运用效果体现在,从全量数据中把监督范围逐步缩小到一定范围,而这一定范围的线索仍需要进行人工甄别、验证以确保监督靶向精准、行之有效。因此,大数据法律监督更注重多维度、多层次、多方法的流程再造,以及多类型、多跨场景的数据共享和工具应用。
三是创建法律监督模型。目前,全国各级检察机关正在广泛开展“个案发现线索,运用数字建模,办理类案监督”〔7〕《刘品新 翁跃强 李小东:检察大数据赋能法律监督三人谈》,《人民检察》2022 年第5 期。的大数据运用,检察工作步入数字化阶段,促使检察办案人员对于大数据法律监督的理解,已从建设数字化场景,转化为综合、充分、深度运用大数据实现法律监督流程重塑,而法律监督流程重塑的重要载体便是大数据法律监督模型。
监督规则侧重于推理,狭义上的数据建模是将这一过程用可表达可实现的方式架构出来,办案人员主要围绕监督场景、监督依据、数据来源、数据规则、案件支撑等方面进行阐述和论证,以确保检察监督有据可循、有法可依;数据来源有对象、易获取;数据规则逻辑严密、架构完整;案件支撑有个案验证、类案效果。
广义上来说,构建法律监督模型应涵盖大数据法律监督的全路径,横向上由单一监督模型向融合监督模型发展,纵向贯穿社会治理的前端和后端,即模型本身就是检察业务流程再造的雏形。如浙江省检察机关探索的“解析个案、梳理要素、构建模型、类案治理、融合监督”〔8〕同前注[7]。大数据法律监督路径,走出了一条“以数字检察为牵引,以类案监督为核心,以促进社会治理为目标”〔9〕方立华、张纯:《大数据检察监督的浙江探索——贾宇谈如何加强类案监督促进社会治理》,《民主与法制周刊》2021 年第41 期。的创新发展之路。这种流程再造,把检察机关法律监督从静脉转移到动脉,从隔靴搔痒到对症下药,从浅表监督到穿透监督,在业务流程、全程监督、流转处置等方面形成点、线、面、立体的“多闭环”,从根本上优化数字检察监督办案,形成大数据法律监督的整体格局。
三、运用大数据开展法律监督面临的问题和挑战
信息社会,数据是至关重要的治理资源。〔10〕参见贾宇:《深入学习贯彻习近平法治思想 以赶考姿态打造法律监督最有力示范省份》,《民主与法制周刊》2021 年第41 期。谁掌握了大数据,谁就掌握了主动权。各地检察机关在长期的实践中,探索出“数字赋能监督,监督促进治理”的大数据法律监督路径,并在实践中不断发展完善。探索运用大数据开展法律监督的道路上,大量的经验成效有力证明了大数据对法律监督工作的放大、叠加、倍增作用,但不可否认,作为一项创新性工作,运用大数据开展法律监督也面临不少问题和挑战。
(一)对大数据法律监督的概念、意义、价值理解不到位
一是大数据法律监督基本概念辨析不清。实践中,部分办案人员认为只要在办案过程中运用了部分与大数据相关的元素,如分析在案电子数据、运用辅助电子取证手段、进行数据统计分析等,就是大数据法律监督。实际上,大数据法律监督是检察机关通过数字化智能化技术,在履行司法办案职能过程中,通过业务规则进行梳理分析,建立法律监督模型及配套系统,发现并对相关违法犯罪行为进行查处、纠正、监督,对社会治理机制进行系统完善的法律监督新模式,并不是跟数据有关的工作都是大数据法律监督。二是大数据法律监督目标价值存在偏离。不少检察机关在开展大数据法律监督的过程中,与对大数据法律监督促进社会治理的价值目标发生偏离。有的地方认为能动履职就是主动履职,对自身职责边界定位不清,监督职能越位,导致大数据法律监督的工作效果不佳;或者把融合监督理解为刑事、民事、行政、公益诉讼检察监督的简单叠加,追求监督类型多、模型大而全,而不考虑前端治理、治未病的深层次目标;或者将监督重点放在执法司法过失和瑕疵问题上,对监管漏洞、治理盲区等关键领域鲜有作为,甚至出现“耕了别人的田,荒了自己的地”的尴尬境地。三是对传统监督模式的地位作用认识不足。有些办案人员认为,传统法律监督与当前数字化改革进程中各行政机关、各行业部门的数字化工作不相适应,偶发式、碎片化监督与检察工作质效提升的要求不相适应,与我国治理体系与治理能力现代化的目标不相适应,已无法应对法律监督工作的新要求、新挑战,将传统监督与大数据法律监督割裂开来,甚至认为传统监督是大数据法律监督的附庸。这种对法律监督方法不全面不充分的理解,导致大数据法律监督模型构建过程中,过度强调模型的标新立异,过度关注数据的产出效能,脱离了模型建设应为检察业务工作服务的基本定位。
(二)数据建模优化路径不足
全国检察机关的大数据法律监督工作开展如火如荼,各类监督模型如雨后春笋,但效果参差不齐。主要反映在以下几个方面,一是获取的数据质量不符合预期目的。任何违法犯罪都有构成要件,都有一个信息链条,特别是以多次、多起为特征的犯罪,孤立看链条上的信息点很难发现异常,但运用大数据筛查、比对、碰撞,信息点之间就有了交集、串连,问题线索就能暴露出来。而数据质量直接决定了以此为基础开展的一系列筛选规则的运用结果是否真实、有效、精准。高质量的数据可以从完整性、规范性、准确性、唯一性、关联性几个指标进行评估,有助于准确提炼行为的特征、事物的规律,进而辅助对线索的判断和决策。办案人员在没有提前了解所需数据的特点、与数据持有方协调沟通不畅或获取的数据不能精准匹配模型等情况下,往往会产生数据质量问题进而影响监督质效。二是数据治理成本大于数据治理成效。数据建模是一项长期工作,真正投入成本之前需要充分论证,实践中不乏为建模型而建模型的情形,导致一些模型匆匆上马,但落地后面临数据梳理困难、数据碰撞无效等各种实际问题,建好的模型不仅没有提升线索发现的效率和能力,反而占用了大量的人力、物力和精力,背离了大数据法律监督最基本的价值取向。三是照搬模型导致复用性、推广性不强。法律监督模型的构建大多由基层检察机关作最初探索,模型成效往往通过线索移送成案、实际办案数量、制发检察建议等方面进行量化,并结合社会治理效果、监督持续期间、应用便捷程度等方面进行综合评估。由于各地经济社会发展特点、区域产业结构、政治生态等存在差异,在本地运行效果很好的模型,却无法在异地发挥作用的情况较为普遍。模型难以复制,不是模型本身的问题,检察机关在复用模型的过程中有必要结合本地实际,进行改造、优化、创新,形成具有自身特色、数据交互频次高、可产生规模效应的大数据法律监督模式。
(三)数据共享带来安全和隐私顾虑
在大数据法律监督应用场景中,数据流动是“常态”,法律监督模型中往往需要对不同来源的数据执行至少一次碰撞分析。数据共享意味着数据被赋予多源性和开放性,多源数据的融合导致信息泄露风险大大增加,甚至涉及公民个人信息和企业商业秘密。因此,数据安全不仅仅是网络安全的一个下位概念,更是网络信息安全的核心内容,是需要独立加以研究和管理的内容。
在我国的立法语境下,“数据”和“信息”并不是通用的,〔11〕参见李海英:《大数据的法律挑战和建议》,《大数据》2016 年第2 期。信息相较于数据而言,具有单独或结合其他数据的可识别特征,这种可识别特征意味着信息具有隐私权利。目前,我国隐私保护的关键技术不完善,法律法规不健全,保护意识不充分,〔12〕参见张峰:《大数据时代隐私保护的伦理困境及对策》,《学术前沿》2019 年第15 期。数据利用过程中对于个人隐私信息的保障、数据保管使用的监管均存在不足。大数据法律监督以数据为基础,其数据来源相当广泛,其中不乏“共享”“开放”数据,且比重不断增大。数字社会带来了以效率为核心的“群组正义观”〔13〕郑智航:《人工智能算法的伦理危机与法律规制》,《法律科学》(西北政法大学学报)2021 年第1 期。,为满足公共决策、公共安全、公共秩序等公域需求,个人权利作出有限让渡,并仅限于特定时期、环境及条件。随着涉及隐私保护相关法律法规的不断健全,未来检察机关大数据法律监督必须正视信息共享与隐私保护的关系,平衡个体权利的独立性与沟通社会的兼容性,进而解决由此带来隐私让渡边界、期限、用途等一系列新的问题。
2023 年3 月,经济合作与发展组织(OECD)发布了《新兴的隐私增强技术:当前的监管和政策方法报告》,〔14〕See OECD,Emerging Privacy Enhancing Technologies:Current Regulatory And Policy Approaches,http://www.oecd.org/publications/emerging-privacy-enhancing-technologies-bf121be4-en.htm,Last Visited on Nov.26th,2023.该报告对隐私增强技术(PETs)的种类进行了梳理:以匿名化、合成数据、差分隐私、零知识证明为关键技术的数据混淆工具(Data obfuscation),以同态加密、多方计算、可信执行环境为关键技术的加密数据处理工具(Encrypted data processing),以联邦学习、分布式分析为关键技术的联邦和分布式分析(Federated and distributed analytics),以及以问责系统、阈值密钥分享、个人数据存储为关键技术的数据问责工具(Data accountability)。以上技术成熟度、优势和限制各有不同,被应用于不同的领域和场景。当前,我国在数据流通环节的隐私计算技术水平和工具产业化专业化水平尚待提升,而数据逆向分析等技术又给数据脱敏清洗带来新的挑战,加之法律体系不完善、安全防护关键技术不成熟等问题,随着大数据法律监督工作的不断深化,未来会有更多的“开放”“公共”数据进入法律监督视野,数据共享和隐私保护、数据安全的冲突平衡问题也将更加突出。
四、大数据赋能法律监督的改革路径
大数据赋能法律监督机遇和挑战并存,基于上文对问题的梳理分析,提出以下改革路径。
(一)注重理念引导
大数据法律监督带来了检察机关司法办案模式和流程的重塑,实质是办案人员监督理念和思维模式的更新,尤其是大数据意识的逐渐树立与不断强化。“理念一变天地宽”,当前,要通过培训、座谈、研讨等多种方式,引导检察机关的领导和检察官树立正确的数字检察理念,在司法办案过程中自觉运用大数据开展法律监督、参与社会治理。
一是正确理解大数据及提升数据意识。大数据是通过获取、存储、分析,从大量数据中挖掘价值的一种技术架构。在检察业务活动中,这种价值体现为通过对海量数据进行高效处理来挖掘法律监督线索,这也是大数据法律监督的核心要义。大数据意识本身是个复杂的体系,包括数据开放共享、数字化管理、大数据应用、大数据治理等理念。数字检察要始终贯彻“业务主导,数据服务,技术支撑,重在应用”的理念,把业务需求放到第一位,引导、依靠业务部门的一线检察官在司法办案中树立能动检察理念和大数据思维,注意总结和提炼类案监督点和监督规则。具体到检察工作中,一要不断提升侦查意识、线索意识、数据意识,强化线索研判的能力、调查核实的能力、启动数据的能力;二要不断提升问题意识、需求意识、治理意识,遵循“个案办理-类案监督-系统治理”的办案思路,提高站位,把着眼点放在破解社会治理难题、构建社会治理体系上,这既是大数据法律监督的底层逻辑,也是顶层设计的出发点;三要不断提升全局意识、共享意识、协作意识,让检察监督既有法律威严又有人文关怀,以双赢多赢共赢的理念获得各方的尊重和认同。
二是正确理解法律监督机关的准确定位。职能的价值与定位需要具备目的性、结果性和唯一性。检察机关开展监督的出发点,是促进职权主体更好地履行职责。数字检察的目的是通过大数据、人工智能等新技术破解检察机关履行法律监督职能过程中的难题,发现与推动解决执法司法权力运行及社会治理中的深层次问题,不断深化和加强检察机关的法律监督工作,助推提高国家治理体系和治理能力现代化水平。大数据法律监督既有主动作为的监督形态,也需要合理把握权力的谦抑性,而这一尺度的把握始终建立在检察机关是国家的法律监督机关的宪法定位上。由此,才能有的放矢、有所作为,实现“监督促进治理”“以我管促多管”的价值目标。同时,检察机关在司法办案过程中,也要紧扣服务中心大局、执法司法突出问题、社会治理薄弱地带和公共利益弱项短板,通过履行法律监督职责促进某一类堵点难点痛点问题的系统治理,为党委政府打好“法治补丁”。模型建设最终是为检察业务工作服务,为发现法律监督线索、完善治理体系服务,必须防范为建模型而建模型的形式主义,损害检察机关的法律威严。
三是正确理解不同监督模式的作用关系。必须认识到,检察机关在维护法律统一正确实施的要求下进行价值衡量,体现人的主体性与司法的权威性。数字检察是法律监督活动的高级形态,本质仍然是法律监督活动,必然包含但不限于传统监督、大数据运用等手段方法,且具体到个案需要具体问题具体分析,两者适时进行补位。大数据法律监督模型的最后一步,往往以调查取证核实作为落脚点,因此大数据运用在从海量数据中发现监督线索的前端,传统监督的作用则发挥在甄别、验证以发现精准线索的后端,两者相辅相成,不可或缺。未来检察机关除了在数据分析方法上要实现从平面数据比对到立体综合分析的转变,更需要具体问题具体分析,灵活选择有效的监督模式,以达到大数据法律监督的高效性、精准性。
(二)加强顶层设计
大数据法律监督经过几年的探索实践,已经在全国检察机关“开花结果”,显示出强大的生命力。下一步,最高检和省级院应当总结实践经验,“自上而下”做好顶层设计。
首先,加强制度建设,确保数字检察工作行稳致远。一是制定数字检察工作相关规范性文件。比如,制定数字检察工作指引和具体规则,明确数字检察工作的总体要求和规范;适时出台加强数字检察工作的意见,指导各地工作开展;出台模型管理办法,对模型的管理与使用、冠名与保护、评审与竞赛进行规范;出台线索管理办法和数字检察办案规则,加强类案监督线索的管理;针对数据共享的协同方式、技术要求、接口规范等研究制定数据安全标准;针对数据采集、存储、处理、传输、使用全过程制定操作规范,等等。二是建立科学合理的数据责权制度。明确数据主管部门及监管职责,建立健全数据安全监管机制和责任体系;明确数据安全管理的主体责任对第三方运营主体进行准入安全审查,如配套网络安全、数据安全技术;明晰数据所有者、调取者、管理者的权责范围,保证数据在获取、使用、储存、管理等各个环节中权责清晰,防止数据滥用和泄露。三是建立公民个人信息查询分级授权制度。在大数据法律监督的应用中,有必要细化不同数据类型、程序环节、对象内容的查询权限、具体义务和法律责任,如针对公民个人信息区分一般个人信息、特殊个人信息、敏感个人信息等。四是创新数据共享安全管理技术手段。加强数据共享安全评估,加快研发安全多方计算、同态加密、隐私计算等技术,形成物理分散、管控可信、标准统一的共享协同体系,做好对数据共享协同的风险控制。五是强化全过程人民民主监督。坚持以人民为中心的发展思想,构建公众参与的监督体系,探索大数据检察监督过程的人民监督员制度,拓宽群众有序、分类、阶段参与和监督司法的渠道〔15〕参见孙风娟:《推进全过程人民民主监督,检察实践持续发力》,微信公众号“最高人民检察院”,2022 年2月24 日。。
其次,加强数据管理,实现数据融合兼顾风险防范。开展大数据法律监督工作所需的共享数据,由于在共享范围、数据管理、数据安全等多方面没有配套的法律法规或完备的法律体系,导致理论和实务界存在不同认识。有的认为检察监督应属于个案监督,有的认为数据共享应有文件依据,还有的基于数据保密相关要求认为数据共享会带来泄露风险。因此,亟待从制度层面对数据共享范围、协同程序要求、检察监督方式等予以明确和细化,不仅要考虑数据权力的赋予和克制,也应关心数据权利的合理让渡与合法保护。一是启动未来相关法律修订的前期研究。结合当前数字检察实践,从数据共享、线索筛查、调查核实、监督管理、法律责任等贯穿大数据法律监督全过程的各个环节,提供法律法规依据,有条件有限制地赋予检察机关对其他政法机关办案数据、政务数据、网络信息企业数据的共享权力,以解决检察监督数据赋权不明确和数据需求日益增长的矛盾。二是出台促进数据共享开放的标准规范。强调分级分类、应用先行、安全并重,以满足合理目的、合理方式、信息主体未受不合理侵害〔16〕参见吴国喆、王文文:《数据共享视域下个人信息“合理使用”的场景化判定》,《西安交通大学学报》(社会科学版)2023 年第3 期。为要件开展数据应用,实现数据共享合法、有序、规范,促进政务数据、司法数据、公共数据的融合应用。三是完善法律监督场景下的配套规定。针对法律监督、公共区域监控等场景下的数据安全与个人信息保护,进一步细化、完善配套的法律法规,严格检察机关向互联网企业调取个人信息的报批程序,杜绝违规收集及恶意利用等行为,保障国家、组织和个人的数据安全和隐私信息。
最后,统筹数据协同,打造数据全域共享体系。“四大检察”融合发展大大拓宽了检察监督的领域,但也不乏数据调取周期较长,监督成效无法迅速转化,甚至延误监督最佳时机的情况发生。因此,高效的数据协同是提升监督质效的利器。我们认为,宜由最高检统筹数据协同工作,采用“四级一体系”模式,打造贯穿四级检察机关的全国法律监督大数据管理平台,汇聚可复制、可推广、多元化的各类大数据法律监督模型,供四级检察机关使用。同时,鼓励各省级检察院建设本地的法律监督大数据管理平台,建设内容涵盖检察机关履行法律监督职能的数据中心、情报中心、知识中心和线索管理中心〔17〕参见翁跃强、申云天:《数字检察工作中的十个关系》,《人民检察》2023 年第1 期。,避免各级检察机关重复投入、重复建设。在制度层面,需要研究制定大数据管理基础规则、数据交换共享基础规则,建立科学的数据库和数字资源目录,细化数据分类分级规定,建立适应数字检察的数据权限体系。在软件层面,组织研发大数据检察一体化信息系统,打造大数据法律监督平台。
(三)构建协同体系
大数据法律监督是数据的“炼金术”,突破了个案监督的局限和类案监督的瓶颈,核心是利用数据规则在海量数据中挖掘、提炼有效线索,以线索引导侦查、调查、审查,在“三查”融合、“四大检察”融合监督以及外部协同上实现跨部门联动场景。在检察数字化改革的背景下,各业务部门、前后环节、上下条线之间融合不深、协同不强的矛盾逐渐凸显,除了在理念上打破思维的“墙”,在共享上打破数据的“墙”,我们更需要打破“业务墙”“部门墙”,为大数据法律监督构建内外部协同生态体系。
一是构建数据的多跨协同体系。数据集纳管理主要就是数据源的获取和管理,是数字检察工作顺利开展的前提和基础。与数字检察工作密切相关的主要有三类数据:一是内部数据,包括检察业务数据、办公数据等。二是政法协同数据、行政协同数据,如公安机关的立案、撤案、刑拘数据,审判机关的裁判、调解、执行数据,行政机关的许可、处罚等已经作出终结性结论的基础数据。三是第三方提供的公共数据,如12345 举报记录、信访、电子政务、企业登记等信息。对内部数据要加强数据治理,共享数据要不断拓展范围和内容,公共数据要提升数据价值。当然,数据集纳管理不是数字检察部门一家的事,而是全局性的工作,需要各业务部门、技术信息部门在检察长的直接带领下,由数字检察部门牵头协调共同推进、规划和使用。〔18〕同前注[17]。
二是构建上下与内外协同体系。有必要建立内外部之间、上下之间、区域之间的一体协同体系,在场景共建、机制共建、制度共建、工作联动上与其他部门的协同,与上下层级的贯通,与区域之间的协作,真正构建合力、效能、融合最大化的一体协同体系。最高检和省级检察院应成立数字检察专家咨询委员会,聘请各个行业的专家学者,通过到院挂职、定向联系、专家咨询等方式多元化发挥外脑的作用。同时,可以通过签订战略合作协议等方式整合外部数据和技术资源,保障相关经费,为开展大数据法律监督提供专业支持服务。〔19〕同前注[17]。对于基层检察机关而言,对内应构建“四大检察”的线索快速移送机制、多部门数字办案单元办理机制、“三查”融合案件办理机制等,以机制促内部良性循环,充分挖掘检察人才潜力;对外应建立线索流转处置机制、联合办理事项磋商机制、全流程人民民主监督机制等,充分调用“外智”“外力”,打通社会治理的“最后一公里”,实现大数据法律监督的终极目标。
此外,应加强与高校、科研院所、科技企业等广泛合作,高频、深度、共同开展理论研究、科技攻关、人才培养等。〔20〕同前注[17]。以人工智能和大数据为核心的“第四次产业革命”为数据这一重要生产要素架构了新的舞台,数字产业、产业数字化、数字安全等领域随之滋生出大量新型经济产业。经过多年的深耕,数字信息科技企业在数据分析、运用、安全等方面,与政府及其他职能部门相比,具备数据质量更好,经验更加丰富,技术更加先进等优势。不可否认,大数据法律监督的公权力属性决定了其数据获取的“扩张性”和数据运用的“内生性”,也即在数据共享上,公权力机关与企业之间的关系并不平等。基于这种现状,一方面有必要通过相关规范、制度来对前述的权力扩张加以规制,另一方面,可以探索“购买服务”模式,对于检察机关在大数据运用过程中需要企业数据参与的部分分析决策,向企业提供数据规则,利用企业的技术手段在其自有的数据平台中辅助开展数据筛查,提高数据分析效能,减少数据迁移风险,以平衡企业社会责任和隐私保护义务的关系。
三是构建科学的绩效评价体系。数字检察工作必须依靠基层、为了基层,模型建设的主体应当是市县两级检察院。〔21〕同前注[17]。特别是大数据法律监督模型的监督点和业务规则,绝大多数是一线检察人员在办案中总结提炼的,模型研发完成后还需要到异地基层进行验证。科学的绩效评价体系能够推动数字检察工作提质增效,有必要全面搜集基层检察机关在检察监督权运行过程中的难点痛点堵点问题,充分征求意见并严格论证,制定、修正、完善大数据法律监督的质效评价体系。比如在针对基层检察院的考核规则中,大幅增加数据检察创新和大数据法律监督模型验证工作的分值,〔22〕同前注[17]。鼓励基层单位通过大数据建模发现异地监督线索并对线索移送环节适当赋分,对由检察长牵头全院数字检察工作的基层院单独赋分;考虑、尊重被监督对象的感受,吸收相关意见建议,鼓励“磋商监督”“口头监督”“柔性监督”,并增加该类监督类型的赋分指标、放宽监督成效的核定标准,将社会治理类检察建议纳入绩效评价范围等等,鼓励检察机关采用多元、综合、灵活方式开展大数据法律监督,切实发挥考核指挥棒的作用,以大数据法律监督实践推动评价体系的完善,以科学合理的评价体系促进大数据法律监督反映“监督促进治理”的核心旨意,以共赢多赢实现检察监督的良性循环。
(三)重塑业务流程
从我国未成年人检察、知识产权检察的综合履职探索来看,“四大检察”职能充分融合,深度融入未成年人检察综合保护、知识产权保护格局,无疑是推进检察一体化、现代化建设的优秀范式。未来大数据法律监督应更加强调数据整合,更加注重综合履职,更加强化一体协同。大数据法律监督流程重塑的优化方向也会是刑事、民事、行政、公益诉讼检察的融合履职。
广义的法律监督数据建模应涵盖大数据法律监督的全路径,由单一监督模型向融合监督模型发展,贯穿社会治理的前端和后端,即模型本身就是检察业务流程再造的雏形。如浙江探索的大数据法律监督路径,走出了一条“以数字检察为牵引,以类案监督为核心,以促进社会治理为目标”的发展之路。〔23〕同前注[9]。这种流程再造,把法律监督从隔靴搔痒到对症下药,从浅表监督到穿透监督,在业务流程、全程监督、流转处置等方面形成点、线、面、立体的“多闭环”,从根本上优化数字检察监督办案,形成大数据法律监督的整体格局。
随着数据协同的拓展、监督模型的优化、综合履职机制的完善以及上级指导统筹的深化,检察机关在大数据分析过程中发现越来越多跨部门、跨层级、跨区域的监督线索,如何对这些线索进行梳理整合、分类移送、闭环处置,及时跟进后续治理环节,在横向、纵向上形成一体协同,以实现监督效能最大化,成为大数据法律监督实践中的重大挑战。基层检察机关也在不断探索诸如数字检察办案组模式、多部门协同办案模式、两级院联合办案模式、特邀检察员或特约检察官助理参与办案制度、检察环节全过程人民民主法律监督机制等一系列业务流程改造。这种流程再造,目标是更高水平协同履职和更有效的社会治理。业务流程再造与数字监督办案相互促进,通过优化“数据流”再造“业务流”、优化“数据规则”再造“业务规则”、优化“监督模型”再造“办案流程”,数字监督办案质效反过来推动流程进一步的完善和优化,两者互相促进,实现检察办案、法律监督、社会治理的路径融合。
结语
法律监督是检察机关的立身之本。大数据分析在法律监督中的应用,体现了一体履职、综合履职、能动履职理念的实践化过程。对法律监督中的大数据应用实践的总结提炼,不仅论证了现阶段大数据赋能检察履职实践的有效性,更为开展数字检察工作与司法基本规律一致性的理论探讨提供了基础,有利于帮助基层检察机关和一线检察人员建立真正的大数据思维和大数据认知,更好地理解大数据分析在法律监督中的丰富样态和优化路径,真正实现检察业务与数据技术的深度融合。