APP下载

海量电子数据审查的实现路径

2022-02-17赵宪伟

中国司法鉴定 2022年1期
关键词:聊天记录检察官检察机关

赵宪伟,刘 政,徐 衍

(1.最高人民检察院检察技术信息研究中心,北京 100041; 2.北京市东城区人民检察院,北京 100001;3.杭州市人民检察院,浙江 杭州 310036)

电子数据是人类活动在虚拟赛博空间的投射。 “上帝之眼”所代表的“全视、全知”的能力,一直是各领域所关注推崇的目标。 随着信息技术的发展,为获取这种投射而创造了现实场景及其可行性。 例如,刑事案件中的海量电子数据,存在诸多信息链条或因子,通过探索适当方式重塑重组,是创造“上帝之眼”视角下虚拟空间的可行路径,本文将在刑事司法领域探讨其实现方式。

1 国内电子数据取证和审查的发展现状

2005 年,公安部物证鉴定中心组织了面向检察系统的电子物证培训班。 由此,检察系统开始在职务犯罪侦查工作中收集和运用电子数据。 此后,检察系统的电子数据技术人员紧跟取证技术发展前沿,在实践中总结出大量的经验、技战法,培养了一支具有较强实战能力的优秀队伍。

从行业来看,我国于2001 年才引入电子数据取证的概念,之后取证产品市场逐渐形成。 在早期,国产取证产品的整体技术水平与发达国家存在一定的差距,主要依赖国外相关产品。 随着国产取证产品市场的不断发展,国内企业开始自主创新,经过十余年的发展,电子数据取证领域已经涌现出不少具有自主知识产权的优秀产品和公司企业。 可以认为,中国的电子数据取证产业链已经从十余年前的研究、跟随、模仿美国及欧洲等发达国家的取证技术,发展至现在不断向国外输出产品、技术、培训和理念。 与国外产品相比,国内取证产品针对国内用户需求而开发, 并提供了丰富的本地化解决方案,而且操作简单,是多数国外取证产品所不及的。 因此,国内自主研发的取证产品逐步取代国外取证产品成为了市场主流。 这一变化与国家的经济社会发展息息相关、同频共振,也是整个行业得以快速发展的主要推动力。

从标准规范及实验室能力配套方面来看,截至今年,一方面我国共发布了电子数据取证鉴定领域的各项标准与技术规范59 项,包括4 项国家标准、36 项公共安全行业标准和19 项司法鉴定技术规范。 另一方面,每年参加公安部能力验证计划的实验室近千家,公安、检察、国家安全、海关、司法鉴定等机关机构投入的电子数据实验室建设及配套升级增长迅速, 相应的电子数据鉴定人数量逐年上升,对电子数据取证的实践应用日益丰富。

从司法立法来看,2012 年修正的《刑事诉讼法》将电子数据增列为新的证据种类,进一步丰富了证据的外延。2014 年发布的《关于办理网络犯罪案件适用刑事诉讼程序若干问题的意见》,对电子数据取证人员资质与技术要求、电子数据取证原则、收集提取电子数据的笔录制作要求、电子数据的移送规则和电子数据的鉴定与检验等问题作了进一步明确。2016 年颁布的《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》,进一步统一和细化了电子数据证据规则。 同时针对不同类型的案件,连续出台了电子数据取证、审查等相关司法解释,特别是随着网络犯罪的不断延伸,电子数据审查取证在司法立法中属于热门板块。

从司法实践来看,涉及电子数据的专业案件呈几何式增长,司法人员需要面对大量的电子数据。以杭州市检察机关技术部门为例,2019—2021 年共办理电子数据专业技术案件6947 件,分别为2019 年1 218 件、2020 年 2 161 件、2021 年 3 568 件,案件数年均增长幅度为72%。 其中,勘验检查、技术协助、检验鉴定等检察机关自行补充侦查取证类电子数据专业技术案件共4 189 件,分别为2019 年966件、2020 年 1 152 件、2021 年 2 071 件,案件数年均增长幅度为49.5%。

图1 杭州检察机关电子数据分类情况(2019—2021 年)

从2019—2021 年电子数据专业技术案件涉及的罪名分布而言,2019 年涉及罪名数55 个、2020年涉及罪名数89 个、2021 年涉及罪名数99 个,罪名数年均增长幅度为36.5%,基本覆盖了常见的刑事案件罪名。

当然,技术的发展日新月异,对于“电子数据取证”而言,仍有大量的问题亟待解决,但从国内整个发展的基本面来看,相关行业市场日趋成熟,电子数据在司法立法上逐渐形成体系,实验室建设投入增长迅速,电子数据作为基本的八大类证据已在司法实践中广泛运用,电子数据的“取证”难题已基本解决。

2 电子数据审查工作面临的问题与挑战

事实上,所有的电子数据都具有多元关联证明作用。 例如,从张三手机中提取固定的微信聊天记录,不仅能够证明张三实施了本罪行为,可能还有其与上下游人员勾连的记录,或者实施了其他相似或者无关的违法犯罪活动。 因此,从刑事司法的角度来看,如何利用好电子数据,是超越了“取证”且更能凸显其证据作用的新维度问题。 对各地进行调研发现,越来越多的基层检察官反映电子数据无论是在整体工作面、技术层面还是在业务层面中都存在诸多问题,有的甚至造成了较为尴尬的局面。

2.1 检察机关电子数据审查面临的整体困局

检察机关电子数据审查面临的困局主要体现在以下六个方面:

一是装备落后,难以满足正常工作需要。 检察官缺少审查电子数据的必要科技装备。 随着侦查机关办案过程中收集提取的电子数据体量越来越大,存储电子数据的载体使用更多的是蓝光光盘和移动硬盘,而检察官办公使用的电脑多数都没有蓝光光驱,且电脑配置一般,连电子数据存储载体都无法打开,从而无法进行基本的审查,甚至连最基本的浏览电子数据都需要检察技术部门的协助。

二是海量电子数据审查与审限之间紧张的矛盾日益凸显,这也是目前电子数据审查实务中最为突出的问题。 高效审查海量电子数据存在诸多困难,即使委托检察技术人员介入,利用专业手段和技术装备辅助开展电子数据审查也需要一定的时间,而不论是审查逮捕、审查起诉均有时限要求。 审查逮捕一般只有七天时间,如何在七天时限内审查利用好电子数据困难重重。 在大量案件中,特别是经济案件呈现出信息网络化特征,导致犯罪证据多数以电子数据的形式留存,而此类电子数据的体量日益增大,如何实现关键证据的快速锁定、查询和审查是困扰一线办案人员的重要问题,尤其是在捕诉合一、案多人少的背景下,对于海量电子数据审查的提质增效显得尤为重要。 例如,在某基层检察院办理的一起案件中,侦查部门将收集提取的电子数据移送到检察院,电子数据中包含的社交软件记录就高达近1 000 万条。

三是检察官审查电子数据缺乏操作指引。 比如,是否可建立提醒机制,提醒检察官是否需要委托技术性证据专门审查,是否需要辅助进行海量数据筛查等。 再比如,什么性质案件需要如何开展什么类型的电子数据鉴定,公安机关答复的无法鉴定或者无法收集提取的电子数据是否有依据等,而这些问题都需要有相当深厚的专业背景才能够提出。

四是检察官审查运用电子数据敏感度较低。 针对检察官审查判断电子数据的技能跟不上以及敏感度较低的问题,应当加强电子数据审查技能培训,使得检察官不仅会看电子数据,还能够不断积累经验,提升审查运用电子数据的能力,并进一步提高引导侦查取证的敏感度。

五是检察机关专业技术人员配备薄弱且水平参差不齐。 例如,司法实务中的电子数据并非全都是转账记录、聊天记录等,有些电子数据呈现的方式是代码、符号等。 此时,若不经过专业人员的分析、解读、转换,上述电子数据无法转化为有效的证据,难以为司法实务人员所用。 因此,以专业的方式来解读、审查电子数据成为发挥电子数据有效价值的关键所在。 但目前检察机关专业技术人员配备较为薄弱且水平参差不齐,很难真正满足电子数据审查的真实需求。

六是公检法在刑事诉讼领域中对电子数据认知存在差异。 目前,公检法对电子数据的收集提取、移送展示、审查认定在认知上存在差异且标准不够统一,应当加强交流,统一标准。 即便不能统一标准,也应当尽可能统一理念。 实践中,常常看到部分地区公安机关收集提取电子数据不规范,检察人员对电子数据的相关规定和技术标准不熟悉,审查电子数据存在误区,法院对电子数据审查的关键点无法与公安、检察达成一致。

2.2 检察机关电子数据审查面临的技术难题

检察机关电子数据审查存在的技术难题主要有以下三个方面:一是“看不到”,是指很多基层检察院对侦查部门移送的电子数据束手无策。 一方面是没有合适的工具可用,另一方面是不会运用电子数据解决案件中的问题。 以微信聊天记录为例,当需要从海量聊天记录中筛选关键证据时,检察官有时只能打印出来一页一页的查看,效率极低。 同时,受限于专业门槛,检察官对网络犯罪领域的专业知识缺乏了解,在某些极端情况下,由于提取的电子数据过于庞大,使得审查流于形式。 二是“搜不着”,是指一个案件中,收集固定的电子数据往往体量巨大,取证报告通常是网页格式,使用非常不便。 通过在其中搜索某些关键词,更是宛若龟行,而对于关联分析,则更是无从下手。 根据调研,目前尚未有智能化工具可供办案人员便捷高效的搜索。 三是“用不好”,是指海量电子数据其实是一个巨大的虚拟空间,其中往往蕴藏着远超司法机关已经掌握的违法犯罪线索,显然目前对其挖掘和利用的程度还远远不够。 当然,用不好的原因更多的是与前两个原因有关。

2.3 检察机关电子数据审查面临的业务痛点

在很多新型犯罪案件中,公安机关经常会主动邀请检察机关提前介入引导侦查,但由于缺乏专业知识,检察官很难提出具有很强针对性的引导侦查意见。 特别是在涉及电子数据等证据实体问题上,缺乏侦查人员与检察官的沟通,导致提前介入的效果和质量都不高。 此外,很多原因致使案件中的电子数据并没有及时收集提取,除了部分囿于技术难度高尚且无法突破之外,还存在地方办案部门之间的沟通存在障碍。 例如,侦查阶段认为不重要而未提取数据,或者没有及时获取相关密码密钥导致后续无法提取数据。 对上述情况需要及时开展补充性的提取工作,但在实践中往往被忽略。 另一个棘手的问题是远程跨境获取电子数据合法性的问题。 例如,当前大部分网络犯罪组织的后台服务器部署在境外,公安机关运用技术手段获取的后台数据难以转化为法庭证据。 在法庭审理过程中,涉及电子数据的诸多专门性问题,是辩护人重要的法庭“辩点”,这也是需要在司法层面需要给予重点关注的。

3 电子数据审查的发展趋势

目前,虽然电子数据审查的现实并不乐观,但也不绝对悲观,特别是在新型多发犯罪的网络化趋势愈发显著的背景下,电子数据审查的作用也更为突出,并得到相关部门的高度关注和重视。

2020 年杭州市江干区人民检察院在办理一起电信诈骗案中,侦查机关移送了142 部被扣押的手机,初步查实共32 名受害人,涉案金额32 万元。基层院的检察官与检察技术人员用了两周时间将能明确身份的受害人增加到202 人,诈骗金额从32 万增加到395 万。 这些突破对犯罪嫌疑人形成极大威慑力,最终整个团伙认罪认罚,不仅表示对数额认定没有异议,还主动要求退赃挽损。 在另外一起案件中,技术人员协助检察官审查嫌疑人聊天记录时,推断其中一个嫌疑人应当用电脑记账,台账文件对涉案金额的确定至关重要,但侦查阶段并未扣押该嫌疑人电脑。 在退补期间,检察官现场引导侦查人员扣押了嫌疑人电脑,成功提取台账文件。 通过对台账文件进行分析,结合案涉其他相关证据,将涉案金额从300 万提升至9 700 万,达到了罪责刑相适应的目的。

“电子数据中有天使”,可惜的是,检察机关在多数案件中尚未能够充分利用电子数据的价值。 检察机关承担着指控和证明犯罪的主导责任,同时履行法律监督职能。 因此,一方面应立足融合协作,另一方面应立足专业能力。 电子数据支撑办案有广度空间, 虽然当前案件中的电子数据运用呈快速增长,但从刑事案件总量上看,涉及电子数据的案件还有很大空间。 检察机关应通过完善建立技术协作机制,将电子数据取证纳入重大或疑难、复杂案件的提前介入及自行补充侦查,覆盖刑事案件办理的全部阶段。 此外,电子数据支撑办案有深度空间,当前网络犯罪新型案件层出不穷,案件中无论是技术手段、原理或是事实情节都直接影响到案件定性及量刑,检察机关应通过研究新型或疑难复杂案件的办案难点,在传统电子数据取证基础上,根据检察官在不同案件中的视角需求,形成针对海量电子数据聚类、搜索、归集、关联等各类技战方法。同时,深入探索区块链、跨境云平台、特定对象数据取证(机动车、船舶等)等新型取证领域,进一步形成针对海量电子数据进行取证、分析的专业技术能力。

4 电子数据审查的实现路径与方法

目前阶段,检察机关的电子数据审查由于大量工作都需要靠人工完成,办案过程非常艰辛。 现阶段各地检察机关还不具备有足够优秀和数量的专业技术人员,无法在每一个案件中协助检察官去挖掘电子数据潜在的价值,试图将解决问题的希望寄托于侦查阶段亦不现实。 对海量电子数据进行审查,可通过以下五个方面进行推进。

4.1 构建案件办理中运用电子数据的良好生态

从前述情况来看,整个检察系统的办案检察官依旧沿袭对侦查机关结论性材料的依赖习惯——尤其针对电子数据,不愿怀疑、不会怀疑,进而不敢怀疑。 导致这种情况的一个重要原因是,目前行业内还没有高度匹配检察审查应用场景的电子数据工具软件。 这可能是很多设备和取证厂商,长期以来将更多精力放在“取证”上所导致的。 其实,在检察审查阶段对电子数据的分析和应用是有一定规律的,只要把握好以下几个方面,就能够充分挖掘出电子数据的价值作用。 在工具层面,首先需要完善对电子数据取证报告的浏览、过滤、搜索、统计、标记功能。 显而易见,“浏览电子数据”始终是应用的第一步,并且是最重要的步骤,可能还会涉及很多组合过滤的浏览需求。 其次才是根据需求进行高效搜索和查询。 统计和标记的功能需求也是非常关键的,如在分析聊天记录时,当审查人员点击社交软件主账号时,有效的审查工具应当清晰展示主账号的哪些群组更加活跃、跟哪些好友联系更加紧密、主账号在哪些群组的发言更加热络等。 通过这些简单的统计,使得审查人员能够对该主账号的状态有整体性认识,也便于开展后续工作。 同时,审查电子数据并非一日或者一次就能够完成,有效的工具应当提供随时标记备注的功能,这也是研判案件事实的重要依据。

4.2 积累检察办案电子数据分析精准需求

在业务层面,应当围绕指控和证明的需求进行挖掘,应当从犯罪构成的角度入手,了解真正的检察审查需求是什么。 下面试着梳理几方面问题供大家参考启发。

一是哪些电子数据能够证明相关人员主体身份? 可以从手机通讯簿信息、诸多第三方APP 的注册用户基础信息、社交媒体记录中好友对其的称呼、交易对手信息、相关人员之间的备注信息等落地相关人员的主体身份,如图2 和图3 所示。

图2 电子数据证明主体身份示例1

图3 电子数据证明主体身份示例2

二是哪些电子数据能够直接证明明知或者主观故意? 电子数据不仅能够反映行为内容,也能够记录行为痕迹。 因此,精准的电子数据取证不仅能够固定犯罪的客观行为,甚至也能够据此发现行为人的主观故意以及相关的犯罪预备行为。 在某案件中,行为人与不满14 周岁的受害人发生性关系,并辩称毫不知情受害者不满14 周岁。 但嫌疑人在与其好友的聊天交流中,曾经炫耀自己“X 了一个初二的女生”,依据这条聊天记录,完全可以推定行为人对受害者的年龄是具有明知故意的。

三是哪些电子数据能够表示犯罪行为的危害后果? 在某黑客攻击案件中,行为人案发后为逃避刑事处罚,在跟好友的聊天记录中提到自己“收了别人几万元钱”,好友则劝其出去避避,这一组聊天记录不仅反映了犯罪行为的损害后果和情节,还侧面提供了好友的包庇行为,如图4 所示。

图4 电子数据证明犯罪事实及行为后果示例

哪些电子数据能够延伸证明潜在的受害者,是否存在上下游勾连或者团伙组织架构,哪些电子数据能够表明犯罪后的掩饰毁灭行为、销赃行为、请求帮助行为,以及哪些电子数据证明了侦查阶段取证行为不够规范或者违法取证等。 这些审查点比较分散,需要有丰富实际办案经验的检察官深度参与并提出,绝非仅凭工程技术人员就能够解决的。

4.3 设计科学合理的人工智能技术框架

依靠优秀的技术人员只能解决个案,只有在更大的范围内做到整体性提升,才是解决问题的最好方法。怎么进行整体性提升?唯有向科技要战斗力。具体到本文所探讨的问题,从海量电子数据中挖掘诉讼价值,极有可能是第一个在司法机关真正落地的人工智能应用场景。 以海量聊天记录为例,按照如图5 所示的电子数据智能模型设计思路可建立这样一个模型:将电子数据所反映的行为拆分为最小原子操作。 例如,将每一条聊天记录当作一个处理的对象,运用算法识别每一条记录中的实体、行为类型等,通过积累规则对标犯罪案由库。 这里有很多基础工作需要做,例如,规则库和案由库怎么构建,这些既可通过集成司法系统的行业智慧,也可辅助以机器学习来付诸实现。

图5 电子数据智能辅助审查模型设计思路

针对电子数据辅助审查智能模型具体如何运行的问题,以一份手机取证报告为例。 将手机取证报告作为输入,对其中的每一条聊天记录进行分析,以人、物、地址、时间为基本属性,以行为识别、实体识别、情绪识别等为扩展属性。 经过中间过程的匹配,初步输出检察办案所需项目。 例如,是否有团伙、主观故意情况、表示危害后果的证据、潜在的受害对象等。 这些具体的目标和指标均需要检察官的深度参与。 同时,还可在中间阶段加入取证规范性判断,通过智能化输出判断侦查取证行为是否必要、适当。

如何对模型进行验证? 模型的智能化操作最关键的是结果输出。 最初未必准确,甚至完全不准确。这就需要动员高校、科研院所、各类公司企业参与进来,可以给所有的参与者提供真实案件中的电子数据包。 各参与方充分挖掘自身智慧、创建自己的人工智能算法,支持和鼓励在各类算法之间进行竞争。 由于依据的基础电子数据是已判决案件,结果很容易得到验证。 通过这种形式,推动不断地完善人工智能算法达到更好的效果,这将是能够推动解决该问题的可行之道。

4.4 实现案件电子数据审查的必要功能

目前,行业主流的电子数据取证和综合分析工具软件通常具备过滤、关键词搜索(含正则表达式模糊搜索)以及简单的统计、标记等功能,但这与高质量挖掘和利用电子数据的目标仍相差甚远。 如何在浏览、过滤、搜索、标记、统计这五个基础功能上融合人工智能经典算法,既是挑战,也着实令人期待。以海量聊天记录搜索为例。按照常规的做法,检察机关会在深入了解案件的基础上,设定一组可能的关键词,并在社交媒体记录中进行精准检索(搜索中文,无法使用正则表达式进行模糊匹配),然后在命中的文本中逐项浏览、标记和判断。 但该方法却始终无法处理以下需求,如“检索聊天记录中出现的所有安徽省的地址”“检索聊天记录中‘闪电’组织的其他成员”“张三与李四2020 年 10 月 3 日下午去了哪里”“王五2020 年11 与10 日的情绪怎么样”等,这些“奇怪”的需求已突破了精准匹配和现有的模式匹配概念,需要以当前比较成熟的自然语言处理、机器学习为基础,研究运用好人工智能经典算法,从一个小的需求切口出发,逐步积累形成成熟的战法。 同时,还需要创造性的发明一种机制,将检察官的智慧模型化,并能够实现积累、验证和输出。

4.5 构建电子数据案件的科学表达

对海量电子数据进行可视化表达,既是运用电子数据的关键环节,也是充分实现庭审效果的有效手段。 以某网络传销为例,一个拥有10 余万用户的传销组织,其社会危害性、组织规模程度都不是数字能够传递出来的。在庭审环节,公诉人出示了专门绘制的组织架构图(如图6 所示),详细描绘了组织的层级关系和总体规模,取得良好的庭审效果。 当然,数据可视化的方式和工具很多,广大电子数据技术工作者可结合案件需要和实际情况灵活选择。

图6 电子数据可视化设计示例

电子数据作为一项法定证据,在刑事案件办理过程中发挥着重要的作用。 从电子数据内容层面实现诉讼价值挖掘,有望切实提高一线办案人员的电子数据审查能力。 应坚信,只要有广泛的参与者,一定能够最大程度地利用好电子数据,履行好检察机关追诉犯罪和法律监督职能。

猜你喜欢

聊天记录检察官检察机关
储存聊天记录用掉两个半三峡水电站电量
天津检察院减刑假释信息化办案平台上线
一键备份手机QQ聊天记录
全国检察机关党建理论研讨会在晋召开
和爸妈的爆笑聊天记录
三个女检察官一台戏
双十一,单身检察官是怎样炼成的
检察机关3年刑事抗诉近2万件
实行检察官办案责任制的对策建议
QQ聊天记录的保密绝招