大数据时代查办职务犯罪侦查模式认识论*
2019-06-12郭哲
郭 哲
(湖南大学法学院,湖南 长沙 410082)
2017年12月8日,中共中央政治局就实施国家大数据战略进行第二次集体学习,习近平总书记在主持学习时强调:“大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动。”谁掌握了数据,谁就掌握了主动权。随着信息化发展进入新阶段,信息技术和大数据分析手段有助于纪检监察机关发现线索、固定证据,给纪检监察工作插上科技的“翅膀",提高工作效率。在职务犯罪案件日趋智能化、隐蔽化、复杂化的时代背景下,职务犯罪调查工作应该注重数据引导,庞杂的数据给反腐败侦查工作提供了前所未有的便利,同时也带来了巨大的挑战。
一、大数据时代查办职务犯罪侦查模式之理论基础
数据作为先进科技之一,已经逐渐渗入到社会生活的方方面面,并体现出其无以比拟的高效、高质、便捷等优越性。在大数据时代,政府机关、企事业单位、社会团体、组织及相关个人在各个领域产生数据的速度越来越快、规模越来越大、类型越来越复杂,如此庞杂的数据给反腐败侦查工作提供了前所未有的便利,同时也带来了巨大的挑战。因此要充分运用大数据侦破腐败案件,需要对大数据原理深刻把握及对大数据时代查办职务犯罪侦查模式认识论深入探究。
(一)大数据时代职务犯罪侦查模式的哲学理论依据
职务犯罪侦查活动的进行,遵循了辩证唯物主义认识论的哲学观。辩证唯物主义认为,世界是物质的,物质具有一种客观属性,正是这样一种客观属性,其具有不以人的意志为转移的特性,辩证唯物主义认识论便进一步主张“可知论”,激励我们发挥人的主观能动性去发现规律,认识事物。传统腐败案件侦查模式以主观证据的收集为主、客观证据的收集为辅。[1]P10-13但是在大数据背景下的侦查模式中,侦查人员能够更多地运用口供以外的证据去发现犯罪、证明犯罪,利用大数据资源及其相关技术,侦查人员可以获取证明力胜过主观证据的物证,使得过去只能以口供表现或者只能从口供中获取的证据,可以在零口供下被大量收集并运用。这些证据包括犯罪嫌疑人的通讯记录、聊天记录、行车轨迹、住宿记录、出入境记录、现金交易记录、电子转账记录、银行取现留下的影像和签字数据,等等。大数据反腐侦查中着重于对这些客观数据信息的挖掘与收集,而且通过大数据获取的电子证据或电子信息绝大部份都是视听资料、电子数据,以及通过视听资料收集到的物证、书证,这些证据真实度高、客观性强。虽然传统的职务犯罪侦查也存在对犯罪案件的认识,但是大多是凭借零碎的线索,再通过经验、直觉得出的结论,经过实践的经验,这种结论更多的是一种推断的因果关系。为了深化认识,从谬误走向真理,现代职务犯罪侦查借助现代科学技术,分析数据,得出的更多的是一种相关关系。比如通过高科技分析数据可以得出,职务犯罪与市政设施、政府采购等政府行使职权相关的领域之间存在着相关关系,即职务犯罪率的上升,促进政府采购、财政补贴等产业的高速增长。再比如,通过借助分析企业、社会经济组织所掌握的数据可以得出,职务犯罪案件数量的增加,带来了娱乐场所、高档餐厅、高档烟酒以及汽车等行业消费额的增加。
大数据提供各种相互关联的信息,大数据时代查办职务犯罪的侦查则通过大数据带来的相关关系预测方法,能够敏锐的发现事物之间存在的联系,正如哲学上认为事物是普遍联系,所以唯物辩证法的联系观也是大数据时代查办腐败案件侦查模式的理论基础。如果事物A与事物B之间存在一起发生的联系,那么A与B往往相伴而存在,侦查A的同时还要侦查B。如果A与B存在的是此消彼长的关系,那么,通过对A的分析可以得出B的相反的结论。这些大数据提供的相关关系的哲学联系观可以预测出职务犯罪的犯罪时间、地点,克服认识主体在时间和精力上的限制,避免思维上的错漏。其次,还可以为侦查指明道路,为侦查部门通过信息间的相关,及时预测职务犯罪发展趋势提供便利。
职务犯罪黑数是指已经发生但是未被发现, 应当依法追究而未被追究刑事责任的职务犯罪行为数。[2]P1在职务犯罪黑数概念下,已经发生就是指已经实施了,但是没有被侦查机关发现,导致职务犯罪躲过了刑事责任的追究。[3]P8职务犯罪黑数强调的是犯罪的隐蔽性,一种未被检举、举报,或者是未被侦查机关主动察觉的状态,职务犯罪黑数职务还强调一种难以被追究刑事责任的状态。犯罪分子在犯罪前会存在由犯罪遭受的处罚和犯罪行为带来的不当利益的衡量,当犯罪行为带来的不当利益大于可能的处罚时,犯罪分子一般会冒险一试,而犯罪黑数这两种状态会给犯罪分子带来一种错觉,感性的认为犯罪不一定会受到惩罚,从而给犯罪分子在犯罪前一种盲目的心理自信,增大职务犯罪的发生几率。职务犯罪黑数越大,越反映出职务犯罪侦查查究不力,越暴露出腐败等社会问题的严重性。基于以上,必须降低职务犯罪黑数,能有效的遏制职务犯罪的发生。大数据时代,生活的方方面面都会被互联网以数据的形式记录下来,职务犯罪行为在如此海量的信息中也有迹可循。例如,故意杀人罪中的犯罪分子为犯罪做准备,在互联网搜索杀人的手段,同样,新型受贿罪的官员会借助引擎搜索相关的法条,或者是移转财产的方式等等,而这些都可以在百度等搜索引擎的后台数据中查到。职务犯罪侦查可以利用大数据这一特性,及时侦查出犯罪的手段、犯罪的相关信息,从而提高案件侦破率,降低职务犯罪黑数。
(二)大数据时代查办职务犯罪侦查模式的痕迹学理论依据
痕迹学原理广泛运用于考古和侦探方面。痕迹学原理在于追寻事物的内在痕迹和外在痕迹,追索事物发生的原因和过程。与痕迹学理论相关的是物质转移理论。在物质转移理论之前,就有人提出了物质交换现象在自然界具有普遍性的观点,法国的洛卡德把这一提法加以提炼,进一步发展为物质转移理论。在洛卡德的观点看来,事物活动实际上是各种物质不断接触并伴随物质转移的一个过程,犯罪也是如此,其中存在物质接触和转移,并且这一活动具有客观物质性,不因人的意志的改变而改变,是可以掌握规律的。痕迹学理论认为在物质转移过程中会留下各种痕迹,或是有形痕迹,或是无形痕迹,都不随人的意志的改变而改变。有形痕迹在大数据时代职务犯罪过程中,体现为互联网的使用痕迹,网络账户的使用痕迹,电子商务平台的购物痕迹,这些都以数据的形式存储在高科技载体中,构成大量的有形的数据。[4]P25无形痕迹则体现为职务犯罪案件中相关人员的思想意识,例如,在受贿罪中,行贿人与受贿人交涉接触的过程,彼此存在思想意识交流的接触转移。当然,案件通常不可能只有单一的人员,还存在证人,其他相关人员,这些人员的思想意识活动也是痕迹学理论中的无形痕迹。职务犯罪不同于其他类型的犯罪,其没有所谓的比较实体的犯罪现场,也没有其他类型犯罪下受到侵害的受害人,因此与其他犯罪相比较,职务犯罪更具有隐蔽性,侦查难度更大。在大数据时代,公权力机关的事务与互联网有着千丝万缕的关系,把电子数据认定为证据的一种,并越来越重视电子数据的作用,是时代使然,也是公权力机关利用互联网处理公权事务的体现。即使如微信等聊天软件,为了增加用户的数量,提升为用户服务的水平,提供了删除功能,但这些电子数据仍然储存于微信系统的后台。更何况,随着用户需求的发展,大多用户发展为要求能永久保存数据而不占内存的需求,为满足这一需求,很多系统都开发了云保存的功能。这些保存下来的大数据,为职务犯罪侦查提供了这样一种契机: 职务犯罪分子在大数据下的犯罪活动中会留下各种痕迹,而痕迹就是线索,把握好痕迹学,同时结合物质交换理论,就能掌握好破案的线索和证据。
(三)大数据时代查办职务犯罪侦查模式的系统控制论依据
系统控制论包括系统论和控制论。侦查活动中既体现系统论又体现控制论,两者合称为系统控制论。根据系统论,侦查活动就是一个多层次的系统的活动,具体表现为信息引导侦查活动中的信息发现、共享、收集、分析、处理等环节,各环节之间体现一定的层次性。控制论是指对系统论中的要素加以人为的调控,得出被调控后的结果,又把其作用结果返送回来,并对信息的再输出发生影响,起到制约的作用,以达到预定的目的。[5]P30-32把握好系统论,侦查活动才能有序进行。而根据控制论,侦查机关为了达到预先设定的目标,可以对系统论中的各个侦查环节进行人为的控制。在“信息引导侦查”职务犯罪侦查模式下,离不开系统控制论。侦查主体作为认识的主体,人脑的机能使其能够进行主观能动和主观调控。包括犯罪后侦查犯罪线索,锁定犯罪嫌疑人,以及利用大数据对信息进行采集、分析、归纳、整理,最终达到还原案件的犯罪过程、破解犯罪案件的一系列系统过程中。实现数据的预测功能,为侦查提供便利,是信息引导职务犯罪侦查模式下的优势。如何利用好大数据为职务犯罪侦查服务,就显得尤为重要,从目前来看,以下三个平台的建设很有必要。一是要建立信息决策指挥平台。建立这一平台的目的之一是一改传统侦查上的缺陷。大数据时代背景下的侦查是对大量信息进行分析,从海量数据中发现规律,而不是传统侦查中以少量的侦查线索,加之经验式的信息而进行的主观决策。对大量的数据进行分析能够减少误差,克服主观上的弊端,也就是说,信息决策平台得出的是客观的、误差小的决策。以较为客观的信息辅助侦查,减少职务犯罪侦查决策上的失误,对于提高职务犯罪办案机关的公信力,打击职务犯罪具有建设性的意义。二是要建立信息分析研判平台。大数据带来了海量的信息资源,但不是说侦查工作就自然而然的完成了,还需要对共享的信息进行分析、判断。建立信息分析研判平台,把实时共享得来的信息,及时的分析,促使信息对侦查的正确引导,才能走向信息引导侦查的侦查模式。三是创新纪检监察业务应用平台。应用也是使用大数据的重要一环,数据的应用是一项重要的技能。大数据对纪检监察业务应用平台提出了新的要求,因此,要改掉传统纪检监察业务应用平台不适应的功能,创新纪检监察业务应用平台。首先,要统一功能,新纪检监察业务应用平台应该具有很强的实用性,这就要求标准要统一,减少业务之间的摩擦。其次,使用必须简单,具有可操作性,有利于基层纪检监察人员快速上手,从而能快速的发挥数据对职务犯罪侦查的价值。[6]P9
(四)大数据时代查办职务犯罪侦查模式的数学理论依据
计算机和互联网为我们包括出行、饮食、购物在内的生活的方方面面带来了便利,与此同时,那种想要过与互联网“老死不相往来”的隐居生活之想法也变得越来越难实现。换句话说,我们的信息被互联网以大数据的形式记忆着,尽管有的时候我们非常不愿意,甚至有的时候连自己都没有发觉,却被计算机记录了下来。比较常见的记录,如常住人口信息、工商登记资料信息、银行邮政存款信息、通讯信息、车辆信息、房地产信息等数据库中的信息记录,而这些记录显然对侦查有利,职务犯罪侦查部门能从常住人口信息数据库中了解到犯罪案件中所涉及人员的信息,从车辆、房地产信息数据库中了解到涉案人员的财产情况,还能从通讯信息数据库中的记录找寻到案件的共犯等线索。这些数据处理,说明了数学对侦查的功能,构成了“信息引导侦查”职务犯罪侦查模式的数学理论依据。[7]P136大数据的开发使用,体现着数学的理论的运用。计算机以二进制的形式对数据进行存贮、转化。开发出一个新的应用软件需要一系列的编程、算法。为了适应新时代纪检监察业务的需要,纪检监察机关需要引入懂数学、懂编程的人才设计出能够在计算机上转化的运算来对大数据进行处理。例如,研发职务犯罪侦查情报分析系统,此情报系统应围绕犯罪嫌疑人、涉案线索进行核查,全方位、有重点的为职务犯罪侦查提供突破口。[8]P96
信息引导侦查模式下建设的大数据库数据,必须是海量数据中为职务犯罪侦查有关的部分,否则缠绕侦查工作的无关数据,只会成为侦查工作中的绊脚石。以下几个子数据库是职务犯罪侦查大数据库的应有内容:1、基础数据库。侦查机关必须对管辖区域内发生的职务犯罪案件进行初查,初查是职务犯罪案件的必经程序,并且与反腐倡廉的推进存在很大的关系,职务犯罪初查与反腐的相关性要求初查必须精细化。要进行初查,需要搜集大量的基础信息,包括工商登记信息、公安机关人口管理信息、民政部门登记信息、车辆管理信息、房产登记信息、金融机构信息、组织档案信息等。如果利用互联网技术把这些信息建设为若干基础数据库,实现以高新技术手段点击就能快速调取目标信息,从而就能节省初查中不必要的侦查资源浪费,而以往的时间、人力成本便可以用来提高初查的精细化程度。2、即时数据库。即时数据库不像预先设定好的数据库,即时数据库中的数据是在职务犯罪案件发生后,经过调查,收集得来的实际数据。与预先就存在的数据不同,即时数据与案件联系更为紧密,如果预先存在的数据与即时数据两者不一样,那么应以即时数据为准。即时数据包括案件发生后为了搜集证据而进行调查笔录、录像,以及为了恢复证据而进行的证据恢复,如短信恢复、电脑数据恢复等等数据。3、业务数据库。业务数据库也应该包含在职务犯罪侦查大数据库中。业务数据库针对行政机关,其中应该包括与行政机关相关的业务,如行政机关的资金的申报,招标投标、财政补贴等业务。
二、大数据时代查办职务犯罪数据库构建模式
信息引导职务犯罪侦查是时代的产物,是大数据时代与职务犯罪侦查的良好结合。这种结合促使侦查人员观念的转变,而观念的转变导致办案模式也随着发生变化。信息引导下的侦查是由被动型、粗放型、口供中心型转变为主动型、精细型、信息中心型的侦查。这种侦查模式的转变,是为了适应新型职务犯罪而走向精细化、主动化、信息化的表现。
(一)构建职务犯罪侦查专属数据库
信息引导侦查中的“引导”应理解为,通过在共享得来,并且整合好的信息中,能够预先的、化被动为主动去得到案件的线索,从而在丰富的数据中导引出侦查的方向、取证的方式和路径。[9]P9从引导侦查理解的界定中,我们能轻而易举的得出信息引导对于侦查的重要性,然而随之,如何“引导”也成为重要的课题。要发挥信息对侦查之引导,就必须要建立与职务犯罪有关的基础信息库,即构建以人员信息、活动信息、财产信息等有关基础信息的数据库。在侦查中,要锁定犯罪分子,就必须要侦查犯罪分子的姓名、性别、年龄、面貌等信息,侦查其最近的活动轨迹与犯罪现场是否可能相接,生活轨迹中有无动机和作案准备,以及侦查其房地产、机动车等财产信息,特别是在职务犯罪侦查中侦查此类信息显得尤为重要,如判定是否巨额财产来源不明罪,受贿罪等。当然,在以信息交互,实时性强为特征的大数据时代背景下,与职务犯罪有关的基础信息数据库的构建,应该发展为建立纪委监察委内部联网的行贿人员信息库、腐败高危人员信息库、官员亲属信息库、官员财产信息库,以及不动产交易信息库、股票交易信息库、汽车等贵重财物交易信息库在内,庞大却有序的数据库。[10]当职务犯罪案件线索来源于,通常也是大部分来源于举报、检举时,职务犯罪侦查人员可以利用这样一个数据库,迅速对案件的侦查作出反映。在实践中,侦查能不能走向案件的破解,往往取决于侦查的前二十四个小时。换言之,就是实践中侦查的有效性取决于侦查的时效性。建立这样一个庞大有序的数据库,职务犯罪侦查人员便可以迅速在库内获得姓名、身份证号码、电话号码、车牌号码,家庭住址、工作单位等类似的相关信息,从而节省了为获取这些信息而做调查的时间、人力资源。以往浪费掉的时间成本,可以用来进行更有价值的侦查步骤,如对线索价值的评估,对侦查路径的选择,和进行对侦查之关键的证据的收集等等。可见,构建与职务犯罪有关的基础信息数据库,能够提升职务犯罪侦查的效率。
大数据模式需要依托海量且准确齐全的信息,只有建立内容全面、集成高效、高度共享的数据信息库,重视硬件的配备,才能发挥大数据侦査的最大效益。构建职务犯罪专属数据库要突破传统侦査基础信息数据库政府信息资料库、社会信息数据的禁锢,建立适合职务犯罪侦查的综合数据数据体系,涵盖基础信息、案例、线索信息等与职务犯罪有关的各类数据。可借鉴公安系统“金盾工程”,建立全国职务犯罪信息网络平台,为职务犯罪侦查提供信息保障。依靠资深侦查人员的经验与科技工作者的技术,建立有效、实用的职务犯罪数学模型,进行数据、信息比对,确定事物关联性后整合犯罪嫌疑信息,还可通过证据、个案、类案分析生成各类预警、决策报告。大数据侦査下,不仅需要有专门的情报信息机构,还要配备信息技术人员、专业情报信息分析人员和联络协调人员,人员的素质和能力,直接决定着职务犯罪侦査情报信息系统的数据分析和数据研判质量。建立侦査科技人才队伍,应专兼结合、缓急结合:可争取组织、人事部门支持,引进一批急需的专业技术人才;可有针对性的组织有侦查办案经验的侦查人员进行培训,将其培养成用精通侦查技能和技术装备的复合性人才;可与技术部门共享技术人才优势[11]P191。
但另一方面,构建与职务犯罪有关的基础信息数据库存在一定的困难。诸如上网有上网痕迹,通话有通话记录,短信记录,出行有身份信息,以及各种app应用所授权获取的个人资料、定位和后台数据等等所形成的数据爆炸时代,构建这样一种信息数据库也不是一件容易的事。[12]P112首先,在各种数据中剔除无关的信息,从而使数据库的信息更有价值,必须扩宽为面向各种平台,企业组织所掌握的数据,并进行有筛选的采集。把来源于不同渠道的信息,对其进行技术上的分析,进行精细的分类,然后系统安全的存储下来。这些基础性的工作在数据库构建初期是大量的,具有一定困难性。其次,对于如官员的房地产、汽车、存款的财产信息,其获取和使用上的困难,也造成了数据库构建的阻力。[13]构建与职务犯罪有关的基础信息数据库的原因,从国家利益角度来看,职务犯罪一般侵犯的是国家财产,会造成国家利益上的损失,同时,又由于国家利益、党的利益和人民利益是相统一的,所以建立这种基础信息数据库,从而提高职务犯罪侦查的效率,在迅速侦破职务犯罪案件的同时又遏制职务犯罪,降低职务犯罪率,涉及的是各方面的利益。因此构建信息数据库是必然趋势,反腐倡廉势在必行。为此,利用一切互联网上与职务犯罪侦查有关的海量信息,纪检、监察、审计、公安、税务、工商、银行、房地产管理、通讯、社会经济管理等部门联手,进行与职务犯罪有关的大数据共享,从共享数据中分析出腐败的诱因,从而更好打击职务犯罪,做到打老虎与拍苍蝇两面抓,甚至能够起到预防职务犯罪,约束政府官员的效果。[14]P8
(二)职务犯罪侦查大数据库的构建规则
基于职务犯罪数据库的困境,职务犯罪侦查大数据库的构建必须遵循以下规则:
1、检索规则。大数据时代是信息爆炸的时代,海量的数据是最为鲜明的特征。以大数据为基础的职务犯罪侦查大数据库中也拥有大量的数据资源。而要利用这些数据就必须对其进行检索。检索必须有规则,不能朝令夕改,必须固定下来,形成一套规则。在职务犯罪大数据库中,建议设立快速检索栏和高级检索栏,检索方式应该是多样的,如按照关键词,案由、人名、时间等方式来检索,尽量满足检索人的需求,从而快速检索出结果。
2、关联规则。首先,关联规则要求数据必须具有相关性,如同证据必须具有关联性一样。其次,职务犯罪侦查大数据库中的数据应该是相互关联的,通过信息之间相互关联,可以深入了解案件的事实,从而整体把握案件的情况。[15]P96关联规则能减少侦查工作的障碍,促进侦查工作流畅的进行,从而提高侦查的效率。
3、符合法律规则。法律具有指引作用,法律通过规定主体在法律上的权利和义务来指引人们的行为,违背法律将会受到法律的制裁。职务犯罪侦查大数据库的建立要遵循法律的规定,数据库中的数据要求来源必须符合法律要求,尤其是刑法和刑诉法要求。数据库数据的采集、使用必须是为满足职务犯罪侦查的需要,否则,就有侵犯隐私权之嫌。
4、及时入库规则。及时入库规则对于保证数据的正确性具有重要的意义。在上文提到的三个子数据库中的数据都要符合这一规则。因为要保证准确性,所以及时入库前要经报批。但是,三个子数据库中的即时数据库具有特殊性,此数据库的数据不能像另外两个数据库一样经报批就可入库,在报批前还需要经过层层的筛选。总之,及时入库才能及时发挥数据的价值。
5、专人负责规则。设立专人负责规则的目的是保证数据的安全性。大数据库中海量的数据一旦泄露,会侵害隐私权,甚至将会被不法分子所利用。专人负责还要保证数据运用过程中的安全,像企业会计一样,必须专人经手,不允许随便使用。建议采取权限准入等手段,确保专人负责,并经严格审批。
电子证据作为新兴证据,具有无形性、易收集性、易保存性、反复重现性等独特的证据特性。查办职务犯罪时,侦查员经常把有存储功能的电子设备作为检材,提取数据、恢复和还原已删或覆盖的数据。应严格遵照以上规则,做好提取、固定、登记和保管工作,确保电子证据的真实性、完整性和合法性。
从技术层面上分析,职务犯罪侦查大数据库的建设简而言之就是数据汇集和算法构建。在数据汇聚方面,职务犯罪侦查机关与其他的司法机关对内部网络都是采用等级保护的机制,通过相关的网闻、前置机就可以实现对其他司法机关、互联网数据的导入。尽管纪检监察机关的内部网络采用了分级保护的机制,依然可以采用互联网向非涉密工作网导入数据,非涉密工作网经过严格的审核和备案后再向涉密网络单项导入的形式,进行数据的汇聚。在数据存储方面,大容量硬盘阵列已经非常普及,可以选取高速、高容量的硬盘己经可以被配置在纪检监察机关的数据中心,能够高达数十PB的硬盘组已经能够被组建,结构化、半结构化和非结构化的数据都能够被存储。镜像模式,热备容灾等数据备份机制使得数据的存放更加安全。在算法构建上诸如Hadoop①、Spark②、Openstack③这些软件框架己经经过大量实践应用的检验。如Hadoop已经成为大数据分析领域最受欢迎的解决方案,类似eBay这样大型的电子商务企业都一直在用Hadoop技术从数据中挖掘价值,如提高用户搜索的精确性、通过用户的行为对用户进行画像以提高用户的体验,精准的广告投放等。国内已有多家软件公司针对司法数据进行建模分析,创新地推出了不少司法大数据模型产品。如北京华宇公司参与北京市检察院构建检立方项目,并提供了多种分析评估检察业务质效的数括模型。安微富驰公司推出的“数魔方”,为安徽省法院提供了类案检索和审判辅助功能。类似这些创新的大数据业务模型保证了构建职务犯罪侦查专属数据库在技术上是可行的。
三、大数据时代查办职务犯罪数据分析模式
大数据时代查办职务犯罪思维模式的一个最大转型在于数据在整个侦查过程成为主导和导向因素。在这一新的侦查思维模式中,职务犯罪侦查的思维重点和关键在于侦查人员充分采用数据技术,利用收集的海量数据的整体性、全面性、相关性、多样性特点对数据进行分析,得出体系化、有规律性的分析结果,发现与所查办案件相关的数据证据、助力办案。
(一)树立数据空间侦查思维
在大数据时代,侦查数据化是大势所趋,职务犯罪侦查人员在侦查中应当从物理空间转向数据空间,关注大数据、接纳大数据、运用大数据,充分认识到大数据的重要价值,做到用“数”分析,以“数”办案,树立数据空间侦查思维。[16]P202-203具体而言,一是树立数据化侦查思维。现代社会中,在人类智力和硬件设施高速开发的双支持下,只要人们进行社会活动,有关信息就可能以数据形式被捕捉和记录下来。相关的职能部门、机构随时随地从不同的角度、以不同形式将各种违法犯罪信息记录下来,腐败案件侦查工作所需要的绝大部分信息也是以各种各样的数据形式存在的。即便是某些主要或关键的犯罪要素或片段缺失,通过相关海量数据的连接、分析后,也可以拼接出相对完整的犯罪过程。因此,侦查人员应以数据信息为出发点,以关联部门和机构记录的数据信息的收集作为职务犯罪侦查的第一步。二是树立侦查量化思维。以往在侦查过程中,侦查人员对于各类侦查信息主要依靠经验来分析,效率较低,且缺乏衡量标准,因此结论也不精确。大数据时代,犯罪嫌疑人、危害行为、作案方式、时间、地点、犯罪主观方面、危害结果、物质痕迹、电子信息等与定罪有关的所有线索、要件都可以通过数据筛选、计算机运算、云计算、统计学原理等技术与方法予以量化,而清晰的量化标准有助于提高侦查人员的工作效率、提升侦查结果的准确度。三是树立数据可视化思维。大数据时代的侦查信息除了可以进行量化以外,侦查人员更要树立侦查信息可视化思维,将量化后的数据以各种形象的图表、思维导图、电子影像等方式予以呈现。通过可视化方式变抽象为具象,为案件分析提供更为直观、更为立体、更为形象、更为准确的“数据画像”④。
(二)查办职务犯罪数据分析思维导图
在信息化背景下,新型犯罪出现了横跨现实空间和虚拟空间的现象,这就使传统职务犯罪侦查模式捉襟见肘。传统的职务犯罪侦查主要方法是通过举报线索收集涉案人员口供、调查访问、收集物证、摸底排查等,其模式属于经验型,很大程度上依靠办案人员丰富的办案经验。由于职务犯罪案件性质特殊,现场目击证人、物证及现场犯罪痕迹较少,所以传统的侦查模式在发现案件线索上单独依靠举报、在取证顺序上强调先获取犯罪嫌疑人口供,并将口供视为证据体系中最为核心的证据,以口供去搜集其他证据。“以供求证”侦查模式所遵循的是一种“特定的嫌疑事实→犯罪嫌疑人→嫌疑依据或证据”的认识路径,该认识路径的本质特征在于,特定的犯罪嫌疑人既是侦査认识的内容,又是侦查认识的依据和途径。[17]P26这种侦查模式就是利用侦查人员与犯罪嫌疑人之间的信息不对称,突破犯罪嫌疑人心理实现职务犯罪案件的侦破,是侦査主体进行侦查活动时在不断发现、汇总、分析、研判、处理犯罪关联信息,还原案件真相及查明法律事实过程中所采用的思维模式(如图1)。
图1 侦查逻辑思维活动系统工程图[18]P27
然而,如今许多职务犯罪行为已经不再是单一的现实空间作案,往往现实、虚拟交错出现,甚至有些直接表现为网络犯罪。近年来国内外对大数据手段应用于执法和司法的实践和研究越来越广泛。在我国,职务犯罪侦查模式转型过程中引入了职务犯罪侦查信息化的概念。虽然信息和数据的原始概念有所不同,但在科学技术高速发展的今天,所有的信息均可以数据化,这一改变使得职务犯罪侦查信息化模式为数据引领职务犯罪侦查模式奠定了理论基础。职务犯罪侦查信息化大致经过了两个阶段:第一阶段是信息单一应用阶段,学界称之为“信息嵌入”阶段[19]P16-17。这一阶段表现为全国侦查机关引入信息技术和信息化侦查装备,建立相关职务犯罪数据库。但是,该阶段的职务犯罪信息是静止、独立而片面的,信息共享机制未到位,侦查人员专业素养不够,导致了职务犯罪转型后劲不足。第二阶段是信息综合应用阶段,学界称之为“系统集成”阶段。在此阶段,侦查办案人员开始积极主动的运用信息化办公系统,一定程度上解决了信息共享的问题。传统侦查模式与信息化侦查模式开始融合。这一时期的职务犯罪侦查模式转型的最大特点是网络技术的广泛应用,职务犯罪侦查效率有所提升。
图2 运用大数据查办职务犯罪思维模式图
“让数据说话”使得职务犯罪侦查形成了一种新的系统工程模式,即“数据的收集和预判—犯罪初查—立案—数据的收集和研判—终结”(如图)。这个新的侦查思维系统工程模式中与案件相关的数据成为破案的关键。在大数据时代,侦查过程就是数据储存、提取和分析过程,数据贯穿于侦查的各个环节,“让数据说话”成为侦査的基本思维。[20]P9大数据侦查确立以客观性证据为中心的取证模式。这种“由证到供”的主动侦査模式,具有査办案件准确、快捷、高效、证据固定、能顺势挖掘更多信息等优势,已成为职务犯罪侦査模式的必然趋势。大数据时代下,职务犯罪侦査模式将数据信息的收集、整理分析、利用与职务犯罪案件的査办有机结合起来,在拓展案件线索来源、快速搜集情报、突破犯罪嫌疑人防线等方面充分发挥大数据作用。按照侦查活动中记录、存储、提取以及分析信息的方式将信息引导侦查模式划分为业务信息引导侦查模式和大数据驱动侦査模式。业务信息引导侦查模式实际上只是传统侦查模式的电子化改革,它主要依靠人工采集信息,受侦査人员的逻辑和经验的局限,信息更新不及时且信息的智能化、多维化分析不强。因此,建立在大数据和云计算平台基础上的大数据驱动侦查模式,成为信息引导侦査模式的最终发展方向。
数据分析理念与传统腐败案件分析的最大不同之处在于,数据分析以数据为基础,依托智能算法、云计算等现代科学技术,对筛选的相关数据进行排序、计算、整合以及全面、客观、系统地分析,不再是遵循以往的零散分析、主观分析和经验分析。“让数据说话”是推进职务犯罪侦查思维转型过程中的基本思维,这一思维模式包括三个方面的内容:第一,职务犯罪中的所有情节都可以用数据来体现。凡事皆可量化,皆可数据化[21]P103。不仅与职务犯罪相关的有形之物如时间、空间、行为、手段、物等可以量化和数据化,那些与犯罪相关的无形之物如人的价值观念、态度、情绪等等也可以量化和数据化。[22]P78第二,数据在职务犯罪侦查中属于基础性资源,大数据手段也是职务犯罪侦查工作中的基础方法。侦查就是对数据开矿式的挖掘和分析,侦查能否成功某种程度上取决于对大数据资源的提取、分析能力,运用大数据各种分析技术,可以获得我们所需要的犯罪信息。[22]P80第三,数据支撑侦查程序推进,数据采集和分析是整个侦查过程的核心。选择侦查策略和途径、数据分析和摸排、侦查预测等环节都要围绕数据来运行和展开。
(三)查办职务犯罪中数据相关性分析
以往的侦查思维是一种单项思维、平面思维、局部思维,侦查案件只是在一个平面上作单一定向的分析。[24]P105传统的职务犯罪侦查过程是按照因果关系和数据结构的标准来采集和分析数据的,按照这两个标准,侦查人员只是采集业务工作的基本信息,如户籍警察按照一定的结构记录了人口基本信息、治安警察按照一定的结构记录了违法犯罪信息等,这种采集信息模式下收集到的信息范围相对狭窄。而大数据技术的特点之一是“相关而非因果”,这一特点改变了传统侦查模式普遍追求的因果关系的经验。其以相关关系思维为主导,分析职务犯罪案件各个情节的数据相关关系。学者舍恩伯格认为:“大数据让社会放弃它对因果关系的渴求,而仅需要关注相关关系,也就是说只需要知道是什么,而不需要知道为什么。”[25]一些看似没有关系的数据通过相关性分析就有可能发现它们之间的关系。当一个数据量变化时,另一个数据量也随之变化,通过海量数据的分析和研判,总会在二者之间发现一种数据变化的规律,这种从大数据中发现的相关关系可以给职务犯罪侦查带来意想不到的收获。因此,对于纪检监察机关来说,可能与滥用公权力相关的所有数据都弥足珍贵。
图3 互联网查办职务犯罪可视化数据图
当前,侦查部门无需根据经验化的因果关系,通过大数据技术便可以将所有与案件相关的数据信息汇集在一起,这极大程度地方便了侦查人员更加注重对腐败犯罪案件各种要素的相关关系进行分析,以及以相关性思维收集、分析结构化、半结构化、非结构化数据,进而为发现线索、查找案件突破口提供更有价值的关联信息[26]。其次,从结论上讲,数据判断标准要实现数据证明和法律证明的相结合。数据证明强调相关性,法律证明强调排他性,两种证明逻辑上存在本质差异。大数据的“相关性”,是广义的相关性,既要追求支持事实的相关信息,又要追求否定案件事实的排他信息。因而,在大数据的智力支持下,要以数据证明为方法,以法律证明为目的。
在查处职务犯罪案件的侦查活动中,专案侦查员从传统的寻找“物质痕迹”转变为寻找“信息痕迹”,通过数据侦查平台,利用“互联网”等不同信息技术获取的不同来源、不同形式的各种数据,通过分辨、处理和优化,乃至可视化地呈现出来(见图3)。引入先进的大数据分析,根据海量的案件数据,建立起合理的恰当的数据模型来认识案件,可以在短时间内将犯罪嫌疑人基本情况、关联线索信息、行踪轨迹、人际关系网络等情况清晰分析展示,在职务犯罪案件侦查中通过数据挖掘,搜索隐藏于海量信息中的有效数据,实现侦查资源的有效整合与侦查信息的动态勾连,大力提升办案效率与效果。
四、大数据时代查办职务犯罪数据收集模式
(一)理念层面:塑造侦查人员大数据信息情报收集观
黑格尔说“理念是任何一门学问的理性”,[27]P2而且认为理性中包含着“某种预想的东西”,具有前瞻性、导向性和设计性。[22]P72理念作为意识的凝结,对于实践具有非常重要的价值引导作用,而且是实践获得成功的重要因素,对于侦查工作也是如此。大数据时代,须有新的数据收集模式,即大数据时代的职务犯罪信息情报收集模式。理念指导模式的运转,成就模式的活的灵魂。大数据时代的职务犯罪信息情报收集模式在理念层面以侦查人员大数据信息情报收集观为指导。侦查人员大数据信息情报收集观与传统职务犯罪侦查的信息情报收集观念存在很大的区别。传统职务犯罪侦查的信息情报收集观念是与旧有的工业社会相匹配,侦查人员大数据信息情报收集观是大数据语境下的新型理念。[29]P93传统的情报收集观虽然也承认犯罪分子的犯罪活动过程中会留下各种痕迹,但却认为这种痕迹是有形痕迹,比如指纹、脚印、体液等,忽视了无形痕迹的作用,并且对这些痕迹只是简单的收集起来,把收集来的痕迹,即证据简单相加。这种传统侦查模式在错误的理念指导下容易造成侦查错误,这为现代社会高涨的人权保护意识所不能容忍。在大数据背景下产生的侦查人员大数据信息情报收集观则能够克服这些弊病。网络时代,很多犯罪,特别是职务犯罪的犯罪分子利用互联网、4G移动通讯平台甚至将来广泛运用的5G技术来实施犯罪,使得新型犯罪没有传统犯罪那样实实在在的场所、线索,犯罪更具有隐蔽性。[30]P87于是侦查人员必须面向网络承载的大数据信息,尤其是注重在大数据中侦查上网历史,聊天记录等无形痕迹。“可以说,没有大数据意识缺乏信息的掌握和研判,很多案件根本无法侦破。”[31]P15因此,在理念层面,塑造侦查人员大数据信息情报收集观,对于打击和遏制新型职务犯罪具有非凡意义。侦查人员大数据信息情报收集观的塑造,必须重视数据的价值,在海量数据中甄别出相关的信息,对数据进行采集、分析、归纳整理。同时,还要利用一切可以利用的数据,如行政机关行政信息公开专栏公布的经费支出、或者是如犯罪分子在聊天软件中晒出的不符合本人收入水平的炫富信息等等。总之,塑造侦查人员大数据信息情报收集观是在理念层面对大数据职务犯罪隐蔽化的破解方式。
(二)中枢层面:设置专门化的大数据时代职务犯罪信息情报控制平台
中枢层面是指事物系统中起中心主导作用的部分,如同大脑神经中枢的重要性一般,设置专门化的大数据时代职务犯罪信息情报控制平台对构建大数据时代查办腐败案件数据收集模式的运转起着“神经中枢”的功能。
我国的大数据犯罪信息情报收集、控制系统与发达国家相比较,还处于非常稚嫩的起步阶段。虽然有如公安部联合信息产业部等相关部委共同发起的“天网工程”,但是这个工程不具有专门性,其涉及的有刑事案件、治安案件、交通违章、城管违章等,职务犯罪侦查只是其中的一小块内容,因而不能满足打击越来越隐蔽的职务犯罪的要求。[32]P117山东济南等城市启用的“公安云计算中心”,也是如此。现今,大数据时代为大数据犯罪信息情报收集、控制系统既提供了条件又提出了新的要求。计算机不断更新换代、电脑CPU能够对指令迅速作出反应,功能不断细化,在职务犯罪侦查上,案件预测技术、证据收集储存技术成为可能,但同时侦查机关也要面对零碎繁杂的信息,做好筛选整理工作。据此,为了抓住机遇、迎接挑战,侦查机关理当设置一个专门化的大数据时代职务犯罪信息情报控制平台。[33]P123
构建专门化的大数据时代职务犯罪信息情报控制平台,应当根据侦查机关级别,划分县(区)—市—省—国家(中央)四级。在平台内部四级中,应该吸收毕业于计算机技术专业的人才,并对侦查人员进行高新技术操作的培训,保证侦查机关与互联网的密切互动。平台应该围绕反腐等打击职务犯罪为中心任务,加强与其它机关的合作,如与税务、工商、金融等部门合作,共享有关职务犯罪的情报,从而建立为一个多机构、全方位的专门平台。[34]P12此外,构建专门化的大数据时代职务犯罪信息情报控制平台时,为了方便在平台内进行快速的检索,还须在平台内设立三大资料库。一是案件线索资料库。线索是案件的开端,在职务犯罪中,案件线索可以是来源于举报、检举、控告或是侦查机关主动发觉。建议在案件线索资料库中根据职务犯罪案件的类别,对线索来源加以录入和整理。二是已办案件资料库。已经办理的案件分别整理为单个档案归入档案室,是我国一直的做法。随着大数据时代的发展,技术上为档案扫成扫描件存贮为电子档案提供了可能性,有的地方已经开始践行。因此,要建立已办案件资料库。该资料库对职务犯罪侦查具有重要作用。已经办理的案件是过去式,但不是完成式,特别是现在越来越重视对错案的责任追究,已经办理的案件也可能存在个别的错误。这样,建立已经办理案件资料库有利于加强对侦查机关的监督以及侦查机关自身纠错,从而便于侦查机关总结经验和教训。三是社会公共信息资料库。随着社会的进步,各行各业大数据应用的进一步深入,社会上产生和采集的与查办职务犯罪相关的信息数据越来越丰富,纪检监察机关能利用的数据量也越来越大,包括公安综合信息、相关国家机关执法信息、公用事业单位信息、互联网信息等信息,这些海量的数据为职务犯罪侦查特别是关联分析提供了丰富的数据资源。[35]P105当然社会上产生的海量数据,纪检监察机关不能全部拿来,而只能利用与职务犯罪侦査工作相关的信息数据。⑤虽然侦查机关能够利用的数据有限,但是由于各种数据之间存在着相互关联关系,大数据背景下,侦查机关不应把视野局限于犯罪信息,对公共数据进行关联分析,也可能会出其不意的揭露某些隐蔽于其中的犯罪。[36]P145建立数据共享平台需要制定一系列的建设标准。没有规矩不成方圆,没有标准也就没办法构建一个完整的平台。只有不断加强职务犯罪数据的流动和共享,才能使数据引领侦查新模式焕发生命力。新模式下的侦查数据库不仅需建立面向国内外各个地区、各个领域的基础数据,还需要做到实时更新,为实现整个系统内部网络相连、信息互通、数据共享奠定基础。
(三)技术层面:凸显数据挖掘技术在信息情报收集中的应用
第三次革命带动了技术的变革,自此进入了信息化时代,科学技术成为第一生产力。在此背景下,职务犯罪也成为了技术型犯罪,使犯罪难以被侦查。要打击这种新兴无形化职务犯罪,必须以技术对抗技术。
大数据时代查办腐败案件数据收集模式,在技术层面,要重点突出数据挖掘技术在信息情报收集中的应用。数据挖掘技术(DataMining Technology)作为从数据源(数据库、文本、图片、视频、Intern等)内搜集人们所需要知识之新兴信息技术,能帮助侦查机关在碎片化、海量化信息中挖掘出案件的信息,节约侦查资源。数据挖掘技术还具有归纳数据的功能,通过汇总各种具有同种特质的微量信息,使其具有职务犯罪侦查意义上的价值。[37]P89
法律提倡侦查与技术相结合,促使侦查走向技术化。要在职务犯罪信息情报收集中,运用数据挖掘技术,具体为关联分析和模型结构两大内容的运用。首先,在关联分析这块,关联分析凭借探究数据之间的相关性,能够挖掘出彼此关联数据背后的隐藏信息。这种技术思维能够打破传统侦查的孤立思维。例如通过Apriori算法,将职务犯罪案件中犯罪分子的年龄、职位、学历和作案的手段、时间、地点等要素相串联,得出不同职务犯罪案件年龄分布、职务与犯罪率关系以及职务犯罪区域分布等分析结果。[38]P126以人力来分析这些信息之间的关联,不仅繁琐,而且容易产生误差,用数据挖掘技术来代替人力操作切实可行,还能提高侦破案件的效率。其次,在模型结构方面,结合关联分析技术,建构出一个以三大要素为维度的模型,这包括案件资料维(职务犯罪类别、案发时间、地点等)、犯罪嫌疑人维(职务犯罪嫌疑人姓名、性别、年龄、学历、职务等)和犯罪行为维(贪污贿赂行为、渎职行为、侵权行为、其他职务犯罪行为、侵害法益严重程度等)。[39]P56这种数据化模型,立体化展示与职务犯罪侦查相关的信息,指引侦查的方向,为攻克侦查难题提供技术上的支持。
(四)法律层面:注重相关人员的人权保护
一方面,时代在快速发展,法律要对发展着的社会现象作出反映,但与此同时,不同于政策的法律又要保持一定的稳定性,这两种要求之间存在着一定的矛盾,加之我国《立法法》规定的严格的法律修改程序,造成法律有的时候滞后于社会发展。在侦查方面就是如此,如对于技术侦查、电子数据,我国法律仅仅作出了粗略的规定。因此法律需要对侦查作出更加细化的规定。
另一方面,我国步入法治社会,依法治国不断深化,法律至上成为我国和其他法治国家基本原则,它要求法律面前人人平等,不允许任何人在法律面前享有特权。随着法律至上等法治精神深入人心,人们愈发要求并看重自由和人权保障。孟德斯鸠主张“天赋人权”、美国《独立宣言》中规定:“人人生而平等,造物主赋予他们若干不可剥夺的权利,其中包括生命权、自由权和追求幸福的权利。”[40]P28尊重人权是法治国家应有的内容,故在法律层面,法治国家的犯罪侦查,理应遵循法律的要求,注重对相关人员权利的保护。
从大数据采集中职务犯罪信息情报,不同于传统侦查事务的开展,由于职务犯罪转向虚拟的网络空间,侦查方式发生改变、侦查阵地也随之转移。传统侦查更多的是侦查人员与相关人员面对面接触,一旦被侵害权利,受害人能够立即发觉。而在大数据时代,不止是信息引导侦查模式下,各方面都可能会侵犯隐私权,并且受害人的范围极其广。[41]P155信息化造成受害人面对侵害时往往无能为力,仿佛这是享受信息时代带来的便利而不得不付出的代价。《宪法》规定:“国家尊重和保障人权”。监察机关在展开大数据时代职务犯罪信息情报收集时,必须尊重法律规定,在法律层面注重保护相关人员的隐私权、言论自由权、通讯自由权和虚拟财产权等人权。构建大数据时代职务犯罪信息情报收集模式,在法律层面注重对相关人员的人权保护,应做到以下几点:其一是在监察机关内部加强监管,监察机关内部制定安全等级制度,安排每一安全等级的侦查人员涉足不同安全系数的数据信息。下一等级的侦查人员若要采取大数据侦查活动或者需要获取上一等级的数据信息,就必须向上一级的领导汇报审批,若没有得到批准,获得的证据则不会被采纳。并且对获得的各级数据信息必须要保证完全保密,要加强数据防火墙建设,防止外部人员入侵。其二是在程序上,要保障相关人员的知情权。监察机关在履行职务时要全面履行告知义务,向被调取信息的人员作出说明。并且这种告知要充分、彻底,能够保证相关人员确实同意。侦查机关在收集数据的时候,理应尽到合理、全面的告知义务,给相关公民讲解其可以享有的权利和应履行的义务,防止其因为不了解专业知识而不知其中危害。⑥其三是监察机关要安全保管数据并履行严格保密义务。监察机关构建各种信息数据库后,要采取安全措施,如设置权限准入,数字密码,并配有专人负责,无批准不得随意适用,此外,也不能利用职权,非法使用所掌握到的相关信息,确保数据安全保管不外泄。一旦违反了这些义务,既要受到行政处分,又要追究法律上的侵权责任。[42]P120其四是应当完善网络非法证据排除规则。主要是指通过非法使用大数据手段获得的证据不得被采纳的制度。目前的非法证据排除规则主要面向传统侦查模式下的证据,但是由于大数据证据的特殊性,所以应当确立数据排除规则、设定数据排除范围并且明确数据排除程序,利用这些特别规定来尽量减少相关人员的人权侵害。⑦
结语
事实上,职务犯罪侦查本质上就是一场“数据战争”,其侦破过程就是数据的收集、预判、处理、分析、研判和运用的过程。随着智能移动技术的发展,技术研发者为了给用户提供更加便捷的使用体验和更周全的数据存储技术,他们推出了照片、通讯录、账户和密码的云存储技术。出于快捷、便民的目的,技术研发者和使用者往往都不会删除这些有很大价值的信息。现代社会每一个人都离不开这些云技术,即使一部分人群主观上可能不是很喜欢这类事物,但是他们却常常因为工作和生活中的一些常规要求而不得不使用这些先进技术,这样就在所难免的会在数据信息库里面留下自己的痕迹。也可以说,云技术为职务犯罪侦查提供了进入每个人的私人虚拟空间的快捷通道,使每一个人的个人虚拟信息都可以在侦查机关的掌握之中。职务犯罪涉案人员多为管理者,与信息时代生产生活相适应,其对外交往离不开手机、电脑、网络等电子设备,这些电子设备里面往往存储着最为重要、私密的信息,甚至客观地记录了实施职务犯罪的经过。[43]P54-55目前,权力机关已经将互联网数据存储技术和数据交换系统等技术手段全方位的运用到公共管理和社会服务的过程中,即使部分系统内部采用保密政策,但是各种公共服务仍然不能断绝与互联网保持联系。侦查机关可以通过大数据手段第一时间占领信息的制高点,从粗放型侦查转向精细型侦查,从被动型侦查转向主动型侦查,从口供中心型侦查转向信息中心型侦查,从由供到证型侦查转向由信息到事实型侦查。[3]P8从而打赢这场“数据战争”。
在大数据时代背景下,侦查人员利用大数据技术,挖掘情报,能够提高其与犯罪嫌疑人的对抗能力。侦查人员可以在整合的情报中敏锐的发觉犯罪痕迹,实现先发制人,并且,随着大数据技术应用水平走向成熟,一些犯罪被扼杀在犯罪预备阶段将成为可能。值得一提的是,数据平台下的侦查模式与传统侦查模式之间并不是你死我亡般的取代关系,信息引导侦查的模式不断发展,并不意味着传统侦查模式的消逝,相反,这两种侦查模式其实是可以在多元的世界中共存的。大数据背景下,大数据侦查模式的构建具有必然性,同时也需要各方面的努力,如需要对科技发展的重视、培养精通该模式的人才,以及更加完善的法律制度等等方面的支持。我们有理由相信,新时代随着反腐工作的推进,大数据技术的发展以及法律制度的完备,我国查办职务犯罪侦查模式将日臻完善。
注释:
① Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS,HDS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。HDFS放宽了(relax)POSX的要求,可以以流的形式访问(streamingaccess)文件系统中的数据。
② Spark启用了内存分布数据集,除了能够提供交互式査询外,它还可以优化迭代工作负载。
③ openstack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。Openstack支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。
④ 目前在实务中,已经不少地区的侦査部门开始运用大数据画像技术。江苏省某市检察院依托于2000余万条拷贝类信息库、10余条实时连线信息查询通道、10000余条已办案件信息等三大信息库组成基本的数据平台;在其查办的每一起职务犯罪案件中,侦査人员都会对嫌疑人进行基本的数据画像,选取其话单数据、手机数据、银行数据、房产数据、出入境数据作为画像的数据源;在此基础上,侦查人员通过大数据智能挖掘和人工分析研判,对每位嫌疑人的基本信息、人际关系、资产情况等进行画像。再如,福建省某市检察院的“智慧检察大数据分析平台”,同样具有数据画像的功能,其能将有关犯罪嫌疑人的碎片数据收集整合,对其家庭情况、人际交往情况、消费情况等维度进行画像。见王燃.大数据侦查[M].北京:清华大学出版社。2017.139.
⑤ 2016年贵州的检察机关就与公安机关、行政执法机关、银行业,包括通讯运营商等等实行信息的互联互通,在他建成的大数据库里面收录了3500多万条信息,对于他们发现案件线索,取证和侦破案件都带来了明确的改观。
⑥ 此类事件看似罕见,但其实屡有发生。例如,一个非计算机专业人士就很难知晓服务器端自发形成的cookie用途,即便网络服务商告知其可以禁用cookie,他也不一定完全掌握如何删除这些容易泄露自身隐私的cookie之技巧。欧阳爱辉:《大数据时代的职务犯罪信息情报收集模式》,载《江南论坛》2015第6期。
⑦ 可喜的是,2016年9月份高检、高法和公安部联合印发了关于办理刑事案件收集提取和审查判断电子数据若干问题的规定,针对大数据时代新的形势下获取电子数据这种新型的证据进行了规范。