大数据时代下犯罪预测的应用与限制研究
2020-11-25张蓓蓓
张蓓蓓
随着第五代移动通信技术(5G)、物联网络(IoT)、云计算(Cloud Computing)、人工智能(AI)的发展,人类步入了“大数据时代”。2015年8月31日,国务院发布的《促进大数据发展行动纲要》中对大数据进行如下界定,“大数据是以容量大、类型多、存取速度快、价值密度低为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。
大数据改变着人们的工作、学习和社交方式,我们的生理数据、实时定位、交易记录等都可以被即时记录下来并进一步深入挖掘分析产生可利用的价值。基于大数据,电商平台可以根据以往的购物记录和浏览商品情况推送我们下一个可能会购买的商品;社交软件结合我们的学习经历、兴趣爱好、手机定位等为我们推荐可能会认识的朋友;当然,我们也可以运用某些软件预测在什么时候能买到价格低廉的机票。同时,大数据也为理解和解决人们所关心的问题提供了新的视角和可操作化工具并向传统的社会学、经济学、管理学、法学等理论体系发起冲击和挑战。
古典刑法理论认为,刑法虽然不是社会现代化的推动者,但是刑法需要通过调整自身的方式对现代化的挑战予以回应。学界关于大数据时代个人信息保护问题、数据的财产属性问题、人工智能犯罪主体适格问题、数据依赖与垄断问题等诸多方面的探讨都体现了这种关切。
传统犯罪治理的思维方式是逆向思维,强调演绎,即从犯罪现象倒溯犯罪原因,进而有针对性地采取治理措施。大数据思维是正向思维,强调归纳,其指导下的犯罪治理更多地是探寻相关性关系的数据决策方式。本文聚焦大数据时代下犯罪预测问题,主张大力推进基于大数据的预测警务活动,但对犯罪人预测功能的应用必须加以严格限制。
一、大数据时代下的预测警务
大数据的核心功能是预测,大数据技术的魅力就表现在它能够迅速收集、分析数量庞杂的相关数据并快速获取影响未来的信息能力。[1]参见赵国栋等:《大数据时代的历史机遇:产业变革与数据科学》,清华大学出版社2013年版,第21页。2009年美国甲型H1N1流感爆发的前几周,Google公司的工程师们在《自然》杂志上发表了一篇论文,他们把本国网民检索最频繁的5000万条词组与2003到2008五年间美国疾控中心季节性流感传播时期的搜索数据开展比对,处理了4.5亿个不同的数学模型,试图找出某些特别的检索词组搜索频率与流感传播规律之间的相互关系。在得到特定的数学模型后,他们判断出流感的传播源头,成功预测了 2009年冬季流感的传播,而这一预测比滞后的官方数据来得更加及时、有效。[2]参见[英]维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第3页。在美国《时代》杂志评比出的2011年度50大最佳发明中,基于大数据的“出警预测”赫然在列。这款由数学家、人类学家、刑事学家协同研发的程序,能够预测美国加利福尼亚州圣克鲁兹的哪些地区最大概率发生犯罪活动以及发生时间。运用这个软件可以让警方提前做好准备,避免惨剧发生。[3]新浪科技:《时代周刊2011年度50大最佳发明揭晓》,来源:http://tech.sina.com.cn/d/2011-11-18/09056341862.s html,2020年1月25日访问。
情报主导警务是全球范围内第五次警务革命的主题。让数据发声,运用大数据开展情报分析进而合理调配警力资源的预测警务,是预防和打击违法犯罪、保障社会公共安全、解决当下警力资源不足的新思路。
(一)预防犯罪的需要
犯罪问题影响着国家经济增长、社会发展和国际声誉,一个地区犯罪率的高低亦是影响公众社会安全感的主要因素。无论是对个人还是社会,预防犯罪行为的发生要比处罚已经发生的犯罪行为更有价值,更为重要。[4]参见[德]弗兰茨·冯·李斯特:《德国刑法教科书》,徐久生译,法律出版社2000年版,第21页。
联合国的一项调查数据表明,刑事系统的费用比例占到了犯罪所造成代价的 40%—50%,而这个费用随着犯罪率的增加而增加。根据法计量经济学研究,针对已知风险因素采取的预防性行动花费比监禁的支出少1/2到1/7。从这个层面上来说,犯罪预防是效果明显、费用较低、“性价比”较高的犯罪治理措施。[5]参见李春雷、靳高风主编:《犯罪预防学》,中国人民公安大学出版社2016年版,第8页。
预测警务是指运用分析技术,特别是定量分析技术来提前确定警察需要介入和干预的目标,对公共安全加以更严密的保护。预测警务属于罪前阶段的预防,之所以取得良好效果就在于该模式基于数据分析的预测合理配置警力,达到犯罪情境预防的目的。例如根据数据分析的指引,在犯罪高发区域增派警察加强巡逻会使犯罪的成本显著提高,使犯罪分子打消犯罪意图。
(二)技术可行性分析
人类祖先早在几千年前便开始用龟甲占卜的方法预测吉凶祸福。随着社会发展和人们认识水平的逐步提高,期间发明和经历了上百种预测方法。现代的预测方法根据预测客体和预测用途的不同而有所差别,较为常见的有模型法、线性回归分析法、德尔菲(Delphi)法、灰色系统理论分析法、最小方差预测法等。
大数据时代最常用到的预测建模技术包括逻辑回归模型、决策树、支持向量机等,它们可以抽丝剥茧地解开数据背后的内在关联,然后运用得到的关联关系去预测未来,推理未知。[1]参见李熙、黄力:《大数据背景下的犯罪预测与预防——基于犯罪预测分析模型的应用及构建》,载《山西科技》2015年第3期。犯罪预测是犯罪预防的前提。犯罪作为一种社会现象,是可以被认识和加以预防的。早在1829年比利时统计学家凯特就运用概率论较为精准地预估出了1830年法国的犯罪行为总数和罪行种类。现代技术的迅猛发展、对犯罪规律的认识不断深入为犯罪预防研究提供了先进的技术手段和科学的研究方法。
具体而言,各种可视化技术和机器学习算法常常被用来预测某一地区的犯罪分布。操作流程是对原始数据加以收集和整理之后,运用机器学习算法把有效信息从大型数据中提取出来并发现数据之间隐藏的关系。犯罪模式分析师们再通过各种交互式可视化方法分析这些被报告和发现的有价值的犯罪信息,进而为警方提供前瞻性指导。[2]Hitesh Kumar Reddy ToppiReddy,Bhavna Saini&Ginika Mahajan. Crime Prediction & Monitoring Framework B ased on Spatial Analysis. Procedia Computer Science,132, 2018:697.可视化可分为不同种类,比如犯罪热点可视化、3D图像交互可视化、犯罪类型可视化、犯罪频率可视化和交互式犯罪频率报告等。
数据挖掘是对数据集进行剖析,从它们中间提取出有价值有意义的信息供进一步使用。犯罪学的理性选择理论(Rational Choice Theory)和日常活动理论(Routine Activity Theory)可以用来指导犯罪预测。朴素贝叶斯理论是犯罪预测系统里最常用到的算法。国外有学者基于贝叶斯理论采用高斯混合模型和基于K-均值方法的参数化模型,综合生成犯罪数据集,利用交叉验证方法对预测系统进行了测试,结果表明该系统应用于犯罪预测成功率达到83%,为预防和打击犯罪提供了帮助。[3]Mehmet Sait Vural&Mustafa Gök.Criminal prediction using Naive Bayes theory. Neural Computing and Appl ications, 2017, 28(9):2581-2582.
(三)预测警务的可借鉴经验
2008年,在美国洛杉矶市时任警察局长威廉·布拉顿、美国司法援助局代理主任詹姆斯·伯奇和国家司法委员会代理主任克里斯蒂娜·罗丝等人的大力倡导下,美国警界开始推行“预测警务”这一新的执法理念。经过多年的发展,美国的预测警务在深入挖掘大数据的可利用价值,进行犯罪预测方面取得了标志性胜利。[4]参见吕雪梅:《美国预测警务中基于大数据的犯罪情报分析》,载《情报杂志》2015第12期。
20世纪70年代末80年代初,我国开始了关于犯罪预测的研究,起步相对较晚。近年来,各地区依托大数据研发的犯罪预测系统纷纷投入使用并初见成效。北京市公安局怀柔分局自2013年4月起便开始运行的“犯罪数据分析和趋势预测系统”是北京乃至全国首个警情研判系统。这套系统通过对以往犯罪案件数据的整理,套入多种预测模型,对今后某个时间段、某个区域内可能发生犯罪的几率以及犯罪的类型进行预测。公安机关可以根据系统运算结果,有针对性地调配人手,部署警力。
据统计,该系统推行以来,该辖区抢劫案发生率明显下降。2014年5月怀柔分局对预测系统进行了升级,升级后的数据收集来源增加了治安案件、交通事故等,进一步拓宽了预测范围。[5]参见何祺:《预测警务在我国公安工作中的应用研究》,中国人民公安大学2019年硕士学位论文。苏州市公安局苏州工业园区分局唯亭派出所从2014年开始使用犯罪预测系统指导巡防工作,侦查工作模式从“案后研判”调整为“案前预警”,取得了良好的安防效果。据统计,该辖区侵财类违法犯罪警情逐年下降,下降幅度超过了15%。[1]参见蔡长春:《政法高科技连犯罪都可以预测》,来源:http://www.legaldaily.com.cn/index/content/2017-12/25/content_7429904.htm?node=20908,2020年1月25日访问。
二、大数据时代下的犯罪人预测
大数据技术同其他技术一样,是伦理中立的,它在被加以运用去实现更多的经济利益、发挥更大的社会价值过程中并不自带判断是非好坏的审视功能。大数据的蓬勃发展对社会准则、经济环境、法律法规等将会产生什么影响,预期的变化都尚未明晰,需要我们运用正确的价值观去衡量数据创新所带来的利益与风险。[2]参见[美]科德·戴维斯、道格·帕特森:《大数据伦理:平衡风险与创新》,赵亮、王健译,东北大学出版社 2016年版,第8-9页。大数据时代下犯罪人预测在一定程度上侵犯了个人隐私和自由,违背了罪刑法定原则,冲击了社会公平正义,应在适用范围上加以严格限制。
(一)犯罪人预测的设想与试水
在斯皮尔伯格导演的科幻电影《少数派报告》中,当局将能够预知未来、预测犯罪细节的“先知”们集合起来构建了一套“犯罪预测系统”,对即将发生或正在进行的“罪行”予以阻止,虽然在影片中该系统以失败告终,但是这套“犯罪预测系统”随着大数据时代的到来仿佛触手可及。
在美国,芝加哥警方掌握了更多数据之后,分析预测的目标从分析预测犯罪地点“升级”到犯罪人预测上,在这份备受争议的犯罪人热点名单上列出了临近街区前二十名最有可能犯罪的嫌疑人名字和照片,甚至具体到此人在多长时间内可能犯罪的几率。日本的商业战略专家盐野诚在《大智能时代:智能科技如何改变人类的经济、社会与生活》一书中还提到美国孟菲斯的例子,当地警察已经引进了IBM研发的预测分析软件“Blue CRUSH”。将来,警察可以用这个软件分析包括人类遗传基因在内的庞大数据,如果事先知道具有某种基因的人犯罪的可能性很高,就可以逮捕此人,甚至最终可以使这种基因不再出现在地球上。[3]参见[日]松尾丰、盐野诚:《大智能时代:智能科技如何改变人类的经济、社会与生活》,陆贝旎译,机械工业出版社2016年版,第12页。
COMPAS人工智能算法从2000年初就开始在美国的司法机构使用,目前已经修改到第四版,这个十分制的“打分”机制被美国司法部用于判断有过犯罪记录的人未来犯罪的几率,各个州法官量刑或者警察盘查疑犯的时候,会把COMPAS分数作为参考。
2016年武筱林教授和博士生张熙的论文《基于面部图像的自动犯罪性概率推断》引起广泛争议。他们用机器扫描了1856张中国成年男子的身份证照片,运用机器学习算法和图像识别技术来判断这个人是否罪犯,并称成功率高达 90%。在论文中还总结了这些罪犯的面相特点:罪犯跟普通人相比,他们面部特征更为明显。Google和普林斯顿大学的三位研究人员写了一篇反驳文章,名为《相面学的新衣》。他们在文章中批评武筱林等人的研究方法跟150年前的意大利龙勃罗梭天生犯罪人理论类似,只是使用了机器学习算法。
(二)犯罪人预测的批判
中国眼下正处于社会转型时期,大规模的社会变革实践与接踵而来的各种风险,使得我国正成为典型的高风险社会。[1]参见孙粤文:《大数据:风险社会公共安全治理的新思维与新技术》,载《求实》2016年第12期。有德国刑法学者主张,为了应对“‘世界风险社会’的新挑战”,可以考虑“刑法的延伸和去边界化”,诸如“实体刑法中可罚性的前移”、“预防性监控观念的延伸,自由权利保障的解除”等。[2]参见[德]乌尔里希·齐白:《刑法的边界——马普外国与国际刑法研究所最新刑法研究项目的基础与挑战》,周遵友译,载赵秉志主编:《刑法论丛》2008年第4卷,法律出版社2008年版,第24-25页。刘艳红教授指出,这些极端的风险刑法观念,意在将刑法作为一种社会控制的工具而不仅仅是保障人权打击犯罪的手段,这种无边界的刑法是滥用的刑法,会导致刑法最终被消解,其挑战的不仅仅是刑法谦抑性,更是罪刑法定甚至是整个刑事法治进程和人类社会法治进程。[3]参见刘艳红:《中西刑法文化与定罪制度之比较》,东南大学出版社2017年版,第78-81页。
1.侵犯个人隐私和自由
大数据时代,可量化的维度大大拓展,除了姓名、电话、缴税记录等传统数字数据,人们的生活习惯、兴趣喜好甚至情绪情感都可以被量化和记录下来。即使存在网络匿名化和部分数据缺失,但是随着数据量的增加,匿名化会逐渐失效。从模糊化的数据中交叉分析精确锁定目标已不是难事。
犯罪人预测首先要求政府对个人的数据进行全面收集,比如个人的身体状况、教育背景、工作情况、社会关系网等,而这必定会侵犯到公民的隐私。国家对社会秩序的管控与保障公民个体自由之间难免发生冲突,这就需要在两者之间进行调和,寻找一个黄金分割点。[4]参见陈志军:《对大数据技术应用的合理刑法规制》,载《中国人民公安大学学报(社会科学版)》2018年第6期。自由可以分为思想自由和行为自由。思想自由是首要的,人之所以区别于动物就在于我们的思想是多元化的、多样性的。姑且假设这种基于大数据平台的犯罪人预测是准确的,但是这种预测违背了人的自由意志,也不承认人们基于自由意志改变未来选择的可能性。[5]参见[英]维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第225页。刑法规范作为明文法,因其预测可能性,使国民能够预测到自己的行为性质以及自己的行为是否会受到刑罚制裁,即“正确的预期”,从而形成社会的可控性和社会生活的稳定性。[6]参见马荣春:《刑法的可能性:预测可能性》,载《法律科学(西北政法大学学报)》2013年第1期。
2.违反罪刑法定原则
依据犯罪预测的结果对尚处于未然状态的“犯罪人”施以刑罚是错误的,即使是出于防卫社会的目的。这是斯皮尔伯格通过电影《少数派报告》想向人们传达的思想,也是刑事法律基本原则对犯罪预测的价值观要求。[7]参见赵军:《“先知”之惑——犯罪预测局限性研究》,载《河南公安高等专科学校学报》2010年第6期。国家在进行社会管控过程中的威信树立,依赖于管理目的的正当性和管理手段的妥当性。刑法作为其他法律的“保护法”,具有谦抑性,应严格控制刑罚的处罚范围。即使出于保卫社会的目的,也不能动辄动用刑法,否则会使国家威信降低。[8]参见张明楷:《刑法学》(第五版),法律出版社2016年版,第55页。
假设《少数派报告》中“先知”们预测出的结果百分之百准确,“犯罪分子”正处于准备工具,制造条件的预备阶段,但是在犯罪阶段上的预备,除了特定的犯罪之外,原则上是不可罚的,因为侵害法益的危险尚未成为具体的危险。[9]参见黎宏:《刑法总论问题思考》(第二版),中国人民大学出版社2016年版,第399页。预备阶段尚不可罚,更遑论有的“犯罪”只存在于“犯罪分子”的“思想”里。
因此,基于预测结果的制裁属于“处罚不当罚”行为,违反了罪刑法定原则。另外,从经济学上来说,区分犯罪的预备、中止、未遂与既遂,是保持刑罚边际威慑的一种形式。如果降低刑罚适用标准,反而会降低刑罚的威慑力,不利于打击犯罪。
3.冲击社会公平正义
人人平等是现代刑事司法制度的核心要义。美国1956年格里芬诉伊利诺伊州(Griffin v. Illinois)一案中,最高法院大法官雨果·布莱克(Hugo Black)把“为穷人,富人,弱者和强者提供平等司法”的目标称作“整个司法制度的核心目标”。1983年,比尔登诉乔治亚州(Bearden v. Georgia)一案中,法院裁定该州在被告人失业时撤销其缓刑是违反宪法的。该州引入了大量的实证研究,表明失业和贫困增加了再犯的风险,以他的失业为理由认为他有更高的犯罪风险是正当的。法院坚决驳回了这一论点,认为不能基于贫穷而把他列为危险人物增加刑期,这样做只不过是为了惩罚一个人的贫困。法律面前一律平等,国家尊重和保障人权也明确写在我国宪法第13条中。
要设计一个预测犯罪人的系统首先需要机器学习算法的设计者判断“什么样的人更容易犯罪”,然后再把不同原因分解开来搜集数据。一个人犯罪的可能性成千上万,而算法设计者将贫困、家庭状况、种族或民族、社会经济地位等维度输入进去,就好像黑夜里我们更容易关注到的路灯下的路面一样,本身就带有偏见和歧视。从这个角度说,犯罪人预测是显失公平正义的,他们被预测是危险的“犯罪人”并据此受到惩罚,不是因为他们做过什么,而是因为他们是谁、他们的家庭怎么样以及他们的口袋里有多少钱。[1]Sonja Starr. The Odds of Justice: Actuarial Risk Prediction and the Criminal Justice System. CHANCE,2016, 29(1):49.
(三)犯罪人预测的适用限制
基于大数据的“犯罪人”预测也并非一无是处,只要转变设计思维便可大放异彩。笔者认为“犯罪人”预测适用范围宜限定为被宣告犯罪,受到刑罚处罚的犯罪分子。
关于服刑人员再犯罪风险的评估,我国已有学者提出了较为完整的再犯罪预测的流程及预测模型。笔者认为,我们的设计思维应该从犯罪人预测转移到改善犯罪人境遇、减少犯罪上。从这个层面来说,“犯罪人预测”改成“犯罪人关注和改善”比较妥当。比如,大数据平台分析得出的结论是失业与盗窃犯再犯率呈现相关性,那我们就应当加强罪犯的教育和职业技术培训,帮助他们顺利回归社会。
同时,笔者同意在某些特定犯罪领域适用犯罪人预测,比如社会危害极大、再犯风险极高的恐怖主义犯罪。就具体适用而言,一是建立完善的恐怖分子信息库;二是建立恐怖分子再犯风险评估体系;三是对刑满释放恐怖分子进行后续跟踪追评。[2]参见叶良芳、张勤:《大数据时代网络恐怖主义犯罪的防治:大数据时代下的犯罪防控》,载《中国犯罪学学会年会论文集(2017年)》,中国检察出版社2017年版,第480-481页。对恐怖分子进行社会危险性评估亦被我国法律所认可。[3]《中华人民共和国反恐怖主义法》第30条第1款中规定:“对恐怖活动罪犯和极端主义罪犯被判处徒刑以上刑罚的,监狱、看守所应当在刑满释放前根据其犯罪性质、情节和社会危害程度,服刑期间的表现,释放后对所居住社区的影响等进行社会危险性评估。”
三、大数据时代下犯罪预测的审慎态度
人们对自然预测是确定性的,如天体运动方面,以拉普拉斯为代表的预测学派达到了相当精确地程度,他们可以准确地预测出某个时间太阳系中各个行星的位置,甚至可以预测1000年之后的日食或月食。社会预测领域却杂糅着大量不确定因素,阎耀军教授将量子论中的测不准概念迁移到社会预测学研究,提出测不准的几个因素,具体包括社会预测客体因应行为、人类个体的主观随意性和非理性、社会预测信息的不完备性、预测期限内新因素介入、社会系统的非线性和随机性。[1]参见阎耀军:《社会预测学基本原理》,北京社会科学文献出版社2005年版,第320-336页。基于以上考虑,我们对大数据时代下犯罪预测应保持审慎态度。
(一)“大”数据完备性存疑
数据完备性在一定程度上决定着社会预测的准确度。数据的完备不仅包括信息的完整,更重要的是收集数据的真实可靠性。在小数据时代,采样分析精确度与采样随机性正相关,与样本数目的扩大关联性较小。大数据时代下,有条件采集所有数据而不必拘泥于采样分析。[2]参见[英]维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第39页。但大数据是混杂的,有时候为了更大的数据量,了解大致的发展趋势,人们愿意对精确性做出一定的让步,接受适量错误的存在,虽然存在即合理,但是这个错误是需要我们去正视和处理的问题。
首先,大数据难以涵盖所有的“黑天鹅事件”,势必会影响数据全面性。再者采集数据的真实可靠性仍需辩证看待。徐英瑾教授曾一针见血地指出,现代社会诚信缺失,网络“水军”发布的大量注水数据让某些特定数据的质量下降,即使庞大数量也无法平衡。[3]参见徐英瑾、王培:《大数据就意味着大智慧吗——兼论作为信息技术发展新方向的“绿色人工智能”》,载《学术研究》2016年第10期。就犯罪预测而言,客观存在的犯罪黑数影响着犯罪数据完备性,虽然在德国、美国等西方国家通过自我报告、被害调查等方式可以大致估算出犯罪黑数与犯罪明数的比例,但是犯罪黑数的成因是多方面的,其复杂性决定了估算数据准确与否无从验证。
(二)俄狄浦斯效应影响
《俄狄浦斯王》是古希腊悲剧大师索福克勒斯所著,从这个故事中我们得到的启示是人的活动结果往往与预言或者目的背道而驰。哲学家卡尔·波普把这种人们对未来的心理预期会影响未来的变化称为俄狄浦斯效应。[4]参见徐才:《历史和哲学的悖论:历史规律的“俄狄浦斯效应”》,载《理论探讨》2001年第1期。
影片《少数派报告》中警察约翰利用地心引力做类比,来解释对犯罪的事前打击并将这些“犯罪人”予以逮捕或拘留是合乎情理的。他把一个木球从桌上滚到桌子的边沿,虽然木球被接住了,但是这个球在重力的作用下掉到地上是必然发生的,不能因为外力介入而中止否认木球落地的必然性。同样,即将发生的犯罪虽然因警察提前介入打击而停止,但不能否定该罪行按照预测情形实行的必然性。
这个类比显然是经不起推敲的,我们可以把它看成“类推解释”。因为犯罪预测本身可以影响被预测事件的结果,当预测客体感知到预测者的预测活动后他的因应行为会促使他调整自身,使先前的预测结果失灵。即便预测客体没有感知到预测活动,他也会因受到各种随机波动或介入因素的影响而改变自身行为。[5]参见阎耀军:《社会预测学基本原理》,北京社会科学文献出版社2005年版,第94-95页。哲学家约翰·塞尔在《心·脑与科学》一书中给出了答案,任何人对我们行为的预测都可以认为是不成立的,这种不成立完全可以被证明。如果有人预言我要去干这件事, 我可以恰恰去干别的事情。这跟冰块从山坡上滑下来,小球从斜面上滚下来,行星按照自己的轨道行进是不一样的,它们没有选择的余地,而我们有选择的空间。[1]参见约翰·塞尔:《心·脑与科学》,杨音莱译,上海译文出版社1991年版,第75页。
(三)黑盒子理论
计算机系统的决策是基于程序明确设定的规则进行计算,是可以被溯源、被解码和追踪的。大数据算法往往超出我们的理解范围,人们只能输入数据集等待输出结果。这期间机器是怎么识别的,连设计者也不能肯定。这使得大数据有变为黑盒子的风险,不公开、不透明、难以解释。数据所揭示的相关性,只让我们知道是什么,而不知道为什么。因此,我们不能完全受其主导支配,将大数据结果奉为真理,而应当将大数据与小数据相结合,将数据分析与人工分析相结合,对得到的结果进行甄别、筛选和交叉验证,最终得到较为科学的分析结果。[2]参见张威:《基于大数据的犯罪防控之困境及应对:大数据时代下的犯罪防控》,载《中国犯罪学学会年会论文集(2017年)》,中国检察出版社2017年版,第77-81页。
大数据以惊人的力量引发了商业变革、管理变革、研究方法变革,这个“万能”概念似乎能一下解决许多问题。人们纷纷想抓住它作为研究问题、解决问题的法宝。对大数据的盲目迷恋和崇拜是十分危险的,对大数据时代下的犯罪预测我们应始终坚持理性地思考、保持审慎的态度。