大数据研究方法应用于刑事法学的冷思考
2017-01-10王登辉
摘要:作为一种重要的跨学科研究方法,大数据研究方法在法学中已有广泛应用。然而,通过考察大数据研究方法在刑事法学中的应用,不难发现其也存在明显的局限性:不适用于难以量化的对象;不能代替定性研究;相当多的数据、合适的样本不易获取;容易忽视细节和联系以致基础不够坚实;存在逻辑断裂,结论仅是或然性的;貌似具有宏观视野却不及类型化思维。因此,大数据研究方法的作用不能夸大,更不能形成“大数据崇拜”。
关键词:大数据研究方法;刑事法学;司法规律;类型化思维
中图分类号:DF873
文献标志码:A DOI:10.3969/j.issn.1008-4355.2016.06.03
晚清以降,西学东渐,英、美、法、德、日、俄等国的法律思想、观念和制度陆续传入我国,律学在欧风美雨的强劲涤荡下日趋凋零,法学一度兴起旋沉寂多年。改革开放以来,我国高度重视并积极推进社会主义政治文明建设,法治建设取得了举世瞩目的伟大成就,突出表现为社会主义法律体系已经基本建成。然而,不可否认,我国目前仍是法治欠发达国家,非但不少思想观念和制度机制较为落后,法学研究也可谓跟在法治发达国家后面亦步亦趋,在国际法学界的发言权与我国的综合国力、国际地位极不匹配。
毕竟,不同于经济学、统计学和社会学等学科,法学与价值评价密切相关。法的价值,主要包括人权、公平正义、自由平等和秩序等。刑事诉讼的价值主要是保护人权和打击犯罪。“事实清楚,证据确实充分”才能判决有罪。司法独立、回避制度、辩护制度、公开审判制度、非法证据排除制度、不能自证其罪原则、疑罪从无原则、存疑有利于被告原则和上诉不加刑原则等,属于程序正义的范畴。法益保护原则、罪刑法定原则和罪刑相适应原则等,属于实体正义的范畴。程序正义和实体正义在每个司法案件中都应当实现,力求“不冤枉一个好人也不放纵一个坏人”,而“宁纵勿枉”是退而求其次的无奈之举。公平正义不是一句空话,而是由无数个案中的公平正义结合而成——当然不是简单相加,却也不是由于“主流是好的”就会产生“少数服从多数”之效果;相反,“百俊不能遮一丑”才是现实。假设冤错案件的发生率只有千分之一,则被冤枉的无辜者总数仍是相当惊人的,人们会认为错案频出、司法黑暗且不可信赖,而不会因为“99.9%的案件被正确处理”就认为0.1%的错案率是可以接受的。对“完美司法”的这种执着追求,对实务界、法学界提出了更高的要求。这些特点决定了刑事司法具有诸多面向,是多种主客观因素共同作用的“场”,从事刑事法学研究不能忽视这些特点,偏执、武断及理想化均不可取。
一、大数据研究方法在刑事法学研究中的应用概述
《2016年中国大数据交易产业白皮书》指出,国际数据公司(IDC)认为大数据(Big Data)有四个特征,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。这一定义对法学研究之“大数据”亦具有较大借鉴意义。2008年,内地各级法院审结一审刑事案件768 130件,判处罪犯1 007 304人,至2014年案件数、人数均突破“百万大关”,而无罪判决率极低例如,2015年、2016年最高人民法院工作报告显示,2014年各级法院审结一审刑事案件102.3万件,判处罪犯118.4万人,宣告518名公诉案件被告人和260名自诉案件被告人无罪;2015年各级法院审结一审刑事案件109.9万件,判处罪犯123.2万人,宣告667名公诉案件被告人和372名自诉案件被告人无罪。由此可以算出,这两年全国无罪判决率分别为万分之六点六、万分之八点四。值得一提的是,这个“全样本”只有最高人民法院、最高人民检察院能够获得,学者基本不可能凭一己之力获得这样的“大数据”进行全样本研究。。“中国裁判文书网自2013年7月1日正式开通以来,已公开裁判文书超过2000万篇,访问量突破20亿次。自2016年8月起,每天都有超过2000万的访问量”[1]。司法公开三大平台
即审判流程公开、裁判文书公开、执行信息公开,其中以中国裁判文书网应用最为广泛。、人民检察院案件信息公开网、北大法宝(含中国法院裁判文书库)、北大法意、法律图书馆等平台汇集并公布了海量的法律文书,以及SPSS软件、云计算等的应用,极大地方便了大数据的采集和分析研究,为法学研究提供了巨大便利。数量庞大的刑事案件及其裁判文书,是刑事法学研究的重要宝库和不竭源泉。学术界就此“大数据”展开实证研究的队伍日渐壮大,影响不断扩大,有利于转变“重定性轻定量”“重定罪轻量刑”的研究习惯,有利于量化分析和精确分析,其积极意义不可低估。
总体而言,作为一种跨学科方法,大数据研究方法具有广阔前景。近年来,“大数据”俨然法学界的热词,不懂大数据简直不好意思谈实证研究方法及法学方法论了。白建军教授指出,大数据的核心是尊重经验真实,敬畏经验真实,在乎经验的代表性;哪怕从一个小故事切入,只要收集足够的信息,也可能得到大张力、大格局的结论,用来解释、预测较大时间跨度和空间跨度的社会现象[2]。不过,人们一般并不把对个案的精细分析当作大数据研究。不少从事大数据研究的学者似乎更重视获取“大样本”,而不够尊重经验真实,在一定程度上影响了研究的质量。在很大程度上,当前法学界的“大数据”研究几乎混同于“大样本”研究。这一方法如火如荼地展开,成绩可喜而问题不容忽视,值得反思。
二、大数据研究方法的局限性
潘绥铭教授指出,在量化过程中,不可避免地会出现四种情况:剪裁现实生活、忽视社会情境、抹杀主体建构、取消生活意义[3]。大数据研究方法应用于法学研究同样存在这四个问题,毋庸赘述。就刑事法学而言,大数据研究方法还存在如下问题:
(一)不适用于难以量化的对象
其一,无论确定研究对象,还是选择样本,都必须具有一定的“可识别性”,如犯罪嫌疑人的身份信息、罪名、刑罚、地域和时间等。如果研究对象欠缺可识别性,或者可识别性较低,就不适用于大数据研究,而只能通过典型案例分析法、问卷调查法、深度访谈法、入圈考察法等展开研究。几乎没有通过大数据研究刑法上因果关系
研究疫学因果关系更接近于自然科学研究,相关的少量法学研究成果一般也不是用数据说话的。、想象竞合犯、刑事诉讼证据规则、刑事法官滥用自由裁量权等问题的,也基本没有通过大数据研究案外因素对判决的影响的,这些皆是显例。又如,尽管犯罪人的主观罪过被规范地评价为故意和过失,而很多犯罪的深层原因还有无意识和潜意识的成分。如果研究犯罪目的、动机、原因时无视这一点,其意义恐怕会大打折扣。
其二,有的研究对象表面上具有较高的“可识别性”,其实不易量化,或者即使量化也基本无意义。通常认为,对人立案、对事立案容易区分,似乎有较高的“可识别性”。其实,准确区分对事立案与对人立案,有时是难度颇大的问题。例如,某恐怖活动组织在闹市区制造爆炸,造成多人伤亡,恐怖分子成功逃离现场,数日后恐怖活动组织宣布对此惨案负责。那么,公安机关立案时如果不知道犯罪嫌疑人的身份,且早于恐怖活动组织宣布,就属于对事立案吗?如果晚于恐怖活动组织宣布,就属于对人立案吗?如果虽知系某恐怖活动组织所为,却不了解该组织成员与分工,还属于对人立案吗?基本查明至少一名犯罪嫌疑人的身份再立案,才属于对人立案吗?如果后续侦查查明“至少一名犯罪嫌疑人的身份”是错误的,还是对人立案吗?……况且,对人立案、对事立案与犯罪本身的特点有关,有的犯罪几乎必然是对人立案,有的犯罪几乎必然是对事立案。如暴力干涉婚姻自由案、重婚案、破坏军婚案、虐待案、脱逃案、暴力危及飞行安全案、劫持航空器案、劫持船只、汽车案、非法出租、出借枪支案、醉酒型危险驾驶案、受贿案、枉法裁判案、巨额财产来源不明案等,必然是对人立案;行为人犯罪后被当场抓获、被群众扭送司法机关,或者自动投案后才立案的,必然是对人立案,而不会是对事立案。行为人犯罪后逃离现场的盗窃案、诈骗案、抢劫案、故意杀人案等,一般在侦查阶段查明并抓捕犯罪嫌疑人(也可能永远未侦破),是对事立案而不是对人立案。由于对人立案和对事立案的区分缺乏指导意义,无论选择单一罪名抑或复数罪名进行研究,都是没有意义的,且可能导致异化。
其三,大数据研究的前提是“可见”,但刑事案件毕竟只是全部犯罪的冰山一角,“海面”以下的犯罪虽然存在却不可见,目前尚不能成为大数据研究的对象。试问:盗窃罪、诈骗罪、强奸罪、贩卖毒品罪、危险驾驶罪、故意杀人罪、贪污受贿罪等的犯罪黑数有多大?即使能够采集到所欲调查的若干罪名的较大数据,而不同罪名之间的可比性甚小,可以说整体评估仍只是基于个体的经验,难谓严格的大数据分析。犯罪黑数被低估、忽视,不利于修正、完善刑事政策和社会政策。抓获一个毒贩对其他毒贩的威慑作用如何?判决一个贪官有期徒刑十三年对其他国家工作人员的教育、震慑效果如何?死刑有多大威慑力?……这些问题也难以通过大数据分析得出结论。打击犯罪、准确定罪、合理量刑,是刑事司法考虑的主要方面,而减少和预防犯罪似乎被较少考虑到。如果只研究可见的刑事案件而忽视其他因素,并以此为建议和决策的基础,这种较大的片面性会造成消极的社会影响,背离初衷。
(二)不能代替定性研究
定量分析与定性分析适用于不同的场域,二者的侧重点、范式不同,无甚可比性,互相不可替代。一般而言,大数据研究以定量分析为主,则在多数情况下藉大数据研究定性问题并无优势。定罪是刑事司法的核心,也是刑法学研究的重点。即便常见案件的普遍性问题已有相关规范性文件,仍会发生诸多争议。例如,盗窃需要是秘密实施的吗?或者只要行为人以为是秘密的即可?扒窃是行为犯,还是数额犯?扒窃得1元是犯罪既遂,还是未遂?以借用手机打电话为由骗得他人手机后逃离,构成盗窃罪还是诈骗罪?着手盗窃后为窝藏赃物、抗拒抓捕或者毁灭罪证而当场以摆脱的方式逃脱抓捕,暴力强度较小,未造成轻伤以上后果的,不以抢劫罪论处,是否合理?嫖宿幼女罪应当废除吗?代购毒品,哪些情况下构成贩卖毒品罪,哪些情况下构成运输毒品罪、非法持有毒品罪,哪些情况下不构成犯罪,抑或应当废除“代购毒品”这一提法
具体可见:王登辉,罗倩.贩卖毒品罪若干基础理论辨正[J].中国刑事法杂志,2016(2):33-39.?因故意犯罪被判处有期徒刑且宣告缓刑,在缓刑考验期满后五年内又故意犯应处有期徒刑以上刑罚之罪,是否构成累犯?……这些有浓厚的思辨性色彩的定性争议,宜以系统分析为主,不是大数据研究所能解决的。
思想试验也是一种重要的思维方法和研究方法。阿基米德在洗澡时引发思考遂抽象出浮力定律,并未观察诸多浮力现象;牛顿发现万有引力定律,特斯拉(另说马可尼)发明无线电,爱因斯坦发明相对论,都是思想试验的杰出成果。思想试验方法蕴含了直觉、想象力、逻辑推理等多种要素,同样适用于法学研究,而素材的作用不应夸大。很多简单案件,只要改变一个要素,就可能成为争议颇大的疑难案件。如果不断地修订要素进行分析推理,有利于找到问题的核心、本质,也有利于举一反三。例如,甲将自己占有的毒品与乙的现金交换,人们都会认为甲构成贩卖毒品罪。如果乙用于交换的是车辆、枪支、刀具呢?是性服务呢?是假币呢?是债权呢(即以毒偿债)?是其他毒品呢(即互易毒品)?如果乙是赊购呢?如果乙想骗取甲的毒品,拒不支付毒资呢?乙用于自己吸食,或者用于贩卖,甲知道或者不知道这一点,是否影响对甲定罪?通过分析归纳可知,贩卖毒品罪的本质是,行为人明知是毒品而与他人的财产性利益交换。这样进行思想试验,有利于揭示某种犯罪的本质,这不是通过研究相关罪名的庞大案例抽取大样本统计分析就能得出的。法学研究固然讲求言之有据、“有一分证据说一分话”,但一些法学研究者缺乏想象力
有学者指出,想象力是一种直观公法本质的抽象洞察力,是一种从多个角度进行换位思考的能力,是一种把握整体和全局的系统联想能力,是一种敢于突破现有一切条条框框的颠覆性思考能力。(参见:高家伟.放飞公法学的想象力[J].浙江社会科学,2014(6):149-150.),客观上限制了其研究成果的价值。
(三)相当多的数据、合适的样本不易获取
相当多的数据不易获取,搜集到大量相关数据基本上是不可能的,很多隐蔽的重要信息更是难以纳入研究视野。其一,涉及国家秘密、未成年人犯罪的判决书不会公开,许多涉及个人隐私、商业秘密的判决书不会公开,有问题的、会引发批评的裁判文书也可能不公开,毕竟存在受贿、枉法裁判的情况仍把错误裁判公之于众的行为是少数(受贿但未枉法的裁判文书不在此列)。其二,新型、疑难的法律问题层出不穷(如许霆案),适合“解剖麻雀”的方法,非深入解读个案难以得出妥适的结论——这几乎只能进行“小数据”分析,也是通过有限的样本抽象出规则的必经之路。关注实务,深入分析较多同一罪名案件、类似罪行的案件的法律意见(特别是裁判要旨),加以比较、鉴别,提倡争鸣,择其较妥适者,予以规范化加工整理,凝聚共识,尽量形成通说,更有利于指导和规范司法实践。其三,数据的失真和异化不易通过大数据反映出来。受考核指标等因素的影响,“数目字管理”已呈扭曲之态,颇为普遍。例如,检察机关做出证据不足不起诉、存疑不起诉的决定,其真实原因很可能是认为不应作为犯罪追诉(则依法应当绝对不起诉),而非真的认为证据不足或者存疑。如果忽略了这类真实原因,无论被研究案件的数量如何庞大,其意义都极为有限。纵然研究者能收集到维持原判的全部刑事上诉案件,也无法知悉哪些是在一审宣判前已经向二审法院请示过的。二审法院经常裁定“撤销原判、发回重审”,理由一般是“事实不清、证据不足”,而研究者即使收集了全样本,也难以确切知道“事实清楚、证据确实充分”仍以这一理由被撤销的刑事判决有多少及其比例。又如,无论问卷是匿名还是实名、结构式抑或开放式,由于种种原因,答卷者的回答未必真实可靠,不实问卷难以辨识,研究者对此几乎是束手无策的。若样本未大到不实问卷可以忽略不计的程度又未将其剔除,则问卷调查的质量和价值不可避免地会受到影响。通过研究大量“扭曲”的资料、数据得出若干结论,却可能是偏离本质的,是“病态”的,是有误导性的
举一个不恰当的例子,假设所有的改革试点单位均宣布自己改革成功了,可这能证明各项改革措施都是成功的、都有推广意义吗?。其四,很多法律文书说理内容较少,不会把无较大把握的论证过程写入,研究者难以发现更有价值的“富矿”。裁判过程中案外的重要因素、关键因素、“内幕”,更不会体现出来。例如,承办法官认为被告人无罪,受公安机关和检察机关(或者其他机关)的压力,决定只宣告有罪,免予刑事处罚,或者判处有期徒刑缓刑,也可能“照单全收”。又如,法官觉得判处被告人有期徒刑二年较妥,或者宣告缓刑二年亦无不可,因收受被告人的家属(或辩护人)的贿赂,或者领导“打招呼”,遂顺水推舟决定宣告其缓刑二年。单从判决书来看,几乎不会怀疑到法官受贿、领导干预等问题。即使取得了2015年《领导干部干预司法活动、插手具体案件处理的记录、通报和责任追究规定》和《司法机关内部人员过问案件的记录和责任追究规定》发布后相关记录的全样本(或大样本),据此研究领导干部干预司法活动、插手具体案件处理和司法机关内部人员过问案件的情况,也是远远不够的。相当多的错案判决,仅从判决书本身是看不出问题的,只有结合证据、辩护词、庭审笔录,才会有更全面、更正确的判断。完整地了解案件,完全知悉案件信息,才会知道犯罪人为什么这样做,为什么会得逞(或者未得逞),法院为什么这样判决,有无案外因素干预,涉及哪些理论点。大数据研究对判决的质疑、批判较少,几乎默认为合法(专门研究错案的除外),这与现实存在较大差距,或者说在一定程度上脱离实际。
合适的样本不易获取,是大数据研究方法应用于法学所面临的现实问题。进行大数据分析,没有预设命题、对样本来源不做筛选是不可思议的。白建军教授指出,“合理确定抽样框架的关键不在于样本的数量大小,也不在于抽样框架是出于何种目的确定的,而在于根据某个框架所获得的样本与总体之间是否相似。大数据并不在于样本绝对量的大小,关键在于‘全。样本规模绝对数值的重要性大大超过样本占总体比例的重要性。”[2]34-35此说甚可赞同,不过仍存在几个疑问:其一,这与白建军教授所指出的“大样本研究的好处”存在明显的自相矛盾之处。既然大样本研究至少有三大好处
大样本研究的好处是,只要抽样过程符合随机性要求,样本越大,抽样误差就越小,由此所得结论偏离现实世界的可能性就越小;样本越大,所含信息、类型就越丰富,所研究的对象就能以更多的方式展现自己;样本越大,可供选择的分析工具也就越多,其结论也越可信。本文基本赞同这一观点。不过,“所含的丰富信息、类型”虽然在研究者触手可及范围内,却未必都能进入研究者的视线、纳入考量范畴,可能不会对研究结论产生什么影响。,又说“合理确定抽样框架的关键不在于样本的数量大小”,“大数据并不在于样本绝对量的大小”,似有自相矛盾之嫌。其二,就很多研究而言,研究者很可能难以知晓研究对象总体是多少,不知道所搜集的样本齐全与否,也不知道样本占总体的比例,更不知道“样本与总体之间是否相似”——即便研究者已经搜集到庞大的相关信息也是如此,甚至研究结束也不知道是否相似。其三,“样本规模绝对数值”大,则采集、分析样本的工作量也巨大,无用信息过多、效率不高等问题不可避免,这些是现实中必须面对的,与大公司、专业公司分析海量商业数据存在较大不同。获取足够数量的、有代表性的样本以供研究,已是相当困难之事,遑论与总体相似的样本。从某种角度而言,“不好用”可谓大数据研究方法的局限性之一。
(四)容易忽视细节和联系以致基础不够坚实
社会生活丰富多彩,犯罪现象复杂多样。既有平淡无奇的案件,又有罕见新奇的案件;既有常规案件,又有疑难案件;既有形似而实异的案件,也有形异而实同的案件;既有浅显易判的案件,还有涉及深层次问题的案件。大多数刑事案件是常规的,罕见的、极端的案件毕竟是少数。正如世界上没有两片完全相同的树叶,也没有两个完全相同的案件。每个案件之不同,在于细节不同,还与案情系剪裁事实而成有关,很多重要细节在剪裁过程中遗失了,且受叙事策略影响较大,仅进行简单化的类比推理是远远不够的。例如,艾滋病人、绝症患者、吸毒人员及同性恋者实施的犯罪颇有特点,而这些身份细节容易被研究者忽略(专门研究此类特殊对象犯罪的除外)。不论研究同种犯罪,还是异种犯罪,忽视细节往往会遗漏重要信息,结论很可能是大而化之、大而无当的。
普遍联系是马克思主义哲学的重要观点。大数据研究的对象和抓手充其量往往只局限于单一学科,鲜有跨学科之作,犹如炼铁而抛弃金、银、铜、硫等矿产,甚是可惜。刑事一体化的要义即融通学科联系(或曰淡化学科界限),解决现实问题[4]。程序和实体是法律实务的两个基本方面,事实查明和价值评价是司法实践的两大基本问题。倘抛开事实和证据,空谈公平正义、罪刑法定,未免过于天真。如何依法定程序探知事实真相,如何符合规范地评价案件、判定责任,是至关重要的。在实践中,二者存在紧密联系,准确查明事实和价值评价联系密切且贯穿了司法的全过程,在事实和规范之间顾盼往返是不可避免的。对于司法工作者,查明案件事实的重要性丝毫不逊于准确的价值评价,甚至更加重要——毕竟事实认定错误(有时以“事实不清”的面貌出现)几乎必然导致错误判断。形形色色的刑事疑难案件大多与无法查明(或证明)某一部分事实有关,便是明证。如果纯粹地探讨如何查明事实真相,则属侦查学、刑事诉讼法学(含证据法学)的研究范畴,而不属于刑法学研究范畴。由于学科分工的精细化以及由此衍生的研究方向、学术习惯和兴趣点不同,“术业有专攻”,刑事诉讼法学者往往很少关注刑法和犯罪学方面的问题,刑法学者也较少关注刑事诉讼法方面的问题,刑法学研究似乎可以忽视刑事诉讼的要求(主要是如何知道、如何证明)。一些刑法学著作举例较少,偶尔举例也基本不考虑证据及证明的问题,此路径依赖或许与实体法学者往往疏于事实如何查明存在一定关联。如此分析刑法问题,与做司法考试题颇有几分相似——案件事实是不容置疑的小前提;如此研究刑法理论,几乎是将实体法与程序法割裂开来的,欠缺系统观念,不可避免地限制了其实践意义。当然,这并不是说刑法学研究每时每刻要有证据意识和程序意识,而是说,从事理论研究不宜忽略实践智慧,如果能反思一下某个理论、学说在实践中可能会出现什么问题、异化,再修正理论、学说,可能会更有价值,也更受实务界的欢迎。
(五)存在逻辑断裂,结论仅是或然性的
较之演绎法,运用归纳法更容易发生创新。绝大多数大数据研究皆属于归纳法。然而,归纳法的固有缺陷是逻辑不够严密——或曰存在逻辑断裂,那么所得出的结论是否可以普遍适用,在什么条件下会重复发生,在多大程度上揭示了规律,难以判断,往往只有或然性,甚至是较低的盖然性。不少大数据的片面性是固有的,基于其的研究结论的预测准确性不高于预测50楼的电梯将先于51楼的电梯到达1楼的准确性。具体如下:
其一,过去不等于未来。大数据分析成果看似颇有说服力,却有强加因果关系的嫌疑。社会现实不是线性逻辑的,而是非线性逻辑的。一因一果只是理想状态,多因多果是常态。一个变量出现,则结果发生变化——而研究者很可能不知道变量是什么,更不知道变量什么条件下会出现。尽管“历史”经常重演,如盗窃罪、诈骗罪、抢劫罪、强奸罪、故意杀人罪层出不穷,但很难说这些预示着未来会发生具体的什么事——这也是犯罪人、被害人的侥幸心理的现实基础。司法经验固然重要,而先入为主却是司法的大忌。又如,《刑法》第112条规定的资敌罪,第376条至第381条规定的七个战时犯罪,多年来无一实例,能说明这些条文被架空或虚置、应当删除吗?
其二,比例不等于概率,彼与此不能等同。因所选取的样本不同,所得出的比例、结论有较大差异,颇为寻常,可见法学中的大数据研究受主观因素影响较大。这些大数据及其结论与价值无涉,不是必然的,也不是最优的。因琐事纠纷而临时起意杀人的情况在全部故意杀人案件中所占比例较高,而这不能说明某个被告人临时起意杀人的可能性更高,也不能说明临时起意杀人的社会危害性比预谋杀人更小或者更大。即使大数据显示,某检察院批准逮捕率为40%、起诉率为94%,也不能说明某个犯罪嫌疑人被逮捕、被起诉的概率就是40%、94%。假设大数据显示,被告人自动投案的占20%,被害人有过错的占30%,被害人谅解的占20%,被告人当庭翻供率为20%,普通程序的适用率为20%、刑事案件上诉率为10%,也不能丝毫说明某个案件中出现这些情况的概率是多少,因为二者无任何事实、法律和逻辑上的关系。即使大数据显示,90%的冤案都存在刑讯逼供,也不表明某个冤案中存在刑讯逼供的可能性是90%——换个角度说,可能性为90%说明未达到证明标准,不能认定存在刑讯逼供。即使大数据显示,发生某种行为或者结果的可能性是95%,也不能证明某个行为或者结果是否存在,更不能说明其合理性。假设大数据表明,危险驾驶罪的平均宣告刑为拘役三个月,也不说明犯危险驾驶罪的某个被告人被判处拘役三个月是合适的。假设大数据表明,成年人犯盗窃罪的平均宣告刑是有期徒刑十个月,也不能说明某个犯盗窃罪的被告人被判处有期徒刑十个月是合适的,或者重于有期徒刑十个月就是量刑偏重。假设大数据显示,成年人犯贩卖毒品罪的平均宣告刑是有期徒刑一年,而这既不能说明同一罪名的其他被告人被判处有期徒刑一年是妥适的,也不能说明其他量刑偏重或者偏轻。判断某事实是否成立、预测案件发展趋势、判断个案中量刑是否合适,只能通过个案的证据与相关信息分析综合这一途径,既与其他案件无关,也与大数据研究结论无关。
其三,对大数据研究结论,有时可能存在多种解读,甚至是自相矛盾的解读。人们已经认识到,极低的无罪判决率,与其说证明了侦查机关和公诉机关办案质量高,倒不如说法院做出无罪判决面临巨大障碍,即是明证。又如,劳佳琦博士以2000-2011年全国各地各级法院普通累犯相关刑事判决书为样本进行实证研究认为,“目前我国普通累犯制度的隔离机制低效,威慑机制无效,其在减少犯罪、防卫社会方面的综合实际效果远远低于预期。”
参见:劳佳琦.我国累犯从严实效之实证研究[J].中外法学,2014(6):1648.需要注意的是,我国《刑法》第65条的用语是累犯“应当从重处罚”,故不宜用“从严”替换“从重”。解读一:可能由于刑罚普遍偏轻,不足以将罪犯改造好。那么,应当普遍增大从重处罚的幅度,甚至修法加重法定刑——这恐怕是人们难以接受的。解读二:可能是服刑经历使罪犯变得“更坏”了,而不是变得“更好”了。据此,至少可以推导出监禁刑弊多利少(甚至在一定程度上会动摇刑罚制度),则应对监禁刑制度予以重大改造。一个可能的路径是修改刑法,对一切犯罪都宣告缓刑,如果在缓刑考验期内未犯新罪、未违反缓刑考验期内应遵守的规定,就不再执行原判刑罚;如果在缓刑考验期内发现漏罪或者又犯新罪,则数罪并罚,继续宣告缓刑——这样显然是很荒谬的。解读三:可能是累犯自身的反社会性较强,无论是否对其从重处罚,其再犯罪的可能性均高于其他人。但这种“事后诸葛亮式”的结论也明显过于武断。既然连被判处刑罚、实际执行刑罚都没能使一些犯罪分子放弃“重操旧业”或者犯其他罪行,推测未受到刑事追诉的犯罪分子会自动改善,难以置信。这也是对“改善推测说”的一个有力反证。可见,这一大数据研究结论既不能说明“累犯从重处罚”的幅度应当更大,也不能说明这样欠缺必要性,某种程度上只是证伪了“对累犯从重处罚有利于取得较好的刑罚效果”这一“常识”。即使对累犯从重处罚的“综合实际效果远远低于预期”,也远不足以证伪“应当对累犯从重处罚”的观点。
其四,大数据研究可能只有描述性的结论,而未揭示因果规律,没有丝毫新意,可谓“精致的平庸”。刑事法学中的大数据研究一般可以解构出很多要素,从不同角度揭示各要素之间的关系。如果不试图找出或者无法找出常量、变量和因果关系,只是低水平的研究,只能为他人的进一步研究提供素材,而不会有所创新。如果研究结论只是印证了众所周知的事实,如年底侵财案件多发,夏夜女士被强奸或猥亵的案件较多发,机动车被盗的被害人几乎都会报案,危险驾驶罪的被告人绝大多数系被当场抓获且基本无前科劣迹且缓刑适用率较高,抢劫罪的被告人很少适用缓刑,盗窃案被害人一般无过错而故意杀人案的被害人有过错较多,犯受贿罪的科级干部多于处级干部,冤错案件被告人平均被羁押五年……其意义是极为有限的,相当于2016年7月1日完成大数据计算得出2016年6月20日有大雨的结论。
(六)貌似具有宏观视野却不及类型化思维
就法学研究而言,高瞻远瞩、高屋建瓴的法律理论研究和法律工程研究固然必不可少,精耕细作、精雕细刻的案例分析也不可或缺。宏观、中观、微观的视角均有其意义,不可偏废。就宏观而言,实行“拿来主义”,引进域外先进的法律思想观念、制度机制,总结和引进成功的法律经验、汲取教训,避免在法治进程中走弯路,显然具有“他山之石,可以攻玉”的重要意义,也是借鉴人类一切先进文明成果的重要表征。在方向性、原则性问题已经解决的背景下,撰写几乎无问题意识的、充斥各种大词和超级概念的空洞文章,对实现公平正义有多大裨益,值得商榷。正如看地图需要选择合适的比例尺,比例尺太大或太小会影响观察的效果,不利于又快又准地找到所求的信息,皆不可取。从事法学研究亦同此理,运用中观思维观察现象、分析问题,值得倡导。
类型化思维是一种中观思维,是从现象中提炼规律与规则、探索最优解决方案的尝试,与事物的本质存在密切关系,既为“抽象理念的具体化”提供了某种可能的途径,也是法律体系化所必须倚仗的重要工具。类型化思维有着“务实从容,分解重构,日拱一卒”的气质。有学者指出:从“行为类型”到“违法类型”再到“责任类型”,构成要件开始被作为整体的“犯罪类型”加以对待。类型思维还可以全面推进至刑法的整个版图:从构成要件的类型化到犯罪阻却事由的类型化,从犯罪行为的类型化到犯罪人的类型化,从犯罪成立条件的类型化到犯罪之法律效果的类型化
参见:杜宇.刑法学上“类型观”的生成与展开:以构成要件理论的发展为脉络[J].复旦学报(社会科学版),2010(5):78.。这些精辟论断揭示了类型化思维在刑法学研究中的重要地位。就刑法学研究而言,掌握正确的认定案件事实的方法、法律解释方法和定罪方法,可以说比掌握大数据研究方法更为基础、更加迫切。而类型化思维在认定案件事实、法律解释和定罪等方面有着广泛应用,兼具理论意义和实践意义。随着这一意识深入人心,类型化思维及其研究方法必将产生更好的社会效果,前景广阔,其意义不容小觑。
三、结 语
有学者指出,量化研究和大数据不能质疑更不能取代各种非量化的人文社会研究;只有对这些先天缺陷进行深刻反思,并予以充分展示的量化研究,才有资格在人文社会研究中保留一席之地;两种研究缺一不可,但又平行延伸,永不交叉[3]35。大数据的“大”未必真的“大”,绝大部分的大数据分析存在“大而失真”之虞;大数据偏重相似性比较,但仅有相似性是不够的。大数据并非越大越好,也非越大分析越精确。数据的质量决定着分析预测的准确与否[5]。这些观点甚可赞同。将大数据研究方法应用于法学,是实证研究方法的重要突破,但倘若不当地应用于人文社会科学领域,在某种程度上属于“越界”,则真理也可能变成谬误。其当然可以应用于刑法学、刑事诉讼法学,也可以适用于犯罪学、侦查学,不过应用于前者的局限性较为明显,效果也不及后者。通过考察大数据研究方法在刑事法学中的应用,不难发现其也存在较大的局限性:不适用于难以量化的对象;不能代替定性研究;相当多的数据、合适的样本不易获取;容易忽视细节和联系以致基础不够坚实;存在逻辑断裂,结论仅是或然性的;貌似具有宏观视野却不及类型化研究方法。如果忽视了人的主观能动性、社会现象的复杂性,搞“大数据崇拜”,本质上是“惟科学主义”,违背司法规律,可能犯削足适履的错误,是不可取的。有较强的解释力,有所创新而不落窠臼,符合形式逻辑,是彰显大数据研究方法的意义的关键。以问题为导向,综合运用多种研究方法,才能更好地从事刑事法学研究,更有利于实现公平正义。
参考文献:
[1]刘婧.让司法公正看得见摸得着——人民法院裁判文书公开工作座谈会侧记[N].人民法院报,2016-08-31(02).
[2]白建军.大数据对法学研究的些许影响[J].中外法学,2015(1):30.
[3]潘绥铭.生活是如何被篡改为数据的——大数据套用到研究人类的“原罪”[J].新视野,2016(3):32.
[4]储槐植,闫雨.刑事一体化践行[J].中国法学,2013(2):139.
[5]青岭.反思国际关系研究中的大数据应用[J].探索与争鸣,2016(7):94.
Abstract:As an important interdisciplinary research method, the big data research method has been widely used in the law science. However, it is easy to find obvious limitations via examining the big data research methods in the criminal law research. It is improper to apply it to objects which are difficult to quantify. It is not a substitute for qualitative research. It is also difficult to obtain quite a lot of data or suitable samples. It is easy to overlook the details or connection so that its foundation is not solid enough, and there is a logical problem, and its conclusion is probable. On the surface it seems to have a macroscopic visionscope but in fact it is inferior to the category thinking methods. Thus the role of big data research methods cannot be overstated, nor be worshiped.