APP下载

论大数据时代法律实效研究范式之变革

2015-03-26刘佳奇

湖北社会科学 2015年7期
关键词:范式法律评价

摘要:由于实然法与应然法之间存在着天然的鸿沟,故要建立高效的法治实施体系、增强法律的有效性,亟须加强对法律实效的研究。法律实效对研究范式的选择提出了全面、动态、客观有效的需求。但传统的定性、定量研究范式因囿于自身缺陷,均无法完全满足法律实效对研究范式的需求。随着大数据时代的到来,将大数据研究范式应用于法律实效研究既在技术上可行,又能弥补传统范式之不足,满足法律实效研究对范式的需求。为实现法律实效研究范式的变革,应遵循以相关性为基础的大数据研究范式的基本理论框架,实现法律实效信息数据化并提升运用法律实效大数据的能力。

文献标识码:A

文章编号:1003-8477(2015)07-0140-07

作者简介:刘佳奇(1986—),男,辽宁大学法学院讲师,湖北水事研究中心兼职研究员,法学博士。

基金项目:2014年辽宁省社会科学基金规划项目(L14CFX028)。

为全面推进依法治国,加快建设社会主义法治国家,《中共中央关于全面推进依法治国若干重大问题的决定》明确提出:“法律的生命力在于实施,法律的权威也在于实施”,要建立“高效的法治实施体系,增强法律法规的有效性”。其中表达的重要内涵就是关注法律实效,即制定法在实际社会生活中被执行、适用和遵守的状况。 [1](p368)法律实效之所以备受关注,是因为立法只是一种书本上的法律,处在应然状态,具有实现立法目标的可能性。但法律实施后,在特定的时空范围未必能产生如立法者所期望的效果。诚如弗里德曼所言,不执行在法律中是普遍的事,某项规则得到完全执行几乎闻所未闻。 [2](p109)如果有了法律不能有效实施,那再多法律也是一纸空文,依法治国就会成为一句空话。 [3]所以,我们不要仅仅看立法的美好愿望,而要看实施后的结果。 [4](p165)这就需要在法律运行的过程中,根据一定的研究范式对法律实效进行深入研究——文本上已经生效的法律如何作用于人的行为,哪些法律具有实效,哪些法律在实际生活中很难得到遵守和执行。由此观之,法律实效是衡量依法治国实现程度的重要指征之一,而研究范式又是进行法律实效研究的基础。

一、法律实效研究之范式需求与传统范式之缺陷

(一)法律实效研究之范式需求。

按照库恩的思路,研究范式多被用来指涉一个学术共同体所共有的知识假设、研究模式、研究方法、价值标准以及人们理解世界的知识体系。每一种研究范式其实就是由“能工巧匠”制作出来的不同样式、不同功能的观察工具,研究者可以根据不同的研究目标来进行选择。但是,正如对细菌的观察无法用望远镜而必须用显微镜一样,研究目标会因自身属性对“观察”它的工具提出基本需求,即范式需求。进一步讲,法律实效作为一个研究目标,其对研究范式提出了全面、动态、客观的基本需求。具体而言:第一,由于法律实效所涉要素复杂,至少在宏观上就包括时间、地域、对象、事项等四个维度, [5](p12)若片面地对其中某一个、某几个维度进行研究则不能反映法律实效的全部状态。故所选范式对法律实效的研究必须是全面的。第二,法律的实施是一个包括执法、司法、守法的动态运行过程。有鉴于此,所选范式对法律实效的研究亦不能是静止的,需要以整个法律动态运行过程作为研究对象。静止的、孤立的、片段式的截取法律运行过程中的某个阶段进行研究,同样无法反映法律实效的真实状态。第三,对法律实效的研究并非只是对法律实际实施效果进行简单的观察和记录,而是通过对观察和记录结果的评价,进一步提供改进立法、执法与司法,促进守法的方案以利决策,从而缩小实然法与应然法之间的差距,向“人的实际行为符合法律规范”这一理想状态逐步迈进。 [6](p43)因此,所选范式对法律实效的分析评价必须是客观的,否则就难以为提升法律实效的决策和行动提供有效支持。

(二)传统研究范式之缺陷。

对法律实效的研究分为定性和定量两种研究范式。但是,这两种范式均存在缺陷,难以满足法律实效研究对范式的需求。

1.定性研究范式之缺陷。

定性研究是在法律的整体实现及其实现的社会效果这一宏观范围上衡量法治实现的状况、程度,分析、判断法律整体的实效,得出一个适当的评价结果。 [7](p8)这也是目前较为普遍采用的法律实效研究范式。诚然,该范式具有概括性强、所涉问题领域广泛等优势,但其缺陷也是显而易见的:

第一,信息收集能力不足,导致研究结果不具有全面性。定性研究主要通过文献资料检索、阅读等方式收集与法律实效有关的信息,而这些方式决定了所收集到的信息只是片面的、不充分的,导致研究结果不免有挂一漏万之嫌。

第二,信息处理能力不足,导致研究范式局限于静态视角。定性研究以仅具备有限认知能力的研究者本人为研究工具,不仅收集信息能力不足,信息处理能力更加匮乏。其表现为研究过程中只能对法律实效进行静态的观察——或是采用法理演绎加法条注释的方法梳理法律文本寻找制度或规范之间的矛盾冲突, [8](p140)或是截取法律运行中的某个片段进行研究,并据此得出研究结论。其孤立、静止的观察视角与动态发展的法律实效之间显然存在矛盾。

第三,受主观因素影响较多,导致难以做出客观的评价。定性研究主要凭研究者的直觉、经验,对法律实效的性质、特点、发展变化规律作出判断,其评价结果受研究者个人因素的影响颇多。评价标准的设定、结果的分析和形成会因研究者的智识水平、研究经历、学术主张等呈现明显的差异。加之所收集和处理的信息本身又是片面的,致使评价结果难免因人而异,其客观性及对未来决策和行动的有效性值得怀疑。

2.定量研究范式之缺陷。

正如有些学者指出的那样,法律世界的共性和规律也需要科学的量化分析手段才能准确把握。 [9](p32)面对定性研究范式存在的缺陷,法律实效的定量研究范式正在得到越来越多的认同。 ①如谢晖教授认为,法律实效总是可以被我们用统计学的原理统计出来。 [10](p99)定量研究范式通过观察、实验和调查获取客观数据和信息,借助统计学和数学的定量分析进行具体量化,进而分析、归纳出法律实效的发展规律。尽管该范式有其存在的必要性和实证优势,但传统定量研究范式同样存在缺陷:

第一,范式本身局限于传统统计学意义上的科学性,导致研究结果仍不具有全面性。传统定量研究的基本范式要求是以更多的样本量实现更好的统计显著性,从而推断出更大的总体。具体而言,就是使用发放调查问卷、典型样本分析等方式“抽样”收集和分析数据,运用传统统计分析工具对数据和信息进行处理。但问题在于,样本、问卷终究是对部分甚至极少部分法律实效信息的收集,亦即传统定量研究范式仍是建立在信息不完备、不充分的基础之上。仅以少量甚至极少量的信息对法律实效的全貌进行研究,其得出的只是传统统计学意义上的科学结果,仍然不具备实质意义上的全面性。

第二,信息收集能力有限,导致研究范式存在滞后性。传统定量研究样本的收集往往耗时费力,如依靠长时间蹲点、大范围发放问卷、反复调查研究等方式收集样本。待到样本收集满足统计学意义上的充分要求后再行研究,得出的结果充其量是反映法律实效的“部分过去时”状态。研究结果在多大程度上可以推论到总体,还有赖于同一题目下多个研究的不断重复,最终才能达成共识。 [9](p32)鉴于传统定量研究范式的信息收集能力远远赶不上法律实效变化发展的速率,即使经过多次、反复研究最终达成了共识,其对法律实效动态现状的研究功能恐也早已失去。

第三,受人为因素干扰,导致评价仍不具有客观性。虽然定量研究过程本身由统计软件、设备自动进行,不受研究者主观因素的影响。但在进行统计分析前必须进行问卷调查、选点取样,而这些主观选样的过程同样具有任意性、为我性。例如,对于同一部法律的实效研究,虽然不同的研究者可以采用相同的统计工具、软件、算法等,但其依然有可能根据自身的主观判断设计不同的调查问卷、选择不同的典型样本。而这些选样的主观性依然会影响评价结果的客观性。面对这样的评价结果,如何加以参考以利未来决策和行动?

二、大数据时代法律实效研究新范式之开拓

近年来,人们通过分析庞大的数据来获得有价值的信息或判断,这个被称为“大数据”的概念正受到越来越广泛的关注。 [11](p3)可以说,人类社会正在进入一个全新的历史阶段——大数据时代。在这个新的时代,人成为一切数据足迹的总和,人们的一切行为都以数据的形式被记录、被储存、被处理。对大数据的分析和处理,成为人类获得新知,创造新价值的源泉。因此,与其说大数据是一种海量的数据状态及其相应的数据处理技术,不如说它是一种思维方式。 [12](pXXXI)它开启了一次重大的时代转型,是人类认识世界、改造世界能力在方法上的一次飞越,这为法律实效研究开拓了一种新的范式。

(一)法律实效大数据研究具有技术可行性。

大数据时代之所以能够到来,首先得益于与之相适应的信息技术的飞速发展。同理,要将法律实效的研究范式拓展至大数据领域,也必须首先满足技术上的可行性。实际上,与大数据时代相匹配的数据收集、处理、分析技术,已经可以为法律实效的大数据研究提供充分的技术支撑,使之作为法律实效研究新范式在技术上成为可能。

1.建立大数据法律信息系统在技术上成为可能。

法律信息系统是以法律信息为主要内容,由绝大部分从事有关法律信息的收集、处理、储存、传递和反馈工作的部门或单位有机地联结而成的一个巨大的集合体。其功能是使许多从事信息工作的部门或单位成为有组织有领导的信息集合体,实现使一切工作都围绕着法律信息的动态收集进行,以满足法律信息需求。 [13](p47)特别是由于计算机技术和网络技术的发展,法律实效信息的收集工作已经可以不断提升能级。例如,2008年以来,浙江法院系统通过构建数据大集中的信息化体系,汇集了近700万件案件“一案到底”的信息、80多万件案件的庭审录音录像和所有已归档案卷的电子卷宗,为加强对办案的全流程监管,实现科学分类、多元检索和海量数据的分析比对奠定了基础。 [14]可见,建立法律信息系统已经可以成为大数据收集工作的主流形态,系统所收集到的大数据信息足以作为法律实效大数据研究的基础。

2.对大数据法律实效信息进行高速处理在技术上成为可能。

伴随着大数据时代的到来,“云计算”的应用服务范围正日渐扩大,影响力也无可估量。通过“云计算”,所有收集的数据和信息录入法律信息系统后都能够及时进行一系列的加工、处理。更重要的是,用户可以通过各种终端接入数据中心,按自己的需求进行数据处理,得到结构严谨、分析深刻、结论明确的研究报告。例如,山东省成立了大数据警务云计算中心,不但通过警情数据研究打防管控等业务工作,还把大数据警务云计算应用领域拓展到警务人员的管理和执法工作。 [15]总之,与大数据时代相适应的数据处理能力,已经可以满足大数据研究对与法律实效有关数据的处理需求。

3.对法律实效进行大数据分析评价在技术上成为可能。

近年来,现代统计学的研究已经发展到通过建设数据分析中心,以现代统计理论研究为基础开展的大数据分析、评价和预测。例如,通过建立房地产市场信息统计分析系统、职业病监测信息统计分析系统等, ①对相关行业、领域的信息进行收集和分析,能够有效检验政策、法规等的实际实施效果。在美国的查尔斯顿,警方利用数据分析工具准确地分析了犯罪模式,在分析预测工具的指导下主动进行了警力调配,锁定犯罪热点地区、预防犯罪行为发生,该地发案率明显下降,无疑提升了法律的实施效果。 [16](p49)目前,运用大数据分析在技术上已经可以提供包括综合性信息、宏观性信息、微观性信息、预测性信息、动态性信息、正反馈性信息、负反馈性信息、趋向性信息和咨询建议性信息等不同类型的反馈信息。 [17](p43)这些信息为客观分析评价法律实效,并支持未来决策和行动提供了有力依据。

(二)大数据研究能够弥补传统范式之不足。

法律实效研究范式向大数据拓展,不仅仅是考虑到其在技术层面可行,更主要的是大数据具有“4V”的特点,即Volume(数据容量巨大)、Velocity(数据产生处理速度快)、Variety(数据类型多样)、和Value(数据价值巨大)。面对法律实效研究之范式需求与传统范式之缺陷间存在的矛盾,上述特点使得大数据研究可以有效弥补传统范式之不足,满足法律实效对研究范式的需求。

1.克服传统范式对信息收集的不充分,使研究结果具有全面性。

无论是定性研究,还是传统统计学意义上的定量研究,都建立在信息不充分的基础之上。即使所获信息达到传统意义上的充分标准,其实质仍是局部分析、片面分析。随着大数据时代的到来,信息的收集已经不再成为法律实效研究的羁绊,因为所谓大数据,就是用现有的一般技术难以管理的大量数据的集合。 [11](p3)海量的、全部的信息会通过互联网网站、法律信息数据库等各种渠道向研究者提供。也就是说,法律实效大数据研究范式的基本前提就是信息充分,运用该范式起码可以展开对法律实效的全面研究。

2.克服传统范式数据处理能力的有限性,使研究富有效率。

在大数据时代,存储、网络和计算技术领域的最新发展使得人们能经济、高效地利用大数据, [18](p15)这将极大地提升法律实效研究的效率。大数据研究范式以强大的数字化、信息化技术为支撑,其采用的数据收集、导入和处理、统计和分析、挖掘这一流程和相应设备能够极大地缩短法律实效分析与评价周期。如此一来,研究者可以及时掌握法律实效的动态全貌,并适时得出法律实效的分析评价结果,进而有助于及时决策和采取行动提升法律实效,弥补传统研究范式孤立、静止、滞后的缺陷。此外,强大的技术和设备还能使海量数据信息得以长期保存,以利在持续进行的法律实效研究过程中反复挖掘既有数据资源的价值,达到对已收集数据的充分利用。

3.屏蔽传统范式中过多的人为因素,使分析评价结果具有客观性。

大数据不是一种凭研究者的直觉、经验作出判断的研究范式,其是以信息充分的大数据实证分析为基础,再对实证分析结果进行科学评价的过程。其中,大数据的产生绝大多数时候不需要人工参与而是直接由大数据收集设备自动生成,其分析评价过程也是通过标准化的流程和设备对数据进行自动处理。不仅如此,运用大数据研究范式需要构建庞大的数据系统,这绝非少数研究个体仅凭自身智识就可达成的,它需要多学科、多领域的专业研究人员联合攻关、系统建立。任何部分的非科学性、主观性均可致整个大数据系统的失败。故相比传统范式,大数据研究受人为因素,特别是个别人主观因素影响较小,可以保证呈现高质量的、客观的分析评价结果。

三、法律实效大数据研究范式之理论框架

既然大数据能够为法律实效研究带来范式的变革,我们不禁要问,什么是支持范式变革的原动力?答案就是大数据研究范式特有的、变革传统人类认知模式的理论框架。

(一)要全数据不要抽样。

无论何种研究范式,其对法律实效的观察均需借助对相关信息的分析。但在信息收集和处理能力有限的时代,缺乏收集和处理充足信息所需的方法和工具。因此,采用抽样、选点、访谈、问卷等“捷径”便成为那个时代理所当然的产物,这也从侧面折射出法律实效传统研究范式对数据不足的无奈。然而,在大数据时代,当我们可以获得海量规模的数据信息以后,当我们拥有足够的数据信息处理能力以后,之前的抽样、选点等无奈之举也似乎就没有什么意义了。这是因为大数据中的“大”不是绝对意义上的大,而是指不用抽样分析这样的“捷径”,采用所有数据的方法。 [19](p30)因此,在法律实效大数据研究范式中,需要收集的是有关法律实效全部而完整的数据信息,即“样本=总体”。有了这样的全数据保障,进行法律实效研究自然能实现全面性,相比主观臆断或抽样分析得出的片面结果在范式上已经明显胜出一筹。

(二)要混杂不要绝对精确。

在传统的“抽样”、“选点”时代,最基本、最重要的范式要求就是减少数据的错误,保证数据的质量。因为在抽样和选点时的任何细微误差,都将在后续的分析过程中被放大进而影响研究的精确性。因此反复校对数据,对结果的反复验证就成为传统范式提升精确性的必然要求。在大数据时代,我们所能获得的数据规模越来越大,甚至可以获得全部数据。与之相应的问题是,在分析大数据时,可能会遇到杂乱无章、充斥着垃圾的数据。 [20](p7)特别是许多错误信息也会混入数据库和分析系统,因此大数据分析虽然迅捷但错误率却可能增加。面对可能出现的混杂状况,大数据研究范式并不苛求研究结果的绝对精确。因为无论多精密和高超的方法、技术、设备,其必然产生于特定的历史时空范围内、特定的生产技术水平条件下。如果我们承认人类在特定时空范围内的有限理性,那么在该特定条件下产生的研究范式总要存在一定的方法局限性和能力有限性。在承认数据混杂的基础上,大数据研究范式的结果不是“板上钉钉”,不是唯一答案,而是一种趋近于精确的参考答案,这本身就是一种科学的态度。例如,在新加坡,智能交通综合信息管理平台在预测交通流速和流量方面有高达85%的准确率。 [21]对于时时变化的、成因复杂的交通管理事务而言,其预测结果的准确率显然高于主观臆断和抽样分析得出的结果。更为重要的是,没有了苛求“绝对精确”的羁绊,大数据研究范式在数据混杂状态下更能充分发挥其处理数据高效、迅捷的优势,以全面、动态、及时、趋于精确的评价结果回馈研究者。

(三)要相关性不要因果性。

一直以来人类不断追求和崇尚知识的确定性,受此影响,无论是定性研究,还是定量研究,在对法律实效的研究结果做出分析评价时,研究者必然要依据因果性确定现象与结果之间的关系。然而,在信息不充分的状态下,对因果关系的判断或是主观的,或是片面的、仅适用于样本的。也就是说,传统范式遵循的所谓因果性评价标准难以探求事物间真正的因果关系。实际上,人类本来就是在有限的时空中活动,其客观条件和主观条件决定了他只能从日常的、有限的时空关系开始去认识事物。如果将有限时空的有限理性运用于无限的对绝对真理的追索过程中,很容易使我们陷入无因无果、无始无终的困境。 [22](p98)

大数据研究范式则在有限时空、有限理性的条件下不苛求因果关系,通过发现和分析事物间的相关关系——数据关系来认识世界。当数据规模达到“大数据”水平后,大数据将运用相关关系“自动”呈现在传统条件下无法显现的结果,以及传统因果关系分析难以发现和解释的规律。运用相关关系“自动”得出的结果,就可以对法律实效及时做出分析评价、决策,并及时采取进一步提升实效性的必要行动。无疑,这既弥补了传统研究范式在对法律实效分析评价方面的滞后性,又满足了法律实效研究对研究范式的客观性需求。实际上,相关性决不等于非科学性,只是在有限的时空条件和有限理性下,这些相关关系尚无法获得因果性解释。我们不能因为所谓的因果关系尚不明确,就放弃采取必要的决策和行动。进一步讲,我们不必非得完全明晰法律实效所呈现状态背后的原因,数据相关性才是大数据研究方法对法律实效做出分析评价的基础。这种分析评价的结果在因果性判断标准下可能是“无根据”甚至荒诞的,但这就是大数据研究范式的特有魅力。它颠覆了人类固有的思维模式,即对法律实效的评价我们只需要知道“是什么”,而不需要知道“为什么”。

四、大数据时代法律实效研究范式之变革路径

正如麦肯锡全球研究所发布的研究报告《大数据:下一个创新、竞争和生产力的前沿》中指出的那样:大数据可以在任何一个行业内创造更多价值。应当说,谁率先拥有、善于利用大数据,谁就能掌握主动、赢得未来。 [23]既然大数据研究有能力变革法律实效的研究范式,那么当务之急就是让大数据更好地应用到法律实效的研究中去。

(一)转变法律实效研究范式。

在信息不充分的时代,采用定性、定量研究范式所获得的法律实效评价结果往往不全面、不客观、不及时。受此制约,法律实效的决策者、研究者往往缺乏数据信息管理的习惯,倾向于“依靠经验、拍脑袋决策”做出粗放式的判断并采取措施。但已经到来的大数据时代正以前所未有的速度,颠覆人们探索世界的方法。不仅是法律实效的决策者、研究者,甚至企业、普通公民个人都可以拥有、利用大数据,并且都在时时刻刻产生大数据。在这种时代背景下,越来越多的组织决策是根据数据分析做出的,越来越多的领域正在经历大数据浪潮带来的革命性影响, [12](pⅩⅦ)法律实效研究亦无例外。因此,必须学习数据驱动的管理方法,依靠海量的数据搜集和精确的数据分析增强法律实效研究的科学性。 [12](pⅩⅩⅡ)这要求决策者、研究者必须充分认知自身的有限理性,尊重数据、尊重相关性,塑造心中有“数”的思维方式:要从传统依靠经验、直觉或抽样的研究范式向“让数据说话、用数据评价、依数据相关性决策和行动”的大数据研究范式转变;要能从海量数据中发现信息,寻找隐藏在大数据中的模式、趋势和相关性,揭示或表达法律实效的真实状态;尤其应该养成重视数据结论与主观常识不符的情况,避免有倾向性地选择使用与主观常识一致的数据,放手让大数据发声。

(二)实现法律实效信息数据化。

诚然,法律实效的大数据研究需要相应的技术、设备、人才作为必要支撑。但是,正如同计算机时代、互联网时代人类对与之相适应的技术、设备、人才刚刚“求贤若渴”便迅速“资源过剩”一样,随着大数据时代的到来,与大数据相关之技术、设备、人才等要素的配置在不久的将来同样不会成为制约大数据应用于法律实效研究的瓶颈。真正可能制约法律实效研究范式转变的恰恰是大数据本身,首当其冲的就是在法律实效研究中能否真正掌握、拥有大数据。因为在大数据时代,数是一种客观存在的物质对象的基本属性,数据将成为一切人类活动和组织运行的基本要素。法律实效中的一切事务,经过编码,都可以成为相互之间的数据关系的载体。 [22](p101)数据越多,分析越深入,所得的结论就越全面。 [24](p2)是故,大数据研究范式的核心不是技术而是数据。要实现对法律实效的大数据研究,必须首先使与法律实效相关的全部信息数据化,把数据与法律实效相连接、相匹配。鉴于影响法律实效的因素包括立法、执法、司法、守法等法律运行的全过程,涉及权力机关、行政机关、司法机关、企业、社会组织、公民个人等多元主体,因此,在法律实效的研究中,多元主体在法律运行全过程的一切行为和事件都要以数据的形式被记录、被鉴别、被挖掘、被设计。同时,还要做好法律实效大数据信息的质量保障工作,实现由传统的经验性、模糊化评价向数字化、精密化、科学化、智能化评价转变。 ①

(三)提升运用法律实效大数据的能力。

对于大数据研究范式而言,“大”和“数据”都只是范式适用的基础。无论是“大”,还是“数据”,虽然必不可少但在大数据时代要实现也并非难事。换言之,二者都不是法律实效大数据研究范式中最重要的。根本而言,最重要的应该是如何运用这些大数据。

1.多元主体间数据之开放与交流。

第一,公权力机关内部各主体间要实现数据之开放与交流。传统的“条块分割”模式使得公权力机关内部各主体间各自为政,各自依据自身职权和需要收集、处理与之相关的法律实效数据。这导致公权力机关内部各主体间在法律实效数据的交流上存在体制性障碍。只有打破公权力机关内部各主体间的数据壁垒,通过跨系统、跨平台、跨数据结构的大数据共享平台使公权力机关内部各主体间得以流畅协同,使被割裂存储于不同主体的数据在统一大数据平台上得到开放,削减“信息孤岛”现象,实现对大数据的处理才真正成为可能。

第二,公权力机关与其他主体间也要实现数据之开放与交流。过去,能够大量掌控法律实效数据的只能是公权力机关。但在大数据时代,信息技术的不断发展使许多企业如百度、谷歌等,甚至某些个人也能够拥有海量的法律实效数据,其数据量在某些方面甚至可能超过公权力机关。不仅如此,即使公权力机关拥有关于法律实效的海量大数据,但其毕竟无法做到全知全能,尤其是挖掘数据价值的数据处理能力难称充足。因此,对法律实效的大数据处理不应是公权力机关或少数法律实效研究者的专利,多元主体间数据之开放和交流有利于让大数据时代最重要的生产资料——数据得以充分流动,并创造出更大的价值。

2.多源数据之整合与存储。

多元主体之间数据之开放与交流固然可以为大数据的不断增值提供不竭动力。然而,数量不等于质量,“好”信息不等于“滥”信息。要想更好地实现数据分析的目标绝非易事,大数据发展的瓶颈在于满足分析需求的同时要找到多源数据的最优处理方法, [24](p6)而所谓的最优处理方法就是实现对多元数据之有效整合与存储。具体而言:

第一,重视对多源数据的整合,使数据的功能趋于一致。由于与法律实效有关的数据来源的主体不同、内容不同、地域不同,因此相关数据具有不同的格式、不同的指标含义,且其中存在不少无效数据、异常数据、不完整数据、错误数据。这就需要在法律实效大数据研究过程中对多源数据进行整合,将其转换成可以实现检索、汇总等功能的数据库。

第二,重视对多源数据的存储,不要将数据随意丢弃。在法律实施的过程中,公权力机关、企业、公民等多元主体每时每刻可能都在产生与法律实效有关的多源数据。要把数据视为能够创造价值的资产,不仅要通过多种渠道尽可能多地收集、整合,更重要的是对整合后的数据进行有效存储,为不断使用和挖掘大数据的价值提供基础数据保障。

3.历史数据之充分使用与挖掘。

“为公共资料增值再用”,香港公共数据网站“资料一线通”的这句口号深刻地揭示了大数据时代对待历史数据的基本态度。在传统的研究范式下,对法律实效评价后,相关数据、资料通常会因其已经“过时”而被弃之不用、束之高阁。但在大数据时代,大数据对价值的创造不仅体现在新数据的不断收集和处理上,更体现在对既有历史数据的充分使用和挖掘上。质言之,对既有历史数据的充分使用和挖掘也是对大数据的创新。因此,要持续进行法律实效大数据研究,不仅需要不断充实新的数据,也需要使用和挖掘被妥善存储的大量历史数据,使其能够不断创造新的价值。

猜你喜欢

范式法律评价
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
法律解释与自然法
中药治疗室性早搏系统评价再评价
孙惠芬乡土写作批评的六个范式
管窥西方“诗辩”发展史的四次范式转换
让人死亡的法律
“互助献血”质疑声背后的法律困惑
基于Moodle的学习评价
让法律做主