APP下载

大数据相关关系及其深层因果关系意蕴

2017-10-31王天恩

社会科学 2017年10期
关键词:相关关系因果关系大数据

摘 要:大数据的信息性质及其对相关关系的凸显,促使人们对相关关系及其与因果关系的关联进行深入反思。因果概念的重新刻画及其量化展开,展示了物数据化中的因果关系际遇:在获得量的关系强度和正负性质的同时,丧失了原有的必然性和方向性。相关关系是因果派生关系。相关关系的因果派生机制决定了相关关系的或然性质,说明了相关关系的因果派生强度和因果派生层次。大数据相关关系具有深层因果关系意蕴,它意味着因果时态的展示,追溯既往的因果关系量化把握和探向未来的新因果关系创构。

关键词:大数据;相关关系;因果关系;因果时态

中图分类号:TP311.13-02 文献标识码:A 文章编号:0257-5833(2017)10-0115-08

作者简介:王天恩,上海大学社会科学学部教授、博导 (上海 200444)

随着大数据对相关关系的凸显,因果关系和相关关系这一久久萦绕人们脑际的复杂问题,日益显示出其实践和理论的双重意义。大数据的发展,既使这一问题的深入理解更显迫切,又为这一问题的理解提供了新的重要条件。

无论在哲学中还是在科学中,人们似乎都默认:“相关关系并不意味着因果关系”。但无论在科学中还是在哲学中,因果关系和相关关系之间始终具有一种持续的内在张力;尤其是在大数据基础之上,因果关系和相关关系成了越来越多领域关注的重要问题。相关关系到底意味着什么?相关关系与因果关系之间究竟是一种什么关系?有关大数据相关关系的这些问题,不仅随着信息文明的发展面临更紧迫的实践追问,而且随着对大数据的反思日益呈现出更深层次的因果关系意蕴。

一、因果观念的困境和相关关系的凸显

自《科学》杂志1998年首次出现“大数据”概念1,《自然》杂志2008年出版“大数据”专刊以来,“大数据”浪潮就以难以想象的势头扑面袭来。一系列理性不能不及早深层次面对的时代课题,以空前的速度和让人始料未及的方式,甚至在许多人的既定理论酣睡中,横在了哲学面前。正是大数据的物数据化,在对传统因果观构成严峻挑战的同时,提出了深入理解相关关系的迫切任务。

相关性及其与因果性的关系问题,无疑是由大数据的发展得以空前凸显的,但问题的根源却在于因果描述本身的发展困境和相关关系日渐突出的复杂性。

1、因果观念的发展困境

对于因果性问题来说,20世纪30至50年代是灾难性的30年。因果论的这种遭遇主要是由量子理论的发展带来的,量子描述的或然性和因果时序颠倒说凸显了因果定性描述的两方面问题:因果联系是必然的还是或然的?前后相继的还是同时的?

在因果概念的哲学研究中,因果必然联系的观念与因果概念的规定内在相联;而在因果关系的科学研究中,因果或然联系的观念则与因果关系的实际应用密切相关。因而问题就在于:因果概念的规定旨在描述事物过程的确定性环节,对于人类认识发展来说,这种描述无论在经验上还是在逻辑上,都是必不可少的;但具有必然性的因果定性描述与科学实践中描述的或然性构成冲突。这显然涉及因果概念的内在逻辑矛盾,这种内在逻辑矛盾在因果时序方面有进一步的表现。

关于因果时序,“前因后果”说似乎不仅拥有经验的支持,而且具有逻辑上的论据。在休谟那里,理由很简单:“如果一个原因和它的结果是同时的,这个结果又和它的结果是同时的,这样一直推下去。那么显然就不会有接续这样一个现象,而一切对象必然就都是同时存在的了”。因此“原因必须是先于结果的”。1康德的观点和根据与休谟一样:“原因的因果规定性(原因的一种状态)一定先于结果而存在,……否则在原因和结果之间就不能设想出什么时间连续性来”2。而“因果同时”说则有一个同样不可置疑的论据:“前因后果”意味着“前因”阶段存在无果之因。因果概念与因果规定的要求不相符合,表明传统因果概念存在根本问题。这也正是为什么在量子力学建立之后,必须重新刻画因果概念。

2、因果概念的重新刻画及其量化展开

关于因果概念的规定,事实上正如休谟所说,如果只是“给原因下一个定义说,它是能够产生其他东西的一种东西,那他显然是什么也没有说”。因为在“产生”这一概念中,这一问题仍然存在。3量子力学表明,问题的关键在于把因果概念的规定落实到事物的相互作用上。恩格斯早就指出,“相互作用是事物的真正的终极原因。我们不能比这种相互作用的认识追溯得更远了,因为在这之后没有什么要认识的东西了。……只有从这种普遍的相互作用出发,我们才能达到现实的因果关系”4。而要把因果规定落实到事物的相互作用过程,关键又在于从原因中分析出参与相互作用过程、构成一定原因的“因素”。

在汉语文献中,最早将“因素”引入因果概念刻画的是《原因是因素的相互作用过程》5一文,在此基础上因果结构得以呈现。6在西文文献中,最早从大卫·玻姆开始,不少哲学家和科学家使用“causal factor”这一术语,现在很多文献都使用“因果因素”,包括格兰杰。7“因素”和一般事物之间的不同在于:因素是相对于特定因果关系的事物,即使尚未进入相互作用过程,它们也相对于潜在结果构成一种具有特殊含义的关系。不与特定因果关系相联系,就不成其为因素关系而只是一般的事物联系。正是由此可以看到,原因是对因素相互作用过程的描述;结果则是对因素相互作用效应及其痕迹累积的描述。

重新刻画的因果概念,一方面解决了因果概念面临的上述两方面问题;另一方面“因素”和“原因”的分化导向对事物过程必然性和或然性两个环节的合理描述。而因素相互作用效应及其累积的区分则解决了因果时序问题,这与当代科学中因果原理的理解相一致。“同样的原因或原因集合总是产生同样的结果或结果集合以及原因(原因集合)短暂先于或与结果(结果集合)同时发生。因果原理的上述陈述与科学中普遍接受的原因和结果概念相一致。”1这也包括M.邦格的观点。2而在信息文明时代,重新刻畫的因果概念不仅能解决因果定性描述问题,而且可以走出因果定性描述所带来的因果观念困境。endprint

在哲学和科学发展中,不仅因果关系的定性研究,因果关系定量分析的发展也带来了因果观念的困境。随着因果关系定量研究的兴起和发展,因果性研究在20世纪60年代后迅猛复兴。因果性定量研究的全面复兴,又一次使因果观念陷入困境,只是这一困境直到大数据出现才悄然出场。随着大数据的发展,物数据化使相关关系空前凸显。在爆炸式增长的大数据文献中,相关关系大有淹没因果关系之势,只是在传统概念迷雾中偶尔闪现新的识见:“‘大数据用事实向人类宣告:‘知其然不知其所以然,既是电脑望尘人脑的劣势,也是电脑超越人脑的优势!”3因果关系的定性研究和定量研究是如此不同,以至有观点认为,因果关系是物理的、哲学的,相关关系是数学的。而在实践中,因果定量描述对定性描述的绝对优势则导致以相关关系取代因果关系的倾向。

因果定量描述所带来的困境反映了因果定量描述和定性描述的矛盾,涉及因果关系在物数据化过程中的因果遭际。

3、物数据化中的因果关系际遇

大数据的建立是一个物数据化的过程,在这一过程中,对因果关系来说,有两方面的事实至关重要:由因素相互作用过程的数据化,可以看到因果关系的量化蜕变;由因果关系的量化蜕变,可以看到原有因果关系方向性的丧失。

(1)因果关系的量化蜕变。由于原因是对因素相互作用过程的描述,因果关系量化成为变量之间的关系后,作为因果关系的量化反映,只是对因果关系的量化描述。

在大数据中,相关关系都表现为不同变量之间的关联。这意味着,物数据化过程既具有重要意义,又发生了一系列重要改变。一方面,只有作为变量之间的关系,相关关系才可能通过量化得以具体体现,才可能为我们所精确把握。因果关系量化的必要性,与相关关系的性质密切相关。另一方面,因果关系成为变量之间的关系后,由于量化而获得了量的关系强度和正负性质。在因素相互作用动态过程中,因果关系的数据化过程具有一个非常重要的性质:量化蜕变。因果关系一旦以不同变量之间的关系表达,就变成了变量之间的相关关系。虽然这种变量之间的相关关系可以反映因果关系,但原有因果关系的一些重要性质,已经在这一过程中因具体条件被量化抽离而改变。因果关系的量化使其蜕变为相关关系,就像三维物体的平面投影将三维信息折叠为二维。比如氧化反应的数据化,物的过程的因果关系变成数据的量的关系后,成为因果关系的量化反映。由于因果关系的量化反映只能是相关关系,数据化的氧化反应表现为数据的变量关系。

(2)因果关系方向性的丧失。作为凝固的因素相互作用过程,由于因素的作用方式都是确定的,因素相互作用过程不可逆,因果关系具有明确的方向性,而在因素和潜在结果之间的关系中,因素之间的相互作用方式并未确定,因素尚未进入相互作用过程,因而不存在因果联系的不可逆性,从而不存在明确的方向性。也就是说,原有的因果关系由于量化丧失了特有的必然性和方向性4,数据化后没有了因果关系所特有的方向。

因果关系的量化正是把因果关系蜕变为因素关系的过程,因此作为量化过程,数据化就是使因果关系丧失方向性的过程。由于没有方向,变量相关在定量分析中不能区分原因和结果。“两相关变量远不足以得到结论,认为一个变量的变化是另一变量变化的原因。”1尽管被量化的是严格的因果关系,但量化后没有了原有的方向性,只具有正相关和负相关的区别。既可能正相关,也可能负相关。

在大数据中,由于都是量化的关系,由于全是定量描述,相关关系及其所反映的因果关系都表现为变量之间的关系。由于因果关系量化为相关关系,虽然数据化前后的关系性质有很大不同,但正是这种量化前后的关系,表明相关关系的根基仍然在因果性,只是传统因果概念不能展示二者间的内在关联。重新刻画的因果概念不仅能理解物数据化和数据物化中的因果关系,而且为理解大数据相关关系创造了条件。

二、相关关系的因果派生及其性质

由于与因果关系之间千丝万缕的特殊关联,相关关系的问题必须在与因果关系的关联中寻找答案。重新刻画的因果概念为相关关系的深入理解提供了理论根据,为这些问题的澄清创造了条件。

1、相关关系的因果派生及其机制

从定性的角度看,相关关系是一个宽泛的概念,世间事物就呈现为从直接相关到间接相关这样一个无限蔓延的分布。实际上,关系本身就是对相关性的描述,而大数据相关关系则一方面对因果关系概念提出了挑战;另一方面又使更深入理解和规定相关关系成为可能。

世界上的任何事物都可能相互关联,但相关关系并不指谓所有这些关系,大數据相关关系应当在因果关系中找到其定位。在重新刻画的因果概念中,正好可以找到相关关系的对应位置。

在重新刻画的因果关系中,当因素未进入相互作用过程时,构成了一种与潜在结果相联系的因素关系。这种因素关系显然不就是因果关系,而是相对于潜在结果的一种相互关系,这就是相关关系。它们的生成及其与因果关系的密切关联表明,相关关系是由因果关系派生出来的,相关关系和因果关系之间是一种派生关系,即相关关系是一种因果派生关系。由同样的机制,因果结构可以派生出更多的相关关系,除了因素和结果之间,因素之间和结果之间的关系等都是因果派生关系。重新刻画的因果关系表明,由不同的机制可以派生出各种不同的相关关系。作为因素相互作用过程与其结果之间的关系,因果关系是由相互作用过程凝固了的因素关系,而在进入相互作用之前和因素相互作用过程之中,因素之间、结果之间以及因素和结果之间所构成的一类有特殊意义的关系,都是相关关系。由此可以得到关于因果关系和相关关系的清晰理解:因果关系是为因素相互作用所确定的关系,由于因果关系事实上是一个过程的两个方面,所以不构成相关关系。而相关关系则是因果关系的派生关系,包括因素之间、结果之间以及因素和结果之间的关系等。2毫无疑问,重新刻画的因果概念为展示相关关系的因果派生关系提供了理论基础,但真正使得这种派生关系得以凸显的,则是大数据的发展。正是大数据所带来的物数据化和数据物化的对称发展,凸显了相关关系的因果派生性质。endprint

2、相关关系的或然性质

正是大数据的发展,使相关关系在重新刻画的因果概念中得以充分凸显,并使因果关系得以更充分地展开。将重新刻画的因果概念加以展开,可以看到相关关系的因果派生性质。

作为因果派生关系,相关关系具有与因果关系不同的性质。由因果关系的结构和性质可见,作为因素之间、结果之间以及因素和结果之间的关系,相关关系的性质与因果关系的最大不同,就是不具有因果关系的必然性,而具有或然的性质。

作为因素相互作用过程凝固了的因果关系,原因和结果之间的联系是必然的。作为因素相互作用过程,由于“同样原因永远产生同样结果,同样结果也永远只能发生于同样原因”1,原因与结果的关系是确定的。与因果关系不同,因素和结果之间的关系则不是完全确定的。特定因素与什么样的其他因素,以什么样的方式进入特定的相互作用过程,所形成的结果可以有很大差异甚至完全不同,因而特定因素与结果间的关系只能是相关而不是必然的,即不是完全确定的。这种不完全确定不仅表现为量的差异,而且可以表现为质的不同。这种不确定性不是几率性关系意义上的不完全确定,而是关联有无和相关正负的不确定。即相关性可强可弱,可正可负,甚至时有时无。

由于不同的因果派生机制,在不同的因素作用条件下,相关关系可以是从接近因果关系到趋近完全无关这样一个连续区间,既可以是变量间具有几近完全确定的联系,也可以是几近完全不确定的联系。只是这种完全确定的联系不一定是必然关联,完全不确定的联系也不意味着与因果关系不相关,因为相关关系的因果派生性质,决定了相关关系的强度。

3、相关关系的因果派生强度

在因素相互作用过程中,因素具有特定的作用方式和作用距离,间接结果也相应具有不同的生成距离。原则上说,任何因素相互作用过程都涉及复杂的因素体系,因为在开放的因素体系中,可能参与相互作用的因素有直接因素和间接因素。再简单的因素体系也涉及复杂的间接因素,即使是球体静止于平面的简单平衡状态,虽然直接因素相对简单,但间接因素同样复杂。

所谓间接因素,就是其参与特定因素相互作用过程不是直接的,而是通过其他因素——典型的如通过直接因素——起作用的因素,比如杀人案中的教唆者。由此可以构成一个作用链条,正是这一链条构成因素的作用距离。直接因素的作用距离最近,越是靠近直接因素的间接因素,其作用距离越近,反之则越远。由于因素在相互作用中具有特定的地位和作用,由于因素在特定相互作用中的時空关系不同,因素在相互作用中所具有的特定作用方式和作用距离使量化的相关关系有不同的相关度。越是接近相互作用过程的因素之间的关系,越是表现为直接的相关关系,越具有强相关度,因而也越接近因果关系的性质。越是远离相互作用过程的因素之间的关系,越是具有弱相关度,或越是具有间接性的相关关系。而且,不仅因素有不同的作用方式和作用距离,在因素相互作用生成的系列效应及其累积的不同结果形态之间,也具有由结果的间接性所确定的生成距离。越接近相互作用过程的结果间关系,越表现为直接的结果间相关关系,越具有强相关度,反之亦然。因素参与相互作用的方式与相关关系的正负值密切相关,而因素的作用距离和结果的生成距离,则正是相关关系强度形成的基础。

4、相关关系的因果派生层次

因素相互作用过程的时间性,构成了相关关系因果派生的不同层次。作为因果派生关系,相关关系也相应存在三个层次,即作为原因的因素相互作用过程后构成的相关关系、因素相互作用过程中构成的相关关系以及因素相互作用过程前构成的相关关系。

因素相互作用过程后和过程中构成的相关关系,主要是对既定事物中相关关系的描述。统计学、计量经济学、生物统计学(Biometrics)和心理测验学(Psychometrics)等学科中的相关关系主要是因素相互作用过程中,因素之间、结果之间以及因素和结果之间的关系,这是一种过程中的关系。由于是过程中的关系,因此也有系列相关关系即所谓“自相关”(autocorrelation)。自相关是因素相互作用过程不同阶段的相关关系,统计学和计量经济学等学科中的自相关是因素相互作用过程不同阶段或因素与序列结果之间的相关关系。这种自相关实质上仍然是因素之间、结果之间以及因素和结果之间的相互关系。在因素相互作用过程中,抽取一定时间段的数据就可以获取某一时段的相关关系数据,而对这一过程的跟踪观测,则可以获得系列数据。在因素相互作用过程中,动态相关关系对于了解和调控对象过程至关重要。而因素相互作用过程中和过程前构成的相关关系,则与创构活动密切相关。在大数据相关关系中,因素相互作用过程前的因素和潜在结果之间的相关关系,对于数据物化从而创构活动特别重要。

由于因素相互作用体系的复杂性,相关关系的形式复杂多样。在相关关系的因果派生结构基础上,这些复杂的相关关系类型就可以得到系统的清晰呈现。

三、大数据相关关系的深层因果关系意蕴

大数据涉及两个重要过程:物数据化和数据物化。大数据时代,在物数据化的基础上,作为因果派生关系,相关关系不仅涉及因果关系理解的重要扩展——最为典型的就是因果时态,而且涉及两大至关重要的基本活动:一是基于相关关系的因果关系量化把握,即因果推断;二是基于数据物化的因果关系创构。正因为如此,作为因果派生关系的相关关系同时又具有更深层次的因果关系意蕴。

1、因果时态的大数据相关关系展示

大数据使重新刻画的因果概念及因果结构得以更充分的展开,进一步扩展到因果时态,扩展到因果时序的内在结构。作为因素的相互作用过程,原因可以是球体静止于平面的简单平衡状态,也可以是股市般复杂的因素相互作用体系;可以是物能的,也可以是信息的;既包括物理因素关系,也包括心理因素关系。而扩展到内在时序结构的因果概念,则不仅可以描述并在一定程度上把握更复杂的因果关系,而且可以深入涉及因果关系与其他关系的内在关联。endprint

因果概念的重新刻画所带来的一个重要变化,就是通过对因素相互作用过程的描述,将因素相互作用的时态纳入因果描述模型。

关于因果关系,传统因果概念主要涉及过去时或进行时,而作为因素相互作用过程的描述,因果描述模型则还进一步涉及将来时。原因作为一个过程,使因素相互作用具有不同的时态。作为因素相互作用过程,原因的过程性使其具有相应的时态。因素的相互作用过程不仅有进行时,而且有过去时和未来时。作为过去时,因素相互作用过程已然凝固;作为进行时,事物的动态关系就是一个因素相互作用过程的关系;而作为将来时,则有一个相对于潜在结果的因素关系体系。作为因素相互作用过程的凝固形态,因素相互作用是过去时态;作为因素相互作用过程的动态展示,因素的相互作用是现在时态;而相对于潜在结果,因素因未进入相互作用过程而处于未来时态。因果描述模型的这一时态扩展,具有非同寻常的意义。

首先,因果描述模型的将来时态使因果关系的描述有了真正意义上的因果时态。大数据所带来的物数据化和数据物化的对称发展,凸显了因果时态的对称发展,从而因果模型的将来时态,通过现在时这一中点过程构成了与过去时态相对称的完整因果时态。

其次,因果时态使因果描述模型能更合理地描述事物过程,可以不仅对过去和现在,而且还能对将来做因果描述。

最后,纳入时态的因果概念反过来又为大数据相关关系研究提供了必不可少的因果描述模型。大數据相关关系所反映的,既不是因果关系的过去时,也不是现在时,而是将来时。正是大数据相关关系的时态,不仅为进一步理解因果关系和相关关系概念提供了前提,而且为把握世界事物过程提供了更全面合理的描述模型。

2、追溯既往的因果关系量化把握

从相关关系推断因果关系,既是大数据基础上通过数据把握因果关系不可或缺的环节,同时又是大数据为因果关系的量化把握所提供的重要手段。在物数据化过程中,静态数据反映事物相互作用的瞬时状态,动态数据则反映事物相互作用的动态过程。物的相互作用关系,通过数据化变成量化关系,因而在物的关系的量化过程中,物相互作用的具体条件在数据化过程中因量化而抽离。还原这种因果关系,必须通过因果推断。

通过数据所反映的相关关系还原因果关系,即因果推断。在大数据时代,因果推断已经成了一个越来越重要的热门领域。这方面最具代表性的成果就是格兰杰因果关系检验(Granger Causal Relation Test)。作为因果推断模型,格兰杰因果检验是对因素和结果关系的检测。

为了判断Y对X是否存在因果关系,可以比较“已知上一时刻所有信息”和“已知上一时刻除Y以外的所有信息”。在进行这种比较时,“这一时刻X的概率分布情况”的差别,就是一种典型的检验Y是不是结果X的因素,而不是真正的原因和结果关系检验。因为Y只是确定X的“所有信息”之一,即整个因素体系中的因素之一。在这种因果检验中,虽然预设了一个结构,但可以排除因素间和结果间的相关关系,因此检验是有效的,可用于“预测”。正因为如此,格兰杰认为外加结构(the extra structure)的使用方式对因果关系的定义至关重要。1只是其所检测出的不是原因和结果之间的关系,而是因素和结果之间的关系。所测出的关系强度也只是该因素或该组因素在作为原因的这一因素相互作用过程中的作用强度。而通过变量之间的相关关系强度,只能检验出特定因素与结果之间的因(素和结)果关联,而不可能是真正意义上的因果关系。任何根据变量关系检验因果关系都只能检验出相关关系,而且只是检验出因素和结果间的相关关系。

基于大数据的因果推断虽然只是对因素和结果关系的检验,却是一种基于相关关系的因果关系量化把握。由于既定因果关系属于因素相互作用已经凝固了的关系,因而因果推断是通过追溯既往的因果关系的量化把握。由此建立起来的因果推断模型,无疑是因果描述模型的重要扩展,不仅涉及因果关系的把握,而且涉及因果观念理解的进一步深化。作为定性描述模型,因果观念更属信念层次的规定;而作为定量描述模型,因果关系则更是相关性把握中的相关程度。

“因果”不是实体概念,而是对因素相互作用过程的描述。因果关系的研究经历了一个从实在论因果观到描述论因果观的发展2,而作为因果派生关系,相关关系的理解也应当有一个从实在论理解到描述论理解的过程。而且,由于相对于因果关系,相关关系具有更明显的描述性质,这两种不同的理解具有更明显的区别和更重要的意义。在实在论理解中,所有关系都是相关关系,由此陷入的困境与因果关系传统理解中的终极原因困境具有同样的性质。而在描述论理解中,相关关系则以量的方式,以关系强度和正负性质的形式与人类学特性并最终与人的需要联系在一起,从而达到了具有实践意义的更深层次。

3、探向未来的新因果关系创构

与物数据化相对应的另一基本活动,则是通过数据所反映的相关关系将数据物化。这不仅是一个与物数据化相反的过程,而且是一个与因果关系还原相对称的过程。在这一过程中,结果不是既定的,因而既不是由果溯因,也不是一般意义上的由因(素)索果,而是由因(素)构果。而这个“果”也不是既存的,而是根据人们的需要和大数据相关关系所反映的可能性,以一定的方式使相关因素进入相互作用过程,所获得的期望中的潜在结果。而在特定潜在结果的观照中,则会生成新的潜在的因果关系。这种潜在因果关系所构成的因素体系,在还没有进入相互作用之前,只具有因素和潜在结果之间的关系,这正是大数据所构成的具有未来时态的相关关系。只有让相关因素以一定的方式进入相互作用,生成预期中的结果后,因素相互作用过程才构成现实的原因,从而生成现实的结果,形成作为潜在物创构过程的因果关系。这种因果关系不同于既定物生成的因果关系。正是由此可以看到描述和创构两个不同的空间和过程,看到两种不同的认识旨趣形成的必然性和合理性。

创构是基于人们的需要,根据所设立的潜在结果,得到与这一潜在结果相联系的因素体系,并确定和控制这些因素的相互作用过程,获得想得到的结果的过程。这种具有未来时态的相关关系状态给人类创构未来提供了无限广阔的自由度。以过程哲学研究著称的怀特海把这一点表述得淋漓尽致:“根据本体论原则,所有事物在现实中确定地在什么地方,而在潜在中则在任何地方。”1这在基本原理上表明了相关关系对于人类创构活动及其发展的深层意蕴。endprint

在這里,一方面是作为既定因素和结果关系所反映的相关关系;另一方面是作为因素与可能物(潜在结果)关系反映的相关关系。一方面是作为既定物原因和结果关系反映的因果关系;另一方面是作为可能物原因和结果关系反映的因果关系。两种关系构成一种对称,而对称轴则既是过去和未来的时间轴,更是现实和可能的时空轴。正是大数据从量的方面给出更高层次的整体观照,使我们看到这一前所未有的时空轴对称的壮观图景。

由这一时空轴对称图景,不仅可以更清晰地看到因果关系之于相关关系的基础性地位,更可以看到因果性和相关性的关系,看到因果关系和相关关系二者的结构,看到相关关系及其量化把握为更深入理解因果关系及相关哲学问题所开启的新前景。

在有人参与的简单相关关系体系中,主客二分的认识框架不仅可以有效用于描述,而且更为简洁方便,但在复杂的相关关系体系中,尤其是在大数据相关关系中,有人参与的因素体系至为复杂,人作为因素不再可能当作起支配作用的主体处理。在那里,人作为因素之一,更合理的角色定位是施事者(agent)。

与潜在结果相联系的因素之间的关系,可以是施事者对因素和可能结果之间关系的意识反映。而且对可能结果的意识可以与施事者的意图相关。正是大数据对丰富多样相关关系的展示,人们得以从因果关系深入到因素关系。也正是通过“相关”,大数据使“因素”这一关键概念得以凸显,从而导向了与描述不同的创构——对新事物的创设。而创构正是在大数据基础上,以数据物化为典型形式的基本活动。由于这一基本活动将是人类越来越重要的生活方式,它也将成为哲学研究越来越重要的主题。

在大数据中,因果关系为相关关系提供了哲学根据。作为因素相互作用过程确定性关系的描述,因果性在更深层次关系到大数据的哲学意蕴。而大数据相关关系则通过对因果关系理解的深化,开辟了关于因果关系乃至哲学本身更广阔的思考空间。从线性到非线性相关,从非线性相关到人的因素,从人的因素到创构活动,从创构活动到人的需要,从人的需要到哲学的最终目的,从抽象普遍性终极追寻到量的整体性具体把握,这些都是大数据相关关系和因果关系引出的进一步话题。

(责任编辑:周小玲)

Correlation in Big Data and Its Deep Causal Meaning

Wang Tianen

Abstract: The informational nature of and the highlights of correlations by big data urge people to reflect deeply on correlations and its connection with causality. The redefinition of the concept of causality and its quantificationally spreading shows the fortune of causality in the process of matter datamation: a loss in terms of in evitability and direction as well as a gain in relationship strength and positive and negative properties. Correlations are causal derivative relationships.The mechanism of causal derivative relationship determines the probabilistic nature of correlation,illustrates the strength and levelof causal derivation of correlation. Correlations in big data has deep causal connotations, it means the reveal of causal tense, the quantifying grasp of the causality back over the past and the creation of new causality towards future.

Keywords: Big Data; Correlation; Causality; Causal Tenseendprint

猜你喜欢

相关关系因果关系大数据
原因的原因的原因不是原因
做完形填空题,需考虑的逻辑关系
探究刑法的因果关系
地区公路投资与经济增长关系探究
以数据新闻获奖作品探析数据新闻特征
基于大数据背景下的智慧城市建设研究
大学生复原力与负性生活事件、心理健康之间的关系
从哲学中的因果关系到刑法学中的因果关系