大数据思维与归纳主义方法论的变革
2016-03-23袁海瑛江西财经大学马克思主义学院江西南昌330013
袁海瑛(江西财经大学马克思主义学院,江西南昌 330013)
大数据思维与归纳主义方法论的变革
袁海瑛
(江西财经大学马克思主义学院,江西南昌 330013)
[摘要]归纳主义方法论在西方科学方法论史上占据了重要地位,随着大数据时代的来临,人们的思维发生了深刻的变化,同时也影响了归纳主义这一基本思想方法。文章在回顾传统归纳主义方法特征与缺陷的基础上,结合大数据时代的思维变革特点,论述大数据思维对归纳主义方法论的影响。
[关键词]大数据思维;归纳主义;方法论;变革
归纳法是从经验走向理论的重要科学方法,它与演绎法一起构成了科学研究的两种路向。自从培根对归纳法进行全面论证并作为科学新工具以来,近代科学在归纳法的帮助下取得了辉煌的成就,以至形成了所谓的归纳主义方法论。然而,归纳法所归纳的结论不具有绝对的确定性,因此一直被哲学家所诟病。随着大数据时代的来临,传统的归纳法将产生重大变革,其所得结论的确定性将可能得到极大的改善,因此,在大数据时代,我们有必要对传统归纳法和归纳主义进行重新的思考。
一、传统归纳主义及其局限
归纳主义方法论是指以归纳主义方法为内容的一种经验主义方法论,简言之,归纳主义方法论就是以归纳主义为基本思想方法的理论。此处有必要区别方法与方法论两个概念。按照通常理解,方法就是用来解决问题的新思路、新办法,也可以进一步将方法定义为:“任何特殊领域中实施程序的方式,即组织活动的方式和使对象协调的方式。”[1]关于方法论,前苏联哲学家罗森塔尔·尤金认为包括两层内涵:“(一)关于研究的方法、方式的学说;(二)是在某一门科学上所采用的研究方法、研究方式的总和。”[2]可见,“方法只是方法论的一个基本范畴,方法论是一种带有普遍意义的一般理论,而方法则突出具体的本性。”[3]通俗地说,方法论就是研究方法的理论。归纳主义方法论就是关于归纳主义方法的理论。那么,归纳主义是一种怎样的方法呢?
(一)归纳主义的兴起
归纳主义始于17世纪至18世纪的英国工业革命时期,当时的科学还处于积累材料的阶段,材料的获得主要靠观察、分析与总结,在自然科学领域中经验性获取知识的方法影响了哲学家们,甚至某些哲学家认为经验是唯一可靠的认识方法。这些哲学家被称为经验主义者,经验主义者推崇经验,提倡归纳主义,认为我们的一切知识都是从经验中获得的。归纳主义的思想渊源可以追溯到17世纪的弗朗西斯·培根的著作,培根反对演绎逻辑方法,主张把科学发现建立在经验主义的基础之上,认为人必须采用实验、观察、归纳的方法,在经验的基础上得出普遍性的结论或公理。培根之后,不少西方方法论学者对归纳主义进行了发展,将归纳主义发展到更为严格的程度。可见,归纳主义就是一种实验、观察和分析、总结的方法,也就是对实验与观察的内容进行分析与总结,从而得出结论获取知识的方法。
(二)归纳主义的特征
归纳主义方法能在方法论史上占有一席之位,并在多学科领域尤其经济学领域得到普遍运用与认可自有其魅力之处,笔者简要概括为以下几点。
第一,归纳主义主张把知识的获得与理论的形成建立在经验的基础上,只有通过感性认识与经验才能获得可靠的知识,而感性知识和经验是通过实验、观察、搜集资料等方式得到的。感性知识和经验是活生生的现象和事实,无论是通过实验或观察现象或搜集资料,其对象都具有客观性,都是客观存在的,由此得出的结论或者获得的知识便具有可靠性,这不同于演绎主义通过演绎推理得到结论的方法。归纳主义反对单纯依靠思辨的方法提出各种结论,而主张依靠实验、观察的手段获取知识。
第二,归纳主义把归纳法作为发现规律和建立理论的基本方法,但是这里的归纳法并不同于人们通常理解的简单枚举。归纳主义的归纳法有着自己特有的规则和方式,即归纳主义的实验和观察并不是简单、机械地观察客观事物和现象,而是运用人脑的思维与理智,为了更好地获得事物的本质属性而对观察与实验的方式等进行合理有效地安排。
第三,归纳主义要求人们在观察、实验之前必须摒除头脑中的一切先入为主的思想即被培根称为“幻相”或“虚妄观念”的东西,具体包括四种幻相:部落幻相、洞穴幻相、市场幻相、剧场幻相[4]。因为预先已经存在于人头脑中的观点或者见解会让人们在观察客观事实时带有偏见,已经存在的思想会干扰、影响客观事物的观察,从而得出不客观甚至不正确的结论。因此,归纳主义反对在进行观察、实验之前对观察对象做出任何预先的判断,而主张通过不带有任何偏见的观察所得到的认识,认为只有这样的认识才能如实反映客观事物的本质。
第四,归纳主义认为要建立正确的科学理论必须要了解事物的属性以及发现现象之间的因果关系,其观察、实验的目的也正在于此。换言之,人们在观察客观事物和现象时,要有目的性,目的就是要深入了解事物的属性或成因以及努力发现众多现象之间存在或可能存在的因果联系。只有这样,才能建立经得起客观事实检验的科学理论,才能获得理性可靠的知识。因此,归纳主义主张探寻事物的因果关系,从而得到更为正确的结论。
(三)归纳主义的缺陷
归纳主义的存在魅力让经验主义者坚定不移地以归纳法来形成公理、获取知识。然而,演绎思想家和逻辑主义者以及很多现代方法论学者却不赞同经验主义者的观点,他们对归纳主义提出了种种怀疑与批评,主要表现在运用归纳方法进行推理得出的结论具有或然性,也即结论的可靠性或真实性问题,这正是归纳主义方法的缺陷。
首先,归纳主义通过观察有限的客观事物和现象来获得的结论本身就具有或然性。世界上的事物和现象多种多样,与观察目的相关的事物和现象也可能非常巨大甚至无限多。但人们却无法获得全部的相关事物和现象,原因可能是有些事物没有出现,更多的可能是因为获取技术手段的限制从而无法获得所需要的全部事物与现象。归纳主义的公式是:如果A1是红色的、A2是红色的、A3也是红色的,由此归纳得出所有的A都是红色的。这其中就存在问题,A1、A2、A3是红色,如果A4是绿色的,那么“所有的A都是红色的”结论就不正确了,而这个A4刚好就是人们没有观察到的现象或者没有搜集到的资料。因此,这样归纳得出的结论是具有或然性的。
其次,归纳主义强调通过观察客观事物和现象来获得公理与知识,而且归纳法认为自己并不同于简单的枚举,在观察和实验的时候也会利用人的思维和理智对观察和实验的方式进行合理有效的安排。但是,我们都知道,世界纷繁复杂,万事万物的表现形式不拘一格,许多表面的事实和现象可能并不真实或者说只是一种假象。如果将公理建立在这样一种事实和现象的基础上,将难以想象其结果和影响的可怕与荒谬。因此,归纳主义虽然对其观察和实验的方法有过思考,但其终究是将知识的获取建立在资料的堆积之上,从而得出结论。这种思想方法有其致命的缺陷,而缺陷的根源在于忽视了思维规律的作用。其实,外部世界的事实及其规律并非都可以运用感官观察和感受到,在经济学领域这一问题尤为突出,经济学领域中有许多以“关系”为基本特征的客观事物不可能通过感官直觉来认识而必须借助思维逻辑的推理。所以,归纳主义虽然意识到思维对存在的依赖性,承认思维与存在的同一性,但却没有认识到思维也具有自身的活动规律。由此得出的结论或者获取的知识是否缺乏可靠性呢?
再次,归纳主义要求人们在观察与实验之前要完全摒除已经存在大脑中的观点和见解,只有这样才能不带任何偏见地去观察、实验,也只有这样不带偏见地观察与实验才能获得客观而正确的结论。如此“摒弃先入为主的观念”现实中是否可行呢?在人的大脑中所形成的观念和思想,它们已经存在于人的意识中,并且会不自觉地影响人们后来的行为与思想,所以,首先从现实的角度来看,这种“摒弃先入为主的观念”的提法就不够正确。再有,归纳主义主张对事物和现象进行观察从而得出结论,而世界上的事物和现象纷繁众多,人们该选择哪些事物和现象进行观察和实验?当然是选择与目的有关的事物和现象,在这里就有一个价值判断问题,如何辨别哪些事物和现象是与目的有关的?此时就需要借助于人脑中已经存在的知识和观念了,通过已有的知识和观念才能更好地判断与目的有关的对象,以确定观察与实验的范围。可见从效用的角度来看,“摒弃先入为主的观念”也不明智。正确地理解应该是我们在得出结论时要避免来自主观判断的干扰,而是根据客观事实和现象进行分析归纳。如果摒弃所有预先存在于大脑中的观点见解,势必无法获得正确可靠的结论。
最后,归纳主义认为人们观察和实验的目的是找到事物的属性和发现现象与现象之间的因果关系,认为只有这样才能得出更为正确的结论。当然,如果仅仅通过观察和实验就能轻易找到事物的属性以及能够发现现象之间的因果联系自然有利于归纳分析得出正确的结论,但是,事物的属性是事物本质性的东西,现象之间的因果联系更是隐藏在现象背后的规律性,仅仅通过归纳主义所主张的观察、实验是无法获知的。因此,方法在这里就具有目的的不能性。另外,就算通过观察、实验能够获知事物的属性与发现现象之间的因果联系,这个观察和实验的过程也应该是漫长而艰辛的。而且,笔者认为,并不是所有的公理或者结论都必须通过分析事物之间的因果关系而获得,有时候结论与因果关系无关或关联甚微,这种情况下得出的结论甚至可能会受到无关因果关系的影响从而影响结论的正确性。如果是这样,那么如此费时费力地去探究事物的属性与挖掘现象之间的因果关系是否也不是如此必需?
特别要强调的是,这里所提出的缺陷是在小数据时代的归纳主义所表现出来的不足。什么是小数据时代?它是指我们已经经历过的那个信息严重缺乏,只能拥有随机样本、只关注精确性和因果关系的时代。小数据时代信息残缺不全,因为人们不具备获取全部信息的手段,这对科学研究是一个巨大的阻碍与无法克服的瓶颈。但是,我们非常幸运,因为我们已经迎来了一个崭新的时代、一个充满诱惑与挑战的时代——大数据时代。
二、大数据时代的特征及其思维变革
(一)大数据时代的特征
大数据时代,是指一个拥有大量数据的时代。其特点通常用四个V来表述[5],即量大(Volume)、多样(Variety)、迅捷(Velocity)、有价(Value)。量大是指大数据时代拥有无限多的数据,即拥有海量数据,如此大量数据的获得是与当前先进的信息处理技术相关联的,即云计算。有了先进的云处理技术,庞大量的数据可以轻易被存储、被处理,这在小数据时代是不可能的。多样是指大数据时代的信息各种各样,种类繁多。同样由于云处理技术的兴起,使得人们可以去挖掘更多丰富多样的数据,并对种类多样的数据信息进行存储与处理,在小数据时代存储与处理如此丰富种类的数据也是不可能的。迅捷是指大数据时代信息传播的速度之快,信息几乎实现了同时共享,只要你需要,可以随时通过百度、搜狗等去寻找自己想要的信息。而这在小数据时代则不可能,小数据时代的信息具有强烈的地域性,某个区域的信息要想传播到另一个区域需要很长的时间甚至不可能。不能实现信息的共享会给人们的生活带来非常大的不便。有价是指大数据时代的信息拥有巨大的价值,当然任何时代的信息都会有价值,但大数据时代的信息由于能够大量存储并进行处理从而体现不一样的巨大价值。而且,随着信息的不断传播与共享,信息的价值并不会贬值,但是在小数据时代由于信息不能及时传播与共享,便可能使人们需要的信息不能及时获得从而让信息没有体现其应有的价值。
(二)大数据时代的变革
大数据的量大、多样、迅捷、有价的特点无疑让我们这个时代与小数据时代相比具有了翻天覆地的变化,大数据深刻地影响着人们的思维、工作和生活,而且这种影响将越来越大,甚而可被称为一场技术革命。大数据是一场新技术革命,即将彻底改变我们的世界观、生产方式、生活方式和思维模式[6-7]。大数据时代的变革体现在其所带来的思维变革、商业变革及管理变革上[8]。思维变革是人们大脑思维方式的改变,大数据时代给人们带来的思维变革主要表现在三方面:首先,大数据时代由于能够拥有大量甚至全部的数据,所以在科学研究中,人们所获得的不再是小数据时代以随机抽样的方式得到的随机样本,而是全体数据。全体数据与小数据的差别就在于大数据时代可以让数据自己“发声”,因为海量的数据几乎囊括了所有相关信息,所以,让数据自己“发声”便找到了可靠的依据。其次,大数据时代要学会接受混杂性而不是精确性,注重精确性是信息缺乏时代的产物,如果不接受精确性,将无法利用大量的非结构化数据。庞大的数据库,包括结构与非结构的信息,包括相关与不相关的信息,甚至包括错误的信息,首先我们要允许它们的存在或者说接受它们,当然我们同时需要学会与各种各样的混乱与错误作斗争。再次,大数据时代重视相关关系而不再是因果关系。面对海量的数据信息,我们只需要知道“是什么”,不需要知道“为什么”。在小数据时代,人们总是探究现象背后的原因,这既费时而且有时候也不必要。大数据时代来临,面对如此大量的数据信息,人们只需要知道这些信息是什么,而无需去挖掘信息背后的原因,因为大量数据的真实存在,会让数据自己“发声”,数据会“告诉”我们正确的结论。此外,大数据时代也引发了商业上的变革以及管理上的变革。简言之,商业的变革主要体现在世界可以数据化即一切皆可量化,数据具有巨大的价值且取之不尽用之不竭,由此而形成了数据技术与思维的三足鼎立状态。管理变革主要表现在:由于世界已经数据化,所以人们开始意识到让数据掌控一切的隐忧,由此应该在自由享用大量信息的同时承担应有的责任,让大数据真正发挥其所长避其所短。大数据给人类社会带来的变化是巨大的也是多方面的,它深刻地影响着社会生活的方方面面,甚至某个细微之处,比如影响某个学科,某个方法等等。那么,大数据时代的来临,对传统的归纳主义方法会有怎样的影响呢?
三、大数据对归纳主义方法论的影响
大数据时代的来临,人们开始能够拥有大量的数据,甚至样本等于总体的数据,人们开始习惯让数据自己“发声”;而且由于数据的复杂多样,大数据时代的人们开始接受混杂的数据,而不再如从前一样对数据作精确的要求;此外,同样由于数据数量与种类的繁多,人们开始不关注数据背后的因果关系而注重相关关系,也就是只需要知道信息“是什么”而不需要知道“为什么”。这是大数据带给人们的思维变革,这一场技术革命,让我们对社会各种事物与现象开始反思,正如此文所旨,大数据时代对归纳主义方法论也应该有一个重新的思考。基于归纳主义的特征及其缺陷,笔者将从大数据时代给人们带来的三大思维变革谈谈大数据时代对归纳主义方法的几点重新认识或思考。
(一)基于全体数据的归纳主义
小数据时代运用归纳主义方法所得出的结论的或然性,是由于小数据时代数据的有限性,导致人们无法获得进行研究所需要的更多或全部信息,因此其所得出的结论自然具有或然性。而大数据时代的来临,数据风起云涌、铺天盖地,人们只需要在某个搜索软件输入一个主题,相关的信息便几乎囊括其中,再加上先进的数据处理技术,比如云计算,这些庞大海量的数据能够得到规范有序的处理,进而做出科学正确的判断。正是因为大数据时代数据无限大量,加上先进的数据处理技术,人们在使用归纳主义方法时能够面对大量甚至是全部的数据,经过分析综合,所得出的结论比小数据时代拥有了更高的正确性,或者说大数据时代运用归纳主义方法所得出的结论比小数据时代降低了结论的或然性。
小数据时代的方法论学者曾批评归纳主义所提出的“摒弃先入为主的观念”,认为去除观察者已经存在大脑中的观点和见解不可能也不必要,所以小数据时代的归纳主义方法在这一点上受到质疑,大数据时代的来临已经改变这种局面。如前所述,在大数据时代,人们可以获得所需要的大量甚至全部数据,每一个相关的数据都可以提供给我们有用的信息,人们只需要分析这些数据传递的信息,再依此得出结论。这种归纳的思想方法反而要求人们的大脑确实不能预先存在已有的观念,因为,干净空白的大脑是最客观的,置于我们面前的数据才是最真实可靠的,由此得出的结论才不会有任何主观的因素干扰,而体现结论的正确性和客观性。因此,传统归纳主义所主张的“摒弃先入为主的观念”在大数据时代似乎找到了存在的理由。
(二)基于混杂性的归纳主义
小数据时代运用归纳主义方法所得出的结论是基于对经验和资料的简单累积,由于观察对象的有限以及现象本身的多样性,所以,如果只是机械地从有限的资料集合归纳得出结论会让结论不够真实或正确,因此那个时候的人们认为应该充分发挥人的思维主动性,注重思维本身存在的独有规律。如今,大数据时代的背景不一样了,除了无限多样、无限种类的数据都可以获得之外,人们不再关注精确性而接受混杂性。大数据时代的人们要允许不精确数据的存在,要学会拥抱混杂多样的数据。人们认为纷繁复杂的数据越多越好,因为无论是怎样的信息,错误的或者正确的,都有可能提供给你不一样的信息,人们只需要分析综合所有的信息便可获得正确的结论。因此,曾经人们认为归纳主义缺乏思维主动性时,在大数据时代人们接受混杂性而非精确性的今天,人们不再需要深刻地去思考更深的内容,而只需要接受各种数据然后进行分析综合。由此可见,大数据时代的到来在归纳主义方法的运用中对思维主动性的要求似乎不如从前那般程度了。
(三)基于相关关系的归纳主义
小数据时代的归纳主义方法主张挖掘事物的属性和现象之间的因果关系,认为只有这样深刻地探究才能归纳得出正确的结论,或者说小数据时代的归纳主义是非常注重事物或现象之间的因果关系的。大数据时代的到来完全改变了这一状况,大数据时代只注重相关关系而不注重因果关系,人们只需要知道“是什么”,而不需要知道“为什么”,或者说“为什么”是更进一步的一个问题。大数据时代,面对纷繁复杂的海量数据,人们只需要找到事物之间的相关关系,并不需要探究事物背后的因果关系。因为相关关系就能告诉我们所想要的结论,在这里,因果关系显得有些多余和累赘。因此,在大数据时代的归纳主义方法相比从前似乎更简单了,不必追寻因果关系,只要知道相关关系。
由上可见,大数据时代的归纳主义方法在其内涵与运用上确实发生了变化,这正是大数据对归纳主义的影响。大数据时代的归纳主义虽然还是同样的观察、实验与分析、综合,却在其思维过程与结果上发生了变化。大数据时代的归纳主义方法面对全体数据所得到的结论的或然性无限降低了,以及传统的归纳主义所主张的“摒弃先入为主的观念”在大数据时代找到了存在的合理理由;大数据时代的归纳主义方法允许、接受混杂性而不注重精确性对传统的归纳主义方法没有强调思维的主动性及其规律的独立性似乎给予了一种默认的支持;大数据时代的归纳主义方法强调相关关系不关注因果关系对传统的归纳主义重视探究事实与现象的因果关系是一种进步与革新,因为方法变得更简单容易了。
四、结语
任何方法都不可能完美,无论是小数据时代的归纳主义还是大数据时代的归纳主义,都仍然有其优点和缺点。本文并非意在指出大数据时代的归纳主义相比小数据时代有任何先进之处,只是身处大数据时代引发了一些对归纳主义方法论的重新思考,以期人们能更好地运用方法去解决问题。
[参考文献]
[1][瑞士]J·M·鲍亨斯基.当代思维方法[M].上海:上海人民出版社,1987:9.
[2][苏联]罗森塔尔,尤金,主编.简明哲学辞典[M].北京:人民出版社,1955:61.
[3]韦诚.方法学——科学发现的理论基础[M].安徽:安徽大学出版社,2008:17.
[4]张俊山.经济学方法论[M].天津:南开大学出版社, 2003:28.
[5]Zikopoulos P C .Understanding Big Data[M].New York:McGraw Hill,2013:5-9.
[6]黄欣荣.从复杂性科学到大数据技术[J].长沙理工大学学报(社会科学版),2014(2):5-9.
[7]黄欣荣.大数据的语义、特征与本质[J].长沙理工大学学报(社会科学版),2015(6):5-11.
[8][英]V·M-舍恩伯格,[英]K.库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:59.
Change of the Big Data Thinking and Inductive Methodology
YUAN Hai-ying
(School of Marxism,Jiangxi University of Finance and Economics,Jiangxi,Nanchang 330013 China)
Abstract:Inductive methodology has a great role in the history of Western scientific methods.With the advent of the era of big data,people's thinking changed profoundly.At the same time,it affected the induction theory.On the basis of reviewing the characteristics and defects of the traditional inductive method,and combining with characteristics of thinking change in the era of big data,the this paper discussed the impact of big data thinking on the inductive methodology.
Key words:big data thinking;induction;methodology;reform
作者简介:袁海瑛(1977-),女,江西奉新人,博士研究生,研究方向为经济学方法论、大数据经济学等。
基金项目:江西省政府2015年度创新专项资金项目(YC2015-B059)阶段性成果
收稿日期:2016-01-17
DOI:10.16573/j.cnki.1672-934x.2016.02.004
[中图分类号]N03
[文献标志码]A
[文章编号]1672-934X(2016)02-0026-06