从语言转向到数据转向: 科学认知的新变革
2021-08-27黄欣荣
〔摘要〕 20世纪被称为分析哲学的世纪,它用逻辑方法对语言进行了逻辑分析并由此形成了分析哲学、语言哲学,实现了科学认知的语言转向。然而,由于缺少可计算的方法工具,语言转向遇到了种种困难。随着大数据时代的来临,数据成为比自然语言更加精准的科学语言,它比逻辑语言更加方便描述、建模、计算,分析哲学和语言哲学难以实现的学术愿景有可能由数据哲学来实现,从而带来一场从语言到数据、从逻辑到算法、从分析到综合、从证明到发现、从因果到相关的科学认知数据转向。
〔关键词〕 科学认知,语言转向,数据转向,数据哲学
〔中图分类号〕N03 〔文献标识码〕A 〔文章编号〕1004-4175(2021)02-0032-08
20世纪的认知研究色彩纷呈、精彩不断,各种流派轮番登场,但不少哲学家还是将其称为“分析哲学时代”,并把语言转向看作是20世纪认知研究特别是科学认知方向的重大转变 〔1 〕5。由于数理逻辑的兴起和应用,20世纪认知研究的语言转向带来了认知研究语言更加严谨、明确,更加符合逻辑规范,并因此开辟了分析哲学、语言哲学等认知研究新领域。但是,经过近一个世纪的发展,语言转向并没有实现当初的学术愿景,分析哲学家对形而上学语言的逻辑分析和逻辑重构难以进行,语言哲学家对自然语言的逻辑分析又让自然语言支离破碎,因此20世纪的语言转向虽然取得了不少成绩,但最后基本上都以逐渐衰落而告终 〔2 〕20。
21世纪20年代,距离提出分析哲学和语言转向整整100年,我们的时代已经进入了以互联网、大数据、人工智能为代表的新一代信息革命时代。在这场信息革命中,数据化成了信息革命的重要手段,数据成为人们关注的热点。21世纪的科学认知向何处去?是否会像20世纪初因为数理逻辑的兴起而发生语言转向一样,科学认知即将发生数据转向呢?科学认知如果发生数据转向,它又将转向何处呢?本文试图在比对20世纪初发生的科学认知语言转向的基础上提出21世纪发生数据转向的可能性、必要性,并从五个维度对数据转向进行初步的探讨。
一、20世纪认知研究的困境与语言转向
20世纪初那场认知研究的语言转向,现在仍然被哲学家们津津乐道。那次语言转向是如何发生的?哲学家们为何突然关注上语言?哲学家们又如何来关注语言?语言转向给20世纪的哲学带来了什么样的影响呢?我们将从20世纪初的哲学认知困境说起。
(一)20世纪初认知研究的困境
哲学具有两千多年的悠久历史,并取得了令人瞩目的成就。然而,随着近代科学的兴起,科学技术取得了令人瞩目的高速发展,连续发生了两次科学革命并带来了技术革命和产业革命。特别是19世纪末20世纪初的世纪转折时期,作为自然科学代表的物理学同时发生了相对论、量子力学革命,并由此带来了激动人心的现代科学时代。然而,作为传统哲学的形而上学却依然故我,迈着自身固有的蹒跚步伐。与生机勃勃、充满活力的科学技术相比,古老的哲学显得老态龙钟。一些具有科学功底的哲学家们开始反思:数千年历史的哲学为什么总是重复昨天的故事,不能像科学一样迈开步伐快速前进呢?哲学为什么会没有多少进步呢?这些问题久久地困扰着20世纪初的哲学家们 〔3 〕1-2。
哲学家们发现,自古希腊开始,数学、力学虽然与哲学不分家,但它们更注重逻辑的力量。例如欧几里得几何学就是从五个公理出发一步步进行逻辑推演而形成整个几何学体系,阿基米德的浮力定律则通过观察和实验,再进行一步步的逻辑推演。自文艺复兴之后,以天文学、力学为代表的自然科学更是逐渐摆脱了传统形而上学的纯思辨方法,走向观察、实验和数学描述,特别是每一门学科都会对其基本概念的含义进行预先的约定,并对其基本假设进行符号化、公理化然后进行严密的逻辑推演。例如伟大的科学家牛顿就是将观察数据和数学方法有机结合,在数据、符号的基础上建构严密的学科逻辑体系。所以,自然科学可以在前人的基础上不断前进,无需回头。与此相反,哲学家们则一直用日常生活的自然语言来表达自己的复杂思想,而且很少进行约定和规范,更不用实验、数据、符号和数学,仅仅凭着日常语言来阐述自己高深的理论。因此,每一个人都可以对他的思想进行不同的理解和解释,从而产生诸多的分歧。更为重要的是,自然科学数据化、符号化和逻辑化的科学语言在传递过程中不容易产生信息失真,而哲学家所用的自然语言则失真严重,经过几个人的转述就可能变得面目全非,所以哲学家要不断地回到最原始的哲学文本,而科学家则可以勇往直前而无需担心信息在传递中的失真问题。
哲学家们发现,古代哲学把中心放在探索“世界是什么”的本体论问题有点大而无当,因为缺少认识工具的支持,我们很难说清楚世界究竟是什么,因此近代哲学发生了认识论转向这一重大的哲学方向的转变,近代哲学的研究重点转向了认识论。哲学转向认识论之后,人类对自身如何认识世界、认识自己有了更深刻的反思,认识论也有了许许多多的理论和学派,但与自然科学的快速进步相比,哲学仍然进步不大。就认识论来说,认识论虽然比本体论更抓住了问题的本质,但人类认识世界必然要有合适的认识工具,其中无论是认识世界的理论工具还是认识世界的理论成果都需要有合适的表述工具,这样才能够更好地描述认识的成果。自然科学找到了自己的科学语言工具,而哲学却缺乏自己独特的表述工具因而只能用多义的自然语言。因此,20世纪初的哲学家们终于找到了哲学停步不前的问题症结是语言工具问题,而数理逻辑的兴起为哲学家们解决语言工具问题带来了曙光。
(二)数理逻辑的兴起与分析哲学运动
19世纪末20世纪初,除了轰轰烈烈的物理学革命之外,数学界和逻辑学界也发生了一场类似的革命,即数理逻辑的兴起。19世纪末,数学家们都在寻找数学的基础问题,也就是说,数学学科到19世纪末已经取得了巨大成就,但庞大的数学大厦却一直没有找到自己的学科基础。庞大的数学大厦究竟建构在什么基础之上呢?这关涉到数学大厦是否牢固并且能否继续往上添砖加瓦的问题。与此同时,逻辑学家发现,逻辑学从古希腊的亚里士多德开始经历了两千多年,却一直停留在用自然语言表述的三段论上。逻辑学是否也可以像数学和自然科学一样实现符号化?这是逻辑学家开始思考的问题。數学家弗雷格发现,数学学科的基础问题最终是逻辑问题,但传统的自然语言表述的逻辑无法表达以形式化为标志的数学问题,于是弗雷格将数学的形式化方法应用于传统逻辑的改造中,即把自然语言表述的逻辑进行形式化、符号化,创造了完全符号化的数理逻辑。数理逻辑的创建具有极其重要的意义,一方面让语言逻辑变成了符号逻辑,实现了逻辑的符号化,另一方面解决了数学学科的基础问题,即把数学的基础问题转换成了数理逻辑问题,例如数学家、哲学家罗素与怀德海一起出版的《数学原理》就是试图把整个数学王国建构在数理逻辑的基础上。20世纪初,数理逻辑成了数学和逻辑学两个学科的研究热点,它让两千多年没有根本变化的亚里斯多德逻辑学发生了革命性变革。
数理逻辑的兴起,让哲学家们发现了近代科学快速发展的秘密,即近代科学之所以能够突飞猛进,就是因为科学家们完全遵循了符号化、逻辑化的方法,使用的是结构化语言,从而把科学思想表述得清楚、明白,在传播过程中不会发生思想信息的失真、衰变。哲学之所以发展缓慢,而且要不断回到原点,就是因为没有能够保真的思想传递工具。于是,近代哲学从重点关注认识论,再次转向关注语言问题,因为任何哲学思想的表达都离不开语言,即没有语言,任何哲学思想都无法得到表述,更不可能得到传递。最初,罗素、维特根斯坦和逻辑经验主义的哲学家们试图用数理逻辑构造一种完全形式化、符号化的人工语言,即数理逻辑语言来改造哲学家们使用了数千年的自然语言。逻辑经验主义甚至提出让物理学家来当语文老师的主张,因为传统的语文老师不懂自然科学、不懂数理逻辑,教出的都是说话朦胧、充满诗意的学生。卡尔纳普更是用数理逻辑来推演整个世界,提出世界的逻辑构造思想。这个阶段的哲学家们虽然关注语言,认识到语言的极端重要性,但他们更希望彻底改造自然语言,让所有哲学家甚至所有人都用清晰、明确、可推演的数理逻辑语言,并且把所有复杂的事物、思想分解为清楚明白、没有歧义的简单命题,因此这个时期的哲学被称为分析哲学。分析哲学没有统一的学派标准,但他们具有家族相似性,即他们都以语言为对象,逻辑为工具,分析为手段 〔3 〕8-9。作为一场哲学运动,分析哲学从20世纪20年代开始影响了世界认知研究数十年,至今依然有其声音。
(三)20世纪认知研究的语言转向
20世纪50年代前后,分析哲学遇到了各种问题,难以实现世界的逻辑重构目标,于是在英国兴起了日常語言学派,他们开始用数理逻辑方法来分析日常语言,以便让哲学家和大众在使用日常语言的过程中能够更加遵循逻辑规范。更为重要的是,哲学家们开始更加关注语言,用逻辑、分析的方法来精细地分析词汇、语句、语法等,以便让哲学家们和大众能够把事物和思想表述得更加清楚明白,更能够进行推理、分析。牛津日常语言学派正是这个时期的代表,随后发展为具有较大影响的语言哲学学派,而且从此语言哲学成为认知研究,特别是英美认知研究的重点 〔4 〕125。
分析哲学的兴起和语言哲学的发展意味着语言成为认知研究的核心,也就是说从古希腊哲学关注世界的本体到近代哲学关注认识之后,哲学再一次发生了研究重点的革命性转变,前者被称为认识转向,而后者被称为语言转向。语言转向从什么时候开始的呢?有人说发生在20世纪20年代分析哲学兴起之时,也有人说是发生在20世纪60年代语言哲学兴起之时,更有学者认为发生在弗雷格创建数理逻辑之时或维特根斯坦出版其《逻辑哲学论》之时 〔4 〕14-16。不过虽然具体时间难以统一,但从弗雷格开始,语言就进入了哲学关注的视野,因为认识论必然需要语言来描述对象、分析问题、预测未来,语言转向是认识转向的细化和实现。语言转向的特征表现为语言成为哲学的重点关注对象,逻辑成为重要的描述方法,而分析成了重要的径路。语言转向的结果带来了20世纪的分析哲学运动和语言哲学的诞生。逻辑、语言、分析成为20世纪哲学最重要的三个关键词。
二、21世纪认知研究的困境与数据哲学的兴起
21世纪,作为时代精神精华的哲学,在新时代该有怎样的变革呢?是继续20世纪的分析哲学和语言哲学之路,还是该有自己的方向性转变呢?21世纪初是否又出现了类似20世纪初的时代背景和认知转向的可能性?如果即将转向,又将转向何处?为此,我们先从21世纪初认知研究的困境和大数据时代的来临开始。
(一)认知研究的新时代困境
20世纪初哲学的语言转向与分析哲学、语言哲学的兴起,虽然当初雄心勃勃,而且产生了巨大的影响,但最后并没有实现他们的初心。分析哲学开始于20世纪初,强盛于20-40年代,后来很快发现哲学语言和日常语言并不能完全被人工构造的数理逻辑语言所取代,因此当初逻辑经验主义所主张的“让物理老师教语文”并不现实。也就是说,人们在日常生活中以及在认知研究中都不可能放弃具有数千年历史的自然语言而改用完全符号化的数理逻辑语言。
20世纪50年代后,哲学家们不再用数理逻辑来改造自然语言,而是对自然语言进行逻辑分析,以帮助自然语言更加正确、精准。也就是说,不再用数理逻辑对自然语言进行全面的符号化和逻辑推理,而是在尊重自然语言的基础上进行逻辑分解和分析,以便找到自然语言的规律,并对其作适当的规范性改造,由此语言转向进入语言哲学研究。语言哲学的本质是将自然语言映射为逻辑语言,从而通过对逻辑语言的分析来研究自然语言的规律。语言哲学虽然对语言的规范性、精准性作出了重要贡献,但同时也把自然语言弄得支离破碎,以至于让人感觉自然语言不再自然。20世纪80年代开始,语言哲学开始走上了下坡路,当初的学术愿景也没有彻底实现 〔3 〕5。
由此可见,20世纪以分哲学与语言哲学为代表的语言转向虽然在20世纪影响巨大,曾经被称为“哲学中的革命”,但这次语言转向没有取得预期的成功,并在20世纪就已经走向衰落,认知研究再一次失去了重大方向的引领。因此,分析哲学、语言哲学不可能是21世纪认知研究的主流,21世纪的哲学必须在跟随其时代的发展再次开启新的转向。
(二)数据革命与大数据时代的来临
自从文艺复兴以来科学技术逐渐成为引领时代发展的方向标和推动力,20世纪认知研究的语言转向也是由于当时数理逻辑的兴起而引发的。21世纪初的20年,科学技术发生了什么重大变革呢?20世纪到21世纪的世纪之交,没有发生19世纪到20世纪的世纪之交那激动人心的科学革命,但在技术上却比上个世纪之交还更加激动人心。生物技术、量子技术、网络技术、智能技术等一系列技术都正在发生着革命。有人用不同的名称来描述新世纪这场革命,但这一切革命都建立在数据革命的基础上,因此用数据革命来概括可能更加合适。
20世纪中叶开始的信息革命为21世纪的数据革命做好了充分的准备,所以这场数据革命也被称为新一代信息革命。二战结束后的信息论和电子数字计算机分别从科学和技术两个方面迈开了信息革命的步伐。信息论的创立让以往难以认知的信息进入了科学研究的视野,而数字电子计算机的发明更是将信息彻底表征为机器能够处理的0和1两个符号的数据集合,实现了数据的机器自动处理。随后的感知技术、网络技术、存储技术和智能技术等一系列的技术创新为数据采集、存储、传输和处理的革命性变革。进入21世纪后,移动互联网、智能手机、物联网、网络社交等一系列新技术更是让数据规模迅速飙升,于是带来了前所未有的大数据时代。
(三)数据成为新时代关注的热点
大数据是21世纪一系列新技术革命的结果,同时又是引发一系列新技术革命的动因。在大数据时代,数据无疑成了这个时代的标志和主角,因此也就成了一系列学科关注的热点。数据在过去主要是指由数字和计量单位一起构成的对事物的量化描述,在人类对世界的量化认识中起着重要的作用,因此人们对其并不陌生。为什么它就成了21世纪关注的新热点呢?
首先,随着数字化技术的发展,数据的规模发生了重大变化。过去的数据主要依靠人工采集,但上世纪中叶电子技术的发展特别是计算機技术的发展,带来了数据采集、存储、传输和计算方式的重大变化,由此出现了数据“爆炸”并带来了大数据时代 〔5 〕9-10。21世纪开始,数据成了一种新资源,一种新现象。无论是互联网、物联网、人工智能还是区块链,几乎所有的新技术都建立在大数据的基础上,数据成了刻画世界和认识世界的新手段。
其次,随着数字化技术的发展,数据的性质发生了重大变化。信息论和控制论创始人维纳认为,世界由质料、能量和信息三要素构成,由此他和申农同时提出了信息论。信息的本质是对世界状态的映射或刻画,但过去我们却很难找到合适的信息表征方式。随着大数据时代的来临,人们发现世界的一切皆可数据化,即“万物皆数据” 〔5 〕123-126。过去对世界的描述分为定性和定量两种描述方式,而且这两种描述方式难以通约。大数据技术的发展让定性描述可以转化为定量描述,一切皆可量化,皆可由0和1两个符号表征并被计算机处理。
最后,随着数据化技术的发展,数据的地位发生了重大变化。人类认知世界其实就是通过感知世界的信息,通过信息的辨识来达到认知世界的状态,因此需要合适的工具和技术来表述人类对世界的认识过程和结果。语言、文字、逻辑符号等都是表述人类认知的重要工具。数据作为人类认知的工具,在以往只是其他认知工具的补充,特别是作为定量描述为定性描述作补充。但是,随着数字化技术的发展,万物皆可被数据化,万物皆可用数据来表述,这样,我们的语言、文字、声音、图像、符号等,一切都可以用数据来表征,一切都可还原为数据。于是,数据成为信息的最重要的表征工具,而且是一种通用的表达工具,即使是以往定性的表述也一样可以被数据化。所以,英国学者舍恩伯格说:“世界的本质就是数据” 〔5 〕125,而詹姆斯·格雷克也表达了同样的意思:“万物皆比特。” 〔6 〕7这样,数据就从描述世界的工具逐渐成为世界的本质,数据在21世纪的地位有了本质的变化。
(四)数据哲学研究的兴起
数据被哲学家关注,最早应该追溯到毕达哥拉斯,他在两千多年前就提出了“数是万物的本原”的观点。可惜接下来的两千多年,哲学家们似乎都遗忘了对数据的关注,虽然期间也有莱布尼兹这样的哲学家曾经对数据有所思考,但终究没有形成系统的数据哲学。
直到20世纪80年代,随着数字化技术和计算机技术的发展,数据的地位更加凸显之后,哲学家波根(J.Bogen)和伍德沃德(J.Woodward)才将目光投向数据,把数据作为描述现象的工具并奠定科学发现的基础,提出“数据—现象—理论”的科学发现模式 〔7 〕。计算机科学家吉姆·格雷则提出了基于海量数据的数据密集型科学发现新范式。2008年9月国际哲学界在德国海德堡召开了“数据·现象·理论”的国际研讨会,并于2011年在《综合》(Synthese)杂志上以专辑的形式发表了这次会议的26篇会议论文,由此哲学界开始将数据列入自己的研究议程中。
随着大数据时代的来临,国内外哲学界开始将目光转向了大数据的哲学研究。在国外,英国大数据专家舍恩伯格在其畅销书《大数据时代》中以通俗的语言开始了本体论、认识论、方法论和伦理学的一系列哲学思考,随后国外哲学界展开了对大数据的哲学研究。在国内,大数据一被提出,就有李德伟、刘红等学者开展了大数据的哲学研究。随后,黄欣荣、段伟文等一批中国学者对大数据的本体论、认识论、方法论和伦理学进行了全面深入的研究,特别是大数据伦理的研究更加热门和深入,由此大数据哲学成为科学技术哲学的重要研究方向。由此可见,目前国内外都有人提出了数据哲学的概念,国内是以数据哲学作为硕士论文或博士论文的选题,而国外则由哲学界之外的其他人提出了数据哲学的概念和设想。我们可以说,数据哲学研究正在开始兴起。
三、21世纪科学认知的数据转向
随着大数据革命的展开和大数据时代的来临,以及大数据哲学研究的深入和数据哲学的兴起,数据不但成了21世纪最为重要的资源,而且成了最为重要的认知工具。数据正在成为21世纪哲学研究的新对象,数据哲学正在成为哲学研究的新领域。由此我们发现,21世纪20年代的科学认知又像20世纪20年代的科学认知一样正面临着变革和转向重大机遇,即由上世纪的语言转向走向21世纪的数据转向。
20世纪的语言转向是以语言为对象,以逻辑为工具,以分析为方法的一次认知研究方向的重大转变。语言转向的重要表现有三个方面:从认知对象上来说,从研究世界到研究语言;从认知工具来说,从形式逻辑到数理逻辑;从认知方法来说,从思辨方法到分析方法。那么这次的数据转向会有什么样的表现呢?与上次的转向相类似,这次的数据转向主要表现为如下五个方面:从认知对象来说,将从语言转向数据;从认知工具来说,将从逻辑转向算法;从认知方法来说,将从分析转向综合;从认知目标来说,将从知识证明转向知识发现;从认知结果来看,将从追求因果转向追求相关。我们将从这五个方面来分析数据转向的重要表现,并从中可以看出数据转向是否可能。
(一)认知对象:从语言转向数据
作为爱智慧的哲学,曾经是科学及其他各种学科的母亲,但自文艺复兴以来,科学逐渐挣脱哲学母亲的怀抱,走上了一条高速发展的道路,于是科学反而成为了哲学学习的榜样。古代哲学代替科学直接探讨世界的构成、运作原理等,但它使用的是思辨方法,因此难于揭示世界的本质或规律。近代哲学家认识到,要知道世界是什么首先必须解决我们是怎样认识世界的,因此发生了认知研究的第一次大转向,即认识论转向。但科学的高速发展又启发哲学,要认识世界,首先必须解决认识工具问题,这样人类的认识才不会失真,于是哲学家们意识到必须研究语言问题,于是上世纪初又出现了语言转向问题。语言转向之后,哲学家们才发现,语言才是我们最需要研究的对象。但是,哲学有着自己的伟大使命和复杂理论,仅仅使用多义、多变的自然语言,许多问题都将在讨论中失真、变味,因此分析哲学、逻辑实证主义才想使用科学中已经取得重大成就的符号化数理逻辑语言。但后来的实践证明,逻辑化的道路是走不通的,于是回到自然语言的逻辑分析,并由此对自然语言进行逻辑规范。
认知研究的数据转向事实上仍然是语言转向的继续,但它从研究自然语言或逻辑语言转向为数据语言。以往哲学对世界的认知主要通过日常语言,但日常语言模糊、随意,表述能力有限,而且很难完全映射为逻辑语言。但大数据时代的数据语言则有自己的特点:精准、全面、多样、可算。所谓精准是指一切皆用0和1两个符号序列来表征,没有随意性;所谓全面是指数据语言的表现力更强,除了表述自然语言之外,它还可以表征语音、图像以及万物的其他各种状态;多样是指无论是定性还是定量、无论是结构化還是非结构化的语言,一切都可以转换成统一的数据语言;所谓可算是指数据语言可以输入智能计算设备,可建模可计算,实现数据处理自动化智能化。此外,数据语言在数据采集、存储、传输和应用等方面都比自然语言或逻辑语言更加方便快捷,并可实现智能化。
科学认知的语言转向只学到了科学超常发展经验的一个方面,科学的确首先要把认识结果用语言表述清楚,必须符合逻辑规律,这样才能确保认识结果客观真实,不至于在传递过程中失真变异,也才能保证从正确的前提推演出正确的结论,这就是构造性语言或结构化语言。但是,近现代科学之所以超常发展,还有一个重要秘密,那就是用数据说话,即数据化。无论是开普勒、伽利略还是牛顿,都是通过观测数据或受控实验获取数据之后,用数据来描述现象、寻找规律并预测未来的,所以数据在科学的快速发展中起了巨大的作用。逻辑表述和观察数据是科学发展的两条腿。语言转向,哲学家们发现了科学发展的一条腿,而数据转向则又发现了另一条腿。认知研究的语言转向到数据转向,都在试图找到科学这个榜样的发展秘密,并从用语言说话,到用逻辑说话再到用数据说话,人类认识的语言越来越严谨,越来越精准,从而越来越科学。
(二)认知工具:从逻辑转向算法
无论是科学认识还是哲学认识,除了需要合适的语言之外,还需要科学的工具。哲学的语言转向让哲学的重点放到了语言上,而且开始主要还是自然语言。从亚里士多德开始,人们说话就被要求符合逻辑,不能出现逻辑矛盾。因此,当我们试图从自然语言中找到规律时,逻辑就成了最佳科学工具。在语言转向之前,哲学家们也只能用形式逻辑对日常语言进行逻辑分析。因为缺乏必要的符号化,这种传统逻辑分析比较繁琐,而且难于实现符号化。正是19世纪末20世纪初数理逻辑的兴起为日常语言进行符号化的数理逻辑分析成为可能,也为日常语言的符号化和逻辑化提供了工具。
符号化的数理逻辑消除了自然语言的不确定性,带来了逻辑语言的确定性,而且具有更强的逻辑运算和推理能力。但是逻辑语言在一定程度上会改变自然语言,而且太强制太僵硬,难以对自然语言全面逻辑化。此外,对事物的逻辑描述特别麻烦,而且无法进行更加深入的各种计算操作,从而限制了逻辑语言的更广泛应用。
数据转向之后,数据成为关注的重点。对数据特别是大数据时代的海量数据如何进行分析?我们不可能再进行数理逻辑分析,必须使用新的科学工具,即算法分析。在大数据时代,对数据语言的算法分析将取代自然语言的逻辑分析,因此算法分析将成为数据转向之后认知研究的重要科学工具。从21世纪开始,各种智能设备的广泛应用带来了数据的爆炸性增长,面对这海量的数据,不可能对每个数据找到因果性,就像分子物理学无法对海量的分子做全面的因果性分析一样,我们只能找到海量数据所呈现出来的相关性,然后从相关性中发现一定的规律,并建立反映相关性的算法模型。
数理逻辑的兴起为哲学的语言转向准备了科学的分析工具,而数据算法的兴起则为哲学的数据转向准备了科学的分析工具。数据算法将成为数据分析最重要的科学工具,为我们从海量的数据中发现新知识、新规律提供了可能。
(三)认知方法:从分析转向综合
分析和综合是人类认识事物的两种基本方法。所谓分析就是将复杂的事物分解为简单的事物,将整体的事物分解为其构成部分或构成要素。正是通过这种分解,可以实现化繁为简,化整为零。所谓综合方法则与分析正好相反,它把零碎的、部分的要素按事物内在的规律有机地统一为一个整体,从而达到从整体的视野看问题的目的。
20世纪被称为分析的世纪,分析方法与语言转向被当作20世纪哲学的基本特征。20世纪认知研究实现语言转向之后,分析方法成为最重要的科学方法,可以说分析方法是实现语言转向的重要方法。正因如此,分析哲学成了20世纪的哲学主流。
虽然把复杂事物分解为部分、要素有利于我们更好地认识事物,但这种分解也有可能破坏事物的整体性和有机性。被分解为海量的碎片之后,我们怎样从中找到规律?我们如何重新组合为整体?特别是数据化技术把万物分解为海量的数据之后,分解、分析不再是问题,如何重新整合起来成了我们这个时代的重要任务。所以认知研究实现数据转向之后,其科学方法也将会发生重大转向,即从侧重于分析走向侧重于综合。从大数据的海量数据碎片中重新组装、复合为事物的整体是数据哲学的重点,从而也将是我们这个大数据时代的特色。如果说20世纪可称为分析的时代,那么我们也许可以将21世纪称为综合的时代,综合将成为21世纪的主旋律和主要认知方法特征。
(四)认知目标:从证明转向发现
知识发现和知识证明是人类认识的两个重要阶段,也是认识论的两个重要任务。知识发现解决知识的来源问题,是知识的发生和起源问题,即知识从“无”到“有”的问题。知识证明主要是解决知识的可靠性问题,即如何证明我们发现的知识是值得信任的,而且可以将这种信任传递下去,即知识从“有”到“有”的问题。
分析哲学和语言哲学都借助逻辑演绎来证明知识的可靠性,让我们已有的知识不至于在传递过程中由于信息失真而变得不可靠。正因如此,逻辑实证主义就利用演绎逻辑的必然性进行一步步推导,试图从可靠的逻辑基点出发推演出整个知识大厦。例如罗素和怀德海合作的《数学原理》就试图从可靠的数学公理出发利用演绎逻辑来建构出整个可靠的数学大厦。所以论证、证明、推演在分析哲学中占有绝对的地位,逻辑演绎成了语言转向后的主要方法,而知识证明成了分析哲学和语言哲学的主要目标。
但是,推理、证明无法发现新知识,而新知识的发现还得靠归纳、综合。数据哲学就是通过数据挖掘和数据算法,从海量数据中归纳、综合提炼出具有规律性的知识,它善于发现新知识。正因如此,数据挖掘最初就被命名为知识发现。由于归纳出来的知识没有绝对的可靠性,所以英国哲学家波普尔曾经极力反对归纳法,甚至扬言要把归纳法彻底赶走。但是,没有归纳,人类就不可能发现知识,最后只能像波普尔所说的靠猜想来乱猜测。21世纪数据转向之后的数据哲学将致力于从海量数据中发现各种各样的有用知识。虽然不一定具有绝对可靠性,但它具有实用性。人工智能最初就是利用逻辑演绎来实现了几何定理的机器证明,但由于逻辑演绎不能发现新知识,所以人工智能后来走向衰落。当前新一代人工智能就是利用大数据进行机器学习和知识发现,因此新一代人工智能才越来越聪明,显现出其勃勃生机。因此,21世纪,人类的认知目标将从知识证明转向知识发现,知识发现将是数据转向之后哲学关注的重点。
(五)认知结果:从因果转向相关
因果和相关是刻画两个事物之间关系的范畴,因果关系是具有必然性的关系,而相关性则指两者之间具有一定的关联,但未必具有必然的联系。因果性提供了绝对的可靠性,而相关性则不完全可靠,我们只能将信将疑。传统的认识论追求的就是这样确定无疑的因果性,认为知识的大厦就必须由具有因果性的各种知识来建构,这样才能值得相信。
分析哲学和语言哲学都希望借助于20世纪初刚刚兴起的数理逻辑来建立具有因果关系的严密知识体系,甚至能够像欧几里得几何学一样从公理出发,经过严密的因果关系来建立知识体系。例如逻辑实证主义代表鲁道夫·卡尔纳普就用严密的数理逻辑来重构世界,撰写了影响巨大的《世界的逻辑构造》。因果性是传统科学的基石,更是20世纪分析哲学的灵魂,因为分析哲学是建立在数理逻辑的基础上,而一切逻辑分析都是基于因果关系的。
大数据技术革命打破了因果性神话和因果性的终极追求。大数据认为“知道‘是什么就够了,没必要知道‘为什么。在大数据时代,我們不必非得知道现象背后的原因,而是要让数据自己‘发声” 〔5 〕67。相关关系通过识别有用的关联物来帮助我们分析现象,而不是通过揭示其内部的运作机制。通过海量数据和相关关系,人工智能可以实现快速的自我学习,发现相关性的规律,并对未来行为做出精准预测。由于数据的暴增,我们不可能找到每一个数据之间的因果关系,只能找到宏观的相关关系,而且只要有了相关关系就能够解决许多问题。因此,在大数据时代,我们不再偏执于追求因果关系,我们更重视的是数据之间的相关关系,相关性重于因果性。认知研究在数据转向之后,其认知结果的追求也将从追求因果性转向追求相关性。
总之,20世纪初数理逻辑的兴起引发了哲学的语言转向,兴起了影响整个20世纪的分析哲学运动,并带来了新的语言哲学。21世纪初,以互联网、大数据、人工智能等一系列新技术的出现带来了一场新一代信息技术革命,这场革命的核心是数据,数据语言成为世界流行的人机通用语言,“让数据说话”成了21世纪的流行语。数据革命带来了比自然语言、逻辑语言更精准、更丰富、可建模、可计算的数据语言,由此可能引发一场新的科学认知方向的大转变,即数据转向。数据转向是语言转向的再革命、再转向,同时也是其延续和发展,即对语言转向的克服和拓展。认知研究的数据转向将可能像上世纪的语言转向一样,即将掀起一场哲学的综合运动,并建构出内容更加丰富的数据哲学。21世纪哲学与20世纪哲学具有惊人的历史相似性,我们可能即将迎来科学认知的数据转向与数据哲学的兴起。
参考文献:
〔1〕M.怀特:分析的时代〔M〕.杜任之,译.北京:商务印书馆,1981.
〔2〕陈 波,江 怡.分析哲学——回顾与反省(上卷)〔C〕.北京:中国人民大学出版社,2018.
〔3〕江 怡.分析哲学教程〔M〕.北京:北京大学出版社,2009.
〔4〕王 路.走向分析哲学〔M〕.北京:中国人民大学出版社,2009.
〔5〕维克多·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代〔M〕.盛杨燕,周涛,译.杭州:浙江人民出版社,2013.
〔6〕詹姆斯·格雷克.信息简史〔M〕.高博,译.北京:人民邮电出版社,2013.
〔7〕Bogen J,Woodward J.Saving the phenomenal〔J〕.The Philosophical Review:303-352.
责任编辑 苏玉娟