知识的幻象:人工智能与知识变迁
2024-09-26刘大年曹月
关键词:人工智能;知识的定义;知识的来源;知识的分类
一、引言
“他们身处丰饶之中.却逐渐饥饿致死。”阿瑟·克拉克(Arthur C.Clarke)在《2001:太空漫游》中这样描述猿人的处境。猿人们身处物产丰饶的自然之中,但食物对它们来说“不只非能力所及,也非他们想象所及”这句话,也是对如今人类获取知识处境的描述。对今天的人来说,知识唾手可得:人们遇到问题可以直接用搜索引擎检索答案,还可以利用最新的人工智能技术,向ChatGPT等语言大模型提问,让人工智能生成对特定问题的回答。人们通达知识的手段越来越丰富、越来越便捷。然而,对人类来说,这是真正的有知吗?在算法、算力、数据三要素的支持下,人工智能获取知识的能力已经超过人类,在知识领域,人类好像又回到了荒野之中:人工智能给出的回答从哪里来?可靠性如何?会产生什么样的后果?知识的边界被人工智能拓展到了何方?许多问题的答案已经超出了人类能力和想象所及。
亨利·基辛格(Henry Kissinger)认为,人工智能“将改变我们作为理性生物的经验,并永久地改变我们与现实的关系”。随着社会整体被压人数据状态,人们当下所面对的是一种超真实,一种由数据构建的、无实体根源的真实。现实不再是一个客观的物理世界,而是变成了一系列由技术创造、维持并操纵的体验和感知。人们生活在拟真化社会之中,在真实消解的过程中,社会的历史性、否定性与公共性逐渐消失。
拟真化社会首先表现为超真实体系的产生与扩展,超真实将取消真实成为新的现实。在超真实环境中,符号形象大于事物本质,知识随之成为幻象。知识幻象首先表现为知识真实性的消解,涉及知识的生成、验证、传播和接受等各个环节。人工智能技术已经嵌入知识生产与传播的各个环节,而人类尚未完全把握技术自身的运作逻辑,技术在不断地塑造知识。由于技术运作的透明度问题,信息筛选与组合存在不可知性,算法黑箱之类的现象使得技术生成的知识的真实性难以确证。人工智能算法支持下的深度伪造技术,已经超越文本操纵,拓展至音视频领域,真假难辨的信息与知识充斥网络平台。然而,在知识验证阶段,人们依然依靠人工智能。大量人工智能系统被设计来辨识虚假信息和校验事实,它甚至被应用于专业学术领域。这相当于人工智能系统的自我校验,进一步增强了知识的不确定性。在知识传播的过程中,内嵌于其中的人工智能技术决定了哪些信息值得被关注,哪些应该被隐藏或忽视,进而逐渐改写了知识传播的逻辑和秩序。
人工智能开发的初衷,是要研发出一种像人一样思考的机器,让它完成人类所能完成的工作以及人类所不能完成的工作。在“完成人类所能完成的工作”方面,人工智能模仿人脑结构、模仿人类语言,开发者们还试图让人工智能从事“创作”:写作、绘画、摄影……人类还希望人工智能实现与人类的“价值对齐”,反对人工智能技术应用中存在的不平等现象。然而,人工智能的表现备受质疑,人工智能的创作呈现出一种对人类已有创作的“重组”或“穷举”。人类的偏见和人类的科学知识一样,被编码进了人工智能的数据库和训练集,人工智能表现出歧视而非平等的价值倾向。与此同时,人工智能在“完成人类所不能完成的工作”方面有所突破,在人类思维领域以外发现了新的知识域。我们需要重新思考人工智能对人类知识的影响。
二、什么是知识
(一)从古典到现代:知识的普遍性与确定性
人类寻求对知识的确证,知识的理想形态应当是可判断的:人们经过判断,得出对事物相对稳定的认识,这样的知识是确定的、可靠的。在知识论层面,知识的确定性原则并不是天然成立的。古希腊哲学家首先将知识的确定性问题作为讨论对象,在一代代哲学家的论述中,知识的确定性问题在不同层次和角度得以展开,知识的确定性原则不断得到论证。
1.知识是关于事物的普遍观念
在古希腊城邦,公开的辩论在公民事务中具有重要地位。智者教授修辞和辩论术,为追求辩论的胜利,智者的代表普罗泰戈拉(Protagoras)否认人具有关于众神是否存在的任何知识,宣称“人是万物的尺度”,这是在说万物的尺度是人的感觉,事物就是人感觉的那样,那么每个人的意见都是正确的,每个人都可以为自己的观点辩护。普罗泰戈拉的观点一方面促进了城邦的辩论活动,另一方面却走向了相对主义:事物没有确定的尺度,人的感觉怎样,事物就是怎样,人凭借感觉就可以获得知识。而不同的人有不同的感觉,那么究竟何种知识才是正确的?普遍性知识的问题开始出现,这也就是苏格拉底面对的问题。苏格拉底反对智者的相对主义感觉论,把雅典城邦的衰落归因于智者:“人是万物的尺度”消除了是非、善恶的界限。与教授诡辩术的智者一样,苏格拉底同样采取对话的形式来阐明自己的观点,但苏格拉底的对话往往以“是什么”为主题,如“什么是美”“什么是正义”“什么是勇敢”,等等。也就是说,苏格拉底追求的知识是关于某物的定义或概念,是使某事物成为该事物的本质规定,在此意义上的知识是具有确定性和普遍性的。在《泰阿泰德》中,柏拉图记载了苏格拉底和泰阿泰德的对话。苏格拉底向泰阿泰德提问“知识是什么”,泰阿泰德的第一次回答是几何学和制鞋术之类的学问和技艺。在《大希庇亚篇》中也有类似的情况,苏格拉底向希庇亚提问“美是什么”,希庇亚只能回答出“什么东西是美的”。“是什么”的问题就是要从关于具体事物的感性经验中提取出确定的普遍概念,人如果像智者一样仅有流动的感性意见,就无法形成真正的知识,这奠定了知识的基本形式。
苏格拉底确定了知识的形式,但没有对知识的定义作出规定,他的弟子柏拉图区分了信念和知识:信念介于知识与无知之间,是可真可伪的,知识是绝对真实的。他在《美诺篇》中提出真的、正确的信念,真信念和知识都是正确的,但两者不同,知识永远留在我们心上,真信念却不稳定,有时在我们心上出现了,有时又跑掉了,因此关键的问题是如何将真信念转变为知识。柏拉图的回答是通过“关于原因的推理”将前者“绑定下来”。由此,“得到证成的真信念”成为对知识的经典定义。也就是说,知识由信念、真与确证三个要素组成。这既是对知识确定性原则的强调,也是提供通达知识确定性的途径。“得到证成”在今天看来是容易理解的,现代科学有实验观测的方法,我们可以验证和判断某种信念的真伪。但柏拉图所述的“关于原因的推理”则有别于今天的一般理解,这种推理不是从外部世界的经验中得来的,而是天然就有的。柏拉图认为“整个自然是同类的”,可以通过逻辑推理由此及彼,认识它们普遍的“理念”。理念论划分出两个世界,引出了现象与本质、感性与理性、经验与超验等一系列知识论问题。
柏拉图将理念与事物分离所带来的一系列问题,被亚里士多德称为“分离问题”。亚里士多德认为不存在独立于事物之外的理念,知识建立在对可感世界的体验之上,要对事物本身进行观察和实践,这种获取知识的方法其实就是今天人们所熟悉的科学方法,亚里士多德也被后人称为“科学之父”。在亚里士多德那里,逻辑推理是科学的方法和工具,是客观的形式和规则,推理论证是从经验着手的,而不是像柏拉图那样将推理作为主观思维形式。逻辑三段论是亚里士多德逻辑学最重要的内容,一个三段论就是一个包括大前提、小前提和结论三个部分的论证。最为人熟知的一个三段论是:人是有死的(大前提),苏格拉底是人(小前提),苏格拉底有死(结论)。亚里士多德认为,把所有推理都化为三段论的形式,就可以避免一切谬误,由此得到的知识是科学知识,科学知识始终是有根据的、确定的。
2.寻找知识的确定性基础
近代自然科学的诞生伴随着其和教会、神学的斗争,弗朗西斯·培根(Francis Bacon)追求的就是让神学和哲学分开,建构一个适于科学发展的知识论。培根是近代第一个自觉地把知识问题作为思辨对象的哲学家。培根继承了亚里士多德一切知识来源于感觉经验的基本原则。而感觉具有局限性,要依靠科学实验来弥补感觉的缺陷。人们通过实验获得关于事物的认知后,还要运用人的理性能力进行加工。培根主张从经验上升到理性,把经验和理性结合起来,经验和理性能力的“离异”给科学知识的发展造成了阻碍,真正的知识是“经验与理性的联姻”。
勒内·笛卡尔(Rene Descartes)在数学研究中发现,基本的数学公理一旦确定,就可以从公理出发演绎出其他一切原理,如果公理是可靠的,那么整个数学知识体系也是可靠的。由此,笛卡尔认为一切知识都必须建立在完全或完美的确定性基础之上。笛卡尔将人类知识形容为一棵“知识树”:形而上学是根,物理学(自然哲学)是树干,医学、力学、伦理学等应用学科是枝叶和果实。他面对的问题是,经院哲学衰落,作为根基的形而上学却众说纷纭,不具备确定性的基础。因此必须找到具有普遍必然性的基本原理,来建立科学的哲学体系。笛卡尔对一切知识和观念采取普遍怀疑的方法,由此找到了第一原理“我思故我在”:一切都是可以被怀疑的,但只有我思是无可置疑的。笛卡尔用怀疑的方式排除了知识,只保留了认识的主体,这也是人的主体性得到确立的过程。然而,主体不是知识的有效保证,认识主体与认识对象分离,人们就无法确认知识和对象的一致性,也就不能把握任何知识的确定性,知识的确定性问题仍然没有得到解决。
以笛卡尔为代表的唯理论哲学家认为感觉经验不可靠,知识不能建立在不可靠的基础之上,只能从理性中固有的天赋观念中推演出来。而经验论哲学认为一切知识归根结底都来源于感觉经验,理性只起到整合感觉经验的作用。这个时期的自然科学也分为理论科学和实验科学,各自为唯理论和经验论提供新的依据。约翰·洛克(John Locke)批判唯理论和宗教神学的天赋观念论,致力于在天赋观念以外探讨人类知识的起源、确定性和边界。在他看来,人具有形成观念和知识的天赋,但观念和知识不是天赋。洛克提出“白板说”,将人最初的心灵比作一块“白板”,是经验在心灵上留下痕迹,从而形成观念和知识。知识是人心对两个观念是否契合的知觉,知识不能超出观念的范畴。在洛克这里,知识为真的保证是观念之间的契合。但感觉观念又来源于外部事物,如何保证知识和知识外部对象的一致性?洛克既承认感觉经验来源于外部事物,又坚持知识仅存于观念的范围之内,就遇到了这样的矛盾。
大卫·休谟(David Hume)将实验哲学的方法和经验主义的原则贯彻到底,得出了带有怀疑主义的结论:人类自认为拥有的关于世界的知识大都是或然性的,但这就是我们作为人类能够得到的全部。他在哲学史上第一次系统质疑了因果关系和归纳法的有效性,从而对哲学和科学产生了颠覆性的影响。在休谟看来,所有的人类知觉内容可以被划入两个范畴:来自直接经验感受的“印象”,以及根据临摹原则形成的“观念”。前者是后者的充分和必要条件,人类所有的认知内容,说到底都来源于经验感受。同时,观念和观念之间通过相似关系、时间或空间中的接近关系,以及因果关系产生关联。这些关联其实并不是事物和事物之间一种客观存在的必然关系,而只是人的心灵习惯性地用“原因”这样的观念,给其他观念建立联系。这个结论无疑给现代科学带来了巨大的挑战。因为人们通常认为,现代科学是建立在经验观察和归纳推理基础上的,是基于经验观察的因果推理。但如果休谟是对的,因果推理反映的仅仅是人类在处理经验观察时的习惯做法,并不反映事件之间的必然关联,那么科学知识就永远不可能是确定有效的。这就是休谟为后世哲学家留下的两个著名难题,归纳法问题和因果关系问题。
随着近代科学的发展,包括欧几里得几何学和牛顿物理学在内的精确哲学使人们相信科学知识实际上是确定的,理性有能力获得知识,只是哲学没有成功对此进行证明。康德直面休谟提出的怀疑论,跳出经验论和唯理论的局限,解决科学知识的确定性问题。康德对经验论和唯理论进行整合,他认为,一方面,知识必须建立在经验的基础之上,另一方面,认识的主体人类本身有先天的认识形式。判断是人类先天认知形式的运用和展开,康德提出真正的知识是判断。康德承认知识发源于感觉经验,这些经验质料无形无象、混沌一团,他称之为“杂多”。人类的认知能力捕获这些质料后,开始对其进行深度加工,赋予它们空间结构和概念结构,最终产出可靠的判断,也就是知识。判断是人类认知的最基本形式和唯一途径,能够满足知识的客观性、必然性和普遍性的要求。就像哥白尼把天体运动的中心从地球转换到太阳,康德把知识的确定性问题转换为人类先天认识形式的问题,康德哲学被称为哲学的“哥白尼革命”。康德的任务转换为证明人类理性具有先天认识形式,而且这些先天认识形式构成了经验和知识的先天条件。他把专门研究主体先天认识形式的哲学称为“先验哲学”。康德认为,凡是不涉及认识对象而只涉及在认识对象之前认识方式的知识,就是先验的。“先验哲学”讨论的内容是人的认识结构在经验发生之前已然具备了哪些能力,这些能力又如何发挥作用。在先验感性论中,康德证明空间和时间是人类感性的先天直观形式;在先验分析论中,康德证明知性范畴是人类知性的先天认识形式。经由知性范畴,康德为知识提供了统一的基础和根据。
但休谟问题仍然在自然科学领域发挥着影响。在现代物理学的发展过程中,科学家开始认为,物理学定律、公式只是科学家之间的协定,而不是自然界的客观反映。基于此,科学家们接受逻辑实证主义,反对形而上学。面对此种知识背景,同时受到达尔文生物进化论的启发,卡尔·波普尔(KarlPopper)提出一种知识进化论。在生物进化论中,生物通过基因调节的试错法努力作出各种改变以适应环境,同样,知识的增长也属于科学认识论的试错法,人们通过对知识理论的不断批判发现错误、排除错误。知识的最终目的就在于寻求真理,寻求客观上正确的说明性理论。知识客观上都是推测性的:人们接受客观知识,是因为它比其他理论经受了更好的检验。科学方法就是优选理论。在波普尔的知识论中,知识的确定性意味着“对于实际目的来说足够确定”,确定性与我们对信念的可能后果的期望有很大关系,波普尔的知识论揭示了一种作为总体的人类知识,知识在科学证明的过程中不断实现其确定性。
对知识是什么、如何验证知识的思辨本身就是在呼唤知识的确定性。知识具有普遍性,知识是可验证的,人类理性具有先天认识形式,总体上知识是客观的……知识的确定性原则在人类思辨过程中不断得到强调和确立。在总体性意义上,人类生活在变动不居的、纷繁复杂的世界之中,不确定性意味着混乱、风险,甚至危机。在不确定性中寻找确定性,是人类生存不可或缺的悖论形式,对知识的追求彰显了人类应对不确定性的本能欲求,知识的确定性原则就是人类生存的确定性原则。作为知识生产新的方式,人工智能在人类知识域中的表现,给知识的确定性原则带来了一场深刻的挑战。
(二)人工智能时代:知识的幻象
1.深度学习算法:知识确定性的动摇
在科学领域,知识的确定性原则指引着人类追求知识的精确性。人工智能开发的出发点就是以更精确的方式提取事物的特征。构成人工智能的三要素是算法、算力和数据,人工智能的表现日新月异,背后是三要素的升级。其中,算法指机器用于解决问题的方法。以神经网络为基础的深度学习是目前最流行的人工智能算法。一方面,人工智能新算法的出现与应用,使得人类对精确性的追求更进一步,人类通达知识的能力显著提升;另一方面,深度学习的人工智能以一种新的方式生产知识,使得人类难以对知识的精确性进行验证,进而冲击了知识的确定性基础。
在深度学习以前,早期的AI模型主要是基于统计学的数学模型。这些数学模型需要专家根据特定领域的知识和推理方法来设计特征,因此这种人工智能又被称为专家系统。例如,程序开发者把农业专家具有的关于农作物生长的知识,农作物种类、温度、湿度等编码进专家系统,该系统模拟农业专家的诊断推理过程,这样建立起来的农业专家系统就可以像真正的农业专家一样对农作物的生长进行诊断。专家系统从设计到应用,包括应用过程中的输入与输出过程,都可预测、可追溯,因而可以通过程序步骤判断专家系统的可靠性。
专家系统依赖于特定领域的专业知识,专家通过科学方法获得专业知识,程序开发者再将专业知识编码进专家系统,其中每一步都存在精确性问题。专家系统时期,人工智能的开发主要是将专家的知识或思想转化为更加精确的计算机语言。与计算机语言相比,人类知识或思想是概念性的和不精确的,进而导致转化和应用过程中的不精确,因而人类思想的概念性和不精确性被认为是人工智能发展的障碍。从专家系统到机器学习,则发生了根本转变,人工智能的开发从把人类的思维编码到机器中转变为让机器自主学习。
计算机神经网络模拟人脑的神经网络,以期实现类似于人脑的功能。神经网络的本质是模拟特征与目标之间的真实关系函数。在神经网络中,每一层神经元学习到的是前一层神经元值更抽象的表示。其通过抽取更抽象的特征对事物进行区分,以更好地对对象进行分类。专家系统的实际使用效果已经被深度学习超越,但专家系统使用的特征具有现实可解释性,神经网络计算出的特征则不能和任何具体的可解释性概念联系起来。
计算机神经网络往往是多层级的,包含大量参数,交互十分复杂,即使有完整的计算过程,人类思维也无法解释计算机神经网络的运作。研发人员很大程度上依赖经验和试错来开发和改进他们的模型,因此他们形象地称自己为“炼丹师”“炼金术士”等。以ChatGPT为例,即使是开发者也无法解释ChatGPT的生成逻辑,OpenAI使用GPT-4成功解释了GPT-2中30多万个神经元,也就是让人工智能来教会人类如何理解人工智能。人类在用自己不理解的东西解释另一个不理解的东西。在应用端,习惯于向ChatGPT寻求问题答案的用户往往也不会深究ChatGPT得出答案的过程。
人工智能直接挑战了知识的可验证性。人工智能可以在人类思维能力以外发现新的事实。如果把人工智能视为认识工具,那么这代表着人类认识能力的进步。然而人工智能的空间处在人类思维能力以外,这就意味着无法以人工智能以外的方式进行验证。在人工智能领域,包括其发生应用、生产知识的一切领域,人类获得新知识的同时,知识的确定性基础也在动摇。
2.计算机语言:精确却不可读
2022年11月,OpenAI发布了能够使用自然语言与人类交互的生成式人工智能模型ChatGPT,迅速引发了热烈讨论。此后,ChatGPT不断迭代,一系列受ChatGPT启发的大模型人工智能陆续发布,2023年也因此被称为“人工智能元年”。在专家系统时期,人类思维与语言的概念性和不精确性被视为人工智能的阻碍。深度学习的人工智能绕过人类语言,直接用计算机数据学习世界的特征。ChatGPT的语言机制是把人类语言作为机器学习的对象,在人类文本和算力的支持下,用计算机语言提取人类语言的特征,主要是语词之间的概率,再按照概率生成类似于人类语言的文本。也就是说,尽管ChatGPT表现出与人类相似的语言功能,能够¨像人”一样与人对话,但这种对话并不是基于相互理解,人工智能只是根据概率进行输出。目前的ChatGPT时常会犯低级错误,但无论表现如何,其使用的低成本和便捷已经在人类生活中产生了影响。对作为地球生物的人类来说,语言是一个突出特征,语言和思想不可分割。ChatGPT的广泛应用引申出一系列问题:思想的表达需要语言,那么ChatGPT在使用与人类相同的语言时,也是有思想的吗?如果人工智能是无思想的工具,那么人工智能生成的是“无思想的语言”吗?在ChatGPT生成文本时,语言和思想相分离了吗?
卡尔·波兰尼(Karl Polanyi)认为语言是一种思维模式,是一种“由简单的指称、重组和解读机制所产生的巨大心灵力量”。语言作为思维模式在科学知识生产中发挥效用,“科学是日常言语的扩展,即增加了科学的系统命名,但它们主要依靠的符号操作是已被记载的知识的系统积累,是用新的观点对这些知识进行重组和再思考”。尽管ChatGPT用人类语言输出文本,但在深度学习的人工智能系统内部,它使用的是计算机语言,并且这种计算机语言不再像专家系统那样对人类语言进行转译,而是直接收集数据并进行计算。计算机语言可以在一定程度上编码人类语言,与人类语言相比更精确,但对人类来说却不可读。深度学习的计算机语言带来了一种全新的知识生产机制。人工智能知识生产的具体环节,因人工智能语言的不可解读,而难以进行追溯和验证。
人工智能语言已经偏离人类对语言的定义。深度学习的人工智能没有语法,人工智能在识别和生成人类语言时不从语法的角度进行解析。在人工智能语言中,数学统计取代了自然语言逻辑,统计语词之间的概率关系意味着人工智能关注的是词和短语,而不是语法。而对人类语言来说,自然语言的语法具有重要意义。语言的表层结构决定语音形式,而深层结构提供述谓、修饰等语法关系。语法由生成深层结构的规则与将生成深层结构的规则映射到相关表层结构的规则构成。即便是在日常的普通句子中,语法关系也十分复杂,因为在将深层结构转换为表层结构的过程中,发生了一长串的转换。语法的深层结构是实在的心智结构,深度学习的人工智能没有语法,不仅是人工智能语言与人类语言区别的直接表征,也是人工智能与人类心智的本质区别。
3.人工智能拟真:消失的主体
深度学习的人工智能将现实世界数据化,在数据的基础上用神经网络算法提取现实世界的特征,为人类提供一种全景式的拟真。自2022年11月OpenAI发布ChatGPT后,ChatGPT不断迭代,越来越多的人开始使用ChatGPT生成文本。而ChatGPT只是OpenAI迈出的第一步,OpenAI的开发重点从文本生成逐渐过渡到图像生成。2024年,OpenAI发布新的生成式人工智能模型Sora,Sora能够根据提示词生成60秒的连贯视频。Sora备受影视制作行业的关注,Sora不仅是视频生成工具,更是“理解和模拟现实世界的模型的基础”。
让·鲍德里亚(Jean Baudrillard)在1981年出版了《拟像与拟真》,标志着他完成了从符号政治经济学到媒介批判的转向。在结构主义语言学的视角下,鲍德里亚用“拟像”和“拟真”作为媒介批判的出发点。在鲍德里亚那里,就如同政治经济学中的价值是被需求建构的,而不是具体的有用性,指涉物意义上的世界只能被看作符号的现实展开,这种展开就是“拟像”。媒介在其中作为一种普遍抽象的形式,对现实进行潜在书写。当拟像与真实没有任何关联,不再表征任何现实时,它就是纯粹的拟真,而拟真体系是主体陷落的,符号之间的彼此关系形成了完整的自足性,而不再代表任何主体。在当时,鲍德里亚认为互联网是最契合从拟像走向拟真的媒介。
如今的人工智能已内嵌于互联网之中:搜索引擎、推荐算法、流量机制……人工智能算法加持下的大数据根据用户画像通过互联网进行内容推送,即使用户不主动使用人工智能技术,也处于人工智能编织的信息茧房之中。在平台经济中,人工智能算法为商家、服务者、消费者赋值,被算法评估为“优质”的商家能够在平台获得更多曝光机会,被算法评分更高的网约车司机更有机会接到被算法评估为“优质”的行程订单。社会的、信息的、经济的,各个层面的意指关系都在人工智能的运算中展开,人的主体性陷落,一种人工智能主体开始建立。
Sora将使得超真实的模型更进一步。超真实意味着事物形象复活而本质消失,意味着近代认识论哲学意义上的“真实”消失,建立在“拟真”之上的知识随之成为“幻象”。笛卡尔通过“我思故我在”,在人的思维的确定性中确立了人的主体性原则,而在人工智能的知识幻象中,人的意义体系被算法重构而消解,人工智能拟真最终为人类带来一种主体性的消失。
三、知识的来源
对知识确定性意义的理解,不意味着人类知识的生成和传承严格遵循确定性逻辑。某一信念之所以成立,有可能是本人在推理或实践中的确证,也可能是经过了他人的确证,出于某种原因,此人是可信的。还有可能,某信念对个体或群体来说是不证白明的。以上这些因素可能出现在同一个确证过程中,人类知识生成是诸因素互动中的多样性呈现。整体意义上,可以在纷繁复杂的知识生成过程中提取出两种具有代表性的知识来源:理性和信仰。“任何宗教都不仅是宇宙论,同时也是对神圣事物的思索。如果说哲学和科学产生于宗教,那是因为宗教起初替代了哲学和科学。”在爱弥尔·涂尔干(Emile Durkheim)看来,理性和信仰都来源于社会实在,两者都力图将事物联系起来建立它们的内部关系,将它们分类,使它们系统化,但两者的知识图式和观察方法却完全不同。
(一)理性
尼采这样描述苏格拉底哲学以来人们对理性精神的崇尚:“他本着上述对于事物本性的可探究性的信仰,赋予知识和认识一种万能妙药的力量,并且把谬误理解为邪恶本身……自苏格拉底以降,由概念、判断、推理组成的机制,被当作最高的活动和一切能力之上最值得赞赏的天赋而受到重视。”理性精神从古希腊城邦中孕育出来,成为贯穿人类社会历史的基本要素,结出了名为科学的硕果。那么,这种理性精神是如何起源的呢?或者说,为什么这种理性精神起源于古希腊,而不是世界的其他地区?基于考古发现,让一皮埃尔·韦尔南(Jean-Pierre Vernant)在《希腊思想的起源》中作出了相对合理的解释:哲学是城邦的女儿。古希腊城邦这一特殊的体制则产生于克里特一迈锡尼文明的衰落之后。克里特一迈锡尼文明与当时世界上的东方文明相似,出于某种原因,可能是自然环境的变化导致人口的迁移,也可能是战争原因,最终克里特一迈锡尼文明衰落了。随着文明一同衰落的,是和其他古老文明一样的中央集权制度以及传统观念。古希腊城邦在旧文明的灰烬之中建立起来,在雅典形成了比较完善的城邦民主制度。城邦公民以公开辩论的方式共同参与政治生活,理性精神在思想自由和鼓励言说的环境中诞生了。理性精神及后续成就表明了人类面对世界的一种基本自信:人类思维有能力理解世界的实质。
在西方历史中,理性精神并不总处于主导地位,在中世纪,理性受到信仰的挑战,基督教教廷逐渐形成了对学术研究的垄断。在古希腊哲学传统中人们努力去认识的自然世界,在基督教教徒那里成为神秘的、上帝的造物。对上帝的信仰中,神学家总是要面对信仰和理性之间对立和冲突的问题。在基督教早期,教父查士丁(Justin Martyr)将古希腊哲学中的逻各斯理解为上帝的内在理智和永恒智慧,逻各斯普照世界,向所有人启示真理,因此异教徒(如苏格拉底、柏拉图)也能拥有逻各斯,从而认识真理。后来的经院哲学则试图用理性的逻辑方法论证基督教教义,其中的一个重要论题就是证明基督教信仰的前提——上帝存在。托马斯·阿奎那(Thomas Aquinas)在《神学大全》中援引亚里士多德的四因说,用五种方式证明上帝存在,以理性论证上帝的尝试最终在神秘主义思潮中失败。但从客观上讲,即便是在一切对世界的认识都基于对上帝信仰的黑暗的中世纪,理性的火种仍作为文本被保留在封闭的修道院中,作为思想方式也仍存续于基督教哲学当中。同样在中世纪,理性的火种传到了阿拉伯帝国。阿拔斯王朝发起了一场大规模的翻译运动,得益于中国人传授的造纸术,阿拉伯人将希腊文明、波斯文明和印度文明的智慧翻译成阿拉伯文。这个时期的伊斯兰世界成为理性精神的中心,在8至13世纪迎来了黄金时代。穆斯林哲学家继承了古希腊哲学家的遗产,用理性方式讨论心灵、智慧、道德、信仰等问题。包括数学、天文学、光学、化学、医学在内的多个领域都产生了具有重要意义的成果。
近代哲学在批判经院哲学的基础上发展起来,笛卡尔以“我思故我在”重新确立了人类理性的地位。同时,近代哲学也从经院哲学那里继承了唯名论和唯实论的对立,理性认识的对象和理性获得的知识被区分。这使得近代哲学中的理性精神与古希腊的理性精神得以区别:在古希腊人那里,人和自然一体,自然是理性直观的,还没有出现知识与知识对象的对立。在近代的理性精神中,人和自然相分离,人成了自然的主人,人有能力认识自然、改造自然。近代科学精神和方法逐渐建立起来,科学的进步和关于自然的观念在互动中相互促进和强化。现代学者们将这样一种理性精神概括为“工具理性”,它驱动了现代科学知识的生产,却在人类价值等方面遭遇了困难。
(二)信仰
信仰同样是一种理解世界的方式,人类智识的形成本身就有信仰的参与。“人类有赖于宗教的不仅是大量的知识内容,还有这些知识得以阐发的形式。”涂尔干在考察原始宗教的过程中发现,范畴是经由宗教信仰形成的知识阐发形式,一些基本范畴,包括时间、空间、类别、数量、原因、实体、人格等观念,是原始人类在宗教信仰中产生的。这些关于范畴的知识之所以不直接形成于经验,是因为范畴是最普遍的观念,由世世代代的集体经验累积而成。如果人们没有同样的时间、空间、原因、数量等观念,那么人们的心灵不可能产生联系。社会要想生存下去,不仅需要一定的道德一致性,还需要最低限度的逻辑一致性。“社会时间、社会空间、社会类别以及因果关系就应该是相应范畴的基础。”在集体的宗教仪式中,共有的心理状态得到激发、维持和重塑,这也是关于范畴的知识不断强化的过程。而这种过程不是纯粹非理性的,因为原始人并不认为这是在无力理解世界的情况下选择盲目相信,对原始人来说,这是理解世界最直接的、最好的办法。
中国的上古巫术在性质上是信仰的,“诚则灵”是巫术活动的根本准则,它要求卜筮者、卜筮的对象必须进入敬畏、诚心的情感状态。卜筮以复杂的数字演算为方法,服务于巫君的统治,因而这种情感状态又和图像、计算等客观冷静的认知因素交织在一起。《周易》中有“天地定位,山泽通气,水火相济,雷风相薄”,这些文字记录的内容可能是人们对自然世界的经验认知。李泽厚认为可能是巫术活动中“对各类自然事物的想象性的驱使”将自然对象转变成符号性的操作系统,这表现出了“人在神秘演算中的主导权和主动性”。在强烈的情感和信仰之中有数字系统、历史事件等理性因素。
尽管信仰与理性往往被视为对立的两种因素,但在许多情况下,两者同时存在而又难以分离,我们可以将它们看作人类思维活动的两种倾向,而不是两个完全独立的要素。神经科学也揭示出,在人类大脑中,没有专门负责信仰的区域,只有日常使用的神经网络,理性和信仰只是在强度和流程上有所不同。塔拉勒·阿萨德(Talal Asad)从学术史的角度,指出宗教并不和现代生活完全脱离:“在19世纪大部分进化论的思想里,宗教被看作早期人类的状况,现代的法律、科学和政治从此状况中产生出来并变得与之无关。但在20世纪,大多数人类学家放弃了维多利亚时代的进化论观点,许多人挑战理性主义的观点:宗教只是原始的,因而是落后的制度形式,我们在现代生活中有了更真实的形式(法律、政治、科学)。”
(三)人工智能
人工智能本身是人类知识生产的成果,而当人工智能加入知识生产领域以后,一些知识生产的现象则难以用理性和信仰两种传统知识源进行剖析。人工智能知识生产既不是理性过程—一它超出了人类理性能力的范畴,其作用也与信仰的作用不同——它没有人类敬畏、严肃等情绪的参与,因而也不是某种理性和信仰互动的结果。人工智能驾驶系统根据路况和算法作出驾驶决策的过程,没有人类思维、判断力的参与,对使用者来说,这是—种对技术的信任,而这种信任是否可以称为某种程度的信仰呢?既然人工智能已经部分地独处于人类思维领域以外,我们或许可以将人工智能视为理性与信仰之外的第三种知识来源。
人类理性和信仰的知识生产,尽管可能是曲折的、不完美的,但人类长久以来都是知识生产的唯一主体。人类被颂扬为“一件多么了不得的杰作,多么高贵的理性,多么伟大的力量,多么优美的仪表,多么文雅的举动,在行为上多么像一个天使,在智慧上多么像一个天神、宇宙的精华、万物的灵长”。当人类不是理解或驾驭现实的唯一主体,知识也不只源自理性与信仰的作用,人类主体的角色是否会随之改变?人类不得不开始思考与其他智慧体、与现实世界的关系问题。行动者网络理论为此提供了一种新的视角,在知识生产中,所有人类或非人类的参与者,包括非人的实体、技术系统、观念等在内,都被视为具有能动性的“行动者”,他(它)们通过相互关联的网络推动知识生产,人类和人工智能一样,都是知识生产网络中的节点。但无法忽视的是,在非人的因素中,人工智能具有无与伦比的特殊性。智慧生命是人类对人工智能终极形态的想象,因而在知识生产中,人工智能可以被视为与理性和信仰相并列的知识来源。
在认可人工智能作为一种新的知识来源的前提下,才存在讨论人工智能创造力问题的空间。英国认知科学家玛格丽特.A.博登(Margaret A.Boden)将人类创造力划分为探索型、组合型、变革型三种。探索型创造力拓展已知事物的边界,扩展其可能的极限,人类97%的创造行为属于探索型创造行为。神经网络人工智能最擅长的任务就是模式识别,生成式人工智能可以根据特定的风格生成文本和图像。人工智能在棋类游戏中的表现,也说明其擅长探索型创造,其能力在某些方面甚至超过了人类。在组合型创造中,已有的内容以新的方式组合在一起。在人工智能绘画软件Midjourney中,使用者可以将不同的艺术风格组合在一起,还可以用古典的艺术风格生成现代主题的图像。不过这里出现的问题是,在Midjourney生成图像的过程中,创造力来源于输入提示词的使用者还是人工智能?这涉及著作权法中的著作权归属问题,法学界已经展开了诸多讨论。变革型创造力要求打破已有的规则和认知,创造出前所未有的知识。何种创造可以称得上具有变革性意义?这个问题本身就难以回答,进而我们也就难以判断人工智能在人类能力以外找到的知识是否具有变革性。因而,对知识本身进行分类,而不是对创造力进行分类,能够展开更多讨论的空间。
四、知识的分类
(一)显性知识、默会知识与隐性知识
正如人类心智建立在人类生理和心理条件之上,人工智能生产知识需要数据、算法、算力、能源等各项条件。其中,数据是人工智能知识生产的“养料”。当前人工智能的核心成长逻辑就是庞大的数据集和超强算力,简单来说,在同等条件下,向人工智能投喂的数据越多,人工智能的表现就越好。也就是说,人工智能面向的是数据化了的那部分现实。ChatGPT等语言大模型是深度学习算法的最早成果,人类语言是这类文本生成模型的养料,也是人工智能面向现实进行运算的中介。
但人类语言不是人工智能数据集的唯一来源,外接了传感器的人工智能可以直接获取关于现实的数据,就像人类通过感觉器官获得关于现实的直接经验一样。而这部分直接来源于现实的数据的规模,远远大于人类语言的数据规模。尽管人类语言有悠久的历史,但能够作为人工智能养料的“语料”是有限的。人工智能预测组织EpochAI的研究人员估计,人工智能开发公司可能会在2026年之前耗尽高质量的文本训练数据。而同样可以作为人工智能养料的、人类生产的图像资源可能在2030年到2060年之间耗尽。
基于不同性质的“养料”来源,在知识域中,人工智能与不同种类的人类知识发生不同的互动关系,并且形成了关于知识的新的可能性。
波兰尼提出,在人的知识活动中,还活跃着另一种与认知个体活动无法分离、不可言说、只能默会的认知功能。波兰尼不认同笛卡尔“清楚且明晰的观念”的学说,认为人类知识存在不可明确说明的部分,这在一定程度上是人类语言表达的缺陷带来的。比如射箭比赛运动员明白如何调整身体以精准射出箭矢,却很难讲明作出某种调整的原因。那是一种言语难以描述的感觉,是在多次练习中形成的肌肉记忆。波兰尼指出:“我知道我完全明白如何做这些事情,虽然我只以工具的方式知道那些细节,并且在焦点意识上完全忽视了它们,因此我可以说,我知道这些东西,尽管我无法讲明或完全无法说出我知道的是什么。”波兰尼将这部分知识称为“默会知识”,与之相对,可以用言语描述的那部分知识则是“显性知识”。
能够用人类语言表述的显性知识是人工智能最早的“养料”,早期的专家系统人工智能就在很大程度上依赖着人类显性知识的输入。与专家系统不同,对于深度学习的人工智能系统来说,以文本符号形式输入的显性知识,和通过各种传感器获得的数据信息一样,都将经过层层神经网络,最终提取出的是新的特征。对人类来说具有直观性的显性知识,对人工智能来说却是非直观的。在人工智能那里,显性知识不是语言和现象之间的关联性,而是描述显性知识所用语言内部的关联性,或者说是显性知识的语言概率。显性知识与现实直接的问题被人工智能转换为纯粹的、上一个字符和下一个字符之间的概率问题。
与显性知识相对,默会知识是人类语言表达不可能或者不充分的领域。在人工智能的专家系统时期,人类语言的这种不精确和模糊的特性,被视为人工智能发展最主要的阻碍。默会知识难以用语言表达,在人类之间的传授要经过实践上的示范,而不能仅靠学习规则,因而难以被输入到专家系统中去。默会知识一度是人工智能难以涉足的领域。而深度学习的人工智能则可以从数据化了的现实中提取出这类默会知识,如人工智能可以收集和分析运动员的身体数据和运动数据,识别运动员的动作模式,从而提取运动员无法用语言表达的默会知识,包括运动员通过练习获取的肌肉记忆和直觉性运动思维等。
人类产出知识的能力远超过反思知识的能力,人类知识的生产除了理性思维的参与,还有非理性因素的参与,包括创造力、灵感、直觉、审美等,这些非理性因素本身在一定程度上也是默会的。作家可以教授遣词造句和安排隋节的技巧,但灵感和创造力难以被传授。默会知识有着个人化的特征,在关于知识生产本身的默会知识当中,这种个人化特征尤为突出。人工智能能够以人类作品为对象进行深度学习,领会这些作品的特征,还能够依据这些特征输出新的作品,但人工智能获取的始终不是关于人类创造力本身的知识。人工智能深度学习的底层逻辑就是在诸现象中提取一般特征,灵感、创造力、直觉等默会知识具有高度的个体性和偶然性,深藏于每个人类个体的生命历程当中,这是采取共性和必然性逻辑的人工智能难以触及的领域。
人工智能在人类理性思维能力以外生成的知识对人类来说是不可知的,不能通过人类的感性和知性等获取,我们将之称为隐性知识。在这里,隐性知识并不和前面所提到的显性知识相对应,而是一种人类尚未通达的知识。就获取方式来说,隐性知识可以完全脱离人类已有的知识成果,让人工智能直接面对现实进行深度学习。
2016年,DeepMind开发的人工智能围棋程序AlphaGo战胜围棋世界冠军李世石。对人类来说,围棋有超过4,000年的历史,而人工智能经过短时间的深度学习,就能够超越人类4,000年智慧的累积。2017年,AlphaGoZero抛弃已有的人类棋谱,在自我博弈中独立发现围棋的规则和策略,在三天的自我训练中就打败了旧版的AlphaGO。DeepMind公司以《在没有人类知识条件下掌握围棋游戏》为题,公布了AlphaGoZero这一成果。类似地,麻省理工学院开发的人工智能程序成功独立地找到一批用于对抗金黄色葡萄球菌的新抗生素,而在这之前的60年中,人类在抗生素领域都没有取得任何重要进展。
人工智能给人类知识领域带来了新的突破,但是这些隐性知识却伴随着黑箱问题。黑箱这个词被控制论者用来表示任何一部过于复杂的机器或者任何一组过于复杂的指令。他们在黑箱所在的地方画上一个小盒子,以表示此处除了输入和输出以外不需要知道任何其他的事情。对用户来说,使用人工智能仅需输入提示词并获取结果,不需要思考人工智能输出结果的逻辑。然而这其中的逻辑对于开发人员来说也是未知的,不可解释的隐性知识加剧了人类对人工智能的不信任,尤其是在医疗健康等要求严格的领域。2022年6月,中国国家卫健委和国家中医药局联合发布《互联网诊疗监管细则(试行)》,其中第21条明确指出:“处方应由接诊医师本人开具,严禁使用人工智能等自动生成处方。”
(二)地方性知识与全球性知识
地方性知识是文化人类学者克利福德·吉尔兹(Clifford Geertz)提出的概念。吉尔兹在田野调查中发现,在西方式的知识体系之外,还存在着各种各样未进入课本和词典的本土文化知识。这些文化知识具有高度的地域性特征,如巴厘岛的原住民按照长幼为孩子命名为“头生的”“二生的”“三生的”“四生的”,接着第五个孩子也叫“头生的”,第六个叫“二生的”,这种循环式的称谓体现着巴厘岛文化中往复无穷的生命观念。就此还可以举出许许多多的例子,如中华饮食文化中的“鲜”,在英文中无法实现准确的表达,只有一个日语外来词umami可以勉强描述,但这个日语词更多指向海带中的味精带来的鲜味,显然,在中文语境中,“鲜”的含义更为丰富。地方性的知识说明了人类文化的多样性,我们不能始终用一种方法、一种眼光考察和学习具有地方性和多样性特征的人类知识。然而,目前人工智能在收集人类知识、提取特征、输出知识的过程中,人类知识的地方性特征可能被消解。
数字基础设施的不平衡将带来人工智能训练过程中的不平衡。在人工智能知识生产的起始阶段,地方性知识就可能因为数字基础设施发展的不平衡而被排除在知识生产过程之外。ChatGPT的数据来源主要是互联网上的大量文本数据,包括维基百科、新闻文章、博客日志、论坛帖子等。在与用户的交互过程中,ChatGPT还将根据反馈不断进行优化。在数字基础设施完善的地区,人们更有条件使用数字信息网络,在互联网上采取具有地方性文化特色的行动。经由具有特定文化属性的用户,地方性知识被吸纳进互联网数据库,进而被人工智能训练集捕获。缺少数字基础设施,就相当于缺少被人工智能“看见”的机会。
地方性知识在人工智能知识生产中的边缘化和消解,反映出部分区域性或民族性文化在文化话语体系中的弱势地位,同时也是对这种知识一权力体系的强化。尽管数字技术往往以普惠性作为价值目标,互联网上的公开资源被视为数字技术普惠性的体现——全世界的学生都可以通过互联网学习哈佛等顶尖大学的公开课程。然而,这种普惠性的前提是数字基础设施的完备。这方面的“马太效应”非常明显,在数字传播中具有优势的是那些原本就具有强势地位的地方性知识。这在人工智能技术中体现得更为直接:ChatGPT的训练集中包括不同语言的语料,而英语和其他语言相比有更大的数据量,ChatGPT从而对英语有更好的建模能力,在生成文本时,英语文本输出的表现更好。
在全球化进程中,地方性知识不是一个封闭概念,而是处于互联互通的人类知识网之中。15世纪地理大发现之后,此前局限于地域的地方性知识以及较为分散的区域性知识交往圈,开始出现密集的全球互动,并最终伴随资本主义世界市场体系的形成而汇聚为人类的知识之网。知识的全球化是地方性知识跨文化互动的过程,全球性知识是在这一互动过程中形成的文化反应与概念建构。包括人工智能在内的数字技术,加速了知识全球化的进程。全球性知识要求真正多元的文化交流互鉴,实现互相尊重、普惠共享的人类价值目标。一方面,人工智能大语言模型使得构建一个吸纳人类全部知识文化的全球性知识体系成为可能;另一方面,目前的人工智能还难以引入人类的价值目标,而是遵循算法逻辑,哪种文化的语料更丰富,人工智能就将表现出哪种文化的特征,存在以地方性知识取代全球性知识的风险。
五、结语
密涅瓦的猫头鹰总在黄昏起飞。思想是后置的,人类对技术的应用也总是走在对技术认识之前。人工智能已经深度介入人类的日常生活,我们要对人工智能及其生产的隐性知识进行哲学层面的反思。在人工智能生成的知识域中,知识由各种模式生成,拟真原则替代了现实原则,人类的知识在人工智能系统中被重新解构。知识生产的主体也成为数据要素的—部分,主体与客体之间的界限被消除,主客体辩证法不复存在。以“我思故我在”建立起的人类主体性被消解,人类陷入某种第二存在。
与理性秩序不同,拟真体系的运行方式是技术性的。在拟真体系的代码操纵下,建立在真实性、普遍性与确定性基础之上的知识成为幻象,世界成为数据的集合,这遮蔽着人类的思想与行为,人类正在变成“无思想的生物”。技术逐渐从社会“脱嵌”,不再受控于人类,反过来,人成为技术体系的一部分,技术的本质决定着人的发展。技术以理性之名支配一切,人类思维能力逐渐弱化,内含于其中的批判与否定精神随之消逝。和理性一样,个体的情感与意志也受限于技术体系。对身处其中的人们来说,“接收”就是“接受”,反思的空间被无限挤压以致完全消失。由此,技术以一种绝对控制的姿态将异质声音和多元视角统一起来,个体的独特性被同质化的话语压抑。理性、情感、意志等构成“人之尊严”的重要特质,也在这一过程中被逐渐弱化。人的不确定性意味着人不停地自我生产,人的自身不断地在历史长河中发生变化。
作为“他者”的人工智能,将带给人类怎样的文明?