APP下载

人工智能发展对认识论研究的若干启示

2022-11-21

关键词:图式经验算法

王 前

(大连理工大学 人文与社会科学学部,辽宁 大连 116024)

自人工智能技术产生以来,人们逐渐习惯于以人类的认知机制为基础来理解人工智能的性质、特点和设计方法,让人工智能模拟人类的认知机制。而人工智能在发展中呈现出的很多超越人类智能的特殊功能,大都被认为是由人工智能设备自身的数学、物理或化学性能决定的,只是技术上的突破,与人类自身的认知机制无关。可是,人工智能在技术上可以实现的事情,是否以间接的方式反映了以往人类认知机制某些被忽略的方面?人工智能的性质、特点和设计方法,对认识论研究有何启示?这一反向的研究思路,能够对以往一些基本观点和有争议的问题给出新的更合理的解释。

一、数据:感性认识向理性认识飞跃的关键

“数据”(data)是人工智能技术的核心概念,表示对客观事件进行记录并可以鉴别的符号,用来记载客观事物的性质、状态及相互关系。数据,狭义上指数字,广义上还包括具有一定意义的文字、字母、数学符号、图形、图像、视频、音频等。数据经过加工后就成为有价值的信息。所有数据都是可以输入计算机并被程序化处理的[1]。 如果将“数据”概念置于传统认识论的理论框架中,可以发现数据正处于感性认识与理性认识之间。人们通常所说的“经验”,其实就是数据模型,它是从感性认识飞跃到理性认识的关键。

在感性认识与理性认识关系方面,哲学教科书上传统的标准论述早已为人们所熟知。感性认识包括感觉、知觉和表象;理性认识包括概念、判断和推理。从感性认识飞跃到理性认识,要运用抽象、概括、归纳、演绎、分析、综合等思维方法。可是,“经验”在感性认识向理性认识飞跃的过程中起什么作用?这个问题以往似乎没有得到足够关注。哲学史上有很多经验论学派,现实生活中也有很多人倚重经验,强调积累经验,有些学者采用“感觉经验”的提法[2],或者认为“经验”属于感性认识[3],然而,在实际生活的语境中,“感觉”和“经验”的含义有很大区别。人们日常交流所说的“经验”包含经历、技能、方法以及能够直观体验到的因果关系,远远超出感觉的层次。那么,“感觉”和“经验”的区别究竟在哪里?要回答这个问题,在人工智能技术发展起来之前是比较困难的,因为那时有些认知机制的细节尚不明确,“经验”一直被认为是一个原初范畴,由此引发了经验论者和唯理论者之间的长期争论。人工智能技术应用中提出的“数据”概念,为阐释和解决这些问题提供了新的视角。

“数据”不同于感觉、知觉和表象,而是对感觉、知觉和表象进行一定的思维加工后的结果,其特征是赋予感觉、知觉和表象以一定的质化和量化特征。“质”是一事物区别于其他事物的内在规定性,用于将通过感觉和知觉了解到的各种事物区别开来,观察到事物的各种特征,用词语加以表征,这个定性的过程产生了语言文字形式的数据。通过对各种事物的空间形式和数量关系进行测量,特别是对事物的各种属性和特征进行量化处理,就会产生数字和图形数据。数据的获得使感性认识的成果得到整理,便于进一步抽象、概括和总结,这样才能够上升到理性认识。

“数据”也不同于概念、判断、推理等理性认识活动的结果。每个数据都不是抽象的,而是具体的、特殊的、有明确规定性的。当一般概念表示的某种属性(如形状、颜色、种类、品质等)落实到“某一个”具体事物的时候,就成为数据。人们描述一个事件的具体情景和经过时,总要用到数字、文字、符号、图像等表达形式,给出的所有有关细节的总体描述就是数据模型。人们在日常活动中积累的具体经验,其实都是由数据构成的。能够确认事件真相和规律性的专业性经验证据,包括法定证据、考古发现、科学实验结果等,也都是由数据构成的。

通过比对“数据”,可以揭示事物之间的“相关关系”以及可以体验到未经证明的因果关系[4]。“数据”之间的“相关关系”具有不同程度的普遍性,但不具有严格界限的、边界明晰的一般性;“数据”之间可以体验到的因果关系可以在很多场合存在,但也不具有普适的规律性。有些学者将“经验”理解为对现象的认识,但在科学研究和技术应用中积累的作为数据模型的经验往往超出现象层次,反映出事物之间或事物各种属性之间的某些深层次的因果关系。科技工作者在其研究工作中,一般将“经验”理解为科学实验或技术试验,“数据”成为检验科学假说、理论预测和技术设计的证据,对理性认识起到支撑作用。而普通民众则将“经验”理解为体验、经历、技能和解决各种问题的实用方法,包括可以用数据表述的具体操作程序、手段、标准、分寸感等。人们经常讲“心中有数”,这里的“数”是人们亲身体验到的广义的“数据”,还没有达到理论层次。西方近代经验论哲学家所理解的“经验”,主要是指在科学实验和社会活动中获得的数据模型[5]。值得注意的是,近代西方经验论哲学家对“经验”的理解与当时的科学观察和实验活动有密切联系,这和人们日常语义上的生活经验相去较远。在这个意义上,西方哲学史上的经验论也可以说是一种不自觉的“数据主义”,而现在流行的“大数据”则可以说是数字化时代的“超经验”。

为什么以往人们理解和阐释“经验”范畴时,没有突出对“数据”的关注呢?因为人们以往在感觉、知觉和表象基础上获得数据时,是通过亲身体验直接获取的,数据与感知觉糅合在一起,并没有体现出其自身的独特作用和价值。不过,近代科学发展到19世纪末20世纪初时,经验主义哲学演化成实证主义哲学,已经表现出对作为科学假说检验证据的数据的格外关注,这与近代科学初期笼统谈论“感觉经验”的状况相比已经有了明显进步。孔德的实证主义就已经把“实在”“有用”“确定”“精确”“肯定”“相对”等特征作为“实证”的基本要求,显然这些要求都是与数据密切相关的[6]。 现代信息技术出现之后,越来越多的数据是靠监视器、录音机、传感器等技术装置获得的,数据与人的直接感知日益相分离,并且在传输、处理、利用方面显示出独特价值,因而才引起人们特别注意。从信息科学角度来看,人的感官接收到的外部刺激,如光波、声波、气味等,合成为完整的外界自然图像。这种图像要转换成神经信号传输到人脑中,并再现成为同样的图像,才能为人们所认识。这个过程已经开启了数据化的准备阶段。传输到大脑中的神经信号已经使外部自然图像转换成适用于从质化和量化角度标识的东西。当这些神经信号在人脑中再转换成完整图像时,就已经实现数据化了。这个过程很类似于人工智能系统对外部信息的获取、传输和处理。影像、音频、文档、图片等通过智能工具采集的信息,需要通过数字化转换成电子信号发射出去,被计算机网络接收到,再转换成文字或图像。而这时的文字或图像就已经实现了数据化,可以进一步处理,如进行比对、识别、编辑处理等。由此可见,人类的感性认识,并不是对外部世界图景的直接反映,不是简单的“摄影”“描摹”“模写”,而是一个将外部信息转换为可传输的数据后,再转换成完整图像的过程。人脑中的表象不是用感官直接看到、听到的,人脑中并没有眼睛和耳朵,但人们会想象,正如计算机屏幕会完整再现外部世界图景一样。究其原因,这就是外部信息的数据化在其中发挥了关键作用。然而,人脑中这个“屏幕”究竟在哪里?是如何运作的?人脑中的数据模型如何体现“回放”功能?这些问题都还值得深入探究。

以往哲学界经常争论“经验”是主观的还是客观的,经验论哲学家中既可能有唯物主义者,也可能有唯心主义者,其原因就在于作为数据模型的“经验”范畴从源头来看是源自物质世界,但其建构方式又是主体在起决定性作用。数据模型所表述和测量的对象都来自客观世界,数据的测量标准、表达方式、传播途径都是客观的,是有物质基础的。然而数据的获得、数据模型的建构方式以及对数据的挖掘和处理,都离不开主体的能动作用,其认知结果都带有主体的印记,从这个意义上来说又是主观的。现代人们对“数据”的理解,更多侧重其客观性,很多人相信“数据”不会说谎,有“数据”为证的判断是可靠的,但往往忽略了选择和建构数据模型中可能存在隐蔽的主观因素的作用,比如有些人可能操弄数据(如数据歧视、大数据杀熟)和伪造数据(如学术造假、虚假广告),这就使得辨识数据的可靠性变得尤为重要。关于人类的感性认识和理性认识互动机制问题,还可以从数据的形成和转换方式中得到启发。所谓“观察渗透着理论”,正是发生在数据模型的建构环节中[7]。人们从观察到的同样的经验材料中之所以会得出不同的解释,不仅是因为有着不同的理论知识背景,还因为这些经验材料只是在具有数据形态的时候,才能够按照不同的理论框架组合起来,从而体现出不同的意义。

二、人类认知活动中“算法”的对应物

“算法”是人工智能技术的又一个核心概念,表示由一系列明晰指令组成的解决问题的策略机制,具备有穷性、确定性、可行性等特征。“算法”是对人类大脑左半球计算和逻辑思维解题策略的模拟。人工智能技术的各种层出不穷的新“算法”不仅使人类的计算和逻辑思维效率大为提高,而且增强了处理信息和解决问题的能力,使得人工智能在很多方面体现出相对于人类智能的优势。认知科学中的计算主义思潮主张“认知=计算”,计算机程序就是一个实实在在的认知模型[8]。计算主义关注的问题是如何用计算机程序模拟人的认知活动,可是,计算机技术发展中一些有自身特色的“算法”在人类智能中是否也有对应物?这些“算法”的功能对于理解人类认知机制有何启示?下面通过几个典型事例加以讨论。

其一,缺省配置。这是一种非常基础的“算法”或程序设计,指的是在无决策者干预的情况下,对于决策或应用软件、计算机程序的系统参数的自动选择,即“默认”。默认选项的设计可以让用户在无需决策的状况下开始使用上述软件与程序。从计算机使用角度来看,这种设计的目的是为了提高思维效率,默认运行常用的、可靠的、有效的软件和程序,避免一切都从头再来。在人类认知活动中,也需要为了提高思维效率而默认一些可以作为思考基础的常识、原则、前提条件,但这一点以往并没有引起人们足够注意。从严格的逻辑思维角度来看,常识是低层次的、不完全可靠的、需要超越的,近现代数学发展的一个基本特征就是用严格的逻辑追问取代常识性的判断,像微积分、非欧几何、超穷集合论等成果都是超越人们常识的[9]。在现实生活中,很多年轻人喜欢追问判断人生价值和意义的逻辑起点,甚至落入无限递归的思维陷阱,出现迷茫、彷徨、无所适从的心态。但实际上在大多数情况下,常识经过众人的实践检验,基本上是可靠且有效的,通过默认可以显著提高思维效率。在保持批判性思维的前提下,运用人类思维中的“缺省配置”,可以在前人提供的基础上更好地从事创造性工作,避免因为怀疑一切而失去思维的根基。另外,运用人类思维中的“缺省配置”,意味着承认在现有的认知活动之前仍然有基础性的“软件”和“程序”起了作用,这就是默认的常识、原则、前提条件,以及使理解和结构性认识成为可能的思维框架,即解释学所说的“前理解”“前结构”[10]。

其二,超文本链接。这也是一种非常基础的“算法”或程序设计,可以使人们在浏览计算机界面时,通过鼠标点击,直接从一个文本转换到另一个文本。现在人们已经在计算机上熟练运用超文本链接,却很少考虑这种“算法”对了解人类认知机制有何种启发意义。实际上,人类认知活动中的联想、想象甚至虚构都具有“超文本链接”的性质[11],而这种认知机制对于理解人类的创造性思维活动具有重要价值。人类认知活动中的联想能力,实际上就是“超文本链接”作用的结果,即从对眼前事物的思考中受到某种触动(相当于“点击”),突然跳跃到对另一件事情的思考中,这个联想的渠道可能是对两件不同事情产生同感(“共情”或“共理”)。在联想基础上,还可以展开对尚未发生的事情的合理想象,甚至是对不可能发生的事情(“反事实”)的虚构,这种思维活动只有具备“超文本链接”的机制才成为可能。以往人们大都主张人工智能只能替代和强化大脑左半球的数学和逻辑思维能力,而不可能模拟右半球的联想、想象、灵感和创造能力。然而超文本链接似乎表明,用人工智能部分地模拟人类的联想能力或许是可能的。关键在于寻找产生“共情”的主体之间的联系途径和转换方式。至于想象和虚构,看起来纯属认知主体的自由选择,但这里也有某些带有必然性要求的限制,这就是超文本链接的实际能力。想象和虚构的素材都来自现实世界,但却以现实世界不存在的方式组合在一起,在这里,想象和虚构的自由来自超文本链接的自由。人类认知活动中的“超文本链接”带来的想象和虚构之所以具有某种意义,会引发人们的情感反应,是因为初始的文本都具有一定意义,而相互链接要符合文本的形成规则,最后建构出来的新的文本才具有可以理解的新的意义。

其三,深度学习。这是指以现有的数据库和信息网络为基础进行深度数据挖掘,并从中找出一些规律性的认识成果。人工智能机器之所以具有深度学习的功能,是因为人类的认知活动同样具有深度学习的特点,尽管人类在搜索技术、模式识别、数据挖掘等方面的成效可能达不到人工智能的水平。深度学习算法的很多原理都来自人类认知活动的启示,如各种类型的人工神经网络;还有些算法来自生物活动机能的启示,如遗传算法、蚁群算法等。这些算法与计算机处理数据的强大能力相结合,使以往很多依靠人类智能难以实现的目标逐渐变得不再困难。值得深思的是,在人类智能活动中,类似深度学习算法的思维过程是否存在?这些思维过程是否将来有可能以某种方式与人工智能相结合?直觉思维是人工智能技术不能直接模拟的,但直觉思维的某些环节却有些类似算法的特征。比如在直觉观念的酝酿阶段,人们需要在已有的知识和体验记忆中寻找与眼前对象具有相似关系特征的素材,按照中国传统哲学的提法,就是寻找“取象比类”的合适喻体,这里所指的长期思索相当于在数据库中的搜索。在直觉观念形成的“嵌入”和“贯通”阶段,被选择出来的合适喻体一旦嵌入已有的观念网络之中,就会出现认识上的澄明境界,达到豁然贯通的效果,这相当于关键数据比对成功出现的连锁反应,会带来一系列相关模式的自动更新[12]。当然,直觉思维的整体运行机制不可能完全算法化,但借助算法的原理和计算效果的帮助实现部分算法化是可能的。这应该是人工智能和人类智能协同发展的一个重要方向。

从以上所举的典型例子可以看出,用计算机的算法比照人类的思维活动,可以发现原来隐含在人类认知过程中的某些算法痕迹及其规律性,反过来可以成为更深入地理解人工智能能够部分替代人类智能的内在根据。是否还有其他一些计算机算法也能给理解人类的认知机制带来新的启发,值得进一步探索。

三、从软件功能反观人类的“认知图式”

在西方哲学史上,自康德提出“先验图式”的观念[13]之后,一直有学者认为这种观念带有唯心主义倾向[14]。皮亚杰从发生认识论角度,指出“认知图式”体现了已有各种知识块之间有机的能动关系,既是信息接收系统,也是信息提取系统。当某一图式被激活后,人们就能够从知识块的有机结合中预测某种期待信息的出现[15]。现代认知心理学对“认知图式”的理解侧重于人类的学习过程,认为“图式”是学习者从多次类似事件中抽取的共同元素,是知识模块的联系方式。以往人们感到困惑的是,认知活动的展开必须依赖事先准备好的特定图式,能够把从外界接收到的信息、经验和知识组织起来,这种“认知图式”并不是直接来自感性材料,也不是现成的理论研究成果,而是在认知活动开始之前就已经存在,并使得认知活动得以实施的东西。“认知图式”是纯粹先验的吗?它是从哪里获得的呢?为什么认知活动必须遵循这种图式?计算机软件的出现和发展,为解决这一问题开启了新思路。“认知图式”其实就是人脑在自然状态下的认知软件,其功能与计算机软件的功能是高度类似的。

计算机软件指计算机系统中的程序及其文档,程序是计算任务的处理对象和处理规则的描述,文档是为了便于了解程序所需的阐明性资料。计算机运行时,软件是能够提供给人们所要求的功能和性能的指令或计算机程序集合,能够更好地处理信息的数据结构。软件本身是无形的,但没有安装软件的计算机是无法启动和运行的。人类的认知活动过程隐含着类似软件的功能因素,可是以往常和认知的对象、内容、方法等因素糅合在一起,并没有体现独特的作用。直到计算机软件被发明并成为参照物之后,人类“认知图式”的类似软件的功能才有可能体现出来。

从软件功能反观人类的认知机制,可以提出很多值得思考的问题。哲学史上一般认为“认知图式”是先验的,先于经验而存在,包括先天的空间和时间的直观形式、先天的综合判断能力、计算能力和语言表达能力,这些“认知图式”相当于人们头脑中自然形成的“软件”。有了这些“软件”,人类接收到的外部信息才能被处理,才有意义。一个刚出生的婴儿,像是一台没有安装任何软件的电脑,还是像一台已经安装了一些基本软件的电脑?如果是前者,那就意味着决定其感知活动的“软件”都是后天形成的,皮亚杰的发生认识论支持这种观点。但是,很难想象人的先天生理结构对于认知活动来说只是“硬件”,没有任何“软件”的成分。因为如果婴儿一开始是通过感知活动来形成“软件”,那么婴儿早期感知活动的个体差异可能很大,为什么他们会逐渐形成基本一致并且可以相互理解的感知“软件”呢?人类的遗传信息中有“软件”的成分吗?刚出生的婴儿已经安装了哪些“软件”?后天的“软件”是如何形成和演化的?这些问题都值得深入探究。

从软件功能反观人类的“认知图式”,有助于对中国传统哲学中的“道”“技”关系给出新的解释。很多学者认为,“道”是类似西方哲学中“逻各斯”那样的范畴,是世界的本原,是基本规律,很少有人去想“道”和“软件”有什么关系。实际上,老庄在解读“道”的时候,已经表达了这样一种理解,即“道”涉及人们实践活动中最合理的、最优化的程序,最典型的例子就是《庄子》中“庖丁解牛”的寓言。庖丁之所以技艺娴熟,解牛刀法自如,整个过程又快又好,就是基于对自身特性、工具特性和对象特性及其相互关系的深刻理解,采取了最合理的、最优化的操作程序,这就是“技”中之“道”。《老子》中也说,“道”的特性在于“可执”“可为天下式”;《管子》说,“不见其形,不闻其声,而序其成,谓之道”。换句话说,中国传统范畴“道”有类似“软件”的性质,是一种最理想的“软件”,即人类实践活动的最高层次的“认知图式”,追求最合理、最优化的活动程序。如果从程序的角度理解“道”的意蕴,就可以解释得通“道”在其他方面的表述。比如,“道生一,一生二,二生三,三生万物”,“道”常被理解为万物的起源。实际上这里的“生”不是讲宇宙起源,而是讲通过特定程序可以使事物被创生出来。“道”的程序特征与软件的程序特征是一样的,都具有本身无形但能生发出各种事物的本质特征。二者的区别在于:软件是人为制定的程序,而“道”是按照事物自然本性规定的程序。可是,为什么以往人们很少注意到“道”的程序特征呢?这是因为在计算机技术没有出现之前,“程序”并没有体现出独特的价值。老子、庄子、管子这些哲学家在他们那个时代不可能有对“程序”的明确意识,但可能以间接的方式体验到程序性活动的意义和价值,能够将其概括为“道”,这实际上是一种超越时代的大智慧。“道”可以被理解为天地万物演化的纯自然的“巨软件”,而将其应用于技术活动之后,会带来各种发明和高超技艺。直到经过千百年的演化,这种纯自然的“巨软件”才有机会转化成人工软件,使人类社会进入人工智能的时代。

从软件功能反观人类的“认知图式”,还有助于预测人工智能对人类智能的长远影响。当代的软件设计已经成为一个迅速发展的产业,人们甚至提出“世界运行在软件之上”的观念,美国浏览器之父马克·安德森就曾认为,“软件正在吞噬世界。”[16]这种趋势对于人类的认知能力而言意味着什么?软件的功能在于将人的大脑左半球的各种功能,包括计算、语言文字处理、逻辑推理等形式化,并在人工智能设备上实现,而且软件的应用越来越难以进行社会控制。人脑右半球的想象、直觉、创造等功能,目前看来还不能用软件替代,这可能是人工智能不能全然替代人类智能的关键所在。问题在于,如果将来人脑左半球的功能越来越被人工智能取代,是否会造成左右脑之间功能失衡?在人工智能时代,人类的认知机制如何适应这种变化?近年来,西方现象学、解释学、隐喻理论、涉身认知等领域的研究,在一定程度上具有平衡意义,但还缺少从软件功能角度进行反思性探索,这可能是今后认知哲学研究的一个重要方向。

四、人工智能技术与人类认知关系的一般性思考

基于上面的讨论,可以引发一个更为一般性的问题,即人工智能在技术上可行的事情,是否都与人类的认知机制存在某种对应关系?因为人工智能的功能是人类赋予的,人工智能技术涉及的数学、物理和化学原理是人类发现并应用于技术设计的,人工智能可以做到的事情首先是人类可以设想并合理推断的事情,而这些设想的提出需要以人类的各种显性和隐性的认知机制为前提。由于认知能力和知识积累方面的显性特征,人类可能在一定时期并未认识到自身的认知机制具有的某些隐蔽特征,但这些特征可能在实际上支持着或者制约着人工智能可以实现的功能。反过来说,如果人工智能技术与人类的认知机制完全不存在对应关系,或者说人工智能技术的发展是人类的认知机制无法理解的,那就意味着人工智能不仅无法部分取代人类智能,还可能完全脱离人类的控制,成为彻底的异化产物。

当然,还应注意到,人工智能在技术上能做到的事情,未必都是符合或有益于人类的认知机制的事情。人们也需要警惕人工智能的不适当应用可能出现反人类认知机制的倾向,如碎片化思维、信息茧房、虚拟认知错觉等,有可能削弱对人类智能的开发,造就一些认知机制失衡的年轻人,进而对人类社会的长远发展带来消极影响。

关于人工智能与人类认知机制的对应关系,需要通过认知科学和认知哲学的研究进一步加以完善和证实,以上的初步思考已经呈现了充满希望的发展前景。这一思路提供了揭示人类自身认知机制的新视角,有助于发现一些以往忽略的认识论范畴的内在联系并揭示新的认知图景,由此可以建构人工智能研究与人类智能研究相互启发的关系,以开拓更为广阔的研究视域。

猜你喜欢

图式经验算法
思维图式在初中英语阅读教学中的应用
2021年第20期“最值得推广的经验”评选
透过“图式”读懂儿童
Travellng thg World Full—time for Rree
2018年第20期“最值得推广的经验”评选
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
图式思维在现代室内装饰设计中的应用
Can lucid dreams kill you?