APP下载

大模型时代人机合作的“以言行事”

2024-10-28肖峰

江汉论坛 2024年10期

摘要:奥斯汀的“以言行事”揭示了语言具有行动的属性和效应,成为语言哲学的重要命题。大语言模型的出现,使自然语言成为人机交互的界面,形成了人“告诉”智能机器替自己完成种种任务的人机结合的“以言行事”。随着大模型功能的强大,它可以为人做的事情越来越多,“人言+机器做”的技术性以言行事也将越来越普遍,使得哲学必须关注和研究这种新型的以言行事,考察它对奥斯汀的以言行事在内涵上的丰富与拓展,并探究它对语言哲学、行动哲学、人本哲学和伦理学提出的新问题。

关键词:以言行事; 大模型; 人机合作;人工智能

基金项目:国家社会科学基金一般项目“人工智能驱动科学发现的认识论研究”(22BZX027)

中图分类号:TP391.1 文献标识码:A 文章编号:1003-854X(2024)10-0049-08

大语言模型(LLMs,简称大模型)的出现掀起了人工智能的新浪潮,催促人类走向一个新的技术时代:“大模型时代”。大模型的特点是人工智能模型的规模和复杂性不断增长,能够处理的问题和完成的任务不断扩大,能为我们做的事情越来越多。使用大模型时,人所要做的就是用自然语言告诉智能机器“做什么”,智能机器系统就可按人的要求去“行事”即完成任务。这种“人说+机器做”的“联合作业”,就是人机合作的“以言行事”,它是对哲学家奥斯汀的“以言行事”的一种新型扩展,也提出了若干新的需要我们深思的哲学问题。

一、从奥斯汀的以言行事说起

英国哲学家奥斯汀(John Langshaw Austin,1911—1960)是牛津日常语言学派的主要代表和领袖人物,他对日常语言的分析使其跻身为20世纪最重要的哲学家之一。奥斯汀的主要贡献在于提出了言语行为理论(speech act theory),主张从行动的角度去研究日常使用的语句。他将话语分成两种:记述话语(constative utterance)和施行话语(performative utterance)。前者主要是对客观事实的陈述,其功能在于传递信息,例如“我每天都去公园散步”“我教英语”等,这类句子的目的是以言指事、以言叙事;后者的首要功用是做事或执行行为,而不是陈述或描述事态,因此它们不存在是否与事实相符合的问题,其本身也无所谓真假。用语言来做事的过程被他称为“以言行事”(doing things with words,也译为“说话就是做事”或“说即是行”)。以言行事意味着语言不仅是用来传递信息的,还可以用来执行特定的行为。在奥斯汀看来,以言行事具有普遍性,甚至许多看起来是描述性的语句,也不仅仅是表述了思想或陈述了事实,而且还完成了某种行为。或者说,当人们做出一个语言上的陈述时,并不仅仅是在说一些话,而且是在做一些事情。这些行为或所做的事情可能是抱怨、命令、许诺、引诱、祝福等等。这一理论后由美国哲学家塞尔等人加以发展。他们都认为,语言是人的一种特异的行为方式,人们在实际交往过程中离不开说话和写字这类言语行为。

“以言行事”的关键在于话语中的“行事”成分,它主张了人们可以直接通过说出的话语完成某种行为,即通过言语本身就能实施行动,或说话本身就是在直接执行某种动作。例如,当你说“我任命你为经理”时,你不仅表达了一个意思,还完成了任命的行为;同样地,当你说“我承诺明天会去机场接你”时,你不仅表达了一个意思,还完成了承诺的行为;当一个人在婚礼上说“我愿意”时,不仅传达了一个信息,更重要的是执行了这样一个行为:做出结婚的承诺;类似地,法官在法庭上宣布“我判被告有罪”,这一声明不仅仅是描述性的,它同时完成了法律上的判决行为。

此外,奥斯汀还强调了“以言行事”的力量。他认为,话语本身具有一种强制力或说服力,能够使听话人接受说话人的意图并采取相应的行动。这种力量不是来自于说话人的主观意愿或权威地位,而是来自于语言的内在性质和语境中的因素。这也是与以言行事关联的“以言取效”的功能:说话者说出的话语对于听话者所产生的预期效果或影响,即影响到听话者的思想、感情和行动等。例如,当一个人在观看一场演出后说“这真是个美妙的演出”时,他所希望的就是要影响听众作出对演出的积极评价。这样的以言取效也称之为“以言成事”或“话语施效”。

总之,“以言行事”是奥斯汀语言哲学或言语行为理论中的核心命题,它强调了语言不仅是传递信息的工具,而且具有执行行动的能力,并尤其强调语言的这种能力,由此揭示了语言与行动之间的紧密联系。以言行事,或说话的同时也是在行事,这在日常生活中我们也能看到大量的表现。人们经常是通过说话来表达请求、命令、承诺、邀请等具有行动意义的意图,这些都是以言行事的行为。例如,“我请你吃饭”“你快去写作业”“我保证完成任务”“我提议去看电影”等。奥斯汀的以言行事改变了人们对语言本质的认识:语言不再被简单地视为交流的手段,而是被纳入人的行动这个广阔的背景中加以新的考察,从而有效地解释了人们如何通过语言来塑造和影响世界。这一理论对传统语义学和语言哲学带来了重大革新,从而对语言哲学的发展做出了独特贡献,产生了深远影响,尤其是拓宽了其研究视域,揭示了语言如何在实现人与人之间的有效交际中发挥作用,呼吁人们更加关注语言的实际运用,并理解其对于人际交流和社会互动的影响,言语行为由此得到广泛的研究。

当然,奥斯汀的以言行事也有泛化语言行动功能的趋向,尤其是他把任何语言活动都视为行动,认为说话者总要发出某些声音,这就是“发音行动”(phonetic act),说话者说出的语词具有一定句法结构,这就是“发语行动”(phatic act),说话者说出某一句子时也是在说出一桩事情,这就是“发言行动”(rhetic act)。如此扩张“行动”的含义,就会消解言语活动与实际行动之间的界限,完全取消了“言”与“行”在日常语言中的区别,或者不再有不是行动的语言现象。但从认识与实践的区别来看,言与行还是有所不同的。如果行相当于实践的话,言虽然不完全等同于认识,但主要还是属于认识的领域,这从“行胜于言”“空谈不如实干”“说起来容易做起来难”等日常表述中,就可以看到这种区别。也就是说,我说话时并不总是在行动,也有“只说不做”“动口不动手”的言说活动,此时所进行的通常是语义的传递或表达,主要是信息性的认识活动,只是在信息世界而非物质世界取效,取得的通常也只是认识的效果而非实践的效果;而动手去做的行动则是物质性的实践活动,即肢体所进行的实在动作,它能在物理世界取得实际的物质性效果。

用语言取得改变物理世界的实际效果,即实践论意义上的以言行事或以言取效,其实还可以通过人际合作的方式来实现。如果将奥斯汀的以言取效稍加扩展,就可以看到,以言施效在现实中也经常通过说话人对于听话人的权威关系来起作用,如上级对下级、主人对仆人下达命令时,就形成为一个人的言语引起、影响或控制另外一个或一些人的行动及做事的效果,如领导对秘书说“给我起草一篇发言稿”时,就是在命令对方写一篇稿子。这通常来自特殊的社会或人际关系而形成的“言行分工”,这种言行分工在一定的“制度保障”下具有了以言行事的效果,此时,说话人试图通过自己所说出的话语来实现做事的目的,且是通过他人的行动来实现这一目的,由此形成了一种“A说B做”型的以言行事,这是一种“人际合作”型的以言行事。

这种人际合作的以言行事,在大模型时代来临后,还可以进一步延展为“人机合作”(即“人说+机器做”)的新方式来实施,这就是基于人工智能大模型所结成的人机合作型的以言行事,这是以言行事的新扩展或新形态,可称之为“技术性的以言行事”。由此一来,以言行事就可以归结出三种类型,一种是“我说我做”,这是奥斯汀原意的以言行事;第二种是“我说你做”,这是人际协同型的以言行事,是基于人类“分工”基础上的以言行事;第三种是“我说机器做”,是人和机器在新型分工基础上进行合作而完成的以言行事,是人机之间的一种联合作业。本文所要探讨的,就是最后一种以言行事。这也表明,即使我们接受奥斯汀的以言行事所表达的内涵,也需要结合新的视野,尤其是结合智能技术发展提供的新手段、新可能来加以新的扩展,从而对以言行事这一重要的命题给予大模型时代的新阐释。

二、大模型介导的以言行事

基于自然语言处理技术的大模型(如ChatGPT)出现后,其强大的与人可以基于自然语言进行流畅对话的功能,以及按对话中的人所提出的要求去完成各种任务(如生成文本、图画、视频和编写程序等),使得人机之间合作去实现“以言行事”得以可能。可以说,人通过自然语言与大模型交互并完成特定任务,是“以言行事”的智能化应用和技术性实现。当人向大模型发出指令或提出需求时,他所输入或说出的提示词就是一种“言说”活动,人此时的言说实际上是在启动一个行动的过程,大模型根据你的指令生成回答、执行任务或提供服务,就是这个行动过程的完成。这种通过自然语言进行的人机交互,实现了通过语言表达来介导智能机器的运作,并达成实际效果,无疑是实实在在的以言取效。

目前,大模型通常关联生成式人工智能,或者说大模型的核心能力是“生成”,这里的“生成”就是按人的需要或要求生成所需的内容(文本、多媒体、程序等)。生成这些内容原本是人自己要做的事,而今可以由大模型来替代,由此形成了大模型 “为人做事”的关系,也就是在做事过程上的“人言+机器行”的人机协同的联合作业。从本质上看,这也是人用自然语言指挥机器为自己做事。

其实,在智能语音技术中,人机协同的以言行事就初现端倪。如在智能家居领域中就率先实现了简单的“以言控物”的过程:当我们对智能语音助手说“打开空调”时,智能语音助手会将这个指令传递给作为物联网一部分的空调设备,从而启动空调的开启。集成大模型后,智能家居的以言控物可以达到更高的水平,如用户告诉语音助手“我想听音乐”,植入了大模型的语音助手可以识别用户的意图,自动为用户推荐适合的音乐。在这里,所谓人机协同的以言行事,就是指人类通过言语命令机器执行某种行为,而机器则根据其内部模型和算法来实现这一行为。

在人工智能领域,大模型是指那些具有大量参数、能够处理复杂任务的深度学习模型。近年来,随着计算能力的提升和数据量的增长,大模型在自然语言处理、计算机视觉等领域取得了显著的成果。这些成果使得机器可以更好地理解人类的语言和行为,从而实现与人类的更高效、更自然的交互,由此将基于AI的以言行事推进到更新的水平或更高的阶段。使用大模型后,人机合作的以言行事的模式可以在越来越多领域中实现,如工业大模型、农业大模型、金融大模型、教育大模型等就表明了这种领域的不断扩展。目前,大模型技术正在千行百业中寻求落地,大模型为人做事的能力也在新的领域中不断扩充;各种应用场景的开发,也如同给大模型配上能够在现实世界里执行任务的“手”和“脚”,使其不仅能完成文本生成之类的信息生成任务,而且也能完成各种需要动手才能完成的物理操作或物品生成任务,从而具有“物质实践”意义上的行动或做事的能力,即我们通常所说的“做实事”的能力,这也是通过物质性的工具使用来与环境互动并解决问题,即“实体交互能力”。(1) 此时,人类通过语言向大模型发出明确指示,而大模型则通过强大的计算能力和智能算法来理解这些指令,并转化为能够控制智能机器有序运行的程序,从而通过它所联通和控制的人工肢体去执行这些人所下达的任务,包括在物质世界中改变对象的任务(大模型在智能制造中的应用就体现了这一过程)。当大模型可以控制机器人进行特定的动作时,意味着我们可以通过大模型来实现更多复杂的“以言行事”的任务。

物质生产是人类最重要的行动方式,也是最主要的做事领域。上述的发展趋势表明,大模型所介导的以言行事在这一领域中具有巨大的潜力,工业大模型(尤其是嵌入大模型的智能制造系统)所具有的就是这种潜力。工业大模型从本质上就是联通了制造系统的大模型,制造业是AI大模型应用的主要战场,全球范围内越来越多的制造业相关企业开始探索和部署AI大模型,旨在提高生产效率、降低成本并驱动产业升级。使用智能制造大模型时,只要在人机对话中告诉大模型“我要做什么”(即人需要大模型做什么),包括“我要某种物品”(在提示词中将物品的种类、大小、颜色、外形等描述出来),接下来大模型就可以将其转化为机器指令去启动和控制智能生产系统将其制造出来,这就是定制化、个性化的物品生产的高效实现。甚至,在“我需要某种物品”的想法的某些细节还不清楚时,还可以与大模型进行“讨论”,让其根据自己的特点提供最佳的设计方案,获得物品细节方面的咨询和启发,使自己的需要从模糊变得明晰。如根据自己的年龄、身材、性格、职业等设计合身且有个性的服装。这样一来,大模型就从只会生成知识,发展到也可以生成动作;从只能充当认识世界的手段,到可以充当改造世界(造物)的工具,使“以言行事的知识生产”辐射为“以言行事的物质生产”,如此等等。

传统的生产离不开人的亲力亲为的“具身”性肢体劳动,可简言之“以手行事”的生产劳动方式。即使在使用计算机作为控制装置的自动化生产系统中,人也需要进行打字和点鼠标之类的“动手”活动,为此才能完成编写程序或向计算机发送控制指令的工作任务。就是说,物质生产中的“做事”或行动,在这里是由人发出的语言信息(包括以文字形态输入的信息)转化为机器能理解的数字化指令后,由智能机器系统去最后完成的。在大模型之前,由于AI对人的自然语言的理解能力有限,自然语言与机器语言的转化需要经过编写代码或程序来完成,所以面对智能制造系统的以言行事者,实际上只能由会编写程序软件工程师(也称为“码农”)来完成,此时AI作为以言行事的代具就显然受限于小众范围。但在使用大模型嵌入的智能化生产系统时,由于软件程序可由大模型按人的需要自动生成,人就无需再进行动手编写程序的工作,甚至也无需人动手敲击控制指令,而只需通过口述自己的目的或要求,能理解语言的大模型就能自动编写出能够控制机器运行的程序指令,启动和控制生产系统制造出人所需要的物品。此时,不会写代码、编程序的人也可以驾驭智能化的物质生产系统,因为你只需要告诉大模型你想要它做什么,剩下的就是“一键生成”,包括生成相应的能控制生产流程的程序, 这也可称之为“以言编程”。所以制造物品的生产活动,就可以从先前的以手行事普遍地转变为以言行事。

大模型可以以“聊天机器人”的方式出现,如将大语言模型内置于机器人身上,它就可以听懂人的话,按人的要求去做事,此时人只要说话,告诉机器人要做什么,它就可以替人去完成所要做的事情。而当这种机器人做成“人型机器人”时,它更像是人的忠实“仆人”,人机合作的以言行事也更像是主仆型的人际合作型以言行事。在这里,人与大模型之间以自然语言为接口的交互,还在技术上从文字交互转变为语音交互。目前不少大模型都配置了话筒为人机交互的新界面,使传统的文字输入被更便捷的语音对话代替,人机合作以言行事中的“言”,也从“以书面语行事”演进为“以口语行事”,使得“动手录入”的微小行动也可以被更省力更高效的“对话聊天”所取代,或称之为从“以写行事”进一步简化为“以说行事”,这就更加提高了以言行事的效率,也进一步降低了通过大模型来实施以言取效的门槛:只要会说话,即使不会打字,或因眼力退化而打字不快不准,也可以有效地使用大模型来为自己做事,在几乎所有的任务中获得大模型的帮助。由此一来,大模型有潜力为每个人提供以言行事的新能力,几乎人人都可以借助大模型来“享受”技术性以言行事的“红利”,人机合作的以言行事于是更有可能成为无处不在的人类行为新方式。

大模型之所以能够理解人的要求并完成人所布置的任务,主要得益于自然语言处理技术的不断发展。自然语言处理是一种人工智能技术,旨在使计算机能够理解、解释和生成人类语言,从而弥合人类交流和机器理解之间的差距,形成机器与人之间自然流畅的交互,实现无缝的人机通信。自然语言处理经历了早期的形式语法、转换生成语法到现代基于统计的方法和深度学习模型的演变过程,其中涵盖了词汇表征、语言模型等基础概念和关键技术。随着深度学习模型的使用,自然语言处理技术取得了重大突破。大模型就是使用深度学习算法的自然语言处理模型,它通过大量的数据训练,能够更准确地理解和生成人类语言,因此它在自然语言处理方面表现优异。大模型与早期基于规则或简单统计方法的自然语言处理模型不同,它通过深度学习来掌握语言的内在结构和语义关系,具有了更大的词汇表和更高的语境感知能力,不仅能理解单个词汇的含义,而且能理解词汇之间的关系以及整个语境,还能通过分析大量文本数据、学习语言结构和语义关系。这意味着它们能够根据上下文来理解语言的含义,从而更准确地理解人类语言的真实意图,由此按人的语言所表达的要求去做事、去行动、去完成任务。由于大模型在语言理解、生成、交互和推理等方面展现出卓越的能力,能够在跟人类相当的水平上理解和生成文本,所以它被视为自然语言处理的重大进步。(2) 还有的研究者提出了“语言作为一种通用接口”的概念,使得大模型不再是一个简单的工具,而是一个节点,能和其他许多AI工具连在一起用,从而能够用来管理和协调其他AI模型,展现出理解和解决来自多个领域复杂任务的巨大潜力。(3) 总之,正是大模型在自然语言处理方面的强大能力,使其能够理解并执行人类的指令,从而与人结合为一个“人说”与“机器做”的以言行事系统。

大模型在自然语言处理上的质的提升,以及它所综合集成的大算力、大数据、大应用等方面的能力,不仅使其成为人所使用的技术和工具,而且在技术形态或工具范式上也发生了质的变化。我们知道,人与世界的关系是以技术和工具为中介而联结和形成的,人是在与技术和工具的交互中完成对世界的作用的,技术和工具通常是受动的一方(死物),而人是主动的一方(活物)。但大模型作为工具则改变了工具的上述特性,因为大模型不再是全然受动的工具,而是具有了与人对话、互动的能力,具有对人的意图加以理解进而决策的能力,由此成为集伙伴、助手、代理于一身的技术手段,从多方面具有“活物”的特征,如它具有一定主动性和随机应变的灵活性,甚至被称为“智能体”“行为体”或“自为体”等等。也正是工具范式的这种质变,才使得大模型具有了一定程度上“独自”为人做事的能力,才能在“人机合作”的以言行事中充当相对独立的一方,起着先前任何技术所无法比拟的空前强大的作用。

这种“空前强大”的作用还表现为,当智能机器介入到以言行事的系统之后,机器行事的优势随之显现出来。对于许多事情,尤其是那些规范化的事情,人做不如机器做得好,尤其是不如机器快、不如机器效率高。大模型可以比人更多更快地行事,例如文档可以一键生成。因此在行事能力上,机器比人强,这一新特征使得人机合作的以言行事不仅开辟了以言行事的新形态,而且极大提高了以言行事的效率,在一些场合还可以提高做事的质量。这种人机合作的以言行事在物质生产领域中的应用,使劳动生产率借助大模型的威力而获得大幅度提高,加上如前所说的低门槛甚至没有门槛,大模型还可能成为人人都可以使用的泛在的以言行事的代具。在人机结合的智能系统中,人的主要任务是提出需求,并用合适的方式“告诉”机器,而大模型则通过其具有的强大的理解和执行能力,高质量地完成人所交代的任务,在此形成人的智慧与大模型的能力的有机结合,使双方的优势都得以发挥,从而导向一种基于人机合作的最优行为策略。而且,当大模型及其控制的机器所行之事主要是那些常规的、重复的、标准化的、琐碎的、人所不愿意从事的事情时,这种人机合作的以言行事还具有将人从琐事的劳作中解放出来的意味,使人进入一种更轻松自如的劳动方式,尤其是转入自己更擅长更乐意从事的创造性工作。所以技术性的以言行事在这里也具有了人文或人性的意义:当人主要转向创造性活动时,也意味着人的进一步发展和提升。

在人机互动的以言行事中,人出言,机器做事,机器所做的是人想做的事,是人告诉、要求机器去做的事,从而是体现人的意图的行为,这种做事或行为的最后归属者,仍是人,即由人去“享受”机器做事的成果。此时,以言行事虽是人机之间的联合作业,但核心是人,主体是人,原初的发起者是人,最后的结果也是服务于人,这无疑在本质上是一种“以人为本”过程或现象,这也是体现人机合作之人文意义的一个侧面。

总之,随着大模型的工具化,以言行事正在获得新的含义、增添新的形式,使得人类的行为方式也随之发生着重大变化,甚至是“颠覆性的改变”:人类将越来越多地不再“以手行事”,不再用自身的肢体去充当“做事”的工具,而是用“智能含量”更高的“发号施令”去实现做事的结果,人的职能成为以言行事这个系统的调动者和指挥者。由此也导致劳动方式的嬗变:从更偏向于体能支出的“手力劳动”(以手行事)到更偏向于脑力支出的“口力劳动”。所以大模型是以言行事的新型工具,是人类改变社会、创造历史的崭新手段,它决定了使用这种工具后所形成的包括新的生产方式、劳动方式、实践方式在内的新的行动方式,由此进入了真正的人机协同时代:人和机器的融通达到前所未有的水平,智能媒介使人和机器形成更紧密的联结。

三、哲学新视界与新问题

以上分析表明,随着大模型时代的来临,奥斯汀的以言行事必然扩展为“人言+机器做”的技术化新形态,由此带来人类行为方式的嬗变。这种拓展和嬗变无疑也提出了若干新的哲学问题,启发我们去进行新的哲学反思。

(一)语言观或语言存在论新视界

奥斯汀的以言行事,曾经启示了我们对语言功能的重新认识;而人机合作的以言行事,则进一步拓展了语言的功能。大模型实现了自然语言与机器语言的通畅联结,使人的自然语言通过智能机器系统“做事”的能力得到质的飞跃,这既可以视为“以言行事”的新途径,也可以视为人类所使用的自然语言所拥有的功能的新拓展。

可以说,奥斯汀的以言行事主要揭示了“说话包含行动”的语言功能,而人机合作的以言行事,则将其进一步推进到“说话就是行动”的“言即行”, 从而进一步彰显了语言的强大功能,并再度启发了我们对语言的形而上思考。

海德格尔曾对语言的本质给予了存在论的阐释,提出了“语言是存在的家”(4) 这一著名命题,揭示了语言是我们思考和理解世界的方式,语言的界限决定了我们对存在的理解。伽达默尔还进一步阐释道:不存在语言和对话之外的“自在的世界”,正是语言才使存在成为“能够被理解的存在”。(5) 可以说,技术性的以言行事或“言即行”在一定意义上与海德格尔“语言是存在的家”具有相通性,对语言的这一存在论阐释形成新的印证。较之“语言是存在的家”,“言即行”进一步表明,语言不仅是我们理解世界的方式,而且是我们应对和改变世界的方式。我们对存在所造成的人工变化,是通过语言来实现的;离开语言,人的行动就不可能进行,所以任何行动的背后,都有语言的启动与调控,行总是伴随着言。将“言即行”跟“语言是存在的家”两个命题相结合,语言的强大功能就可以得到更充分的体现:语言是人理解和重塑存在的方式,我们既通过语言来理解世界,也通过语言来构建或重塑我们的世界。由此,语言不仅设定了我们理解世界的限度,也划定了我们面对存在所能采取的行动的界限,这尤其表现在依靠大模型的技术性以言行事中,语言的限度也是我们行动的限度。例如,人在使用提示词上的语言水平,就将决定可以使用大模型为人做事的限度。由此,语言与世界的关系从认识论层面进一步推进DlasLAB8s7P6fjpu+src4vDFw0ptOZGlaRsTFTwMmos=到行动论或实践论层面,“语言是存在的家”也进一步进化为“语言是行动的平台”。于是,语言与世界,言说与行动就联结为一个相互依存、不可分割的整体,语言—存在—行动之间的关系得到了新的整合:语言不仅是存在的家,还是行动的根,是做事的本;离开语言,离开人言的控制,由“事”所构成的存在者,由“做事”所造就的变动中的世界,将不可能存在。

(二)行动观与主体观新问题

人机合作的以言行事,不仅启发了对“言”(语言)的存在论新探究,而且也引出了对“行”(行动)的认识论新思考,这就是:在“人言+机器做”的人机合作中,如果说行动成为了人与机器的一种联合作业,那么如何理解“行动”的含义?

“行动”是与实践具有等位关系的哲学范畴,它是人成为主体的重要特征,它既是认识论研究的对象,也是行动哲学的核心概念。行动哲学将行动界定为“有意图的身体移动”,或“行动的意图转化为一系列适当的身体动作”(6) ,其构成就是“意愿+一系列适当的身体动作”。传统的行动无论怎么分解,各个部分(尤其是身体动作)都是由人来承担,即由人去“亲身”完成,此即所谓“行动的具身性”。而在人机合作的以言行事中,行事的意愿由人承担并通过语言来表达,但行事所需的“身体动作”(尤其是“动手去做”的肢体活动)则由大模型连同它所控制的机器系统所承接,大模型替人完成需要“手”去做的一切后续事情。由此带BdZ8OSMLpzdJ2nSgftGVkDUGXFCM2h8csnYRHbwUrG8=来两个相关的问题:一是人所进行的没有身体动作(尤其是动手的肢体动作)的意愿表达活动,是否还是严格意义上的行动尤其是完整的行动?二是智能机器系统替代人的肢体所完成的那些物理运动,是否具有人的行动的属性,是否符合严格的行动范畴的规定性?换句话说,大模型的“做事”或“行动”在何种意义上仍属于人的行动?是否可以称其为人的“延展行动”或基于技术的“人工行动”,就像我们将机器智能称为“延展智能”或“人工智能”一样?

显然,从传统的行动概念所包含的两个要件上,在大模型介导的以言行事中,单独的人和单独的机器所执行的都是局部的功能,似乎均不构成完整的严格意义上的行动,因为人用语言表达意愿的活动缺少身体动作,而机器尽管有做事的动作,但意愿不是出自它自己(因此缺少意愿),只有两者的结合与协同,才具备作为行动的全部要素。当然,即使在人机合作的以言行事中,我们也不会认为人没有行动。如果承认此时的人仍在行动,那么行动的具身性是否不再必要?如果将意愿的表达界定为一种“信息行动”,那么大模型介导的以言行事是否意味着人类正在进入以信息行动而非体能行动为主的行动方式新时代?这里也涉及到“言”和“行”之间是“言主导行”还是“行决定言”的问题。在人机合作的以言行事中,言无疑行使主体职能,行则行使手段职能。进一步的问题是:行动的“主体”在这种语境下应该如何界定?可否将大模型、智能机器与人结合为一个新的“人机主体”?或像称呼人机结合的智能为“混合智能”那样称其为“混合主体”?从人机行动主体还自然会引申“人机劳动主体”“人机实践主体”“人机认识主体”等称谓问题。如果还是仍然坚持人是唯一的主体,那么智能机器就只能属于“工具”。但是如前所述,大模型介导的智能系统显然远不同于传统的工具,传统的工具完全是受动于人,且只能局限于特定场景帮助人做特定的事(所谓“专用工具”)。而大模型并不完全受动于人,也可通用于多种场景,这样的智能系统越来越多地被称为“agent”,具有“智能体”“行为体”“自主体”等含义,与“主体”的含义不再有泾渭分明的界限,难以用传统的“工具”来界定其功能。因此,技术性以言行事所造就的行动新形态,不仅对行动本身的认识论含义提出了新的问题,也对行动主体应该如何界定、大模型及其外设是行动的工具还是行动主体(或行动主体的一部分)等问题,形成了新的挑战,需要在深入探讨的过程中去逐渐厘清。

(三)人本观或人学新问题

人机合作进行的以言行事,也是人所进行的“以言行令”的活动,即人对大模型发出控制指令,无需自己亲手做事,而是由智能机器去进行。大模型在这里掌握了人类的语言规律,能理解人和回答人的问题,完成人所“交办”的事情,如生成文档、编写程序,以及完成其他应用场景中的任务。当人只行使“说话”“告知”的功能时,人在语言方面的能力就更为凸显,甚至语言对人之为人的意义也随之被再度唤醒,这也使得将语言视为人的本质的人本观有可能得到一定程度的“复兴”。

亚里士多德曾将人界定为惟一具有言语天赋的动物,其后继者们认为,语言不仅是“驱动人类的心理软件”(7),而且“语言是我们的第一种技术”(8);人创造了语言,也以语言作为自己的特征。达尔文将语言看作是人与猿的分界线,他认为声音语言“这一才能被认为是人与低于人的动物之间的主要区别”。(9) 哲学家芒福德认为,对于人的起源和进化来说,语言符号所起的作用远远超越了工具制造,因为制造生产工具的能力既不需要早期人类丰富的大脑容量,也不会导致早期人类大脑容量的增长;完成有声言语所需要的多种器官密切配合是一种更大的进步,并且肯定占用了早期人类大部分时间和精力。所以从人类起源的开端处,不是更有效的工具,而是符号表达的意义模式的建立,才是智人进一步发展的基础。(10) 文化人类学家卡西尔也认为语言对于人之为人来说,意义远比制造和使用工具要大得多。(11) 当代技术哲学家波兹曼也表达了类似的看法:“语言无愧为一种原始而不可或缺的媒介,它使我们成为人,保持人的特点,事实上还定义了人的含义。”(12) 凡此种种,表达了基于语言能力的人本观:人的本质是人拥有语言,语言能力成为人的本质力量。

在大模型时代,人作为主体的能力更充分地体现为一种使用语言的能力,表现为人使用提示词向大模型清楚明白地表达意图的能力,通过这种能力来使大模型理解和按照人的要求去行事。目前使用大模型中存在的不能如愿以偿,往往是因为给它的提示词不明确,所表达的要求不能被其理解,从而体现出一种“言不顺则事不成”的关系,所以学会使用提示词成为人需要演练的一种新的语言能力,也是提高人机合作以言行事效能的重要一环。从中还可以看到:一个人只要不丧失言语能力,即使他丧失了肢体行动的功能,也可以通过大模型hJGYG/rVKGpe6RyRTJ5d+uxZhV1oFkA/sdkCkm9FyWE=而重拾行动能力,从而成为功能上完整或健全的人。在这个意义上,“能说”比“能做”更重要,语言能力比行动能力更重要,更能体现人之为人的本质属性。

人的本质是语言性的,还表现为“人是对话中的人”。使用语言所进行的“人际对话”(人与人之间的对话)贯穿于人的学习、生活和所有活动中。人在学习中的成长,以及在协作中进行劳动或工作,都是在对话中实现的。提出交往和语言理论的苏联哲学家和文艺学家巴赫金(Mikhail Bakhtin)不仅把生活的本质看成是对话,认为思维、语言、艺术等都是人的一种对话方式,而且认为人的任何活动都处于一种开放式的不断对话的进程中。伽达默尔则赋予对话更为广泛的意义:与他人的对话是对话,对文献、历史、艺术的理解是对话,对世界的理解也是对话。(13) 在这个意义上,人所具有的语言本质折射为“人是对话中的人”。而大模型介入到人的学习和工作之后,人际间的对话越来越多地可以采取人机对话来实现。大模型在行使聊天机器人的功能时,开辟了人机对话的新形式,使人作为对话的人可以更便捷更有效地通过对话中获得“赋能”“赋智”,从而实现人的发展和提升,并且,这一效应可以得到空前的增强和更泛在地实现。同时人的以言行事也被进一步扩展到更多领域,越来越多的任务可以在人机对话中完成。当人机对话可以解决人所面对的一切问题时,语言能力作为人的本质能力就得到进一步彰显。

当然,人机合作的以言行事也带来了种种令人担忧的人文问题,如人在某些能力上的退化问题。当人借助大模型可以只从事“动口不动手”的“口头行动”或“口力劳动”时,身体行动、动手行动的能力大概率会衰退;当所有的事都是智能机器系统干得更好时,人还需要做什么?他还能够做什么?人是否仅会“以言行令”?换句话说,凡机器可以做的,如果我们都交给机器去做,那么随着越来越多的事交由机器去做,人的行为或行动能力会否日趋退化甚至丧失殆尽?人会成为“只会说话”的动物吗?“手”的价值或意义会不复存在吗?凡此种种,都需引起我们的警醒。

(四)责任的人机分担问题

责任问题是使用人工智能技术时普遍会遇到的问题,奥斯汀的以言行事也涉及到责任问题,其中包含了这样的强调:说话的人应该意识到他的说话是一种行为,因此说话时不仅要弄清所说的意思,同时要为所进行的说话行为承担后果与责任。在人机合作的以言行事中,这种责任无疑还会牵涉到智能机器,引出人机之间的责任分担问题,这就是:在使用大模型的以言行事中,当人们通过言语命令机器做事时,如果机器做出了错误的决定或者导致了不良的后果,那么责任应该由谁来承担?是说话的人即命令的发布者,还是执行命令的机器?进一步,如果命令本身并无过错,从而发布命令的人不具有责任,相应地也会引发“自由意志”的问题。在传统的以言行事的模式中,人们通过自己的言语来控制和指导自己的行为,人具有决定自己行为的“自由意志”。然而,在“人言+机器做”的模式中,人们的言语只是命令机器做事的手段,并不能直接控制自己的行为,这是否意味着人们在这种模式下失去了一部分自由意志?在缺乏自由意志的以言行事的过程中,人需要承担何种责任无疑成为行动哲学面临的新疑惑。还有,如果出言发令的人没有明显的过失,但执行命令的算法因为“不透明”而导致了错误的后果,如大模型因“幻觉”而进行的“一本正经的胡说八道”,生成了错误的结论或内容(也是“做错事”的一种情形),那么此时应该如何界定和分配责任?是算法设计者的责任更大,还是模型本身应承担部分责任?后者意味着,大模型在接收到人类的言语指示后进行操作即行事,是否具备一定的道德地位或代理能力?它的行动是否应当遵循特定的伦理准则?由谁来监督或治理这类问题?现行法律体系如何适应这种新型的人机交互模式,例如在合同法、侵权法等领域,如何认定“以言行事”的合法性及有效性?这些都是与担责相关的问题。

总之,大模型带来的人机合作的以言行事,在对人类行动方式带来革命性变化的同时,也极大地拓展了我们的哲学视野,遭逢了在语言观、行动观、责任观甚至人本观上的层出不尽的新问题。正是对这些新问题的探究,可以使哲学在大模型时代获取新的滋养。

注释:

(1) Sébastien Bubeck, Varun Chandrasekaran, Ronen Eldan, et al., Sparks of Artificial General Intelligence: Early experiments with GPT-4, arXiv:2303.12712.

(2) Timm Teubner, Christoph M. Flath, Christof Weinhardt, et al., Welcome to the Era of ChatGPT et al.: The Prospects of Large Language Models, Business & Information Systems Engineering, 2023, 65(4), pp.95-101.

(3) Yongliang Shen, Kaitao Song, Xu Tan, et al., HuggingGPT: Solving AI Tasks with ChatGPT and Its Friends in Hugging Face, arXiv: 2303.17580.

(4) [德]海德格尔:《人,诗意地安居》,郜元宝译,广西师范大学出版社2002年版,第46页。

(5) [德]伽达默尔:《论科学中的哲学要素和哲学的科学特性》,《哲学译丛》1986年第3期。

(6) Gerd Grübler and Elisabeth Hildt (eds.), Brain-Computer Interfaces in Their Ethical, Social and Cultural Contexts, Dordrecht: Springer Science+Business Media, 2014, p.150.

(7)(8) [加]德里克·德克霍夫:《文化肌肤:真实社会的电子克隆》,汪冰译,河北大学出版社1998年版,第36、250页。

(9) [英]达尔文:《人类的由来》,潘光旦等译,商务印书馆1983年版,第16页。

(10) [美]刘易斯·芒福德:《技术与人的本性》,载吴国盛主编:《技术哲学经典读本》,上海交通大学出版社2008年版,第497—500页。

(11) [德]恩斯特·卡西尔:《人论》,甘阳译,上海译文出版社2004年版,第159—166页。

(12) [美]尼尔·波兹曼:《娱乐至死》,章艳译,广西师范大学出版社2004年版,第11页。

(13) 徐朝旭:《从建构到对话中的建构:认识本质的重新审视》, 《厦门大学学报》 (哲学社会科学版)2003年第4期。

作者简介:肖峰,上海大学智能哲学与文化研究院、上海大学马克思主义学院特聘教授、博士生导师,上海,200444。

(责任编辑 胡 静)