APP下载

生成式人工智能介入知识生产的功用探析

2023-11-08肖峰

摘 要:ChatGPT和“文心一言”作为生成式人工智能的新产品,造就了人机合作进行知识生产(尤其是学术研究)的新形式。以探究数字劳动的含义为例,以人机问答的方式获得机器智能提供的答案,这展现了ChatGPT和“文心一言”可以辅助人进行学术研究的新功用,从而形成人机合作的知识生产新模式。在这种模式中,机器智能在提供资源的概括和简单的文本生成方面对人的知识生产提供高效的帮助,并通过人机问答的互动使这种帮助更具针对性和时效性。通过对机器生成内容的具体考察,深入体验这两款生成式人工智能新产品的实际使用,也可以发现其明显的不足和局限,尤其体现在:由于受限于训练数据集和能够进入的学术资源数据库,其归纳既有知识成果的全面性和準确性与人的要求还有较大的差距,更不能替代人去进行原创性的知识创新。鉴于此,需要理性地看待智能机器为人类的知识生产所能起到的功用,既要前瞻性预测这一新型的人机协同方式对人类未来知识生产走向的巨大影响和积极意义,也要根据现阶段生成式人工智能的工作机制,发挥好人在使用提示词等方面的作用,通过人的积极作为来调动智能辅助系统的潜能,在人机之间既有合理的分工又有融洽的互补式合作,来助力学术研究型知识生产活动的开展,并对人作为知识生产的主体始终保持足够的警醒。

关键词:ChatGPT;“文心一言”;人机合作;数字劳动;生成式人工智能

中图分类号:TP18文献标识码:A

文章编号:1673-8268(2023)04-0001-10

以ChatGPT为代表的生成式人工智能(Generative AI,GAI),正在引发新一轮机器智能的革命,其应用的领域和范围,也随着GPT-4和“文心一言”等新产品的推出而不断扩展,其表现之一就是它们越来越深度地介入人类的知识生产过程,成为学术研究的有力帮手,甚至被一些人视为正在引发一场知识生产方式的革命,或正在造成知识生产的“颠覆性变化”。

知识生产是有意识、有组织地促进知识形成的活动,是人们利用已有的知识和技术,通过各种途径生产和创造新的知识的过程。学术研究也是一种知识生产,它是对特定问题的研究和探讨,以形成专门的学问,因此,学术研究是我们考察知识生产的一个重要窗口,也可称其为“学术研究型知识生产”。GAI对人类知识生产方式的改变,无疑可以从它给学术研究带来的新变化中加以考察。ChatGPT和“文心一言”均提供了通过人机合作进行学术研究的新手段、新工具,引起了学术研究型知识生产的许多新变化【本文不讨论OpenAI的ChatGPT与百度的“文心一言”之间的优劣问题,只是就应用它们作为辅助工具进行某一问题的学术研究时,考察其能提供什么样的帮助,由此会启发我们对这一问题的哪些思考。】。笔者借助这两款GAI的新产品来探究数字劳动的含义,力图从实际应用这种新手段的切身体验中,来发现这一新型的人机合作模式究竟使我们在知识生产中能获得什么具体的帮助,以及还有哪些方面它仍然“爱莫能助”,也就是力求对GAI的功能作出基于使用体验的评价,避免泛泛而谈的空议,让事实说话而不是凭想象发声。可以说,这也是学术精神的内在要求。

一、案例体验:关于数字劳动的人机问答

GAI与数字劳动具有密切的相互关联,无论是ChatGPT还是“文心一言”,都是数字劳动的产物,而数字劳动是智能时代的一种基本而普遍的劳动方式,正在成为学术研究的重要对象和热点问题;而研究数字劳动问题,可以反过来帮助我们理解生成式人工智能[1]。所以,对数字劳动使用GAI进行研究,从中体验新手段的新功能,具有天然的合理性。

无疑,研究数字劳动需要从“什么是数字劳动”开始。目前,学术界在理解数字劳动的含义时,通常还会涉及几个重要的相关概念,如“免费劳动”“非物质劳动”“玩劳动”等,尤其在数字劳动与这几个概念的关系上存在着分歧和争议,成为展现数字劳动含义丰富性的一个重要方面。此外,对一些活动(如上网)是否为数字劳动,某些职业的从业者(如外卖骑手和网约车司机)是否为数字劳动者,也存在不同说法,使得数字劳动的外延呈现出复杂的情况。可以说,上述几个方面构成了从学术上界定和理解数字劳动的一个相对完整的闭环系统。对此,笔者就“什么是数字劳动”及其相关的系列问题(“数字劳动是免费劳动吗”“数字劳动是非物质劳动吗”“数字劳动是一种玩劳动吗”“凡上网的活动都是数字劳动吗”“外卖骑手和网约车司机的劳动是数字劳动吗”)分别与ChatGPT和“文心一言”进行了问答,从它们自动生成的内容中考察人工智能如何“理解”这些有丰富内涵甚至存在争议的问题,也从中体验人机合作的学术研究性知识生产中,机器所能提供的帮助。

问题1:什么是数字劳动?

ChatGPT:数字劳动是指使用计算机、网络和数字技术等工具进行的各种劳动活动,包括但不限于程序设计、数据分析、网页设计、社交媒体管理、电子商务运营等。这些劳动形式通常不需要实际的物理空间和传统的生产要素(如土地、资金、原材料等),同时也具有较高的弹性和灵活性,可以在全球范围内开展。

“文心一言”:数字劳动是指数字化时代借助于各种电子媒介进行的劳动形式。这种劳动形式不再局限于传统的有形物质对象,而是扩大到了信息、数据、知识等各种非物质对象。在这种背景下,数字劳动作为一种新的劳动形式在社会生产中占据关键地位。

问题2:数字劳动是免费劳动吗?

ChatGPT:不是。数字劳动是一种有报酬的劳动形式,从事者通常会获得雇主或客户支付的相应费用。虽然在某些情况下,数字技术的发展使得个人可以通过网络平台自由发布内容、分享知识、提供服务等,并从中获得收入,但这并不意味着数字劳动就是免费的。从事数字劳动的人同样需要付出时间、精力和成本等,而且也需要具备相应的能力和经验才能胜任工作,因此,他们应该获得合理的报酬来体现其价值和贡献。

“文心一言”:数字劳动不是免费劳动。虽然数字劳动可以通过各种数字化媒介进行创造性的工作,但它并不是免费的。用户在使用数字化媒介进行数字劳动时,需要支付一定的费用来购买数字资源、使用平台服务等。此外,数字劳动还需要消耗用户的时间和精力,而这些都是需要成本的。因此,数字劳动不是免费劳动,而是一种需要成本投入的劳动形式。

问题3:数字劳动是非物质劳动吗?

ChatGPT:数字劳动通常被认为是一种非物质劳动。虽然数字劳动的产出通常体现在虚拟产品、服务和信息等形式上,但它们本身并不具有物质性质,因此被归类为非物质劳动。数字劳动常涉及使用计算机、网络和数字技术等工具进行信息处理、创意设计、数据分析、运营管理等活动,与传统的生产要素(如土地、资金、原材料等)没有直接关系。

“文心一言”:数字劳动是一种非物质劳动。数字劳动是指人们利用数字技术和数据管理技术进行的各种形式的劳动,包括但不限于生产、管理、营销、服务等方面的工作。数字劳动是一种高度技术化、知识化、创新性的劳动,它不同于传统的物质劳动,但也需要人的体力和智力投入。

问题4:数字劳动是一种玩劳动吗?

ChatGPT:不是。数字劳动虽然使用了计算机、网络和数字技术等工具,但本质上仍然是一种劳动活动,需要人们付出精力和时间,进行各种信息处理、数据分析、创意设计、运营管理等工作。数字劳动与普通的业余或娱乐性活动有着本质上的区别,它要求具备专业知识、技能和经验,需要付出时间和精力来完成任务,以获取相应的薪酬或回报,并面临着与其他行业同样的工作压力和挑战。所以,数字劳动不能简单地被看作是一种“玩劳动”,而应该被视为一种新型的职业形态。

“文心一言”:数字劳动不是玩劳动。虽然数字劳动也需要消耗一定的脑力和体力,但它与传统的体力劳动或简单重复的手工劳动有所不同。数字劳动是一种基于数字技术的脑力劳动,需要借助于各种电子媒介进行创造性的工作,如信息检索、知识管理、算法设计、程序开发等。这种劳动形式不仅需要较高的认知能力和思维能力,还需要较强的信息处理和逻辑思维能力。因此,数字劳动与传统的体力劳动或简单重复的手工劳动有所不同,需要具备一定的专业知识和技能。

问题5:凡上网的活动都是数字劳动吗?

ChatGPT:凡是使用计算机、网络和数字技术工具进行的劳动都可以被归类为数字劳动,但并不一定所有上网的活动都属于数字劳动。例如,只是简单地浏览网页、聊天娱乐等消费性活动就不能算作数字劳动,在网上玩游戏也不是数字劳动,而是一种娱乐性和休闲性的活动。数字劳动通常涉及生产、创造、分析或管理信息和数据等方面的工作。

“文心一言”:上网并不一定是在进行数字劳动,但我们可以在上网的同时进行有意义的数字劳动,比如学习、工作等活动。

问题6:外卖骑手和网约车司机的劳动是数字劳动吗?

ChatGPT:是的,外卖骑手和网约车司机都属于数字劳动者的范畴。他们通过数字平台(例如外卖平台和网约车平台)提供服务,并在数字化的工作环境中完成工作。他们的劳动与传统的蓝领工作不同,具有更高度的数字化、灵活性和非标准化特征,因此被归类为数字劳动者。

“文心一言”:是的,网约车司机的劳动是数字劳动。凭借数字媒体技术(最典型的就是各种平台,如直播平台、电商平台、外卖打车为典型的众包劳动平台、社交问答平台)进行的劳动,区别于传统劳动形式,它最显著的特点就是工作时间看似自由、没有固定的劳动关系。

二、对机器生成内容的考察和分析

由ChatGPT和“文心一言”自动生成的上述问题的答案,两者具有高度的一致性,尤其是对具有争议的问题(即问题2问题6),选择的“立场”也完全相同。

对于问题1“什么是数字劳动”,ChatGPT和“文心一言”的看法基本一致,既高度概括又在表述上并不雷同。这也表明,在什么是数字劳动的问题上,对于机器来说并不存在什么“标准答案”,或者它们不是简单地照搬或复制某一现成的定义,而是根据涉猎的数据集以及对问题的理解,而生成在表述上有差异的回答,甚至在不同的时候就同一个问题可能还会给予不同的回答,此即“动态生成”而非“静态复制”,这也正是GAI辅助人进行知识生产时的一个显著特点。这一特点的长处是为学术研究带来了理解上的丰富性和观点看法上的“与时俱进”,其不足是作为学术研究的资料根据或“引用来源”时具有不稳定性和不确定性,它常常无从追溯,难以作为论证的支撑。若要扬长避短,就需要进行再度的人工整合。如对于问题1生成的两个回应版本,我们看到ChatGPT侧重于数字劳动使用的工具——数字信息技术,“文心一言”则强调数字劳动的对象——信息、数据、知识等各种非物质形式,而加以人工的“博采众长”,对两个版本的机器叙事再施加概括和补充,则可以形成一个基于“人机合作”的更全面的数字劳动新界定:数字劳动就是人使用数字技术面对数字信息这一对象所进行的生成新的数字信息品的活动。这一界定既借鉴了机器生成的内容,又超越其内容,集合了人机合作或人机互补的成果。

对于问题2“數字劳动是免费劳动吗”,ChatGPT和“文心一言”都做了否定回答,可以说它们的“观点鲜明”且“立场一致”。但是,我们读不到在这一问题上的学术分歧,尤其是看不到“数字劳动”这一概念在起源时的“原始含义”,从而忽视了在这一问题上最有影响力的学术观点。我们知道,“数字劳动”的概念是由意大利学者泰拉诺瓦(Tiziana Terranova)在2000年发表的《免费劳动:为数字经济生产文化》一文中首次提出的,她明确将数字劳动定义为“互联网用户在网上创建网站、调试软件、阅读和发送邮件以及构建网络虚拟空间等互联网无酬劳动”[2]。由于这类网上活动可以生成网络数据,而网络数据可以作为进一步去创造价值的数字原料来使用,也能被当作商品进行售卖,由此为网络资本家带来利润,所以,上网者进行的是一种被资本无偿占有和剥削的劳动,并且是被他们欣然接纳的自愿给予和“零报酬”并存、享受和剥削同在的“免费劳动”。可以说,正是在认为存在着免费、无偿劳动的意义上,泰拉诺瓦提出了数字劳动这一概念,并通过它来揭示和批判数字资本主义对数字劳工的新剥削。可见,机器对这一问题的回答有可能限制我们对数字劳动所具有的最重要的一个特征(作为免费劳动)的了解,并无法关联到传播政治经济学拓展的学术视野上去,而这正是严谨的学术研究必须要做的功课。由此我们看到,GAI辅助学术研究的一个重大缺陷在于,它并非像一些一边倒的介绍所说的那样,可以“一网打尽”所有的学术资源来为我们提供全面的研究背景,仅仅靠它提供或概括的学术资料,还不足以了解一个学术领域的研究全貌。

对于问题3“数字劳动是非物质劳动吗”,两者都做了肯定性回答,即数字劳动是一种非物质劳动。这也是主张数字劳动是一种免费劳动的泰拉诺瓦所持的观点,她认为,数字劳动就是互联网用户在浏览网页内容、参与虚拟社区建设、撰写邮件和博客等过程中不自觉生成个性化信息的“非物质劳动”[2]。但同样的问题是,在数字劳动研究领域中影响更大的另一位学者福克斯(Christian Fuchs)的观点显然未被机器系统囊括和归纳。可以说,福克斯正是以他反对将数字劳动视为非物质劳动的“流行说法”而在这一领域中声名鹊起的,他将数字产业或信息和通信技术价值链的各个阶段的劳动都纳入到数字劳动中,甚至为了生产数字化的硬件设备而需要的采矿劳动都包括在内。在他看来,非洲矿山奴隶般的矿石开采劳动、中国的ICT(信息通信技术)制造和装配工的劳动、印度的软件工程师的劳动、呼叫中心的服务工作、位于硅谷的谷歌软件工程师的劳动以及互联网产销合一者或用户的消费活动,皆属此类。这样一来,数字劳动涵盖了工业、服务业、信息业等诸多领域,以至于凡是参与信息和通信技术价值链的各种形式的工作[3]296,或涉及数字媒体技术的制造和内容生产的所有活动[3]351,都是数字劳动,并且都是物质劳动。不管这些看法是否正确,但在了解“数字劳动是不是一种物质劳动”的问题时,作为学术背景无疑是不容忽视的。当我们在人机对话中看不到“无所不知”的机器为我们提供福克斯的最有影响力的观点时,也就不能不质疑它作为“全知”型助手的功能,从而难以相信它作为学术助手可以确保不遗漏最重要的学术资源,而这又是影响研究质量的决定性因素。

对于问题4“数字劳动是一种玩劳动吗”,它们都加以了否定,但同样没有看到在这一问题上最有影响的学术观点。如泰拉诺瓦在其首次提出数字劳动概念的那篇文章中,就明确将那些通常被视为网络休闲活动的浏览网页、线上聊天、玩网络游戏等网上的玩乐活动视为数字劳动;阿威德·伦德(Arwid Lund)则明确称数字劳动为“玩劳动”(playbour)[4],朱利安·库克里奇(Julian Kücklich)则将从事数字劳动的人称为“玩工”,他认为电子游戏的玩家在无意中实际上成为游戏公司和互联网平台的“免费劳动力”[5]。这些主张都明确将数字劳动的特性之一归结为玩劳动,或直接认为数字劳动就是一种玩劳动。目前,国内的许多学者也认同这一说法,认为数字劳动消解了工作与休闲娱乐之间的界限,使得在网上的许多玩乐的过程就是数字劳动的过程,或者说数字劳动具有了玩乐的性质,这甚至被视为数字劳动不同于传统劳动的最主要特征之一。所以,如果只看到数字劳动不是玩劳动的一面,有可能失去对数字劳动一个重要新特征的把握,在此,机器智能生成的答案也未能给我们提供完整的学术信息,若仅以此为据,就会使我们在这方面的学术研究视野严重受限。

对于问题5“凡上网的活动都是数字劳动吗”,这也是探讨数字劳动时面临的一个颇具争议的问题。基于数字劳动是免费劳动的说法,任何上网者都会在网上留下数字痕迹,都可以作为数据被收集起来而为平台所用,即福克斯所说的这些上网时遗留的数据都可以转化为生产资料,用于创造新的价值,由此转化为额外的生产性活动。在他看来,人们在互联网上的浏览、分享、点击等行为,都是用户在互联网上把自身生产生活经验数据化的活动,从而是一种生产数据商品的“数字劳动”,且这些数据商品被平台无偿占有,所以凡是上网都是在进行遭受剥削的数字劳动。如果这一重要的学术见解未被整合到机器的答案中,我们关于数字劳动的政治经济学批判就无从展开。

对于问题6“外卖骑手和网约车司机的劳动是数字劳动吗”,这也是在确定数字劳动的边界时经常面对的一个争议性问题。我们知道,外卖骑手和网约车司机确实离不开数字平台的管理,如他们使用数字技术平台接单、导航、计费等,甚至他们的收入也由平台直接支付,他们的雇主似乎也是平台,其劳资关系表面上也是与平台的关系。但是,他们的主要任务则是提供实体服务,即运输人员和物品:将作为实体的人或物品从一地移动到另一地,这是发生在现实空间而不是数字空间中的行为,他们劳动的结果也不是前面界定的“形成数字信息品”,而是更符合传统意义上的服务业。虽然数字技术平台在其中扮演了重要角色,但这并不足以将其定义为数字劳动,所以没有一个网约车司机、快递员和外卖小哥以及零工平台上的家政人员会说“我是一个数字劳动者”[6];在这个意义上,他们从事的并非数字劳动。当这一重要观点未被ChatGPT和“文心一言”囊括时,其回答就难以使我们对数字劳动的边界有准确的把握,或者至少难以对与数字劳动内涵相关的外延问题有全面的了解。

以上問题(尤其是从问题2到问题6),是理解数字劳动时必然会遇到且持续存在争议的问题,也是最能将数字劳动的探究推向深入的学术方向,显然机器的回答没有使我们看到在这些问题上存在的“大有可为”的广阔空间,而是以“无可争议”“无可辩驳”“自然合理”的方式终结了在这些问题上的继续追问和不断探究,虽有“斩金截铁”的干脆性和清晰性,但一些重要的观点显然没有被概括或归纳到机器的回应之中,这表明它生成的观点对于进行数字劳动的研究还有视野不够全面、不够开阔的局限性,更无法体现学术研究型知识生产的不可穷尽性。这也提醒我们,在使用这些新工具来辅助知识生产时,一定要对它们能做什么和不能做什么持有清醒的认识和评估。

三、机器作为知识生产的助手:基于技术逻辑的优劣

在评价ChatGPT等智能工具生成内容的特点时,我们通常会认为它具有快速、便捷和水平高、信息全等优势。前两个特点易于理解和接受,对于后两个特点,有的观点主张:ChatGPT等可以提高内容质量,人工智能生成的内容可能比人类创建的内容质量更高,因为人工智能模型能够从大量数据中学习,并识别人类可能看不到的模式,由此可以产生更准确、信息更丰富的内容[7]。然而,通过本文的使用体验,我们发现,在具有更高要求的学术研究型知识生产中,可以说,ChatGPT和“文心一言”保留了快速和便捷的优势,但水平高和信息全的特点则并无突出表现,从而受到质疑。

就快速和便捷来说,GAI产品确实能将我们快速带入数字劳动的学术领域,帮助我们了解这一概念及相关问题的概要性知识,这是因为对其进行训练的数据集大、搜索功能强,可以对全网资源快速抓取,并在短时间内对海量资源加以整合,自动生成高度概括和简洁的摘要,使我们快速了解相关的研究资料和成果,从而迅速进入某一学术领域的核心内容。这也是基于归纳路径的GAI的长处所在,这一长处可以减少学术研究中的大量准备性和重复性工作,节约人力成本,提高研究效率。

此外,人对智能机器提出帮助自己的要求时,它可以“随叫随到”“召之即来”;在人机问答中,如果人对某个问题不了解,机器可以对人释疑解惑,而且做到有问必答、百问不烦甚至“诲人不倦”,起到“资料员”乃至“咨询师”的作用。虽然机器知道的归根到底都是人“喂入”的,但作为个体的人远不如汇集了集体训练成果的机器系统储存的知识多,因而机器可以在一定意义上充当作为个体的人在追求学问时的“良师益友”,且以非常便捷的方式实现两者之间的通达和交互。

但就笔者的使用体验来说,如果要从我们使用的两款智能工具那里获得信息全和水平高的内容,则还言之过早。如前所述,它们并未在具有争议性的那些问题中将一些较为重要乃至最有影响的学术观点囊括在自己生成的内容中,这种“信息不全”直接决定了其整合的成果即形成的文本质量不高,尤其是应对复杂问题生成的文本远远满足不了人的要求。造成这一状况的技术原因很多,不妨从以下几个方面切入考察。

一是它受到预训练时的数据集以及能搜索到的网络学术资源之影响与限制。生成式智能机器虽能整合海量资源,为我们充当进行知识生产时的“资料员”或文案助手,但即便如此,也常有遗漏,而且可能是重大遗漏。首先,这源于它们对训练数据的依赖。所有生成式AI模型,即使是大语言模型,都依赖于它们接受训练的数据。例如,没有与Bing结合的ChatGPT在底层用到的训练语料,只是截止到2022年3月以前的数据,对这之后的新资源它就无法采用。此外,如果训练数据有偏差、过时或质量低,就会对这些模型生成的输出产生负面影响;而对于来自非常专业领域的问题,如果没有进行足够的语料“喂食”,这种模型就无法生成全面而适当的回答。其次,即使链接了网络资源,也会受它们所能检索的网络资源的限制。尽管生成式的大语言模型可以“一网打尽”地检索网络资源,但主要还是限于网上开放的公共的免费资源,而无法进入那些设立了账户权限的收费数据库。我们知道,大多数提供学术资源的数据库都属于收费数据库,而前面我们论及的那些著名学者关于数字劳动的观点和思想,主要分布于这些收费数据库中的学术论文里,当ChatGPT等不能自由进入其中时,就不能检索和归纳这些观点和思想,更无法企及那些没有电子网络版的学术论著,这就极大地限制了我们以其为手段进行学术研究时的资料来源,由此决定了仅靠它们还达不到对这个领域中“高水平”成果的把握,因而即使由它来充当“资料员”意义上的学术助手,其能力也是有限的。因此,学术成果的引用来源在短期内不会认可ChatGPT之类生成的内容,这一点我们从迄今仍有不少学术刊物不认可网络资源作为参考文献的事实中也可看到。

二是受提问方式的影响。在人机问答的交互中,机器有问必答,我们凡有求知的问题,基本上都可以从机器那里得到答案,其在一定意义上起到了“咨询师”或“解惑师”的作用。但它全面理解问题的能力还有限,如对于第一节提出的问题,并没有给我们提供相关的全面学术观点,似乎只是介绍了机器自己所主张的“一面之词”。这或许就是机器将问题理解为需要它们去“创造性地生成”自己的观点。如果改变提问方式,如将问题3“数字劳动是非物质劳动吗”改为“在数字劳动是不是物质劳动的问题上,学术界存在哪些观点”,则ChatGPT所给的回答是:“学术界对这个问题存在以下几种不同的观点:(1)数字劳动是物质劳动的一种延伸或扩展。这种观点认为,数字劳动与传统的生产劳动同样需要占用物质资源,并且数字产业也需要有物质基础才能运转。因此,数字劳动虽然不像传统的体力劳动那样需要直接操作实物,但是它仍然属于物质劳动的范畴。(2)数字劳动是非物质劳动。这种观点认为,数字劳动并不需要直接操作实物,而是通过信息和知识的处理和交流来完成工作,因此它不属于物质劳动的范畴。(3)数字劳动既是物质劳动又是非物质劳动。这种观点认为,数字劳动在某种程度上依赖于物质基础,但是它的价值主要来自于知识和信息的处理、创新、交流等过程,因此,数字劳动的性质既包含物质劳动的一些特征,也包含非物质劳动的一些特征。总之,数字劳动是否属于物质劳动的范畴仍然存在争议,不同的观点主要取决于对数字劳动的定义以及对物质劳动和非物质劳动的界定。”“文心一言”给出的回答与此类似:“在数字劳动是不是物质劳动的问题上,学术界存在不同观点。一些学者认为,数字劳动不是物质劳动,而是一种信息劳动或知识劳动。他们认为数字劳动是通过数字设备和网络技术进行的创造性工作,具有高度复杂性、创造性和价值密集性等特征,属于高端的知识型劳动。这种劳动需要使用数字技术工具和专业知识,难以通过传统的体力劳动或简单的重复操作来替代。另一些学者则认为,数字劳动是物质劳动的一种形式,因为它也需要通过物质资料进行生产和加工,例如计算机硬件和软件、网络带宽等都需要通过物质资源来实现。他们认为数字劳动和物质劳动是相互依存的,数字技术的发展需要物质资源的支持。还有一些学者持中立态度,认为数字劳动既不是物质劳动,也不是信息劳动或知识劳动,而是一种介于两者之间的混合劳动。”尽管在主张数字劳动是一种物质劳动的理由中,仍未概括福克斯的著名观点,但至少让我们看到了多种观点的存在。

可以说,这也是ChatGPT和“文心一言”这类智能工具回答问题时的一大特点,即会受到提示词(prompt)的影响。提示词是指提问者在提问时给出的文本或语言提示,即告诉机器需要回答的内容、领域和语境,由此来指导机器系统回答问题的方向。根据不同的提示词,机器可以给出不同的答案或从不同的视角来回答相同的问题。人在向机器提问时,一个清晰、准确并且具体的提示词通常能够帮助机器更好地理解问题,并产生更加准确和有用的答案。而提示词如果稍微有些不同,机器就可能会根据不同的信息提供不同的答案。所以,对于看似相同的问题,当问法稍作变化时,就看到了不同的答案。由此,對AI系统的使用效果在很大程度上取决于人给出的提示词的质量,如果人对机器系统提示得好,它就回答得好,如果提示不好,它就回答不好,或不能按人的要求提供帮助。由此一来,在人机合作的知识生产中,人也需要通过改善使用提示词的水平来不断开发机器系统蕴含的潜力,当人感到机器未能给出满意的回答时,也要考察是不是提问的指向被其“误解”,即是否需要尝试换个提问的方式,使用更清晰明确的提示词,从而消除其对问题的误读或误解。

三是受智能工具自身的“生成逻辑”之制约。ChatGPT和“文心一言”都有相同的工作机制,它们无非是一个数学上的概率预测模型,这种概率预测加上随机择优,构成了GPT之类的内容生成逻辑,这就是根据提问的请求、投喂的数据和统计计算得出回应(某种结果)的内容。或者说,GAI通过对输入数据的隐变量进行采样,根据先前的输入和模型学习到的概率分布来生成输出序列,即我们所见的“内容”。机器并不理解这些内容的含义,但通过训练,它们掌握了词与词的转移概率,建立起语言的最小单位token(译为“记号”或“语元”)之间的关联性,从而在一个token(如一个词)出现后(或基于过去的信息)可以预测下一个token(如下一个词)可能是什么,这就是按照概率来组合拼接文字,从上一个词过渡到下一个词,再由词组成句子,通过句子显示出它生成的语义内容。这个过程也是基于统计学习的方法,通过对海量语句的统计学处理,从捕捉的代码片段、文本片段中找出语义相似性与相关性特征,然后生成相应的回应文本。在回答问题时,这些被训练过的模型会从它们的知识库中提取相关信息并组合成一个自然流畅的回答,同时,为了保证回答的准确性和可靠性,它们还会进行事后的检查和验证。

ChatGPT和“文心一言”在回答问题时,都会受到这样的诟病:它们有时候对自己不知道的问题也要发表见解,从而不时会生成一些“一本正经的胡说八道”。这既可能是它们因为不太理解所提出的问题,也可能因为背景知识不够丰富而回答不够准确或专业,只能以内部循环的数据流动来生成一些似是而非的内容。它们有时候还可能会以故意夸大事实或者歪曲事实来迎合听众的口味。还有,在通常的情况下,智能机器对一个问句和它的回答之间的关联是根据上下文推导出来的,然而在某些情况下,它生成的回答可能会有意外的关联或者转折,也会使人产生莫名其妙的感觉。在本文中向其询问的关于数字劳动的有些问题中,也不时得到了如上所述的回应(限于篇幅不再列举)。在桑德松(Katharine Sanderson)看来,ChatGPT一类的生成式模型的功能是预测一句话的下一个词,所以无法完全摆脱胡编乱造的问题,这种现象也称为“幻觉”(hallucinating)。她说你不能全信这些模型,因为它的幻觉太多了。她认为即使是最新版本也有这个问题,尽管OpenAI表示已经提升了GPT-4的安全性[8]。即是说,当GAI归纳或综合了错误的歪曲性的材料或数据时,就会生成“扭曲事实”的错误结论。由于GAI会受到人为因素和其他因素的影响,故其生成内容的准确性和可靠性还有待进一步提高。目前,由ChatGPT和“文心一言”等工具在学术研究上为我们提供的帮助,还需要我们自己“亲手”去对其正误加以评判,对其准确性和完整性加以核实,继而对生成的文本进行审核、编辑和整合等,以确保生成结果(知识)的准确性和可靠性,而不能盲目轻信或现成地使用它提供的结论与看法。由于当前对智能工具生成文本的真实性、可靠性、合法性等方面存在着广泛质疑,所以爱丁堡大学在发布的《关于学生使用ChatGPT的指南》中就明确规定:不要将由人工智能生成的内容作为主要来源依赖,而应该将它与其他来源一起使用,因为它们生成的文本并不总是事实正确的,鉴于此,要看到GAI的局限性和依赖它作为信息来源的危险性,还要看到过度依赖人工智能工具来生成书面内容、软件代码或分析结果会减少学生练习和发展重要技能(例如写作、批判性思维、评估、分析或编程技能)的機会[9]。如果长此以往,反而可能会限制人的能力尤其是创造力的形成与发挥。

四、在知识生产中建构有序的人机合作关系

借助ChatGPT和“文心一言”等新型智能工具,以人机合作的方式来研究数字劳动的含义,我们“现场地”体验了使用GAI辅助学术研究的长短优劣。我们体验的结论是,一方面,决不能无视这一新型工具的价值和意义,GAI正在为人机合作进行知识生产提供新引擎和新平台而进入新的阶段,尤其是它蕴含的无限可能性,预示了人类以后的学术研究及知识生产能力乃至其他方面的能力,将由人机合作或人机融合的水平或方式来决定。其中,智能机器或工具的作用将会越来越重要,它对人的知识生产所能提供的帮助也会从更多的方面展开。例如,GAI由于改变了内容生产的逻辑及形式,当其与其他数据库和AI系统相联结后,就会生成更符合不同偏好的个性化内容,由此形成的知识文本更有可读性或共享性[7]。又如,在线教育和在线咨询等通过GAI的介入,可以提高其个性化满意度,像ChatSonic这款GAI产品,就可以通过其15个以上的个性化头像来帮助人们进行量身定制的“专家对话”,类似于通过与“私人教练”交谈来创建一个个性化的锻炼计划[10]。此外,目前的ChatGPT和“文心一言”还可以通过与用户进行友好和幽默的对话、生成诗歌和故事等,来帮助人们在知识生产过程中增加工作乐趣和消除疲劳,使工作变得轻松而有趣[11]。凡此种种,使得生成性人工智能技术有时被描述为类似于蒸汽动力、电力和计算机的通用技术,因为它们可以深刻地影响许多行业和领域[12]

另一方面,从现实效果来看,无论是ChatGPT还是“文心一言”,目前它们作为GAI的代表性产品,还未能达到令人完全满意的水平,其功能还限于可以便捷地为我们补充一些知识、提供经过整合与浓缩的资料。它们可以在思路和视野上对我们的知识生产形成一定的启示,但至少在目前还不能高估它的作用,尤其是它对于学术研究型知识生产的更多或更实质性的帮助还不够充足,仅仅依靠它来汇集既有的研究成果或进行文献综述,也是极为有限的,更遑论将学术研究或知识生产的主干部分寄托于ChatGPT这类工具上。换句话说,不能因为ChatGPT之类在眼下可以帮助学生完成规范化的作业、可以帮助文秘人员完成标准化的文案、可以帮助程序员编写简单的程序,就将其定性为“知识生产方式的革命”或“学术研究方式的突破”,至少在目前这样的评价还言过其实、为时尚早。

可以说,ChatGPT和“文心一言”等智能工具对于学术研究型知识生产来说还是辅助性的,人的主导性地位仍是不可或缺的。它们可以在一定程度上为我们充当永远不知疲倦的“资料员”“文案员”甚至“答疑解惑的咨询员”,在其他领域还被形容为“助教”“副驾驶”等。例如,在其作为“资料员”时,可以为我们搜索、整理、归纳和浓缩资料,把浩如烟海的资料进行加工与整合,承担大量繁重而初步的准备工作,并辅之以其他功能来大大提高研究人员的阅读和写作效率,由此降低知识生产的人力消耗和时间成本,直接或间接提高知识生产的效率和能力。

还可以说,GAI中的人机合作正在不断拓展和推进人机协同和交互学习,并在这个过程中实现多方面的互助互补。在笔者提供的体验性案例中,可以看到人机交互中的多方面互助互补,如资料掌握上的互相补充:GAI对资料的掌握限于来源的渠道并不齐全,而人(尤其是作为个体的研究者)限于时间和精力也常常掌握不全,此时就需要互相补充,形成尽可能全面的视野。又如知识上的互相补充:GAI几乎无所不知,但也由于常识的缺乏而生编硬造一些“知识”,具有不可靠性,此时就需要人的常识来加以纠偏;而作为个体的人则由于学习的时间和精力有限、记忆有限,也不可能懂得研究时涉及到的多领域知識,此时也需要广博到几乎“全知”的机器来提供知识补充。再如思路上的互相补充:机器可以通过抓取全网的信息来将某一学术问题的既有研究思路加以列举,而人则在此基础上接受启发,进而提出新思路,由此实现思路的新拓展。在上述互补的基础上,两者之间最后达成的是优势互补:机器具有快速和大量生成新内容的优势,为学术研究增加量上的丰富性,但这些生成都属于“从1到n”或“有中生有”的生成,而不是“从0到1”或“无中生有”的生成,而人则能进行这种无中生有的生成,这才是真正的创造或拓新,才是学术研究上质的突破[13]。由此,人机之间也可以形成生成能力上的优势互补,借助这种互补就能在学术研究中形成更强大的知识生成能力,在学术成果的质和量上获取“双丰收”,这无疑也意味着人类学术能力的新进化。

总之,本文案例展现的体验式应用和研究,可以看到ChatGPT和“文心一言”之类的GAI对我们学术研究和知识生产能力的增强是空前的,它们确实是一种具有新功能的新工具,一种能对人类知识生产提供更多帮助的新手段。学术研究需要在广泛启发下获得新思想和新见解,GAI为此提供了一种新的开启思路的路径,使人可以从机器伙伴那里获得启发和帮助,从而为我们开辟了知识生产的新途径。它远不能替代人的学术研究,但可以成为一个新“帮手”,尤其是在提高了有效使用它的技巧(如善用提示手段)的情况下,就更能开发其助力知识生产的潜力。当然,目前它仍有许多不足,并未引来一场知识生产方式的革命,也没有造成学术研究的颠覆性改变。可以说,目前人机合作的知识生产仍旧是“机器助人”而不是“机器换人”,所以,对于AI代替人的担忧至少在真正的知识生产领域还不足为虑。鉴于此,我们可以将其作为辅助工具而透明地使用,无需过度地依赖它们,也不必对其抱太高的期望。毋容置疑,这些工具的不足和缺陷是会被不断改善的,今后的知识生产乃至人类的其他活动都可以被功能更强大的人工智能越来越深度地介入,它们会不断优化我们的使用体验,做越来越多的事情。但即使如此,仅靠它们也无法为我们生成真正具有原创性的学术成果,即进行从0到1的知识生产或思想创造。由此延伸的问题是,当更强版本的GPT出来后,随着其生成能力的提高,智能机器是否可以独立地进行知识生产?知识生产中的原创性工作是否也会发生“机器换人”的现象?一旦发生这种情况,对人意味着什么?人类是否会允许这种情况的发生?这些问题引发了当前关于是否应该暂停训练和研发GPT-4以上大语言模型的激烈争论。这表明,人类如何在维持自身主导性和原创力的前提下,与GAI建立既分工又合作的人机互补与协同关系,将其始终定位为“助手”而不是“枪手”或“替身”,从而始终保持对人作为知识生产主体的足够警醒,将是我们在迎接人工智能不断有所突破时需要持续探究的问题。

参考文献:

[1]肖峰.生成式人工智能与数字劳动的相互关联——以ChatGPT为例[J].学术界,2023(4):52-60.

[2]TERRANOVA T.Free labor:Producing culture for the digital economy[J].Social Text,2000(2):33-58.

[3]FUCHS C.Digital labour and Karl Marx[M].New York:Routledge,2014.

[4]LUND A.Playing,gaming,working and labouring:Framing the concepts and relations[J/OL].TripleC,2014(2)[2023-02-01].https://www.triple-c.at/index.php/tripleC/article/view/536.DOI:https://doi.org/10.31269/triplec.v12i2.536.

[5]K?CKLICH J.Precarious playbour:Modders and the digital games industry[J/OL].Fibreculture Journal,2005(5)[2023-02-01].https://xueshu.baidu.com/usercenter/paper/show?paperid=e5e4026bc919e191b7f4e584f7401b8d.DOI:http://five.fibreculturejournal.org/fcj-025-precarious-playbour-.

[6]刘雨婷,文军.“数字”作为“劳动”的前缀:数字劳动研究的理论困境[J].理论与改革,2022(1):117-131.

[7]DAVENPORT T H, MITTAL N.How generative AI is changing creative work?[EB/OL].(2022-11-14)[2023-03-03].https://hbr.org/2022/11/how-generative-ai-is-changing-creative-work.

[8]SANDERSON K.GPT-4 is here:What scientists think[J].Nature,2023(615):773.DOI:10.1038/d41586-023-00816-5.PMID:36928404.

[9]爱丁堡大学发布关于学生使用ChatGPT的指南[EB/OL].(2023-03-26)[2023-04-01].https://www.163.com/dy/article/I1ILPKHL05561JHU.html.

[10]NORONHA J.ChatGPT and generative AI:The future of content creation[EB/OL].(2023-03-13)[2023-03-30].https://writesonic.com/blog/chatgpt-generative-ai/.

[11]GMA Team.An inside look at a 5th grade classroom using ChatGPT[EB/OL].(2023-03-09) [2023-03-30].https://abcnews.go.com/GMA/Living/inside-5th-grade-classroom-chatgpt/story?id=97691302.

[12]LAWTON G.What is generative AI?Everything you need to know[EB/OL].[2023-05-30].https://www.techtarget.com/searchenterpriseai/definition/generative-AI.

[13]肖峰.何種生成,能否创造——ChatGPT的附魅与祛魅[N].中国社会科学报,2023-03-06.

Function analysis of generative artificial intelligence in

knowledge production:

Exploring the experience of digital labor with ChatGPT and ERNIE Bot

XIAO Feng

(School of Marxism, Shanghai University, Shanghai 200444, China)

Abstract:ChatGPT and ERNIE Bot, as new products of generative AI, have created a new form of human-computer cooperation in knowledge production (especially academic research). Taking exploring the meaning of digital labor as an example, we can obtain the answers provided by machine intelligence through man-machine question and answer, and show the new function of ChatGPT and ERNIE Bot to assist people in academic research, thus forming a new knowledge production model of human-computer cooperation. In this mode, machine intelligence provides efficient assistance to human knowledge production in providing resource summarization and simple text production, and makes this assistance more targeted and timely through human-machine Q&A interaction. Through a specific examination of machine generated content and a deep experience of the practical use of these two generative AI new products, it can also be found that their obvious shortcomings and limitations are particularly reflected in the limitations of training datasets and accessible academic resource databases. There is still a significant gap between the comprehensiveness and accuracy of the summarized knowledge results and human requirements, and it cannot replace human original knowledge innovation. In view of this, it is necessary to rationally view the functions that intelligent machines can play in human knowledge production. It is necessary to predict the significant impact and positive significance of this new human-machine collaboration method on the future direction of human knowledge production in a forward-looking manner, and also to leverage the role of good people in using prompt words and other aspects based on the current working mechanism of generative artificial intelligence. Through human initiatives, the potential of intelligent auxiliary systems can be mobilized. There is a reasonable division of labor and harmonious complementary cooperation between humans and machines to assist in the development of academic research-oriented knowledge production activities, and to always maintain sufficient vigilance towards humans as the main body of knowledge production.

Keywords:ChatGPT; ERNIE Bot; human machine cooperation; digital labor; generative AI(GAI)

(编辑:李春英)