意义互联网的兴起——ChatGPT开启互联网第三次革命
2023-11-03刘德寰洪馨仪
刘德寰 洪馨仪
【摘要】互联网诞生以来已经经历了两个发展阶段。其中,桌面互联网解决了“何时”的问题;移动互联网解决了“何地”的问题。以ChatGPT(GPT-4)为代表的大型语言模型产品开启了互联网的第三次革命——意义互联网。意义互联网时期,“何事”的问题开始被解决,不懂不再是障碍。人类反馈强化学习的训练方法、注重交互性的设计方式、上下文学习的能力是大型语言模型取得成功的关键原因,也是意义互联网的基础技术架构必不可少的特性。意义互联网的本质是智能时代的来临。在意义互联网时代,通用人工智能的实现将不再遥远,人工智能生成内容将不断有新突破,人机关系将发生更深层次的融合,人工智能的因果推断能力将进一步增强。在意义互联网极速扩张的同时,其中隐含的问题同样不可忽视。如何拥抱第三次互联网革命,实现技术与人的良性互动,将是被长期探索的重要课题。
【关键词】意义互联网 人工智能 人机关系 ChatGPT
【中图分类号】G206 【文献标识码】A 【文章编号】1003-6687(2023)9-042-08
【DOI】 10.13786/j.cnki.cn14-1066/g2.2023.9.006
自20世纪90年代万维网的思想被提出始,互联网彻底颠覆了人类的生产生活状态,人类历史进入了新的篇章。互联网技术发展和迭代的速度超乎人们的想象。自诞生以来,其已经历了两个发展阶段:桌面互联网和移动互联网。如今,我们正处在第三次革命的边缘,以ChatGPT为代表的大型语言模型产品的推出让意义互联网呼之欲出。在互联网历史的剧变期,梳理互联网前两次革命的历程,介绍第三次革命的开创意义,有利于占领先机,以更主动的姿态拥抱正在到来的新时代。本文首先回顾桌面互联网和移动互联网时代的发展历程和特征,然后重点探讨意义互联网的内涵及发展趋势,以期为未来研究和应用提供有益的启示。具体而言,本文试图跳出新技术研究的既有范式,将关注点从对技术表象特征的描绘转向对技术本质逻辑的探寻,并尝试以俯瞰的视角,在互联网史的脉络中找寻新技术的历史定位和坐标意义。同时,区别于目前盛行的批判主义取向,本文着墨于意义互联网时代人机共生的潜力,试图探索一条人类拥抱新技术的未来之路。
一、桌面互联网:解决“何时”的问题
互联网的第一次革命是桌面互联网的诞生和进化。桌面互联网可以被定义为一种通过个人计算机(例如台式机、笔记本电脑等)访问和使用互联网资源的方式。其为用户提供了丰富的信息和多样化的在线服务,包括电子邮件、网页浏览、文件传输、在线购物和社交媒体等。[1]桌面互联网是在计算机发展的过程中应运而生的。1946年,世界上第一台计算机在美国诞生,当时计算机的主要功能是快速计算,那时由于计算机数量稀缺且昂贵,普通人很难获得使用计算机的机会。因此,当多个用户或团队需要使用同一台计算机完成各自的任务时,他们必须按照某种顺序排队等候,一次只能有一个任务在计算机上运行。随着计算机技术的发展,特别是操作系统和计算机硬件的进步,分时系统的出现逐渐解决了这个问题。分时系统中的多任务处理和时间共享系统允许计算机在同一时间内运行多个任务,且使得多个用户可以同时通过终端访问和使用计算机资源。[2]
1969年,阿帕网在美国诞生,这是互联网的雏形,也标志着一个新的时代的开始。“何时”的问题从此刻开始被加速解决。1983年,TCP/IP协议正式成为网络标准协议,这一协议将ARPANet与其他独立网络连接起来,形成了互联网。1990年左右,万维网思想被提出,也就是实现网络中的文字、图像等超文本信息的相互连接。1991年,万维网向公众开放,任何人都可以访问和创建网站,人们可以在不同地点同时上线建立虚拟身份和信息的关联。[3]20世纪90年代初,克林顿政府提出“信息高速公路”计划,互联网成为各国在信息化赛道上加速铺陈的基础设施。20世纪最后十年,一系列标志性互联网产品相继推出,包括互联网最早的搜索引擎和门户网站雅虎、最早的在线购物商城亚马逊等。也是在这一时期,中国迈入互联网世界的大门,并拥有了如中国万维网、腾讯、阿里巴巴、新浪网等自主的代表性互联网公司和产品。进入21世纪,世界加速在“信息高速公路”上狂飙,平台社会来临。伴随着互联网技术的高速发展和用户规模的急剧扩张,各类社交网络平台、在线视频平台、电商平台、实时信息传播平台等如雨后春笋,在东风中成长崛起。
桌面互联网时代的到来极大地改变了人类对时间利用的认知与行为。在传统的时间观念中,由于地理空间和信息传播的局限性,人们在获取信息、与他人沟通以及协作过程中,往往受制于特定时间。然而,桌面互联网打破了这一界限,使得信息的传播变得高效、便捷和实时。在这一变革下,人们对时间的利用和认知发生了根本性的颠覆。
桌面互联网在很大程度上解决了人们在“何时”接触和共享信息的问题。一方面,桌面互联网打破线性时间的限制,使不同人群和事件的同时性成为可能。桌面互联网实现了每个终端同时完成任务以及时间互联,联网的计算机可以实现资源和成果的共享。互联网技术将同一时间的不同人群和事件镶嵌进网络,实现了远距离同时工作。
另一方面,桌面互联网解放了个人时间。一些产品和服务已经让人们生活在真正的全天候、全球化的信息平台,让即时和随时成为可能。比如,在桌面互聯网时代,电子邮件已经成为一种主要的通信方式,使得人们可以在任何时间发送和接收邮件,提高了工作效率和沟通便利性。在社交媒体盛行之前,人们主要通过在线论坛(如BBS、贴吧等)与世界各地的朋友交流,这些平台允许用户随时发布信息、回复他人以及与他人互动。在信息检索方面,桌面互联网时代,人们可以随时访问门户网站、搜索引擎以及在线新闻网站获取资讯。在智能手机出现之前,桌面即时通信软件(如MSN Messenger、Yahoo Messenger、腾讯QQ等)已经开始在个人电脑上广泛使用,使得用户可以随时与他人进行实时沟通。在教育资源和娱乐方面,人们可以随时通过在线教育网站访问课程资源,虽然当时在线娱乐资源相对有限,但用户仍然可以通过桌面互联网访问和下载音乐、电影和游戏等。
可以说,桌面互联网时期,对计算机和网络的使用大大提高了人们的工作和生活效率,而解决“何时”问题是此次变革的核心。
二、移动互联网:解决“何地”的问题
智能手机等便携式电子设备的出现及风行,开启了互联网时代的新纪元——移动互联网。移动互联网的终端移动性、使用便利性、内容个性化、用户草根化的特点决定了其与传统的桌面互联网相比,具有独特的发展模式。[4](1-2)自此,人与手机开启了共同进化的进程。对于中国互联网的发展而言,2012年是具有里程碑意义的一年。截至2012年6月底,中国手机网民的规模达到了3.88亿,手机首次超越台式电脑成为第一大上网终端。[5]移动互联网完成了对桌面互联网的颠覆与重构,虽然并没有完全替代,但二者间的分工已经逐步明确。桌面互联网有固化成办公设备的趋势,移动互联网则趋向于娱乐、随时随地信息的获取与处理,以及人际交往方面。[6](27)而在移动互联网扩散的过程中,人们又不再只把手机当成一种通信工具或信息获取工具,而是作为一个随时随地的玩具。[6](18)移动互联网对人们生活的最大意义在于解除心的疲惫,不见面,不通电话,也能抒怀。[4](VI)从技术可供性看,手机等移动设备的种种功能变迁,与其可携带、可获取、可定位、可兼容的特性密不可分。这几大特性使用户可以脱离空间的限制,在任何地方通过互联网平台获取多样化的信息服务,人人都成了“手机人”。
从青铜器到羊皮纸,再到电报、电话、电视及互联网,媒介变迁的过程中,往往呈现出如英尼斯所说的“偏倚空间的媒介”[7]进化趋势。在空间意义上,传播媒介最重要的改变在于克服空间距离对人们沟通的阻碍和限制,使人的移动更加迅速和自由。在桌面互联网时期,考虑到电脑等设备在物理层面的固定性,接收者必须处在与之相连接的物理空间中才能够进入存在的媒介空间。[8]这一限制在移动互联网时期被逐步打破,“何地”的问题开始被解决。在移动互联网时代,地缘不再是划分手机人的标准。[4](7)移动互联网将社会结构导向“半熟社会”,人们更多地被“趣缘”“价值缘”所联结。[9]
具体而言,首先,移动互联网拓宽了连接地点的多样性和便捷性。借助智能手机、平板电脑等便携式设备,用户可以在各种环境和场景下获取信息和进行沟通。例如,候车室、咖啡馆甚至户外活动现场都可以成为人们访问互联网的场所,这大大提高了互联网连接的可达性和实用性,人们可以充分利用碎片化时间。[10]其次,基于地理位置的服务得到了广泛应用。移动互联网使得地理位置信息可以实时获取和传播,为各种基于地理位置的应用提供了便利。例如,导航应用可以为用户提供实时路线规划,附近搜索功能有助于发现周边服务和设施,而基于位置的社交媒体则促进了地理空间内的人际互动。再次,移动互联网时期,人与手机等智能设备融为一体并共同进化,促使虚拟世界与现实世界的空间交融。智能便携设备的发展为用户提供了丰富的虚拟体验,如增强现实和虚拟现实技术。这些技术使虚拟元素与现实世界相结合,为用户创造了沉浸式体验。以Pokemon Go为例,这款基于地理位置的增强现实游戏使玩家在现实世界中捕捉虚拟精灵,进一步弥合了虚拟与现实之间的空间界限。最后,移动互联网随时随地的黏性使其用户群展现出大规模的、以集团迁徙为特征的游牧特征。从一个社交网络平台到另一个社交网络平台,一个用户的迁徙往往是其朋友圈子的集体迁徙,因此表现出强烈的集群性特征。而这种在虚拟网络的应用平台间频繁的整体迁移往往是只去不回的。[6](23)这一互联网上不同栖居地点间的迁移也反映出移动互联网虚拟层面的用户流动性特征。
当然,需要说明的是,相较于桌面互联网,移动互联网主要解决的是“何地”的问题,但在“何时”的问题上,移动互联网依旧有所突破,因为移动总是和即时联系在一起,时空的突破往往具有同步性。手机等移动设备解决了在“何地”连接网络的问题,也就同时将“何时”获取和发布信息的便利性进行了新一轮深化。
三、意义互联网:解决“何事”的问题
早在1960年,利克莱德在其人机交互领域的奠基之作中,就对人机共生的未来提出了愿景和目标。他认为要实现人机共生,让机器帮助人类处理复杂问题,需要解决自然语言处理、在线学习、适应人工智能、协同工作等关键问题,以使计算机能更好地理解自然语言、人类的需求以及沟通方式,从而更好地相互协作。[11]利克莱德超前的思想成功预测了互联网发展的方向,即实现人和机器的共同生存与进化,让机器具备理解人类世界意义的能力。技术发展到今天,我们已经能够看到意义互联网的雏形,人类世界的一切知识将会被加速提炼,机器的学习能力也会进一步增强。
以ChatGPT、“文心一言”为代表的大型语言模型产品的推出引发了新一轮互联网狂欢,人们认为这是互联网新的“iPhone时刻”。实际上,作为意义互联网的开端,大型语言模型及其背后的基础模型已经超越了应用层,作为一种基础设施奠定了意义互联网的进化方向。ChatGPT等产品在短时间内取得巨大成功的原因,在于其产品内核反映了意义互联网时代用户的期待和需求,蕴含着意义互联网时代人机交互的底层逻辑——机器能“善解人意”,与人共同思考和创造,给予人类更多的启发意义。这一意义不同于简单的知识整理、归纳和计算,而是针对人类世界纷繁的需求和变数作出准确的理解和有价值的回应。未来在此基础上,会出现更多超级应用,通用人工智能的实现将不再遥远。人工智能在对人类世界语言和逻辑进行大量学习和模拟后,能更加精准地理解人类的需求以及人类世界的生活场景,从而在人机协同工作中给出更具启发意义的答案,胜任更需创造力的工作,解决更具体多样的事件类型。这是一次技术的飞跃,也是人机关系的又一次深层革命。
回顾自然语言处理领域的一系列技术变革,从Word Embedding到GPT-3,模型在理解和生成自然语言方面取得显著进步。然而,当这些模型应用于实际,使人们的生活变得更轻松时,它们往往无法发挥潜力,因为其在一致性问题上的解决并没有达到理想水准。而这会导致提供无效帮助、内容胡编乱造、缺乏可解释性、内容偏见有害等一系列問题。[12]Word Embedding(如Word2Vec和GloVe)通过将词汇映射到高维空间中的向量,为计算词语之间的相似性提供了基础。然而,这些方法仅限于词级别的表示,缺乏对上下文信息的捕捉能力。随后,Transformer架构的出现引领了自然语言处理的新篇章。其中,BERT模型通过引入双向信息,有效地提高了文本理解的性能。但由于BERT主要关注需要理解全局上下文的分类和标记任务,而非只允许考虑前文的生成型任务,因此在一致性方面仍有所不足。GPT-3及其前身GPT-2作为基于Transformer的生成模型,能够生成连贯且具有一定语义的文本。然而,由于缺乏人工参与的监督学习训练,生成的回复可能不具有一致性,甚至可能出现大量的以问答问、答非所问的情况。由此可见,以往的模型在解决“何事”的问题,特别是实现“对症下药”或“量体裁衣”的功能方面,依然存在较大局限性。
从GPT-3.5(ChatGPT的基础模型之一)开始,大型语言模型在一致性问题解决方面取得了长足进步。有研究依据心智理论测试发现,GPT-3.5可解决90%的虚假信念任务,相当于7岁儿童的水平。[13]到了GPT-4,
模型进化得更细致、更可信、更具有创造力。百度“文心一言”产品也宣称,其在文学创作、商业文案创作、数理逻辑推算等应用场景方面的能力已经可以对标ChatGPT,而其在中文理解、多模态生成方面甚至有独特优势。[14]为何这类模型相比以往模型在准确度、叙述细节和上下文连贯性上具有更优的表现?笔者认为,主要是因为此类模型在以下三个方面取得了突破。
1. 这类模型加入了人类反馈强化学习(RLHF)的训练方法
这是一种结合了人类指导和自动强化学习算法的训练方法。在人类反馈强化学习中,智能体通过与人类进行交互,学习如何改善其决策和行为。其关键步骤包括监督调优模型、模拟人类偏好、近端策略优化等。在人类标注阶段,人类专家与智能体进行交互,提供关于其行为的反馈。这些反馈可以是具体的行动建议、对当前策略的评估或对未来奖励的预测,评估的主要标准是帮助性、真实性、无害性三个方面,[12]这有助于智能体快速学习关键知识和避免探索低效策略。在产品发布后,由于现实世界的大规模用户群在使用过程中也对输出结果进行了大量的反馈,大型语言模型迭代速度进一步提升,随着反馈的标注越来越多,大型语言模型会以更快的速度进化。
2. 这类模型在设计中非常注重交互性
在历史模型的设计中,交互主要涉及将预先训练好的系统用于完成特定任务,例如ELIZA、IBM Watson、微软小冰、Siri、智能音箱以及京东的智能客服。然而,大型语言模型中所提到的协同和交互是将交互视为一种学习方法,协同作为人工智能与人之间的分工,以实现更优秀的人机协同融合,从而深入洞察、创造新知识并成功完成任务。[15]作为高度交互式的大型语言模型,ChatGPT、“文心一言”等强调与用户的沟通与协同。如此,一种良性循环在这一过程中形成了:人工智能为人类提供了具有深度洞察力的新知识,这些新的创意又反过来推动了人工智能的优化,促进了更多新想法的产生。人与机器在合作和对话的过程中能够相互启发,共同进步。以下是一个人与机器共同思考论文选题的例子:
用户:“刚刚读到一篇论文,是从微观层面研究现行小学入学制度对出生截止日期的规定所导致的教育不平等现象。我觉得很有意思,你能想想类似的选题吗?”
ChatGPT(GPT-4模型):“当然可以!我们可以从不同角度和层面探讨教育不平等现象。如:研究家庭经济状况、父母受教育程度等因素如何影响学生的学业表现,或探讨性别如何影响学生的学科选择和成就,以及教育政策对此现象的影响。”
用户:“你提供的这些在既有文献中都能找到很多。不过你说的性别如何影响学生的学科成就,我是否可以探讨父亲和母亲分别对孩子的教育表现有何影响?”
ChatGPT(GPT-4模型):“當然可以。你可以从父母性别角色对孩子学科兴趣的影响、父母性别角色与教育期望、父母性别角色与教育投入、父母性别角色与家庭教育环境、父母性别角色与教育公平等几个方面深入探讨父母性别角色对孩子教育表现的影响,如分析父母性别角色如何影响家庭中不同性别孩子的教育机会和资源分配,进而影响他们的教育成果。”
从这个例子中可以看出,对于论文选题这一对创意要求极高的工作,现有的大型语言模型对话软件能够给予人类相应的启发,且人类针对回答给出的具体追问,进一步让大型语言模型对话软件给出更具有可行性和具象的输出。在这一过程中,机器与人相互影响,不断完善想法,实现目标。
3. 此类模型具备上下文学习的能力
上下文学习的关键思想是从类比中学习。它是指大型语言模型能够通过对少数输入或示范标签进行调节并对新的输入进行预测,仅通过推理来执行一项新的任务。这种能力使得系统能够更准确地解释和预测新情况,从而在处理复杂任务时表现出更高的适应性和灵活性。[16]比如,在自然语言处理任务中,一个具备上下文学习能力的系统能够理解对话中的隐含信息,并根据对话历史来生成恰当的回应。在搜索任务中,一个具备上下文学习能力的系统能够根据查询者的背景知识和需求,提供更为相关和精准的搜索结果。在预测和推理任务中,它还能够利用周围环境和历史数据来提高预测的准确性和鲁棒性。在完成新任务时,它亦能够通过观察和学习新环境,迅速调整自己的策略以适应新任务。对于一个具备上下文学习能力的系统而言,当用户给予它恰当的提示词或其他形式的信息时,能将既有模型的潜力激发出来,从而形成更好的回答。这种能力使人工智能更准确地理解提问者输出的意义,并表现出其作为智能体的无限潜能。以下是一个能体现机器上下文学习能力的例子:
用户:“我最近在看一部科幻系列,男主人公是一个年轻的太空探险家。”
ChatGPT(GPT-4模型):“哦!听起来很有趣,请问这部系列的名字是什么?”
用户:“好像叫《太空迷航》。”
ChatGPT(GPT-4模型):“您想说的是否是《星际迷航》?《星际迷航》是一部经典的科幻作品,讲述了主人公和他的太空船在遥远星系中的冒险经历。虽然和您提到的《太空迷航》不一样,但我认为《星际迷航》可能更符合您的描述。您觉得这个系列怎么样呢?”
该例子能很好地体现大型语言模型(GPT-4)的上下文学习能力。模型首先从第一个问题习得用户正在阅读一部作品系列,随后,当用户给出这一系列名称的不准确描述时,模型能基于上下文和背景信息,给出正确的系列名称,并继续与用户进行讨论。由此可见,以GPT-4为代表的大语言模型已经在很大程度上克服了“不懂”的障碍,能够与人类进行高质量的对话和交互。
四、意义互联网的本质是智能时代的来临
正如Android和iOS之于移动互联网的意义,大型语言模型作为意义互联网的开端,绝不仅仅只是一种产品形态,而是可以被称为一种操作系统式的技术架构。在此基础上,我们可以畅想意义互联网未来发展的几大应用方向。
1. 在意义互联网时代,通用人工智能的实现将不再遥远
通用人工智能指具有广泛自我适应能力、在多个领域均能表现出人类水平智能的人工智能系统。[17]与目前主流的窄域人工智能不同,通用人工智能可以理解、学习和适应多种任务,而不仅限于某个特定的任务。[18]大型语言模型为通用人工智能的实现奠定了很好的基础。比如,大型语言模型在阅读理解、命名实体识别、情感分析等任务上展现出了强大的性能,使得机器能够更好地理解和分析人类语言,从而提高人机交互的效率和体验,促进通用人工智能的发展。且大型语言模型在一个模型中可以完成多种任务,通过迁移学习,可以在不同任务间共享知识,从而减少训练成本,提高模型泛化能力。因此,在意义互联网时代,随着大型语言模型迭代速度的加快,通用人工智能的实现也许并不遥远。
2. 意义互联网时代,人工智能生成内容将不断有新突破
ChatGPT问世时,其生成内容的高度拟人性让70多年前的“图灵之问”重新激发起大众的热情。图灵所说的“模仿游戏”是指普通人通过打字机与计算机交流时,如果无法分辨与其交流的是人类还是计算机,那么就可以认为计算机已经具有了“思维”。[19]大型语言模型(如GPT系列)通过学习大量文本数据,能够生成更加流畅、准确和自然的文本,这些生成内容在质量上接近甚至有时与人类所写难以区分。此外,一些大型语言模型可以通过特定的参数调整,实现对生成内容的风格和主题的控制,这使得人工智能可以生成更具针对性和多样性的内容,实现根据需求的个性化定制。更重要的是,大型语言模型可以基于最新的数据和信息,实时生成和更新内容,使生成的内容保持较强的时效性。因此,在未来,机器生成内容也许真的能通过“图灵测试”,机器也将成为真正的智能体。
3. 意义互联网时代,人机关系将发生更深层次的融合
如果说桌面互联网时代机器还是人类的工具,移动互联网时代就已经出现了人和机器(手机等终端)的混合体——手机人。在意义互联网时代,机器的主体性将再次成为伦理讨论的焦点。有研究指出,传统技术通常以机械方式扩展和增强人类的肢体和感官能力,而智能机器则模拟、延伸并拓展了人类大脑的功能,使其部分具备了人类智能特性。因此,人工智能在与人类互动过程中会展现出一种拟主体的特质,并且可以被看作具有一定主动性的拟主体。[20]当大型语言模型产品解决了人工智能的核心问题,即达到强人工智能状态,能够像人一样聪明或像人一样说话,接近“人工智能完备”的状态时,[21]人与机器又将呈现何种共生关系?这将是意义互联网时代最大的谜。
4. 意义互联网时代,人工智能的因果推断能力将进一步增强
ChatGPT和“文心一言”等产品刚推出时,数学推理能力一直是人们测试其是否智能的“试金石”,而初代大型语言模型产品在数学推理及因果推断方面的表现并不尽如人意。如今模型(特别是GPT-4)凭借其对因果语料库的大量学习,已经逐步具备更高层次的推理能力,如多步推理、演绎推理、反绎推理、反事实推理、隐含知识挖掘等。但尽管现有的模型已经有能力理解因果关系的概念,却不能进行因果推断。Pearl和Mackenzie认为,一旦机器具备因果推理模块的能力,智能体就有能力反思他们的错误,找到自身软件程序中的弱点,并能像一个道德实体那样思考和行动,自然地与人类交流它们自己的选择和意图。[22]要让机器理解因果关系并进行因果推断,除需要大量的数据,还需要基于现实世界的因果模型。在此基础上,即使机器没有干预现实世界和实验的能力,其也能从输入的数字、比特和像素中提取意义,能够理解“我本该采取不同的行为”这句话。当我们真正“教会”了机器进行因果推断,也许那时我们也就能够理解自己的大脑是如何运作的,“智能时代”也就真正降临了。
五、意义互联网时代不可忽视的问题
大型语言模型正在高速迭代发展,不断升级模型以实现不同功能,从史无前例的參数量到实现图片识别,到拥有数学证明逻辑,再到可以连接网络,每一次进化的间隔时间越来越短。在这一超速迭代过程中,反思以大型语言模型为技术基础的意义互联网时代可能出现的问题,至关重要。
1. 主观性与偏见
由于大型语言模型在设计和训练过程中仍依靠的是人工参与,所以主观性的难题不可避免。一些主观性局限因素包括:生成演示数据的人工标注者的偏好、设计研究和编写标签说明的研究人员、由开发人员制作或由OpenAI客户提供的提示词的选择等。[12]设计和进行标注的目的是让模型更拟合人类需求,然而需要注意的是,这些参与设计和标注工作的人群的判断并不能代表所有人类的想法。于是,在这一过程中就产生了偏见。此外,大型语言模型通常使用大量的来源于互联网的文本数据进行训练,这些互联网上的文本信息可能存在明显的偏见和刻板印象,而这种偏见很可能被模型学习和内化。因此,模型可能在生成文本时表现出与其训练数据相似的偏见。由于ChatGPT、“文心一言”等大型语言模型产品并未公开技术细节,其“黑箱式”的运作很容易诱发信息安全和伦理风险。
2. 隐私与版权
尽管相关公司声称非常重视用户的隐私和数据安全,但在大型语言模型训练的过程中,一定会收集与用户的使用相关的数据,以“改进服务,为用户提供更好的体验”。此外,公司也会与合作伙伴共享某些数据,尽管这些数据通常是去标识化的。[23]实际上,OpenAI在其用户协议中赋予了使用者拒绝提供数据用以模型优化的权利,但这一协议过于隐蔽,且需要用户主动提交申请。这样的隐私协议对用户的隐私素养提出了较高的要求。在版权问题上,一些公司(如OpenAI)声称用户拥有其与AI助手(如ChatGPT)进行对话所生成的内容的使用权,但由于大型语言模型使用的训练数据来源多样,且AI在对话的过程中不会标注来源,如此就很难保证用户使用的内容是受版权保护的内容。总体而言,在大型语言模型使用和进化过程中,会导致数据挖掘、内容生成与生成内容使用三个阶段的版权风险。[24]
3. 错误与缺乏数据来源
在中文的性能测评中,研究人员发现ChatGPT在中文的知识和常识回答上很容易出现错误,具体表现为混淆事实、编造信息等,且其能用较为流畅和可信的语言模板陈述错误事实,具有很强的迷惑性,尤其是对信息素养较低的群体危害较大。[25]此外,在使用大型语言模型产品的过程中,使用者可能会注意到模型给出的回答并未提供明确的来源。由于模型生成的内容可能包含错误或不准确的信息,这就有可能导致使用者在未经过事实核查的情况下误信这些信息。因此,在利用这些模型获取知识时,使用者需要谨慎对待,培养良好的信息素养,尽可能避免被错误信息误导。
4.“幽灵劳动”引发的政治经济学批判
美国《时代》杂志最近的一项调查发现,为训练ChatGPT,OpenAI使用了每小时收入不到两美元的肯尼亚外包劳工。从工业革命到互联网革命,伴随着技术的高速发展和迭代,按需工人和幽灵劳力也在无声中完成着大规模的流动,他们贡献了技术发展背后必不可少的力量,但也逃不开被无视和作为个体销声匿迹的命运。即使到了人工智能时代,机器和人的“最后一公里”之间依旧需要大量隐藏在幕后的人力,他们不需要多么专业的技能,只需要一些线上培训和一些经验性的知识就可以在任何时间完成工作,但“幽灵劳动”背后潜在的劳动保障和职业发展问题却被习惯性忽视了。随着传统产业技术化程度逐渐加深、新兴产业自动化程度不断升级,“幽灵劳动”有可能在未来成为一种十分普遍甚至是占据主导地位的工作形态,同时将数量庞大的“活”劳动者群体按需编织进“死”劳动的褶皱之中。[26]此外,数字劳动研究领域常涉及的免费劳力问题,在意义互联网时代将会变得更突出。作为使用者的我们,在使用人工智能技术时,为企业提供数据和其他信息,从而为其创造价值,但却未获得相应的报酬。在未来,这可能会导致更加不平等的劳动关系和更严重的剥削现象。
5. 新的“能力沟”出现
在意义互联网时代,有学者认为大型语言模型产品突破了在资源整合方面的能力限制,使得每个人至少从理论上具备高于社会平均水平的语义表达和资源调动能力,从而进行社会性内容的创作与传播对话。这背后是生成式人工智能在数字文明中弥合“能力沟”的表现,也代表着数字化和智能化进一步推动了社会传播权力的下沉。[27]然而,并非所有人都持有这种技术乐观主义观点。移动互联网时期,互联网的“接入沟”几乎被填平,但“使用沟”和“效果沟”却有逐渐拉大的趋势。在与大型语言模型产品进行对话的过程中,使用者能明显感受到,提出问题的能力极大程度上决定了最后输出答案的质量。历史告诉我们,当既往产业的信息技术化和全球化浪潮来临时,往往只有那些受过高等教育的人群才能更适应这种浪潮,并利用技术发展的东风实现自身价值。因此,笔者以为,未来可能更考验人的是提出问题以及准确表达提示词的能力,或者说,是与机器交流,不断激发机器生产力和创造力的能力。无论哪个时代,人类与其他动物或者机器的区别都在于驾驭工具的能力,人工智能时代依旧如此。
结语
本文首先对桌面互联网和移动互联网的特征进行了概述,随后重点探讨了意义互联网的内涵及其发展趋势。在此基础上,还指出了意义互联网时代所面临的诸多挑战。互联网的三次革命分别解决了不同的本质问题,也为人类生活提供了不同的价值。回顾互联网三次革命历程,在新的时代风口展望新征程的壮丽图景和漫漫长路,能使我们以开阔的视角和眺望的眼光面对技术和环境的巨变,也能让我们以更开放的态度迎接其所带来的挑战和机遇。从工业革命到互联网革命,每一次技术的变革都伴随着抵抗和忧虑,但过度的省思不会延缓技术扩散的脚步,时代也终将属于那些主动与创新共舞的弄潮儿。未来已来,如何拥抱第三次互联网革命,实现技术与人的良性互动,这将是我们长期探索的重要课题。
参考文献:
[1] Chaffey D, Ellis-Chadwick F, Mayer R, et al. Internet marketing: strategy, implementation and practice[M]. London: Pearson education, 2009: 8.
[2] 彭蘭. 中国网络媒体的第一个十年[M]. 北京:清华大学出版社,2015:12.
[3] Berners-Lee T, Cailliau R, Luotonen A, et al. The world-wide web[J]. Communications of the ACM, 1994, 37(8): 76-82.
[4] 刘德寰,刘向清,崔凯,等. 正在发生的未来:手机人的族群与趋势[M]. 北京:机械工业出版社,2012.
[5] CNNIC. 第30次中国互联网络发展状况统计报告[R]. 2012.
[6] 刘德寰,崔凯,刘向清,等. 颠覆与重整——手机人的群落与游牧[M]. 北京:机械工业出版社,2014.
[7] Innis·H. A. The bias of communication[M]. Toronto: University of Toronto Press, 200: xix.
[8] 李雪莲. 大众传播的终结——由大众向现代族群的社会结构变迁[D]. 北京大学,2019.
[9] 刘德寰. 我们都是“半熟人”[J]. 商界(评论),2013(6):73-74.
[10] 刘德寰,季飞,崔凯. 移动互联时代,手机重新定义黄金时间[J]. 广告大观(综合版),2012(2):93-95.
[11] Licklider·J. C. R. Man-computer symbiosis[J]. IRE transactions on human factors in electronics, 1960 (1): 4-11.
[12] Marco Ramponi. How ChatGPT actually works[EB/OL].[2022-12-23].https://www.assemblyai.com/blog/how-chatgpt-actually-works/?continueFlag=1bafdcd5c034def869fecb4f3bdaed70.
[13] Kosinski M. Theory of mind may have spontaneously emerged in large language models[EB/OL].[2023-03-14].https://arxiv.org/abs/2302.02083.
[14] 百度文心一言新闻发布会[EB/OL].[2023-03-16].https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8117393980&source=search.
[15] 周伯文. AI与人和环境的协同与交互:多模态学习的新机遇[EB/OL].[2023-01-11].https://mp.weixin.qq.com/s/IYj0Y9yMXerTTS4yRGHddw.
[16] Min, Sewon, et al. Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?[EB/OL].[2022-10-20].https://arxiv.org/abs/2202.12837.
[17] Goertzel, Ben. Artificial general intelligence: concept, state of the art, and future prospects[J]. Journal of Artificial General Intelligence, 2014(1): 1.
[18] Kurzweil, Ray. The singularity is near[M]. London: Palgrave Macmillan UK, 2014: 428.
[19] French·R. M. The Turing Test: the first 50 years[J]. Trends in cognitive sciences, 2000(3): 115-122.
[20] 段偉文. 控制的危机与人工智能的未来情境[J]. 探索与争鸣,2017(10):7-10.
[21] 令小雄,王鼎民,袁健. ChatGPT爆火后关于科技伦理及学术伦理的冷思考[J]. 新疆师范大学学报(哲学社会科学版),2023(4):123-136.
[22] Pearl J, Mackenzie D. The book of why: the new science of cause and effect[M]. New York: Basic books, 2018: 398.
[23] Open AI. Privacy policy[EB/OL].[2023-04-07].https://openai.com/policies/privacy-policy.
[24] 丛立先,李泳霖. 聊天机器人生成内容的版权风险及其治理——以ChatGPT的应用场景为视角[J]. 中国出版,2023(5):16-21.
[25] 张华平,李林翰,李春锦. ChatGPT中文性能测评与风险应对[J]. 数据分析与知识发现,2023(3):16-25.
[26] 姚建华,丁依然.“幽灵劳动”是新瓶装旧酒吗?——幽灵劳动及其概念的传播政治经济学省思[J]. 新闻记者,2022(12):30-40.
[27] 喻国明,苏健威. 生成式人工智能浪潮下的传播革命与媒介生态——从ChatGPT到全面智能化时代的未来[J]. 新疆师范大学学报(哲学社会科学版),2023(5):1-10.
The Rise of the Internet of Meaning—ChatGPT Starts the Third Revolution of the Internet
LIU De-Huan, HONG Xin-Yi(School of New Media, Peking University, Beijing 100871, China)
Abstract: The Internet has gone through two stages of development since its inception. The desktop Internet solved the problem of "when"; the mobile Internet solved the problem of "where". The third revolution of the Internet---the Internet of Meaning---was initiated by the large language model products represented by ChatGPT (GPT-4). During the Internet of Meaning, the problem of "what" is being solved and the lack of understanding will no longer be a barrier. The training method of RLHF, the design approach focusing on interactivity and the ability of in-context learning are the key reasons for the success of large language models and are essential features of the underlying technical architecture of the Internet of Meaning. The essence of the Internet of Meaning is the advent of the age of intelligence. In the age of the Internet of Meaning, the realization of Artificial General Intelligence will no longer be far away; new breakthroughs in AI-generated content will continue; a deeper integration of human-computer relationship will occur; and the causal inference capabilities of AI will be further enhanced. While the Internet of Meaning is expanding at arapid pace, the problems implied therein cannot be ignored as well. How to embrace the third Internet revolution and realize a positive interaction between technology and people will be an important topic to be explored for a long time.
Key words: the Internet of meaning; artificial intelligence; human-computer relationship; ChatGPT