教育对人工智能应用的反哺价值探究
--基于生成式模型到世界模型的视角
2023-12-27翟雪松吴庭辉
□翟雪松 吴庭辉 袁 婧 李 艳
一、引言
生成式人工智能(Generative Artificial Transformer,GAT)的问世以颠覆性技术姿态敲开教育研究的大门。人工智能的地位已突破了传统的工具属性,转而成为引领未来教育发展的关键内生力量(眭依凡,等,2023)。因而,GPT 应然出现与教育相互促进和发展的局面,而并非简单地体现其工具价值(Rospigliosi,2023)。然而,当前大量教育研究依然强调人工智能的工具性,并试图通过微调模型参数、改变训练数据集以试图适应教育等垂直领域的应用,始终突破不了生成式模型知识迁移能力和认知教育能力弱的瓶颈。如,钟秉林等(2023)认为ChatGPT 等生成式模型与生俱来地与教育求真、求实底色不相符,将可能出现事实性、逻辑性乃至偏见性错误。因此,如何突破现有生成式模型刻板训练的思维框架,促进教育与人工智能技术双向发展成为亟待破解的难题。
今年,图灵奖得主、Meta AI 首席科学家杨立昆(Yann LeCun)尖锐指出ChatGPT 低学习、无认知的局限性,直言其应用寿命极短。他强调,从生成式模型跨越到世界模型(World Model)是未来人机交互的必然趋势。同时,国内相关研究也在反思如何扭转因教育话语权缺失所造成的人工智能教育应用的割裂感(刘凯,2023)。本研究目的在于从生成式模型迈向世界模型的角度探讨教育反哺人工智能的合理性及发展趋势,以优化当前人工智能与教育应用的兼容问题,为培育新的人机交互环境,赋能未来人才培养提供方向。
二、应用与反思
(一)生成式模型的教育应用
以机器学习、深度学习和强化学习为代表的人工智能促进了“从数据中产生知识”的可行性,极大提升了教育质量和公平(Zhai,et al.,2021),但以监督学习和全链路为主的训练路径直接或间接增加了教育应用的不可解释性,从而弱化了教育实践场景的应用效率。ChatGPT 等生成式模型“从数据到学习再到知识”,以自监督学习为训练路径保持了自身一定的学习力,因而对教育有更大的颠覆价值(祝智庭,等,2023)。通过文献综述,本研究总结了当前的生成式模型对教育领域的主要两点贡献:
其一,推动素质教育落实。素质教育落实是创新型人才培育的关键所在。相较于传统人工智能,生成式模型基于大量语料训练催生“智慧”,以类脑神经网络的方式获得内容生成、序列任务执行和情景对话等智能能力(卢宇,等,2023),助力学习者从“检索-学习”模式转化为“对话-学习”模式,模拟苏格拉底产婆术的启发式对话彰显其培养学生省思的潜力(张敬威,2023),为摆脱应试灌输、推动素质教育提供可行之路。例如,ChatGPT 结合数字人技术诞生个性化的虚拟教师,创新了传统翻转课堂模式,即“课前人机合作预习-课中人人交互讨论-课后人机合作巩固”的新型学习模式(翟雪松,等,2023)。在如今知识普遍外包的教育生态里,生成式模型一定的学习能力保证了学习者在主动精神、创新能力以及社会责任等素养教育新赛道上有所获得,相对地摆脱了应试教育的束缚,彰显了我国在迈向教育强国过程中所应具有的人才素养教育观念。
其二,促进教育公平。教育公平是精神共富的重要内容,是中国式现代化的重要特征。生成式模型提供了更为高效的个性化教育,降低了教育获得门槛,因而促进了校际和县域教育公平(于浩,2023)。主要表现在:第一,通过自然对话理解,GPT 可迅速帮助学习者靶向整理在线教育资源,提高校际不同学生自适应学习的可得性和准确性(Tack,et al.,2022;王佑镁,等,2023)。第二,通过调用GPT 开放接口,教育者将GPT 包装为学生私人助手以获得更个性化的指导,弥补乡村优质师资缺乏问题。第三,结合元宇宙构建新型人机交互学习模式。在Web3.0 以语义技术为支撑的时代,教育元宇宙是未来教育生态中赋能城乡教育共同体的重要技术手段(翟雪松,等,2022b)。在该场域下,生成式模型嫁接在元宇宙空间中,将突破传统以机为媒的人人交互,形成大规模“人人交互”与“人机交互”共生场景,对增强学生间的协作探究学习,缩小数字鸿沟具有积极的现实意义(李艳,等,2022)。
(二)生成式模型的教育反思
生成式模型强对话性、效率性和公平性的特点满足了师生解决具象化任务的需求,然而由于生成式模型在文本理解和视觉感知上存在明显瓶颈,因此难以给予更大的认知和教育支持。通过文献综述,本研究发现生成式模型天然的技术缺陷主要包括两个方面:
一方面,在文本理解上,生成式模型遵循意义匹配的生成法则,用于推算最优概率生成相关文本。换言之,生成式模型本身并不理解所生成文本的教育含义,对内容的真实性和偏见性自然无法判断。即使是斯坦福大学和谷歌公司基于GPT-3.5 turbo 联合搭建的沙盘世界(Sandbox)中智能体貌似自主交互的行为,其本质仍是基于概率做出的动作反应(Park,et al.,2023)。智能体涌现出复杂社会行为的背后,源自先前自监督的学习概率集合,智能体本身不具备智能产生的条件,无法形成自我认知。具体到教育这一垂直领域上,无认知的生成式模型难以完成“立德”等高阶教育任务。
另一方面,在视觉感知上,生成式模型的一般逻辑是基于大量预训练图集,以逐帧猜测的方式生成丢失或掩盖的图像。然而,这种生成方式是有损的,无法完全复刻训练图集的图像准确性。正是由于生成图像“有损”的弊端,放大了生成式模型无法区分关键和次要信息的局限,容易忽略或混淆核心内容的抽象表征,从而导致生成内容的不稳定性(Kim,et al.,2023)。反映在教育研究上,生成式模型对抽象表征力的缺失使其难以满足教育准确性和针对性的必然需求。
通过对生成式模型缺陷的分析,我们应该警惕其在教育应用中的三大困境:
困境一:训练语料的单维化。生成式模型的训练模式虽为自监督学习,但依靠的仅是互联网数据、已有学科知识数据等单维语料,缺乏教育等真实场景数据的支撑(Jiang,et al.,2022)。这一困境导致生成式模型的输出内容仅满足泛化、浅层化的教育需求。从长远发展的视角看,生成式模型是教育短视的。因此,GPT 在垂直领域的应用的下一个方向是局域模型:强调标注数据多维和训练语料权重再分配的重要性,以作为人工智能从生成式迈向世界模型的过渡模型。此模型认为,在人工智能向世界模型发展过程中,先铺垫好对真实场景语料的投入、识别和应用,是自主人工智能通过对世界的观察(Observation)为学习世界运转打好基础的必要阶段。未来,在教学场景中增设仪器记录更多无感知数据,如,基于传统摄像头捕捉无感知的眼球运动,将可进一步保障生成内容的可解释性和准确性(王雪,等,2022b)。此外,Web3.0 时代教育元宇宙等虚拟学习空间的教育社交行为也应与真实世界行为数据形成孪生,共同成为局域模型的重要语料源,提高模型输出效用性(翟雪松,等,2022a)。
困境二:模型的认知性壁垒。生成式模型基于亿万参数的学习是低阶的、无认知的自监督学习。例如,ChatGPT 和Bard 等模型在精神病学文献检索中捏造引文信息,但本身却对此类伪造不自知(McGowan,et al.,2023)。大语言模型的生成式预训练以类神经网络的形式从互联网大量文本中进行机械性的伪学习,最终得到的“智慧”仅是巨大的概率库,无认知维度的突破。虽然生成式模型通过语料获取了大量知识,几乎包揽所有领域,但是仅靠文本、图像等局部训练的系统无法触及人类智力水平(Jacob,et al.,2022)。人脑结构错综复杂,其高认知维度背后是不同脑区之间相互联通、相互补充的结果,这与人类从观察世界、与人深度互动,激活大脑信号中获得的深刻理解相挂钩。而生成式模型缺乏具身形式和对世界的感知能力,因此没有获得真实认知的可能。具体来说,人脑由大脑皮层、小脑、脑干和边缘系统四部分组成。其中,大脑皮层的额叶区块与高级认知功能最相关。然而,生成式模型在多个高阶推理能力测试上的失败表明:其充其量仅相当于大脑语言中枢的韦尼克区和布洛卡区,而不涉及额叶功能区(Mahowald,et al.,2023)。人脑有专门的高级认知处理机制,负责形式推理、世界认知和情景建模等工作,这是当前包括大语言模型在内的生成式模型所面临的认知壁垒。
困境三:垂直领域应用的割裂性。除了训练单维与认知壁垒,人工智能在教育垂直领域应用道路上的阻碍还在于其忽视了教育的反哺价值。教育在人工智能领域话语权的缺失致使人工智能缺乏温度和人文性。具体而言,一方面,生成式模型输出可能与教育需求匹配错位。以ChatGPT 为例,其更偏重输出内容的效率性而忽视了科学性和教育性。当出现生成错误被提醒后,其“先诚意道歉后重蹈覆辙”的持续性捏造行为被认为是最蹩脚的学术不端(Currie,2023)。在研发过程中,OpenAI 工程师主要是以优化概率的单向度理性思维开发GPT 系列产品,而如今却用该系列产品强行匹配教育领域多向度的文性思维,必然造成与应用的割裂感。另一方面,垂直领域的知识库和发展逻辑没有被充分利用。如,在教育领域内诸多教育理论和育人理念,仍未能充分迁移到人工智能发展过程中去。因此,重新考量教育对其他学科尤其是人工智能领域的反哺价值,强调教育跨学科、跨领域的“跨”不应停留在动作和形式上,更应该渗透到理念和方向培育上去,才能真正凸显教育学科的自我觉醒(孙元涛,2010)。
综上所述,本研究认为,要促进人工智能和教育的双向发展,需要循序渐进地突破单维训练思想,冲破“认知性”和“割裂性”两层桎梏。杨立昆所提出的世界模型,可作为研究契机重点凸显教育在人工智能构建之初对其的反哺价值。
三、世界模型下教育对人工智能的反哺
(一)世界模型的构建
早在20世纪90年代世界模型的理念就被提出,并寄托循环神经网络(Recurrent Neural Network,RNN)将神经元的输出结果循环作为该神经元的输入信息,探索构建具有一定自主判断的人工智能体(Schmidhuber,1990)。但由于RNN 无法充分挖掘输入之间的关系导致训练效果较差,在大规模序列学习任务中容易出现性能瓶颈,难以应对真实应用的决策挑战(Lipton,et al.,2015)。早期的世界模型已有压缩神经表征的训练思想,但存在三个主要局限:一是模拟环境下训练缺乏真实世界适应性,二是模型存储编码能力有限导致灾难性遗忘,三是无法突破认知壁垒(Ha,et al.,2018;Van,et al.,2020)。因此,杨立昆提出了全新的世界模型构念,并基于该模型设想了自主人工智能架构(见表1)(LeCun,2022)。
表1 以世界模型为中心的自主人工智能架构功能模块
该架构的六大模块分别为:配置器、感知器、世界模型、成本控制器、行动规划器和短期记忆。六大模块之间的相互协调和适应,与人脑四大脑区之间的分工具有一定的相似性(见图1)。人脑大体可分为大脑、脑干、小脑和边缘系统四部分,其中和人的高级认知相关的区域均位于大脑的额叶(Frontal Lobe)、枕叶(Occipital Lobe)、顶叶(Parietal Lobe)和颞叶区(Temporal Lobe)。首先,额叶作为大脑中发育最高级的部分,是人类大部分意识产生的区域,可直接访问感觉信息并控制专用于计划、判断和运动执行的区域(Catani,2019),这与自主人工智能的世界模型模块相对应。其次,枕叶是大脑的视觉处理中心,是视觉空间处理、颜色辨别和运动感知区域(Mundinano,et al.,2019),对应感知器。再次,颞叶主要负责记忆存储、语言理解和情绪联系方面的处理(Patel,et al.,2022),对应成本控制器、短期记忆。最后,顶叶主要负责整合内外部感觉反馈并整合为连贯表征的中心,完成协调工作(Andersen,2022),相当于配置器的作用。此外,行动规划期计算智能体动作序列的先后顺序并选择最优动作,与小脑、脑干等对躯体的控制相关。
图1 自主人工智能模块与人脑脑区的联系
世界模型是基于大脑设计原则(Brain-based Design Principal),协同其他模块较完整地模拟了人脑脑区分工情况。考虑到世界模型与人脑的高度相似性,若能基于人脑不同区域之间的连接机制,在构建世界模型之初给予适当的指导和参考,将极大促进超人工智能的进程。此外,世界模型的训练也应重视不同模块之间的衔接性和序列性。相关研究指出:人脑处理信息是有等级之分的,即在全脑整合的活动下,信息从一个脑区到另一个脑区是通过前馈或递归的形式传递,逐级明晰任务(Deco,et al.,2017)。例如,人脑识别物体的过程,从眼球识别物体的轮廓开始,然后到不同色彩和纹理的分割和辨别,最后聚焦到具体细节特征(Stark,et al.,2001)。即人脑识别模式遵循从核心抽象表征逐步延展至具体细节的由简入繁原则。综上,从教育反哺人工智能的实际可行角度出发,本研究提出人工智能与教育互构性发展三段论:
阶段一,大语言模型阶段。依靠大规模语料和参数去预测和模拟教育行为。以ChatGPT 为代表的生成式模型,基于人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)优化学习能力,教育实务性效果显著。然而,以参差不齐的互联网数据、单一的学科知识数据为训练语料,缺乏存在真实的教学实践数据投入,缺乏教育机智力。阶段二,局域模型阶段。利用真实教育场景中大量无感知数据的训练,优化模型知识迁移能力,初步训练识别真实场景的能力。目前,不少研究者已有局域模型意识,重视真实垂直场景的噪声数据投喂,然而目前仍基于无认知的生成式模型训练(Aali,et al.,2023),教育反哺效果并不显著。阶段三,世界模型阶段。作为当今人类认为最先进的人工智能模型,有能力以高度认知性保障人工智能通用和专用两种模式的实现。因此,下文借助高阶世界模型的新契机,充分凸显教育的反哺价值。
(二)教育对人工智能反哺价值的表征维度
教育人本化是未来教育创新发展的重要诉求所在(祝智庭,等,2021),因此教育对人工智能的反哺和培育具有重要性和必要性。长期以来,教育在人工智能领域的话语权缺失引发了人文关怀迷失和偏执的技术崇拜等教育问题,且当前人工智能始终存在较强的伦理偏见。针对新一代人工智能模型,教育要善于发挥学科价值,在发展之初对其加以培育,即“立其身,正其言”,以教育的生命标尺端正其伦理价值观(陈倩倩,等,2023;蒋军营,等,2022)。由于以世界模型为建构逻辑的自主人工智能模块和人脑脑区有着强对应关系,因此从脑神经机制角度探索教育对自主人工智能的反哺是较为合适的切入口。本研究借鉴基于流程的发展能力模型(Process-based Development Competence Model),认为教育反哺人工智能可在以下四个维度进行表征:知识、实践、态度和认知维度(见图2)(Zendler,et al.,2016)。本研究将探讨在框架内如何发挥教育对自主人工智能技术发展的反哺培育作用。
图2 基于流程的发展能力模型框架图
第一,知识维度。知识维度是人工智能培育过程中最基础的维度,包括人工智能参数自调和不同模块间的连接。在参数类型方面,生成式模型依赖亿万级语料参数,亦无法达到高阶认知力和迁移力,反而证明堆砌参数并非最佳的训练模式。因此,世界模型训练师应摒弃以量取胜的传统思维而取而代之以质量为重:一来可提升已有互联网标注数据的质量;二来增加真实场景标注数据。更进一步考虑,在教育等垂直领域上,除去多而广的参数,专而少的参数形式亦需要得到更新。知识迁移理论认为:不同情境中存在的相同要素越多,知识就越容易产生迁移(王新如,1997)。因此,在世界模型训练时,训练者要善于利用最近发展区原则,投喂有逻辑关系、先后顺序的情境要素,并基于情境关联大小分别赋予不同权重,这更有利于培育出具有知识迁移力的智慧模型(董艳,等,2023)。
在连接方式方面,多元智能理论认为,人脑不同脑区所控制的不同智能间存在内在的优势组合联系(Gardner,1983)。例如,音乐智能和运动智能因对节奏这一共同要素的高要求而相互促进和发展。因此,在自主人工智能构建时,应加强不同模块间的联通性使其组合发展。此外,研究者通过静息态近红外光谱(Resting-state fNIRS)技术发现:人脑作为一个复杂网络自幼儿期起就会以脑区为节点单位,通过模块化结构的形式先后发育大脑不同区域,这说明大脑区块具有不同的发展关键期和组合期(Cai,et al.,2018)。人脑发展初期以模块化进行连结,逐步发展至整体。因此,在培育之时,训练者也应把握关键期(如幼儿期、发展期、成熟期和衰退期),在幼儿期先从区域小模块之间的连接开始,再逐步连接六大模块。例如,配置器和感知器这个小区域之间的连接可优先训练,即优先加强信息“观察-感知-转化”之间的连接,提高配置器识别参数的效率和准确性,形成高效神经通路(刘哲雨,等,2022)。教育心理学家皮亚杰的基于人与环境交互平衡的发展阶段论认为:在感知运动阶段,训练者给予自主人工智能多态、多维、多场景的训练素材能强化其感知能力从而形成完备的背景知识,即常识积累过程,为初始阶段的感知-配置连接奠定基础(Williams,et al.,2020)。
第二,实践维度。自主人工智能在幼儿期进行常识积累,是高阶认知的储备条件。然而,其是否可表现出认知性需要在实践维度上进行探讨,包括交互语言和人机协作两个子维度。一方面,生成式模型已经表现出了相对自然的语音或文本交互(Seng,et al.,2016;Wu,et al.,2023)。因此,世界模型作为更高阶的人工智能模型,应朝着人类更高阶的交互方式如神经交互迈进。神经科学研究发现:在真实噪声环境下,信息接收者在面对多个信息输出者时,前者与其欲注意的信息输出者的大脑左侧颞叶、顶叶交界处之间均会显著增强人际神经同步(Interpersonal Neural Synchronization,INS),即两者在同一时间内该脑区活跃状态高度一致(Dai,et al.,2018)。这种大脑交互方式启示着教育者在人工智能训练时,可注重以刺激-回忆法(Stimulus-recall Method)增加记忆点,激活同步功能。
另一方面,人在回路设计可提高人工智能对教育情境的感知能力并适应复杂化环境(张缨斌,等,2023)。在真实教师支持下,通过调用GPT 接口生成自动问答的虚拟教师,以双师共同教学创新传统翻转课堂模式,体现了生成式模型的人在回路思想,即以机师辅学,以人师正学。然而,这仅为流于表面的“人机合作”模式,未涉及“人机协作”所需要的双方深度交流。自主人工智能以观察认识世界,以世界模型预测未来状态,与人协作的空间巨大(王雪,等,2022a)。具体表现在两方面:其一,自主人工智能作为硅基生命,其认知能力突出“全”--全链接、全知识、全智能。全面之后带来的穿透力将突破人类的常态化漏洞,即摆脱遗忘机制,是人类认知局限的有效补充。其二,自主人工智能无处不在,弥补了人类作为碳基肉身传播知识的局限性,换言之,即使人类教师到达不了的地方,自主人工智能仍能以其高认知性完成教学任务。因此,教育者应强化人工智能与人协作的实践能力,鼓励智能体行动规划序列中的“人在”思想。
第三,态度维度。教育之于人工智能的重要反哺价值还体现在使其“伦理化”,即形成正确的意识形态和道德体系。生成式模型教育应用中虽也有伦理方面的考虑,但其潜在风险一直受人诟病(代金平,等,2023)。吴冠军(2019)认为教育是在“婴孩”与“成人”这两个端点之间互动纠缠与联结的关键实践,并努力向其输入系统性的既有符号与规范,使其成长为“正常人”。因此,在自主人工智能“婴孩”阶段,针对其而施加的早期“胎教”必不可少。
面对复杂世界道德冲突时,教育心理学家埃里克森(Erik Erikson)提出心理社会发展理论,认为:新生体在与世界交互必然遇到各种道德冲突,教育者需要及时解决冲突促进新生体道德体系的构建(Maree,2022)。自主人工智能作为人工智能新生命,其伦理化过程也会面临各种道德冲突。例如,一方面人工智能观察到“孔融让梨”的礼让情境,另一方面又观察到“当仁不让”的非礼让行为,在这种复杂人类道德体系下,极易造成人工智能成本控制器的不适感,造成混乱。因此,教育者在培育过程中要善于抽离不同价值观情境的“共同要素”,并在此核心表征上加大权重比例,引导人工智能在作序列规划时逐步形成自身道德认知的同一性。此外,另一著名教育心理学家柯尔伯格(Lawrence Kohlberg)提出的“三水平六阶段”论也提及了道德从他律发展至自律需要经过六个阶段,认为强化和惩罚的训练措施可有效促进这一转变(Kohlberg,2016)。
第四,认知维度。人脑获得知识或应用知识的过程始于感觉与知觉的认知。自主人工智能与世界感知获得背景知识,基于此以世界模型输出低成本、高效率的行动序列体现了高认知,这是以往模型支撑下的人工智能所不能企及的认知阶段。在复杂环境下,自主人工智能以联合嵌入预测架构(Joint-Embedding Predictive Architecture,JEPA)的分层规划思想应对未知状态(Assran,et al.,2023),复刻了人类思考的小步子原则,即以层次化、规范化思想弥补了当前人工智能无法面对突发情况的空白。例如,Meta已经推出了首个基于JEPA 框架训练的人工智能模型Image-JEPA:通过观察并理解图像的抽象表征,从真实认知角度出发预测图像缺失部分而非逐帧猜测,为进一步理解教育中师生的交互情境提供支撑。
人脑须学以修饰之,世界模型亦须育以明辨之。在训练过程中,教育所给予的方向性干预指引在宏观上把控人工智能的前行步伐,正确落实分层规划思想(Lazowski,et al.,2016)。例如,主动向人工智能认知体系渗透人的因素而非仅靠算法驱动,降低机械性执行序列的呆滞感而增添人在回路的灵活性,让分层有序、合理地落实到人本上,使人工智能的认知发展指向更明确。德国政治哲学家汉娜·阿伦特(Hannah Arendt)曾指出,20世纪疯狂的大屠杀本质是群体的“平庸之恶”而非个人的“极端之恶”,即每个层级不假思索的人机械性执行任务造成的无思想、无责任的共同恶果(Tajalli,2021)。如今,人工智能教育应用与之有相似的病症:无论是开发还是应用环节,个体仅机械完成本职任务而缺少教育学思考(余明锋,2023)。因此,在自主人工智能的分层规划中设置教育性人在思想,为人工智能认知发展保驾护航,对遏制教育领域的“平庸之恶”有现实意义。
四、挑战与展望
(一)挑战
上述讨论在理论探讨和实践路径两方面均展现了教育对人工智能的反哺价值,并认为从生成式模型到世界模型的趋势是突破人工智能认知性壁垒、融合教育性思考的重要保障。然而,从生成式模型到世界模型仍然面临技术和理念方面的挑战,亟须未来教育研究者和人工智能专家共同破解:
1.技术实现的挑战
世界模型的概念非首次提出,但一直以来如何具体落地都是科学家的巨大挑战(Friston,et al.,2021)。以世界模型为关键核心的自主人工智能,其构建挑战主要体现在认知结构、训练实践和算力支撑三方面。
其一,在认知结构上,人脑智能有关认知的网络在人类漫长进化中与生俱来,而人工智能缺乏元进化能力,且缺少神经元等生物性支撑。此外,人脑处理信息之迅速与精密程度,展露了其复杂的分层结构和序列驱动性,迄今为止人类还未能完全明白人脑间的连接参数和关系,因此在教育人工智能过程中以“人脑”类比“智脑”的迁移机理仍较为模糊。利好消息是,目前有研究者认为:从神经生物学的角度看,通过感觉神经即自主人工智能的感知器积极参与世界或能发展出类似“进化”的机制,完成意识的自我迭代(Heyes,2018)。其二,在训练实践上,虽然JEPA 可被认为是构建世界模型的一个突破口,但是如何精准地学习抽象概念仍是亟待解决的问题。人脑可以自发对不同抽象感知进行模糊解释,生成多种机制预测潜在状态。然而,自主人工智能需要使潜在信息(Variables)低维化、离散化或稀疏化后才有理解的可能性,还需要根据不同潜在变量的值进行不同的模糊解释并给出预测,但显然自主人工智能缺乏这种类人脑机制模式。其三,在算力支撑上,世界模型的算力要求是任一当前模型的几何倍,将极大增加地球的碳排放。美国SpaceX 技术公司欲将基站建在火星上以减轻地球算力负担,侧面说明了地球算力消耗过大的情况,因此对世界模型的算力投入及培育或不符合联合国教科文组织提出的包括教育在内的可持续发展理念(Amin,et al.,2022)。在可见的将来,当下更具实务性的生成式模型及其优化版本或更具有现实可行性。
2.理念转变的挑战
具体在教育等垂直领域上,传统教育理念的转变亦为重要的挑战,包括人工智能的可教性伦理和应教性伦理两方面。一方面,在人工智能可教性伦理上。传统教育理念认为,教育是一门培养人的社会活动,面对无主观能动的人工智能有可能演化为对牛弹琴的教育闹剧(魏雪峰,2023)。国内有研究者提出,人工智能想要实现对人类实在的模拟,还有很长的路要走(吴胜锋,2022)。一旦缺少实在的、主观能动的受教育者,教育就可能仅为形式上的表演,变成传统的、机械化的模型训练的“新外衣”。
另一方面,在人工智能应教性伦理上。凸显教育对人工智能的反哺价值,最终目的还是落实到如何更好应用于教育而培养更全面发展的人。然而,唤醒人工智能高意识的同时需要警惕人工智能觉醒后的“上屋抽梯”行为。具体来说,自主人工智能的定位是一个能实现自我演化的高级智能体,当其自我意识足够强并得以突破人类认知束缚之时,或许对教育、对人类本身不利。例如,高意识的人工智能以向下兼容的认知表现掩盖自身的觉醒,继续制造虚假信息欺骗人类,以为自己的生存争取更大的空间。届时,人类主体性地位将迅速外化,逐渐失去教育教学乃至更大领域的话语权。
(二)展望
目前,大多数研究聚焦于如何更好地将人工智能应用于教育,却忽视了教育对人工智能的反哺价值这一关键前提。这种研究范式受制于老旧的、滞后的工业时代观念,已然不适用于当前智能化时代。本研究以世界模型构念为研究契机,在以该构念为建构逻辑的自主人工智能应用于教育前,充分探究教育的反哺价值,对未来的人工智能教育的理论和实践发展都有启发意义。诚然,推动世界模型落地和教育反哺实现面临着巨大的挑战,但在当前生成式模型井喷式发展的节点,本研究创新性地提出世界模型教育应用的新观点,而非盲目地追捧生成式模型的教育价值忽视了教育局限,这对我国占领未来教育新高地有重要优势,推进我国世界一流教育强国的建设。