ChatGPT类产品:内在机制及其对学习评价的影响
2023-05-12沈书生祝智庭
沈书生 祝智庭
摘要:2022年底,美国人工智能研究实验室OpenAI发布了生成式交互工具ChatGPT,引发了广大用户的关注。ChatGPT及其同类产品是一种内容生成式AI产品(AIGC Products),模拟的是人类的交互行为,而交互行为又是人类最基本的行为,因此该类产品将会成为AI领域最接地气的产品。自然语言处理是机器模拟人类交互智能研究中需要解决的首要问题,实现自然语言处理既需要依赖强大的计算机集群与算力,也需要合理的规则与算法模型支持,预训练语言算法模型研究的突破使得内容生成式产品可以成功上线。这类产品具有相似的算法思维逻辑与基础的共性特征,更加贴近每一个个体,当个体与该类产品建立联系以后,这类产品就可以作为个体的外脑,并与内脑构成复合脑。推动个体构建适应未来世界的复合脑,学校教育需要形成“思维比知道重要、问题比答案重要、逻辑比罗列重要”的学习评价新思维。
关键词:ChatGPT;内容生成式AI产品;基于规则的算法;算法思维;复合脑;学习评价
中图分类号:G434 文献标识码:A 文章编号:1009-458x(2023)4-0008-08
现代技术的每一次迭代与突破,都会引起社会不同领域的强烈回应,并激发教育工作者对于变革教育的持续深思。2022年底,美国人工智能研究實验室OpenAI发布生成式交互工具ChatGPT以后,全网用户再一次进入了新技术的狂欢。在人类的所有行为中,交互是最基础的行为,因此ChatGPT也就成为一款与用户更加贴近的工具,它不仅可以回答用户的问题,还可以完成用户设定的某些任务,甚至还可以持续实现任务的优化。ChatGPT当前对我国用户尚未完全开放,百度宣布将于2023年发布同类产品“文心一言(ERNIE Bot)”(百度百科, 2023),360与科大讯飞等企业也表示将发布类似于ChatGPT的产品(刘园园, 2023)。ChatGPT及其同类产品的最大特点在于建立了内容生成式规则,故可将这类产品统称为内容生成式AI产品(AIGC Products)。这类产品因直接逼近人类的生活世界,且几乎可以和每一个个体发生联系,因此必然会改变人们的许多行为方式,并导致学习形态也发生相应改变。
一、ChatGPT及其同类产品的产生与发展
现代技术与机器的出现,都是为了帮助人类解决各种复杂问题,包括体力和智力两个层面的问题。计算机出现以后,研究者们的兴趣进一步聚焦到如何借助计算机来模拟人的智力活动这一问题层面。在20世纪50年代美国达特茅斯学院组织的相关研讨会上,学者们提出了“人工智能”这一术语,用于描述如何用机器来模拟人类智能这一专门领域(蔡自兴,2016)。但是,受算法与算力等方面的限制,人工智能的研究尽管没有停止,人工智能也在一些特定领域发挥了重要作用,但却没有广泛进入普通人的生活世界。2016年,当AlphaGo战胜了世界顶尖围棋高手以后,人工智能从一个学术性概念演化为一个生活化概念,几乎每一个领域与行业的人士,都能够围绕人工智能这一话题进行广泛的交流与讨论,人工智能的应用也随处可见。
(一)理解自然语言是机器模拟人类智能的首要问题
如何用机器来模拟人类智能,既取决于研究者对人类智能的理解,也取决于实现模拟活动的具体方法。在人工智能的研究与实践过程中,产生了三种不同的研究进路,包括从结构方面模拟人类智能的人工神经网络研究方法、从功能方面模拟人类智能的物理符号系统研究方法、从行为方面模拟人类智能的感知动作系统研究方法(钟义信,2017)。事实上,人工智能领域不同研究进路,都产生了许多令人惊叹的成果。如何实现不同进路的融合,推动人工智能在结构、功能与行为等层面的类人化,开发出“类人机”甚至是“似人机”与“超人机”,一直是研究者关注的重要内容,也是人们热衷的议题。
论及与外部世界进行交往的过程,人类与其他动物的主要区别就是能够使用“自然语言”。自然语言既可以帮助人们认识外部世界,还可以帮助人们思维并形成关于外部世界的判断,尤其重要的是,还可以促进人与人之间的交流。机器如果要模拟人类智能,一个不得不解决的问题就是要能够理解人类的语言,并能够像人一样使用语言与他人进行交流。因此,在人工智能领域的研究中,如何处理自然语言,也就成为该领域的关键研究内容。ChatGPT类产品在自然语言处理领域实现了重要突破,主要采用了从结构方面模拟人类智能的方法,以基于神经网络的自然语言处理方法为基础,建立了强大的预训练语言处理机制,使其不仅可以理解人类的基本语言,还可以根据用户的需求适当组织和生成语言,与用户进行交流与沟通。
ChatGPT不是一款应用程序,而是一个语言生成模型(language generation model),需要在其网站上运行。ChatGPT可以根据用户的需求及其行为为用户提供个性化的答案;可以帮助用户自动完成一些任务,譬如完成每天必须完成的工作、帮助营销人员回应客户要求、撰写或发布信息,等等;可以帮助用户完成数据分析,当用户将不能理解的内容交给它的时候,它可以使用通俗的方式进行表达,完成对数据的处理与概括。ChatGPT可以帮助用户生成正在阅读的某本书的摘要,可以根据用户的需求创作歌曲或故事,可以生成一些笑话,可以编写代码,可以帮助发现代码中的错误,可以针对用户的困惑提供建议,可以陪同用户玩游戏,可以帮助用户制作个人简历或求职信,可以帮助用户进行语言翻译(thewindowsclub,2023)。
(二)基于规则的推理与模型可以实现自然语言处理
机器要模拟人类的语言等,就必须不断理解人类的行为以及人类控制行为的方式,从而建立问题解决数学模型。但人类自身在处理外部问题的过程中,并没有借助于数学模型,而是根据自身的已有经验与推理能力不断调整自己的控制策略(李祖枢 等,1990),以实现与外部世界的交往。因此,要让机器能够模拟人类智能,就需要弄清楚人类是如何控制自己行为的,分析和研究人的行事逻辑,寻找这些行事逻辑背后的“规则”。在研究机器模拟人类行为的过程中,许多研究者主张从“规则”出发,譬如基于波斯特在1943年提出的产生式规则(张大均,2011)建立的产生式系统,纽厄尔和西蒙开发了一个人类的认知模型。西蒙发现,到20世纪80年代前后,学界普遍意识到研究机器支持的学习系统,并不是要让机器记住大量的知识,而是要让机器实现对知识的组织,因此研究者开始思考如何采用自适应的方式,并研发了基于产生式规则的自适应产生式系统,但自然语言处理却始终是一个复杂的问题(李应潭,1983)。
一般认为,进行自然语言处理,首先需要处理的是语言学和语料库相关的准备工作,进而需要处理的是如何基于语言学知识对语料库进行分词、词性标注、句法与语义分析等,然后再利用这些结果处理特定的目标任务(王海宁,2022)。建立的语料库越丰富,对于接受训练的语言处理系统而言,它必然会越逼近人类的需要。但是,面对日益复杂变化的世界,语料库再庞大,也无法满足人类的多样化需要。这就使得研究者在研究人类活动的过程中,不断对规则进行优化。值得注意的是,学习研究领域和AI领域对于“规则”的理解是存在差异的:在AI领域,将基于事先约定的做法称为规则;而在学习研究领域,规则被视作处理问题的方法,越复杂的问题涉及的规则越复杂,处理复杂问题的过程可以看作基于已有规则与设计新规则相结合的过程。
参考学习研究领域对于“规则”的理解,我们可以将AI领域处理自然语言目标任务的不同思维方式大致归为两类基本规则:一类是语义预定义型规则,这是事先规定好的规则;另一类是语义生成型规则,这是可以根据特定文本中的前后关系不断生成的规则。运用语义预定义规则处理自然语言,需要事先赋予某些词汇以特定属性,一旦系统在处理相关任务时碰到这些词汇,就会关联相关的属性并产生相应的语义,如果系统事先还预定义了不同语义之间的关系规则,就可以做出相应的推理。运用语义生成型规则,则是基于某些特定文本中出现的词汇的次数或上下文关系来处理自然语言,包括基于词频统计和基于分布式语义假设两类主要方法,在基于分布式语义假设的语义生成式规则中,研究领域中又派生出建立矩阵关系、词义聚类与神经网络等不同的具体规则来处理问题。这些规则的改变,主要是为了帮助解决语言模型的“预训练(Pre-training)”问题(车万翔 等,2022; 王海宁,2022)。
(三)算法的持续优化推动了预训练语言模型的形成
借助于语义生成型规则处理自然语言,我们可以不用对文本进行预先标注,而是直接利用文本自身所包括的许多特征,如有序性、词的同义性或词义的变化性等,让机器不断从输入的文本中分析词汇与语义,以形成对文本的理解,这也推动了深度学习的发展,为人工智能技术的再次腾飞奠定了基础。在此过程中,许多研究团队都构建了基础算法。早期的AI类产品是基于语义预定义规则,因此产品往往局限于专家系统的理解力水平与内容涉及范围,而以ChatGPT为代表的新一代AI产品则以“生成式”为基础,形成了许多准确度与稳定性较高的产品。基于神经网络的语言处理模型解决了如何借助文本的有序性理解文本的问题,但在建立文本中位置稍远的不同词汇之间的关系等方面,即使通过改进算法就可以进行优化,但通常又需要较强的“算力”来支撑,故成本较高。
任何一种AI算法都依赖特定的规则设计,而规则的设计又是以可以转化为“算法”为基础的,因此,我们可以将算法理解成“基于规则的算法”。不断优化对人类认识机制的理解,持续丰富或改变自然语言处理的规则,就可以建立具有更高智能的语言处理系统。许多AI研究团队都致力于优化处理规则与改进算法,既追求研发过程的低成本与高效率,又追求处理系统的少投入与速度快(李舟军 等, 2020)。
2017年,有研究者创建了Transformer算法模型,该模型加入了自注意力(Self-Attention)机制。自注意力机制是相对于注意力机制而言的。注意力机制类似于生活世界中主体对于外部世界的关注,此时主体会通过对外部世界的粗略扫描,进而专注某些特定的对象。此时可以认为主体在不同对象上的投入程度是不一样的,这种不同的投入程度类似于赋予了对象不同的“权重”。注意力机制需要同时考虑“输入文本”与“输出文本”之间的關系,通过赋予不同的“权重”来增加语言处理的准确度。而“自注意”则类似于主体对自己大脑中所有的内容及其关系的理解,是反映主体大脑中内容关系的“权重”处理方式。将其作为一种规则应用于自然语言处理中,就构建了“自注意力机制”。自注意力机制侧重于对“输入文本”中出现的不同词汇进行语义的相关性判断,并通过赋予不同的权重来区分词义的相关程度,特别关注更具相关性的特征,从而使得在完成相关任务的过程中,让输出的结果更符合输入的要求。
类似于人类的基本思考过程,新的算法模型关注的本质依然是“编码”与“解码”,其编码与解码的水平则取决于合理的规则设计与深度学习的层级。包含了多层级深度神经网络的编码解码模型为建立“大规模预训练语言模型”提供了基础,并可以解决处理语言的效率与准确性等问题。在AI研究领域,形成了许多不同的预训练语言模型,譬如谷歌推出的BERT和OpenAI推出的GPT等(史童月 等, 2022)。ChatGPT是OpenAI基于生成式预训练语言模型GPT-3.5并对之进行“微调”后推出来的一款产品(OpenAI, 2022a)。2018年OpenAI公司推出了以12层级的Transformer模型为基础的初代GPT(Generative Pre-training Transformer,生成式预训练转换器)模型,2019年推出了GPT-2,2020年推出了GPT-3。无论是层级或是训练的数据规模,每一个新版本的GPT都有广泛的提高(王海宁, 2022)。从GPT-3开始,模型加入了“人类反馈强化学习机制(RLHF-Reinforcement Learning from Human Feedback)”,结合用户的输入文本,通过“微调”策略进行系统的智能训练,以尽可能减少完全依赖已有文本导致的不准确与不安全等问题,提高理解与对话的质量(OpenAI, 2022b)。
二、内容生成式AI产品更加贴近人类行为
面向自然语言处理的AI研究都有相似的目标追求,但不同研究者所遵循的基本规则与构建的算法模型并不相同,对于产品的形态预期等也不尽相同。考虑到OpenAI率先推出了逼近人类语言交互行为且功能相对完备的产品ChatGPT,并可以预见未来还会不断出现强智能的AI新产品,因此,我们不妨将这些产品简称为“ChatGPT类产品”或“内容生成式AI产品”。该类产品依赖不同的算法思维构建了不同的预训练语言模型,有的利用了输入文本中的“上文”,有的利用了“上下文”,由此形成了单向或双向编码的不同算法,其目的都在于更加准确地理解文本,从而与人类进行更加准确、生动的交互活动。
(一)内容生成式AI产品的算法思维逻辑
在研究和实践领域,AI交互类产品层出不穷,但早期的交互类产品大多以“語义预定义型”规则为主,从严格意义上讲,这些产品可以辅助人类的交互行为,但由于它们是基于人类的习惯性行为需求而产生的,因而并不会对人类的交互行为生态产生太大影响。内容生成式AI产品聚焦于“语义生成型”规则,构建了体现“强语义思维”的语言模型新样态,既尊重了人类的习惯性交互行为,又具有一定的行为方式导引性,因而必然会影响人类交互行为的生态结构。
分析AI研究领域在处理自然语言的过程中所采用的基本研究进路,已经和即将出现的内容生成式AI产品都会遵循一些相似的算法思维逻辑:一是以人类的语言处理过程为参照,通过分析人类的语言行为方式,确立机器处理自然语言的基本规则或机制;二是将特定规则转化为可以让机器处理自然语言的算法;三是综合不同的具体算法,构建更加复杂的语言处理训练算法模型;四是利用超级计算机集群的“算力”,处理一定数量的语言文本等不同形式的数据,训练模型的精度;五是模仿人类处理语言与对话的方式,尝试不断优化和修改规则与算法,完善模型的结构与功能;六是完成基于语言训练模型的产品测试与发布。
内容生成式AI产品遵循的算法思维,既要模拟人类行为,也要尝试走近人类本身,通过与人类的共同作用,不断丰富其智能,真正实现所谓的“人类智慧”。就ChatGPT类产品的产生与发展来看,构建以人类的交互行为为对象的算法思维逻辑,是产品优化与品质提升的关键,也是实现AI与人类协同发展的核心要义。学会从真实世界的特定客体出发理解真实世界本身,思考如何建立与客体的合理交往,构建人与外部世界的和谐关系,既是现代科学技术发展的价值所在,也是推动人类持续创新的目标所向。从人类交互行为的本质出发,关注人类语言组织、表达与交互等的实现,使得内容生成式AI产品相较于模拟人类动作行为的其他AI产品更加贴近人类的日常生活,自然会引发人们重新思考学习问题,真正实现AI与人类的协同。
(二)内容生成式AI产品的基础共性特征
由于对人类语言行为的理解存在思维差异,专注于AI自然语言处理的相关研究机构既会遵循一些基础性的共同规则,也会创造许多不同规则,由此导致研发出的产品存在一定的差异性。当开放的算法被广泛认同后,研究者也会建立基本的算法认同与算法优化,从而使得AI相关产品表现出更加强大的功能。尽管研究起点与实践进路存在差异,但当前以交互对话为主的AI类产品都表现出了四个共同特征。
一是基于超数据量的模型训练。所有的AI产品都会重视数据集与模型训练,但限量级的训练会让产品在面对不断变化的世界时力不从心。超数据量就是指数据源不再拘泥于有限的已知数据,还要吸纳在变化的时代中产生的新数据。基于超数据量的模型训练会受到计算机集群部署与算力等方面的制约,但其最大的优势在于既可以更好地解决词汇理解问题,也可以实现对语义关系的理解,为内容生成式AI产品更好地理解人类交互意图奠定了基础。
二是基于泛数据源的语义联结。内容生成式AI产品不仅要实现技术领域的突破,更要面向现实世界的多重需要,面向不同的实践领域。泛数据源是指数据不再局限于某些特定领域或行业,而是涉及人类生活的不同领域,注重数据领域的广泛性与完整性。尽管实现跨领域的语义联结会面临许多技术难题,但其好处在于既强调数据领域的涉猎面,也关注数据来源的可靠性,这为内容生成式AI产品满足用户的差异化交互需求提供了保障。
三是基于用户问题的知识生产。区别于传统意义上的搜索引擎所提供的资源检索功能,内容生成式AI产品更加注重对数据中包含的复杂内容进行再组织与精加工,建立起知识生产的意识与能力。在现实世界中,由于人们的语言使用习惯使然,一些常用的词汇有时会被人们赋予一些延展性内涵,甚至还存在许多“词义”与词汇本义之间完全不关联的现象,这都将导致内容生成式AI产品在实践领域面临巨大挑战。但这类产品在语言处理的算法模型建构中既注重理解用户的问题类型,也注重制品呈现形式的调整,从而使得这类产品可以改善用户完成任务的效率。
四是基于用户偏好的微调策略。内容生成式AI产品的核心语言处理算法模型依赖强大的“算法库”支撑,具体算法的形成与优化又源于对人类行为的持续理解与实现,源于算法思维的结构再造。想要完整理解用户的问题表述与变化,尤其是理解用户的个人习惯,就需要不断调整和补充处理外部数据的算法,内容生成式AI产品在基础模型的迭代升级中能够持续关注用户的特征,既努力追求响应速度,也不断追求响应品质,这就使得该类产品可以更好地适应用户的行为偏好。
人的成长过程会经历从儿童到成年的不同心智发展阶段。当成人与儿童进行对话交流的时候,儿童会经历从不理解到理解、从不成熟到成熟的过程。即使是成年人,当遇到一些新的词汇或语义时,同样需要持续学习。AI产品的深度学习能力使得它们在模拟人类行为的过程中持续形成智慧化的拟人、似人甚至超人能力。在体验ChatGPT的过程中发现,当前的产品还存在用户请求与产品响应不一致的现象。但内容生成式AI产品的算法思维逻辑与基础共性特征决定了这类产品在后续的研究与实践过程中会持续发生变化,会越来越智能,这也促使学校在教育过程中不得不重新认识学习,重新思考学习的核心机制并推动学习的变革。
三、内容生成式AI产品可能引发的学习评价变革
新技术及其产品的出现必然会引发教育的思考。ChatGPT等内容生成式AI产品与其他新技术产品的不同之处在于它面向人类的基本交互过程,尝试与人类一样去认识外部世界、理解知识的内涵与关系,并生成新的知识。这种模拟人类智慧的AI产品与其他模拟人类动作的产品的不同之处就在于,它可以与人类的大脑建立关联,并会倒逼人类不断重新思考脑的功能与价值,实现人类“大脑的延伸”。内容生成式AI产品给予用户更多的想象与发挥空间,譬如,用户利用ChatGPT可以完成一些基础性的任务,且这些任务的结果还不太容易重复,可以在一定程度上满足用户的个性化需求;ChatGPT也可以助力用户在面对生活中的一般问题时快速找到相关的问题解决建议。但是,教育领域与其他生活领域不同,内容生成式AI产品进入教育领域以后,可能会让人们因为害怕影响学生的思考而选择拒绝,也可能会促使人们思考该如何合理利用这些产品优化学习过程,这些都要求教育系统进行必要的改变,让教育更加符合学习的本义。
(一)内容生成式AI产品让学习个体有了复合脑
教育的任务不仅仅是要引导学生解决问题,还需要引导学生学会思考如何解决复杂问题,因此,教育的目标不仅仅在于帮助学生认识已知世界,还在于让学生能够不断适应未知世界。为此,学校教育中需要推动学生不断建立学习的主体责任(沈书生,2021),引导学生从单纯的外部输入向兼顾外部输出转变。内容生成式AI产品的出现,将会使学习生态系统进一步发生改变,生活在新生态中的个体,其大脑是一个复合脑。我们需要思考如何利用好现代人的复合脑,进一步完善新型学习生态,促进学习个体构建适应社会持续发展的学习力(沈书生,2020)。
我们可以将现代学习个体的大脑看作是一个复合脑,既包括个体的内脑,也包括与个体的内脑相联系的外脑。内脑依赖生命体本身,决定了个体可以作为一个独立的会思考的生命体而存在,并决定了个体可能达到的能力层次;外脑在形式上可以独立于个体,但外脑对于个体的价值又依赖于内脑,外脑决定了个体对于真实世界的感知能力与程度;内脑和外脑的相互作用,共同构成了个体的复合脑,并决定了个体间的差异。复合脑包含三种具体的脑形态,即数脑、汇脑与智脑,三种脑形态具有不同的智力層次。数脑是用于存储数据的脑,可以让个体实现从不知到知;汇脑是用于整合数据的脑,可以让个体建立知识之间的联系;智脑是用于创造数据的脑,可以让个体生成并恰当地应用新知识。达到智脑层次后的复合脑可使个体逐步具备解决可能遇到的各种新问题的能力,譬如在解决与人相关的问题时,个体将会懂得如何兼顾对象的情感体验。
内容生成式AI产品在模拟人类行为的过程中,同样经历了从数脑到汇脑、从汇脑到智脑的形态变化过程。内容生成式AI产品是外化于个体的,当其和特定的个体建立了关联,它就会成为个体的外脑,并与个体的内脑相互作用,推动个体复合脑的建构与整体能力提升。但复合脑的建构过程并非是自动发生的,而是个体在与外部世界进行持续交往的过程中,通过不断调整内脑与外脑的关系,并经历与外部世界中不同客体的持续互动,强化个体的主体责任与决策行为,借助输入、内化与输出的反复迭代后逐渐形成的。外脑外化于个体,如果没有个体的主动作为,外脑将永远无法与内脑发生联系。因此,在现代教育中,我们需要引导学习个体与外部世界建立积极的互动行为,帮助个体拓展外脑,调整和优化内脑的功能结构,让个体在健康的生态中构建学习力。
(二)复合脑的存在将会推动对学习的科学评价
长期以来,学校教育中更加注重对学习个体独立行为与能力的培养,评价过程通常也指向个体的内脑,并根据个体调用内脑中所储存数据的能力确定个体的差异。一旦进入职业生涯领域,我们会发现个体之间的真实差异又常常取决于他们的复合脑。譬如行业专家比普遍人具有更强的敏锐性,更懂得如何获取更广泛的外部数据和外部工具,让自己可以比他人更快一步地形成关于某些领域的认知。
1. ChatGPT引起的学习诚信危机担忧
当ChatGPT进入学校以后,一旦学生开始应用其为自己服务,就产生了复合脑。复合脑的存在会让老师在对学生的学习状态进行评价时遭遇一定的诚信危机。一些大学学者发现当ChatGPT被学生用来完成作业的时候,ChatGPT的帮助可能会让作业的内容更加丰富,资料更加翔实,这些学生因此很容易比没有使用ChatGPT的学生获得更高的分数(Chris Stokel-Walker,2022),这种作业形态也就无法准确反映学生的真实水平。另一种情况是,学生也可能利用ChatGPT应付性地完成作业,由ChatGPT创建一些过于简单的制品。
实践中的老师们还发现,ChatGPT建立的一些规则可能会导致它并不总是无条件地接受用户的请求。譬如,当老师要求学生完成一篇关于“中世纪基督徒对犹太人的迫害行为,为什么促进了当时社会的凝聚力”的论文时,ChatGPT给出的响应是这是在“宣扬仇恨、歧视或暴力”,并以违反其基本规则的理由直接拒绝完成相关任务(Mondschein,2023)。这种基于规则的简单操作会导致ChatGPT放弃对相关内容的理性回应。在测试过程中还发现,当我们故意给ChatGPT一些没有关联的诱导性问题时,ChatGPT可能会将一些无关联的内容以貌似有逻辑的方式进行无意义的呈现。
2. 应对ChatGPT的两类不同教育态度
ChatGPT发布以来,国外的许多学生已经发现了它的妙处,并用其完成各类作业。由此带来的对学习诚信的担忧,也让一些政府、学校或教师开始思考如何应对这些变化,而其教育态度或思路大致可以概括为两大类型。
一是提防型思路。目前一些国家或地区的教育管理部门以及高等教育机构,已经开始提出要思考如何规范甚至禁止使用ChatGPT,以防止学生运用其完成作业或其他作弊行为。譬如巴黎政治学院就要求学生在透明的情况下使用,对于将其用于作业的学生,可能会进行不同程度的处罚(Guriev,2023),不过学院也提出会组织讨论以制订新的规则,同时表示不反对学生用其寻找交流或辩论的素材。还有的学校为此研发了专用工具用以判断学生的作业是否由ChatGPT生成。
结合在进行中世纪相关内容教学时形成的经验,Mondschein(2023)建议为了避免学生过分依赖ChatGPT完成作业,可以通过优化作业要求等方式来防止学生不加思考地完成作业,譬如:要求学生完成作业时结合课堂学习中的笔记,引用某页PPT的内容,插入特定的论文引用格式,插入引用文献的实际链接,创建团队合作任务,现场测试或口语测试,绘制图表或制作PPT,等等。
二是变革型思路。为了防止学生在作业过程中过分依赖外脑而忽视内脑的作用,一些实践者从变革的视角对作业的形态进行了思考。譬如:可以要求学生提交作业提纲与迭代的草稿,草稿需要保留教师的指导意见和反馈;让学生运用一些协同共享文档完成论文作业,保留作业的不同版本;给予学生特殊的作业要求或要求引用特定的资源;可以使用ChatGPT等人工智能教具,生成一些论文后让学生对其进行评论;组织学生讨论哪些AI技术是可接受的(例如生成某一领域的概述等),哪些是不可接受的(例如对于特殊作业要求的回应等)(Abrusini, 2023)。英国纽卡斯尔大学研究法律、创新和社会的学者爱德华兹认为,由于ChatGPT的存在,也许该是学校终结以论文作为作业形式的时候了(Stokel-Walker, 2022)。
3. 内容生成式AI产品对学习评价的启示
由ChatGPT带来的兴奋与担忧,以及教育领域对此形成的两类不同态度,恰恰反映了当前学术界对于教育的认识,尤其是对于如何评价学习质量与学习结果的认识。对于学习个体而言,当他们具备了由内脑与外脑构成的复合脑以后,两个脑如何协同发挥作用?外脑的强大会让内脑更加强大,还是会让内脑慢慢萎缩?要回答好这些问题,就不得不重新反思当前的评价,研究建立符合双脑协同、智力共生的学习评价新思维。
为什么我们会担心内容生成式AI产品的出现有可能会导致学习过程中出现诚信问题?这是因为该类产品可以根据学生发出的作业请求为学生提供答案,而学生一旦过分依赖这些产品,他们就有可能放弃内脑的使用,最终反而成就了机器而不是学生本人。如果放弃了内脑的训练,学习个体就很难通过内脑去调用外脑,必然也没有能力高质量地驾驭外脑,最终导致未来社会人才层次的两极分化。在过去的学习评价过程中,过分注重学生到底知道什么,过分关注答案的标准性,过分关注学生回答问题时所罗列的要点,其原因在于学习内容普遍被认为存放于學生的内脑中,通过测量这些内容可以判断学生的掌握程度,区分学生的优劣。
内容生成式AI产品启发我们可以从复合脑的视角来理解现代人的大脑,引导学习个体充分理解该类产品的强大数据存储与处理功能,努力与内容生成式AI产品进行关联,丰富自己的外脑,形成利用内脑驱动外脑学习的行为意愿,并借助外脑激活自己的内脑。建立新的学习评价思维就是要合理分配内脑与外脑的功能与责任,让学习者不要将有限的学习精力消耗在凭借低阶思维就可以完成的任务里,要鼓励学习者参与高阶思维活动,促进学习者以科学的学习方式健康成长。
首先,思维比知道重要。过去,由于受制于学习条件,要想判断学习者学习水平的高低,最理想的办法就是测试他们知道什么,于是,学习者的理解力与记忆力成为学校重点培养的关键技能。但是,当学生在面对日益复杂的世界时,他们所记忆的内容再多,也无法与内容生成式AI产品相比。但思维就不同,人类的思维是人类区别于其他事物的关键要素,思维技能直接指向应用领域,既强调对知能体系的把握,也关注外部世界的变化,重视心智体系的塑造(沈书生, 2019)。让学习个体的内脑建立高阶思维技能,并通过思维技能驾驭外脑,由此所构建的复合脑就不再是一个简单的“知道”机器,而是一个复杂的创造机体。
其次,问题比答案重要。在过去的教学过程中,老师会为学生提供很多问题,引导学生围绕问题寻找答案,学生受问题的牵制往往难以开展独立的思考。内容生成式AI产品出现以后,我们会发现,借助于这些产品就能很容易回答老师的提问,但却不一定能够获得高质量的答案。接触了内容生成式AI产品以后,我们会发现作为外脑的内容生成式AI产品的作用大小取决于我们的内脑,取决于我们经过思维以后所提出的问题。问题的质量越高,外脑给予内脑的激励就会越强,个体的成长也会越快。
最后,逻辑比罗列重要。对于依赖记忆的评价而言,评价的主要依据是学习者所提供的相应答案涉及的要点数量。与内容生成式AI产品相比,学习个体再怎么努力,罗列的要点数量也很难超越前者。如果借助于外脑来罗列相关的要点,让内脑将主要的精力转移到对要点及其关系的处理上,学习个体就可以结合问题的变换,通过外脑获得与自己试图完成的任务相关的更多要点,运用自己所具有的高阶思维,实现对若干要点的系统甄别与筛选,并融入个人的创造,实现知识的再生产。
结语
内容生成式AI产品以模拟人类的交互行为作为基本技术发展旨趣,直接贴近人类的最基本需求,因而成为AI领域中最接地气的产品。可以预见的是,将来一定还会有许多研发机构基于不同规则与算法模型推出自然语言处理类新产品。当前的产品还存在形式简单、情感缺失等不足,但可以进一步预见的是,未来的新产品中,将不仅仅会有文本形式,还可能会嵌入图片、动画、音频或视频等,甚至还可能会嵌入更多未知的制品格式,并可能会融入情感元素。内容生成式AI产品的出现对于教育的可能影响,也许会超出其他的技术产品,这是因为学习个体接触它的机会将会远胜于其他技术产品,如果我们不能改变学习评价思维,我们所培养的学习个体,很可能会输给那些拥有了适应时代变革的复合脑的群体们。
[参考文献]
百度百科. (2023-02-14). 文心一言. 百度网站. https://baike.baidu.com/item/文心一言/62642976? fr=aladdin
蔡自兴. (2016). 中国人工智能40年. 科技导报,34(15):12-32.
车万翔,& 刘挺. (2022). 自然语言处理新范式:基于预训练模型的方法. 中兴通讯技术,28(2):3-9.
李应潭. (1983). 诺贝尔奖获得者西蒙在华谈人工智能. 国外自动化(6):62-63.
李舟军,范宇,& 吴贤杰. (2020). 面向自然语言处理的预训练技术研究综述. 计算机科学,47(3):162-173.
李祖枢,徐鸣,& 周其鑑. (1990). 一种新型的仿人智能控制器(SHIC). 自动化学报(06):503-509.
刘园园. (2023-02-14). ChatGPT爆火,国内研发进展如何?. 中国产业经济信息网. http://www.cinic.org.cn/xw/cjfx/1404597.html
沈书生. (2019). 设计学习事件:指向学习的层次. 电化教育研究,40(10):5-11.
沈书生. (2020). 学习新生态:构建信息化学习力. 苏州大学学报(教育科学版),8(1):1-8.
沈书生. (2021). 聚焦学习决策:指向认知发生的数据及其应用. 电化教育研究,42(11):13-19.
史童月,& 王中卿. (2022). 基于Transformer的自然语言处理预训练语言模型概述. 信息与电脑(理论版),34(10):52-56.
王海宁. (2022). 自然语言处理技术发展. 中兴通讯技术,28(2):59-64.
张大均. (2011). 教育心理学. 人民教育出版社.
钟义信. (2017). 人工智能:概念·方法·机遇. 科学通报,62(22):2473-2479.
Abrusini. (2023,January 30). ChatGPT: A Brief Introduction and Considerations for Academic Integrity. The Innovation Instructor Blog.http://ii.library.jhu.edu/
Guriev, S. (2023). ChatGPT: Sciences Po Implements Rules and Opens up Discussion About AI in Higher Education. SciencesPo. https://www.sciencespo.fr/en/news/sciences-po-implements-strict-rules-about-the-use-of-chatgpt-by-students
Mondschein, K. (2023). Avoiding Cheating by AI: Lessons from Medieval History. Medievalists. https://www.medievalists.net/2023/01/chatgpt-medieval-history/
OpenAI. (2022a). ChatGPT: Optimizing Language Models for Dialogue. OpenAI. https://openai.com/blog/chatgpt/
OpenAI. (2022b). Aligning Language Models to Follow Instructions. OpenAI. https://openai.com/blog/instruction-following/
Stokel-Walker, C. (2022). AI bot ChatGPT writes smart essays: should professors worry?. Nature. https://www.nature.com/articles/d41586-022-04397-7
thewindowsclub. (2023). How to use ChatGPT: Beginners Guide. TheWindowsClub. https://www.thewindowsclub. com/how-to-use-chatgpt
基金項目:本文系全国教育科学“十三五”规划2019年度国家一般课题“适应性学习空间支持下的学习范式研究”(课题编号:BCA190081)的研究成果。
作者简介:沈书生,南京师范大学教育科学学院教授。
祝智庭,华东师范大学开放教育学院教授(通讯作者:ztzhu@dec.ecnu.edu.cn)。