GPT-4人工智能技术在基础教育的应用与展望

2024-01-20刘思怡傅胤荣郑耿忠孔维宏

韩山师范学院学报 2023年6期

刘思怡，傅胤荣，王畅，郑耿忠，孔维宏

（1.韩山师范学院物理与电子工程学院广东潮州 521041，2.广州大学教育学院广东广州 510006）

1956年约翰·麦卡锡等在达特茅斯学院发起了人工智能的会议，后称达特茅斯会议，标志着人们对人工智能的研究正式开始.20 世纪60 年代以来，人工智能领域的研究取得了一系列瞩目的成果，包括支持向量机［1］、KNN［2］、逻辑斯蒂回归［3］、决策树［4］、随机森林［5］、感知机［6］、卷积神经网络［7］等，这些算法使得计算机应用在一些简单的任务上取得了良好的效果，例如1998 年，LeCun 等人使用LeNet 对邮件上手写数字的识别［7］.但由于受到硬件条件的限制，人工智能领域的许多算法难以获得更好的效果.

2010年以后，深度学习领域取得了迅速的发展，使得人工智能在图像识别、文本处理、语音识别等领域取得了广泛的应用.随着深度学习技术的发展，生成模型（Generative Model）也越来越得到研究者的重视.生成模型的目标是学习数据的真实分布，并能够生成与真实数据相似的新数据.常见的生成模型有受限玻尔兹曼机、变分自编码器、生成对抗网络等.GPT（Generative Pre-trained Transformer）是生成模型的一种，其主要特点是利用Transformer 架构进行预训练，并在各种下游任务上进行微调，以具备完成各种任务的能力.2020 年6 月11 日，OpenAI 团队基于GPT 模型发布了一个名为ChatGPT 的应用，其能够生成自然语言文本，完成包括回答问题、翻译、创作文章等在内的任务.ChatGPT 的发布引起了广泛的关注和讨论，被认为是人工智能领域的一项重要进展.2023 年3 月14日，OpenAI 团队发布了GPT-4，相比于原有模型，GPT-4 在多个性能指标上都取得了巨大的进步，ChatGPT底层的神经网络也从GPT-3进化成了GPT-4.

我国教育部门一直非常重视人工智能在教育教学过程中的应用.2017年国务院印发《新一代人工智能发展规划》，其中指出我国对人工智能发展的战略规划，明确指出要抓住人工智能发展的重大历史机遇［8］.在2021 年举办的国际人工智能与教育会议上，中国政府声明将加大人工智能教育政策供给，推动人工智能与教育深度融合，利用人工智能促进全民终身学习，致力推动教育数字转型、智能升级、融合创新，加快建设高质量教育体系［9］.基础教育是我国教育体系中重要的一部分，包括幼儿园、小学、初中和高中四个阶段，并且制定了一系列政策和标准来规范和改进基础教育［10］.例如，实施“义务教育均衡发展计划”，加强农村和贫困地区的教育发展，提高教育公平性［11］.

在人工智能技术日益成熟的今天，人类正逐步从信息时代进入人工智能时代，各行各业都将面临人工智能技术所带来的机遇和挑战.作为我国教育体系中庞大和重要的一部分，基础教育无疑将在人工智能的介入下发生巨大的变化.本文针对基础教育和以GPT-4为例子的生成式人工智能的特点，探讨基础教育场景下生成式人工智能产品的应用前景，以及人工智能技术为基础教育带来的挑战与展望.

1 文献综述

ChatGPT 的快速发展引起了基础教育领域学者的兴趣，目前已有一些学者在理论和实践上进行了相关的探索.李政涛从理论上讨论了ChatGPT 以及技术变革与基础教育的关系［12］.他认为，ChatGPT与基础教育之间相互提出了挑战：ChatGPT 对基础教育带来的挑战是对基础教育根本性和系统性的颠覆；基础教育对ChatGPT 提出的挑战是基础教育能否改变ChatGPT 以及技术变革的基础.邓友超讨论了人工智能对话机器人与基础教育工作者之间的关系［13］，他认为人工智能对话机器人不会简单地取代教师，但是教师应该重新审视其职业和专业基本问题.尚智丛等人讨论了ChatGPT 教育应用及其带来的变革和伦理挑战［14］.对于基础教育，ChatGPT 带来的变革可以提升素质教育中知识传授的效率，便捷地将关于自然、人类社会与人的相关知识传授给学生，甚至根据学生需求定制传授相关知识.由于ChatGPT 是机器，不具备人的情感体验和道德体验，在情感和审美的培养上有所不足，只能作为辅助手段.ChatGPT 会带来一些伦理挑战，例如可能会导致教育中主体淡化甚至缺失，教育中的情感与道德淡漠，甚至在某些情况下的缺失等等.秦建军认为，ChatGPT 所带来的一个重要挑战是人工智能可以参与到知识的创造与传承，甚至会影响到“人”作为知识传授者的主体地位.因此，当下的教学组织方式应该做出变革，包括教学理念、教学模式甚至教学内容等［15］.

除了理论上的思考，目前也已经有一些使用ChatGPT 辅助教学的实践.孙旭等人尝试将ChatGPT用于高中地理教学［16］，使用的场景包括学生自主学习、教师教学辅助.在第一个场景中，ChatGPT可以利用其对话功能，使用“苏格拉底教学法”对学生进行教育.具体地，学生可以就一个题目与ChatGPT 进行辩论，在辩论的过程中学生可以增强对知识的理解程度，同时通过辩论的形式可以从ChatGPT 的反馈中进行查漏补缺.在后一个场景中，ChatGPT 可以帮助教师准备备课所需的信息和材料，为课程设计提供思路，帮助教师设计教学大纲和课程计划等.在课堂教学中，ChatGPT 可以作为一种在线答疑工具通过即时性的对话互动为学生提供及时的解答和支持，提高教学效率.最后，Chat-GPT 还可以帮助教师开发课程教学资源.例如，可以让ChatGPT 以echarts 的形式生成一些地理教学所需的地图和分布图.徐康等人使用ChatGPT 帮助留学生学习编译原理这门课程［17］，他们使用ChatGPT生成编程需求、程序代码以及计算机编程配套文档，还可以用ChatGPT 模拟编程系统的某些行为.同时，他们针对编译原理实践环节不同阶段的问题设计各种Prompt模版，令ChatGPT 为留学生提供代码自动纠错功能以及个性化的学习解答和辅导，以促进其在编译原理课程中学习和实践能力的提升.从效果上看，ChatGPT改善了教学效果，提升了学生的课程参与主动性，提升了学生的学习效果.

2 GPT-4相关技术

2.1 深度学习技术

深度学习技术是GPT 技术的基础，但是深度学习并不是近几年才提出的新技术.1958年，Rosenblatt Frank就提出了感知机模型［6］.1969年，Minsky等人在单层感知机的基础上提出了多层感知机［18］.感知机模型不仅可以做的更宽，还可以做的更深，使得其具有学习更加复杂功能的能力，其初步体现出了解决图形识别问题的能力.在多层感知机之后，研究者们开始构思如何使用神经网络处理更加丰富的数据类型，包括文本、时间序列等序列数据.1988 年，美国科学家Paul Werbos 提出了用于处理序列数据的循环神经网络（RNN）［19］.与感知机模型不同，循环神经网络具有一个内部反馈回路，自身的输出会成为下一轮对自身的输入.2012年，Geoffrey Hinton 的AlexNet卷积神经网络在ImageNet比赛中夺冠［20］，该网络在两块Nvidia GTX 580 GPU 上运行，速度远超CPU.此后，深度学习依赖GPU，与大规模数据集结合，实现了快速进展，并对各行业产生了重大影响.

2.2 生成模型

生成模型是机器学习中一类特殊的模型，其目标是学习并模拟样本数据的分布，从而在这个分布的基础上可以产生新的数据.生成模型可以应用于多个领域，例如自然语言处理、计算机视觉、音频处理.生成模型可以分为两大类：概率生成模型和非概率生成模型.概率生成模型通常基于概率理论的基础，以参数化的方式表示样本数据的概率分布.这一类模型的典型代表包括混合模型（GMM）、朴素贝叶斯模型（Naïve Bayes）、概率图模型（PGM）等.非概率生成模型是一种无参的方法，代表有对抗生成网络（GAN）、变分自编码器（VAE）、自编码器（Autoencoder）、自回归模型（Autoregressive Models）等等.

GPT 中的G 是Generative 的缩写，即意味着GPT 是一类生成模型.从上述的分类来说，GPT 属于非概率模型中的自回归模型.自回归模型的基本思想是，将生成任务分解为多个条件生成任务，每个子任务生成一个特定位置的数据，然后将这些条件概率联合起来生成最终的数据序列.具体地说，自回归模型的输入是一个序列的历史数据，输出是下一个位置的数据的条件概率分布.在训练阶段，模型通过最大化数据样本的联合概率来学习参数，以使得模型在生成新的数据时能够生成与训练数据相似的数据.在生成新的数据时，模型采用贪心搜索、束搜索或蒙特卡洛方法等策略，根据已经生成的数据来预测下一个位置的数据，并不断重复这个过程，生成整个数据序列.除了GPT，递归神经网络（RNN）、长短期记忆网络（LSTM）、门控循环单元（GRU）和Transformer等都属于自回归模型.

2.3 Transformer

ChatGPT 的相关技术中Transformer 是一类深度神经网络的类型，由Google 团队在2017 年提出［21］.Transformer模型引入了注意力机制（Attention），允许模型在处理输入序列时关注不同的部分，从而更好地捕捉序列间各个部分的依赖关系.

截至2023 年4 月，GPT 一共发展出了四代：GPT-1［22］、GPT-2［23］、GPT-3［24］、GPT-4.GPT-1、GPT-2、GPT-3 分别在2018 年6 月、2019 年2 月、2020 年6 月发布，模型参数量分别为1.17 亿、15 亿和1750 亿，它们的学习和推理能力也越来越强.2023 年3 月，OpenAI 发布了GPT-4.OpenAI 对GPT-4和GPT-3 都进行了考试能力的测试，结果显示，在26 个测试科目中，GPT-4 有15 个以上科目处于绝对优势.此外，GPT-4 是超大多模态模型，在此前的纯文本输入基础上，增加了图像输入.相比GPT-3，GPT-4在AI能力上又取得了更多进步，例如GPT-4通过模拟美国律师资格考试，分数在应试者的前10%左右；相比之下，GPT-3 的得分在倒数10%左右.从GPT 的进化过程中可以看出，随着GPT 模型的参数量越来越多、训练数据集越来越大，GPT 模型的智能性变得越来越强，甚至最新的GPT-4在某些任务上已经取得了比人类更好的表现.GPT 的演化并不会停止，后续GPT 模型无疑会比GPT-4具有更强的能力.在这些能力的加持下，GPT对各行各业带来的改变也将是具有颠覆性的.

3 GPT-4在基础教育的应用

本文以GPT-4为研究对象，从基础教育中GPT-4可能在教育教学过程中给教学提供帮助的角度出发，梳理了三个可能的教育应用.

3.1 智能化的个性化学习

智能化的个性化学习是GPT-4在基础教育领域可能的重要应用之一.根据学生的学习情况和学习习惯，GPT-4可以提供针对性的教学辅导和学习建议，从而帮助学生提高学习效果.

3.1.1 学生学习进度分析

GPT-4可以根据学生的学习数据分析其掌握知识点的程度，从而生成个性化的学习进度报告.例如，在数学科目中，教师首先将学生的数学作业输入到GPT-4中，作业包括多道数学题目和学生的答案.其次，GPT-4对学生的答案进行自然语言理解和数据分析，提取出学生在各个知识点上的掌握程度和错误率等信息.然后，GPT-4 根据学生的答题情况和时间，分析出学生的学习进度和学习效果.比如，对于一道较难的题目，如果学生的回答时间比较长，但是答案仍然错误，GPT-4可以认为学生在这个知识点上的掌握程度较低，需要加强学习和练习.同时，GPT-4可以将学生的学习进度分析和建议反馈给老师，帮助老师更好地了解学生的学习情况，制定更加科学的教学计划和教学策略，以提高学生的学习效果.

3.1.2 针对性的学习建议

基于学生的学习进度和需求，GPT-4可以为其提供针对性的学习建议.例如，对于掌握不足的知识点，GPT-4可以推荐相关的学习资源和练习题目，帮助学生加强巩固.GPT-4还可以根据学生的兴趣和擅长领域提供拓展性的学习建议，有助于激发学生的学习兴趣和主动性.

3.1.3 智能问答与作业辅导

GPT-4具备强大的自然语言处理能力，可以实现智能问答和作业辅导功能.学生可以向GPT-4提问，获得及时、准确的答案和解析.GPT-4还可以帮助学生检查和修改作业，提高作业质量.智能问答与作业辅导功能可以节省教师的时间和精力，使他们更能专注于教学设计和对学生的情感关怀.

3.1.4 学习策略与方法指导

通过分析学生的学习数据和需求，GPT-4可以为学生提供针对性的教学辅导和学习建议.智能问答与作业辅导功能可以为学生提供实时的学术支持.同时，GPT-4还可以根据学生的特点和需求提供学习策略与方法指导，帮助学生养成良好的学习习惯和提高学习效率.

通过引入GPT-4进行智能化的个性化学习，可以实现更加精细化和个性化的教育，满足不同学生的学习需求.

3.2 作文批改与智能反馈

在传统教学中，作文批改是一项非常耗费时间和精力的工作，需要老师仔细阅读每一篇作文，并给出详细的评分和反馈.而随着自然语言处理技术和机器学习算法的发展，GPT-4可能会提供更加高效、准确的作文批改和智能反馈服务.具体来说，GPT-4可能会根据语法、拼写、逻辑、结构等方面的规则，自动检测学生作文中的错误和问题，并针对这些问题，给出相应的评分和建议.同时，GPT-4还可以通过对大量优秀作文的分析和学习，提供更加精准、个性化的反馈和建议.

需要注意的是，GPT-4的作文批改和智能反馈服务仍然需要与教师的手动评估和指导相结合，以确保评估和建议的准确性和全面性.同时，GPT-4的作文批改和智能反馈服务也需要不断地进行优化和改进，以适应不同年龄段和学科领域的学生需求.

3.3 教学资源生成

在当前基础教育阶段，教学资源的质量和多样性对于提高学生的学习效果具有重要意义.然而，传统的教学资源生成过程通常耗时且费力，尤其是在个性化教育需求日益增加的情况下.借助GPT-4，可以实现自动生成高质量的教学资源，以满足教师和学生的需求.

3.3.1 自动生成教案

教案是教师进行教学活动的重要指导文件，通常包括教学目标、教学内容、教学方法和学生评价等部分.GPT-4可以根据教师的需求和学生的学习水平，自动生成教案.这些教案既可以作为课堂教学辅助材料，也可以作为学生的课后练习.

3.3.2 自动生成习题

习题是学生学习过程中用于巩固知识、提高能力的重要教学资源.借助GPT-4，教师可以生成各种类型的习题，如选择题、填空题、问答题等.此外，GPT-4还可以根据学生的能力水平，生成个性化的习题.以数学科目为例，GPT-4可以根据教师的需求和学生的能力水平，生成涉及三角函数等不同领域的习题.这些习题不仅可以用于课堂教学，还可以作为课后练习、家庭作业和期末考试等场景.

3.3.3 自动生成学习素材

学习素材是指帮助学生理解和掌握知识的各种教育资源，如文章、图表、图像描述等.GPT-4可以根据特定主题或知识点，生成各种学习素材.这些素材既可以作为课堂教学辅助材料，也可以作为学生的课后练习.在生物课程中，GPT-4可以生成关于细胞结构和功能的图文解释，帮助学生更好地理解抽象概念.在地理课程中，GPT-4可以根据教师的需求生成一张气候分布图，辅助学生掌握气候类型及其特点.

3.3.4 自动生成案例

案例是指具体的实例或故事，用于说明某个概念或原理.GPT-4可以根据教师的需求，生成各种学科领域的案例.这些案例可以帮助学生更好地理解抽象概念，提高学习兴趣.以历史为例，一位历史老师想要让学生更好地理解罗马帝国的崛起与衰落.他可以请求GPT-4生成一篇关于罗马帝国的概述性文章，包括主要事件、重要人物和相关历史背景.此外，GPT-4 还可以生成一些具体的历史案例，如罗马皇帝奥古斯都的统治策略，以帮助学生更深入地了解罗马帝国的历史.

通过自动生成教案、习题、学习素材和案例，GPT-4 可以为教师提供高质量、个性化的教学资源，节省他们的时间和精力.同时，这些教学资源也可以帮助学生更有效地学习和巩固知识.

4 教育应用案例验证

本研究从智能化个性化学习、作文批改与智能反馈、教学资源生成这三个可能的教育应用方面出发，分别选取语数英三门科目进行效果检验，所选用的系统是GPT-4.

4.1 语文作文题库生成

在基础教育中，针对不同个性化差异的学生可以运用GPT-4生成不一样的作文题目，教师要先了解学生的背景信息，包括兴趣、学科特长、性格特点等.然后，根据这些信息，为学生生成个性化的作文题目.表1 是一些根据不同学生特点生成的作文题目案例.经过多次应用GPT-4 生成作文题目，系统可以持续针对不同个性化差异的学生生成符合他们需求的题目.由此可见，GPT-4 在语文课堂中，初步具备了依据不同特点的学生生成个性化的作文题目的能力.同时，GPT-4不止在作文题目生成中有着出色的能力，也可以在其他学科针对不同学习特点的学生进行题库生成.

表1 语文作文题库生成

4.2 数学作业智能辅导与在线答疑

如表2 所示，用户输入了一道小学数学和编程能力有关的应用题，GPT-4 可以自动生成题目及答案.为了更有效地评估系统的自动解题能力，从Multiarith 数据集（Roy&Dan，2016）中挑选了50 道题目作为测试集.Multiarith 数据集是一个包含600道小学级别情景数学题的多步算法数据集.在不断调用InstructGPT 相关模型接口进行测试后，发现系统的解题平均准确率约为68%.这个结果明显优于GPT-3的表现，而解题错误主要是由于对场景中所需常识性知识的判断失误.进一步分析系统在解题过程中生成的推理文本，发现生成的文本合理且易于理解，大大超越了之前GPT-3 的逻辑表达能力.例如，与GPT-3生成的常常包含错误因果关系和推理的解题思路相比，GPT-4能够给出清晰完整的解题逻辑，并在关键步骤上提供计算公式和描述.

表2 数学作业智能辅导与在线答疑

经过多轮生成题目及解答测试，发现GPT-4有较好的智能辅导与在线答疑能力，但GPT-4可能无法完全理解一些复杂或模糊的问题，导致生成的题目或答案可能不准确或不完整.

4.3 英语课堂教学资源生成

GPT-4 在英语课堂教学资源生成方面具有巨大潜力.表3 展示了用GPT-4 为英语课堂生成教学资源的实际验证案例.本文应用GPT-4针对四年级英语课程的教案、习题、学习素材、案例等进行资源生成，发现系统可以持续生成不同类型的教学资源.由此可见，GPT-4在教学资源的生成上有较成熟的教育应用价值.

表3 英语课堂教学资源生成

5 GPT-4在基础教育的挑战与展望

5.1 GPT-4在基础教育中的挑战

5.1.1 数据安全与隐私保护

GPT-4在基础教育应用中面临的数据隐私与安全挑战主要包括学生信息泄露、数据中心安全漏洞和不当数据使用等问题，这些问题可能导致法律责任、信任破裂和隐私权受损.比如，如果一所学校正在使用GPT-4来辅助教学，为学生提供个性化的学习资源.在这个过程中，学校需要向GPT-4提供学生的学习记录、测试成绩、兴趣爱好等数据.但是，这些数据可能涉及到学生的隐私，如果没有妥善处理，可能导致数据泄露和滥用.

5.1.2 误导性信息与知识准确性

由于GPT-4 是基于大量网络文本数据进行训练的，这些数据中可能包含错误信息或具有误导性.在生成内容时，GPT-4 可能会受到这些负面因素的影响，从而产生误导性信息.美国学者Tom Brown 等人探讨了大型语言模型（如GPT-3）在多种任务上的表现，其中也包括可能产生的误导性信息和知识准确性问题.［24］因此，在回答学生的问题或提供学习材料时，GPT-4可能无法确保所提供的内容的准确性和可靠性.这可能导致学生在学习过程中受到干扰或形成错误认知.

5.2 GPT-4在基础教育的展望

5.2.1 深入挖掘个性化教学潜力

深入挖掘个性化教学潜力是GPT-4在基础教育中的重要应用展望之一.个性化教学旨在满足学生不同的学习需求、兴趣和能力，从而提高学习效果.借助GPT-4等人工智能技术，可以实现更加精细化的个性化教学，从而帮助学生实现最佳学习成果.

GPT-4可以根据学生的知识水平、学习风格和兴趣，生成定制化的学习内容和资源.例如，对于喜欢视觉学习的学生，GPT-4 可以生成图形化的解释和示例.其次，GPT-4 可以提供实时反馈和支持，帮助学生在遇到困难时获得及时的解决方案.这可以在一定程度上替代传统的面对面辅导，从而提高教育资源的利用效率.最后，GPT-4可以辅助教师进行学生评估和诊断，以便更准确地了解学生的进步和需求.这可以为教师制定个性化教学计划提供有力支持，从而实现更有效的教学实践.

5.2.2 生成跨学科高质量课程

GPT-4是基于海量网络文本数据进行训练的，天然具有跨学科的属性，利用GPT-4在基础教育应用中可以生成高质量的跨学科课程内容，有力弥补传统教师的知识面局限，研究人员和教育工作者需要关注模型训练、调优和评估的策略，从而确保GPT-4生成的内容既准确又有针对性.

5.2.3 缩小城乡教育差距，实现教育均衡

城乡教育在设施、师资、教学、管理等诸多方面存在着不均衡现象，教育公平是社会公平的基础，教育均衡发展是教育公平的基石，在大力推行素质教育的新形势下，教育公平问题已经成为全社会广泛关注的问题.优质师资资源的均衡是实现教育公平、教育均衡的关键.通过GPT4 技术支教的形式，GPT4 未来在农村地区推广和普及应用，将有力弥补农村师资力量，解决农村教师老龄化现象和专业教师匮乏的问题.

6 结论

本文介绍了GPT-4 的技术背景，包括深度学习技术、生成模型、Transformer，这些技术为GPT-4的产生和演进提供了基础.GPT-4及其后续版本，无疑将会为人类生产生活的各个方面带来巨大的改变.作为我国教育体系中重要的一部分，基础教育有着知识面广泛、资源分配不均、竞争激烈等特点，GPT-4及其后续的人工智能技术有助于实现学生的个性化教育，提高学生的学习效率，普惠的人工智能教育技术有助于缩小城乡教育差距.我们既要充分利用生成式人工智能的优势，也要尽量避免它们可能带来的一系列问题.