人工智能大模型在我国教育领域的应用现状、问题挑战与实践路径
2024-01-01祝淼 乜勇
摘 要:人工智能大模型的兴起对我国各领域产生了巨大影响,不仅推动了技术产业的进步,也促进了教育事业的繁荣。通过提供个性化学习方案、优化教学资源分配以及辅助教学决策,人工智能大模型展现出巨大潜力,但其在数据处理、技术创新和实践应用中仍面临着数据处理水平不足、用户隐私泄露风险、软硬件实力有待提升、模型优化和泛化能力不足、培训引导缺少等问题。因此,该研究旨在通过加强模型数据处理水平、构建安全保护框架,提升模型性能和稳定性、开发课程培训、完善智能评估系统等多个方面解决难题,以期人工智能大模型在个性化学习、智能辅导和定制化教学中发挥作用。为提升整体教育质量,构建包容、公平的“人工智能+教育”环境提供新思路和新视角,在优化人工智能大模型和深化教育应用的同时,减少智能技术对教育产生的不利影响。
关键词:人工智能大模型;个性化学习;定制化教学;智能教育;数据隐私
中图分类号:G4 文献标志码:A 文章编号:2096-0069(2024)05-0032-06
收稿日期:2024-03-04
基金项目:陕西省“十四五”教育科学规划 2023年度课题“轻量化信息技术在薄弱中小学校应用策略与实践研究”(SGH23Z0010)
作者简介:祝淼(1998 — ),女,陕西安康人,硕士研究生,研究方向为信息技术教育应用;乜勇(1970 — ),男,藏族,青海贵德人,教授、博士生导师,研究方向为信息技术教育应用、课程与教学论、人工智能教育应用。
引言
人工智能大模型应用于教育领域,不但有效提升了教学效率,而且推动了整体教育工作的发展进步。但是,如何确保人工智能大模型在教育中的应用始终发挥正效应和符合伦理规范,以及如何与现行的教育体制、教学手段进行有效的整合,以实现个性化学习和定制化教学等,仍是目前亟须解决的问题。本文以人工智能大模型的教育应用为视角,以个性化学习、智能辅导、定制化教学为主线,深入剖析我国教育领域中人工智能大模型的发展现状、面临的技术挑战和具体的实践应用,力图为“人工智能+教育”的深度融合和应用探索提供新的研究思路。
一、我国人工智能大模型的发展现状
1.人工智能大模型的相关概念
①人工智能大模型是指人工智能预训练大模型,其具有海量参数和复杂架构,能够完成深度学习任务,拥有强大的处理能力和表征能力[1]。该模型通过在大规模数据集上进行训练,并从中学习到更加高级和抽象的特征表示,从而提升模型的性能和泛化能力。预训练语言表征模型和自然语言处理模型都是人工智能大模型的典型代表模型之一。②教育大模型是适用于教育场景、具有超大规模参数、融合通用知识和专业知识训练形成的人工智能模型,是大模型技术、知识库技术及各类智能教育技术的集成,能推动人类学习和机器学习的双向建构。它能在人机对话交互中引导学习者深入思考,为学习者的自主探索提供指导和支持,并在此过程中不断更新升级,达到更高专业水平[2]。③语言大模型是指通过大规模无标注数据进行预训练,并学习到丰富的语言知识与世界知识的人工智能模型。该模型通常基于深度学习技术,尤其是自注意力机制架构,能够理解和生成自然语言文本。该模型通常包含数十亿个甚至数千亿个参数,能够捕捉到语言中的复杂模式和结构,具有高度准确的语言理解和生成能力[3]。④多模态大模型是指能够处理和理解多种模态(如文本、图像、声音、视频等)数据的人工智能模型。这些模型融合了多种感知途径和表达形态,能够同时处理来自不同感知通道的信息,并以多模态的方式进行学习和输出。多模态大模型的核心在能够整合和理解不同类型的数据,并发现它们之间的相互关联,实现对多模态信息的综合理解和分析[4]。⑤生成式人工智能是一种根据自然语言对话提示词自动生成响应内容的人工智能技术[5],其通过学习大规模数据集,能够创造出文本、图像、声音、视频、代码等多种形式的原创内容。生成式大模型通常基于深度学习技术,尤其是神经网络架构,如生成对抗网络、变分自编码器等。
上述概念源于人工智能领域,其核心思想是通过海量数据和复杂算法进行训练,以提高自身性能和适用范围。人工智能大模型是一种较为宽泛的概念,涵盖了由人工智能技术发展而来的各类大模型,其中就包括语言大模型和多模态大模型,前者侧重于对语言文本数据的处理,后者侧重于对图像、语音、视频等多模态数据的处理与输出。教育大模型是专门针对教育领域而开发的人工智能模型,其能够帮助教师通过运用人工智能技术提高教学效率和总体教育质量,特别是在个性化学习、智能辅导和定制化学习方面表现十分出色。生成式人工智能主要关注新内容的创造和多样性数据的生成,包括但不限于文本、图像、代码等。
2.人工智能大模型在教育领域的应用现状
①政策支持与推动:科技部等六部门发布的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》中提出,要在教育领域积极探索各类场景,鼓励高校院所参与场景创新,支持人工智能技术在教育领域的应用[6]。教育部等六部门发布的《关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》中提出,要利用人工智能技术普及教学应用、拓展教师研训应用、增强教育系统监测能力等。这些均表示要深入应用5G、人工智能、大数据、云计算、区块链等新一代信息技术,充分发挥数据作为新型生产要素的作用,推动教育数字转型[7]。②教育专用大模型研发现状:由中国教育科学研究院和之江实验室发布的《重构教育图景:教育专用大模型研究报告》,分别从技术基础、应用案例、挑战与机遇、创建构思、未来展望等多个方位详细阐述了如何利用大模型技术革新教育领域,以技术助力学生进步、教师成长和教育发展,并提出要整合应用各类智能教育技术,将已经发展起来的各类智能教育技术集成于教育专用大模型之中[8]。此外,华东师范大学发布了教育通用人工智能大模型系列标准,旨在从总体框架、构成要素、功能要求、数据集构建原则、测评框架、安全隐私以及教学应用要求等方面,为人工智能大模型在教育领域的应用提供详细的规范和指导,确保技术的可信性、安全性和高效性[9]。这些均表示我国要构建出一个以人为本的教育通用智能体系,以更好地赋能和赋智教育,在推动教育数字化转型的同时激发教育创新,以实现高质量的教育发展。
二、问题与挑战
当前,人工智能大模型正蓬勃发展,带动了国内人工智能大模型的创新热潮。随着研究技术的成熟与进步,各类大模型如雨后春笋般相继涌现,使得越来越多的产品可以应用于教育。然而,如何甄别、筛选并有效地将人工智能大模型应用于教育领域,以及如何解决因模型架构的不可解释性而导致人们的信任缺失等问题,成为当前教育高质量发展面临的现实挑战。
1.数据挑战
数据技术发展依托于数据支持,因此,在人工智能大模型的构建与应用中,数据问题带来的挑战不容小觑。首先,人工智能大模型需要基于大规模数据完成预训练,海量的参数和复杂的架构会为数据的收集与处理增加难度,只有具备足量的数据规模,才能支持大模型进行深度学习。由于预训练数据集规模广、涉猎深,因此在处理数据时,任何人都无法彻底阅尽其中数据或评估数据质量。大量非常相近、几乎算是重复的数据,基准数据遭受污染,预训练的数据域模糊不清,微调任务混在一起难以处理等[10],这些问题可能会影响学习效果或教学质量。其次,既涉及用户,就必然要思考个人隐私保护。造成隐私安全风险的根本原因在于人工智能大模型的内在特性,即在处理数据的过程中很容易造成信息泄露。因此,学生在使用人工智能大模型的过程中,需要加强个人信息安全保护。最后,由于人工智能本质上为类人智能,即一种类似于人脑的软硬件系统,因此,它并不具备人类的道德伦理观念,在实际应用中也会引发算法偏见、责任归属等道德伦理问题。另外,部分学生可能会利用人工智能大模型等技术投机取巧,从而引发学术伦理问题[11]。同理,当人工智能大模型作出错误决策而导致用户损害时,该将责任归属于开发者、用户还是人工智能本身,也值得我们深思。
2. 技术挑战
在人工智能大模型研究中,涉及算法优化、模型泛化能力、软硬件协同等多个层面的技术问题。首先,算法优化是提高大模型推理能力的关键因素之一。算法优化既要确保准确性,还要保证高运行效率和低资源消耗。例如,如何在资源受限的条件下,通过模型压缩和优化算法性能,开发出一种具有通用性的人工智能大模型,使其能在不同地区的各种设备上为师生提供优质的教学资源。其次,为了保证模型在遇到未知数据时依然能有出色的表现,必须增强模型的泛化能力。鉴于学生的知识背景和学习风格存在显著差异,当面对学生提出的各种难题时,必须着重考虑如何提升模型处理新问题的能力,以便帮助学生更好地应对在学业中遇到的多重困难和挑战。最后,深度学习框架是保障人工智能大模型良好运作的基础软件技术。虽然我国在这一技术领域已经取得了显著的成效,但与国际先进水平相比,仍有进步的空间。国内开源框架虽然技术不断进步,但在生态构建、社区支持等方面仍需加强。此外,人工智能芯片作为人工智能大模型的硬件基础,对提升模型计算效率和降低能耗具有决定性作用。目前,我国在人工智能芯片的研发上虽然获得了一系列成果,但云端训练、推断等大算力通用芯片的发展仍相对落后,与国际巨头相比仍有提升空间。
人工智能大模型技术的快速发展为教育事业开辟了广阔的前景,同时也带来了技术不稳定、潜在故障风险等挑战。在教育领域,人工智能大模型的不完全可靠性也会影响教学内容的准确性和教学过程的连贯性,进而对学生的学习成效造成不利影响。
3. 实践挑战
将人工智能大模型引入教育领域意味着一场革命性变化,可通过重塑教与学的方式来实现个性化教育、提高教学效率、增强学习体验。尽管这些技术拥有极大潜力,但在实际应用中也面临一系列复杂的挑战。首先,教师作为教育的直接执行者,他们需要与时俱进,不断地接受专业培训和学习,以便将人工智能大模型工具与教育有效整合。然而,人工智能技术的培训资源相对匮乏,导致部分一线教师未能接受系统的专业技术培训。在应对教育领域变革带来的挑战时,部分教师缺乏信心,这在一定程度上抑制了他们的积极性和参与度。在知识储备不足的情况下,部分教师的不自信情绪不仅会影响其对新技术的接受度,还可能削弱教师在教学中的积极性和创新性。不同于教师,学生对技术的兴趣和接受度通常较高,但也需要教师的适当引导来确保技术的正确使用。教师应当帮助学生从多方位了解人工智能大模型的优势和风险,提高学生的认知水平,从而避免他们对技术的滥用和依赖。若学生过度依赖人工智能大模型,可能会导致教师的部分职能被取代,在此情况下,教师的指导和榜样作用难以充分发挥,同时也不利于学生构建自我的心灵世界。其次,应用人工智能大模型技术可能会加剧教育资源不均衡的现状。在教育资源丰富的城市,学生可以享受到由人工智能大模型提供的个性化学习体验,通过智能辅导和定制化教学轻松完成学习任务和学习目标;在教育资源相对匮乏的部分乡村,由于各种因素的影响,学生可能难以完全触及这种技术。最后,将人工智能大模型引入教育领域还可能会对教育评估系统产生深远影响。传统的考试和评估方法会被更加灵活、更加智能的评估系统取代,并且相较于传统评估手段,人工智能教育评估有助于减少教师在重复性工作上的负担,实时监测学生的学习进度和知识理解程度,帮助教师全面快速掌握学生学习动态,从而提高教学效率。但与此同时,如何确保评估的公正性和准确性,以及如何保护学生数据的隐私成为新的挑战。
三、人工智能模型应用于教育领域的实践路径
1.数据保护与治理
首先,数据是大模型发展的基础,在决策过程中,人工智能大模型依赖于大量数据进行预训练,因此对数据的质量和数量有着严格的要求,特别是在教育领域,面对海量的教育数据和知识体系,其处理过程的复杂性往往难以预见。若想打开人工智能大模型的算法黑盒,需提高大模型的透明度和可解释性,使用户了解模型的决策逻辑,从而增强用户信任。相应地,数据体系的复杂性也增加了人工智能大模型的处理负担。为了减少认知偏差并提升知识多样性,除了整合多源数据,还需要加入自动化程序来清洗和预处理数据,包括消除重复项、纠正错误信息、统一文本格式等,以构建一个综合性教育数据库,为在教育领域中应用人工智能大模型提供坚实的数据支撑。该数据库不仅应包含丰富的教学资源,还应内置先进的教学决策程序和数据纠错系统,在分析和生成、输出数据时,能够自动检测并修正错误,确保信息的准确性。同时,还可设立用户反馈渠道,允许用户报告模型输出中的错误,一旦收到反馈,系统会迅速响应,重新校验数据并进行必要的修正。这种结合自动纠错和用户参与的双向机制,不仅能够提高模型的自我完善能力,也能够增强数据的实时性和可靠性,从而为教育领域提供一个动态更新、高效运作的知识平台。
其次,确保数据安全是实现人工智能大模型长期有效应用于教育的基石。构建多层次的教育数据隐私保护框架,运用严格的数据分类和分级管理策略,以及先进的加密技术及差分隐私算法,用以区分教育中的敏感数据和非敏感数据,并为敏感数据提供额外的安全层级,限制一般用户的访问权限。监督机制的建立同样不可或缺,应由专业人员对模型的数据输出进行定期审查并做好记录。借助这些综合性策略,我们能够在确保用户隐私和数据安全的前提下,促进人工智能大模型在教育领域的良性发展,也有助于充分发挥其在提升教育品质和推动个性化学习方面的潜力。
最后,持续的技术创新和研究是应对未来挑战的关键。随着人工智能技术的快速发展,我们需要不断探索和开发以人为本的数据技术和方法,将一系列伦理道德观念整合进人工智能大模型系统的核心设计中,确保系统的行为准则能够逐渐趋同于人类的伦理道德标准。这意味着在模型的决策过程中,嵌入了对人类价值观的尊重和隐私的维护,通过这种方式,可在一定程度上避免算法偏见和歧视,确保大模型应用在教育实践中的合规性。针对责任归属问题,需要学术界、教育界以及技术提供者共同努力,形成一套完善的人工智能大模型使用标准规范,并且建立预防和处理机制,对学术不端行为进行持续的监督和评估,一旦发现问题,须及时进行处理。
2.技术融合与创新
为了使人工智能大模型更好地服务于教育,在技术研发过程中,研发人员应尽可能提供更高效的算法和硬件,以保证模型能在不同教育地区的不同设备环境下进行广泛应用。首先,在实现算法优化层面,应聚焦于模型压缩与加速,可以通过知识蒸馏提高模型性能和泛化能力,采用参数量化技术加快运算速度,降低设备能耗,以减少模型的复杂度,同时采用自适应学习和联邦学习策略,以增强模型在多样化教育场景中的适应性和泛化能力。其次,在发挥模型泛化能力层面,人工智能大模型通过习得多任务学习和迁移学习技术,增强了其在教育领域的适应性和泛化能力。这些技术使得模型能够跨领域学习,将上一个任务中学到的知识应用于接下来的其他任务中,从而更好地适应多样化的教育场景。针对不同教育主体,精准识别他们的问题和需求,生成定制化的教学内容和个性化的教学策略。未来,随着大模型技术的不断进步,人工智能在教育中的应用将更加深入,为提升教育质量和教学效率提供强大助力。最后,在软硬件协同发展方面,我们要多关注深度学习框架的持续改进,尤其是国内企业研发出的开源框架,应当致力于构建更加完善的生态系统,提供坚实的社区支持。以此提高框架的可用性和普及度,进而支持教育工作者和学生更有效地利用人工智能技术进行智能教学和个性化学习。同时,人工智能芯片的硬件研发也应与深度学习框架的软件发展相协调,以实现更高效的云端训练和本地推理能力,进一步推动教育技术的发展。
若想在教育领域中广泛应用人工智能大模型,需要高度提升技术的稳定性。这意味着在模型部署前,必须进行严格的测试,以确保其在教学内容的准确性和教学过程的连贯性上达到高质量和高标准。当教师或学生使用人工智能大模型时,应当优先选择那些技术成熟、稳定性高的产品,以确保学生学习问题的顺利解决和教师教学活动的展开。大模型的有效应用不仅能为学生提供富有个性化的学习体验,辅助教师高效地开展教学活动,还能促进教育改革事业的飞速发展,更能为人工智能技术的未来发展开辟出新的空间。
3.应用培训与监督
师生如何快速适应并正确运用人工智能大模型?针对这一问题,首先,在教师层面,国家应当着手设计并实施一系列专门课程和培训项目,这些课程和培训应全面覆盖人工智能技术的基本概念、在教育领域的应用策略以及具体的操作技能,经过系统的学习,让教师掌握人工智能的基本理论知识和专业技能,具备利用好人工智能进行课堂教学的能力[12]。学校可建立校内教师社群,鼓励教师跨学科协作,共同研究如何将人工智能大模型融入各自的教学实践。通过这种方式,教师之间可共享经验、交流知识,从而促进教学方法的创新。学校还可以选择特定的班级或课程作为试验点,引入人工智能大模型,让教师在真实的教学环境中实践和探索。对教师个人来说,保持积极进取的心态十分重要。教师应该乐于学习、勇于尝试,这样才能不断在理论与实践中提升自己的专业技能,增强自己对于教育变革的信心。另外,教师还可以参与或发起相关研究,这不仅能够提高教学质量,还能增强他们应用人工智能技术的能力。通过持续的反馈和自我评估,教师可以更有效地利用人工智能工具,为学生提供更优质的教育体验。其次,在学生层面,应侧重于提高学生的高阶思维能力,而不是一般技能。应加强学生批判性思维、创造性思维、问题解决能力和决策能力的培养,当面对复杂的人工智能大模型时,引导学生积极探索如何更有效地利用人工智能来辅助学习,有效地解决各种学业难题。同时,也要注重对学生情感智力和社交技能的培养,使学生理解并采用适当的方法来正确运用人工智能,认识到这些技术仅能作为学习的辅助工具,是对知识的补充和积累,而非替代人脑进行深入探究与反思的工具。对于教育资源相对匮乏的地区,可构建一个城乡一体化的人工智能资源共享平台,通过这个平台,定期向一些偏远乡村学校提供高质量的技术资源和专业的教师支持,做好人工智能大模型的普及教育和应用推广工作,以期从多方面惠及更多学生。政府和企业应当共同合作努力,为资源不足的地区提供必要的硬件和软件资源支持,同时推广混合学习模式,实现教育资源利用的最大化。最后,在教育领域引入智能评估系统,须确保这些系统的公正性和准确性。可以通过采用多元化的评估手段,如自我评估、同伴评估和教师评估等,以降低单一评估方法可能产生的偏差;定期对评估系统进行校准和验证,确保其评估结果与教育目标和标准保持一致,从而真实全面地反映出学生的能力水平;在采集学生信息时,必须获得学生及家长的完全知情权和信息采集同意权,在明确好数据的使用目的、存储期限和访问权限后,务必对收集完成的数据进行加密处理,确保数据在传输和存储过程中的安全,以保护学生隐私。
四、结论
本研究深入分析了人工智能大模型在教育领域的多种应用,指出了其在数据处理、技术革新和实际应用中所面临的挑战。研究发现,尽管这些技术在实现个性化学习、智能辅助教学等方面展现出巨大潜力,但同时也带来了如数据处理水平不足、用户隐私泄露风险、软硬件实力有待提升等问题。本研究提议构建一个多层次的数据保护体系,提高数据的透明度,并采用模型优化技术,以提高模型的适应性和效率。同时,强调通过一系列措施提高教育质量,推动教育资源的公平分配,在确保技术安全和遵守伦理标准的基础上,持续改进算法,以提高模型性能。期待未来人工智能大模型在教育领域的应用更成熟普遍,精准满足学习者的需求,并为学生创造一个安全、公平、包容的教育环境。
参考文献
[1]国家工业信息安全发展研究中心.AI大模型发展白皮书[R].北京:国家工业信息安全发展研究中心, 2023.
[2] 曹培杰,谢阳斌,武卉紫,等.教育大模型的发展现状、创新架构及应用展望[J].现代教育技术,2024,34(2):5-12.
[3][4] 中国人工智能学会. 中国人工智能系列白皮书:大模型技术[R]. 北京: 中国人工智能学会, 2023.
[5] 联合国教科文组织.教育和研究中的生成式人工智能指南(Guidance for generative AI in education and research)[R]. 巴黎:联合国教科文组织,2023.
[6] 科技部等六部门.关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见[R].北京:科技部等六部门,2022.
[7] 教育部等六部门.关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见 [EB/OL].(2021-07-08)[2024-02-02]. http://www.moe.gov.cn/srcsite/A16/s3342/202107/t20210720_545783.html.
[8] 中国教育科学研究院数字教育研究所,之江实验室智能教育研究中心. 重构教育图景:教育专用大模型研究报告[R].北京:中国教育科学研究院数字教育研究所,2023.
[9] 华东师范大学.教育通用人工智能大模型标准体系研究报告[R].上海:华东师范大学,2023.
[10] KADDOUR, J, HARRIS J, MOZES M, et al.Challenges and applications of large language models[J]. arXiv preprint arXiv: 2307.10169.
[11] 吴砥,李环,陈旭.人工智能通用大模型教育应用影响探析[J].开放教育研究,2023,29(2):19-25,45.
[12] 王同聚,胡小勇,丁美荣.中小学人工智能师资培训“AI-3S”教学模式构建与实践[J].数字教育,2023,9(2):1-10.
(责任编辑 李强)
Current Status, Problems, Challenges and Practical Paths of the Application of
Large-Scale AI Models in China’s Education
Zhu Miao, Nie Yong
(Faculty of Education, Shaanxi Normal University, Xi'an, Shaanxi, China 710062)
Abstract: The rise of large-scale AI models has had a great impact on various fields in China, which not only promotes the progress of the technology industry, but also promotes the prosperity of education. By providing personalized learning solutions, optimizing the allocation of teaching resources, and assisting in teaching decision-making, large-scale AI models show great potential, but they still face problems in data processing, technological innovation, and practical application, such as short of data processing level, the risk of users’ privacy leakage, the inadequate strength of software and hardware, insufficient capacity of model optimization and generalization, and the lack of training guidance. Therefore, this study aims to solve the problems by strengthening the model data processing level, constructing a security protection framework, improving model performance and stability, developing curriculum training, and improving the intelligent evaluation system in several aspects, so as to enable the large-scale AI models play a role in personalized learning, intelligent tutoring and customized teaching. It will provide new ideas and perspectives for improving the overall quality of education and building an inclusive and fair “AI + Education” environment, and will reduce the negative impacts of smart technologies on education while optimizing the large-scale AI models and deepening their educational applications.
Key words:" Large-scale AI models; Personalized learning; Customized teaching; Smart education; Data privacy