大型语言模型对高等教育的影响与中国应对*
2024-06-01吴丰华韩文龙
吴丰华 韩文龙
(1. 西北大学 经济管理学院,陕西 西安 710127;2. 西南财经大学 经济学院,四川 成都 610074)
一、引言
以GPT(Generative Pre-Trained Transformer)为代表的大型语言模型(Large Language Model,LLM)的横空出世①,其用户增长至1 亿人所用的时间远远少于其他热门应用,其强大功能和迭代速度远远超过了包括其开发者在内的从业者、社会大众和相关领域科学家的估计。 比尔·盖茨认为其是“平生见识过两次令我印象深刻、革命性的技术演示”之一②。 GPT 是一种基于Transformer 架构的,经过预训练的、生成性的模型。 本质上,这类语言模型的功能是对文本进行“合理的延续”,即预测下一个词该说什么,其中“合理”的意思是“在查看了数十亿个网页等人类编写的文本之后,我们可能会期望某个人会写下这样的内容”[1]。 其中Transformer 架构发挥了关键作用,而训练GPT 的主要方法就是无监督学习,即不需要对素材进行标注的学习方法。 已投入商业应用的最新一代GPT——GPT-4 的性能十分强大,在美国各项主流考试中的成绩均较GPT-3.5 模型有了大幅进步。 著名计算机科学家、物理学家沃尔夫勒姆在新书《ChatGPT 在做什么……以及它为什么好使》中分析认为,GPT 更像人脑,而不像一般的计算机程序。
正如比尔·盖茨所言,人工智能的发展与微处理器、个人电脑、互联网和移动电话的诞生一样意义重大。 它将改变人们工作、学习、旅行、获得医疗保健以及交流的方式。 整个行业将围绕人工智能重新洗牌,企业也将根据其利用人工智能技术的程度来区分优劣[2]。 同样,包括高校在内的教育部门也将受到人工智能和LLM 的巨大冲击,根据OpenAI 的一份研究报告,教育行业受GPT的影响在全部行业中排在中等偏上水平③。
实际上这种冲击已经发生:在美国,纽约市教育部2023 年1 月初宣布禁止学生在其学校的设备和网络上使用ChatGPT,以预防学生的作弊行为。 据《纽约时报》报道,包括乔治·华盛顿大学在内的多所高校,教授们正在逐步淘汰更易受到ChatGPT 影响的开放式作业,作为替代,他们更多选择课堂作业、手写论文、小组作业和口试等方法。 在欧洲,巴黎政治学院在2023 年1 月末发出通知,禁止全体学生及教职工利用ChatGPT 完成教学任务。 在澳大利亚,新南威尔士州、昆士兰州等多个州已宣布禁止在校内使用ChatGPT[3]。 在国内,《暨南学报(哲学社会科学版)》发表声明暂不接受任何大型语言模型工具(如ChatGPT)单独或联合署名的文章,《天津师范大学学报(基础教育版)》也发布相关声明,建议作者在参考文献、致谢等文字中对使用人工智能写作工具(如Chat-GPT 等)的情况予以说明。 然而,将ChatGPT 彻底从教育领域清除并不是所有高等教育者达成的共识。 英国剑桥大学副校长B.Vira 教授表示,人工智能是一种供人们使用的工具,大学禁用像ChatGPT 这样的人工智能软件并不“明智”。 他说,大学应该对学习、教学和考试过程进行相应的调整,以确保学生在使用该工具的同时保持学术诚信[3]。 面对教育界的巨大争论,OpenAI 首席执行官S.Altman 近期表示,OpenAI 正在研发帮助学校识别人工智能参与作弊的技术[3]。
智能化时代,社会对人才提出了正确价值观、多学科交叉能力、人工智能专业素养和创新决策能力的需求[4]。 利用数字化技术创新高教模式已成为全球共识。 2022 年12 月召开的世界慕课与在线教育大会上,《无限的可能——世界高等教育数字化发展报告》获得广泛共识,报告提出,“新一轮科技革命和产业变革带来了前所未有的发展机遇,数字化的知识、信息和数据已成为关键生产要素。 ……利用现代信息技术,高等教育将在育人方式、办学模式等方面产生系统变革”。我国也认识到了发展人工智能的重要性,2023 年4 月28 日,中央政治局会议首次提出要发展通用人工智能并提出要辩证对待,“要重视通用人工智能发展,营造创新生态,重视防范风险。”[5]2022 年全国教育工作会议也提出要实施教育数字化战略行动,把教育信息化作为发展的战略制高点,加快推进教育信息化和教育资源数字化建设。 面对LLM 给高等教育所带来客观的、巨大的挑战和机遇,我们应该积极应对,深入研究以GPT为代表的大型语言模式与高等教育结合的可能性、对我国高等教育产生的短期和长期影响以及带来的挑战等问题,并给出中国的应对方案。
二、LLM 的特点及与高等教育的结合
(一)LLM 的特点
第一,基于超大模型和预训练的强大生成性。GPT 中的“G”(Generative)就是生成性的。 作为超大型语言模型的代表,GPT-4 通过对含有1.8万亿参数④的GPT 模型进行无监督学习、强化学习⑤和大规模的分布式训练⑥,在海量语料库⑦中获得了强大的自然语言理解和生成能力。 这样,ChatGPT 和GPT-4 表现出极强的自组织能力,通过思维链(Chain-of-Thought)机制,出现积少成多的开悟时刻,即“涌现”。 可以说,强大的生成性奠定了GPT 最基础也是最有力的生产力属性。
第二,基于多模态算法和相关领域情境学习和微调的高行业渗透性。 “多模态、推理能力、预测扩展性”是GPT-4 的三大亮点[6],其中以多模态对教育行业的影响最为直观。 多模态算法即融合文字、图片、音视频等多种内容形式的AI 算法。具体来说,给定由穿插文本和图像组成的输入,GPT-4 可以生成文本输出(自然语言、代码等)⑧。 不论是AI,抑或其高级形态——通用人工智能(Artificial general intelligence,AGI)要渗透到各个行业,向多模态发展是必然趋势,毕竟现实世界中的数据天然就是多模态的,必然需要有能感知和理解多模态数据的能力。 进一步,针对各个应用场景需要交互的输入、输出各不相同的情况,多模态的大模型可以且必须通过细分领域的数据和指令微调以及少样本的情境学习⑨,才能高效地应用到各个领域和行业之中⑩,形成很强的任务通用性,可广泛使用于下游任务(生成、预测、判别等)。 同样的,基于对不同教育场景的针对性微调,大型语言模型在高等教育领域的多任务执行和多场景应用才成为可能。
第三,基于思维链产生的复杂推理能力。GPT-4 具备极强的推理机制,无论是复杂的逻辑推理、编程推导或者是密集型内容帮助,GPT-4皆表现不俗。 这意味着GPT-4 可处理未知问题,即没有现成答案的问题。 其原因在于GPT-4 是通过思维链,即通过合适的提示,将逻辑较为复杂的问题拆解为多个简单的子问题来“解答”问题,这里不是搜索答案而是回答问题。 如此,GPT-4会对编程、内容审核等场景产生深远影响。 特别的,以GPT-4 为代表的AI 对问题的回答思路或提出的解决方案,大部分时候符合人类回答或解题的理性思路,但有时也会发现其并非人类的理性思路或套路,它能找到并采取人理解范围之外的解决方案。 这意味着,高等教育中最重要的目标之一——创新,就有可能在师生与以GPT 为代表的LLM 的互动中产生。
(二)LLM 与高等教育的结合
第一,LLM 的使用过程更接近学习的最本源模式。 人与大型语言模型的交互模式更接近对话式学习,正所谓“真传一句话,假传万卷书”。 学生可以通过与大型语言模型不断的问答和追问式的互动,以最快的方式获得知识,而且能够有针对性地弥补自身知识的短板。 更进一步,可以通过对LLM 的针对性训练(如“喂给”特定知识领域的语料),实现像某领域、某学派甚至某位学者那样回答问题。 这样,大型语言模型就有极大可能成为一种高效的学习方式。 当然,这种对话式学习也存在一定挑战:它可能会把知识讲错,可能会凭空编造知识,特别是冷门知识。 这就需要提高训练LLM 的语料库的更新频次,但更为重要的是要通过提高算法,识别并屏蔽编造知识的行为。
第二,基于LLM 的AI 助手将极大解放并赋能教学双方,实现以学生为中心的教学。 一旦拥有一位教育领域的大型语言模型AI 助手,那将是对师生双方的共同解放和赋能,极大地提高效率。作为教师的教学助手,AI 助手可以用自然语言打破各种语言障碍,如外语、编程语言等,深度赋能教师;AI 助手还可以帮助教师和管理者评估学生对某一学科的理解,以提供有针对性、个性化的学习方案;AI 助手还可以就学生的职业规划提供建议。 目前,一些国外教师已经在使用ChatGPT 这样的工具来生成对学生写作的评语。 作为学生的学习助手,通过一段时间的使用,AI 助手会了解学生的兴趣、学习风格和长板短板,从而为学生量身定制内容,保持每位学生的参与度和学习效果;它会衡量学生的理解能力,注意到学生何时失去兴趣,并了解不同的学生倾向于哪种激励方式;AI助手还能给出即时反馈,以解决高等教育中的最大难题之一——学习过程中的及时教学评估。 这些变化已经发生,在不久的将来,AI 助手将最终改革高校的教学方式。
第三,LLM 更丰富的输出形式为教学活动提供了更多可能。 前文分析了多模态所带来的诸多好处。 未来,如果基于LLM 的教学AI 能够提供除自然语言外更为丰富的输出形式,如图像、音频,甚至是视频等⑪,那么其辅助教学的能力和效果必将明显提升,其中,尤其以视频形式最为重要,因为到目前为止,视频被认为是讲授演示的首选媒体。 一旦基于LLM 的视频输出成为可能,那么将明显区别于现在单纯依靠教师设计内容、撰写脚本进行录制的视频类课程。 很显然,慕课等大规模网络课程和在线课程的效果之所以没有达到预期,其原因就在于课程内容从设计策划到生成制作,都是教师“居高临下”地对学生进行单向度传输,并没有充分围绕学生这一中心展开,难以满足学生个性化、动态化的学习要求。
第四,中国高等教育的巨量规模为大型语言模型在高教领域的拓展应用提供了数据基础和广阔前景。 经过多年发展,我国建成了世界上最大规模的高等教育体系,在学总人数超过4 430 万人,高等教育毛入学率从2012 年的30%提高至2021 年的57.8%[7]。 此外,我国慕课建设与应用在课程数量、应用范围、多模式应用和促进高校教学改革等方面取得了显著成就[8]。 截至2022 年11 月,慕课数量超过6.19 万门,注册用户4.02亿,学习人数达9.79 亿人次,中国慕课数量和学习人数均居世界第一[9]。 世界第一的高教规模背后是世界第一的高等教育大数据库,海量的数据将为LLM 的训练提供最为丰富的语料资源,也将为LLM 的应用提供最为广阔的用户群体,前者将大大加速LLM 针对中国高等教育的拓展应用的开发,后者将大大降低在中国高教领域应用或开发LLM 的相关应用的成本,为其商业化应用和大规模推广奠定基础。
三、LLM 影响并重塑高等教育的诸多方面
大型语言模型对高等教育的影响可以从短期的直接影响和长期的间接影响两个维度来分析,前者主要体现在对教学模式、教学方法、线上教学、教学助手等方面的影响,后者则主要体现在对我国高校学科建设与发展、拔尖人才培养、高校结构变革等方面。
(一)短期直接影响
第一,LLM 可以帮助创设教学情境、创新教学模式。 当前高等教育面临的严重问题之一便是课堂教学单通道、单向度,师生互动层次低、停留在表层,而且受限于教师的时间与精力,难以向课前、课后延伸。 雨课堂、学习通等教学辅助软件的诞生和使用,虽然有所缓解上述问题,但是难以从根本上改变这一状况。 而在LLM 上,可以实现大师、学者、老师和学生之间,以角色互换、多角色Cosplay 等方式进行深度互动。 各学科、专业的老师也可围绕LLM 创设多种教学情境,如在基础学科的专业课程上,通过LLM 复活那些已经逝去的伟大科学家、先贤先哲,让学生和他们直接对话;在编程课上,可以由LLM 模拟某种特定的计算机语言,对学生进行编程训练;在论文写作课上,可以让LLM 来担任编辑、编审或审稿人的角色,对学生开展写作、投稿和返修指导;在新闻类课程上,可以让LLM 出任记者、编辑等不同岗位,帮助学生充分体验新闻创作和采编过程。 可以发现,这种互动完全可以在教师相当有限的指导和监督下展开,并向课前和课后充分延伸,这在突破学习的物理时空限制,大大提高学生学习的个性化、自主性的同时,也能充分解放教师,有助于他们投入更富创造力的教学和科研工作中。 这种运用LLM 的教学情境创设和模式创新,既充分彰显了“以学生发展为中心”的教育理念,大大缓解学习者的焦虑和畏难情绪,提高学生学习效果和学习兴趣,也高度契合了“两性一度”的金课标准。
第二,基于LLM 开发的各类教学小程序将大幅提升教学和科研效率。 随着LLM 不断迭代并逐渐成熟,其算法也将不断优化,算力也将逐渐节省,并向高校、高教管理机构和教育类公司开源,基于LLM 开发的各类教学或学习辅助小程序将大量出现。 目前,我国主流的几款辅助教学软件——雨课堂、学习通等,都在进行相关人工智能程序的嵌入式开发。 可以想象,未来将会有大量的教学助手出现,它们能够帮助教师完成学生形式灵活的课前预习、及时的课后答疑、快捷的随堂和课后测评、辅助课堂讨论、教学材料和案例的自动生成、全周期的教学数据分析等多种任务;或者帮助学生完成课前预习、课后复习、学习效果自测、课程作业协同创作⑫等多种任务。 这还仅仅是在教学层面。 实际上,科研层面的应用前景将更加广泛,如基于LLM 开发的能够阅读和初步提炼归纳文献内容的文献管理软件、写作辅助插件、特定领域的编程工具、统计分析、计量分析和大数据分析的插件,等等。 一个可供参照的实例是,随着开发ChatGPT 的公司OpenAI 把API⑬流量价格降低90%之后,短短几天内就涌现出11 个基于ChatGPT 的小应用程序和应用插件上线应用——实现了PDF 文档分析、复杂计算、调用浏览器等LLM 模型自身并不具备的扩展性新功能。
第三,LLM 为高校大规模、个性化在线学习提供了极大的想象空间。 LLM 在高等教育领域的使用,使基于问题导向的线上教学、教师帮助、学生自主学习乃至人工智能助教变得技术可行且成本可控;线上课程开发、建设和内容更新都将更为方便,在线课程的呈现形式也将大大丰富。 未来可能出现的情况是,虽然所有学生都在学习同一门在线课程,但是伴随着课程开始前对学生的知识基础和能力的评估,以及课程进行中不断与LLM 的交互,实际上每位学生学习的课程内容、进行的课程练习、课程的进度安排、被推荐的教学资源,乃至所采用的教学方法和教学模式都是不一样的,真正实现了“千人千面”式的个性化在线学习。 当然,LLM 还需要大量的训练和进一步发展,才能理解某个学生学习的最佳方式或其学习的驱动因素。 即使技术十分完善,创造性学习仍将取决于师生之间的良好关系。 它将助力但永远不会取代学生和老师在课堂上共同完成的工作。
第四,LLM 将助力虚拟仿真课程开发和虚拟教研室建设。 LLM 与AR(增强现实)、VR(虚拟现实)技术和设备的匹配与融合,是LLM 在高等教育领域的又一重要应用方向。 受制于无法进行人机交互,现有的虚拟仿真课程,包括国家级虚拟仿真实验教学一流课程,带给学生的体验感和学习效果都不尽如人意。 随着LLM 及其在基于高等教育各专业,特别是在新工科、新医科、新农科专业不断深入的课程内容建设和开发,虚拟仿真、虚拟实验的内容质量,师生的沉浸式体验感和逼真感,以及学习效果都将大幅提升。 同样,教育部正在推进的虚拟教研室建设,也将随着LLM 的应用,打破不同院校之间的空间限制和教育上下级之间的体制限制,开展充分的跨区域和跨级交流,甚至可提供一个类似于第二大脑的教研交流对象。 每一个虚拟教研室都将拥有一个类似于教学指导委员会或学科建设指导委员会一样的交流和咨询对象,以实现对每个虚拟教研室富有针对性的教学指导和帮助。
(二)深远影响
第一,LLM 将有力助推新工科、新医科、新农科与新文科建设。 “四新”建设旨在从教育思想、发展理念、质量标准、技术方法、质量评价等方面推进相关学科人才培养范式的全方位改革。 就赋能新工科而言,LLM 建设及其应用将有力助推组织模式创新、内容方式创新和实践体系创新,助力构建产学研用多要素融合、多主体协同的育人机制,将有助于支撑本科院校与企业深度合作,将赋能建设一批示范性微电子学院、网络安全学院、现代产业学院、特色化示范性软件学院、未来技术学院等,推动工程教育深层次变革。 就赋能新医科而言,LLM 建设及其应用将助力复合型高层次医学拔尖创新人才培养,推动“医学+X”复合型人才培养改革走向深入。 就赋能新农科而言,LLM 建设及其应用将助力设立更多创新形式的新农科实践项目,促进“大国三农”系列在线开放课程和耕读教育相关国家级一流课程提质升级,赋能耕读教育实践基地建设,有力支撑新农业、新农村、新农民和新生态建设。 就赋能新文科而言,新文科建设的要义之一是促进学科交叉融合,2012—2022 年间,教育部统筹推进在全国高校新增三千多个文理、文工等学科交叉融合专业点[10]。 LLM的发展与建设,将有助于文科背景的教师和管理者更好理解和推进文理、文工等交叉学科的建设,并加快涉外法治、国际传播、国际组织等相关人才培养,推进文科教育与社会实务紧密结合。
第二,LLM 将赋能基础学科拔尖人才培养。在百年未有之大变局下,为贯彻习近平总书记“加强基础学科拔尖学生培养,在数理化生等学科建设一批基地,吸引最优秀的学生投身基础研究”[11]的重要指示,2018 年教育部全面启动基础学科拔尖学生培养计划2.0(简称“珠峰计划”),在77 所高校布局建设了288 个学生培养基地,累计吸引1 万余名优秀学生投身基础学科[10]。 其中,涉及190 个左右的理科基地、60 个左右的文科基地以及10 个左右的医科基地。 LLM 建设及其AI 智能应用,将有利于发现、选拔和培养上述基础学科领域的天才、偏才和怪才。 从学生能力角度考量,基本技能中的初级写作、编程等最容易被LLM 代替或至少辅助完成,而批判性思维、创新能力和综合运用理论解释、解决现实问题的能力就变得更为重要;从教育者角度考量,通过LLM 得到的是相对碎片化的知识,而对拔尖人才的培养,应重点引导启发学生提问能力、独立思考能力、创新思维的涌现。 可以说,LLM 的广泛应用,将助力国家形成基础学科拔尖人才的梯队网络,探索基础学科拔尖人才培养的中国范式,为建设世界重要人才中心和创新高地筑牢基础。
第三,LLM 将促进高校进行以学生能力为核心的结构性变革。 包括我国在内的世界高校教学的现行组织方式都是以专业为基础,围绕“专业+年级”或“学科大类+年级”的核心单元进行组织。未来,在LLM 及其与之相匹配的AI 教学的加持下,高校教学有极大可能充分基于学生的不同能力水平,打破专业、班级教学的整齐划一,围绕“专业+能力”或“学科大类+能力”的核心单元进行组织,在知识习得和掌握的基础上,以多维能力和综合素质提升为最终目标,组织师生、教学资源和学习空间,大幅提升高校针对学生情况开展个性化教学的可能性。 这样,学校将实现从围绕年级展开的“年级进阶”向围绕能力提升展开的“能力进阶”转型升级[12]。
四、LLM 给中国高等教育带来新挑战及应对
(一)LLM 给中国高等教育带来的挑战
第一,LLM 在高等教育领域的使用可能引发国家安全风险。 这种安全风险主要来自三个方面:一是数据泄露风险。 一旦LLM 在高等教育领域大规模使用,其背后的海量教育数据,包括但不限于学科数据、专业数据、教师数据、学生数据、学习数据、师生互动和人机互动数据等,以及背后巨量的个体参数,包括但不限于声音、语言、思维模式和学习习惯等,一旦被GPT 自动收集并分析上述敏感信息,既有可能侵害个人隐私,又很有可能被敌视我国的国家所掌握,存在一定的隐患风险[13]29。 二是意识形态风险。 LLM 技术领先的某些西方霸权国家,有可能利用其LLM 在中国高等教育中的大规模应用,针对我国进行潜移默化的意识形态渗透和制度破坏,这种隐蔽的、持续性的输出可能会影响师生,特别是青年学生的政治判断和选择。 三是技术依赖风险。 目前,几款主流的LLM 都是由美国公司开发,美国又在算力、算法、芯片等关键领域拥有较大优势,在中美科技竞争的背景下,LLM 在高等教育领域的应用,很可能加剧我国对美国的依赖,从而对我国高教安全和独立自主发展构成严重影响。
第二,LLM 的使用可能带来新的高等教育“智能鸿沟”。 虽然教育信息化、教育资源数字化建设在我国高等教育中的发展和应用已经有十余年时间⑭,但是仍存在区域之间、城乡之间、不同层级学校之间和家庭之间等多维度的发展不平衡:东、中、西部在互联网基础设施与数字化学习资源方面差异明显[14];城乡学生在基本硬件条件、网络条件和场地条件方面存在显著差异[15],有网络问题的农村学生比例达37.63%,高于城镇学生[16];一项基于全国12 所高校学生的调查表明,相对于重点大学的本科生,普通院校本科生和高职院校学生拥有互联网设备的可能性要分别低82%和93%[17];中上经济水平家庭安装互联网的概率较劣势家庭高出1.4 ~4.4 倍,而父亲学历是小学及以下的家庭安装互联网的概率仅为专科及以上的40%[18]。 面对即将到来的LLM,可以想见的是,上述教育“数字鸿沟”尚未弥合,新的区域、群体和家庭的教育“智能鸿沟”又会出现,LLM 及其衍生的高等教育工具很有可能被优先提供给有能力购买的高校或重点院校,但我们需要确保这些工具也会被提供给全国各类型、各层次的高校使用。 但是这个美好的均等化愿景的实现并不乐观。
第三,LLM 存在被少数大企业高度垄断的极大可能性。 LLM 的开发和不断更新,需要持续的巨大算力的投入,这背后又是巨大的资金和智力投入,一般企业难以企及⑮。 而一旦被少数企业掌握,势必导致寡头垄断。 那么,一旦个别企业掌握这种超级生产力,对整个行业的生态将造成什么样的影响? 对高等教育管理者、高校教师和学生将产生什么样的影响? 如果上述问题处理不当,不仅会对LLM 的使用者产生不良影响,也会影响LLM 及其相关应用的使用和推广,最终反噬少数垄断企业。
(二)应对LLM 挑战的中国高教方案
第一,开发自身的LLM。 面对上述数据安全、意识形态、技术依赖等方面的风险,根本性方法是要发展中国自己的LLM 及其在高等教育领域的拓展应用和软件。 只有拥有国产自主可控的LLM,才能既保证我国享有LLM 及其拓展应用带来的各项便利,又能规避被人卡脖子以及风险不可控等问题[13]33。 这就需要我们用好市场和国家两种力量,以市场力量为核心,适当发挥科技攻关举国体制的作用,加快开发中国的LLM。 进一步,高等教育主管部门应主动加强与LLM 类公司的深度合作,开展联合研发,并开发适配高等教育场景,具备对话辅导、技能训练、讲授演示、协同创作、交互评价等功能的LLM 应用软件或插件。 实际上,我国已经具备研发LLM 的技术基础和智力储备,在全球人工智能高等院校排名中,我国的清华大学、北京大学位居第二、三位。 同时,中国企业在人工智能领域也取得了较好的成绩,Gartner公布的人工智能报告中,有三家企业(阿里巴巴、百度、腾讯)进入前十名[13]34。 未来,即使是我国的LLM 成功开发并在高等教育领域大规模应用,也需要高度关注数据安全问题。
第二,多措并举促进LLM 均等化可达并使用。 在LLM 的研发阶段,就需要将LLM 在不同的数据集和语料库上进行训练,确保其不含城乡、区域、民族、群体等方面的偏见。 在基于LLM 的高等教育课程开发、师资培训、推广应用阶段,可设立专门的教学改革研究项目,划拨专项教育经费,向中西部高校、地方高校进行倾斜性支持。 如此,数字鸿沟和智能鸿沟才有可能逐渐弥合,来自农村地区、广大中西部地区、偏远地区、低收入家庭的学生才不会掉队。
第三,提升教师数字教学素养和学生数字学习能力。 教师数字素养是指教师适当利用数字技术获取、加工、使用、管理和评价数字信息和资源,发现、分析和解决教育教学问题,优化、创新和变革教育教学活动而具有的意识、能力和责任[19]。提升高校教师数字素养需重点围绕高校教师的数字化意识、数字技术知识与技能、数字化应用、数字社会责任和专业发展五方面展开培训,并对教师运用LLM 和相关拓展工具开展专项培训,最终整体提升教师数字化教学胜任力[20]。 提升学生数字学习能力主要从三方面展开。 一是提高数字化技能。 提升学生正确、主动运用数字技术改进学习的意识和能力,提升学生数字化学习力、适应力与创造力。 二是营造数字化学习氛围。 构建数字化、智能化学习环境,探索基于LLM、VR 的沉浸式、体验式学习模式,并配套建设相应数字化教育基础设施。 整合校内外学习资源,为学生提供充分、完备、便捷的学习支持。 三是养成数字化责任规范。 加强学生信息道德、网络诚信、数据伦理、数据安全教育,倡导并规范学生安全、合法、健康、负责地使用LLM 及其衍生工具,提高学生信息和隐私保护能力[21]43。
第四,夯实数字化教学支撑环境。 一是创建优质高效的数字化教学环境。 依循“以学生发展为中心”的原则,创建高质量、可触及的数字化教学和研学的环境空间。 既要建设新的基于智能信息技术的多元教学场域[22],更要充分挖掘各高校原有数字化平台和学习空间的潜力,并适当进行更新改造,促进服务育人全过程的数字化转变,实现数字化教学应用常态化。 二是构建多网融合的高校新基建。 构建高速率、大容量、高效率的高校骨干网络,推进以IPv6、WIFI6 和5G 等为基础的“多网融合”的校园基础网络教学环境建设。 进一步整合全校计算资源、存储资源,推进绿色、集约的教育系统数据中心建设和多云模式。 三是提高教学数据治理水平。 各高校要运用云计算、大数据、LLM 等新技术,为高校教师、行政管理人员和决策者提供及时、全面、精准的数据支持。 将教学数据与LLM 及其拓展应用充分对接,实现相互打通的教学数据在高校教学和育人各环节的充分有效应用,推进数据、教学和个性化培养的深度融合[21]45。
五、结语
虽然LLM 在高等教育领域的应用作为一项通用技术,尚处于点解决方案和一定的应用解决方案的阶段。 但是,新纪元的大门已经打开了一条缝隙,随着机器学习和超强计算能力的飞速发展,通用人工智能正在成为现实。 面对这种形势,信息时代、智能时代的高校应积极拥抱AI、LLM等智能技术,高等教育主管部门也十分有必要根据中国式现代化对高等教育的发展需要、世界高等教育的发展趋势和中国高校的实际发展情况,进一步谋划发展我国自身的LLM 及其在高教领域的应用,开展相关教学体系重构、硬件建设、师资培训、风险防范等系统性工作。 唯有如此,我们才能以LLM 赋能高等教育不断创新升级,培养更具有问题意识、学习能力、协作能力、创新能力的,堪当推进中国式现代化重任的卓越人才。
注释:
①“横空出世”这个词并不准确,早在2017 年,A.Vaswani 等人发表了Attention is All you Need,就推出了一个超越RNN(循环神经网络)的新型神经网络结构,即Transformer。 之后的两年里,机器学习领域的从业者们在Transformer 的基础上提出了一系列具有里程碑意义的模型,包括GPT、BERT、GPT-2 等及其改进版,如ChatGPT、GPT-4 等。 这些模型把机器处理文本的能力提升到了前所未有的高度,因此很快被产业界接受并得到了广泛引用。
②另一项是1980 年出现的图形用户界面,是包括Windows 在内的所有现代操作系统的前身。
③衡量某个行业受GPT 影响的水平是Exposure 指标,衡量的是在保证完成质量相同的情况下,GPT 是否能够将完成工作和任务的时间缩短至少50%以上。 具体可参见http:/ /openai.com/research/gpts-are-gpts/.
④这比它的上一代GPT-3.5 中包含的1 750 亿个参数整整多了一个数量级。
⑤无监督学习、强化学习是两种流行神经算法网络,另外一种是监督学习。 监督学习需要标注素材,无监督学习不需要标注素材,强化学习是在动态环境中开展,AI 每执行一步都要获得反馈的学习。
⑥分布式训练具有极强的扩展性,允许更大的模型在更大的数据上进行更久的训练。 这种训练需要大量的计算资源和存储资源来支持,因此其训练成本高达1 200 万美元。
⑦GPT-4 使用更多样化和更大的1PB 数据集,而GPT-3 使用较小的45TB 的文本数据集。
⑧在多模态技术出现之前,AI 模型只能专注于单一领域,例如自然语言处理或计算机视觉等,多模态技术出现后,模型已经从单一的自然语言处理和机器视觉发展成自动生成图画、图像文字、音视频等多模态内容,极大地推动了AIGC(AI generated content,翻译为“生成式AI”,即利用人工智能技术来生成内容的一种新型技术)的内容多样性和通用性。
⑨即给出少量的任务示例,大型语言模型从给定情境中学习并解决新任务。
⑩例如AI 绘画从输入图像或者文字得到图像,PalM-E 同时处理视觉、语言和传感器,极可能应用到工业生产中。 PalM-E 是由谷歌与柏林工业大学的人工智能研究小组,于2023 年3 月推出的一个多模态具象化视觉语言模型(VLM),取名为PaLME,该模型的参数规模达到了5 620 亿个。
⑪OpenAI 公司开发的最新一代GPT-4,可以实现文字(上限为25 000 字)和图片的单独或混合输入,文本输出(含自然语言、代码)。
⑫这里的创作是广义的,包括论文、研究报告、读书笔记、程序代码编写、活动方案设计等多种形式。 学生向LLM 陈述题目或主题、内容要件、编程需求、制作说明等任务要求,LLM 会生成初始版本(或者方案),学生进一步向LLM 提出修改要求,LLM给出新版本,……在多轮迭代后,生成一个作品或者方案。 正是这一点让广大教师头疼不已,却让一些学生欢欣鼓舞。 因为教师和管理者无法判断这个过程中学生和LLM 各发挥了多少作用,所以已经有部分高校和学术期刊明确表态禁止使用LLM参与作业和学术创作。
⑬API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件的以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。
⑭2018 年4 月,教育部实施《教育信息化2.0 行动计划》,明确到2022 年基本实现“三全两高一大”的发展目标。 随后,教育部等部门相继出台《高等学校人工智能创新行动计划》《教育部关于实施全国中小学教师信息技术应用能力提升工程2.0 的意见》《教育部等十一部门关于促进在线教育健康发展的指导意见》,全面提升教育信息化能力。
⑮根据国盛证券计算机分析师刘高畅、杨然发布的报告《ChatG-PT,需要多少算力》(2023-02-12)中估算,GPT-3 训练一次的成本约为140 万美元,对于一些更大的LLM 模型,训练成本介于200 万~1 200 万美元之间。 2023 年1 月,平均每天约有1 300万独立访客使用ChatGPT,对应芯片需求为3 万多片英伟达A100GPU,初始投入成本约为8 亿美元,每日电费在5 万美元左右。