走向国际共识的中小学AI教育
2024-08-29谢作如毛勇郑子杰
编者按:因为翻译的问题,“智能”“智慧”和“Intelligence”“Smart”这几个名词往往是混用的,如“智慧校园”对应的单词是“Smart School”,“智慧社会”则对应“Intelligent Society”。“智能教育”是指人工智能教育还是智慧教育?“智能设备”是指人工智能设备还是电脑类设备?语义的混淆给人工智能教育的内容和目标界定带来了困扰,也造成了“泛人工智能教育”(指把人工智能教育的边界泛化到机器人、编程、物联网等)的尴尬。那么,国际上对人工智能教育的认识和定位是怎么样的?中小学人工智能教育如何走出“泛人工智能教育”的误区并走向国际共识?本期对话邀请了温州科技高中的特级教师谢作如、清华大学毛勇博士和北京十一学校郑子杰老师,他们将围绕“国际共识”展开讨论。
算力、数据和算法是中小学AI教育的核心
谢作如:“算力、数据和算法是推动新一代人工智能发展的三驾马车”,这句话对很多人来说已经是常识,随处都能看到。我查过资料,关于“算力、数据和算法”的表述在2017版的高中信息技术课标中并没有出现,但在2022年发布的义务教育信息科技课程标准中出现了,原文为“了解人工智能的基本特征及所依赖的数据、算法和算力三大技术基础”。最初读到这句话时,我并没有深刻感触。过了相当长一段时间我才忽然领悟到——“算力+数据+算法”不就是机器学习的过程吗?毛勇博士是清华大学AI专业的博士,属于在新一代人工智能兴起前就毕业的那一批博士,我很好奇,当您第一次读到“三驾马车”的表述时,想到的是什么?
毛勇:我知道“三驾马车”这一表述的时间也已经很晚了,大概在2017年之后。那时候深度学习已经兴起,AlphaGo已经横空出世。经过媒体的传播,AI学科也渐渐成为人人关注的“显学”。而在2007年前后,也就是我读书和参与科研工作的年代,AI研究基本上局限在实验室中。因此,我们当时的研究工作都不需要太强的算力和太多的数据,而且实际上这些条件也并不存在。当看到这句话之后,结合AI应用在生活中不断出现,我意识到这是对AI领域核心要素非常精炼的概括。它概括的是AI发展的过程,即伴随着互联网和移动互联网时代的发展,摩尔定律带来的算力飞速提升以及各种优秀算法的出现,人工智能终于走出困境成为一个真正的工程学科。对于这个时代的每个学习者来说,建立起一个学科的宏观概念是非常重要的,所以我认为这个总结很精辟,每个学生都应该理解它的内涵。
谢作如:相对于毛勇博士来说,我是“半路出家”的AI教育工作者,靠各种入门型的教程或者教材,才慢慢迈进了AI的大门。早在2005年左右,我把当时所有高中《人工智能初步》模块教材都研究了一遍。即使这样,我也仅仅了解了点皮毛,一度把机器人当作实施AI教育的最好载体。2014年左右,我应邀参加高中课标《智能系统初步》模块(这一模块后来又更名为《人工智能初步》)的讨论和初稿编写,重点则落在“机器人”和“智能控制”上。第一次编写AI教材是在2019年,我应邀为初中生编写一个学年的教材。最初也是中规中矩从符号主义开始学习,如知识表达、推理和搜索等内容,基本上没有涉及神经网络。到了2020年,我们在清华大学出版社的初中《信息科技》教材中加入了“深度学习”的内容。而现在,我的想法又有了变化:能不能把学习重点定位在“模型”上?因为“算力+数据+算法”得到的结果就是“模型”。我这十多年来的学习、认知历程,是不是走了太多弯路?
毛勇:您这个历程绝对不是走了弯路。您从开源硬件、互动媒体到创客、3D打印,再到人工智能,一直在坚持学习,这一点让我尤为佩服,而且您的学习路径很有趣,从“编程和控制”逐步转移到“模型和训练”,关注真实问题解决,为解决问题不断学习新的知识,包括机器学习和深度学习。对于符号主义的涉猎,其实不能算是走弯路,而是在帮助自己建立对AI学科的全貌理解。而且对于之前的学习者来说,都不可避免有这样的经历。您正在推广的“以数据驱动和模型训练为核心”的AI教育,我认为是抓住了现阶段AI学科的核心,路径非常正确。
谢作如:谢谢毛博士的肯定。郑子杰老师是北京十一学校的AI课程教师,我很早就在网上看到过您分享的一个PDF文件,标题为《如何开设面向10年级学生的机器学习课程》。请郑老师简单介绍一下,您的AI课程是什么时候开始实施的?面向哪些学生?涉及哪些课程内容?
郑子杰:自2020年起,我在北京市十一学校开设机器学习课程,主要针对高一和高二学生。这门课每学期都开,一个学期为一个学习周期,每周二晚上上课,每次上课的长度是1.5至2小时。课程内容主要涉及机器学习的基础知识、模型的训练与测试流程,以及包括神经网络、支持向量机、决策树在内的多种常见模型。我尽可能深入浅出地阐释这些概念,并鼓励学生通过问题探索,激发他们思考。例如,在介绍“支持向量机”时,我会强调其设计理念中从“较优解”到“最优解”的演进过程。在讲解决策树时,我侧重于交叉熵概念的讲解。至于深度神经网络,我会简要介绍如何使用PyTorch搭建神经网络以及一些常见的网络模型,但不会深入,因为这需要更深厚的数学背景知识,超出了一般高中生的理解范围。我的课程主要面向那些对AI有浓厚兴趣、具备一定Python编程基础,但又不仅仅为了参加学科竞赛的优秀学生。虽然现在的AI跟升学没关系,但有相当一部分家长会支持孩子选择学习我的课程。
谢作如:谢谢郑老师的介绍。您的课程很有难度,如“交叉熵”一词就能吓跑很多想研究AI的老师。但作为度量两个概率分布间的差异性信息的概念,我也认为“交叉熵”在机器学习中实在是太重要了。对了,我们三个人还有一个共同的身份,都是NOAI科学教育委员会委员。NOAI是IOAI活动的国内版本,IOAI的全称是国际人工智能奥林匹克,我想IOAI的方向基本上代表了AI教育方面的国际共识。那么IOAI活动是以怎样的形式,将不同国家的青少年放在一起“竞技”?关注哪方面的AI知识和能力?请毛博士简单介绍一下IOAI官方网站给出的模拟试题,分析涉及的AI知识以及可能的考核形式。
毛勇:IOAI的考查形式是以4人组队的方式解决真实的人工智能研究和应用问题。它主要包括两轮考查,也就是两种类型的题目。第一轮叫做科学轮,科学轮的3道题目会在国际活动前1个月就发送给学生。学生要在国内进行充分的学术准备和积累,然后在出国前提交一次正式的代码和文档,但是这部分内容只占总分的5%。而到了国际现场,这3道题目的后一半延展问题会直接给到学生手中。他们有8个小时左右的时间以团队为单位进行研究、学习、写代码、处理数据、搭建模型,然后还有8个小时左右的时间可以用云端算力去跑训练。然后他们要把自己的代码、结果和文档在线提交。科学轮的题目基本都是模拟了现实世界中非常新的科学研究问题,选手需要识别和解决现有方法中的局限性,并提出自己的解决方案。在这一轮中的表现主要取决于选手的基本编码技能、对常用深度学习Python库和框架的熟悉程度,以及对机器学习基本原理的理解。
谢作如:据我了解,类似IOAI活动的面向青少年的国际人工智能活动很少。我想请毛博士再介绍一下面向成人(包含大学生)的人工智能活动有哪些,这些活动的考核内容和传统的编程比赛(如信息学奥赛)有什么区别。
毛勇:相对而言,面向大学生和成人的国际人工智能活动要更丰富些。例如,图像领域的学术竞赛ILSVRC(ImageNet Large-Scale Visual Recognition Challenge)、对话系统领域的DSTC(Dialogue System Technology Challenge)都是学术性非常强的比赛活动,还有开源数据平台Kaggle上也会经常组织一些活动。此外,一些大公司也很喜欢把自己业务中的真实问题做成题目,开放地征集解决方案。这些活动要解决的问题往往具体、真实而又开放,有很大的研究和创新空间,考核内容和传统的编程比赛相差比较大。
AI实验要重点体现当今时代(近20年)主流AI的核心要素——数据、模型(算法)和算力。
在现阶段,大语言模型的原理可以在专家讲座中出现,大语言模型的应用可以渗透到其他课程和日常生活中,但是不适合直接放在中学AI课程中。
精心选择AI实验是中小学AI教育的抓手
谢作如:从毛博士的介绍可以看出,虽然都在强调算法,但是人工智能方面的活动涉及的知识往往不是我们熟悉的排序、搜索、动态规划、线段树之类,很多内容都很新,如“词向量”“对抗生成”等。但我们不需要大惊小怪,因为国际奥林匹克活动本来就是为学有余力的学生设计的。当然,我们也必须知道,这些内容实际是新一代人工智能的课程不可缺少的部分。
从AI的各种知识点出发,我想给两位出一道难题。两位都知道,目前国内有多个省份和地区正组织专家编写中小学人工智能通识课程,以地方课程的形式实施,如深圳和上海。假设某地区准备在小学、初中阶段实施一个学年的通识课程,大概32课时,其中有6个AI实验(一个实验2课时)。假设你们都是这个地区编写人工智能通识课程纲要或者指南的专家,你们会为初中生遴选哪6个AI实验主题?
至于我为什么会选择AI实验?那是因为2023年教育部等十八部门颁布了《关于加强新时代中小学科学教育工作的意见》,提出要着力在教育“双减”中做好科学教育加法,要加强中小学科学及相关学科(物理、化学、生物、地理、信息科技/信息技术、通用技术等)课程标准及教材修订完善工作,加强实验室建设,强化实验教学等要求,通过实验来学习AI,显然是最好的抓手。另外,你们在遴选实验主题时不要局限于上课教师的AI水平,即要假设教师们都经过一段时间的AI技术培训,具备了一定的专业技术能力。
郑子杰:首先,我们要明确设计这些实验的目标是什么。以初中生的认知水平,想要通过这6个实验了解AI的各个前沿方向,如大语言模型、多模态、具身智能等显然是不现实的。所以,我会牢记基础教育阶段的“基础性”,课程是为之后学习AI打下“基础”的。至于AI前沿领域的发展,应该通过专家讲座或者是通过其他课程完成。所以,AI实验要重点体现当今时代(近20年)主流AI的核心要素——数据、模型(算法)和算力。我推荐的6个实验分别是:
实验1:以二维表为载体、旨在让中学生认识和分析数据表的实验,数据来源可以是他们真实的物理、化学、生物课堂;
实验2:实现传统机器学习的实验,如线性回归或者鸢尾花分类的实验,用来体会机器学习的一般流程;
实验3:计算机视觉方向的基础实验,如提取图片特征等,简单跟学生讲讲怎么使用卷积提取图片边界;
实验4:计算机视觉方向的进阶实验,如基于CIFAR10这个数据集,使用卷积神经网络实现图像分类;
实验5:自然语言处理的基础实验,如直接分析一篇小说,重点让学生体会如何定量化地描述“文字”,并如何提取文字中的信息;
实验6:自然语言处理的进阶实验,如使用Pytorch框架和LSTM实现文本的分类等。
这6个实验可以分为3个大方向——机器学习、计算机视觉和自然语言处理,并且前一个实验都是通过实验载体了解简单的原理,后一个实验是走通AI训练的流程。我之所以不提大语言模型,是因为其太复杂,学生在知道模型的一些基础结构之前,很难体会大语言模型这类复杂模型的设计初衷。如果直接在课程上讲解大语言模型,学生只会觉得“好厉害”,却发现什么也学不到。所以我一直坚持,至少在现阶段,大语言模型的原理可以在专家讲座中出现,大语言模型的应用可以渗透到其他课程和日常生活中,但是不适合直接放在中学AI课程中。从教学角度讲,我们要用符合中学生知识积累和认知水平的载体,让学生体会数据、模型(算法)、算力,并尽可能体会一些模型设计的初衷和精妙之处。当学生能够体会简单模型的原理后,随着年龄的增长,他们自然就会学习、应用、修改甚至创造更加复杂且精妙的模型。
毛勇:我非常同意郑老师的思路,唯一的不同是我可能会选择把实验5和6改为某个更简单的处理时序数据的问题,如天气或股票数据等。这样做对于像北京十一学校这样的学校来说似乎少了一块内容,但是对于更多的学校来说,相比处理自然语言做词表、向量化等困难一些的实验,也许简单一些的结构化时间序列数据更加适合他们。当然,如果课时允许,可能更加理想的方式是将这部分内容增加到自然语言处理实验的前面去,增加实验时长,让课程更加丰富。
谢作如:在给两位出题的时候,我也进行了认真的思考,在脑海里把自己了解到的AI学科内容“搜索”了一遍,发现6个实验真的不够用。郑老师给出的实验清单涉及了机器学习、深度学习(卷积神经网络、循环神经网络),涵盖了计算机视觉和自然语言处理,做到了“纲举目张”,我相信这6个AI实验一定会成为老师们开发课程的最好参考。
面对这6个实验,相信很多老师会和我一样有疑问——这些AI实验对学生的数学能力都有一定的要求。即使我们不去讲“交叉熵”,也不讲“梯度下降”和“反向传播”,但“向量”显然不可回避。OpenAI的核心研发人员Jack Rae说过的“压缩即智能”,给了我们一个重要的启示:只要找到合适的方式在数据中提取到有效的特征向量,就能用低算力的方式训练出可行的模型。因为,物理世界的信息“数字化”后能被计算机处理,“向量化”则让数据能够更好地用神经网络来计算,如图像识别是先要用卷积神经网络提取特征向量,自然语言处理也是要先得到token。但“向量”是学生在什么年级才会学到的数学知识?初中生能不能理解“向量”?
郑子杰:向量虽然在中学数学课程中是高一才学到的知识,但是初中生也能够理解。在基础教育阶段,我们并不是非要等到数学知识都积累到了,才能学对应学科的知识。举个例子,物理中的“力”是先于数学中的“向量”出现的,大家都下意识地将“向量”等同于“一个箭头”,导致学生甚至数学和物理等学科的教师自身都不能理解向量的第二种理解方式——“数组”。把向量既看作是有方向性的量,又看作是数组,这种双重视角对于AI的学习很重要。只要老师们愿意跳出自己学科固有的理解方式,接受数学、物理、计算机等学科对“向量”不同视角的理解,并转述给学生,那么学生理解起来就非常容易。但由于现阶段基础教育的学科界限过于明显,很多教师的措辞是“这是A学科应该解决的,不关咱们学科的事”,这才使得类似向量这些概念看起来很难。
从另一角度看,数学中很多概念的确不能过于超出学生现有的数学知识水平,但这不等于所有的概念都只能按部就班,不能越雷池一步。例如“矩阵”就很容易理解,可以直接理解为“数表”,甚至连矩阵的四则运算,中学生都可以很容易接受。但是“特征向量”这个概念就有些难,因为其本身就涉及线性代数根本绕不过去的底层原理。但是,提取图像局部特征的“卷积”却在中学能够讲清楚,因为其并不需要很多代数推导作为铺垫。到底什么该讲什么不该讲,教师自身除了需要十分清楚AI内容和具备与之相关的数学基础外,还需要对中学生各科的学习内容了如指掌,并且对“学生能不能理解”有准确的判断。
值得一提的是,学生的Python编程基础反而是在AI教学中最不需要担心的。只要想学Python,在本人和家长不担心因为学习编程耽误时间或者影响视力的前提下,一个毫无代码能力且具有基本英语阅读和表达能力的初学生,每天晚上花2个小时学习写代码,1个月就能熟悉Python的基本语句。因为单从语法层面而言,Python编程无非就是对着计算机说与数学相关的英语而已。
谢作如:郑老师的分析给了我很大的信心。两位都知道,我在工作之余,还带着上海人工智能实验室的XEdu团队为青少年学习AI开发工具,其中涉及机器学习、神经网络、计算机视觉、自然语言处理等方面的模型训练。虽然一线教师对XEdu系列工具的反馈都很好,但也会有人泼冷水,认为中小学生学不了也理解不了机器学习。特别是在ChatGPT流行后,也有好多专家提出中小学生只要会写提示词(Prompt)、会用大模型就够了,没有必要学习模型训练之类的知识,甚至说只要学好语文就够了。对于这些观点,两位是怎么看的?
郑子杰:从学生发展的角度看,XEdu提供的功能足以让学生掌握AI流程,并在进行机器学习、计算机视觉等案例的过程中,深入了解底层原理。然而,我认为这还不够,我们还需要对内容进行更细致的分层。对于那些拔尖和对AI充满兴趣的学生,我们应提供更多关于底层原理的内容,引导他们深入思考并解决“为何会设计出多种不同的损失函数”“卷积如何实现特征提取”“全连接层的必要性何在”“如何调整学习率”等问题。而对于基础相对薄弱,未来不打算涉足AI、数学和自然科学领域的学生,采纳专家的观点是明智之选,他们仅需了解AI应用并学会将AI作为工具使用。关于中学生难以理解机器学习的担忧,其实源自当前AI教学内容的匮乏。目前,大部分AI资料都是针对本科生编写的,缺乏专门面向中学生的教学内容。针对中学生的内容设计,不应仅仅是对大学教材内容的简化,而应借鉴现有其他学科的教学方法,将内容调整至既能展现学科核心思想,又适合中学生学习的程度。例如,在中学和大学物理课程中都会讲述热学,但中学物理课程无需涉及玻尔兹曼分布,同样能清晰阐述热学的核心原理。
毛勇:我认为大模型有潜力成为非常重要的学习工具,学生可以通过和大模型的交互迅速学会原来需要很长学习周期学习或者学习曲线很陡峭的内容,并迅速应用、组装、改写大模型给出的代码解决问题。这种项目导向、问题导向的学习方式,我认为非常适合AI和信息科技这种强调应用、工程、真实问题解决的学科。但是这并不意味着学生不需要理解技术背后的原理,不需要完整参与到从数据到模型的全过程中去。因为我会假设好奇心是人类学习的最大动力,相比掌握了更多知识的大学生、研究生,中小学生在好奇心上也许会更胜一筹。当他们体验到AI的神奇应用后,我不相信他们不好奇背后发生了什么、不想去加深理解、不想去参与做一个自己的AI。当然,这里说的理解和参与是完全可以分层进行的,教师根据自己学生的学情选用合适的工具,小学生显然也可以毫无压力地体验完整的模型训练过程,并用AI来解决真实问题。我认为,这样的学习才是更加完整和有价值的,而不是局限在对大模型的浅层使用上。
大模型有潜力成为非常重要的学习工具,学生可以通过和大模型的交互迅速学会原来需要很长学习周期学习或者学习曲线很陡峭的内容,并迅速应用、组装、改写大模型给出的代码解决问题。
教师想去学习AI,也不知道往哪个方向努力。在“泛AI教育”的影响下,他们也以为做创客、玩机器人就是做AI教育。
不论是信息科技还是人工智能,都是应用性、工程性非常强的学科,如果教师没有动手能力则很难指导学生。
走向国际共识需要师资和学习资源
谢作如:两位博士都提到了最核心的问题,直面一个问题——我们究竟要培养怎样的人才。我在《青少年AI教育:从应用技术到引领未来》一文(本刊2024年1月的专题文章)中提出要培养“更多真正理解AI、驾驭AI的人才”,从而引领AI的下一步发展。AI科学家李飞飞也说过,AI不是一个黑箱子,而应该是灰箱子。要让这些箱子从黑变灰,就需要一系列涉及底层的实验。我组织了一个叫做“AI开源课程众筹计划”的团队,在暑假期间编写这些开源的AI实验,希望帮助更多的师生去理解AI。
我还记得几年前,姚期智先生带着清华姚班的同学编写了一本面向高中生的《人工智能基础》的教材,后来还做了一期培训。我认真阅读过这本教材,从中受益良多。记得郑老师曾经参加过清华姚班组织的教材培训。您能不能介绍一下这本教材的实施情况,以及培训过程中教师们的反馈?
郑子杰:姚老师编的教材整体方向很好,跟我设计课程的初衷基本一致。但因为各种原因,其推广起来并不是很理想。首先是课程内容难度太高,基本接近本科生的AI课程。在教师培训过程中,绝大部分教师其实都跟不上。以我们学校的学生为例,信息学竞赛省队水平的学生都表示学习起来很吃力。
但难度高还是次要的因素,更重要的是高估了现有中学教师的水平。国内的大部分中学教师普遍缺乏学习AI的动力,在没有激励的情况下,他们更希望直接使用那种不太费脑、只需要按照流程做就能跑通还能展示的课程资源。但是,直接拿过来就用的资源往往缺乏AI教育的价值。雪上加霜的一点是,一些有学习动力并通过自学掌握了AI流程和底层原理之后的中学教师或许就不愿意待在中学潜心教学了——他们如何抵制5倍工资和更高社会地位的诱惑呢?所以,如何合理调动中学之外的力量(如市场等)来激励教师学习并建设AI课程,是值得思考的问题。
谢作如:郑老师的回答让我感动。中小学太需要具备实施AI教育能力的教师了,但中小学要想吸引并留住这些人才真的很难。还有一点,这些教师想去学习AI,也不知道往哪个方向努力。在“泛AI教育”的影响下,他们也以为做创客、玩机器人就是做AI教育。今年5月份,中国教育技术协会信息技术教育专委会组织了“第七届中小学人工智能教育展示活动”,其中,基本功展示项目的上机操作部分的试题涉及机器学习和深度学习,不仅要求训练模型还要部署AI应用,并要求教师们在断网的条件下在3小时内完成。当然,在局域网内提供了大语言模型和模型训练环境OpenHydra。毛博士看过那份试卷,请简要点评一下。
毛勇:我看过那份试卷,好多题目给我耳目一新的感觉,尤其是其中的实践题目,要求教师们真刀真枪地操练起来。我记得有一道燃油车效率回归预测的问题,要求教师在短时间内完成从数据预处理、模型搭建训练到推理预测的全过程,而且还要写出简单但完整的UI(程序界面)。线性回归问题本身并不难,很适合中学阶段的教学,很多有学科背景的教师应该都能解决,不过如果长时间处于刀枪入库状态,教师们恐怕也会面临一些挑战。不论是信息科技还是人工智能,都是应用性、工程性非常强的学科,如果教师没有动手能力则很难指导学生,所以我觉得这份试卷对如何提升未来教师的AI素养给出了一个非常好的导向。
谢作如:是的,我们也期望通过各种形式给教师们提供学习方向。这几年郑老师和我一样,不断参与各种会议,不断呼吁更多人参与到中小学的人工智能教育中来。我想郑老师肯定和我一样也接到很多来自一线教师的关于如何学习AI、如何教学AI的“求助”。在您看来,在中小学推动这种国际共识的真正的人工智能教育,除了要培养一批与时俱进的教师外,还需要哪些推动力?
郑子杰:我觉得需要构建一个系统性的生态。这个生态里最需要解决三件事,分别是学术领袖、灵活且开放的政策、大学支持和企业的资助。我们需要一些AI教师成为有影响力的名师,能够带大家一起做事。但是这样的学术领袖一般都是自带AI背景,很难靠后期的教师培训培养出来,所以怎么吸引这些人来中学值得思考。之所以说需要灵活且开放的政策,主要是因为在现在的大环境下,很多有这样能力的教师做事情都担心“违规”。例如,我只知道不能给北京十一学校以外的学生进行有偿培训以及帮其他教育机构建设课程。所以,教师们会在安全第一的情况下,尽可能地拒绝这些活动。因为害怕违规而让AI教师力量没有办法在更大范围内发挥,这势必会阻碍AI的普及。另外,部分行政力量的措辞方法可能也会打击AI教师的积极性。我在十一学校之所以能够将AI课程开展得非常顺利,是因为我们学校对教师的学术尊重远大于行政制约。但当我走出学校时,在行政层面我碰到过类似以下这些措辞:“××说了AI很重要,你们本就应该放弃休息时间贡献力量”“你如果不想做,我会通知你们校领导”“你们必须在两年内做出效果,五年时间太长”……这会让本还想要做事的教师放弃。AI课程开发并不是教师的常规职责,在没有激励只有压力的情况下,有能力的教师会选择隐藏自己的能力。既然提到激励,单纯靠行政力量是远远不够的。既然这是一个教育界的“攻坚难题”,那么就需要提供与“攻坚难题”相匹配的资源支持和激励,这就需要大学和企业的帮助,如大学提供能够切实提升教师AI课程开发能力的教师培训、企业提供资源和资金支持等,还有高校研究机构和企业要为中小学开发更加好用的AI教学工具。
谢作如:对,这个生态要很多人一起去建设。我就认为,低门槛的AI学习工具和教学平台很重要,尤其是教学资源,如数据集和各种AI科创项目。回到前面关于AI实验的话题来。实施AI教育估计最大的困难在于算力,因为随着学生能力的提升,他们会不再满足于简单的模型训练,会尝试去收集更多的数据集,训练更复杂的模型来解决更多的问题。我甚至把一所学校是否购买了算力服务器看成是评价学校AI教育实施情况的一个重要指标,我知道北京十一学校购买了AI服务器作为开课的基础。郑老师,我想了解一下北京十一学校购买的初衷,以及现在的使用情况。
郑子杰:我们购买服务器和GPU的初衷是为了满足AI课程对算力资源的需求。一节课时间太短了,为了让学生在课堂上能够直观地感受到训练过程,模型训练工作尽量要在5分钟内完成。但是,即便采用CIFAR10这样小规模的数据集,在普通笔记本电脑或一体机上也难以做到。因此,我们需要购买算力服务器,配置独立的GPU。但因为预算并不宽裕,仅购置了两台服务器,每台服务器配备了两个4090系列的GPU。其中一台主要用于日常教学,如部署OpenHydra这样的教学资源分配平台;另一台则供学生在进行项目时使用,以便在离线环境下运行较为复杂的模型。如果项目涉及当前的大型语言模型,使用和购买线上资源会更加合适。由于af1f91ef03247ab846ee643e3942d2c4服务器刚购入几个月,目前只在一台服务器上部署了OpenHydra,另一台服务器尚未投入使用。我个人认为,中学需要建立一个分级算力体系,明确在教学过程中学生可能遇到的不同场景以及所需的算力资源,然后决定是采用本地部署还是线上资源。在本地部署时,要区分哪些任务需要依赖服务器,哪些可以由普通台式机完成。换句话说,我们应该先确定课程内容,然后再考虑与内容匹配的计算资源。
谢作如:的确如此,学有余力的学生去参加活动,和有条件的学校去买算力服务器,是一样的逻辑——教育不能做一刀切,要个性化。前面的6个AI实验是面向所有学生(初中生)设计的,对算力的要求不高,如卷积神经网络实验用的CIFAR10数据集的图片尺寸只有32×32,但是这种方式训练出来的模型几乎没办法用来解决生活中的真实问题。以我们常用的MobileNet算法来说,数据集的图片尺寸是224×224,对算力设备就有要求了。因此我们必须了解,虽然算力设备不是实施AI教育的刚需,但是学生一旦掌握了训练的流程和能力,很快就会对算力产生迫切的需求。关于算力的问题,后续将邀请相关专家展开讨论,敬请期待。
实施AI教育估计最大的困难在于算力,因为随着学生能力的提升,他们会不再满足于简单的模型训练,会尝试去收集更多的数据集,训练更复杂的模型来解决更多的问题。
学有余力的学生去参加活动,和有条件的学校去买算力服务器,是一样的逻辑——教育不能做一刀切,要个性化。
我和毛勇博士结识,算起来已经有十多年了。他用Arduino做了一款机器人,组织了一个比赛,并写了一本书。我参与了他的课程编写工作,受益匪浅,也结下了深厚的友谊。在开发XEdu系列工具的时候,我怕走错方向,就常常去请教他。去年他说要组织NOAI活动,我很支持,并且祝贺他回到了老本行——十多年后,一个AI博士终于可以开始做人工智能教育了。
至于郑子杰博士,我们之前一直是神交,真正见面是今年初,我特意去北京十一学校看他的学科教室,看AI教室的环境部署和算力服务器。记得在他开车送我的路上,我问了一个很尖锐的问题:为什么北大毕业后不去顶尖研究机构,却选择做一名中学教师?他说,我从小就有志向做一件很了不起的工作。看着我疑惑的表情,他又补充道:“我认为现在中小学的数学教育存在与时代脱节的问题,很严重。我研究AI教育,是希望能促进基础教育中数学学科的变革。”有这样的想法,真的很了不起。
我邀请毛勇和郑子杰博士做本期对话,他们欣然答应。我们都知道,这次的对话内容其实挺尖锐的,有期待,也有批评。但是批评不是目的,批评是为了更好地发展。在人类步入智能计算时代的过渡阶段,我们都有一种使命感:基础教育必须顺应AI的发展,我们培养出来的学生才能更好地引领未来。