人机协同的敏捷教育建模及实践应用
2021-08-23郑勤华郭利明
郑勤华 郭利明
摘要:将教育理论模型转为可操作的数据模型是智能技术支持教与学变革的关键。多场景、多维度的教育教学要素主体的可测度问题是破解教育建模问题的重心,其与目前人工智能技术的局限共同决定了人机协同是教育建模的必然之路。人机协同的教育建模是一个敏捷的教育建模流程,是充分整合领域专家智慧与机器智能优势以构建教育模型的过程,重点在于将教育建模所需要的多方主体力量进行归一化统整,形成合力。其流程大致可以分为梳理建模目标、确定教育目标类型、选取指标或特征提取、调节参数、训练与建模、数据科学验证、真实教育场景可用性验证7个阶段。然而,以敏捷教育建模理念为指导,进而输出教育模型服务的过程中,还需解决连接领域专家和技术专家知识的“中间件”问题。鉴于此种思路,人机增强智能支持下的敏捷教育建模平臺DMTS应运而生,旨在结合专家的领域知识、经验、理论和机器的数据、算法、算力优势,快速构建能真正理解教育场景的可解释教育模型,为微观个体学习、中观学校管理以及宏观区域教育治理提供科学且可操作的模型服务。实践表明,整合领域专家和机器学习的教育建模支撑技术体系,能够为教育工作者和技术工作者搭建教育建模的生产系统,从而为我国教育领域人工智能技术的深层次应用提供支持和借鉴。
关键词:人工智能;人机协同;教育建模;教育模型;DMTS
中图分类号:G434 文献标识码:A 文章编号:1009-5195(2021)04-0043-08 doi10.3969/j.issn.1009-5195.2021.04.005
基金项目:科技创新2030“新一代人工智能”重大项目“混合增强在线教育关键技术与系统研究”(2020AAA0108804);北京师范大学2020—2021学年博一学科交叉基金项目“多模态数据支持的在线学习情感投入建模与应用研究”(BNUXKJC2004)。
作者简介:郑勤华,博士,教授,博士生导师,北京师范大学远程教育研究中心(北京 100875);郭利明,博士研究生,北京师范大学远程教育研究中心(北京 100875)。
一、引言
随着我国经济和社会的持续快速发展,教育的变革与创新成为国家下一阶段发展的重中之重。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》把发展高质量教育纳入规划当中,提出要建设高质量教育体系(新华社,2021)。实际上,近年来一系列的政策文件都对高质量教育体系建设的多个维度进行了重要阐述,比如《深化新时代教育评价改革总体方案》提出“改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”,同时改革党委和政府、学校、教师、学生以及用人的评价(新华社,2020);《义务教育质量评价指南》提出义务教育质量评价包括县域、学校、学生三个层面,即县域义务教育质量评价、学校办学质量评价以及学生发展质量评价,三者紧紧围绕贯彻党的教育方针,以促进学生全面发展为目标,各有侧重、相互衔接、内在统一,构成完整的义务教育质量评价体系(教育部,2021)。显然,从国家颁布的重大政策文件中可以看出教育改革发展的方向,即当前我国教育改革的基本主线是促进公平和提高质量,未来教育改革的重心是建设高质量的教育体系(薛二勇等,2021)。而信息技术助力乃至部分引领该体系的建立,成为教育信息化领域的重大使命。2020年12月7日,国际人工智能与教育大会上,教育部部长陈宝生提出在应用新技术上着力,推动教育教学方法创新,探索运用新技术开展多元化、过程化评价(教育部,2020)。
建设高质量教育体系需要从质量观、质量标准、质量要素与质量指标等方面对教育教学的主体、过程以及结果要素进行清晰而准确的定位,并且这种定位要具有政策的指导性、理论的科学性、实践的可行性,方能真正支持高质量教育体系的构建。这是一项系统化的工程,需要研究者与实践者紧贴国家政策导向,选择适切教育理论,进而开展技术工程实践,最后输出教育服务,推动实现政策、理论、工程以及服务的一体化发展。这当中教育模型起着“中间桥梁”的重要作用,它将政策、理论与技术研发、实践服务进行衔接,使得概念、理论等能够在信息技术的支撑下转化成具体的可操作实践。
然而,虽然技术发展迅速,但由于目前人工智能的智能性还尚未达到理想的程度,再加上有些教育要素难以量化,甚至有些教育目标根本没有明确的评价规则(郑勤华等,2019)(如创新思维能力包含哪些维度?这些维度如何确定?各维度中包含哪些要素?),导致目前纯粹从数据科学和计算机科学的角度开展模型构建还存在一定困难。人工智能技术的教育应用,始于对学习者发展规律的认识,需要教育学、心理学、脑科学、系统科学等多学科协同探索,构建出清晰的评量、匹配、干预规则,进而整合领域知识与机器学习构建模型体系。因此,人机协同是教育模型构建的必由之路。基于此,本研究立足于智能时代背景,深度探讨人机如何协同以构建教育模型、人机协同构建的教育模型如何在实践中应用以及解决什么样的教育问题,期望能够为推动人工智能的深层次教育应用、促进我国人工智能教育的发展提供参考。
二、教育建模的内涵与外延
建模,即建立模型。智能时代背景下,教育领域所谈及的模型更多是指诸如数学模型、结构模型等在内的虚拟模型类型,是电子数据通过数字表现形式构成的形体及其他实效性表现(王薇等,2021)。从这个层面上讲,教育建模不是指将纷繁复杂的教育过程简化为一种教育模式,因为这种教育模式既无实践的解释力也无实践的指导力,不具有解释力和指导力的建模是失败的建模(杨开城等,2020)。本研究认为,教育建模是从教育学、心理学、学习科学的理论和规律出发,基于教育教学过程中产生的结构化和非结构化数据,利用各类算法综合解读教育要素主体的模式化和数据化的过程,是从教育场景出发的理论建模与数据建模相结合的建构过程。
理论模型是将教育问题的相关主体要素(如学生的学习动机、学习风格、学习投入、学习态度等,教师的教学投入、教学成效、教学策略,以及学校的教育资源、教育水平等教育教学相关变量)进行提炼,形成多维结构化的体系。理论模型构建一般依赖于理论演绎法和专家访谈法,自上而下挖掘不同维度的信息。基本的建构流程为:首先需要确定模型类型(如是层次分析模型还是规律探索模型等),然后通过理论演绎等方式确定模型下的不同维度,最后需要通过专家评估等方式为每个维度选择合适的指标,确保每一个维度之下的不同指标具有代表性和可操作性。因此,一个理论模型在结构上会包含多个维度,每个维度下会包含多个指标。比如本研究团队在开发学生综合评价参考模型(Student-Systematically Evaluation Reference Indicator,S-SERI)时便是从理论模型入手,通过理论演绎和专家访谈得到了包含投入度、完成度、主动性、调控度以及联通度等5个维度若干指标的理论模型(郑勤华等,2016a)。
数据模型是对理论模型进行操作化处理,为理论模型的指标找到可测量、可计算的数据指标,提炼出相应的数学结构,进而为应用模型进行量化评估提供参考和依据。数据模型构建与理论模型构建的出发点往往相反,一般自下而上,从数据出发,结合传统量化研究的系列方法,以及人工智能领域的机器学习和深度学习算法,以求获得一个解释相应教育要素的数学方程,比如利用贝叶斯算法对知识点掌握情况的探究(李景奇等,2018),利用认知网络分析对交互水平的分析(马志强等,2020),基于神经网络分析学生的情绪水平(Zhang et al.,2017;陈子健等,2019),利用序列分析对学生学习路径的探讨(Wu et al.,2015;胡丹妮等,2019),等等。
建模是从内部逻辑分析教育问题的最好方式。教育建模是对教育问题的真切表达,而且表达的是一种真相性事实,这种真相性事实必然与现实有着某种联系。因此,从根源上讲,教育模型是能够操作且能够用于计算的。然而教育建模具有典型的复杂系统特征,既有的教育理论和教育规律,往往从社会科学的角度建立概念框架对人的发展进行解读,据此构建的理论模型在信息化实践应用中难以落地;既有的数据模型,往往又缺失了系统性的教育理论支持。因此,教育建模不仅要关注理念化的流程与策略化的描述,同时更要关注可测量、可计算的数据指标,只有二者的结合才算是一个成功的建模。
在智能时代复杂多变的教育情境下,成功的教育建模离不开人机协同,毕竟个体无法通晓机器算法与掌握机器算力,机器也无法完全理解与明白领域知识。这正是教育建模概念在当下的外延所在。比如要对教师在线教学质量成效进行评价,就需要人机协同构建一个评价模型。首先,依据教育专家的知识和经验,构建教学的投入、促进、调控以及认可等一级维度(粗粒度指标),并初步构建能反映一级维度的二级行为指标(如投入度是从活跃性、持续性等方面对教师的在线教学投入程度进行评价)。然后,基于多源在线教学数据,教育专家对所获得的数据指标进行人工标注,形成教师评价经验数据池,机器采用主动学习方法对已标注的数据指标进行训练,得到新的数据指标并补充到教育专家构建的指标体系中,实现粗粒度指标向细粒度指标的拓展和细化;在此基础之上,机器采用神经网络算法初步建立细粒度指标与粗粒度高阶指标的映射关系,并对映射关系质量的判断设置置信度,保留高置信度的映射关系,由教育专家对低置信度的映射关系进行判断,决定是否保留该映射关系。最后,采用强化学习方法实现对细粒度指标的筛选与聚合,以此形成可解释、可操作的教师在线教学质量成效评价模型。
三、人机协同的教育建模流程
人机协同系统正在全面渗入人类的工作与生活,社会正快速地人机协同化(蔡连玉等,2021),教育领域也不例外。人工智能的逻辑性与教育利益相关者的灵活性相结合,共同实现为教育增知增智(祝智庭等,2021)。随着教育的不断发展,教育问题呈现多样化趋势,教育建模实质就是将多样化的教育问题依据实际教育场景转化为数据化的结构模型,从而能更有针对性地提供解决方案。因此,本研究认为,教育建模需要以真实的教育问题为切入点,通过借助专家智慧和机器智能,将不同类型的教育问题梳理成特定的描述、诊断、预测、干预的教育建模目标,进而开展人机协同的教育建模,具体建模流程如图1所示。人脑图标的环节是以人类智慧为核心的建模要素,机器图标的环节是以机器智能为重点的建模要素。可以看出,整个建模流程是人机协同完成对教育要素的理论和数据建模。所有建模的出发点都是围绕教育实际应用的场景。在真实的教育应用场景中,建模问题一般可以梳理为两类:一类是已经在教育学、心理学或者学习科学等领域有了比较明确的理论体系,并且在已有研究成果中形成了标准的测量目标,比如学习风格、学习路径、知识掌握水平等;另一类是尚未形成有扎实理论体系和公信力的测量目标,但又是新的发展时期教育特别关注且对未來发展十分重要的新型目标,比如核心素养体系、能力体系等。两类目标的建模方式有着明显的不同。
1.易测量目标的教育建模
有着清晰、明确、可量化标准的教育目标更容易建立机器规则,其所对应的教育教学环节是目前人工智能在教育应用中的主要场景,其中典型的代表是以发展学生知识习得水平的教育目标。基于该目标,有研究通过采集学习者学习行为海量过程数据,设计开发学习者学业预警系统(Arnold et al.,2012);也有研究通过采集学习者答题数据,并基于领域专家标注的学科知识图谱,判断其知识掌握程度,以此形成个性化的习题推荐系统等(Piech et al.,2015)。这类教育目标已经在教育教学领域建立了以分数、正确率、百分比等标准化测试成绩为量化标准的评价。
首先,在领域知识范畴,已经建立了对特定目标的多维度理论模型,教育专家首先要做的就是选取可测量目标各维度的数据指标集合,测量该目标的不同维度。这里的数据指标集合是在教育教学流程中生成的各类结构化和非结构化数据经过基本的测算后形成的指标池,比如将学生登录平台的数据换算成日均登录时长等原子指标,在此基础上,形成抽象为特定教育要素的基本数据指标体系(如将日均登录时长、视频访问次数、作业次数等聚合成学生日常学习投入指标等)。如果教育专家在具体建模时认为某个特定目标维度是学生的日常学习投入,则可以直接将该指标引入下一步建模。
其次,在特定维度计算已经明晰的前提下,依据具体的教育应用场景,教育专家可以调节该目标不同维度的指标权重。易测量教育目标维度指标权重设定的常用方法包括专家人工赋权的层次分析法与算法赋权的熵权法等。教育专家可以根据实际需要和数据体系的支撑能力,灵活调节权重,形成初步的计算模型。
最后,基于目标的海量测量数据和指标权重的确定,机器发挥算力、算法等作用对该可测量目标不断进行训练与建模,并通过建模之初预留的测试集数据,对该模型进行数据科学验证。若数据科学验证通过,则最终嵌入日常的教育应用中。教育专家通过在真实的教育情境中应用该模型以验证其可用性,进而针对教育问题提供相应的教育教学服务。若数据科学验证不通过,则返回参数调节,教育专家根据真实的教育情境调节目标不同维度的指标权重,机器再进行训练与建模,直至通过机器的数据科学验证为止。
2.难测度目标的教育建模
在教育实际应用场景中,还有一类建模目标目前没有清晰的可量化规则,例如元认知能力、自我管理能力、学习能力、创新能力等。这类目标以往需要通过开发问卷测试工具或者主观观测等方式进行测量,但这些问卷和观测指标还无法量化成机器所能理解的规则。因此,对于这类教育目标,如果要实现人工智能的自动化教育应用,就需要对原始要素体系中的测量指标进行量化操作。
首先,教育专家采用理论演绎、专家访谈等方法对难测度目标进行领域知识理论模型构建,包括该类目标的多级维度划分、可测量指标的数据等。这一阶段,由于教育目标难测度,获取指标因变量的值较为困难,因此往往采用无监督机器学习方法,对数据指标进行分析。要完成这种分析,需要先将专家知识通过某种方式传授给机器,再由机器完成教育专家所不能够完成的整合分析(郑勤华等,2016a)。比如分析学习者的活跃度这一指标可以找到在线时长、登录次数等特征数据进行表征。为充分发挥人机协同作用,可以先由教育专家为不同活跃水平的学习者打上标签,再由机器对各类活跃水平的学习者进行聚类等分析。
其次,经历过理论建模之后,通过教育特征提取和数据指标特征提取两种方式,教育专家可以再构建新知识算法模型。其中,教育特征提取是教育专家依据教育领域知识来人工选取能够反映该类目标不同维度的特征变量,指标特征提取是机器采用有监督机器学习对该类目标不同维度之下的相应数据指标特征进行提取。需要说明的是,进行特征变量选取的原因是不相关的变量会对模型训练产生干扰,而且有可能会使得训练出来的模型过拟合。另外在数据量越来越多的情况下,过多的变量会降低模型的训练和计算效率。
最后,基于测试数据,机器验证新知识算法模型。若通过验证,则嵌入日常教育应用进行可用性验证;若不通过验证,则教育专家依据具体的教育情境调节目标不同维度的指标权重,机器再进行训练与建模,直至通过机器的数据科学验证为止。
总体来看,围绕教育问题,梳理教育建模目标,进而开展人机协同的教育建模,有以下三点值得注意:
第一,关于可测量教育目标指标集合的选取。这里涉及指标计算的方式,具体步骤为:(1)基于获取的教育大数据(包含教、学、管、评、测等线上线下的数据),教育专家对反映该测量目标的数据进行人工标注,形成人工标注的数据集;(2)采用有监督的机器学习方法(比如人工神经网络)来获得指标因变量的值;(3)基于有监督的机器学习进行聚类等分析后,教育专家梳理汇聚成原子指标池,用于存放最初始的数据指标;(4)结合可测量目标的不同维度需要,从原子指标池中调用数据指标,并对指标进行计算(如对两个单一指标进行计算转化形成复合指标),进而形成数据指标集合。
第二,关于难测度教育目标指标特征提取。先由领域专家选择该难测度目标的人工标注数据集,再经有监督的机器学习进行分析,进而梳理生成原子指标池,再根据需要对指标进行计算,最后为机器的指标特征提取服务。
第三,关于新知识算法模型生成。在训练与建模阶段,当数据结构较为复杂的时候,机器采用深度学习算法来自动识别特征变量,从大规模未标注的数据集中学习数据本质特征(郑勤华等,2016b),教育专家进而可以构建新知识算法模型。这一阶段,经过深度学习,数据从无序变成有序,从无标注变成有标注,最终也能服务于数据指标计算,为教育建模目标的指标集选取和指标特征提取奠定基础。另外,新知识算法生成模型也需要经数据科学验证方可嵌入日常的教育应用中,否则就要重新依据具体的教育情境调整目标不同维度的指标权重,进而进行模型训练与建模。
整体而言,人机协同的教育建模是一个敏捷化的教育建模流程,大致可以分为梳理建模目标、确定教育目标类型、选取指标或特征提取、调节参数、训练与建模、数据科学验证、真实教育场景可用性验证7个阶段。敏捷教育建模是充分整合领域专家智慧與机器智能优势以构建教育模型的过程,重点在于将教育建模所需要的多方主体力量进行归一化统整,形成合力,突破传统教育建模主体力量单一化(如数据工程师、算法工程师)的局限,解决传统教育建模成本高、难度大、模型解释力度不足等现实问题。相对于传统依托单一化主体力量对教育进行建模的方式,敏捷教育建模应对真实教育场景的解释性较强,并且具有成本低、难度较低、易操作且可操作等典型特征。
然而,以敏捷教育建模理念为指导进而输出教育模型服务的过程中还需解决一个关键问题,即通过什么样的载体来连接在敏捷教育建模过程中发挥作用的教育专家与技术专家。为了让二者优势互补、相互促进、形成整体,需要有一个“中间件”来连接二者,并沉淀二者的领域知识,让不懂技术或不懂教育的人依托这个“中间件”都能够构建基于真实教育场景的可解释性模型。
四、敏捷教育建模实践应用
教育是一个非常复杂的系统,完全依靠机器解决教育实践问题目前还只是理想状态。但是,依托机器的数据、算力和算法来延伸人们的认知、提升人们的能力、增强人们的智慧已经成为了一种共识,这能帮助人们在教育场景更好地理解教育本身,进而更好地为教育问题提供解决方案。通过借鉴此种思路,并完全融合上述人机协同的教育建模流程,本研究团队设计研发了人机增强智能支持下的敏捷教育建模平台,并针对真实的小范围教育场景开展了实践。
1.敏捷教育建模平台——DMTS
为了解决教育目标可测量、难测度两类教育场景的教育建模问题,我们充分结合领域专家知识、经验、理论和机器的数据、算法、算力优势,研发了人机增强智能支持下的敏捷教育建模平台——DMTS。其中D代表数据(Data),表示汇聚多源、多维、多类教育大数据;M代表模型(Model),表示支持人机增强智能的半自动化快速建模;T代表任务(Task),表示教育问题场景导向的任务式建模流程;S代表服务(Service),表示为教育相关利益者提供全方位、系统化服务。DMTS平台通过建立协同机制,充分发挥领域专家与机器的最大合力作用,在建模的不同阶段引入不同领域专家,使得教育专家与技术专家之间的知识能够连接,实现敏捷化教育建模。
DMTS平台支持以模型构建为核心业务的适应性学习、科学决策、精准管理、区域教育治理,全方位、系统化地依据真实教育问题有效构建教育模型,为教育大数据应用提供支撑。并且,作为一种敏捷教育建模平台,DMTS在教育大数据生态体系中处于中间层的位置,下层连接大数据平台,上层连接教育大数据应用系统,输送专业化的教育服务。具体而言,DMTS依托底层大数据平台的数据进行模型构建,通过人机协同的教育建模流程构建出更理解教育场景的专业化教育模型,进而生成评价报告,为微观个体发展层面、中观学校教育管理层面以及宏观区域教育治理层面面向教育问题提供专业化的解决方案,从而满足差异化的教育需求(王怀波等,2020)。
需要强调的是,基于DMTS平台,不懂技术的领域专家也能够构建出比较专业化的教育模型,因为数据的采集与处理等工作已经由底层大数据平台完成。比如一位课程与教学论的专家经过多年在教学一线的实践,已经形成了一整套成熟的理论、规律以及方法,但是由于不懂数据科学等领域的知识使得这些理论、规律以及方法难以转化成可量化的数据,进而更为科学、精准、高效地服务学习者。借助DMTS平台,课程与教学论专家只需选择预先经过科学设计的理论模型,导入能够测量指标的数据,生成算法模型,经过数据科学验证之后就能够形成具有可操作性的课程评估模型。
2.实践案例
基于国内第一门联通主义慕课课程“互联网+教育:理论与实践的对话”,本研究依托DMTS平台对知识主题、学习状态分别进行了建模分析,为课程的优化与改善提供了较为科学的依据。
(1)利用非结构化数据形成对知识主题的建模
联通主义慕课课程与传统的慕课课程有所不同,它是以群体智能的生存和演化为导向,没有一个完全特定的教学目标与教学评价方案,更多强调的是群体在这种社区中的交互,以及在交互的基础之上群体形成的新知识和知识的演化。因此,知识如何形成以及演化就变得非常关键。基于这样一个场景,本研究在课程第四期中作了主题知识的建模分析,即如何发现课程中学习者通过交流讨论形成的知识主题。研究通过采集课程第四期中的所有文本数据,整合联通主义专家领域知识和主题挖掘算法,以人机交互增强的方式训练算法,快速构建主题分析模型,并通过不断迭代发现知识主题,具体的人机分工如图2所示。
具体建模流程如下:第一,将“如何发现课程中学习者通过交流讨论形成的知识主题?”这一教育问题梳理成建模目标——知识主题聚类。第二,选择课程第四期的所有文本数据导入到建模平台中,建模平台的底层大数据平台采用无监督的机器学习对所有的文本数据进行清洗,形成原始数据集。第三,根据课程中不同主题知识情境选择专家词库和停用词库,并导入建模平台中,便于机器进行切词分析。第四,机器经过一轮切词分析生成新知识,研究者根据知识内容修正专家词库和停用詞库,并导入建模平台进行新一轮切词分析(本质上是调参的过程)。第五,依据联通主义的教育情境,选择需要聚类的主题类型,再由建模平台发挥其在数据和算法方面的优势来进行知识主题学习与训练,最后生成知识主题模型。通过上述步骤,基于知识主题的建模完成,研究者就可以发现平台上的学习者都在讨论哪些问题与内容,以及讨论的问题中包含哪些知识、新生成了什么知识等。
(2)利用综合指标形成对特定学习状态的建模
开放的在线学习空间中,如何实现对学习者的有效诊断、监测与评价,进而做出干预,这是“互联网+教育:理论与实践的对话”这门联通主义慕课课程改进过程中不断思考的问题。学习者的过程性评价通过分析建模达成,这是精准化学习评价过程中至关重要的一步(黄涛等,2021)。基于此,本研究在课程第五期中对在线学习者的学习状态进行了建模分析。研究通过采集该期课程平台上所有学习者的学习行为数据,依托DMTS平台,构建学习者类型评价模型,如图3(左图)所示。在不同的维度当中,研究通过统一处理学习者的结构化与非结构化数据,并结合领域知识,生成一个每日更新的可视化简单报告,这样就可以看出学习者的类型,最终为其推荐相应的资源等服务。
图3 基于DMTS的学习者类型诊断与监测
具体建模流程如下:第一,将教育问题梳理成建模目标,即将“如何对在线学习环境下学习者的学习过程进行监测与诊断?”这一教育问题梳理成“学习者类型诊断与监测”这一建模目标。第二,通过查询相关文献资料,并咨询领域专家,从理论层面构建了囊括分享型、创新型、反思型以及互动型在内的学习者类型评价模型。在这一过程当中,研究通过设定特定计算公式(每种学习者类型都有相应的计算公式)让机器能够采用有监督机器学习算法对课程平台上已标注的相关数据或者行为进行分析,进而形成数据指标集合。第三,通过选取表征不同学习者类型维度的数据指标,基于设定的计算公式,形成初步的计算模型。最后,将模型导入研发的建模平台进行教育应用可行性验证。建模平台利用底层大数据平台采集“互联网+教育:理论与实践的对话”第五期中学习者的所有学习行为数据(如发表的博客数、资源数、案例数、博客评论数、博客点赞数等),按照计算公式(如分享型=高质量资源和案例×次数+高质量评论×次数+高质量回帖×次数①)对相应的学习行为数据进行分析,进而得出相应学习者类型的得分。如图3(左图)所示,通过平台的建模分析,这位学习者在互动维度上得分最高,因此我们可以认为其属于互动型联通主义学习者。进一步地,结合学习者类型诊断,建模平台基于设定的推荐机制还可以为这位学习者提供比较个性化的学习建议,如图3(右图)所示。
通过上述两个案例的实践表明,人工智能的赋能作用为人们理解真实且复杂教育场景中的问题提供了新的视角,一定程度上实现了人们认知的外包以及能力的提升,有助于学习者提供更好的教育服务。人机协同作为智能时代教育未来发展的必然途径(孙众等,2020),目前只有把领域知识和机器智能有机结合起来,才能够真正地实现在不同场景下的因材施教,进而满足学习者多样且个性化的学习需求。这才是人工智能在教育应用中的最大价值。
五、结语
由于教育的复杂性、动态性、全域性以及不确定性,单纯通过人工智能等技术去解决与人的发展相关的教育建模问题,目前来看还有较大的困难,有必要在教育建模过程中更多地引入领域知识,实现人机协同。机器的数据、算法和算力将成为强大的创新驱动力,人类的行为、认知和能力将被增强(沈阳等,2020),使得越来越多真实且复杂教育场景下的教育问题都将能够形成可解释、可操作性的教育模型。这一过程中,教育建模离不开中间工具的作用以打破领域专家和技术专家“两张皮”现象的困境。领域专家对教育问题有较好理解但在计算机科学和数据科学应用上存在困难,而技术专家能在工具层面提供有力支持但对于教育问题的把握不足。这就需要为二者搭建对话和实操的工具桥梁。本研究正是在这种思路的指导下,立足智能时代背景,對人机协同教育建模流程进行了探讨,提出用“中间件”来连接教育建模过程中的领域专家和技术专家之间的知识。
随着对实践需求的回应,教育建模的重点不仅要关照教育理论和数据科学问题,同时也要更加重视实践的迭代应用。只有经过“理论—技术—应用—理论”的多轮迭代,持续优化教育建模过程,才能为教育现实问题提供更好的教育模型服务。然而既有教育建模的准确性与有效性,我们常常用算法的准确率、召回率等技术指标来表征。但在真实的教育场景中,尤其是在没有明晰的监督变量的情况下(如表征能力、素养等教育目标的测量准确性时),这些技术指标还远远不够。因此,需要在“建模—应用”的不断迭代过程中,优化教育模型,增强其可解释性,为实践提供真正有价值的技术支持。
注释:
① 高质量资源和案例指资源或案例被cMOOC周报收录,赋值10分;高质量评论指评论字数≥20字且不是水评论,赋值5分;高质量回帖指回帖字数≥20字且不是水帖,赋值5分。
参考文献:
[1]蔡连玉,刘家玲,周跃良(2021).人机协同化与学生发展核心素养——基于社会智能三维模型的分析[J].开放教育研究,27(1):24-31.
[2]陈子健,朱晓亮(2019).基于面部表情的学习者情绪自动识别研究——适切性、现状、现存问题和提升路径[J].远程教育杂志,37(4):64-72.
[3]胡丹妮,章梦瑶,郑勤华(2019).基于滞后序列分析法的在线学习者活动路径可视化分析[J].电化教育研究,40(5):55-63.
[4]黄涛,赵媛,耿晶等(2021).数据驱动的精准化学习评价机制与方法[J].现代远程教育研究,33(1):3-12.
[5]教育部(2020).承担教育使命 共同谋划教育未来 陈宝生出席国际人工智能与教育会议[EB/OL].[2021-02-17].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/moe_1485/202012/t20201207_503933.html.
[6]教育部(2021).教育部等六部门关于印发《义务教育质量评价指南》的通知[EB/OL].[2021-04-06].http://www.moe.gov.cn/srcsite/A06/s3321/202103/t20210317_520238.html.
[7]李景奇,卞艺杰,方征(2018).基于BKT模型的网络教学跟踪评价研究[J].现代远程教育研究,(5):104-112.
[8]马志强,管秀(2020).面向多维关联的社会认知网络分析——协作学习交互研究的新进展[J].远程教育杂志,38(6):96-103.
[9]沈阳,田浩,黄云平(2020).智能增强时代推进新一轮学习革命——访中国科学院院士吴朝晖教授[J].电化教育研究,41(8):5-10.
[10]孙众,吕恺悦,骆力明等(2020).基于人工智能的课堂教学分析[J].中国电化教育,(10):15-23.
[11]王怀波,李冀红,孙洪涛等(2020).基于模型的教育大数据应用框架设计[J].现代教育技术,30(6):5-12.
[12]王薇,张鑫(2021).学校评价结果解释模型的建构[J].中国考试,(1):89-94.
[13]新华网(2020).中共中央 国务院印发《深化新时代教育评价改革总体方案》[EB/OL]. [2021-04-06].http://www.xinhuanet.com/2020-10/13/c_1126601551.htm.
[14]新华社(2021).中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要[EB/OL].[2021-04-06].http://www.xinhuanet.com/2021-03/13/c_1127205564.htm.
[15]薛二勇,李健(2021).新时代教育规划的形势、挑战与任务[J].中国教育学刊,(3):19-24.
[16]杨开城,陈洁(2020).论教育作为一种工程性实践[J].现代远程教育研究,32(6):3-8,51.
[17]郑勤华,陈耀华,孙洪涛等(2016a).基于学习分析的在线学习测评建模与应用——学习者综合评价参考模型研究[J].电化教育研究,37(9):33-40.
[18]郑勤华,孙洪涛,陈耀华等(2016b).基于学习分析的在线学习测评建模与应用——综合建模方法研究[J].电化教育研究,37(12):40-45.
[19]鄭勤华,熊潞颖,胡丹妮(2019).任重道远:人工智能教育应用的困境与突破[J].开放教育研究,25(4):10-17.
[20]祝智庭,韩中美,黄昌勤(2021).教育人工智能(eAI):人本人工智能的新范式[J].电化教育研究,42(1):5-15.
[21]Arnold, K. E., & Pistilli, M. D. (2012). Course Signals at Purdue: Using Learning Analytics to Increase Student Success[C]// Proceedings of the 2nd International Conference on Learning Analytics and Knowledge:267-270.
[22]Piech, C., Spencer, J., & Huang, J. et al. (2015). Deep Knowledge Tracing[J]. Computer Science, 3(3):19-23.
[23]Wu, S. Y., & Hou, H. T. (2015). How Cognitive Styles Affect the Learning Behaviors of Online Problem-Solving Based Discussion Activity: A Lag Sequential Analysis[J]. Journal of Educational Computing Research, 52(2):277-298.
[24]Zhang, K., Huang, Y., & Du, Y. et al. (2017). Facial Expression Recognition Based on Deep Evolutional Spatial-Temporal Networks[J]. IEEE Transactions on Image Processing, 26(9):4193-4203.
收稿日期 2021-04-26责任编辑 汪燕
Agile Educational Modeling and Practical Application Supported by Human-Machine Collaboration
ZHENG Qinhua, GUO Liming
Abstract: The shift from theoretical models to operable data models is the key for intelligent technology to support the reform of teaching and learning. The measurability of multi-scenario and multi-dimensional education and teaching elements is the focus of solving the problem of educational modeling. And together with the current limitations of artificial intelligence technologies, it determines that human-machine collaboration is the inevitable way of educational modeling. Human-machine collaborative educational modeling is an agile educational modeling process, which is a process of fully integrating the domain experts wisdom and the advantages of machine intelligence to construct an educational model. Its key point is to normalize and integrate the multi-agent forces required for educational modeling to form a joint force. The process of human-machine collaborative educational modeling can be roughly divided into seven stages: sorting out modeling goals, determining the types of educational goals, selecting indicators or feature extraction, adjusting parameters, training and modeling, scientific validation of data, and usability validation of real educational scenarios. However, in the process of exporting educational model services under the guidance of agile educational modeling concepts, it is necessary to solve the “middleware” problem that connects domain experts and technical experts. Given this idea, the agile educational modeling platform DMTS supported by human-machine enhanced intelligence came into being. It aims to combine experts domain knowledge, experience, theory and data, algorithms and arithmetic advantages of machines to quickly build interpretable education models that truly understand educational scenarios, which provides scientific and operational modeling services for micro-individual learning, meso-school management and macro-regional education governance. The practice has shown that the educational modeling support technology system that combines domain experts and machine learning can build a production system of educational modeling for educators and technical workers, thereby providing support and reference for the in-depth application of artificial intelligence technologies in the educational field in our country.
Keywords: Artificial Intelligence; Human-Machine Collaboration; Educational Modeling; Educational Models; DMTS