智能课堂分析的多维指标体系构建:面向开放教育OMO 智慧教学环境的研究*
2023-02-14通讯作者顾小清
李 玲 肖 君[通讯作者] 顾小清
(1.上海开放大学 上海开放远程教育工程技术研究中心,上海 200433;2.华东师范大学 教育信息技术学系,上海 200062)
一、引言
开放教育线上融合线下的 (Online-Merge-Offline,OMO)智慧教学环境是面向远程和面授学习者的同步教学环境,通过对教学法、工具和空间维度下众多元素的有机整合,支撑课堂教学的转型与变革。在教学实施过程中,多种应用程序、移动终端和情境感知设备产生了大量多来源、 多层次、 多模态的数据。基于这些数据开展课堂分析,可提炼出教师的教学特征,为其反思与优化教学提供参考依据。
课堂分析是对教师教学行为的观察、 分析与评价。随着图像与语音智能识别技术的日趋成熟,国内外学者展开了对智能课堂分析的探索。然而,现有的分析系统大多聚焦线下课堂的教学活动, 且专注于单一维度指标测量技术的突破。 目前尚未有研究系统地开展对线上和线下教学数据的同步挖掘,因此,难以全面刻画出开放教育复杂多元场景下的教学特征。本研究通过整合线上线下教学空间的数据资源,构建了一套适用于开放教育OMO 智慧教学环境的多维课堂分析数据指标体系。
本研究在梳理智能课堂分析的研究现状, 论述构建适用于开放教育课堂分析数据指标体系意义的基础上,详细阐述了指标体系的构建,包括各指标的理论基础、作用、数据来源和计算方法,并在上海开放大学智慧学习中心开展实证研究, 以验证在实验课堂和实际课堂中各指标算法的准确率, 并阐释了多维数据指标在开展教学分析中的优势与价值。 本研究提出的指标体系为智能课堂分析系统的建设,提供了理论依据和设计方案, 对开放教育数据驱动的课堂转型具有重要的实践探索意义。
二、研究现状综述
课堂分析是一个系统地观察、记录、评价教师教学行为的过程,用来提炼教学特征、衡量教学水平。自上世纪60 年代兴起至今,该领域已推出了数百种开展课堂分析的方法(Maxman,2022),其中,既包括弗兰德斯言语互动分析 (Flanders,1966)、S-T 师生行为分析等经典的课堂分析方法, 也包括近些年推出的评估STEM 课堂中积极学习行为的观察量规(Wenderoth,et al.,2014)、评估信息技术在教学中融合的观察方案(Parker,et al.,2019)等聚焦前沿教学趋势的课堂分析方法。
尽管关注点各有侧重, 这些方法的作用机理均有针对性地对师生的某类言语或行为的发生序列、时长、频次进行统计,之后将量化结果反馈给教师,帮助其清晰地了解自己的教学特征, 作为反思和优化课堂设计的依据。已有研究表明,教学数据可以激发教师多层次、多角度的教学反思,并对其改变教学行为产生积极的影响 (Ahuja,et al.,2019;Li,et al.,2022;McFeetors,2008)。 然而,传统的课堂分析方法依赖人工对教学事件的编码和统计, 耗时费力,因此,难以得到规模化、常态化的开展(卢国庆,等,2021;孙众,等,2020)。
随着图像和语音智能识别技术的日趋成熟,国内外学者开始探索高效率、 智能化和规模化的课堂教学分析。 该研究方向通过智能算法自动提取课堂中师生的言语、行为及表情等特征,再通过数据建模来模拟专家视角对所提取的特征进行评估。 已有研究在教学特征提取中采用了不同的数据指标和测量技术。 学者周鹏霄等(2018)通过人脸检测技术实现了教学视频中S-T 行为的智能识别(如,教师解说、教师板书、学生发言、学生记笔记等),并通过计算得出视频的教学模式类型,包括“练习型”“讲授型”“对话型”和“混合型”;学者王冬青等(2020)和孙众等(2020)通过教学媒体,分别使用数据挖掘和自然语言处理技术来自动识别教学事件(如课堂讲授、课堂测验、小组协作、提升反思等),再通过雅各布森等(Jacobson,et al.,2015) 的 教 学 结 构 序 列 框 架(Sequencing of Pedagogical Structure)判断出课堂属于以教师讲授为主的“高结构化教学”还是以学生探究为主的“低结构化教学”;普列托等(Prieto,et al.,2018)通过综合分析四种课堂教学多模态数据, 即教师眼动追踪、教师行动轨迹、音频和视频数据,提取出课堂活动编排图谱,即在不同交互层面上(全班、小组和个体层面)不同种教学活动发生的时序(包括解释说明、 监督、 答疑解惑、 提问和其他); 萨奎布等(Saquib,et al.,2018)通过可穿戴设备追踪教师在教室空间中的行动轨迹, 并通过可视化反映出教师访问了教室的哪些部分, 以及和哪几位学生互动的时间更长。
除上述对单一维度指标的测量外, 有少数研究开始对多维指标进行探索。 卡内基梅隆大学推出了一套集成多种数据指标和测量技术的系统EduSense,包括学习者的表情、姿态、专注度以及师生的行动轨迹、发言和沉默时间等,是目前已有探索中唯一一套完整可运行的多维智能课堂分析原型系统(Ahuja,et al.,2019)。 国内学者杨晓哲(2021)提出了“高品质课堂分析指标”,通过运用“词频统计”“课堂活动时间分布”“S-T 师生行为分析”等方法将多模态数据整合入“课堂效率”“课堂公平”“课堂民主” 三个维度中。
近年来,智慧教室在开放教育中的应用形成了线上融合线下的智慧课堂环境,通过教学法、工具和空间资源的有机整合支撑,开展面向远程和面授学习者的同步教学。然而,上述文献表明,现有的智能课堂分析系统难以对该环境下的教学进行全面分析,具体表现在两个方面:第一,大多数课堂分析系统针对单一维度指标,相应的测量手段分散在各个系统中,测量结果仅能反映出课堂教学某一方面的特征,如,师生言语互动、教学结构序列、行动轨迹等,难以反映出OMO 智慧课堂教学特征的全貌;第二,有少数系统针对多维指标,但通常聚焦线下课堂,通过物理空间中的传感设备获取数据。目前,尚未有课堂分析系统充分挖掘线上教学空间产生的大量数据。因此,本研究旨在针对开放教育OMO 智慧教学环境,构建多维课堂分析指标体系,通过整合多渠道、多模态的数据来汇聚出复杂多元场景下教学特征的全貌。
三、OMO 智慧课堂教学分析数据指标体系的构建
(一)OMO 智慧教学环境的特点
OMO 教学模式是面向线上和线下学习者的同步混合教学模式,通过对教学法、空间与技术的有机整合,无缝衔接线上线下两个空间的教学。 OMO 教学模式的一个典型应用场景是开放教育面向远程和面授学习者的同步教学。近年来,开放教育中智慧教室的大力建设,为OMO 教学模式的落地提供了技术支撑。 一方面,智慧教室中5G、视频会议、全息直播等技术有效提升了远程学习者的临场感受; 另一方面,智慧教室中线上线下的各种技术与资源(如,互动教学平台、移动终端、投屏等)让处于实体课堂外的学习者可以和面授课学习者共同参与课堂学习、讨论、合作等。
在全球新冠疫情影响下,OMO 教学模式在开放教育以外的教学场景中也得到广泛应用, 已成为全球教学的新趋势。 例如,由于各国留学生无法赴境外学习, 教师在开展线下教学的同时将教学内容向国际学生直播, 并通过在线交互工具开展远程互动(Durrani,2021);在一些国家的中小学,为降低学生密度,减少传播风险,学校仅允许少量学生轮流进入校园学习, 其他学生在家通过各种设备与系统参与线上教学(Means,2021)。 可见,OMO 智慧教学环境已常态化地融入多种教学场景中, 教师们正在积极探索开展线上线下同步教学的有效途径。因此,对该环境下的课堂分析研究具有广泛的应用价值。
与纯线下或纯线上教学相比,OMO 智慧教学环境具有以下特点:(1)在教学上,可通过教学法与工具的有机结合打造多类型线上线下同步学习活动,如,探究型、反思型、创造型学习等;(2)在工具上,可集成多种互动教学工具,如,多屏互动、随堂测、讨论、抢答、分组、资源共享等互动工具,支持线上、线下课堂的实时互动;(3)在空间上,可通过教学平台的分组功能完成线上学习小组的划分, 并通过教室中可移动桌椅的灵活组合完成线下学习空间的布局。综上,针对该环境的课堂分析指标体系需要从多个维度捕捉教师对众多教学元素的设计与实施,进而刻画出课堂教学特征的全貌。
(二)指标体系的总体框架
课堂分析通常从两个视角开展: 一是从教师角度来评估教学方法以及教学实施过程的合理性,如,教学活动类型,师生交互、工具与资源的使用(Parker,et al.,2019;Smith,et al.,2009;Topçu,et al.,2018;Wenderoth, et al.,2014);二是从学生角度,通过分析参与度、 专注度等数据来评估教学成效(Alford,et al.,2016;Zhao,et al.,2020)。 本研究综合以上视角,根据开放教育OMO 智慧教学环境的特点,从教学设计、 教学实施和教学效果这三个贯穿教学过程的重要环节构建指标体系,包括7 个指标(见图1)。 其中, 教学设计维度体现了教师对教学活动的制定与编排, 包括教学活动类型及其发生的社交层面和时序;教学实施维度体现了教学过程中的课堂特征,包括师生言语比例及行动轨迹; 教学效果维度通过学习者专注度和测试成绩来反映教学的有效性。
图1 OMO 智慧课堂教学分析多维数据指标体系
上述三个维度下的指标之间两两相关、 相互影响。 具体来说,在设计与行为之间,教学设计指导了教学实施, 对教学实施的测量又可反映出教师的设计思维;在行为与效果之间,教学实施直接影响了教学效果的优劣,对效果的反馈又可以帮助教师及时调整教学实施;在效果与设计之间,有效的设计是教学效果的保障,教学效果又为教师反思、优化教学设计提供了依据。 通过对以上三个维度的有机整合,本指标体系旨在帮助教师从不同角度审视各教学元素之间的内在关联及合理性,从而系统地调整优化教学。
本研究所构建的多维指标体系具有三个特色:第一, 覆盖全过程。 指标体系涵盖了教学的重要环节,即规划、实施与结果,为教师提供了一个全景的视角来审视各教学元素之间的内在关联。第二,提升解释力。 指标体系弥补了单一指标仅能提供孤立数值的局限,通过指标间的相互诠释与印证,有效提升分析结果的解释力。 第三,细粒度识别。 指标体系通过对多模态数据的融合, 可识别出更加细粒度的教学活动类型,进而提供更有价值的反馈。
(三)指标体系的具体构成
各维度下指标的理论依据、作用、数据来源和计算方法,如表1 所示。需要指出的是,开放教育智慧教学环境构成了线上、线下有机融合的学习空间,其中,线上学习者通过5G 直播观看线下教学,线下学习者利用线上学习平台的交互工具(如,答题器、协同写作等)开展多样的学习活动。因此,本指标体系不是将线上、 线下看作相互割裂的学习空间并开展独立分析,而是将融合空间中的教学作为一个整体,以每个指标为单位,通过有机聚合线上、线下数据开展分析。
表1 多维数据指标的数据来源和计算方法
1.教学设计维度
(1)教学模式时长比例。 结合学习科学理论、开放教育教学活动的特点以及课题组已有的研究积累(Laurillard,2012;Li,et al.,2022), 本研究整理出四大类教学模式,包括11 种具体的教学活动类型。 设立这一指标的目的是通过对教学活动类型细粒度的总结与提炼, 启发教师根据不同的教学目标采用灵活多样的教学模式。 基于对教师教学平台使用习惯的观察,本研究为11 种教学活动类型关联了不同的交互工具, 可通过比对某交互工具的启用时间与师生发言的重叠部分来识别和计算出每一类教学活动的时长。 具体的教学模式和类型如下:
一是“吸收型”教学模式。 通过引导学习者参与完成教师规定的内容材料和练习任务来激发学习,包括在传统课堂中常见的 “讲授”“练习”“测试” 三种教学活动。系统通过互动教学平台“文本课件”“音视频课件”“教师端桌面共享”和“浏览器”开启的起止时间点来识别和计算 “讲授” 的累计时长; 通过“小黑板”和“答题器”开启的起止时间来分别识别和计算“练习”和“测试”的时长。
二是“探究型”教学模式。引导学习者通过探索和发现来获取知识(Bruner,1961),包括“信息检索”和“讨论”两种教学活动。 可通过互动教学平台上“小组讨论”和小组讨论环境下“浏览器” 开启的起止时间点来分别识别并计算“讨论”和“信息检索”的时长。
三是“反思型”教学模式。 引导学生通过检验和整理自己的思维过程和思维结果来激发其对学习内容更深层次的理解(Boyd,et al.,1983),包括三种可以有效鼓励反思的教学活动:“提供反馈”“修改答案/重新提交”和“投票”。 基于研究者观察到的教学活动规律, 可通过比对教师发言与学生利用一系列工具展示学习成果的重叠部分来识别和计算“提供反馈”的时长, 包括开启“小黑板”“小组讨论”“学生麦克风”“答题器”“分享屏幕”;通过“答题器”重新提交答案的起止时间点来识别和计算“修改答案/重新提交”的时长;通过“答题器”提交投票的起止时间来识别“投票”的时长。
四是“创造型” 教学模式。 基于建构主义学习理论, 通过引导学习者积极创造有形或无形学习制品(如,作文、模型、软件、报告等)来激发学习,包括组织学生“创作”“报告”和“展示”三类教学活动(Blumenfeld,et al.,1991;Tindall,2012)。系统通过小组讨论中学习者共同使用“板书”的起止时间点来识别和计算“创作” 的时长;通过线上学生端麦克风和线下教室中的拾音器收集的学生发言来识别和计算 “报告”的时长;通过比对学生发言与其利用一系列工具展示学习成果的重叠部分来识别和计算“展示”的时长,包括开启“小黑板”和“分享屏幕”。
(2)教学活动编排。 编排(Orchestration)是指教师如何在多约束的环境中实时管理多层面的活动,通常包括全班、 小组和个人三个层面(Dillenbourg,2013)。 由于不同的环境设定,每一交互层面上的活动可引发对知识不同程度的加工 (Hackling,et al.,2017)。 全班学习通常适用于讲授新知识,帮助学生对所介绍的概念和理论建立表层认识; 小组学习通常用于以材料为中心的动手活动和小组讨论任务,通过对话、辩论、问答、协作等过程使知识内化;个人学习通常用于练习、 评估或反思类的任务使知识得以巩固和沉淀(Hackling,et al.,2017)。在讲授式课堂中,新知识停留在教师面向全班层面的讲解,没有机会下沉到小组或个人层面的学习活动中而内化为学习者的素养与能力。 通过全景呈现出课堂教学中每个社交层面上开展的活动及时序, 这一指标旨在启发教师结合教学目标来审视教学活动编排的合理性。其计算方法为,对上一指标“教学模式时长比例”所定义的各教学活动类型进行更加细粒度的交互层面的标注,之后,根据时间戳识别并计算出每一种教学活动所发生的层面和时序。
2.教学实施维度
(1)师生发言时长比例。 研究显示,很多有效的课堂活动都是与学生发言相结合的,如,提问、讨论(Smith,et al.,2009)、 报 告 (Joughin,2007)、 辩 论(Zare,et al.,2013)等。 这些学习活动通过语言来推动学生的探索、反思和创造,已被证明在培养学生高阶思维能力上远胜于听讲和记笔记 (Ahuja,et al.,2019)。 然而,以教师为绝对主导的讲授式课堂在一线教学中依然广泛存在(杨冬梅,2019;田晓,2021;谢克弘,2019)。通过可视化师生的累计发言时长,这一指标旨在提醒教师避免“一言堂”,并通过设计多样的课堂活动来鼓励学生发言。其计算方法为,根据声学特征从课堂录音中识别出教师和学习者的发言,并分别计算总时长。
(2)教师行动轨迹。 已有研究发现,在教室空间中, 教师与物体和学生的距离关系体现了他们的教学策略和师生互动(Martinez-Maldonado,et al.,2020),并深刻地影响了学生的专注度与参与度(Seals,et al.,1975)。 具体来说,在一对多的讲授式课堂中,教师的行动范围一般局限于教室前部;而在开展小组学习的课堂中,教师往往会移动到教室的各个部分与每个小组交流、 答疑, 并开展近距离的教学(Martinez-Maldonado,et al.,2020)。 另外,学生更容易在教师走近他们时提问,这是由于有些学生会因在全班面前大声与教师交流而焦虑,更愿意在教师经过身边时悄悄分享他们的困惑 (Hargis,et al.,2017)。可视化教师的行动轨迹的意义在于启发教师通过多样化行动范围和行动频率来提升学生的参与度和学习效果。 这一指标的计算方法为,通过人脸跟踪技术高频率追踪教师在教室空间中的定位,形成行动轨迹。
(3)学习者行动轨迹。智慧教室可通过轻松挪动可移动桌椅来调整物理空间布局, 进而支持不同学习活动的开展,如,小组协作、辩论等。 因此,学习者在教室中的行动轨迹能够在一定程度上反映出课堂活动的类型和丰富程度。 已有研究证明,通过调整教学空间布局并辅以各种技术设备,可以使更加多样的学习活动得以开展,并使学生解决问题的能力、态度和通过率得到明显提升(Beichner,et al.,2007)。 通过可视化学生的行动轨迹,这一指标旨在鼓励教师最大化地利用教室的空间资源开展多样、 有效的教学活动。其计算方法为,通过人脸跟踪技术高频率追踪每一位学习者在教室空间中的定位,形成行动轨迹。
3.教学效果维度
(1)专注度曲线。 专注度作为一种认知资源,维持 着 个 体 对 某 信 息 的 持 续 关 注 (Zaletelj,et al.,2017)。 因此,能够长时间维持学生的专注度是教学设计的目标之一(Young,et al.,2009);学生专注度也成了反映课堂有效性的一个重要方面(Fredricks,et al.,2004)。通过可视化一堂课内学生的专注度曲线,这一指标旨在帮助教师回顾性地反思导致专注度下降的事件,进而及时做出调整。国内外对学习者专注度的测量主要基于情绪特征(Sharma,et al.,2019)和体态特征(Ahuja,et al.,2019)两大表征。 由于开放教育教学环境难以获取远程学习者的体态数据,因此,本指标统一基于情绪来测量线上、 线下学习者的专注度。 美国心理学家埃克曼(P. Ekman)通过研究发现:高兴、生气、惊讶、恐惧、厌恶和悲伤,这六种基本情绪具有跨文化的一致性,因此,它们被广泛应用于情绪识别领域(陈子健,等,2019)。 本指标以一定频率识别学习者面部视频中的六大基本情绪, 并基于此计算出全体学习者的平均专注度。
(2)随堂测试成绩。测试成绩是教学效果的关键指标之一。 互动教学平台可对学生通过移动终端向答题器提交的选择题(单选或多选)答案进行实时统计,包括每道题目的答题次数、全班正确率以及选择每个选项的人数。 设立这一指标的目的在于:(1)帮助教师及时了解教学中的难点和学习者的知识缺陷,进而实施动态干预;(2)辅助教师审视教学设计与教学效果的内在关联,作为优化教学的依据。需要指出的是,选择题作为诸多测试方法中的一种,难以全面地反映教学效果。 随着互动教学平台开发出更多的智能测评工具, 可将多元的成绩数据整合入本指标。
四、实验方法
(一)实验环境
本研究依托上海开放大学智慧学习中心开展对指标体系的验证。 该中心旨在创建以学习者为中心的、 线上线下全场景融合的教学环境 (Xiao,et al.,2019),共建有37 间由物联网、人工智能、5G+全息直播、虚拟现实等新一代技术共同打造的智慧教室。本实验选用的教室面积为8*10 平方米,并配备了三类设备支撑线上线下混合教学 (见图2): 第一,ClassIn 在线学习平台,集成了答题器、多屏互动、协同写作、分组讨论等交互工具,用来同时支持远程和面授学习者通过移动终端参与课堂活动;第二,常态化智能录播系统,包括教师端电脑录屏、4 个自动变焦摄像头和6 个埋在教室天花板的拾音器, 可为远程学习者提供“多媒体”“教师特写”“学生特写”“教师全景” 和“学生全景” 五机位教学画面;第三,教室中灵活可移动的桌椅可拼接成多种造型以支持线下学习者不同类型的学习活动。
图2 两堂实验课的线上线下教学场景
(二)实验设计
本研究通过两组实验分别验证指标体系的有效性和准确率。第一组实验通过两堂均以教师培训为主题的、教学风格迥异的实验课,验证指标体系是否可以有效表征不同风格的教学特征。第一堂是以教师为主体的讲授式课堂,以讲座为主,外加少量测试和练习。 第二堂是以学生为主体的交互式课堂,包含除讲座之外的多种学习活动,如,学生报告、小组讨论和协同写作等。 上述两堂实验课是具有代表性的课堂形态, 常被运用于智能课堂分析系统的对比验证中(Martinez-Maldonado,et al.,2020;杨晓哲,2021)。 采用实验课堂开展验证的原因在于实际课堂中教学活动的类型和频率相对有限,不能包含每一指标所要测量的教学特征;而在实验课堂中,参与者根据测试脚本在规定时间内完成规定动作(如,认真听课、举手、提交答案等),可确保系统能测量到每个指标。两堂实验课均为15 分钟左右, 由同一组参与者开展, 共有14 人,1 人充当教师,13 人充当学习者(包括4 位线上学习者和9 位线下面授课学习者)(见图2)。
第二组实验结合实验和实际课堂, 测量各指标计算方法在不同场景下的准确率。 研究者首先记录下两节实验课堂和四节实际课堂的教学全过程(包括通过摄像机记录教室中的师生行为、 教师端多媒体录屏、米尺标记教室空间相对距离);之后,手动精准测量出实际教学活动的各项特征参数; 再与通过系统自动采集分析出的结果进行比较, 计算出各指标的准确率γa,计算公式如下:
其中a∈(时长、移动范围、时序、次数),τa为系统实测值,Ta为手动测量理论值。
(三)数据采集
基于本指标体系的智能课堂分析共涉及三类数据:视频、音频和学习平台日志数据。 这三类数据均可实现无接触式采集, 可最大限度地减少对教学的干扰。视频数据选取了由教室前、后端的摄像头所采集的“教师全景”和“学生特写”两组动态画面。 音频数据由教室中的拾音器采集。 日志数据为教学过程中ClassIn 教学平台上所产生的过程性事件记录数据,包含师生ID、操作和时间等信息。
(四)数据分析
首先, 将来自摄像头和学习平台的数据根据不同场景解析为不同类型的数据,然后,将其映射到不同指标的计算中(见图3)。
图3 数据处理流程
1.视频数据分析
(1)行动轨迹。采用基于深度学习的人脸跟踪技术进行分析(李荔,等,2021)。首先,采取卡尔曼滤波算法(KF)预测已有轨迹的位置坐标;其次,在抓取的图片中检测是否有人脸;第三,若检测到人脸,则对其进行特征提取和计算;最后,将计算结果与预测数据进行匹配,确认人脸是否移动至新的位置坐标。
(2)专注度。首先,使用OpenPose 平台(Karatay,et al.,2022)提取学习者的面部表情特征,从中选取20 个关键特征点,再通过已有情绪识别模型来识别情绪类型并赋值,最后再将数值套入公式,计算出专注度(详见表1)。
(3)音频数据。 首先,将视频数据的语音提取出来形成音频文件,并标定言语行为标签;其次,预处理语音信号,通过对语音进行端点侦测,保留有效信息部分,去掉静音;第三,使用人工神经网络(ANN)与隐马尔可夫(HMM)的语音识别模型,通过声学特征(包括韵律、频谱、音质等)区分教师和学生的发言;最后,通过最近邻聚类算法(KNN)将所有帧聚为两类,结合平滑处理后对原始音频按说话人进行分段。
2.日志数据分析
日志数据分析是指对日志数据进行清洗、 整理后,计算出每个指标下的特征向量。
五、实验结果
(一)第一组实验结果
我们从两堂风格迥异的实验课堂中, 根据所构建的指标体系提炼出各维度下的教学特征。
1.教学设计维度
(1)教学模式时长比例。这一指标反映了一堂课中不同教学模式下各种教学活动的时长比例, 并按照布鲁姆的教育目标体系(Bloom,et al.,1956),大致区分出不同教学活动所激发的认知水平的高低。 在由图4(a)所反映的讲授式课堂中,吸收型的教学模式(教学活动:讲授、练习和测试)占据了绝大多数的教学时间,除此之外,占较多时间的是教师基于学习者的答题情况所提供的反馈。 在图4(b)所反映的交互式课堂中包含了较丰富的教学模式。
图4(b) 交互式课堂教学模式时长比例
图4(a) 讲授式课堂教学模式时长比例
(2)教学活动编排。这一指标通过教学活动编排图(Prieto,et al.,2018)反映了一堂课中,随着时间的推移,在三个交互层面上(全班、小组和个人)所发生的教学活动时序。在图5(a)所反映的讲授式课堂中,绝大多数的教学活动都发生在全班层面。 在图5(b)所反映的交互式课堂中, 教学活动在三个社交层面较平均地分布。
图5(b) 交互式课堂教学活动编排
2.教学实施维度
(1)师生发言时长比例。这一指标呈现了在一堂课的时间容量内,教师和学生的累计发言时长比例。在图6(a)所反映的讲授式课堂中,教师几乎包揽了所有发言, 线上和线下学生仅通过回答问题获得了简短发言机会。 在图6(b)所反映的交互式课堂中,学生在报告、展示、讨论等活动中累积了较长的发言时长。
图6(a) 讲授式课堂师生发言时长比例
图6(b) 交互式课堂师生发言时长比例
(2)教师行动轨迹。这一指标反映了一堂课中教师在教室中的行动轨迹。 在图7(a)所示的讲授式课堂中, 由于学生一节课都固定地坐在成排摆放的座椅上,教师的行动范围也因此局限在教室前部。在图7(b)所示的交互式课堂中,学习者根据不同学习活动将座椅拼接成不同造型, 当教师走到学生身边提供反馈和教学时,其行动范围也变得更加多样。
图7(b) 交互式课堂教师行动轨迹
图7(a) 讲授式课堂教师行动轨迹
(3)学习者行动轨迹。这一指标反映了每位学习者在教室中的行动轨迹。 在图8(a)所示的讲授式课堂中,学习者一整节课都固定坐在呈“秧苗式” 摆放的座椅上。 在图8(b)所示的交互式课堂中,学习者首先坐成“秧苗式” 聆听教师授课,之后两到三人围坐成“圆形” 进行小组讨论,最后坐成“马蹄形” 进行全班讨论。因此,每位学习者在教室中有了更多样的定位和更频繁的移动。
图8(a) 讲授式课堂学习者行动轨迹
图8(b) 交互式课堂学习者行动轨迹
3.教学效果维度
(1)专注度曲线。这一指标呈现了一堂课中全班学生平均专注度的变化。 教师可对应课堂实录画面来回顾专注度波峰、波谷时段的教学事件。由于学生按照预设的测试脚本表现专注度,因此,两堂课所测得的专注度无比较意义, 以下仅以其中一堂课的测试结果作为示意(见图9)。
图9 学习者专注度曲线
(2)随堂测试成绩。这一指标反映了随堂测的答题情况,包括每道题目作答的平均用时、全班平均准确率和重新答题次数。同上,由于学生按照测试脚本提交答案选项, 以下仅以一堂课的测试结果作为示意(见图10)。
图10 基于互动教学平台答题器点击数据统计出的答题情况
以上分析结果,展示了OMO 智慧课堂多维指标体系对各维度下课堂教学特征的提取, 表明该指标体系可有效表征两类不同课堂风格下的教学特征。
需要说明的是,由于教学场景的复杂性,本指标体系不对各维度指标赋值做归一化分析。 在一些行业中, 数据指标可以转化为一个越高越好的数值,如,网络试听信息传播效果的“收视度”“参与度”和“热议度”(周勇,等,2013),或手机应用的用户“转化率”和“留存率”(Shen,2015)。然而,反映教学特征的数据指标, 往往不能被简单地转化为一个数值来衡量教学的优劣。 教学是教师基于多种环境因素做出的综合决策,如,教学目标、教学时长、学生兴趣和学习能力等(Laurillard,2012;Mor Craf,et al.,2015)。因此,我们不能脱离教学情境来评估教学特征;强交互的教学不总是优于讲授, 一堂课中教学模式不总是越丰富越好。基于此,本指标旨在从多角度提炼教学特征,帮助教师根据具体的教学情境开展教研,不断反思和优化教学设计。
(二)第二组实验结果
在第二组实验中,通过比较手动和系统测量的结果,本研究量化比较了各指标计算方法在实验和实际课堂环境下的准确率(见图11)。 本实验于2021年冬季开展,由于防疫目的,上海开放大学压缩了线下面授课人数。 在所选实际课程中没有或仅有极少量的学习者参与到线下教学,这导致与线下教学相关的两个指标无法测量,即教师和学习者的行动轨迹。 因此,图中这两组指标在实际课程中的准确率为基于实验课堂测试结果所估计的数值。
图11 各指标算法在实验课堂和实际课堂中的准确率比较
由图11 可知:
(1)准确率达到100%的指标是“随堂测答题情况”。对该指标的测量是基于系统对学习者提交答案的简单计数,因此,可实现完全精准的计算结果。
(2)准确率较高的指标是“师生发言时长比例”(实验课堂,Controlled Setting,CS=96%; 实际课堂,Real Class,RC=91%)。 系统可以根据声学特征精准识别师生发言,而其与实际课堂相比存在9%的错误率,这主要由音频质量所导致(当环境噪声大、同时发言或说话人音量较低时)。
(3)准确率均达到80%以上的是通过图像识别技术测量的三个指标,即“教师行动轨迹”(CS=86%;RC estimated=86%)、“学习者行动轨迹”(CS=81%;RC estimated=81%)和“专注度曲线”(CS=90%;RC=84%)。 由于系统基于人的面部来识别师生在教师中的定位, 在行动过程中当其面部背对或侧对摄像机时,或当学习者相互遮挡时,系统则无法清晰提取面部信息。这导致了师生行动轨迹的断点和定位偏移,以及专注度测量的误差。
(4)指标“教学模式时长比例” 在实验课堂中测试的准确率较高(CS=89%),但在实际课堂中的准确率较低(RC=59%);出现同样情况的还有指标“教学活动编排”(CS=86%;RC=62%)。 这是因为对这两个指标的识别依赖于交互工具的启用, 或比对师生发言与工具启用的重叠部分。在实验课堂中,参与者能够精准实施提前设计好的教与学活动(如,对工具的开启和关闭,以及发言的时间和内容);然而,在实际课堂中,当教师在开展小组活动时忘记关闭PPT,系统则会把整个时段识别为“全班学习” 和“讲授” 。另外,尽管大多数情况下,师生在某些工具开启时的发言与标记的教学活动类型相吻合, 但有时也会出现不吻合的情况。例如,系统将教师点击停止作答和关闭答题器之间的发言识别为“提供反馈”,然而,有些教师在点击停止作答前就已提供了反馈。 上述原因导致“教学模式时长比例”和“教学活动编排”指标测量的准确率在实际课堂环境下偏低。
(三)实验结果讨论
我们通过两组实验分别验证了OMO 智慧课堂多维指标体系的有效性和准确率,结果表明:该指标体系可有效提炼出两堂实验课的教学特征, 通过多角度、不同粒度的分析汇聚出课堂教学的全貌;虽然个别指标的计算方法和相关测量技术仍有提升空间,但大部分指标的计算方法已达到理想的准确率。
在验证中, 本研究提出的多维指标体系体现了两方面优势。第一,本指标体系通过指标间的相互诠释与印证,提高了分析结果的解释力。 例如, “师生发言时长比例” 作为单一指标仅能反映出教师指导的占比, 无法解释是什么样的教学设计导致了这个占比,因此,对教师优化教学的启发性有限。 而当我们将该指标与“教学模式时长比例”指标相关联时,便可推断出教师发言时长占比高是由长时间的“讲授”“提供反馈”等教学活动产生;学习者发言时长占比高是由长时间的“讨论”“展示”等活动产生。又如,“专注度曲线”这一指标仅能反映出学习者专注度的浮动,却无法解释原因。 当我们将该指标与“教师行动轨迹”及“教学活动编排”指标相结合时,便可追踪到由于教师在教室中频繁走动而提升了学习者的专注度,或是由于全班层面的授课时间过长,从而压缩了小组层面和个人层面的学习活动, 进而导致学习者专注度下降。 因此,相较单一维度指标,多维指标体系的分析结果更具解释力和可操作性。
第二,通过对线上线下多模态数据的融合,本指标体系可识别出更加细粒度的教学活动类型。例如,现有基于语音识别的分析系统仅能识别出师生发言这一粗粒度的教学活动, 难以进一步确定发言类型(如,学生展示、教师反馈等)。 本指标体系借助师生对交互工具的使用来识别具体的发言类型。 如,学生在发言期间开启了投屏, 则将这一时段的发言识别为“学生展示”;在教师发言期间,学生开启了投屏,则将这一时段的发言识别为“教师反馈”。对细粒度教学活动的精准识别, 有助于支撑教师更加精细化的课堂教学反思。
六、总结与展望
本研究构建了一套适用于开放教育OMO 智慧教学环境的课堂分析数据指标体系, 旨在为智能课堂分析系统的建设提供理论依据和设计方案。 在实验和实际课堂的验证中, 该指标体系可较全面地提炼出线上融合线下教学环境中的多维教学特征,综合体现了教师对教学法、技术和空间的运用;该指标体系可有效表征不同课堂风格下的教学特征, 各指标的计算方法可达到较理想的准确率。
未来,我们将从以下几个方向展开研究:首先,在该指标体系的指引下, 将已实现的子系统集成于一套集数据采集、 分析及可视化呈现为一体的智能课堂教学分析系统中;其次,对更多教学模式下的课堂开展分析, 以验证指标体系是否可以有效表征不同课堂风格下的教学特征;再次,通过实证研究验证指标体系在促进教师优化教学中发挥的作用;最后,基于实证数据的反馈并结合最新技术, 迭代优化数据指标及算法, 持续提升智能课堂教学分析系统的有效性和准确率。