基于人工智能的课堂师生对话分析:IRE的自动分类与分水平构建
2023-10-18杨晓哲王晴晴蒋佳龙
杨晓哲 王晴晴 蒋佳龙
[摘 要] 已有大量研究关注课堂中的师生对话,并对其进行了不同类型的编码与分析,但目前的编码仍受到专业人员的水平与时间限制。为提高课堂对话编码速度,实现自动化的课堂对话分类与即时反馈,采用人工智能技术,利用神经网络分析模型对课堂中的提问、回答、反馈进行自动编码。研究发现:该模型实现了基于语义的课堂对话质量评估,能够在短时间内实现课堂师生对话中IRE模型的分水平评估,即对提问层次水平、回答层次水平和反馈层次水平进行评估与分类;构建了全面、快速、准确的课堂对话评估方式,成为进一步理解课堂中学习发生过程的关键环节,为大规模课堂智能分析奠定重要基础。
[关键词] 师生对话; 机器学习; 自动分类; 人工智能
[中图分类号] G434 [文献标志码] A
[作者简介] 杨晓哲(1988—),男,福建泉州人。副教授,博士,主要从事教育信息化、信息科技、学习科学研究。E-mail:yangxz@vip.163.com。
基金项目:国家社会科学基金2022年度教育学一般课题“中小学课堂智能分析的标准建构与应用研究”(课题编号:BHA220144)
一、引 言
课堂对话是课堂环境中发生的社会化建构过程,也是课堂中进行知识共享、构建群体认知的重要环节。对话有助于学生展开批判性思维,通过相互理解来加深学习效果。有效的课堂对话应该发生在师生之间,并遵循目的性、互惠性、支持性和积累性的方式展开。然而,在真实的课堂教学中,对话质量存在巨大差异,有时仅限于简单的问答,没有展开平等、深入和开放的对话过程。为了提高课堂对话的有效性,教师同伴之间采取相互观察的方式,通过相互提醒和建议以改进教学。教育研究者还利用课堂视频录像等方式进行课堂对话编码,以提高反馈的准确性。然而,这种手动编码方式耗时且难以为教师提供及时有效的反馈,对教学改进的作用非常有限。因此,提高课堂对话编码速度并实现即时反馈对于课堂对话自动分类至关重要。为此,本研究采用機器学习模型和人工智能技术对课堂师生对话进行自动分类编码。通过机器学习训练,实现对课堂师生对话的快速自动编码,分析课堂师生对话的质量,为教师改进教学提供可行途径。
二、研究现状与文献综述
(一)课堂对话研究
课堂对话是一种在课堂环境中教师与学生之间、学生与学生之间的多向交流互动,能够增强知识理解与建构。已有研究表明,有效的课堂对话能促进学习成就的达成[1]。对于课堂对话模式分类的探索起源已久,研究者通过话语分析方法建立了分层描述框架,提出了“启动—响应—反馈(IRF)”结构[2],这被认为是课堂对话模式的经典模型结构。该结构有助于区分课堂中对话的关联与关系。之后,米恩(Mehan)采用民族志方法,对IRF结构作了新的诠释,提出IRE结构,即“教师启动—学生回应—教师评价”[3]。米恩强调了课堂对话中教师反馈对学生的评价作用。卡兹顿(Cazden)用民族志方法完善了IRE结构,丰富了其变式[4]。IRE对话框架自建立以来,一直作为课堂互动分析的重要结构模型被广泛地应用。
教师在教学中可以使用课堂对话来发展和巩固学生的学习,利用学生的已有知识并帮助学生成为独立的学习者。史密斯(Smith)发现,允许学生更多参与的课堂话语导致了更多的批判性思维和更好的学习效果[5]。麦考密克(McCormick)和多纳托(Donato)分析了班会、教师日记、访谈等各种数据来源,发现教师在课堂对话中为学生学习提供了重要支架[6]。虽然课堂中对话的重要性得到认可,但长期以来课堂对话存在两个倾向:一是,教师对课堂中对话的重要性关注不足。沃林(Waring)的研究指出,在大量、连续的IRE指令下,学生的主动性很难被满足,教师也很少让学生自主地提出开放性的问题,这是造成课堂对话质量与水平低下的原因之一[7]。二是,教师作为话语协调者,常常操纵和主导着课堂对话。霍沃思(Haworth)发现,小学生在小组任务中进行讨论时,常模仿教师的话语模式,这限制了学生在讨论中的自由[8]。因此,进一步发展IRE对话的分类编码,不仅应关注结构,还需构建结构下的分水平编码,这将成为深度理解课堂对话的关键。
“对话式教学与学习”(Dialogic Teaching-and-Learning)这一概念由罗哈斯—德拉蒙德等人提出,他们发现参与者之间的对话式互动,即对话式教学与学习对教师和学生建构知识的过程有很大的帮助[9]。“对话式教学与学习”尤其强调利用语言的力量来激发和扩展学生的理解、思考和学习,并鼓励学生公平地参与课堂对话。如此,课堂对话就既有教师课前预设的部分,也有课堂中生成的部分。课堂对话过程不全是教师设定好的问题,还包括教师在课堂中不断生成的问题。学生参与对话的过程会改变和影响整个课堂对话的内容与质量。从“对话式教学与学习”的视角出发,整个课堂对话的过程中,无论是提问、回答还是反馈,都可以呈现为不同的水平和层次。教师既可以提出简单的、有标准答案的问题,也可以提出开放性的、需要推理回答的问题。开放性的对话能够进一步激发学习者元认知和反思的过程。学生对于探讨没有标准答案的开放式问题表现出极大热情,应当鼓励学生对观点进行深入的阐释、推理和论证[10]。对课堂对话质量的研究备受关注,如克利巴德(Kliebard)等基于课堂话语将教学活动分为结构化、诱导、回答和反馈,以此划分一个个“话语周期”并得到 “师生话语的相对占比”,进而分析课堂中的对话质量[11]。
随着对课堂对话研究的深入,越来越多的编码框架能够对课堂话语进行量化观察和分析。近十年来,国际课堂对话评价指标不断更新,研究者总结出它们一般包括事实类话语、个人信息分享、分析式话语、归纳式话语和推断式话语等编码类别。国内学者提出的ITIAS分类系统(Information Technology-based Interaction Analysis System)中,进一步将教师提问划分为封闭性提问和开放性提问[12]。有研究者提出,从邀请解释、明确推理、表达想法等维度来衡量教师课堂教学话语的效度,并提出了课堂教学对话分析SEDA(Scheme for Educational Dialogue Analysis)方案[13]。有研究者设计了一个根据教师提问和学生不同反馈的特征分类编码框架[14],亦有研究者构建了基于人工智能的课堂分析标准架构——高品质课堂智能分析标准(CEED),该标准包括三个方面(课堂效益、课堂公平、课堂民主)和九个维度,并整合多模态数据进行课堂对话分析[15]。
尽管编码体系取得了长足发展,但课堂对话分析还是较依赖经过培训的研究人员进行手工标注来完成。随着技术发展,通过摄像等方式对课堂进行记录,后期采取人工编码的方式,特别是结合NVivo等常用软件对课堂进行编码,能大大提高课堂对话编码的效率。尽管有了软件的辅助,但是课堂对话编码仍然需要耗费大量的时间,无法立即反馈给一线教师。教师无法及时得到关于课堂对话进展情况的反馈。这已被证明是导致低质量课堂对话的一个重要因素。因此,如何实现课堂对话自动、快速地编码分析对改进课堂对话非常重要。
(二)课堂对话的自动分类研究
自动分类是一种计算机独立运行,根据数据进行自动识别分类的技术。与手动分类相比,自动分类的速度更快,也更能节约人力、物力。文本自动分类越来越受到各行各界应用层面的关注。使用基于规则的文本分类方法已经被用于大量行业场景之中。例如:使用文本自动分类区分垃圾邮件内容。传统的文本分类往往依靠一定的明确规则,甚至有的时候要限定一些特定的关键词。然而,近年来,随着人工智能技术的发展,采用有监督学习、半监督学习、无监督学习等方式的文本分类应用越发广泛。与传统文本分类相比,机器学习方式只需要预先对一定的文本进行分类标签的人工标注,然后通过机器学习的方式进行数据集的训练,就能够提升文本分类的准确度和灵活性。例如:运用卷积神经网络进行文本段落与句子分类[16];基于Attention-based C-GRU神经网络进行文本分类[17];基于录音文本进行自动分类[18]。有监督的深度学习更好地利用了神经网络算法,实现了更加精准、高效的文本分类。库萨利(Kowsari)等研究发现,基于深度学习的模型对各种文本分类任务的效率有显著提高[19]。此外,已有不少研究采用了有监督学习对文本进行情感分类。例如:有研究者提出了基于GRU对文档进行多标签情感分类的GRU+Attention 模型[20],还有研究者采用有监督学习进行学习成绩预测、辍学率预测等[21],亦有研究者采用双向LSTM模型进行文本情感分类[22]。
现有研究中,已有少量研究通过自动编码的方式对课堂话语进行自动或半自动分析,并探索使用机器学习进行课堂话语的自动编码。福特(Ford)等设计了一个语言环境分析系统(LENA)。该系统能够记录并自动检测课堂语言环境信息,采用机器学习训练的方式,对课堂中包括教师教授、师生对话和小组活动在内的不同事件时间段进行了分类[23]。研究者还尝试用人工智能技术对课堂话语分类进行自动识别判断[24]。布兰查德(Blanchard)等开发了能够自动检测课堂回答的模型,这一模型能对课堂对话中的问题和回答进行自动编码,采用自动化课堂对话问答模型能够对课堂中的问答环节进行文本判定和区分[25]。国内学者针对信息化环境下课堂话语的特点,从话语分析的维度,利用贝叶斯分类器实现了课堂话语的半自动化分析[26];对不同学科的课堂对话进行自动编码与分析探索,构建了数学课堂的话语分析体系[27];借助人工编码与机器学习相结合的方法对大规模中小学课堂进行话语分析,发掘了中小学课堂“以基础知识类对话为基础、多元对话组合推进”的对话模式[28]。
尽管已有研究对课堂对话的自动分类已经能够实现整体归类分析,区分一般形式的对话,包括判断不同的课堂时间段类型,但尚未实现对课堂对话的质量分水平判定,以往研究中的自动编码分析尚无法实现不同对话层次的分类与不同对话水平的质量评估,应用于诊断课堂对话质量时存在一定的局限性,难以给出更具针对性的教学改进建议。这正是本研究的重点突破范畴。
三、研究过程与方法
(一)数据集
课堂视频数据集为研究团队的实验项目学校所提供的课堂实录素材。课堂视频数据集由1008节课组成,其中,小学672节课,初中336节课。对每节课堂视频进行课堂话语的文字转录,得到共计358410条话语。课堂视频采取整节课全程录制的方式,真实地保留了课堂的全过程,完整地记录了课堂中教师的声音,以及学生发言回答的声音。
(二)编码框架
课堂话语分析存在多种不同的编码框架。课堂分析的出发点和观察视角不同,由此产生的编码框架的价值和指向也不同。采用什么样的编码框架能够更全面地描述对话及其质量呢?虽然不同研究者的定义与方法之间存在差异,但也有相似之处。总体而言,面向师生对话的交互功能包括以下几点:(1)能引起深层思考的邀请,如教师提出真实的问题并进一步要求明确说明和解释;(2)进行解释与推理;(3)进行批判性思维训练、挑战,并在此基础上进行知识建构;(4)在知识间产生链接和关联;(5)试图通过解决分歧达成共识[29]。也有研究团队以社会文化理论为基础,提出侧重微观层面分析的对话分析编码方案SEDA,分解为8个组、33个类别。如以I( Iinvite Elaboration or Reasoning) 代表邀请解释/推理,其中,I又可细分为I1~I6,I1代表邀请解释或证明他人想法,I2代表邀请评估他人想法,I3代表基于已有想法邀请推理,I4代表邀请提供理由,I5代表邀请预测,I6代表邀请细化或举例。又如,以P(Positioning and Coordination)代表定位與协调,P可细分为P1~P6,P1代表总结概括,P2代表比较,P3代表提出解决方案,P4代表转变观点,P5代表质疑,P6代表同意或不同意[13]。此后,亦有学者对此框架进行精简以便更好地应用于研究与实践。SEDA及其衍生编码框架囊括了课堂对话的方向与类别,能够帮助探究师生如何在课堂对话中进行推理、反思、启发。
基于以上编码框架,研究团队提出一种维度更聚焦、指向分水平更明确的课堂对话编码框架。研究团队以I-R-E(启动—回应—评价)编码框架为基础,在每个维度上作了进一步划分与阐释。最终构建了课堂对话分水平编码框架,将课堂中的教师或学生提问分为三个层次水平,相关编码规则见表1。
(三)处理步骤
将所有的课堂视频提取音频信息,通过智能技术实现语音转录成文字。在数据标签部分,根据编写的“IRE分级编码规则”,20名研究人员经培训后各自进行独立编码。完成首轮编码后,就编码不一致部分进行讨论与修改,以提高编码可靠性。初始数据的编码是后期机器学习编码数据的重要依据。
本研究基于上述数据集构建了一个课堂对话自动分类模型,将处理后的数据分为“训练集” “验证集”“测试集”。训练结束后,验证模型的准确性。最后使用最优模型对新的课堂对话数据进行自动分类预测。
(四)课堂对话分类模型实现
预训练模型具备较好的稳定性和可扩展性,在特定领域的任务场景中,仅需要采用标注好的数据集对模型进行调整训练,即可得到特定任务场景的预测模型。预训练的优点在于提供了一种更好的参数初始化方式,使得在目标任务上收敛速度更快,在特定场景使用时不需要单独标注大量的语料来进行训练,大大降低了下游任务所需的样本数据和计算算力,节约时间,提升效率。
BERT是一种基于Transformers双向编码器表示的(Bidirectional Encoder Representation From Transformers, BERT) 预训练语言模型。Bert具有很强的泛化能力,从而为下游特定任務创建更精准的预测模型。同卷积神经网络和循环神经网络相比,Bert模型在训练过程中采用了掩码语言模型(Masked Language Model,MLM)和下一句预测(Next Sentence Predict,NSP)两个方法作为预训练过程中的任务,利用 Self-attention机制可以获取双向上下文信息,能够学习句子与句子间的关系等更多特征,特别适合预测对话分类等具有深层语义特征的任务问题。使用Bert有两个步骤,第一步,采用大量无监督的语料进行语言模型预训练;第二步,再运用少量标注的语料进行微调来完成具体任务。从0开始预训练需要花费巨大的计算资源,为节约资源,本文选择Bert-base-Chinese预训练好的模型进行微调,微调即利用标记好的语料对通用语言模型的参数进行调整,从而得到具体的分类模型。
首先,对课堂对话数据进行编码,转为模型需要的编码格式,使用辅助标记符[CLS]和[SEP]表示句子的开始和分隔,对于单句分类,只需要一个句子输入,不需要分隔SEP标记,得到token_ids、category、seq_len、mask。然后根据特征转换得到对应的embedding,这里的embedding是三种embedding的组合,分别是token、segment、position级别。获得句子级的嵌入表达后用encoder模型进行训练,训练算法为BERT专用的Adam算法,损失函数采用二元交叉熵损失函数,可对BERT进行微调处理和反馈。最后,采取全连接层得到概率分布的分类标签整体情况。
如表2所示,使用Bert进行课堂对话分类任务训练时,我们通常先构造一个Bert Model,然后由它从输入语句中提取特征,每一个epoch后会在验证集上进行验证,并给出相应的f1值,如果f1值大于此前最高分,则保存模型参数,否则flags加1。如果flags大于3,即连续3个epoch模型的性能都没有继续优化,则停止训练过程。当长时间没有优化则自动停止训练,保存最优分类模型。
四、结果与分析
(一)数据集描述
确定课堂对话数据集来自1008节课,共计358410条话语。按照6∶2∶2的比例划分为训练集、验证集和测试集。如表3所示,对IRE进行三类数据的分配设置,并进一步对分水平的IRE进行数据分配设置(见表4)。
(二)分类模型评估结果
经过随机划分训练集、验证集和测试集,重复进行模型微调训练后取平均值作为最终的评估结果。本研究采用准确率(Precision)、召回率(Recall)、F1数值(F1 Score)作为课堂对话分类模型效果的评价指标。表5为IRE三类分类整体指标的评估情况,整体准确率达79.57%。其中,提问I的识别准确率最高,为84.11%,回答R的准确率达81.84%,反馈E的准确率为72.75。从F1数值整体来看,达到了78.73%,表明该模型整体预测处于较高水平。
表6为IRE分水平整体指标的评估情况。在F1数值(表明预测准确率)上,排名前四的是I2、E1、E2、I1。判断准确率较低的是E3,准确率为58.63%。在分水平整体准确率上,达到了73.07%,整体上达到了较好的准确率水平。因此,在IRE整体分类判断水平评估上,该模型的预测结果能够在真实课堂中展开分类自动判断。
经过检验,课堂对话分类模型信效度良好,且与人工编码的结果接近。结果表明,该模型有助于对课堂对话的分类和分水平诊断分析。通过对课堂对话自动化分析,能较准确识别课堂对话中IRE模型中的不同水平,能够对提问层次水平、回答层次水平和反馈层次水平进行评估。这种全面、快速、准确的课堂对话评估方式是本研究的重要发现。
五、研究探讨与反思
(一)研究贡献与局限性
本研究采用机器学习的方式,开创性地在课堂编码领域里尝试对课堂对话进行IRE自动化分水平编码与质量评估。其主要贡献包括:在理论层面,基于经典的课堂对话IRE模型,进一步结合以往研究,建构了IRE分水平的编码框架。该框架能够基于语义,针对课堂对话的质量进行分水平判定与分析,关注了课堂对话中封闭的、简单的、推理的、开放的等不同层级的问题、回答与反馈。在实践层面,自动化分析极大地减少了课堂对话编码的时间与难度,降低了人工工作量。本研究采用的框架不仅便于教师教学反思与理解,自动编码的方式也能为教师和学生提供更多及时的反馈,也将有助于学生思考参与课堂的过程。本研究实现了课堂对话自动编码IRE的突破性进展。
本研究同樣具有一定的局限性:一是,采用了机器学习的算法模型并经过多次训练与测试,但课堂对话中的有些话语判断依旧存在偏差。例如:教师讲授时带有疑问语气的表达,易被机器错误判定为教师提问,仍需通过进一步的算法和数据集修正来解决这一问题。二是,本研究所使用的Bert-base-Chinese中,考虑到传统NLP对中文分词颗粒度存在一定的切分适配问题,其在细粒度级别上进行的判断还不够精准,存在一定误差。
(二)基于课堂师生对话内容的自动分类反思
基于课堂多维度数据,采用人工智能技术实现智能诊断与智能反馈,能帮助我们研究教与学认知的复杂规律,亦是人工智能在教育领域内应用的主要方向之一[30]。首先,在理论层面上,构建师生对话模型的分类标准,是基于课堂师生对话内容的自动分类与分析研究的基础。建构合理、高效的分水平模型框架,有助于实现自动化编码对内容语义的理解,有助于一线教师加强教学反思并加深对教学规律的理解。本研究基于经典课堂对话模型所构建的三级分类标准与细节,能更有效地关注到课堂中开放的、平等的、带有推理性和启发性的提问、回答及反馈,这将有助于教师把握课堂对话的教学效果。其次,提升反馈的时效性与有效性是课堂对话自动分类与评估研究应用于实践的导向。在课堂中,教师在管理学生与进行知识传授之间分身乏术,课堂话语的短时性也致使教师在独立完成教学时很难注意到对话的分布与质量,课堂反馈对教师来说尤其重要。提升反馈的时效性,使教师在课后能及时反思,通过反思促进有效对话、提升对话质量并提高课堂管理技能,同时,这种反馈可以用于专业教师培训[31]。此外,有效的形成性反馈也可以帮助学生更好地理解对话,促进他们的思维和学习[32]。以往研究中,利用ASR技术实现对课堂对话中教师提问与学生回答对话片段的区分[25],但尚未对课堂对话进行更进一步的分层评估。本研究通过机器学习,实现了课堂对话自动化分析,基于语义对课堂对话进行了IRE模型中的不同水平分类,同时实现了快速分析。本研究基于中国课堂的语境与语义进行了课堂对话自动分类与评估的探索,在前人研究基础上进行了拓展。
(三)课堂对话自动分类与评估研究面临的挑战
课堂对话自动分类与评估得益于对语音等数据的捕捉与分析技术。大数据的支持使得对课堂对话教学的大规模研究以及大范围的国际比较研究成为可能。但随着算法与大数据逐步应用于教育教学研究,其中的伦理问题也愈发凸显,数据的采集和使用安全问题不仅涉及基本隐私,更会在深入研究中产生更多伦理问题和数据安全隐患。因此,教育研究人员仍需非常谨慎。一方面,所有的数据收集都应该在符合学术、道德伦理标准和尊重隐私的前提下进行;另一方面,要特别警惕人工智能技术在各种应用场景中的技术错误、数据偏差与推理误判。尽管人工智能基于海量的数据,使用相对准确的算法进行计算,但是仍然存在一定的偏差可能性,仍需警惕数据的假象,避免过分看重数据分析的结果,将课堂学习的过程简单化、标签化和模式化。如何理解课堂中的对话依旧是一个变化、动态、复杂的过程,技术无法解决所有问题,未来研究应着眼于进一步探索人机协同的新方式,使人工智能以更融合的方式打开课堂“黑箱”、理解课堂教学,为课堂研究本身提供更全面的数据与证据支持。
[参考文献]
[1] MERCER N, HENNESSY S, WARWICK P. Dialogue, thinking together and digital technology in the classroom: some educational implications of a continuing line of inquiry[J]. International journal of educational research, 2019,97:187-199.
[2] SINCLAIR J M H, COULTHARD M. Towards an analysis of discourse: the English used by teachers and pupils[M].London: Oxford University Press, 1975.
[3] MEHAN H. “What time is it, Denise?”: asking known information questions in classroom discourse[J].Theory into practice, 1979,18(4):285-294.
[4] CAZDEN C B. Classroom discourse: the language of teaching and learning[M].Michigan:Pearson Education,1988.
[5] SMITH D G. College classroom interactions and critical thinking[J].Journal of educational psychology, 1977,69(2):180-190.
[6] MCCORMICK D E, DONATO R. Teacher questions as scaffolded assistance in an ESL classroom[C]//HALL J K,VERPLAETSE L S.Second and foreign language learning through classroom interaction. New York: Routledge, 2000:183-201.
[7] WARING H Z. Moving out of IRF (Initiation-Response-Feedback): a single case analysis[J]. Language learning, 2009,59(4):796-824.
[8] HAWORTH A. Bakhtin in the classroom: what constitutes a dialogic text? Some lessons from small group interaction[J]. Language and education, 1999:13(2), 99-117.
[9] ROJAS-DRUMMOND S, TORREBLANCA O, PEDRAZA H, et al. “Dialogic scaffolding”: enhancing learning and understanding in collaborative contexts[J].Learning, culture and social interaction, 2013,2(1),11-21.
[10] 石雨晨,曹曙,刘群英.学生参与小学《道德与法治》论证式议题教学的学习体验[J].全球教育展望,2022,51(10):87-104.
[11] KLIEBARD H M.The patterning of classroom discourse[J].Journal of teacher education, 1966,17(4), 469-480.
[12] 顾小清,王炜.支持教师专业发展的课堂分析技术新探索[J].中国电化教育,2004(7):18-21.
[13] HENNESSY S, ROJAS-DRUMMOND S, HIGHAM R, et al. Developing a coding scheme for analysing classroom dialogue across educational contexts[J]. Learning, culture and social interaction, 2016,9:16-44.
[14] 周平红,张屹,杨乔柔,白清玉,陈蓓蕾,刘峥.智慧教室中小学生协同知识建构课堂话语分析——以小学科学课程为例[J].电化教育研究,2018,39(1):20-28.
[15] 杨晓哲.基于人工智能的课堂分析架构:一种智能的课堂教学研究[J].全球教育展望,2021,50(12):55-65.
[16] KIM J, LEE M. Robust lane detection based on convolutional neural network and random sample consensus[C]//Neural Information Processing: 21st International Conference, ICONIP 2014. Kuching, Malaysia: Springer International Publishing, 2014: 454-461.
[17] 杨东,王移芝.基于Attention-based C-GRU神经网络的文本分类[J].计算机与现代化,2018(2):96-100.
[18] 张彦楠,黄小红,马严,等.基于深度学习的录音文本分类方法[J].浙江大学学报(工学版),2020,54(7):1264-1271.
[19] KOWSARI K, JAFARI M K, HEIDARYSAFA M, et al. Text classification algorithms: a survey[J]. Information, 2019,10(4):2-12.
[20] XIE Y, LIANG R, LIANG Z, et al. Speech emotion classification using attention-based LSTM[J].IEEE/ACM transactions on audio, speech, and language processing, 2019, 27(11): 1675-1685.
[21] XING W, DU D. Dropout prediction in MOOCs: using deep learning for personalized intervention[J]. Journal of educational computing research, 2019, 57(3): 547-570.
[22] 任勉,甘剛.基于双向LSTM模型的文本情感分类[J].计算机工程与设计,2018,39(7):2064-2068.
[23] FORD M, BAER C T, XU D, et al.The LENA language environment analysis system[EB/OL]. (2008-09-01)[2022-07-11]. https://www.lena.org/wp-content/uploads/2016/07/LTR-03-2_Audio_Specifications.pdf.
[24] SONG Y, LEI S, HAO T, et al. Automatic classification of semantic content of classroom dialogue[J]. Journal of educational computing research, 2021, 59(3): 496-521.
[25] BLANCHARD N, BRADY M, OLNEY A M, et al. A study of automatic speech recognition in noisy classroom environments for automated dialog analysis[C]//Artificial Intelligence in Education: 17th International Conference, AIED 2015. Madrid, Spain: Springer International Publishing, 2015:23-33.
[26] 高桂平.數字化课堂话语行为分类及方法研究[J].中国信息技术教育,2014(8):66-68.
[27] 曹一鸣,宋宇,赵文君,等.面向教育2030的数学课堂对话人工智能评价体系构建研究[J].数学教育学报,2022,31(1):7-12.
[28] 宋宇,邬宝娴,郝天永.面向知识建构的课堂对话规律探析[J].电化教育研究,2021,42(3):111-119.
[29] VRIKKI M, WHEATLEY L, HOWE C, et al. Dialogic practices in primary school classrooms[J]. Language and education, 2019, 33(1):85-100.
[30] 杨晓哲,任友群.教育人工智能的下一步——应用场景与推进策略[J].中国电化教育,2021(1):89-95.
[31] WANG Z, PAN X, MILLER K F,et al.Automatic classification of activities in classroom discourse[J]. Computers & education, 2014,78:115-123.
[32] 孙众,于子淳.人工智能课堂教学分析与改进:人在回路的协同机制[J].电化教育研究,2023,44(1):116-122.
Analysis of Classroom Teacher-Student Dialogue Based on Artificial Intelligence: Automatic Classification and Sub-level Construction of IRE
YANG Xiaozhe1, WANG Qingqing1, JIANG Jialong2
(1.The Institute of Curriculum & Instruction, East China Normal University, Shanghai 200062
2.College of Computer and Cyber Security, Fujian Normal University, Fuzhou Fujian 350007)
[Abstract] A large number of studies have focused on teacher-student dialogues in the classroom and different types of coding and analysis have been conducted for them, but the current coding is still limited by the level and time of professionals. In order to improve the coding speed of classroom dialogues and realize automatic classroom dialogue classification and instant feedback, a neural network analysis model is adopted to automatically encode questions, answers and feedback in class through artificial intelligence technology. The results show that the model realizes semantic-based quality assessment of classroom dialogues, and can realize the sub-level assessment of IRE model in classroom teacher-student dialogues in a short period of time, i.e., to assess and classify the questioning level, the answering level and the feedback level. This study constructs a comprehensive, fast and accurate classroom dialogue assessment method, which becomes a key link to further understand the learning process in the classroom, and lays an important foundation for large-scale classroom intelligent analysis.
[Keywords] Teacher-Student Dialogue; Machine Learning; Automatic Classification; Artificial Intelligence