APP下载

多维异步在线讨论行为特征分析与学习绩效预测

2022-06-11孙建文胡梦薇刘三女牙李卿沈筱譞

中国远程教育 2022年5期
关键词:学习者预测特征

孙建文 胡梦薇 刘三女牙 李卿 沈筱譞

【摘 要】

在线讨论是数字教育的重要组成部分。利用丰富多元的讨论行为特征开展学习绩效预测分析,是揭示在线协作学习机制、提升在线教学质量的有效途径。本文聚焦在线教学场景下的学习者异步讨论行为特征,通过构建基于多维特征的学习绩效预测模型探究各个特征的预测效力及其影响机理。以华中师范大学一门SPOC课程论坛上的164位学生为实验对象,实验结果表明:移动窗口和回复关系两类社会网络特征对学习绩效的预测能力存在显著差异,基于移动窗口网络特征的预测能力优于传统回复网络;引入积极性和规律性两个隐性时间特征之后,进一步提升了学习绩效预测的准确性;融合人口背景、行為频数、社会网络和时间信息等多维特征对学习绩效具有较高的预测能力,准确率最高可达87.44%,不仅增加了异步讨论行为特征的丰富性,获得更多对在线教学有启示价值的信息,而且有效提升了学习绩效预测能力。

【关键词】  在线教学;异步讨论;学习行为;学习绩效;预测模型;多维特征;社会网络特征;隐性时间特征

【中图分类号】   G434         【文献标识码】  A       【文章编号】  1009-458x(2022)5-0056-08

一、引言

随着互联网、大数据、人工智能等信息技术与教育教学的不断融合,以及新冠肺炎疫情防控常态化,在线教学正发展成为未来教育的一种趋势(Chang, Hsu, Kwon, Kusdhany, & Hong, 2021)。与此同时,支持“师—生”“生—生”甚至“师—生—机”之间有效协作的异步讨论逐渐成为在线教学的有机组成部分(Han & Ellis, 2019)。异步讨论工具支持学习者跨时空、跨场景、跨终端开展社会性交互,为实现“人人皆学、处处能学、时时可学”的学习场景提供了重要手段。基于异步讨论产生的海量、实时、丰富的交互类大数据,开展以学习者为中心的行为分析与绩效预测,是当前在线教学研究的热点问题之一(De-Marcos, et al., 2016; Galikyan & Admiraal, 2019; 胡航, 等, 2021; 沈欣忆, 等, 2020)。

当前研究主要围绕异步讨论交互特征提取与学习绩效预测模型构建两方面开展,尤其是如何从人口背景、行为频数、社会网络、时间信息等多维交互数据中挖掘出具有较高预测效力的特征指标(Alyahyan & Dü teg?r, 2020; Gitinabard, Xu, Heckman, Barnes, & Lynch, 2019; Li & Baker, 2018)。近年来,尽管已取得了一系列研究成果,但在异步讨论交互特征数据的多样化、深层次信息挖掘和利用方面仍存在不足。例如,对于社会网络类特征,多数研究仅局限于探索传统回复关系定义下的行为特征对学习绩效预测能力的影响,少有研究从社会关系多样性视角考察更具预测效力的特征(Gitinabard, et al., 2019)。对于时间类特征,现有研究大多聚焦于浅层统计信息(如在线时长、天数等),缺乏从时间数据中挖掘潜在的隐性特征进行学习绩效预测(Barbera, Gros, & Kirschner, 2015)。针对此类问题,本文运用数据驱动的研究范式,以华中师范大学一门SPOC课程论坛中的164位学生为对象,通过对异步讨论交互数据的全面、深度分析,构建基于多维特征的学习绩效预测模型,进一步揭示在线教学环境下学习者的异步讨论行为特征与学习绩效之间的关系,以期为后续研究提供参考。

二、相关研究

(一)学习绩效预测

学习绩效预测是学习分析领域的核心问题之一,其本质是利用学习者在学习过程中产生的各类数据,运用以机器学习为代表的方法对学习绩效或效果进行预测。教师可根据预测结果及时了解学习者的学习状态,并对学习过程进行及时干预,如改善学习者学习习惯、调整教学策略等(武法提, 等, 2019)。从任务角度划分,学习绩效预测可以是分类任务,如预测学习者是否有不及格的风险(Gray & Perkins, 2019);可以是回归任务,如预测学习者关于某门课程的成绩分值或者排名(Soffer & Cohen, 2019)。

(二)学习绩效影响因素

在在线教学环境下,以异步讨论为代表的数字化学习工具提供了强大的过程性数据采集能力,数据中蕴含了若干影响学习绩效的因素。从数据挖掘角度看,这些因素可称之为特征。结合已有研究,相关特征可分为以下四类:

1. 人口背景

人口背景一般指学习者的性别、年龄、父母职业等。相关研究包括:Alyahyan等(Alyahyan, et al., 2020)通过综述近五年的学习绩效预测研究,发现使用较多的特征是人口统计变量(如学习者的性别、年龄、国籍等);Gardner等(Gardner & Brooks, 2018)针对MOOC学习环境进行了研究,发现学习者的年龄和父母职业等都是学习绩效的重要预测因素;Espinoza等(Espinoza & Taut, 2020)着重考察了学习者的性别和学习绩效的关系,发现性别可以作为预测学习绩效的良好特征。但是,简单基于人口背景信息的学习绩效预测能力有限,通常与其他类型的特征进行组合,实现基于多维特征的学习绩效预测。

2. 行为频数

行为频数是指从学习者学习过程中提取的行为类统计指标,如登录次数、发帖数、作业数、测验数等。Romero等(Romero, López, Luna, & Ventura, 2013)采用学习者发帖总数、发帖总句子数等特征进行学习绩效预测,结果表明,发帖总数、发帖总句子数均是学习绩效的良好预测因子,发帖数越多、句子数越多的学习者更愿意积极参与讨论,并取得更好的成绩;刘三女牙等(2017)和Li等(2018)等发现在学习者的在线活动日志中,如登录次数、作业完成数、测验完成数等是预测学习绩效的强力指标;Cerezo等(Cerezo, Sánchez-Santillán, Paule- Ruiz, & Nú?ez, 2016)采用回归分析发现,学习者在论坛中的发帖总字数也可作为预测学习绩效的有力指标;左明章(2018)等采用定量方法从论坛数据中提取发布时间、文本字数等信息,然后提出基于K-means的学习绩效预测模型。行为频数具有容易采集与量化、特征语义丰富、预测能力强、可解释性好等优势,是学习绩效预测研究使用最广泛的一类特征。749A67E7-4AF0-4AD6-94CB-60315305E7B6

3. 社会网络

社会网络本义指社会行动者(Social Actor)以及彼此关系的集合,具体到教育领域是指学习者之间的关系集合。从学习者互动关系中提取社会网络特征有多种方法,通常可分为两类:一是根据学习者之间的回复关系进行社会网络特征提取,如直接回复;二是基于学习者在讨论中的共同参与情况提取特定关系,如移动窗口(Fincham, Ga evi , & Pardo, 2018)。目前,已有大量研究根据学习者的回复关系定义社会网络,并从中提取特征,分析其对学习绩效的预测能力。如De-Marcos、Gitinabard等采用传统回复网络对学习者讨論数据进行分析,挖掘出中心度、出入度等指标,建立学习绩效预测模型(De-Marcos, et al., 2016; Gitinabard, et al., 2019)。传统研究多数集中于分析回复关系下的网络特征对学习绩效的预测能力,鲜有探讨基于其他关系定义(如移动窗口)的网络特征对学习绩效预测的影响。近年来,有研究发现基于移动窗口定义下的社会网络特征与学习绩效的相关性较强(Fincham, et al., 2018; 刘三女牙, 等, 2020)。因此,有必要进一步探究基于移动窗口等非传统网络特征对学习绩效的预测能力。

4. 时间信息

学习时间对于学习绩效的重要性已得到研究者的关注和证明(Tangtao, Xingli, & Pei, 2018)。目前,在学习绩效预测研究中对时间类特征的利用主要分为两类:一是基于显性时间特征,Xu等(Xu, Wang, Peng, & Wu, 2019)从4,000名学习者的在线学习数据中提取学习时长等特征,再利用决策树、神经网络和支持向量机等机器学习算法预测学习绩效;Gitinabard等(2019)从Pizza论坛中挖掘学习者的在线时间,探索其预测能力。二是挖掘基于时间的隐性特征,Boroujeni等(Boroujeni & Dillenbourg, 2019)采用时间序列方法分析学习者的学习模式如何随时间变化,进而探索学习模式的变化对学习绩效的影响。此外,Barbera等(2015)利用学习者首次参与讨论的时间衡量学习的积极性,分析其对学习绩效的预测能力,并对学习者倾向于何时参与学习讨论进行了研究,发现每个学习者都有独特的参与时间特点,对学习绩效的预测也至关重要。时间信息中蕴涵了大量的隐性特征,为充分理解学习是如何随时间推移而展开的,有必要从时间维度深入分析学习者的学习特征,挖掘出更多具有潜在价值的学习模式与规律,进一步提升学习绩效的预测能力。

三、研究设计

(一)研究问题

综上所述,围绕在线教学异步讨论环境下的人口背景、行为频数、社会网络、时间信息等特征开展学习绩效预测研究,已吸引了国内外大量学者的研究兴趣并取得积极进展,目前正进一步往特征的深层分析与组合建模方向发展。因此,本文重点针对社会网络和时间信息两类特征,以非传统定义下的社会网络特征与基于时间维度的隐性特征为核心,探索不同特征组合对学习绩效预测模型的影响。主要研究问题如下:

1. 采用移动窗口定义下的社会网络特征和传统回复网络特征分别进行预测,对比两者的预测能力是否存在差异?

2. 在特征集合中引入基于时间维度的隐性特征是否可进一步提升预测效果?

(二)研究对象和数据来源

研究数据源于华中师范大学2018学年秋季在SPOC平台上开设的一门“新生研讨课”,该课程主要面向英语专业一年级新生,在教学过程中引入SPOC异步在线论坛进行线上教学,学生通过发帖、回帖等方式开展各种协作性、研讨性学习。经统计,参与讨论的师生总人数为164人,其中包括7名教师、24名大二学生和133名大一新生,帖子总数为9,798条,剔除重复帖、纯标点符号帖等无效数据后,剩余有效帖子数为9,779条。

学习绩效的计算综合考虑了学生的平时表现和期末考核,其中平时表现占80%,期末考核占20%。平时表现的计分规则为:课程论坛提问和回答次数占平时成绩的15%,论坛资源学习占平时成绩的10%,线下课堂出勤、参与度、课堂笔记占平时成绩的25%,课外作业占平时成绩的50%。期末考核成绩的组成为:课程论文占50%,课堂成果展示占50%。

(三)研究方法

按照学习分析或教育数据挖掘的一般流程,主要包括数据清洗、特征提取、模型构建等环节。为提高数据处理和分析的效率,采用领域广泛使用的机器学习套件——Scikit-learn作为研究工具,编程语言选择Python。

1. 数据清洗

使用Scikit-learn库的Pandas包对数据进行清洗,包括:①使用Dropna、Fillna等函数补齐或剔除有缺失值的帖子,保持数据的完整性;②使用Drop_ duplicates函数去除重复帖,保持数据的唯一性。

2. 特征提取

采用以人口背景、行为频数、社会网络、时间信息等为核心的特征分类框架,在此基础上开展在线教学异步讨论环境下学习绩效影响因素的表征与量化。

第一类是人口背景特征集,主要包括性别(男、女)特征。

第二类是行为频数特征集,主要包括发帖次数(学习者在论坛发帖的总次数,利用回帖和发帖的总数目来衡量)和发帖长度(学习者在论坛发帖的总字数,利用每一条帖子的字数之和来衡量)等特征。

第三类是社会网络特征集,分别对直接回复网络和移动窗口网络进行定义。一方面,根据学习者之间的回复层级来提取直接回复网络特征,如图1左边所示,主题帖可表示为S,R1和R2表示主题帖S下的一级回复帖,故R1、R2与S之间存在连线,RR1、RR2和RR3表示R1的二级回复帖,故RR1、RR2、RR3与R1之间存在连线,以此类推。另一方面,根据学习者在论坛的共同参与情况来提取移动窗口网络特征,如图1右边所示,当一个主题S的帖子总数小于N时所有帖子相互连接,否则定义一个大小为N的窗口在主题S中移动,每一步窗口内的所有帖子相互连接。例如,从第一个帖子开始,S、R1和R2存在连线,然后将窗口移动到第二个帖子,R1、R2和RR1存在连线,以此类推直至窗口遍历完主题所有帖子。与直接回复网络相比,移动窗口关系特征不受回复层级影响,更平均地关注了学习者的发帖信息。本文设置移动窗口长度为3,分别从两类社会网络定义特征,包括点出度(学习者给出的回复和反馈数量)、点入度(学习者收到的回复和反馈数量)、接近中心度(反映网络中某一学习者与其他学习者之间的接近程度,可采用一个节点到其他所有节点的最短路径距离累加之和的倒数来衡量)、中介中心度(反映学习者在网络中作为交流媒介的能力,可利用经过一个节点的最短路径数目来衡量)、特征向量中心度(反映某一学习者在网络中的重要性,可采用一个节点的邻居节点数量及邻居节点的重要性来衡量)。749A67E7-4AF0-4AD6-94CB-60315305E7B6

图1 两类社会网络特征定义示意图

第四类是时间信息特征集,分别从显性和隐性时间两个维度定义特征。一方面,显性时间特征包括在线讨论时长(学习者在线讨论总时长,可利用相邻两个帖子之间的时间间隔来估算,如果时间差超过一定阈值则表明学习者可能处于非有效学习状态,不统计在内)和在线讨论天数(学习者在线讨论总天数,利用学习者登录情况计算)。另一方面,隐性时间特征包括积极性(学习者回复主题帖的速度,利用学习者在某一主题帖下首次回复的时间差来衡量,本质是计算在所有主题帖下首次回复时间差的平均值)、规律性(每个讨论主题下学习者首次参与回帖的纵向时间特征,利用学习者回复速度的方差来衡量,本质是计算在所有主题帖下首次回复时间差的方差)等。其中,积极性与规律性的计算方法分别如公式(1)和公式(2)所示,n为主题贴总数,i为第i条主题贴,mi表示第i条主题贴的发布时间,ti表示学习者关于第i条主题贴的首次回帖时间。

[i=1nti-min]    (1)

[[(ti-mi)-i=1nti-min]2n] (2)

综上所述,在以人口背景、行为频数、社会网络、时间信息等为核心的分类框架下,通过对特征的进一步细分与定义得到的特征集合如表1所示。

表1 学习者特征分类和细分指标

[特征类别 细分依据 具体指标 人口背景 人口背景 性別 行为频数 行为频数 发帖次数 发帖长度 社会网络 直接回复

移动窗口 出度 入度 接近中心度 中介中心度 特征向量中心度 时间信息 显性维度 在线讨论总时长 在线讨论总天数 隐性维度 积极性 规律性 ]

3. 模型构建

首先,由于不同特征的量纲不同,为避免各类特征数值取值范围的差异对分类预测的干扰,对所有数值属性进行标准化(Z-Score)处理。其次,在满足正态分布的标准下,依据学习者期末成绩将其学习水平划分为三个层次:80分以下为低水平(Low),80~94分为中等水平(Middle),94分以上为高水平(High)。最后,采用五种主流的机器学习算法(逻辑回归、决策树、多项式SVM、高斯核SVM和神经网络),分别构建基于在线教学异步讨论行为的学习绩效预测模型。所有模型均使用Scikit-learn工具训练,并通过五折交叉验证法进行参数优化与性能评估,预测结果采用准确率、F1值等指标来综合衡量。

四、结果分析

(一)移动窗口与传统回复网络定义下的特征预测能力是否存在显著差异

首先分别将两类社会网络中提取的特征与人口背景、行为频数和显性时间三类特征结合,构成特征集A与B,然后分别采用上述五种机器学习算法在特征集A与B上构建预测模型,相应结果如图2所示。

图2 基于社会网络特征集A与B的预测性能对比

从图2可见,对于准确率指标,基于特征集B构建的五种预测模型的准确率均显著高于特征集A;对于F1值,基于特征集B的预测效果同样普遍优于特征集A。其中,尤其是对于多项式SVM模型,在准确率和F1值上都取得高达7%的性能优势。因此,可以发现两类社会网络定义下的特征对于学习绩效的预测能力存在较为明显的差异,基于移动窗口网络特征的预测能力要优于传统回复网络。

究其原因,一方面是相比直接回复网络,移动窗口关系定义方式不受回复层级影响,更平均地关注了论坛中学习者发布的帖子,最终提取的关系数量相对较多,从中挖掘的出入度等特征更具预测效力,这与Gitinabard等(2019)的研究结论一致;另一方面,从社会网络结构看,在直接回复网络中学习者大多处于边缘位置,教师处于中心位置,而在移动窗口网络中则相反,这充分体现了学习者在学习过程中的主体地位。一般而言,处于中心位置的学习者更有可能获得更高的学习绩效(De-Marcos, et al., 2016)。

由于特征集B为组合特征,包含了移动窗口社会网络、人口信息、行为频数、显性时间等多维特征元素,其中可能存在与学习绩效相关度不高或冗余的特征,有必要进行特征选择,以进一步降低特征维数,并提升模型的预测性能,为此本文采用卡方检验和互信息两种方法进行特征选择。

1. 卡方检验(x2test)

卡方检验(x2test)是一种典型的特征选择方法,其本质是通过计算两个变量间的关联性进行特征筛选,若特征与学习绩效之间的x2显著性水平较高,则表明该特征与学习绩效相关性较强,适合被选作预测因子。本文使用Scikit-learn的Chi2包计算上述特征集B中10个特征元素的x2值,得到其卡方值及相应的p值(显著性水平),根据这两个值衡量每一个特征对于学习绩效预测的置信度,结果如表2所示。

2. 互信息法

对于分类问题,互信息法是用于衡量某个特征对于特定类别所贡献的信息量,信息量越大,该特征与类别之间的相关性越高。本文使用Scikit-learn的Mutual_info_classif包分别计算特征集B中10个特征元素与学习绩效之间的互信息值,根据其大小进行排序,结果如表3所示。

从表2可见,在利用卡方检验进行筛选时,性别、接近中心度等特征的排序较为靠后,预测能力不佳,其次是在线讨论天数、特征向量中心度,因此可考虑剔除这四个特征。但从表3可见,特征向量中心度的排序较高,故综合考虑,保留特征向量中心度。这样经过两类特征选择后,特征集B中保留了7个更具预测效力的特征元素,构成新的特征集C,然后再分别采用逻辑回归、决策树、多项式SVM、高斯核SVM和神经网络五种算法进行模型训练,得到的准确率和F1值如图3所示,五种模型的预测准确率均有不同程度的提升,即用更少的特征取得了更好的预测效果,表明特征选择的有效性。749A67E7-4AF0-4AD6-94CB-60315305E7B6

在上述特征选择过程中,性别、接近中心度和在线讨论天数三项特征被剔除。究其原因:首先对于性别,同Alyahyan等(2020)和Li(2019)的研究结论一致,性别对学习绩效的影响较小。其次对于接近中心度,与中介中心度和特征向量中心度等类似特征相比,其与学习绩效的相关性最低,这和刘三女牙等(2020)的研究结论一致。接近中心度、中介中心度和特征向量中心度虽然都可以衡量学习者的中心地位,但接近中心度侧重于利用学习者之间在讨论交互中的亲密程度来衡量学习者的中心度,而中介中心度和特征向量中心度侧重于衡量学习者在学习互动中充当“中介”的程度,描述了学习者调节社会交往的能力。与接近中心度相比,中介中心度和特征向量中心度更能衡量学习者的社会威望和影响力,学习者的威望越大,影响力越大,往往所取得的学习绩效越高。最后对于在线讨论天数特征,与此相似的是在线讨论时长均可对学习者的在线讨论时间进行衡量,但后者更精确地统计了学习者参与讨论的有效时间,在线讨论天数则主要反映了学习者登录论坛的天数信息,其对学习绩效的预测效力不如在线讨论时长。

此外,通过以上分析可以发现,在四大类特征中仅有行为频数特征未被剔除。有研究表明,在线讨论频数信息是预测学习绩效的重要指标,由于较高的论坛交互频次行为意味着学习者愿意花更多的时间和精力用于学习,因此容易获得较高的学业表现(武法提, 等, 2019; 范逸洲, 等, 2018)。本研究所使用的频数特征包括发帖次数和发帖长度,次数越多通常代表学习者愿意投入更多的时间參与在线讨论和交流,长度越长则往往意味着学习者有自己的分析和思考,主动且深度开展在线讨论。

(二)引入隐性时间特征是否可以获得更好的预测效果

将表1中定义的两个隐性时间特征(积极性与规律性)引入筛选后的特征集C中,构成新的特征集D,然后基于特征集D构建预测模型,得到的预测结果如图4所示。

从图4可见,在引入隐性时间特征之后,五种模型的预测结果均有了进一步的提升(与图3相比),体现出隐性时间特征对学习绩效预测的有效性。从准确率上看,决策树模型的预测性能提升幅度最大,高达5%;高斯核SVM模型的预测效果最好,准确率达87.44%;预测准确率最低的是逻辑回归模型,但和高斯核SVM模型相比也仅存在1%左右的差距。从F1值来看,高斯核SVM模型不仅准确率最高,而且也取得最高的F1值,这表明采用高斯核SVM算法构建学习绩效预测模型的有效性;F1值最低的是决策树模型,但其准确率并非最低,这也说明需采用多个指标对模型性能进行综合评估。

以上表明,在特征集中引入积极性和规律性两个特征后,五个模型的预测准确度均高于85%,表明隐性时间特征对于提升学习绩效预测的有效性。究其原因,积极性衡量学习者在讨论中的整体参与情况,规律性代表学习者的纵向参与模式。积极性不高可能意味着学习者在讨论中存在懈怠、拖延等状况,体现出学习者学习动机不强或时间管理能力较差,从而导致学习质量不高。规律性不强表示学习者难以长期保持积极参与讨论的学习状态,学习投入起伏较大,学习表现也因此受到影响。相比积极性,规律性更能揭示学习者在参与讨论时间上的细微变化。相关研究也表明,学习时间是学习者在学习过程中需要重点把握的因素,只有妥善管理好时间,才有可能取得更好的学习绩效(Xu, et al., 2019)。

(三)教学启示

综上所述,融合多维异步讨论行为特征有效提升了学习绩效的预测能力,最高达87.44%,与已有研究(Wakelam, Jefferies, Davey, & Sun, 2020; Zohair, 2019)相比取得较大提升,表明本文所提出的特征提取、选择以及模型构建等方法的有效性。但需特别指出的是,学习绩效预测研究并非简单追求机器学习预测模型的高准确率,更重要的是探索对提升学习者学习绩效有显著价值、对优化教师教学过程有参考意义的可解释、可信任的特征(刘三女牙, 等, 2021),以及时洞察和干预学习者的学习过程,反思和调整教师的教学过程,促进在线教学模式创新与质量提升。具体启示如下:

1. 在社会网络方面,由于移动窗口网络特征的预测效果优于传统回复网络,因此要加大对交互分析过程中移动窗口的使用,重视移动窗口中学习者交互在提升学习绩效中的重要价值。根据移动窗口社会网络结构下学习者在论坛中互动时的表现和社会地位,对核心成员进行适当引导以建立更广泛的社交关系,实现与更多班级成员进行双向交流。同时,需要特别关注处于网络边缘的学习者,鼓励他们积极投入学习并更多参与讨论。

2. 在学习时间方面,学习者在学习过程中会产生一系列显性时间数据,如在线讨论时长、在线讨论天数等,利用这些数据可以在一定程度上实现对学习绩效的预测,教师也可以根据这些特征对学习者进行适当干预。但由于每个学习者在学习过程中都有其独特的学习模式,有必要从学习者的学习时间数据中深度挖掘其隐性学习模式,如分析学习者在不同时间段的学习积极性等隐性规律,对学习者的学习过程和状态进行更深层次的剖析,使教师对学习者的学习特点有更精细化的洞察,以准确把握学习者的真实需求(Peng & Xu, 2020),并进行有针对性的引导和帮助,进而提升其学习绩效。

五、总结展望

本文面向当前信息技术与教育教学融合创新发展的需求与趋势,着重研究了在线教学场景下基于异步讨论行为特征的学习绩效预测问题,其核心在于如何从讨论数据中挖掘出有教学指导意义和高预测效力的特征集。针对当前研究在异步讨论交互特征的多样化、深层次信息挖掘方面存在的不足,以人口背景、行为频数、显性时间等基本特征信息为基础,重点从社会网络视角引入移动窗口和传统回复网络特征,以及从时间信息维度提取积极性和规律性等隐性特征,不仅增加了异步讨论行为特征的丰富性,得到更多对在线教学有意义的特征,而且有效提升了学习绩效预测模型的性能。749A67E7-4AF0-4AD6-94CB-60315305E7B6

未來可以进一步加大多学科交叉研究力度,利用各类新型传感器采集在线教学环境下学习者的多模态数据,如从生理、心理等多个层面对学习者的行为与特征进行关联分析,从帖子内容语义方面挖掘学习者的认知风格,提取深度融合帖子内容语义信息的社会网络特征等。同时,也可以结合智慧教室场景,引入学习者线下学习行为数据,构建线上线下多维特征融合的特征集,将在线行为拓展至混合教学情景,扩大学习行为分析空间,提升学习绩效的预测能力。

[参考文献]

范逸洲,汪琼. 2018. 学业成就与学业风险的预测——基于学习分析领域中预测指标的文献综述[J]. 中国远程教育(1):5-15.

胡航,杜爽,梁佳柔,等. 2021. 学习绩效预测模型构建:源于学习行为大数据分析[J]. 中国远程教育(4):8-20,76.

刘三女牙,郭美伶,胡天慧,等. 2020. 不同关系定义下在线交互网络特点及其与学习绩效关系——以SPOC论坛为例[J]. 开放教育研究,26(3):80-90.

刘三女牙,刘盛英杰,孙建文,等. 2021. 智能教育发展中的若干关键问题[J]. 中国远程教育(4):1-7,76.

刘三女牙,彭晛,刘智,等. 2017. 面向MOOC课程评论的学习者话题挖掘研究[J]. 电化教育研究,38(10):30-36.

沈欣忆,刘美辰,吴健伟,等. 2020. MOOC学习者在线学习行为和学习绩效评估模型研究[J]. 中国远程教育(10):1-8,76.

武法提,田浩. 2019. 挖掘有意义学习行为特征:学习结果预测框架[J]. 开放教育研究,25(6):75-82.

左明章,赵蓉,王志锋,等. 2018. 基于论坛文本的互动话语分析模式构建与实践[J]. 电化教育研究,39(9):51-58.

Alyahyan, E., & Dü?teg?r, D. (2020). Predicting academic success in higher education: Literature review and best practices. International Journal of Educational Technology in Higher Education, 17(1), 1-21.

Barbera, E., Gros, B., & Kirschner, P. A. (2015). Paradox of time in research on educational technology. Time & Society, 24(1), 96-108.

Boroujeni, M. S., & Dillenbourg, P. (2019). Discovery and temporal analysis of MOOC study patterns. Journal of Learning Analytics, 6(1), 16-33.

Busto, S., Dumbser, M., & Gaburro, E. (2021). A simple but efficient concept of blended teaching of mathematics for engineering students during the COVID-19 pandemic. Education Sciences, 11(2), 1-24.

Chang, T. Y., Hsu, M. L., Kwon, J. S., Kusdhany, M. L. S., & Hong, G. (2021). Effect of online learning for dental education in asia during the pandemic of COVID-19. Journal of Dental Sciences, 16(4), 1095-1101.

Cerezo, R., Sánchez-Santillán, M., Paule-Ruiz, M. P., & Nú?ez, J. C. (2016). Students LMS interaction patterns and their relationship with achievement: A case study in higher education. Computers & Education, 96, 42-54.

De-Marcos, L., García-López, E., García-Cabot, A., Medina-Merodio, J. A., Domínguez, A., Martínez-Herráiz, J. J., et al. (2016). Social network analysis of a gamified e-learning course: Small-world phenomenon and network metrics as predictors of academic performance. Computers in Human Behavior, 60, 312-321.

Espinoza, A. M., & Taut, S. (2020). Gender and psychological variables as key factors in mathematics learning: A study of seventh graders in Chile. International Journal of Educational Research, 103, 1-16.749A67E7-4AF0-4AD6-94CB-60315305E7B6

Fincham, E., Ga?evi , D., & Pardo, A. (2018). From social ties to network processes: Do tie definitions matter? Journal of Learning Analytics, 5(2), 9-28.

Galikyan, I., & Admiraal, W. (2019). Students engagement in asynchronous online discussion: The relationship between cognitive presence, learner prominence, and academic performance. The Internet and Higher Education, 43, 1-9.

Gardner, J., & Brooks, C. (2018). Student success prediction in MOOCs. User Modeling and User-Adapted Interaction, 28(2), 127-203.

Gitinabard, N., Xu, Y., Heckman, S., Barnes, T., & Lynch, C. F. (2019). How widely can prediction models be generalized? Performance prediction in blended courses. IEEE Transactions on Learning Technologies, 12(2), 184-197.

Gray, C. C., & Perkins, D. (2019). Utilizing early engagement and machine learning to predict student outcomes. Computers & Education, 131, 22-32.

Han, F., & Ellis, R. A. (2019). Identifying consistent patterns of quality learning discussions in blended learning. The Internet and Higher Education, 40, 12-19.

Li, K. (2019). MOOC learners demographics, self-regulated learning strategy, perceived learning and satisfaction: A structural equation modeling approach. Computers & Education, 132, 16-30.

Li, Q., & Baker, R. (2018). The different relationships between engagement and outcomes across participant subgroups in massive open online courses. Computers & Education, 127, 41-65.

Peng, X., & Xu, Q. (2020). Investigating learners behaviors and discourse content in MOOC course reviews. Computers & Education, 143, 1-14.

Romero, C., López, M. I., Luna, J. M., & Ventura, S. (2013). Predicting students final performance from participation in on-line discussion forums. Computers & Education, 68, 458-472.

Soffer, T., & Cohen, A. (2019). Students engagement characteristics predict success and completion of online courses. Journal of Computer Assisted Learning, 35(3), 378-389.

Tang, H., Xing, W., & Pei, B. (2019). Time really matters: Understanding the temporal dimension of online learning using educational data mining. Journal of Educational Computing Research, 57(5), 1326-1347.

Wakelam, E., Jefferies, A., Davey, N., & Sun, Y. (2020). The potential for student performance prediction in small cohorts with minimal available attributes. British Journal of Educational Technology, 51(2), 347-370.

Xu, X., Wang, J., Peng, H., & Wu, R. (2019). Prediction of academic performance associated with internet usage behaviors using machine learning algorithms. Computers in Human Behavior, 98, 166-173.

Zohair, L. M. A. (2019). Prediction of students performance by modelling small dataset size. International Journal of Educational Technology in Higher Education, 16(1), 1-18.

收稿日期:2021-08-22

定稿日期:2021-11-03

作者简介:孙建文,博士,副教授,博士生导师;胡梦薇,硕士研究生;劉三女牙,博士,教授,博士生导师;李卿,博士,副教授,硕士生导师;沈筱譞,博士后,本文通讯作者。华中师范大学教育大数据应用技术国家工程研究中心(430079)。

基金项目:本文受教育部人文社会科学研究青年项目“面向启发式教学的智能课堂编排模型与方法研究”(项目编号:20YJC880083)、国家自然科学基金面上项目“多传感数据驱动的智能课堂共享调节机理与量化分析方法”(项目编号:62077021)、教育部-中国移动科研基金研发项目“在线教育发展现状分析与政策研究”(项目编号:MCM20200406)和华中师范大学研究生教学改革研究项目“AI增强的智能课堂教学编排研究与实践”(项目编号:2020JG14)资助。749A67E7-4AF0-4AD6-94CB-60315305E7B6

猜你喜欢

学习者预测特征
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
你是哪种类型的学习者
十二星座是什么类型的学习者
如何表达“特征”
不忠诚的四个特征
抓住特征巧观察
汉语学习自主学习者特征初探
论远程学习者的归属感及其培养