基于学习行为的MOOC 用户持续学习预测框架
2023-02-09陈辉白骏殷传涛荣文戈熊璋
陈辉,白骏,殷传涛,荣文戈,熊璋
(1. 北京航空航天大学 计算机学院,北京 100191; 2. 北京航空航天大学 中法工程师学院,北京 100191)
大型开放式网络课程(massive open online courses, MOOC)作为目前一种最重要的在线学习机制之一,极大地改变了学习者的学习行为,使得不同的学习者能够不受时间和空间的限制,随意进行感兴趣知识的学习,因此,MOOC 在当今网络学习大潮中扮演越来越重要的角色,受到越来越多的欢迎[1]。然而,作为一种新的学习机制,MOOC 的发展遇到了一系列的挑战,其中一个最重要的问题是,有相当多的学习者无法完成MOOC 平台上的课程学习,Lykourentzou 等[2]通过研究显示,只有不到10%的注册用户可以在MOOC 平台上完成特定的课程学习。
对于任何一个新的信息化系统,其成功的要素一般可以从用户使用过程中的愉悦度、参与度、接受度、留存率及任务完成度等角度来研究,该HEART 度量框架是一个广泛适用的评价体系[3]。因此对于MOOC 平台,如何吸引学习者能够留在MOOC平台中不断学习,去完成一些特定课程,提高留存率和任务完成度,是一个非常重要的任务,尽管简单地使用退课率来评估MOOC 平台对于学习者的学习效果可能并不一定准确,但其确实反映了一些具有挑战性的问题且值得进一步研究。
学习者的学习习惯对于学习的效果会有直接的关联,不同的课程内容对于学习的效果也有不同的作用。因此,更好地了解学习者对于不同课程的学习特征对于MOOC 平台的退课预测研究有着重要的价值。对于学习者来说,有很多因素可能会影响注册用户在MOOC 平台上学习课程的持久性,如年龄、性别、以往的学习经历、受教育程度等[2],此外,学习者在MOOC 平台上的一些学习习惯,也可能对其在平台上的学习效果产生重要的影响,比如在学习过程中尝试提交作业或其他测试的行为[4],对论坛帖子的浏览和关注[5],课程视频的点击[6]等。同样的,不同类型的课程,如课程内容上的差异[7]等,也可能会有不同的退课表现。因此,本文在研究MOOC 平台退课率时,不仅要研究学习者学习习惯带来的影响,也要研究课程本身带来的影响。基于这样的思考,本文提出了一个基于用户和课程感知增强的活动学习框架。在该框架中,首先提出了一种语义感知编码机制来分别对用户和课程的活动进行编码,然后使用注意机制分别从用户和课程的角度提取学习活动的相关性,最后设计了一个基于门控机制的上下文提取机制,将用户和课程的特征整合在一起,以实现最终的退课行为预测。为了评价所提框架,本文在XuetangX 数据集上[8]进行了实验研究,实验结果验证了本文提出的退课预测框架的可行性。
1 MOOC 退课率预测现状
近年来,MOOC 平台为全世界各地的数百万用户提供了众多的免费在线课程[9],一些MOOC 平台,例如Coursera、udacity、edx、XuetangX 等已经成为开放式和远程教育最重要的在线学习平台[1]。尽管MOOC 的优势已经得到充分证明,但值得注意的是较高的退课率已成为MOOC 实际应用中最重要的一个挑战[10],有研究表明,超过90%的用户都不能顺利地在MOOC 平台上完成课程[11]。因此,预测学习者放弃课程的可能性就变得非常重要[12],从而使得MOOC 平台能够及时提供支持性干预措施,通过各种不同的激励方法来鼓励学习者继续完成课程的学习[13]。
通过分析用户在MOOC 平台上学习课程方面的特点,预测其潜在的退课可能性是在线教育领域一个非常重要的课题[14],2015 年KDD 大会还特地为此类退课率预测挑战举办了数据挖掘的竞赛。为了降低退课率,需要给学习者提供一个满意的MOOC 平台学习体验,而好的学习体验与很多因素相关[15],例如:学习者本身背景、课程内容、平台的质量、学校的特点等。有学习者通过研究指出,MOOC 平台上学习者退课率高的主要因素和学习者的学习行为与MOOC 平台属性相关,其中与学习者相关的属性包括学习的动机、学习时间、背景知识和技能等因素,而与MOOC 平台相关的属性包括课程设计和课程互动性等因素[7]。类似的,Goopio 和Cheung[16]的研究表明,MOOC 平台上的退课率主要与学习体验、互动性、课程设计、技术、语言、时间和情境七大因素有关。
为了降低MOOC 平台学习者的退课率,一个可行的解决办法是尽早预测退课行为,从而使得平台能够提前部署一些干预手段,帮助和鼓励学习者来完成课程[17]。不同学习者的不同学习行为、学习习惯和学习时间都会影响学习者的退课行为,这其中学习者的学习行为对于退课的预测有着非常重要的作用[14]。在MOOC 平台上,通过研究分析学习者的学习行为来预测退课的可能性一直是退课率预测领域的重要挑战。例如,文献[18-19]对学生参与MOOC 课程的情况进行了调查,开发了一种潜在动态因子图(LadFG)来建模和预测学习行为,同时,进一步提出融合特征提取、特征选择和学习者分类的预测模型,并利用MOOC 平台提供的一些学习行为特征进行预测。
在研究MOOC 平台的学习者学习行为特征的工作中,最常用的一种学习行为特征是注册用户在MOOC 中学习模式的点击流。点击流是网络课程研究中一个重要的学习者行为的时间序列指标[20],通过使用点击流数据可以构建一个不断变化的学习者学习状态表示,利用这个学习状态表示,就能对学习者进行跟踪,从而预测其可能出现的退课行为。点击流是一种重要的行为模式,并且是评估MOOC 学习成果的一种重要数据来源[21-22],因为不同的学生通常有不同的学习方式,这意味着对于同一门课程,不同类型的学习者可能会有不同的活动和学习结果[23]。为了更好地了解点击流,需要更好地对点击流进行建模,较早的尝试提取用户操作方面的特征,如不同点击类型的计数[24],虽然这种方法显示出一定的效果并且易于实现,但无法研究点击流所包含的一些复杂属性,比如点击之间的顺序[25]。目前随着深度学习技术的发展,出现了许多基于神经网络的方法来对点击流进行建模。
为了充分利用点击流中的顺序信息,一些研究人员建议使用序列感知学习技术来研究学习者学习模式,进而预测学习者的退课行为。例如,Wang等[26]提出一种基于递归神经网络(recurrent neural network, RNN)的深度模型用于退课预测。类似的,Tang 等[27]提出一种基于RNN 具有短期记忆单元的方法。Xiong 等[28]则进一步开发了基于长短期记忆(long short-term memory, LSTM)网络的方法来预测学习状态。同样,Fei 和Yeung[25]提出一个LSTM 单元的神经网络模型进行退课预测[29]。这种针对学习者学习行为序列的建模方法在预测退课行为时显示出了巨大的潜力,因为点击流确实具有顺序属性。但是,点击流活动序列内不同活动之间的内在联系也值得充分研究。例如,与其他活动相比,“加载视频”与“观看视频”的相关性更高。因此,有学者指出,除了点击流内部活动之间的时序特性,部分点击流内部活动之间的依赖性应该也有助于提高总体退学预测任务的准确性。
在研究点击流内部活动关系方面,Wang 等[26]提出了一种结合了卷积神经网络(convolutional neural networks, CNN)和RNN 方法的ConRec 网络,从原始MOOC 数据中自动提取特征。类似的,为了利用学习行为之间的相关性,Wen 等[23]设计了一个基于时间序列的二维矩阵作为CNN 模型的输入,将时间信息与学习者的行为特征相结合,利用时间序列解决行为特征的局部相关性问题。除了研究活动之间的相关性以外,还需要指出不同用户和不同课程可能具有不同的活动模式,这意味着活动相关性也应分别从用户和课程的角度进行研究。实际上,一些研究人员指出,从用户和课程不同的角度去研究活动相关性也将影响MOOC 课程的退课率预测[30],因为不同的课程可能与活动具有不同的相关模式,在学习行为的研究中,不同种类的课程对学生的学习行为可能有不同的影响[15]。Feng 等[8]针对这个问题进行了研究,提出了一种上下文感知功能交互网络(context-aware feature interaction network,CFIN)来预测辍学概率,并在更大的数据集上取得了最好的结果。
2 退课预测框架
2.1 问题定义
令u∈U和c∈C为用户和课程,其中U和C分别为用户集合和课程集合,从用户u学习周期为Dh的c课程学习日志中提取用户的学习行为X(u,c),其中每个元素xi(u,c)表 示特定的行为,vi是xi(u,c)的归一化统计值,其相应的行为名称为si={wij}lis=i1(如“加载视频”),其中wij表 示行为xi(u,c)名 称中的第j个单词, lsi为该名称的长度。学习行为的上下文信息包含用户信息Z(u)和 课程信息Z(c),其中用户信息元zi(u)包含学习者的个人基本信息(如年龄、性别、受教育程度、注册课程数量等),课程信息元素zi(c)则包含课程基本信息(如课程种类及注册课程的用户数)。
退课预测任务可根据上述变量形式化定义为:给定过去时间段内发生的学习行为X(u,c)及相关上下文信息Z(u)和Z(c) , 预测用户u是否会在预测周期Dp内 放弃课程c的学习,用于是否退课的结果是一个二分类的值y(u,c),用1 表示用户在预测周期内没有放弃学习任务,否则为0,因此本文目的是学习一个预测函数,使得其预测结果yˆ(u,c)尽可能地逼近真实结果y(u,c)。
2.2 框架结构
针对MOOC 平台学习者的学习行为,本文首先提取学习行为的语义信息,并捕捉学习行为之间的交互关系。在此基础上,进一步从用户和课程的角度分别对行为进行分析,获得从用户和课程角度观察到的行为信息,最后,通过一个门控机制将用户、课程信息及与用户、课程相关的行为交互特征进行融合,并最终用于用户退课的预测,因此,本文提出一个基于用户和课程信息感知增强的行为学习框架,如图1 所示。
图1 基于用户和课程信息感知增强的退课预测框架Fig. 1 User and coursed information perception enhancement based dropout predication framework
2.2.1 用户和课程的语义编码
为了构建一个有效的退课预测框架,本文需要设计一个有效的方法来表示上下文信息和学习行为。早期工作一般直接使用随机初始化的嵌入层或学习行为统计值作为表示层,而忽略了此类信息的语义。因此,本文提出语义感知编码层(semantic aware encoding,SAE),从上下文信息和学习行为中提取语义感知特征。
图2 基于语义编码的点击活动特征编码Fig. 2 Semantic oriented based click activity feature encoding
2.2.2 多角度特征增强
在退课预测任务中,有一些学习行为是相互关联的,如“加载视频”和“播放视频”有时序先后关系。这类相关性可以帮助框架更深入地了解用户行为。为了使框架具备对学习行为之间相互作用的建模能力,本文提出了多角度特征增强层(multiperspective feature enhancement,MFE),该层从多个角度提取了学习行为之间的相关性。
令Fa∈Rla×de表示学习行为特征张量,fia表示Fa中 第i类 行为所对应的分量,其中la和de分别表示学习行为的数量和学习行为特征张量的长度。为了从多角度提取学习行为之间的相关性,本文采用了多头缩放点积自注意力机制,每个头的特征Hi用于提取单个角度的相关性,其计算式如下:
式中:lh为注意力多头数,本文利用线性层整合不同的头特征,并分别使用层归一化和残差连接来稳定特征比例和梯度。于是获得了具有多角度相关性增强的学习行为特征F˜a:
2.2.3 基于门控机制的上下文相关特征优化
每个学习行为的重要性会根据用户和课程的不同而变化,因此,直接使用所有学习行为的特征会存在很多噪声从而导致预测性能较差。为了融合学习行为的相关上下文信息来优化行为特征,本文提出了基于门控机制的上下文相关特征提取优化层(gated context-related feature refine,GCR),该层分别基于用户信息特征和课程信息特征得到带有相关注意力机制的行为特征,然后使用门控机制合并这2 个特征。
式中:WG为用于计算门孔得分的线性层映射矩阵。
3 实验验证
3.1 数 据 集
为了验证所提出的框架,在本文研究中,对XuetangX 数据集的教师定型模式课程进行了实验。XuetangX 数据集发布于2019 年,包含超过220 000个实例,并且比KDDCUP 2015 大得多,KDDCUP 2015也来自XuetangX 数据集,且包含超过120 000 个活动日志。本文通过预处理并将整个数据集拆分为142 149 个训练实例,15 794 个开发实例和67 699 个测试实例,与文献[8]采用了相同的配置,历史期和预测期分别为35 d 和10 d。
3.2 实验设置
本文根据开发集上框架的性能选择超参数。选择与文献[8]相似的配置,使用50 维的GloVe 嵌入向量和1 个包含50 个隐藏单元的LSTM 层。此外,使用了1 层4 头自注意力层,使用Adam 优化器对框架进行了优化,并将学习率设置为 10-4。权重为 10-5的L2 正则化还可以避免过度拟合。将批次大小设置为32,训练了50 个epoch,使用在开发集上表现最佳的框架参数来进行评估。
3.3 对比方法
为了验证所提框架,本文将其与其他方法进行比较。
1) 逻辑回归(logistics regression, LR):LR 是一种广泛用于分类的线性回归分析方法。能够基于对不同变量之间的回归系数的分析来估计某个事件是否会发生。LR 已作为基本技术[31-32]应用于许多MOOC 退课预测任务中。
2) 支持向量机(support vector machine, SVM):SVM 广泛用于二分类任务,并且能够利用从点击流[33]中精心选择的特征来预测MOOC 退课。
3) 随机森林(random forest, RF):RF 是基于决策树的方法,在训练过程中引入随机性来提高分类器的性能,也是一种MOOC 退课预测[34]中广泛使用的基本方法。
4) 梯度提升决策树(gradient boosting decision tree, GBDT):基于GBDT 的退课预测模型是使用决策树的整体来预测标签,深度大于1,并且在此任务中显示了可喜的结果[35]。
5) 全连接神经网络(deep neural network, DNN):1 个3 层DNN,用于研究将深度学习技术用于退课预测任务的可行性。
6) CFIN:上下文感知功能交互网络[8],是目前面向较大的XuetangX 数据集的重要模型。
3.4 评估指标
本文使用精度(ACC)[36]、接受者操作特征曲线(ROC)、曲线下的面积(AUC)[37]来评估所提框架的性能。对于二分类问题,根据预测分类和实际标签可以将样本划分为4 类,即真正例(TP)、假正例(FP)、真反例(TN)和假反例(FN)。分类结果可以用“混淆矩阵”表示,如表1 所示。
表1 分类结果混淆矩阵Table 1 Confusion table confusion matrix for classification results
分类框架中每个样本的输出结果一般为实数值,对于设定的阈值,将该实数值和阈值比较,大于阈值的为正样本,反之为负样本。通过设定不同的阈值,可以得到不同的分类结果。将样本按照预测得到的实数值从高到低进行排序,将每个样本对应的实数值作为阈值,就可以得到和样本数量相当的分类结果。考虑不同阈值下的分类结果,综合反映了分类框架得到结果的排序质量,从而能够更好地反映框架的泛化能力。根据实际标签,可以计算出假阳率(FPR)及真阳率(TPR)的值:
ROC 也可以利用FPR 和TPR 来计算,将每个阈值对应的(FPR,TPR)点绘制在坐标图中,得到ROC 曲线,ROC 曲线的横坐标为假正例率,纵坐标为真正例率。利用ROC 曲线对分类框架效果进行比较时,若各框架的ROC 曲线没有发生交叉,直观上来讲,最外层的ROC 曲线包覆住了其他框架的ROC 曲线,因此,最外层的ROC 曲线对应的分类框架效果最好。若框架的ROC 曲线发生了交叉,那么通常采用比较ROC 曲线下面积的方式[37]。因此,该面积即AUC 被采纳为通用的分类框架优劣判据。在实际训练过程中一般只有有限个样本,因此绘制得到的ROC 曲线由有限个(FPR,TPR)点连接而成,点坐标集合为:{ (x1,y1),(x2,y2),...,(xm,ym)},则AUC可以采用将黎曼积分化为求和形式的方法求解:
3.5 结果与分析
表2 列出了有关ACC 和AUC 的总体性能,就AUC 而言,本文提出的框架可以胜过大多数机器学习方法,但要比最先进的方法CFIN 要低一些。而在ACC 方面,本文提出的框架可以胜过CFIN。表2表明,本文提出的框架与大型数据集中的复杂方法相比具有竞争优势。
表2 ACC 和AUC 总体性能Table 2 Overall performace in terms of ACC and AUC
为了进一步分析提出的SAE、MFE 和GCR 组件的效果,本文还通过以下方法进行消融研究:①使用随机初始化的特征向量而不是语义感知编码层(不包含SAE);②删除多视角特征增强层(不包含MFE);③用平均池化层替换增强的学习行为特征(不包含GCR)上门控的上下文相关特征优化层。本文注意到最明显的下降发生在没有MFE 的情况下,这证明了捕获学习行为之间交互关系的重要性。在没有SAE 的情况下,所获得的框架特征语义要比具有随机初始化特征的框架更好。如表3所示,门控上下文相关特征细化层可以帮助框架过滤不相关的活动特征,并根据不带GCR 的结果提高性能。
表3 消融实验Table 3 Ablation test
3.6 案例与分析
本文对一个测试样本进行采样,并可视化其学习行为-学习行为注意力得分、上下文信息-学习行为注意力得分。
如图3 所示,学习行为与学习行为之间的注意力系数热度图,可以看到框架可以捕捉到一些具有明显时序关系的学习行为之间的交互关系,如“点击论坛”与“问题获取”、“问题获取”与“创建评论”之间的注意力分数明显要更高。而对一些相关性较低的学习行为组合则分配了较低的注意力分数,如“播放视频”和“关闭课件”。
图3 学习行为-学习行为注意力热度图Fig. 3 Study activity-study activity attention heat map
如图4 所示,上下文信息与学习行为之间的注意力系数热度图,可以看到用户功能主要集中在学习行为“问题获取”和“创建评论”上,而课程功能则关注于学习行为“点击课件”、“关闭课件”及“载入视频”等,这有助于框架过滤噪和提取与上下文最相关的学习行为特征。
图4 上下文信息-学习行为注意力热度图Fig. 4 Context-study activity attention heat map
4 结 论
针对MOOC 平台较高退课率的问题,本文提出了一个基于长短时记忆机和多头注意力机制的MOOC 平台用户学习情况预测框架,在该框架中:
1) 提出语义编码机制,将用户的学习行为进行分析,为用户和相应课程进行编码,可以更好地获得用户和课程的特征。
2) 提出一个多角度的用户和课程之间交互的编码方法,更好地将用户和课程之间的交互关系进行分析。
3) 提出基于门控机制的上下文相关行为特征优化机制,最后将获得的用户、课程及优化后的行为交互特征融合并用于退课预测,并在XuetangX数据集上进行了实验验证。
4) 所提框架能获得较好的总体性能,消融实验也验证了本文提出的不同编码机制和特征融合机制的有效性。本文所提方法能够使得MOOC 平台能够尽可能早的对用户活动进行干预,从而提升整体的MOOC 平台使用体验。