面向个性化学习的认知诊断模型及其应用综述
2021-11-22黄卓轩唐文胜
马 华,黄卓轩,唐文胜
(湖南师范大学 信息科学与工程学院,湖南 长沙 410081)
0 引 言
教育大数据背景下针对学生特点进行个性化教育以实现因材施教,是当前智慧教育研究的一个重要方向。近年来在线教育和各大在线学习平台发展迅猛,推动了在线学习的大规模普及[1-2]。随着在线学习平台中学习资源的日益丰富,如何为学生提供个性化的学习服务变得日益重要。基于学生的在线学习数据,借助教育数据挖掘(educational data mining,EDM)的技术手段对学生进行学习状况的分析,针对学生的实际特点进行个性化学习的准确推荐,以实现因材施教,是当前的一个重要研究热点[3]。为了实现对学生的个性化学习指导,首先需要鉴别学生当前的学习状态[4]。传统的教学方法依靠教师经验进行判断,不仅需要耗费大量的时间和精力,也难以保证评价结果的准确度,更不适合在线学习环境下学生规模急剧增加的应用场景。
为此,研究者尝试引入教育心理学中的认知诊断(cognitive diagnosis,CD)方法刻画学生的学习状态。认知诊断的关键是构建反映学生问题解决过程的Q矩阵并选用适当的认知诊断模型(CD models,CDMs)对学生进行建模。由于能够较好地从知识点层面分析学生的认知状态,CDM已在国内外受到广泛关注,研究者对传统的CDM,即项目反应理论(item response theory,IRT)[5]和DINA(deterministic inputs,noisy and-gate)模型[6]进行了深入分析,并针对其不足提出了HO-DINA[7]、P-DINA[8]、FuzzyCDF[9]和R-FuzzyCDF[10]等改进模型。
借助于CDM来准确鉴别学生当前的认知状态,是实现个性化学习指导的前提。为更好地帮助学生开展个性化学习,国内外学者结合在线学习背景进行了认知诊断模型在实际教学中的应用研究,目前已在学生考试成绩预测(predicting examinee performance,PEP)[9-10]、个性化学习资源推荐[11]和协同学习小组构建[12]等方面进行了诸多探索。
现有成果对于推动智慧教育环境下针对学生特点进行个性化教育以实现因材施教具有重要的现实意义。因此,通过文献分析,文中梳理了当前面向在线个性化学习的认知诊断模型及其应用的研究进展,分析了认知诊断模型在个性化学习中的未来研究方向,以期为相关研究者提供借鉴与参考。
1 认知诊断模型的研究进展
心理与教育测量中,对个体的认知过程、加工技能或知识结构的诊断评估被称为认知诊断[4]。在认知心理学和心理测量学理论基础上,人们提出了具有认知诊断功能的心理计量模型,即CDM。CDM可分为离散型和连续型两种类型,各自最具有代表性的是IRT和DINA模型。其中,IRT[5]将学生的认知状态描述成一维的能力值,并结合难度、区分度等试题参数对学生进行建模。而DINA模型[6]结合Q矩阵使用一个涉及多维知识点的向量来描述学生实体。
1.1 项目反应理论
IRT假设每个学生都有一种独特的“潜在特质”,即每个学生都有自己的潜在能力。通过学生在具有区分度、难度等特征的试题上的做题情况,IRT可以将学生建模为一维的连续能力值。该理论的双参数反应模型表达式[5]为:
(1)
其中,P(Xij=1|θ)表示潜在特质水平为θ的学生i答对试题j的概率;a为知识点区分度参数;b为知识点的难度参数;D是经验参数,通常取值为-1.7[13]。
IRT构建于严谨而复杂的数学模型之上,在一些大型考试和传统的智力测验中得到推广应用,但是,IRT也存在明显不足,例如单维性(即测验测量的是单一潜在特质)假定难以满足、计算复杂、对测验条件要求较严格(即需要较大的样本容量、较广的被试能力分布范围、较多的试题数量)等。
1.2 DINA模型
不同于IRT,DINA模型不仅将学生在试题上的作答情况作为输入,同时结合试题知识点关联矩阵(Q矩阵),将学生建模成一个在多维知识点上的掌握向量,其中Q矩阵表示试题与考察的知识点的关联矩阵。具体地,在已知学生i的知识点掌握向量αi={αi1,αi2,…,αik}的情况下,可根据式(2)计算学生i对试题j的掌握程度:
(2)
其中,qjk表示试题j是否考察了知识点k(1代表已考察,0代表未考察),ηij=0表示学生i无法正确回答试题j,ηij=1则认为学生i可以正确回答试题j。
然而,传统的DINA模型也存在一定缺陷,为全面掌握学生的学习情况,以有效指导学生的个性化学习,近年来国内外研究者对DINA模型进了多种改进探索。
1.3 改进的DINA模型
现有改进的DINA模型主要可分为以下三类:
(1)改进评分机制的DINA模型。针对DINA模型仅适应于包含0分和满分的两级0-1评分机制的不足,徐冬波等人[8]开发了支持多级评分的P-DINA模型,可适应从0分到满分区间内共(满分+1)种不同的评分类别,计算公式如下:
P(Yij=t|αi)=P*(Yij=t|αi)-
P*(Yij=t+1|αi)
(3)
其中,P(Yij=t|αi)表示学生i的认知状态为αi时在试题j上恰得t分的概率,P*(Yij=t|αi)表示学生i的认知状态为αi时在试题j上得t分及t分以上的概率,P*(Yij=t+1|αi)表示学生i的认知状态为αi时在试题j上得t+1分及t+1分以上的概率。
针对P-DINA模型下学生的得分可能被推向0分或满分两个极端,蔡艳等人[14]提出了rP-DINA模型,通过学生的认知状态α和试题与知识点的关系向量qj对学生的理想得分进行重新构造,可支持从0分到满分的各种理想得分。具体计算公式如下:
(4)
(2)增加主观题诊断的DINA模型。传统DINA模型只针对客观题进行诊断,即答案只有对和错两种结果,未考虑学生在主观题上的答题情况。针对传统DINA模型无法有效诊断主观题的问题,Wu等人[9]提出了一种面向学生个性化学习的模糊认知诊断分析框架(fuzzy CD framework,FuzzyCDF)。首先利用IRT的双参数反应模型表达式计算学生对于知识点的认知状态,即将学生对于知识点的认知能力表示为模糊集合的隶属度(即一个[0, 1]范围内的实数),之后采用模糊交和模糊并来建模客观题和主观题的认知作答模式。具体地,FuzzyCDF[9]认为学生对客观题和主观题的掌握程度分别是连接型(conjunctive)和补偿型(compensatory)。对于客观题,学生只有掌握了试题考察的所有知识点才能掌握该试题,而对于主观题,学生掌握的知识点越多,其对主观题的掌握程度也就越高,进而在主观题上的得分也就越高,计算公式如下:
(5)
(6)
其中,ηij表示学生i在试题j上的掌握程度,αk(i)表示学生i在知识点k上的掌握程度,qjk表示试题j是否考察了知识点k,1代表已考察,0代表未考察,∩和∪分别表示模糊理论中的模糊交和模糊并,具体的计算公式如下:
(A∩B)(x)=min(A(x),B(x))
(7)
(A∪B)(x)=max(A(x),B(x))
(8)
其中,式(7)针对客观题,式(8)针对主观题。
李忧喜等人[10]在FuzzyCDF的基础上提出R-FuzzyCDF模型,它在知识点的掌握程度中引入了知识点重要性因子,将知识点的重要程度与其后继知识点的个数以及相关的试题数量关联起来,具体计算公式如下:
(9)
此外,R-FuzzyCDF还重新定义了学生对于主观题掌握程度的计算公式,具体如下:
(10)
其中,ηij表示学生i在试题j上的掌握程度,i(k)表示学生i对于知识点k的掌握程度,qjk表示试题j是否考察了知识点k(1代表已考察,0代表未考察),∑i1≤k≤K,qji=1(k)表示学生i对试题j所涉及到的所有知识点的掌握程度的和,分母表示试题j考察的知识点数量。该模型进一步提升了认知诊断模型的准确率,但增加参数数量加重了计算负担。
(3)高维CDM。为描述CDM中多个潜在特质之间可能存在的结构关系,研究者们开发了高阶认知诊断模型。针对CDM中被测试者对属性的掌握可能受到一个(或多个)更高阶的潜在特质的影响且为减少参数估计的数量,De la Torre和Douglas[7]提出了高阶潜在结构模型,将它与DINA相结合可得到高阶DINA(HO-DINA)模型。鉴于HO-DINA模型只能处理包含二阶潜在结构的数据,为实现对包含三阶潜在结构的测评,詹沛达等人[15]提出了一种多阶认知诊断MO-DINA模型。
传统的DINA模型大多基于小样本数据,当面对类似像2020年新冠疫情背景下的大规模在线学习所产生的海量数据时,DINA模型收敛速度慢,导致诊断效率大大降低。针对此,王超等人[3]提出了结合增量算法和最大熵方法的DINA加速方法,有效改善了DINA模型的计算效率。
1.4 其他CDM
随着计算机性能瓶颈的突破,深度学习技术得到快速发展,人工神经网络(artificial neural network,ANN)已经成为人工智能领域研究的热点。它是一种模拟人类的大脑神经系统处理外界复杂信息机制的数学模型,目前在模式识别、自然语言处理、图像分割等领域得到广泛应用。Song等人[16]针对IRT在稀疏数据上诊断效果差的问题,提出了DIRT模型,利用神经网络对挖掘试题的文本信息并对传统IRT公式中的参数进行估计,增强了模型的鲁棒性。Wang等人[17]通过神经网络应用与教育认知诊断,提出了NeuralCDM,它不仅利用了学生得分矩阵和试题知识点关联矩阵,还通过神经网络挖掘试题的文本信息对试题知识点关联矩阵进行修正,借助神经网络对学生、试题、学生与试题的交互过程三者进行建模,提高了模型的学习能力。
2 基于认知诊断分析的应用研究
以下介绍CDM在学生考试成绩预测、个性化学习资源推荐、协同学习小组构建等方面的应用研究工作。
2.1 学生考试成绩预测
通过分析学生的历史学习数据来诊断学生对于知识点的掌握程度,可用于预测学生未来的考试成绩[9-10]。学生考试成绩预测的研究,可为学业状况预警[18]和学生个性化辅导(例如协同学习小组构建[12,19]、个性化学习资源推荐[20-21]等)等研究提供决策依据。
2.1.1 典型的预测方法
CDM以学生在试题上的作答情况作为输入,对学生进行个性化的认知建模,以得到学生的潜在知识水平的掌握情况。通常很难直接评估CDM得到的学生认知状态的准确性,但利用得到的认知状态进行PEP,通过评估预测得分的准确性可间接评估CDMs的性能。因此,DINA模型[6]引入试题失误率(slip)和猜测率(guess)来建模学生的答题情况。计算公式如下:
P(Xij=1|ηij,sj,gj)=(1-sj)ηijgj(1-ηij)
(11)
其中,Xij表示学生i在试题j上的得分,取值为0或1,ηij=1表示学生i掌握了试题j考察的所有知识点,ηij=0表示学生i没有掌握试题j考察的全部知识点,sj为失误率,表示掌握了试题j考察的所有知识点但做错的概率,gj为猜测率,表示未掌握试题j所考察的所有知识点但通过猜测做对的概率。
为预测学生在主观题上的得分,FuzzyCDF[9]给出了计算公式,并基于传统DINA模型[6]的得分预测公式,提出了新的客观题得分预测公式,具体如下:
P(Rij=1|ηij,sj,gj)=(1-sj)ηij+gj(1-ηij)
(12)
P(Rij=1|ηij,sj,gj)=N(Rij|[(1-sj)ηij+
gj(1-ηij),σ2])
(13)
式(12)和式(13)分别表示学生答对客观题和主观题的概率。在式(12)中,(1-sj)ηij表示学生i掌握了客观题j考察的所有知识点并正确解答的概率,gj(1-ηij)表示学生未掌握题j考察的所有知识点但仍然正确解答的概率。在式(13)中,σ2表示学生在主观题上的标准化分数的方差,N(·|μ,σ2)表示一个均值为μ,方差为σ2的高斯分布概率密度函数。
此外,Song等人[16]和Wang等人[17]则利用深度学习中的神经网络对学生的认知状态进行建模并预测学生在客观题上的得分。不过,由于神经网络本身可解释性差,在小规模数据情况下容易出现过拟合等问题,因此,基于ANN的方法应用于智慧教育领域时仍具有明显的局限性。
2.1.2 数据稀疏情况下的预测优化方法
针对数据稀疏情况,矩阵分解(matrix factorization,MF)等方法经常被用于预测优化。MF已被广泛应用于推荐系统[22],并可用于优化PEP,它通过构造学生和试题的低维矩阵,刻画学生和试题在低维空间中的表现程度,并据此实现PEP。例如,Tscher等人[23]利用奇异值分解对考生进行建模;Thai-Nghe等人[24]利用MF对考试成绩进行预测,并将预测结果与回归方法进行比较,对比结果表明MF有效提高了预测的精度。
然而,传统的矩阵分解算法存在解释性较差的问题。例如,通过矩阵分解模型得到学生的潜在因子和试题的潜在因子,然后利用两种因子进行PEP,由于潜在因子不能直接指明学生和试题的具体特征,因此得到的预测结果难以解释。
2.2 个性化学习资源推荐
作为一种基于计算机通信技术的学习方式,在线学习可以最大限度地利用网络教学资源,学习者在学习过程中不必受到时空环境的限制,随时随地根据自身需要进行自主学习。然而,由于学习资源数量庞大,学生要在有限的时间内学习完所有的学习资料是不现实的。因此,如何帮助学生在庞大的资源库中快速准确地找到适合的资源是一个重要的问题。
2.2.1 基于认知诊断的个性化试题推荐
试题或习题是在线学习中使用频率很高的学习资源。朱天宇等人[11]将推荐系统与认知诊断结合在一起,提出了PMF-CD(probabilistic matrix factorization-cognitive diagnosis)模型,利用DINA模型获得学生的认知状态。然后,在已知学生知识点掌握程度的情况下,通过将已观测到的学生答题情况和试题对应的知识点作为先验,计算学生在每道试题上的实际掌握水平(即排除猜测和失误后的学生真实水平)。在获得学生的试题掌握水平后,再计算学生和试题的先验得分情况,并将其应用于概率矩阵分解。最后,模型根据所需试题的难度范围,筛选出合适的试题并形成推荐试题集。经过PMF-CD模型的处理,每个学生会得到结合自身的知识点掌握情况和相似学生答题情况共同生成的个性化试题推荐结果。
2.2.2 结合协同过滤和内容的个性化学习资源推荐
对于广义上的在线学习资源,许多研究者利用传统的基于协同过滤和内容的方法进行推荐。为了克服传统推荐算法存在的冷启动等问题,Soulef等人[25]设计了一种新的推荐系统NPR-EL,结合学生的偏好、背景知识以及记忆能力等特征,实现了多元的个性化推荐。黄冉等人[20]在传统的基于内容的推荐算法的基础上结合word2vec模型进行物品建模以及物品相似度计算改进,提出一种基于内容和word2vec的慕课推荐算法,提高了传统的基于内容的推荐算法的性能。
2.2.3 其他的个性化学习资源推荐
刘忠宝等人[26]综合利用兴趣图谱、本体理论、云计算和信息推荐等技术,对学习者建模与个性化推荐方法展开研究。在深入分析用户行为数据的基础上,利用兴趣图谱对学习者进行建模,研究兴趣图谱的生成、演化与反馈方法,建立云环境下的个性化推荐系统。
刘敏等人[27]从学习风格、在线学习偏好、学习者知识结构以及学习者在线学习行为及结果等方面进行学习分析,对学习资源的内容、类型、资源的推荐时间以及频次等进行个性化的推荐设置。不同于传统的将学生的学习风格分类为单一的类型,Chen等人[28]提出了基于在线学习风格的增强学习资源推荐模型,利用学习风格向量刻画学生的学习风格,并以此为基础,结合聚类和协同过滤算法,实现对学生个性化学习资源的推荐。
2.3 协同学习小组构建
在线学习系统中构建科学合理的学习小组,让学习者能以团队方式进行协作学习,不仅可以帮助学生获得更快的能力提升,也能够显著减少教师的工作量,对于改善在线学习体验、提高学习效果具有重要意义[29]。目前,在线协作学习的分组构建模式主要分为以下三种。
2.3.1 异质分组方法
异质分组即将性质相异的学习者划分到同一小组,这样有利于发挥学习者的互补优势。Agrawal等人[30]将协同学习小组分组问题分为两类:一类是从学生中找到最优学习效果的组(1-GROUP问题),另一类是将学生均分成小组,保证小组学习效果之和最优(L-GROUP问题)。刘玉苹等人[12]将认知诊断应用至协同小组构建,先提出连续化的DINA模型,即Soft-DINA(SDINA);然后基于学生认知状态,分别提出基于学生差异的分组算法(uniform k-means based,UKB)和基于收益的学生分组算法(balanced gain based,BGB)。Ullmann等人[31]提出了基于粒子群的异质分组算法,用于提高学生在线互动的质量,并通过实验验证了该方法形成的小组比与随机分组在学习中取得了更好的成绩。
2.3.2 同质分组方法
同质分组即将性质相同的学习者划分到同一小组,部分学者认为同质群组在学习者实现特定目标上比较有效。Nin等人[32]提出了一个动态感应学生成绩的框架,从学术背景、学习风格、学习态度、个性特征等方面对学生进行建模,并自适应地对学生进行分组,以便于教师给学生提供更加个性化的学习指导。Luisa等人[33]讨论了在MOOC环境下,学生以群体形式进行课程学习的必要性,提出了根据学生行为记录(浏览数、提交作业次数和评论数)的同质分组方法,并将该方法应用在真实的MOOC环境中与随机分组比较效果,实验表明同质性程度较高的组具有较高的任务完成率和互动率,此外,同质性程度较高的组的学生对自己群体的满意度更高。
2.3.3 混合分组方法
实际上,单一的同质分组或异质分组都各有利弊。因此,有学者将这两种分组模式结合起来,提出了混合分组方法。罗凌等人[34]在构建学习者多维特征模型的基础上,设计了基于模糊C均值的在线协作学习混合分组算法,首先基于学习风格、知识水平、学习目标和兴趣爱好实现同质分组,然后完成基于活跃度和性别的异质分组。这样既保证了学习风格、知识水平、兴趣爱好和学习目标具有相似性学习者划分到一组,同时考虑到了活跃度和性别差异对小组学习的影响,使得小组划分更加合理。Zheng等人[35]将学习分组问题的所有要求转化为一个数学模型,并提出一种改进的遗传算法来求解获得最优的学习群体,以满足不同教育情境的分组要求。
3 结束语
文中系统地阐述了在线学习环境下国内外认知诊断模型及其应用的研究进展。详细介绍了认知诊断模型及其在学生考试分数预测、个性化试题推荐和协同学习小组构建等方面的应用研究现状。随着在线学习的不断发展和完善,面向个性化学习的认知诊断模型及其应用研究将可能在诸多方面实现技术突破[36]。未来的工作可从以下两个方面进行:
(1)学生的动态认知建模。现有的模型大多根据学生在某次考试中的成绩对学生进行认知建模,然而学生对不同知识点的认知状态会随着时间的变化而变化,例如:学生刚掌握某一知识点时可以答对考察了该知识点的试题,但是,经过一定长度的时间后,学生淡忘了该知识点,可能就无法答对他先前答对的试题或其他类似试题。因此,根据最初的学生得分表现建模得到的学生画像与当前学生画像是不匹配的。应根据学生的实时表现对学生进行动态的认知建模,以更准确地了解学生实际的学习状态。
(2)跨学科的知识迁移学习分析。当前数据挖掘中针对学生认知诊断的工作通常围绕某一门独立课程的学习行为相关数据展开。然而,学生所学的不同课程(如数学、物理等)之间并不完全独立,相互之间可能存在知识转移现象。因此,利用迁移学习等技术,挖掘不同学科、不同课程之间的共有特征,以实现对学生的跨学科认知状态建模,对于全面了解学生的学习状态、进行更精确的个性化学习辅导具有重要意义。