APP下载

“互联网+”时代个性化试题推荐方法

2021-08-06祝玉芳

计算机时代 2021年7期
关键词:互联网+互联网

摘  要: “互联网+”环境下,网上自主学习已成常态。文章提出一种个性化试题推荐方法,先通过认知诊断模型诊断出学生的认知状态,再采用协同过滤方法推荐试题,能给学生推荐准确且可解释性的试题。

关键词: 个性化试题推荐; 认知诊断; 互联网+

中图分类号:TP302.1          文献标识码:A     文章编号:1006-8228(2021)07-58-03

Personalized question recommendation in the era of "Internet Plus"

Zhu Yufang

(Shangrao Early Childhood Education College, Shangrao, Jiangxi 334000, China)

Abstract: In the "Internet Plus" environment, online self-learning has become a normal. This paper proposes a personalized question recommendation method, in which the cognitive diagnosis model is used to diagnose students' cognitive state, and the collaborative filtering method is used to recommend test questions, thus the accurate and interpretable test questions can be recommended to students.

Key words: personalized question recommendation; cognitive diagnosis; Internet Plus

0 引言

为加快教育现代化和教育强国建设,教育部提出了《教育信息化2.0行动计划》[1]。该计划是推进“互联网+教育”的具体实施计划,充分利用信息技术和互联网,构建更加适宜学生发展、更加关注个性差异的学习环境,培养学生自主学习的意识和习惯,推动个性化学习。2020年突如其来的疫情更是导致网上学习成为一种常态。

在信息爆炸的今天,找到适合自己的学习资源很难,所以越来越多的教育者关注到了智能化推荐系统,能为学习者提供个性化学习资源尤为重要。在学习资源中,通过试题测试可以了解到学习者的认知状态,故如何为学习者推荐他们真正需要的试题,也就是设计个性化试题推荐系统,这是一个重要的研究课题。

1 推荐系统

传统意义的推荐系统是利用电子商务网站向客户提供商品信息和建议,从而帮助用户决定需要购买的商品,或者模拟销售人员帮助客户来完成购买过程。

传统推荐系统主要有两类,即协同过滤推荐和基于内容的推荐。基于内容的推荐算法假设用户历史消费的商品就是用户喜欢的,反映了其兴趣偏好,因而,算法通常分析用户历史消费商品的内容,从而推荐具有相似内容的商品。而协同过滤推荐算法则是直接建模用户历史的消费记录(即用户-商品矩阵),从而找到其感兴趣的商品。在实际应用中,协同过滤算法数据需求小且扩展性强,因而被广泛使用[2]。

基于协同过滤的方法又分为两类,即基于模型的协同过滤方法[3]和基于近邻的协同过滤方法[4]。基于邻域协同过滤又可以分为基于用户( User-based) 协同过滤和基于项目(Item-based)协同过滤,但它们通常面临着冷启动、数据稀疏、算法可扩展性差等问题。为了进一步解决数据稀疏和冷启动等问题,一些现代推荐系统采用基于模型协同过滤的推荐方法中矩阵分解技术进行推荐。

2 认知诊断

认知诊断是借助认知诊断模型,根据被试对测试题目的作答情况推导出被试对测验试题中所涉及的各个认知属性的掌握情况,即通过可观察的被试在测验上的作答反应来分析被试不可观察的知识状态。认知诊断模型比较多,最常见的有规则空间模型(Rule-Space Model, RSM)、属性层级模型(Attribute Hierarchy Method, AHM)[5]和DINA(Deterministic Inputs, Noisy “And”gate)模型[6]等。属性层级模型是最近用的比较广泛的一种方法。

Tatsuoka认为她的认知诊断方法——规则空间模型(RSM)和统计模式识别、分类方法(statistical pattern recognition and classification methodology)相似,包含特征提取(称为Q矩阵理论)和统计模式分类两步。Q矩阵理论确定不可观察的知识状态,并把它转化为可观察的理想项目反应模式;模式分类是根据项目反应理论和多元分析中模式识别的原理构造一个规则空间,将被试的观察反应模式与理想反应模式转化为规则空间的点,理想反应模式对应于规则空间中的点称为纯规则点,它是分类判别的类中心,通过比较观察反应模式对应于规则空间中的点与纯规则点的马氏距离的大小(甚至用Bayes判别)来对观察反应模式进行判别,以达到认知诊断的目的。

DINA(deterministic inputs, noisy “and” gate model)模型结合试题上的猜测和失误参数,并预测学生在试题上的表现情况。

属性层级模型假设所测属性之间具有层次结构(hierarchically-ordered),其中属性定义为正确求解测试项目所要求的基本认知过程或技巧。属性层级方法步骤是先确定待考察属性以及属性个数, 再确定属性及属性之间的层级关系,进而推导出相应的邻接阵、可达阵,使用Tatsuoka[7]的缩减算法或丁树良[8]的扩张算法导出潜在Q阵(Qr阵),Qr阵的每一列都可作为认知诊断测验项目类。Qr阵再加上一个零列,构成被试Q阵(Qs阵),它的列表示了被试知识状态的所有可能类。测验的期望项目反应模式全集由Qs的转置乘以Qr(即Qs'.Qr)得到(對应分量的值为多级评分),即得到认知诊断分类中心,被试知识状态与期望项目反应模式是一一对应的。然后采用模式识别,根据被试的观察反应模式, 通过分类方法把被试归类到相应的期望反应模式,把与之对应的属性掌握模式确定为被试的认知状态。

3 个性化试题推荐方法

随着移动互联网的发展和大规模数据的产生,推荐系统也被辐射到教育领域。基于协同过滤的推荐方法是个性化试题推荐方法中常用且具有代表性的方法之一,也有研究者采用认知诊断方法进行个性化试题推荐。然而,基于协同过滤的试题推荐方法和基于认知诊断的试题推荐方法,各有优势却又各有不足。传统的协同过滤方法通常根据用户的喜好进行推荐,在教育领域中,如果根据学生的做题偏好进行推荐,就会忽略了试题相关的知识点信息以及学生的认知状态(不清楚学生是否掌握了该知识点),导致试题推荐的结果缺乏合理性和可解释性,即学生无法了解推荐某一试题的原因,并且所推荐的试题对学生的学习、提高不一定有针对性的帮助。另一方面,基于认知诊断的方法虽然保证了推荐结果的可解释性,却忽略了学生之间的学习共性(对学生的共性进行建模),无法充分挖掘數据中的隐含信息。

目前针对学生的个性化试题推荐,主要包含以下两个方面的问题:①如何从学生、试题、知识点(属性)三者的交互中,精准的对学生的知识点掌握情况(认知状态)进行建模,并使得该结果可以合理的应用于个性化试题推荐。②如何有效的结合学生的个性化认知状态和相似学生之间的共同特征进行个性化试题推荐,从而保证推荐结果的准确性、合理性及可解释性。

为了解决这两个问题,本研究提出一种基于认知诊断的个性化试题推荐方法,采用属性层级模型对学生的认知状态进行建模,采用矩阵分解方法中的概率矩阵分解(PMF)[9]来进行个性化试题推荐,PMF方法将学生得分矩阵U分解成学生和试题的特征矩阵,通过已有的学生试题得分记录分解得到学生和试题的低维潜在因子向量,能够很好地刻画学生和试题的表现。该方法融合协同过滤方法和认知诊断方法在试题推荐方面的优势,来弥补各自的不足。该试题推荐方法的主要步骤如下。

⑴ 对学生知识状态进行认知诊断,使用属性层级模型对学生知识点掌握程度进行建模,获得学生的知识点掌握程度,并根据学生在知识点上的掌握程度建模学生在试题上的掌握水平。

多级评分的广义距离法(GDD-P)是一种多级评分的属性层级认知诊断模型的方法,0-1评分可以作为其特例,所以本研究采用多级评分认知诊断模型。多级评分的广义距离法,通过计算被试的观察作答反应模式和每个理想作答反应模式之间的广义距离,然后将广义距离最小的对应理想作答反应模式对应的知识状态作为该被试的知识状态。在多级评分的认知诊断测验中,被试i和第t种理想作答反应模式的广义距离的数学表达式为:

[d(Yi,It)=Δj=1Jd(Yij,I(t)j)]    ⑴

其中,[d(Yij,I(t)j)=Yij-I(t)j×(1-PI(t)j(θi))]  ⑵

[d(Yi,It)]表示[Yi]到[It]的广义距离,[Yi=(Yi1,……,YiJ)]是被试[i]的观察作答反应模式,[It=(I(t)1,……,I(t)J)]表示第t种理想作答反应模式,[d(Yij,I(t)j)]表示在项目[j]上被试[i]的观察作答反应[Yij]与项目j上第[t]种理想作答反应[I(t)j]的广义距离,[PI(t)j(θi)]是能力为[θi]的被试[i]在项目[j]上的作答为[I(t)j]的概率,[PI(t)j(θi)]为一种多级评分IRT模型(比如GRM或GPCM),式⑵中的被试[i]的能力参数[θi]的值用被试的观察作答反应模式的估计值[θi∧]来计算。把[d(Yi,It)]值最小的期望反应模式[It]对应的属性掌握模式作为被试i的属性掌握模式。

⑵ 预测学生的得分,并向每个学生进行个性化试题推荐:结合PMF方法,并引入学生在试题上的掌握情况和待推荐试题知识点考察情况作为学生潜在因子和试题潜在因子的先验,据此预测学生试题得分将PMF应用于学生试题推荐时,可以通过预测学生在试题上的得分来进行学生个性化试题推荐。

4 结束语

本研究提出了一种基于认知诊断的个性化试题推荐方法,先采用认知诊断模型(属性层级方法),结合学生、试题和知识点,推导出学生对知识点的掌握情况;再采用试题推荐算法(基于协同过滤方法)找到相似学生之间的共同特征进行个性化试题推荐,这样的推荐方法,既考虑到学生的个性,也考虑到学生的共性,能给学生推荐准确且可解释性的试题。

参考文献(References):

[1] 中华人民共和国教育部关于印发《教育信息化2.0行动计划》的通知[EB/OL].[2018-04]. http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html

[2] 黄振亚.面向个性化学习的数据挖掘方法与应用研究[D].中国科学技术大学博士学位论文,2020.

[3] Koren Y, Bell R, Volinsky C. Matrix factorizationtechniques for recommender systems[J].IEEE Computer,2009.42(8):30-37

[4] Linden G, Smith B, York J.Amazon.com recommenda-tions:Item-to-item collaborative filtering. IEEE Internet Computing,2003.7(1):76-80

[5] 祝玉芳,邓丽萍,周世科,丁树良.用规则空间模型和属性层次方法进行认知诊断[J].计算机时代,2008.6:1-3

[6] dela Torre J. DINA model and parameter estimation: Adidactic.Journal of Educational and Behavioral Statistics,2009.34(1):115-130

[7] Tatsuoka K K. Architecture of knowledge structure andcognitive diagnosis: a statistical pattern recognition and classification approach[M].P. D. Nichols, S. F. Chipman & R. L. Brennan. Cognitively Diagnostic Assessment. Hillsdale, NJ: Erlbaum,1995:327-361

[8] 丁树良,祝玉芳,林海菁等.Tatsuoka Q矩阵理论的修正[J].心理学报,2009.41(2):175-181

[9] Desmarais MC, Naceur R. A matrix factorization methodformapping items to skills and for enhancing expert-based Qmatrices. In: Lane HC, Yacef K, Mostow J, et al., eds.Artificial Intelligence in Education. Berlin, Heidelberg.Springer,2013:441-450

猜你喜欢

互联网+互联网
“互联网+”环境之下的著作权保护
“互联网+”对传统图书出版的影响和推动作用
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施
以高品质对农节目助力打赢脱贫攻坚战