APP下载

基于MOOC的智能信息推荐模型构建仿真

2023-09-20马莲姑黄寿孟纪春林赵安学

计算机仿真 2023年8期
关键词:本体聚类概念

马莲姑,黄寿孟,纪春林,赵安学*

(1. 琼台师范学院信息科学技术学院,海南 海口 571100;2. 三亚学院信息与智能工程学院,海南 三亚 572022;3. 陕西理工大学教育科学学院,陕西 汉中 723000)

1 引言

慕课(MassiveOpenOnlineCourse,MOOC)是受到众多教师以及学生认可的学习方式,MOOC在教学改革中占据重要地位。MOOC属于在线学习方式,具有不受时间以及地点限制的优势[1]。网络中包含众多不同企业以及高校开发的MOOC平台,海量MOOC信息存在于MOOC平台中。众多MOOC平台中的课程存在较高的重复性,学生选择MOOC时,无法明确选取合适的慕MOOC,MOOC的智能信息推荐是目前在线网络学习领域急需解决的重要问题[2]。目前网络中各大MOOC学习平台具有极高的计算能力以及存储能力,利用高效的推荐算法实现MOOC平台的智能信息推荐,利用聚类算法挖掘网络中存在的海量课程,实现MOOC知识数据库的有效优化。学生可以快速获取所需MOOC课程中的知识点,便于快速提升学习成绩,令MOOC利用率有所提升。学生的学习效率有所提升[3,4],同样提升了MOOC平台的教学质量,推动MOOC教学平台进一步发展。

目前针对MOOC研究较多,郭军[5]以及戴亚平[6]等人分别将大数据技术应用于MOOC平台中以及研究学生使用MOOC平台时的听课行为,对MOOC平台具有了初步研究。

目前针对MOOC平台的智能信息推荐研究还行相对较少。本文构建基于MOOC的智能信息推荐模型,将高效的智能信息推荐模型应用于MOOC平台中,通过仿真软件对所构建模型仿真,通过仿真结果验证所构建模型具有较高的智能信息推荐有效性,将所构建模型应用于MOOC平台中,可为用户推荐所需要课程,提升学生的学习效率,令MOOC平台发挥最大功能。

2 MOOC的智能信息推荐模型构建

2.1 MOOC平台信息聚类

利用基于本体的概念相似度计算方法实现MOOC平台中海量课程信息的聚类。MOOC平台中的用户数据包含所订阅、收藏的课程以及课程视频学习数据、浏览记录等数据,以上数据分别属于用户的直接数据以及隐式行为数据。MOOC平台信息聚类需要将以上数据有效聚类[7],利用完成聚类后的数据提取兴趣点特征向量,为智能信息推荐模型提供良好的数据基础。

利用有向树建立本体的层次结构,本体的概念相似度计算过程如下:

1)语义距离

用Dis(Gc1,Gc2)表示待聚类领域本体中的概念Gc1与概念Gc2间的语义距离。设置所建立本体层次数内具有最短概念路径的有向边数量,作为领域本体的语义距离。当概念Gc1与Gc2概念为相同语义时,二者相似度为1,此时Dis(Gc1,Gc2)=0。

2)层次差

用|hc1-hc2|表示概念Gc1与概念Gc2的层次差,概念Gc1与概念Gc2的相应层次深度利用hc1与hc2表示。本体树的层次深度有所提升时,所划分的本体树节点更加具体。设两个概念的语义距离相同[8],二者的层次之和有所提升时,相似度随之增加;二者的层次之差有所增加时,相似度

3)语义重合度

用E(Gc1)∩E(Gc2)表示本体层次树中概念Gc1与概念Gc2的语义重合度。两个概念在所设置的本体层次树内选取根节点作为出发点,出发过程中共同经过的节点占全部节点的比例即概念Gc1与概念Gc2的语义重合度。

充分考虑以上概念,利用本体层次树方法获取概念Gc1与概念Gc2相似度表达式如下

(1)

式中,β表示调节因子。

MOOC平台信息聚类具体过程如下:

选取原始MOOC平台信息集以及聚类数量作为聚类输入,将完成聚类的MOOC平台信息集作为聚类输出。

1)划分MOOC平台信息集;

2)建立MOOC平台信息集内不同概念的向量空间;

3)随机选取K个概念作为初始聚类的聚类中心;

4)计算全部概念与K个聚类中心的相似度,将MOOC平台信息集内与聚类中心相似度较高的概念划分至该类别中,利用式(1)计算MOOC平台信息集内的概念与聚类中心的相似度;

5)更新完成聚类的聚类中心;

6)重复迭代以上过程,直至聚类中心为固定状态,终止聚类。

通过以上过程,利用MOOC平台信息内不同概念的相似度,聚类主体相同或相近的信息,实现MOOC平台内海量信息的有效聚类,得到信息聚类结果。

2.2 提取特征向量

深度神经网络提取兴趣点特征向量主要包括以下步骤:

1)卷积层

利用xi=[w1,w2,…,wn]表示随机兴趣点评论信息集合,将集合xi内的单词wi依据先后顺序。利用词向量模型映射至词向量wi∈p×1,将集合转换至词向量矩阵B∈p×l。该矩阵具有词序不变特征[9],矩阵表达式如下

(2)

其中,p表示单词wi的嵌入维度;l表示集合xi的长度;wi表示集合xi内i处单词的词向量。

(3)

通过重复卷积操作获取上下文特征cj∈l-wd+1表达式如下

(4)

2)池化层

MOOC平台内不同兴趣点的潜在特征利用所提取的上下文特征向量内的最大特征向量体现[10,11]。用lj表示随机兴趣点评论信息xi的上下文特征,可得公式如下

(5)

3)输出层

上文所获取的特征向量,需映射至差异维度的向量空间中,利用不同的向量空间体现不同任务。MOOC平台智能信息推荐应用时,设置特征向量lj映射至kd维向量空间中表达式如下

r=tanh(Zf2{tanh(Zf1lj+bf1)}+bf2)

(6)

以上公式中,r∈kd,Zf1∈f×nc,Zf2∈kd×f,bf1∈f,bf2∈kd,其中Zf1、Zf2与bf1、bf2分别表示映射矩阵以及偏移向量。

通过以上过程实现MOOC平台基于聚类信息的上下文特征提取。总结以上过程,利用深度神经网络学习兴趣点[12],所提取兴趣点特征向量的目标函数如下

(7)

2.3 协同过滤图模型

(8)

兴趣点特征空间向量tI表达式如下

(9)

获取协同过滤图模型应用于智能信息推荐的表达式如下

(10)

(11)

式中,rmi表示用户m对课程i的感兴趣程度。

(12)

式中,smi表示用户m对课程i的相似度。

通过以上步骤实现MOOC平台的智能信息推荐。

3 仿真测试

选取Matlab 2020b0软件作为验证所构建模型推荐性能的仿真软件,由某MOOC平台的用户操作日志以及选课记录构成数据集,利用Matlab 7.0软件将该数据集应用于某MOOC平台中。分析数据集内数据,数据集内包含用户数量为185645名,包含课程数量为52门。分析该MOOC平台可知,约10000名用户选择课程为2-4门,一半以上的用户仅选择1门课程。52门课程中,部分课程开课时的学生用户人数高达12542名,某课程开课时,听课人数仅为13人。该MOOC平台用户选取课程时,具有较高的稀疏性,高效的智能信息推荐模型可有效改善MOOC平台的课程选取稀疏性。

康乾南巡不仅将江南景观仿建至北方,也将北方的建筑风格、造园艺术等元素带到了江南。这一点突出表现在扬州五亭桥、白塔的建筑上。

统计采用本文模型为用户提供智能信息推荐后,该MOOC平台听课人数变化情况,统计结果如图1所示。

图1 课程对应选课人数

采用本文模型前,MOOC平台中的课程选课人数存在过高或者过低情况,本文模型可有效改善课程选取稀疏性过高的缺陷。采用本文模型后,不同课程选取人数均处于5000人-6000人之间,提升了MOOC平台的选课均衡性。将本文模型应用于MOOC平台中,可有效改善课程选择过于稀疏的问题,课程对应选课人数有了明显改善。采用本文模型实现课程的智能信息推荐后,用户对于课程的选取较为均衡,有效避免MOOC平台选课稀疏性的缺陷。本文模型所获取的推荐结果可提升用户对于课程知识的获取情况,学习可依据自身兴趣选取感兴趣课程,通过良好的学习模式提升学生的学习兴趣。

统计所提取不同用户兴趣点特征情况下,本文模型为用户所推荐课程。本文模型为用户推荐课程结果如表1所示。

表1 本文模型推荐结果

表1仿真结果可以看出,本文方法可充分挖掘不同用户的兴趣点,为用户推荐用户所需课程,实现智能信息的有效推荐。例如用户兴趣点为航空航天时,本文模型为该用户推荐了航空航天技术概论、应用物理学等相关课程。本文模型可为用户推荐与用户兴趣点极为相符的课程,具有较高的推荐有效性。

仿真过程中,设用户点击本文模型的推荐列表中的链接,表示用户对智能推荐信息具有较高的感兴趣程度,此时本文模型为智能信息推荐成功状态。选取平均排序倒数作为本文模型智能信息推荐准确率的度量指标。平均排序倒数表达式如下

(13)

式(13)中,N与aij分别表示测试样本数量以及i次推荐结果中,用户首先点击链接j的信息。用户所点击信息排序越前,所获取的平均排序倒数值越高,此时该模型具有优越的智能信息推荐效果。

不同用户会话数量时,本文模型的平均排序倒数结果如图2所示。

图2 平均排序倒数

图2仿真结果可以看出,不同用户会话规模时,本文方法的平均排序倒数均为0.7以上,有效验证本文模型具有较高的智能信息推荐准确率。本文模型可有效获取用户的兴趣点变化情况,用户在不同的MOOC平台使用日期时,均可获取良好的智能信息推荐效果,验证本文模型具有较高的推荐有效性,所获取推荐结果与用户需求极为接近。

选取折现累积收益(discounted cumulative gain,DCG)作为评估所构建智能信息推荐模型推荐性能的另一重要指标。折现累积收益是评估推荐模型排序结果质量的重要指标,该指标表达式如下

(14)

式(14)中,b(1+j)与rel(j)分别表示折扣因子以及第j个链接的相关度,n表示推荐链接在推荐结果中的排序结果。

采用本文模型为用户推荐课程,不同课程类型时,本文模型的DCG指标结果如图3所示。

图3 DCG指标统计结果

图3仿真结果可以看出,MOOC平台为单用户模式以及多用户模式时,本文模型获取的智能信息推荐结果均具有较高的质量。本文模型在单用户模式以及多用户模式下均具有较高的智能信息推荐性能,可应用于MOOC平台智能信息推荐中。本文模型具有优异的推荐性能的主要原因是:本文模型利用基于本体的概念相似度计算方法实现MOOC平台中海量信息的有效聚类,利用特征提取方法提取完成信息聚类后数据特征,利用所提取特征实现智能信息的有效推荐,提升本文模型的智能信息推荐性能。将本文模型应用于MOOC平台中,可有效依据用户兴趣点为用户推荐与用户最相符的课程推荐结果,推荐有效性高。

4 结论

MOOC平台伴随大数据时代的到来,对智能信息推荐的要求更高。用户兴趣点存在较高的动态性,智能推荐模型的实时性极为重要。

通过所构建模型实现MOOC平台的智能信息推荐,利用智能信息推荐结果提升学生的学习效率。所构建模型可有效解决以往智能信息推荐模型具有的数据稀疏性过高的缺陷,具有较高的智能信息推荐准确率。且该模型可依据用户兴趣点推荐用户感兴趣信息,不仅可应用于MOOC平台中,同样可应用于其它需要推荐的平台中。仿真测试结果验证所研究模型具有较高的智能信息推荐有效性,可满足用户的课程推荐需求。

猜你喜欢

本体聚类概念
Birdie Cup Coffee丰盛里概念店
幾樣概念店
学习集合概念『四步走』
聚焦集合的概念及应用
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
基于本体的机械产品工艺知识表示
《我应该感到自豪才对》的本体性教学内容及启示
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例