APP下载

基于改进的混合模式个性化选课推荐技术研究

2016-02-29佟国香

电子科技 2016年1期
关键词:混合模式相似度个性化推荐

齐 婷,佟国香,2

(1.上海理工大学 光电信息与计算机工程学院,上海 200093;2.上海市现代光学系统重点实验室,上海 200093)

基于改进的混合模式个性化选课推荐技术研究

齐婷1,佟国香1,2

(1.上海理工大学 光电信息与计算机工程学院,上海200093;2.上海市现代光学系统重点实验室,上海200093)

摘要针对高等学校学生选课系统中存在的缺乏个性化课程推荐、选课效率较低的问题,通过对个性化推荐技术的分析研究,提出了基于内容、项目及用户属性的改进混合模式算法,并将该算法应用到选课系统中,用MACE数据集对算法进行验证。结果表明,该算法解决了个性化推荐技术中的冷启动问题,相关指标有明显提高,实现了课程与新课程的个性化推荐,并减少了选课的盲目性。

关键词个性化推荐;混合模式;相似度;用户聚类

Research on Improved Personalized Courses Recommendation Technology Based on Mixed Mode

QI Ting1,TONG Guoxiang1,2

(1.School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,

Shanghai 200093,China;2.Shanghai Key Laboratory of Modern Optical Systems,Shanghai 200093,China)

AbstractProblems of lacking in individualized curriculum recommendations and inefficiency exist in current course selection systems of institutions of higher education.In allusion to these limitations,this paper presents a improved mixed model algorithm based on the content,project and user attribute-value through analysis and study of personalized recommendation technology.The proposed algorithm has been successfully applied to the elective system.Experimental results indicate that the proposed approach can solve cold-start technology in personalized recommendation algorithm,improve the related indicators significantly,achieve a personalized recommendation and new courses recommendation and reduce the blindness by the MACE data sets.

Keywordspersonalized recommendation;mixed mode;similarity;user clustering

随着学生在教学过程中主体地位的突出,学生选课已成为学生个体化发展的重要途径,而多数高校在选课制度实施过程中普遍存在课程结构设置不合理、选课方式不完善、选课指导体系不健全等问题[1]。学生不能结合自身的专业和兴趣进行选课,选课缺乏目的性和针对性;选课制度不利于学生的个性发展,也不能为学生以后的工作带来良好的指导,从而出现了专业与职位不对口的现象[2]。有鉴于此,本文将个性化推荐技术应用于选课系统中,根据学生自身的状况、学习需求、兴趣偏好以及职业规划等,为学生提供个性化课程推荐平台,从而避免学生选课的盲目性和跟风现象,提高了课程资源的利用率和选课质量。

1推荐技术

个性化推荐系统(Personalized Recommendation Systems)是根据用户的兴趣爱好和特点,向用户推荐感兴趣的信息[3]。其原理是根据用户模型寻找与用户模型匹配的有用信息,或寻找具有相近兴趣的用户群然后相互推荐浏览过的信息。简单而言,个性化推荐实质是一种“信息找人”的服务模式,可减少用户寻找感兴趣信息的时间,提高用户浏览的效率[4]。

当下普遍流行的课程推荐算法主要包括基于用户和项目的协同过滤推荐、注重本体基本属性的内容推荐、基于关联规则的推荐、基于贝叶斯网络和机器学习的推荐[5-7]。以上推荐算法均存在一定的问题,本文给出了一种综合考虑内容和协同过滤的改进混合模式个性化推荐方法。

2相关算法

2.1 混合推荐模型

混合模型是一种统筹兼顾的做法,混合的思路主要是推荐结果混合和推荐算法混合[8],算法混合的方法主要有加权型、合并型、特征组合型[9]。

本文的混合是以协同过滤为主要框架,混合内容过滤。首先是建模型,根据已有的个人信息、历史选课记录,评分记录、检索的关键字等对用户进行兴趣建模,并计算相似度,完成聚类;根据课程属性,评分记录等完成课程建模。然后完善用户—课程评分矩阵,对于无评分值的项,可根据内容过滤的推荐预测评分,填满矩阵的空缺。最后根据协同过滤的最近邻居推荐课程集。因此混合推荐技术,使用基于内容的过滤技术,对用户相似度和项目相似度分别进行计算,一方面可对原始的用户-课程矩阵进行预处理,增加矩阵的评分丰富度,解决协同过滤的稀疏性问题;另一方面,可通过结合基于项目的协同过滤推荐来解决新课程冷启动问题,结合基于用户的协同过滤技术解决新用户的冷启动问题。

2.2 构建用户兴趣模型

兴趣模型主要是反映用户在一段期间内对某些知识信息的兴趣需求,主要包括特征数据的提取,兴趣爱好的表现方法,模型的更新[10]。

(1)特征数据的提取。本文中构建兴趣模型所用的用户特征数据主要是对学生属性的描述,包括学生的基本信息、数据库中记录的对课程的历史评分记录、选课系统中搜索课程使用的关键字3个部分;

(2)兴趣爱好的表示方法。当前的用户兴趣模型表示方法包括基于向量空间模型表示方法、基于神经网络的表示方法、基于粗细兴趣粒度的表示法、基于本体论的表示法、基于用户—项目评分矩阵以及基于关键字的表示方法[10];

1)基于向量空间的用户兴趣模型。向量空间模型是根据学生用户的背景信息将用户爱好表示成向量,每个向量包括属性和对应的权重,权重用TF-IDF计算。学生选课系统中注册用户属性集{性别,年龄,年级,专业,特长,爱好},对应的权重用Wi表示,其中1≤k

(1)

其中,wk是第k个关键词分项对应的权值,q1k和q2k分别是x,y用户的第k个关键词的取值;

2)基于用户—课程评分矩阵的用户兴趣模型。用户评分矩阵记录了用户对课程的喜好程度,本文中喜好程度用数字1~5表示,数值越大表示学生对课程的喜欢程度越高。根据该矩阵计算用户的相似度

(2)

3)基于关键字的用户兴趣模型。学生浏览选课系统课程时,会以关键字进行搜索,搜索关键字的次数表示用户对课程的关注程度,将次数最多的4个关键字组成集合,表示用户的兴趣偏好。此外,学生查找的关键字没有固定标准,统一用课程概念来表示。若学生用户x和y的关键字集分别为x={cx1,cx2,cx3,cx4},y={cy1,cy2,cy3,cy4},两者的相似度如式(3)

(3)

其中,sim(cxi,cyi)为关键字之间的概念相似度。

2.3 填写用户—课程评价矩阵

在传统的选课系统中,学生对教师的评价较多,但是单单对课程的评价较少,这使得整个推荐系统形成的用户-项目矩阵稀疏,计算出的用户间相似度不够准确,得到的邻居用户不可靠,因而推荐结果不准确;在本系统中先根据课程的特征值计算课程间的相似度,预测用户对未评分课程的评分。矩阵填充前期包括一系列的准备工作:提取课程特征、计算相似度和预测缺失评分。

(1)课程特征的提取。课程特征就是对课程属性的描述,根据课程特征可区分不同课程实例;

(2)课程相似度计算。根据上述的课程概念层次模型,每门课程均可视为一个概念的实例,课程相似度便可用概念相似度表示,包括课程所属概念的相似度和课程属性间的相似度,因此课程相似度为课程数概念相似度与属性间相似度加和;

(3)预测缺失评分。假设目标用户为U,目标课程为P,根据上述的两个步骤的计算,可得到与目标课程P相似度值最高的前n个项目,然后通过目标用户U对这些相似项目的评分来预测U对目标项目P的评分。

3个性化推荐的选课系统

本系统主要采用SQL Server 2008进行数据的存储,根据选课的数据结构模型,在系统的数据库中设计3个基本表:学生表(Student)、教师表(Teacher)和课程表(Course);主要功能模块包括:最近邻推荐模块,新课程推荐模块,新课程推荐模块。

4实验结果及分析

4.1 数据介绍

本文使用的是MACE数据集(Metadata for Architectural Contents in Europe)[11-12],该数据集来源于2009年9月到2010年9月的MACE项目,包括1 148个学生的12 000条记录;将这些记录等分成 5 组,随机选4组为实验数据集以产生推荐,剩下1组作为对照数据集以检验推荐质量。

4.2 实验结果及分析

对于推荐系统的评价,精确度(Precision)率和召回率(Recall)无疑是最受欢迎和最流行的指标,其已被用于各种研究;精准度是准确性的量度,召回率是完整性的量度,MAE是预测精准性的量度。实验主要从推荐系统的推荐质量指标来进行比较,主要包括算法的 MAE 值、准确率、召回率、覆盖率;还有其他指标,如推荐算法的效率、鲁棒性、可解释性、信任度、健壮性等[13]。实验先将本文的改进算法与当前流行的课程推荐算法进行比较。结果如表1所示。

表1 算法比较

实验加入随机项目和热门项目,主要是起到对比作用,突出表明高校选课存在盲目性和跟风行为,需要一个有效算法使学生的选课变的更加合理准确,更有指导性和针对性。其余4种算法的对比表明综合考虑用户属性和项目属性的混合推荐改进算法的准确率/召回率要比其他算法相对较高。

本文还计算MAE值分析预测评分和真实评分的差异比较,主要是与基于用户的协同过滤算法进行比较。针对这两种算法,以相似用户数分别为 2,4,8和12 时,各进行10次试验,以平均值作为相应算法的推荐误差,试验结果如下。

表2 基于用户推荐的协同过滤推荐MAE值

表3 改进的混合推荐MAE值

图1 两种算法的MAE值直观图

由柱状图可看出,改进的混合推荐算法的MAE值整体趋势平稳,波动较小,表明其推荐的质量受相似用户数量的影响较小,混合推荐的结果准确。此外,用户数是4和8时,协同过滤的MAE值突增,明显比改进的混合模式效果差。

实验进一步比较两种算法的用户相似度。目标用户来源于实验集中相似用户数量合适用户,分别计算两种算法的目标用户与两类实验中的相同邻居用户相似度,结果如图2所示。

图2 两种算法的平均相似度对比

由图4可知,改进的混合算法的用户相似度总体水平上高于协同过滤,主要是该算法对没有被学生选择的课程和没有评分的课程做了预测处理,这使得计算结果更加准确和稳定,而协同过滤算法中新课程,新用户的冷启动问题使得对相似度的计算易受到邻居用户的干扰,稳定性较差。综上,改进的混合模式推荐算法比传统的推荐算法更加精确,产生的推荐质量更高。

5结束语

针对多数高校选课系统课程结构设置不合理、选课方式不完善、不考虑学生兴趣等缺陷,本文综合考虑学生属性,课程属性以及多种算法的优缺点,设计了一个改进的混合模式推荐的个性化课程推荐系统,该算法解决了个性化推荐技术中的冷启动问题,相关指标有明显提高,实现了课程的个性化推荐和新课程的推荐;同时,减少学生选课的盲目性,提高选课效率和学生选课的满意度。本文尚未对选课系统中的数据安全性、用户长时短时兴趣的区分以及模型的更新作进一步的研究,这些内容将在下一步的研究中进行探讨。

参考文献

[1]柏美屹,罗颖.中部地区高校选课制实施现状研究——以三所“211工程”大学为例[J].科技致富向导,2013(11):55,104.

[2]吴迪,周利娟,林鸿飞.基于随机游走的就业推荐系统研究与实现[J].广西师范大学学报:自然科学版,2011(1):179-185.

[3]Resniek and Varian.Recommender systems[J].Communications of the ACM,1997,40(3):56-58.

[4]姚志霞.基于混合推荐的个性化信息服务系统的研究与应用[D].北京:北京交通大学,2012.

[5]奉和国,梁晓婷.协同过滤研究综述[J].图书情报工作,2011,55(16):126-130.

[6]王艳,刘双红,李玲玲.基于加权关联规则的选课推荐系统的构建[J].郑州轻工业学院学报:自然科学版,2009(5):44-47.

[7]朱彦松.基于贝叶斯网络推荐模型的教务选课系统应用研究[D].郑州:郑州大学,2011.

[8]王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012(7):66-76.

[9]Robin Burke.Hybrid recommender systems:survey and experiments[J].User Modeling and User-Adapted Interaction November,2002,12(4):319-330.

[10]杨晶.用户兴趣模型及实时个性化推荐算法研究[D].南京:南京邮电大学,2013.

[11]Mojtaba Salehi,Mohammad Pourzaferani,Seyed Amir Razavi.Hybrid attribute-based recommender system for learning material using genetic algorithm and a multidimensional information model[J].Egyptian Informatics Journal,2013(14):67-78.

[12]Sarwar B.Application of dimensionality reduction in recommender system-a case study[M].MA USA:ACM Webkdd Workshop,2000.

[13]朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012(2):163-175.

作者简介:齐婷(1990—),女,硕士研究生。研究方向:个性化推荐技术。佟国香(1968—),女,副教授,硕士生导师。研究方向:计算机控制应用等。

基金项目:上海市教育委员会科研创新重点基金资助项目(10ZZ94;12YZ094)

收稿日期:2015- 06- 25

中图分类号TP18

文献标识码A

文章编号1007-7820(2016)01-152-04

doi:10.16180/j.cnki.issn1007-7820.2016.01.041

猜你喜欢

混合模式相似度个性化推荐
整合突破,奋勇前进
改进的协同过滤推荐算法
模糊Petri网在油田开发设计领域的应用研究
基于链式存储结构的协同过滤推荐算法设计与实现
个性化推荐系统关键算法探讨
基于协同过滤算法的个性化图书推荐系统研究
探讨创业板上市公司治理结构对盈利能力的影响
无线定位个性化导览关键技术在博物馆中的运用
相似度算法在源程序比较中的应用
影响母线负荷预测的因素及改进措施