基于社交关系的学习资源推荐方法
2020-03-05吴东陈长江
吴东,陈长江
(岭南师范学院信息工程学院,湛江524048)
0 引言
近年来,我国以“三通两平台”为代表的教育信息化重点工程取得重大突破,成效显著。其中,教育资源公共服务平台实现跨越式发展,全国近42%的学校可应用数字教育资源开展教学[1]。这些数字教育资源的使用,也为实现《国家中长期教育改革和发展规划纲要(2010-2020)》提出的“尊重差异,满足学生多样化学习需要,发展每一个学生的优良个性”的目标提供了条件[2]。但是,平台中资源的爆炸式增长带来了“信息过载”问题,增加了师生使用教育资源平台的复杂度,造成优质资源发现困难、利用率低,严重妨碍优质资源的有效共享和个性化使用。
因此,怎样帮助广大中小学学生及教师在教育资源公共服务平台中快速找到合适的优质资源显得尤为重要。个性化推荐是解决“信息过载”问题的主要技术,其广泛应用于电子商务、搜索引擎、在线资讯等领域,取得了巨大成功。目前,基于个性化推荐技术的学习资源推送是各教育资源公共服务平台大力发展的基础业务,逐渐为解决“信息过载”问题发挥着重要作用。然而,该技术仍存在数据稀疏、冷启动、多样性差等不足,尚需做进一步的改进和完善。
当前,中小学教师及学生在教育资源公共服务平台中进行教学和学习正趋向普及,他们必将在平台中构建出新的在线社交网络,“师-师”、“师-生”和“生-生”间的积极交互会在平台中留下海量社交信息。在此背景下,我们拟将社交信息融入学习资源个性化推荐技术,旨在利用师生在平台中产生的各式社交信息去提升学习资源个性化推荐技术的性能,提出了一种基于社交关系的学习资源推荐算法RRSR(Resource Recommendation Method Based on Social Relationship)。实验结果表明,该方法能取得很好的准确率,有望为学习资源推送的个性化和精准化提供借鉴和参考。
1 相关工作
自社交应用蓬勃发展,逐步为人们构建新型在线社交网络起,国内外研究人员就敏锐的意识到其对个性化推荐可能带来不可估量的促进作用,并开展了阶段性研究工作,在不同层面取得一定的成果。
早期,学术界和业界展开对社交关系的深入研究,试图挖掘各式社交关系在个性化推荐技术中所起的作用。好友关系是社交网络中最普遍的一种关系,用户的兴趣爱好通常跟好友的极其相似,将好友感兴趣的学习资源推荐给用户往往都能得到该用户的认可。Swearingen 等人的工作就是利用好友关系进行推荐的成功案例[3]。王福生等人把科研工作者之间的好友关系定义为科研合作关系,他们利用学术论文的署名来发现科研工作者之间的这种关系,并在构建科研合作关系网的基础上实现了科研学习资源的个性化推荐[4]。而叶小强等人则认为用户会根据自身爱好加入不同的兴趣圈子或社区,这就产生了用户跟圈子或社区之间的群组关系,当我们能够为用户找到对应的群组时就可找到跟用户学习爱好相似的其他用户,也就能实现学习资源的推荐[5]。
进一步,学者发现用户间除了存在双方地位平等的社交关系外,还有其他不对等关系,如追随关系、信任关系等。Duncan J.Watts 的研究结果表明,社交网络中往往都存在意见领袖,他们发布的消息或评论通常都会得到大多数人的认可,并影响着这些人关于某些事或物的态度[6]。当这些人认定能够从意见领袖那里得到所需的信息后,他们就会长期的追随意见领袖,成为意见领袖的“粉丝”,形成较为稳定的追随关系。Esslimani、Brun 以及Cheon 等人纷纷提出各自的意见领袖识别及利用意见领袖实现学习资源推荐的算法[7]。而Massa 等人则发现用户间的相似性跟他们的信任关系是正相关的,于是首次将信任关系引入个性化推荐技术中[8]。之后,微软亚洲研究院的马浩及南洋理工大学张杰团队在该领域展开了一系列的研究,并取得了一系列成果[9]。
认真分析社交网络环境中个性化推荐的现有成果,我们发现学者探讨了各式社交关系跟用户历史行为相似性之间的联系,考证了社交关系替代相似性的可能,验证了利用社交关系进行个性化推荐的切实可行。这些丰富的成果为推动社交信息融入学习资源个性化推荐奠定了良好的基础。
2 基于社交关系的推荐算法RRSR
基于社交关系的推荐算法RRSR 能够完成资源推荐的前提是,教育资源公共服务平台中的用户已经互相交互、结交为好友,构建了在线社交网络。如图1 所示,是基于社交关系的学习资源推荐算法RRSR 的示意图。从示意图可以看出,当要为平台中的某用户推荐资源时,RRSR 算法先从在线社交网络中找出该用户的好友,再根据好友对于资源的评分及用户跟好友间的熟悉度、兴趣相似度来预测该用户对资源的评分,最后得出该用户可能适用的Top-N 资源排行榜。
图1 RRSR算法示意图
定义1 社交网络。由代表用户的节点和节点间的关系构成的一个无向带权图G 表示,记为G=(V,E,F,S)。其中,V 是社交网络中的用户节点集合,E 是节点间的边集合,F 是用户节点间的熟悉度集合,S 是用户节点间的兴趣相似度集合。
定义2 熟悉度。在社交网络G 中,用户节点u 跟v 之间的熟悉度用fu,v表示。
其中,in(u)表示用户u 的好友集合。在社交网络中,用户相对更容易接纳其熟悉的好友推荐的资源。越熟悉、关系越好的朋友给出的建议,越容易被用户接纳。
定义3 兴趣相似度。在社交网络G 中,用户节点u 跟v 之间的兴趣相似度用su,v表示。
其中,N(u)表示用户u 曾使用的资源集合。在社交网络中,跟用户兴趣最相近的好友推荐的资源,也更容易被该用户接纳。
定义4 基于社交关系的推荐。假设要预测用户u对资源i 的评分ru,i,可根据公式(3)来进行计算。评分ru,i越高,表示用户u 对资源i 非常感兴趣,最有可能使用该资源。从公式(3)可以看出,RRSR 算法不仅考虑了用户跟好友的熟悉度,还考虑了用户跟好友的兴趣相似度。这相当于为用户找到了不仅熟悉且兴趣相投的好友来为其推荐资源,较符合日常生活中人们获取建议的行为,该资源有更大的可能被用户所接纳。
其中,rv,i是用户u 的好友v 对资源i 的评分。
3 实验结果与分析
我们采用数据集LibraryThing[10]来进行算法的推荐效果验证实验。该数据集中有73,882 个用户和337,561 个资源,用户对资源的评论共979,053 条。另外,用户间的好友关系有120,536 条。
由于RRSR 算法的目的是预测目标用户对目标资源的评分,所以在此采用平均绝对误差MAE(Mean Absolute Error)和均方根误差RMSE(Root Mean Squared Error)来评估推荐算法的性能。MAE 和RMSE 越小,推荐算法的性能越好。MAE 和RMSE 的计算公式如(4)和(5)所示:
其中,L 为用户u 评分资源的个数,ru,i为用户的实际评分,为预测评分。考虑到RRSR 算法需要借助用户的好友来完成评分预测,因此我们主要探讨了该算法的性能跟用户好友数之间的关系,其结果如图2 所示。当用户好友数小于30 时,RRSR 算法的MAE 和RMSE 分别为1.583563 和1.805492,而当用户好友数大于120 时,RRSR 算法的MAE 和RMSE 分别为1.253403 和1.429040。由此可以得知,随着用户好友数的增加,RRSR 算法的MAE 和RMSE 减小,说明RRSR 算法的性能越好,推荐的资源越可能是适合用户使用的。
图2 RRSR算法的性能跟用户好友数的关系
4 结语
中小学教学平台的普及使用增强了教学质量,但平台中资源的爆炸式增长带来了“信息过载”问题。考虑到人们比较容易接受兴趣相投的好友的建议,基于教学平台中的社交关系设计了学习资源的推荐算法RRSR。实验结果表明,该算法的推荐性能会随着用户好友的增加而变强。研究成果有望在中小学教学平台中使用,特别是随着平台中在线社交网络的扩大,用户好友的不断增加,这种基于社交关系的推荐算法将取得更好的效果。