APP下载

基于用户交互行为的群组推荐偏好融合策略

2016-06-20唐福喜刘克剑江静炜

关键词:推荐系统

唐福喜,刘克剑*,冯 玲,江静炜

(1.西华大学计算机与软件工程学院,四川 成都 610039;2.西藏飞跃智能科技有限公司,西藏 拉萨 850000)



基于用户交互行为的群组推荐偏好融合策略

唐福喜1,刘克剑1*,冯玲1,江静炜2

(1.西华大学计算机与软件工程学院,四川 成都610039;2.西藏飞跃智能科技有限公司,西藏 拉萨850000)

摘要:为尽可能减小群组成员对所推荐项目的不满意度,提高推荐系统的准确度,在传统推荐系统的基础上,提出一种基于用户交互行为的偏好融合策略。通过成员间协同过滤获得用户对项目的预测评分,通过组间协同过滤获得群组对项目的预测评分,再利用用户间的交互行为获得用户在群组中的权重,进而获得群组对推荐项目的最终评分。通过改进的GMAE评估模型对本融合策略进行验证和评价,结果表明,本策略在准确度、推荐项目多样性方面较传统协同融合策略有明显提高。

关键词:推荐系统;群组推荐;交互行为;偏好融合;GMAE

随着大数据时代的来临,搜索引擎在一定程度上解决了用户从海量信息中准确获取目标对象困难的问题;但是搜索引擎一般要求用户对目标对象有比较清晰的了解,否则很难寻找到目标对象。在用户对目标尚不明确或了解不够充分时,推荐系统可以通过推荐对象,来达到推测用户偏好的目的。传统推荐系统一般是为单独用户进行推荐,然而现实生活中很多活动是由群组共同进行的[1-3],例如聚餐、看电影、旅行等。组推荐系统在实际应用中,需要满足总体满意度、公平性、可理解性等要求,满足不同的要求需要使用不同的融合策略。在偏好融合方面,目前主要有加权模型(MCF)[1,4],其主要思想是根据群组成员的特征、角色、影响力等因素,为每个成员分配不同的权重,如根据成员年龄、性别等人口统计学信息对用户进行分类,然后赋予不同的权重[5-6]。L.Baltrunas等[5]考虑了组间相似度(GCF)对偏好融合策略的影响,其研究结果表明,不同融合策略若单纯利用组间相似度,则影响较小,推荐效果不明显[1,5]。本文就偏好融合策略进行了探讨,提出一种基于用户交互行为的偏好融合策略。

1群组推荐的形式化

目前,群组推荐还没有统一的形式化定义,S. B. Roy等[6]用共识函数为群组推荐做了定义,共识函数主要分为2部分:群组评分和偏好差异程度[3,7]。为更好地阐述偏好融合策略,本文重新定义群组推荐系统。

设ITEMS={I1,I2,…,Im}表示所有项目的集合,USERS={U1,U2,…,Un}表示所有用户的集合,群组G⊆USERS,prerating(i,j)表示用户Ui对项目Ij的预测评分。由于推荐系统所普遍存的数据稀疏性问题,所以prerating(i,j)可以利用协同过滤的方式[3]得到。

定义1群组评分预测

设群组G对项目Ij的预评分为GroupRating(G,j),由组群中每个成员对项目Ij的预评分的融合所得。其形式化定义为

(1)

定义2TOP-K组推荐

在得到群组用户对每个项目的评分预测后,通常将评分最高的K个项目推荐给群组,即TOP-K。由TOP-K所生的推荐项目集T-IK需要满足以下2个条件:

1)GroupRating(G,i)>GroupRating(G,j),其中∀Ii∈T-IK,∀Ij∉T-IK;

2)如果GroupRating(G,i)=GroupRating(G,k),其中Ii,Ik∈T-IK,i≠k,若frequency(i)≥frequecy(k),则rank(i)>rank(k)。frequency(i)表示项目Ii被选择的频率,rank(i)表示项目Ii在T-IK中的降幂排序的顺序。

基于群组推荐系统的定义,本文的主要工作是利用协同过滤获得群组内用户以及群组对项目的初始评分,再利用下文中偏好融合策略对这些初始评分进行融合。

2传统偏好融合策略

表1中给出了传统组推荐系统常用的一些融合策略[8-10]。均值策略是把组内成员的评分平均值作为群组评分,是组推荐系统最常用的策略;然而均值策略产生的推荐可能引起个别群组成员的不满[6]。最小痛苦策略、痛苦避免策略是在均值策略上进行改进得到的;但此类方法需要人为设置过滤阈值,阈值设置过大或过小对推荐结果都有非常大的影响[9]。最受尊敬者策略是选择群组内权重最大的用户,将其评分作为群组的评分,但这种方法会造成内部分用户的不满意度增加[7,10]。

表1 传统偏好融合策略

3基于用户交互的偏好融合策略

3.1单个用户对项目的评分预测

由于推荐系统共同面临数据稀疏问题,所以当项目数量巨大的时候,每个用户并不一定会对所有项目进行评分。为预测用户对未评分项目的评分,可采用协同过滤推荐算法,即搜寻用户的最相似用户,利用相似用户对项目评分进行预测。

在使用协同过滤之前,先对数据进行预处理,将项目中没有被任何用户评分的项目移除,以减小数据空间,提高效率。

首先,采用余弦法计算用户之间的相似度,接着利用式(2)计算群组内每一位成员对项目的预测评分:

(2)

式中:Per_rating(ui,Ij)表示用户ui对项目Ij的预测评分;Nei_Clus(ui)表示用户ui的相似用户构成的邻居集;‖Nei_Clus(ui)‖表示邻居集的成员数目;rating(uk,Ij)表示邻居中用户对项目Ij的评分。

3.2群组间协同过滤算法

单个用户间具有相似性,群组间也会具有相似性,如相似家庭组,具有相似目的的旅行团体等。通过相似群组来对新群组进行偏好预测是具有可行性的[1-2,10]。首先,需要对以群组为元构成的集合进行聚类,聚类的目的是为减小数据搜索空间,提高效率,并且这种方式不会带来精确度的损失。当每一个新群组加入的时候,只需要将新加入的群组与每一个类的中心群组进行相似性比较,通过相似性的大小确定其所属的类,然后在相应的类中寻找与其最相似的群组,并预测其对项目的评分。

然后,利用组间协同过滤算法计算群组G对项目Ij的预测评分,其形式化描述为

SIM_RATING(G,Ij)=

(3)

式中:SIM_RATING(G,Ij)表示群组G对项目Ij的预测评分;Sim(G,G′)表示群组G与G′的相似度;Raitng(G′,Ij)表求群组G′对项目Ij的评分。本文中,群组相似度采用Jaccard系数[8]进行表示:

(4)

3.3基于用户交互的偏好融合策略

在群组决策中,并不是所有用户建议的影响和效果是一样的,有的成员的建议更具有影响力,有的次之,这与实际生活中的群组决策很类似,比如,聚餐活动时,对美食了解较深的成员的建议更具有说服力是一样的道理。为此,获取用户在群组中的权重对于群组决策来说具有相当重要的意义,有学者提出利用遗传算法或模拟退火算法等来获取用户的权重[11-14],这一定程度上提高了偏好融合的公平性;但这类算法只是单纯的从最优化角度去考虑,并未考虑用户之间的交互行为[1]。用户之间的交互行为可以很大程度上体现出用户对整个群组需求的关注度、了解度以及用户在群组决策中的影响力。通过获取用户的交互行为,可以间接获取用户在当前群组决策中的影响力或者影响权重。

Step1:通过用户交互行为计算用户权重。

(5)

Step2:推荐融合。

通过协同过滤获得群组中每位用户对项目的评分,通过组间协同过滤获得群组对项目的预评分,接下来,就将二者通过加权融合,得到最终的群组评分预测:

(6)

参数α、β通过实际数据集产生。本模型在实际生活中也具有参考意义,人们进入一个陌生的区域或领域的时候,对当前环境不够了解,需要参考他人的意见或者建议,但做决定是由自身发出的;因此,二者结合才能最终做出正确的决定。本模型就是利用了这个原理。

Step 3:Top-K排序生成推荐列表

根据Step2产生的群组预测评分,按照定义2所述,即可生成推荐列表。

图1 融合模型流程图

4改进的模型评价体系

任何推荐系统所生成的推荐列表,都需要按照特定的评价模型进行评价,传统的单人推荐通常只需要评价其准确率,而对于群组推荐,则不仅限于此。对群组推荐而言,其首要的是评价其准确度,其次还需要评价推荐列表的多样性,因为通常的推荐项目都具有较高的相似性,用户可能会因此产生厌倦的情绪。

4.1准确率评价

传统推荐系统在评价准确率时通常采用MAE方法[15-21],但在群组推荐系统中,传统的MAE显然是不适用的;因此,本文对传统的MAE方法进行了改进,提出一种适合群组推荐系统的准确率评价模型(GMAE)

GMAE=

(7)

式中:‖I‖表示评分项目总数;‖G‖表示群组中的成员数量。

推荐列表的覆盖率评价往往与准确率的评价是共同进行的,因为高覆盖率往往会以降低准确度为代价。

4.2推荐列表的多样性评价

通常推荐系统的推荐列表包含了很多相似的项目。在组推荐系统中,如果推荐列表中的项目过于相似,会导致群组的选择范围缩小,并有可能产生厌倦的情绪;因此,推荐项目的多样化也是组推荐的一个重要指标。通常方法是计算推荐列表中项目的相似度来衡量推荐系统的多样性[11]。为计算项目间的相似度,通常采用Jaccard系数[15]来计算2个项目的相似度。

(8)

接下来计算推荐列表的多样性

(9)

其中k表示推荐列表的项目总数, Divers的取值介于0与1。

5实验结果

5.1实验数据集

本实验采用100K MovieLens数据集,该数据集包含943名影评者对1 682部电影的10万条评分,其评分范围为0~5,其中0表示影评者未对该电影进行评分。

由于目前还没有用于群组推荐系统的数据集,为此本文借鉴文献[10]的方法,构建模拟真实情景下的群组评分数据。其主要思想是将用户分为不同的小组,为每位成员分配不同的权重,并通过加权的方式得到群组对项目的评分。每个群组所包含的成员数至少为2个,最多为30个。根据原始数据集的特点,将资源项目按属性分为不同的类别,每一个资源可以同时属于多个类别。通过文献[8,11]的方法,得到本实验所用的数据集,将2/3的数据集作为训练集,余下1/3作为测试集,通过实验检验推荐结果与测试集的差异度。

5.2实验结果及分析

1)获取最佳最终加权参数α、β。

α、β为推荐结果产生的控制参数,通过实验找出最佳的参数值,使GMAE最小即推荐准确度最高。为不受群组规模的影响,本实验统一设定群组规模为5。

图2 控制参数α的取值

实验结果如图2所示。可以看出,当α=0.6,β=0.4时,推荐结果的准确度最高,效果视为最好。当α=1时,即只有群组成员按权重进行推荐融合;当α=0时,即只采用群组间协同过滤的方式进行预测评分。从实验结果来看,单独使用这2种策略时,推荐效果都不理想。这从实际角度解释也是可行的,因为群组在进行评分时,组内成员的作用是决定性的,其他相似群组的建议起次要作用。

2)3种融合策略GMAE比较。

本实验比较了组间协同过滤(GCF)[4]、单独成员加权(MCF)[5]以及本文所提出的融合模型(PROPOSED)。图3示出在不同群组规模时,分别产生的推荐结果的GMAE的对比结果。

图3 融合策略对比

实验结果表明,在相同群组规模的前提下,相比GCF本文所提出的模型的准确率提高约17%,相比MCF,其准确率提高约10%,并且受群组规模的影响较小。

3)推荐项目多样性。

组推荐系统中,推荐项目的多样性是评价其性能的重要指标。本实验将组间协同过滤(GCF)、成员加权(MCF)以及本文提出的融合模型(PROPOSED)所得到的推荐列表进行多样化评价,其结果如图4所示。

图4 推荐列表多样性对比

其结果表明,群组成员越少,其推荐列表的多样性越差,成员数较多时,多样性越好。实验也证明了本文所提出的融合模型所得到的推荐列表的多样性明显优于另外2种融合模型。

6结论及展望

本文通过用户交互行为获得用户在群组中的影响权重,通过组间协同过滤的方式获得群组对项目的初始预测评分,最后,利用加权融合的方式,获得最终群组对项目的评分预测,并通过TOP-K获得最终的推荐列表。通过构造实验数据集进行试验,以检验模型的推荐效果,其结果表明,与GCF和MCF相比,本模型的准确率分别提高约17%和10%。

本模型引入用户的交互行为作为成员权重,对于单一的协同过滤方法,具有明显优势;但是本文没有提出用户交互行为的自动获取和自适应改变权重的模型,这是今后工作的重点。另外,本模型的时间复杂度相比单一协同过滤方法要高,这也是之后工作要解决的问题。

参考文献

[1]张玉洁,杜雨露,孟祥武.组推荐系统及其应用[J].计算机学报,2015,38(4):745.

[2]孟祥武,纪威宇,张玉洁.大数据环境下的推荐系统[J]. 北京邮电大学学报(自然科学版), 2015, 38(2): 1.

[3]孟祥武,刘树栋,张玉洁,等.社会化推荐系统研究[J]. 软件学报, 2015, 26(6): 1356.

[4]Ardissono L, Goy A, Petrone G, et al. Intrigue: Personalized Recommendation of Tourist Attractions for Desktop and Hand held Devices[J]. Applied Artificial Intelligence, 2003, 17(8/9): 687.

[5]Baltrunas L, Makcinskas T, Ricci F. Group Recommendations with Rank Aggregation and Collaborative Filtering[C]// ACM Conference on Recommender Systems. New York:Blackwell Publishing Ltd, 2011:407-423.

[6]Roy S B, Amer-Yahia S, Chawla A, et al. Space Efficiency

in Group Recommendation[J]. The VLDB Journal, 2010, 19(6): 877.

[7]刘树栋,孟祥武.基于位置的社会化网络推荐系统[J].计算机学报,2015,38(2) :322.

[8]王理,张淑莲.基于用户偏好融合的组推荐算法综述[J]. 电脑知识与技术, 2014, 10(7): 1511.

[9]许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J]. 软件学报, 2009, 20(2):350.

[10]李岱峰,覃正.一种基于资源多属性分类的群组推荐模型[J]. 统计与决策, 2010(8):153.

[11]Chen Y L, Cheng L C, Chuang C N. A Group Recommendation System with Consideration of Interactions Among Group Members[J]. Expert Systems with Applications, 2008, 34(3): 2082.

[12]张玉洁,孟祥武.遗忘遗传算法及其在信用评分中的应用[J]. 北京科技大学学报, 2012, 34(4): 471.

[13]郭磊,马军,陈竹敏,等.一种结合推荐对象间关联关系的社会化推荐算法[J].计算机学报, 2014, 37(1): 219.

[14]Wang J, Liu Z, Zhao H. Group recommendation based on the pagerank[J]. Journal of Networks, 2012, 7(12): 2019.

[15]Pessemier T D, Dooms S, Martens L. Comparison of Group Recommendation Algorithms[J]. Multimedia Tools & Applications, 2014, 72(3):2497.

[16]Quijano-Sanchez L, Recio-Garcia J A, Diaz-Agudo B, et al.Social Factors in Group Recommender Systems[J]. ACM Transactions on Intelligent Systems and Technology, 2013, 4(1):1.

[17]Jameson A, Smyth B. Recommendation to Groups[C]//The Adaptive Web. Berlin: Springer, 2007: 596-627.

[18]Amer-Yahia S, Roy S B, Chawlat A, et al. Group Recommendation: Semantics and Efficiency[J]. The Proceedings of the VLDB Endowment,2009, 2(1): 754.

[19]Garcia I, Pajares S, Sebastia L, et al. Preference Elicitation Techniques for Group Recommender Systems[J]. Information Sciences, 2012,189(8): 155.

[20]Masthoff J. Group Modeling: Selecting a Sequence of Television Items to Suit a Group of Viewers[J]. User Modeling and User-Adapted Interaction,2004, 14(1): 37.

[21]Garcia I, Pajares S, Sebastia L,et al. Preference Elicitation Techniques for Group Recommender Systems[J]. Information Sciences, 2012,189(8): 155.

(编校:饶莉)

Research on the Integration Strategy of Group Recommendation Based on User’s Interactive Behaviors

TANG Fuxi1, LIU Kejian1*, FENG Ling1,JIANG Jingwei2

(1.SchoolofComputerandSoftwareEngineering,XihuaUniversity,Chengdu610039China;2.TibetFeiyueIntelligentTechnologyCo.,Ltd.,Lasa850000China)

Abstract:In order to reduce the unsatisfictory among the group and improve the accuracy of group recommender system, this paper proposes a preference integration strategy based on users’ interactive behaviors.This model obtained the each members’ prediction rating on the items and group’s predictions on the items based on the individual and group collaborative filtering algorithm. Additionally, this paper puts forward a method that obtains the weights of members, then obtains the final prediction of items through the preference fusion method. The model was evaluated and verified by the improved GMAE. The results of the experiments show that the proposed algorithm is better than traditional GCF on accuracy and diversity.

Keywords:recommender system; group recommendation; interaction behavior; preference integration; GMAE

收稿日期:2016-02-22

基金项目:国家科技支撑计划项目西藏自然科学博物馆数字馆关键技术研究及集成示范(2011BAH26B01);国家自然科学基金(61271413,61472329,61532009);数字空间安全保障四川省高校重点实验室开放基金课题资助(SZjj2015-055);四川省教育厅重点项目资助(16ZA0165);西华大学重点科研基金项目(Z1320607);西华大学研究生创新基金(YCJJ2015187)。

*通信作者:刘克剑(1974—),男,副教授,主要研究方向为计算机网络和无线网络技术、智能信息处理技术、高性能计算技术。E-mail:liukejian@gmail.com

中图分类号:TP181;TP391.3

文献标志码:A

文章编号:1673-159X(2016)03-0051-6

doi:10.3969/j.issn.1673-159X.2016.03.011

·计算机软件理论、技术与应用·

猜你喜欢

推荐系统
数据挖掘在选课推荐中的研究
基于用户偏好的信任网络随机游走推荐模型
基于个性化的协同过滤图书推荐算法研究
个性化推荐系统关键算法探讨
浅谈Mahout在个性化推荐系统中的应用
关于协同过滤推荐算法的研究文献综述
一种基于自适应近邻选择的协同过滤推荐算法
UGC标签推荐系统的一种新的标签清理方法
网上商品推荐系统设计研究
基于Mahout分布式协同过滤推荐算法分析与实现