基于利用可靠用户网络补充标签的服务推荐
2019-03-29吴浩彭亦楠何鹏黄权
吴浩 彭亦楠 何鹏 黄权
摘 要:在服务推荐过程中,为了把社交关系对用户兴趣的影响标签化,提升推荐结果的准确性,提出一种基于利用可靠用户补充标签的服务推荐方法SRST,通过在相似用户之间构建可靠用户网络,比较可靠用户网络中每个用户节点的度数得到度数最大的Top-k2个可靠用户,并通过这些可靠用户的兴趣标签对目标用户的标签进行补充,再利用补充后的标签集进行服务推荐,最后在公开数据集Delicious上进行实证分析。
关键词:社交关系;可靠性网络;协同过滤;服务推荐
中图分类号:TP39文献标识码:A文章编号:2095-1302(2019)02-00-04
0 引 言
随着Web 2.0时代的到来,用户可通过社会标签组织、管理及共享资源,社会标签也因其易用性成为资源分类和索引的重要方式[1]。社会标签既能体现资源本身的特征,又能反映用户的兴趣偏好[2]。将社会标签与个性化推荐相结合,能够有效提高个性化推荐的效率。
人们提出了许多在推荐系统中利用社会网络信息的方法[3-9],从而产生了社会推荐领域。尤其是文献[3]提出的BPR模型,该模型进一步假设在所有目标用户未接触过的服务中,用户更喜欢那些被其社交关系接触过的服务。但是这些基于社交关系的推荐主要针对冷启动和数据稀疏的问题,而且推荐的准确度不高[10]。本文把社交关系对用户兴趣的影响以标签的形式体现出来,并用来提高服务推荐的质量。
本文在标签的角度,为提取出社交关系中的兴趣标签用来对目标用户的标签集进行补充,提出一种基于利用社交关系补充标签的服务推荐(Service Recommendation Based on Using Social Relations to Supplement Tags,SRST)方法。大致流程可概括为:利用目标用户的Top-k1个相似用户构建可靠用户网络,通过比较用户节点度数找出Top-k2个可靠用户,再利用可靠用户的标签补充目标用户的标签,最后利用补充后的标签集向目标用户推荐服务。
1 研究方法
以Delicious公开数据为例,假设向用户u推荐服务。本文方法主要包括构建可靠用户网络、补充目标用户原标签集和服务推荐三个部分。首先通过构建可靠用户网络过滤出可靠用户;其次综合可靠用户的标签补充目标用户的标签集;最后利用补充后的标签集对目标用户推荐服务。
1.1 构建可靠用户网络
在构建可靠用户网络过程中,先从用户集合U中通过比较与目标用户u的标签相似度,筛选出Top-k1个相似用户,然后将每个相似用户表示为一个节点。若两个用户之间的可靠度(可靠度是一个综合考虑标签相似度和社交网络相似度的参数)大于某个阈值θ,则他们之间被视为存在一条可靠性连边。
1.1.3 连接相似用户之间的可靠性边
令Bk1×k1表示相似用户之间的可靠性网络矩阵,如果用戶p与用户q之间的可靠度大于阈值θ,表示这两个用户节点之间存在一条可靠性连边,矩阵元素qi,j=qj,i=1。当所有相似用户之间的可靠性边都存到矩阵B中后,矩阵B就是所要构建的可靠性网络。
1.2 过滤出可靠用户
通过比较可靠用户网络中节点的重要性,得到该可靠性网络中的一些核心节点,这些核心节点就代表着核心用户。本文利用节点度数比较节点的重要性,用户节点的度数在矩阵B中是对应行中元素不为零的个数。取出可靠性网络中Top-k2个节点度数最大的用户节点,得到最后的可靠性用户集合Urel。
1.3 补充目标用户的标签
先从可靠用户中提取出兴趣标签,但因为本文方法只统计标签出现的次数,而标签出现的次数跟权重并非正相关,所以本文提出以下两种提取兴趣标签的方法。
方法一(SRST1):提取出Top-k2个用户都包含的兴趣标签,即对Top-k2个用户中每个用户包含的兴趣标签取交集。
方法二(SRST2):提取出累加权重最大的兴趣标签Top-k3。对Top-k2中每个用户包含的兴趣标签取并集,每个标签的权重等于该标签对于每个用户的权重累加,利用KNN算法得到Top-k3个权重最大的标签,并利用提取出的兴趣标签与目标用户的标签集取并集得到补充后的标签集Tu。
1.4 基于标签相似度服务推荐
如果某个服务的标签集Ts与补充后的用户标签集Tu有交集Tu∩s,就累加交集里的标签相对服务的权重得到目标用户喜欢的概率Pu,s,当Pu,s大于等于阈值δ(0.5≤δ≤1)时,就把服务s推荐给目标用户。令Wt(t∈Ts)表示服务s的标签t的权重,计算公式如下:
2 实验分析
2.1 数据集
实验数据来源于Grouplens平台提供的Delicious标签数据,Delicious 数据集中用户为1 867个,书签为104 799个,标签为53 388个,实验数据的统计情况见表1 所列。
2.3 实验结果
为验证本文所提SRST方法的有效性,随机从用户-服务关注矩阵M中抽取比例为10%的q=1的元素作为测试集,并设置过滤相似用户的个数k1=50,过滤可靠用户的个数k2=5,可靠度的比例参数α=0.5,目标用户补充标签的个数k3=20,可靠度的阈值θ=0.5,概率Pu,s的阈值δ=0.6。推荐结果的accuracy值见表3所列。
首先,实验结果显示在随机列举的10次实验中,本文所提SRST的accuracy值比已有的两种方法都要高,即推荐准确度更高。由表格后2行可知,SRST的accuracy提升幅度在0.02~0.19以内,相比UPCC平均提升了0.121,相比IPCC平均提升了0.116。
其次,因为实验设置用户补充标签的个数k3=20,而用户原标签集的个数在130以上,所以accuracy平均提升幅度为0.116,说明本文方法补充的兴趣标签准确、有效。
2.4 参数影响分析
SRST方法中给用户推荐的标签数k3设置为20,理论上补充标签越多,最后用户标签集的基数越大,容错率就会越大,实验的准确度accuracy也会越大,所以将k3设置为合适大小的值可保证方法的客观合理性。
SRST方法中关键的一步就是构建可靠的用户网络,其中可靠度的比例参数α、相似用户的个数k1、可靠用户的个数k2、可靠度的阈值θ都是动态可调的,而且不同的取值会对最后可靠用户集Urel的生成有影响,所以本文对以上4个参数单独做分析测试。
比例参数α取值越大,标签相似度在可靠度计算中所占的比例越大,最后得到的可靠用户与目标用户的标签相似度越高;而取值越小,社交网络相似度在可靠度计算中所占的比例越大,最后得到的可靠用户与目标用户在社交关系上就会越亲密。因此,在保持其他参数固定,即k1=50,k2=5,θ=0.5时,分析该参数对推荐结果的影响。如图1所示,参数α在[0.2,0.4]区间时,accuracy相对较高,最高为0.72,说明参数α在[0.3,0.4]区间取值,即可靠度更多地考虑社交网络相似度更合适。
对于相似用户的个数k1,在保持其他参数固定时,分析结果如图2所示。参数k1在[20,50]区间时,accuracy相对较高,最高为0.77,说明相似用户过多,会降低可靠用户网络的可靠性,所以参数k1在[20,50]区间取值较为合适。
对于可靠用户的个数k2,在保持其他参数固定时,分析结果如图3所示。参数k2在[8,10]区间时,accuracy相对较高,最高为0.73,说明k2不应太大,否则会降低补充标签的准确性,所以参数k2取值为9或10较为合适。
对于可靠度的阈值θ,在保持其他参数固定时,分析结果如图4所示。参数θ取值为0.1或0.4时,accuracy相对较高,最高为0.77,说明参数θ取值0.1或0.4较为合适。
3 结 语
为了使社交关系对用户兴趣的影响标签化,提升推荐结果的准确性,本文提出一种基于利用可靠用户补充标签的服务推荐方法SRST。通过构建可靠用户网络,找出Top-k2个可靠用户,然后利用可靠用户的兴趣标签补充目标用户的标签集,再用该标签集给用户推荐服务,并在公开数据集Delicious 上进行实证分析。实验结果表明,相比已有方法,本文所提方法在该数据集上的推荐准确度accuracy可分别提高0.121和0.116,且发现构建可靠用户网络时,α在[0.3,0.4]区间中取值,k1=30,θ=0.1时,推荐效果最好;同时,补充标签时为目标用户返回Top-9个可靠用户最为适宜。
另外,本文方法定义的用户标签向量的值是标签使用的次数,后期工作可利用TF-IDF方法从全局和局部两个角度综合求出标签对于用户的权重,进一步提高推荐的准确度。
参 考 文 献
[1] KOHI A,EBRAHIMI S J,JALALI M. Improving the accuracy and efficiency of tag recommendation system by applying hybrid methods[C]// International Econference on Computer and Knowledge Engineering. IEEE,2011:242-248.
[2]張斌,张引,高克宁,等.融合关系与内容分析的社会标签推荐
[J].软件学报,2012,23(3):476-488.
[3] RENDLE S,FREUDENTHALER C,GANTNER Z,et al. BPR:bayesian personalized ranking from implicit feedback[C]// Conference on Uncertainty in Artificial Intelligence. AUAI Press,2009:452-461.
[4] JAMALI M,ESTER M . A matrix factorization technique with trust propagation for recommendation in social networks[C]// Proceedings of the 2010 ACM Conference on Recommender Systems. ACM,2010:135-142.
[5] JAMALI M,ESTER M . TrustWalker : a random walk model for combining trust-based and item-based recommendation[C]// Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM,2009:397-406.
[6] LU W,IOANNIDIS S,BHAGAT S,et al. Optimal recommendations under attraction,aversion,and social influence[C]// Acm Sigkdd International Conference on Knowledge Discovery & Data Mining. ACM,2014:811-820.
[7] MA H,KING I,LYU M R . Learning to recommend with explicit and implicit social relations[J]. ACM transactions on intelligent systems and technology,2011,2(3):1-19.
[8] MA H,YANG H,LYU M R,et al. Sorec:social recommendation using probabilistic matrix factorization[C]// ACM,2008:931-940.
[9] MA H,ZHOU D,LIU C,et al. Recommender systems with social regularization[C]// WSDM,2011:287-296.
[10] WANG X,LU W,ESTER M,et al. Social recommendation with strong and weak ties[C]// ACM International on Conference on Information and Knowledge Management,ACM,2016:5-14.
[11] MA H,ZHOU D Y,LIU C,et al. Recommender systems with social regularization[C]// Proceedings of the Fourth ACM International Conference on Web Search and Data Mining,ACM,2011:287-296.
[12] LINDEN G,SMITH B,YORK J. Amazon.com recommendations: item-to-item collaborative filtering [J]. IEEE internet computing,2003,7(1): 76-80.
[13] WEI S,ZHENG X,CHEN D,et al. A hybrid approach for movie recommendation via tags and ratings [J]. Electronic commerce research & applications,2016,18(C): 83-94.
[14] LAWRENCE E. Everything is a recommendation netflix,altgenres and the construction of taste [J]. Knowledge organization,2015,42(5):358-64.
[15]夏立新,李重陽,程秀峰,等.异质网络资源多维度推荐模式研究—以豆瓣网为例[J].图书情报工作,2017,61(3):6-13.
[16] MA H,YANG H X,MICHENAEL R L,et al.Sorec:social recommendation using probabilistic matrix factorization[C]//
Proceedings of the 17th ACM Conference on Information and Knowledge Management,ACM,2008:931-940.
[17] GUO L,MA J,CHEN Z M,et al.Learning to recommend with social relation ensemble[C]// Proceedings of the 21st ACM International Conference on Information and Knowledge Management,ACM,2012:2599-2602.
[18] TOUHID B.A survey on the relationship between trust and interest similarity in online social networks[J].Journal of emerging technologies in web intelligence,2010,2(4):291-299.
[19] YU Y,QIU G H.Research on collaborative filtering recommendation algorithm by fusing social network[J].New technology of library and information service,2012(6):54-59.
[20] SARWAR B M,KARYPIS G,KONSTAN J A,et al.Application of dimensionality reduction in recommender system a case study[C]// ACM WebKDD Workshop,2000.
[21]蒋胜,王忠群,修宇,等.集成社会化标签和用户背景信息的协同过滤推荐方法[J].计算机应用,2014,34(8):2328-2331.
[22] WANG H,TAO Y,YU Q,et al. Incorporating both qualitative and quantitative preferences for service recommendation [J]. Journal of parallel & distributed computing,2018(114):46-69.
[23] HU Q Y,ZHAO Z L,WANG C D,et al. An item orientated recommendation algorithm from the multi-view perspective [J]. Neurocomputing,2017(269):261-272.
[24] CHEN M,MA Y,HU B,et al. A ranking-oriented hybrid approach to QoS-Aware web service recommendation[C]// Proceedings of the IEEE International Conference on Services Computing,2015:578-585.
[25] REN L,WANG W. An SVM-based collaborative filtering approach for Top-N web services recommendation [J].Future generation computer systems,2017(78):531-543.
[26] DENG S,HUANG L,XU G. Social network-based service recommendation with trust enhancement [J]. Expert systems with applications,2014,41(18): 80-84.
[27] CAO B,LIU J,TANG M,et al. Mashup service recommendation based on user interest and social network[C]// Proceedings of the IEEE International Conference on Web Services,2013:99-106.
[28] XU J,ZHENG Z,LYU M R.Web service personalized quality of service prediction via reputation-based matrix factorization [J]. IEEE transactions on reliability,2016,65(1): 28-37.
[29] MAHLER R P S.Multitarget bayes filtering via first-order multitarget moments[J].IEEE transactions on aerospace & electronic systems,2004,39(4):1152-1178.
[30]王曉,韩崇昭,连峰.基于随机有限集的目标跟踪方法研究及最新进展[J].工程数学学报,2012,29(4):567-578.
[31] ZHOU X,LI Y,HE B,et al. GM-PHD-Based multi-target vi-sual tracking using entropy distribution and game theory[J]. IEEE transactions on industrial informatics,2014,10(2):1064-1076.
[32] VO B N,MA W K. The gaussian mixture probability hypothesis density filter[J].IEEE transactions on signal processing,2006,54(11):4091-4104.
[33] BERNARDIN K,STIEFELHAGEn R. Evaluating multiple object tracking performance: the CLEAR MOT metrics[J]. Eurasip journal on image & video processing,2008(1):246-309.