APP下载

基于时间效应的多准则推荐算法

2018-11-26祥雨戚舒梅曾步鑫

电脑知识与技术 2018年22期
关键词:推荐系统

祥雨 戚舒梅 曾步鑫

摘要:近年来,推荐系统被广泛认为是解决“信息过载”及“信息迷航”的一个有效工具。多准则评分比单一整体评分具有更为丰富的用户个性化偏好信息,但传统的多准则推薦系统研究未考虑到用户兴趣漂移的情况。针对这一问题,本文将时间信息与基于用户的多准则协同过滤算法相结合,在多准则算法中引入基于遗忘规律的艾宾浩斯遗忘曲线拟合用户兴趣漂移,修正用户之间的相似度计算结果。实验结果表明,与传统的多准则协同过滤算法相比,本文提出的算法具有较高的准确度。

关键词:多准则;推荐系统;时间衰减

中图分类号:TP182 文献标识码:A 文章编号:1009-3044(2018)22-0161-03

Abstract: In recent years, the recommendation system has been widely considered as an effective tool for solving "information overload" and "information trekking." The multi-criteria rating has more user personalized preference information than a single overall rating, but the traditional multi-criteria recommendation system does not consider the situation of user interest drift. In order to solve this problem, this paper combines time information with user-based multi-criteria collaborative filtering algorithm. In the multi-criteria algorithm, Ebbhauser forgetting curve based on forgetting rule is introduced to fit user interest drift, and similarity between users is corrected. Experimental results show that compared with the traditional multi-criteria collaborative filtering algorithm, the proposed algorithm has a higher accuracy.

Key words: Multi-Criteria; Recommender System; Time Attenuation

1 引言

在信息爆炸的当代,互联网用户所遇到的首要问题已从“信息匮乏”逐渐转变为“信息过载”及“信息迷航”问题。为解决这些问题,从用户角度出发,信息的获取方式发展经历了网站信息分类、搜索引擎几个重要阶段。推荐系统(recommender systems)作为个性化服务研究领域的重要分支,能够向用户推荐其个人感兴趣的信息。目前,几乎所有大型的电子商务网站,如Amazon、京东商城等,都不同程度地运用了各种形式的个性化推荐技术[1]。

近年来,各大网站认识到单一整体评分的缺陷,开始鼓励用户对商品的多个属性分别进行评分。但是如何恰当地运用这些信息,并得到更加准确的推荐,是多准则推荐系统(Multi-Criteria Recommender System)所面临的主要挑战之一。由现有的研究可将多准则评分推荐方法分为如下几类:(1)基于启发式的多准则评分推荐算法。首先基于各个准则计算用户间的相似度,Le[2]提出基于用户的混合模糊协同过滤算法,将评分数据或人口信息用模糊数和模糊区间替代,以计算用户间相似度。然后,将各准则下的相似度聚合为总体相似度,常用的聚合方法有平均相似度、最坏相似度(如最小值)[3]和最大值距离等[4],考虑到不同用户在不同准则的偏好程度可能有所差异,可使用加权平均相似度[5]。选择近邻、生成推荐列表。(2)基于模型的多准则评分推荐算法。主要是根据多准则评分数据的高维度特点,对现有模型进行改进。其中,矩阵分解和概率模型方法是最主要的两种方法[5]。Park等人[6]在餐饮领域,基于移动环境利用贝叶斯网络构建用户偏好模型,借助AHP提取用户群体偏好,实验显示贝叶斯网络在不确定性环境下表现良好。(3)基于多准则优化的多准则评分推荐方法。常用的方法是将多准则推荐定义为优化问题,根据特定的优化目标建立项目的最佳排序,而后进行推荐。多准则推荐系统优化的对象有整体效用和准则效用[7]、冲突准则效用或指标[8]、特征选择和数据输入选择[9],后两者也可作为优化的方式选择。

越来越多研究人员也开始研究用户行为的动态特性,重视时间信息在推荐系统中的作用[10]。目前大多研究者将时间信息于推荐模型相结合,Ding等人[11]在Item-CF中使用时间衰减函数,这种方法能显著降低 RMSE,从而提高算法的准确性。Lu[12]扩展了矩阵分解模型,将时间作为模型新增的维度,如此便建立了动态的用户和项目的特征向量模型;Xiong等人[13]基于时间维度扩展的矩阵分解模型,引入张量分解的方法对用户和项目进行推荐建模。

为了提高推荐质量,本文将时间信息与基于用户的多准则评分推荐算法相结合,利用艾宾浩斯遗忘曲线修正用户之间的相似度,以更加准确地找到近邻,从而提高推荐效果。

2 传统的基于用户的多准则协同过滤推荐算法

传统的基于用户的多准则协同过滤推荐算法可以看作是基于用户的单一评分协同过滤算法的扩展。使用用户-项目评分矩阵,融合各个准则上的用户相似度,得到与目标用户相似度最高的K个用户,再将相似用户感兴趣的项目推荐给目标用户。多准则评分旨在从不同的方面体现用户偏好差异,较单一整体评分能够更加全面地考虑用户的偏好特征。下面以用户对酒店的评价信息为例,基于用户来解释多准则评分。

假设某网站有三个用户([u1,u2,u3])和五个酒店([i1,i2,i3,i4,i5]),各用户对酒店的评分数据如表1所示。每个评分项由整体评分和各准则评分(位置分、卫生分、服务分、性价比)组成,例如,用户[u1]对酒店[i1]的整体评分为2,各准则评分分别为(1,1,3,3)。由表可得,用户[u1]和[u3]对酒店[i1,i2,i3,i4]的整体评分完全一致,如果基于整体评分对用户[u3]进行推荐,用户[u1]是目标用户[u3]的最近邻,对[u3]的最终预测分影响最大。但是对比各用户对酒店[i1,i2,i3,i4,i5]在各个准则下的评分,[u1]和[u3]的偏好大不相同,而[u2]和[u3]在各准则上的评分比[u1]和[u3]更相近,因此若根据各准则评分对用户[u3]进行推荐,用户[u1]与目标用户[u3]更为相似,对[u3]的最终预测分影响最大。

4 实验结果及分析

4.1 实验数据集

为了评估本文所提出算法的性能,本文采用雅虎电影(https://movies.yahoo.co.jp/)2005年11月至2016年8月内所有用户对电影的多准则评分数据,共23万多条记录,通过对数据进行删除缺省值、删除无效数据等操作,并剔除了评分记录少于10条的用户及其相应记录,保留下来906个用户、941部电影,共35188条记录。

4.2 评价指标

由图1可知,本章提出的基于时间效应的多准则评分推荐算法相比传统的多准则评分协同过滤算法取得了更好的推荐效果。当近邻数为30时,降低幅度最大,这表明算法的预测值与实际值的更为接近。

5 结论

本文阐述了基于时间效应的多准则评分协同过滤推荐算法,在User-Based的多准则推荐算法中引入时间信息,模拟用户兴趣漂移和项目流行度变化,对协同过滤算法中的相似度计算进行改进。实验表明,考虑多准则评分信息和时间信息能够给推荐算法的效果带来显著提高。

参考文献:

[1] 王立才,孟祥武,张玉洁.上下文感知推荐系统[J].软件学报,2012,23(1):1-20.

[2] Le H S.HU-FCF:A hybrid user-based fuzzy collaborative filtering method in Recommender Systems[J].Expert Systems with Applications,2014,41(15):6861-6870.

[3] Adomavicius G,Kwon Y O.New Recommendation Techniques for Multicriteria Rating Systems[J].IEEE Intelligent Systems,2007,22(3):48-55.

[4] Adomavicius G,Tuzhilin A.Towards the next generation of recommender systems:A survey of the state-of-the-art and possible extensions. IEEE Trans.on Knowledge and Data Engineering (TKDE),2005,17(6):734?749.[doi:10.1109/TKDE.2005.99].

[5] Adomavicius G,Manouselis N,Kwon Y O.Multi-Criteria Recommender Systems[J].Recommender Systems Handbook,2011,10(4):769-803.

[6] Park M H,Park H S,Cho S B.Restaurant Recommendation for Group of People in Mobile Environments Using Probabilistic Multi-criteria Decision Making.[C]//Computer-Human Interaction,Asia-Pacific Conference,Apchi 2008,Seoul,Korea,July 6-9,2008,Proceedings.2008:114-122.

[7] N.Manouselis and C.Costopoulou.Experimental analysis of design choices in multi-attributeutility collaborative filtering.International Journal of Pattern Recognition and Artificial Intelligence,21(2):311–332, 2007.

[8] Samant M R,Deshpande M S,Jadhao M A. Multi Criteria Recommendation System for Material Management[J].International Journal of Advanced Trends in Computer Science&Engineering;,2016.

[9] Guyon I,Gunn S,Nikravesh M,et al.Feature Extraction:Foundations and Applications(Studies in Fuzziness and Soft Computing)[C]//Springer-Verlag New York,Inc.2006.

[10] Nilashi M,Ibrahim O B,Ithnin N.Hybrid recommendation approaches for multi-criteria collaborative filtering[J].Expert Systems with Applications,2014,41(8):3879-3900.

[11] Ding Y,Li X.Time weight collaborative filtering[J].2005,1:485-492.

[12] Lu Z,Agarwal D,Dhillon I S.A spatio-temporal approach to collaborative filtering[C]//ACM Conference on Recommender Systems,Recsys 2009,New York,Ny,USA,October.DBLP,2009:13-20.

[13] Xiong L,Chen X,Huang T K,et al.Temporal Collaborative Filtering with Bayesian Probabilistic Tensor Factorization[C]//Siam International Conference on Data Mining,SDM 2010, April 29 - May 1,2010,Columbus,Ohio,Usa.DBLP,2010:211-222.

【通联编辑:梁书】

猜你喜欢

推荐系统
基于用户偏好的信任网络随机游走推荐模型
基于Mahout分布式协同过滤推荐算法分析与实现
基于Baseline SVD主动学习算法的推荐系统