APP下载

移动环境中上下文感知的协同过滤推荐模型

2016-05-18万里勇李楚涵

电脑知识与技术 2016年9期
关键词:模型

万里勇++李楚涵

摘要:由于移动环境中的用户偏好通常会随着位置的变化而发生改变,传统的协同推荐模型在推荐质量的准确率方面往往较低。为了解决这种问题,该文考虑移动环境中上下文因素,提出了将下上文信息融入到协同推荐模型中,提出将上下文预过滤与上下文建模进行结合,构建了一种面向移动环境中上下文感知的协同过滤推荐模型。实验及分析表明,本文提出的协同推荐模型,在改善推荐质量方面具有较好的表现,能够较好的提高推荐的准确性。

关键词: 移动环境;上下文;协同推荐;模型

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)09-0020-03

在当前移动互联网飞速发展的时代,以智能手机为代表的移动终端产品正进入千家万户。目前,它已成为人们获取信息的重要工具和设备。然而,由于移动终端产品的自身特性和移动环境的多变性,用户获取信息的能力受到了影响和限制[1-2]。如何帮助移动用户发现或获取有用信息就显得非常重要。然而,传统的推荐模型或系统,主要针对固定环境下的用户进行推荐,较少考虑移动环境下影响用户的上下文因素,因而不适用对移动环境下进行服务推荐。本文在现有的上下文推荐系统和移动推荐系统的研究基础上,将上下文预过滤与上下文建模进行结合,针对移动用户提出一种面向移动环境上下文感知的协同过滤推荐模型。

1 相关工作

1.1 协同过滤推荐

协同过滤推荐(Collaborative Filtering Recommendation)是推荐系统应用领域应用最为广泛的一种推荐技术,其中心思想是通过对相似性进行计算而获取邻居用户,综合相似用户对信息的评价得分,形成对指定用户的推荐[3]。从推荐过程来看,协同过滤推荐首先需要计算目标用户与其他用户间的相似度,然后选取与目标用户相似度最高的用户对项目的评价来推测目标用户对为评分项目的偏好,最后向目标用户做出推荐。目前,常见的协同过滤推荐模型有:Grundy系统、Phoaks系统和Ringo系统等。

1.2 上下文感知的协同推荐

上下文(Context)作为一个复杂概念,至今还有一个公认的定义。一些学者,将上下文定义为:用于描述实体环境状态的特性信息。同样,上下文感知推荐中的“上下文”也没有统一定义[4],通常是在结合实际的应用场景以及用户需求中,完成对其进行合适定义和建模。比如,在餐饮推荐场景中,上下文信息可能包括:时间、地点和环境等。

2005年,学者Chen[5]提供了基于上下文感知的协同推荐模型,他在研究中认为“相似用户对项目的偏好也应该具有相似性”。然而,这个观点并不完全正确,其原因在于评分用户仅考虑自身偏好时的上下文因素,而缺乏对其他用户的上下文因素的考虑,从而导致片面性。2011年,Adomavicius等人[6]提出了多维度上下文用户偏好相似性计算,在推荐质量方面有所提高;国内的徐凤芩等人提出了基于用户的上下文相似度协同过滤推荐模型。,

2 面向移动环境下上下文感知的协同推荐模型

2.1 问题的提出

传统的推荐系统通常仅通过对目标用户与其他用户间的相似度的计算,来确定相似用户,然后,再利用相似用户的评分来预测目标用户对项目的偏好程度,最终形成对用户产生推荐服务。这种推荐对于用户偏好较为固定的情况,能够产生较好推荐质量。但是,由于在移动环境下,用户的偏好通常会随着上下文的变化而发生改变,因而要提供推荐结果的准确性,就必须在推荐模型结合移动环境下上下文信息,即将移动环境下上下文因素融入到推荐模型中进行考虑。

2.2 协同推荐模型的构建

从已有的研究情况来看,将上下文因素融入到协同过滤推荐模型中,能够较好提高推荐质量。然而对于移动环境下上下文感知的协同推荐模型,其重要解决的问题就是要如何将上下文信息引入到推荐模型中。结合移动环境的特点,对移动环境下上下文感知的协同过滤推荐模型进行构建,模型的框架结构,如图1所示。

在本模型中,主要涉及四个重要模块:上下文确定、上下文预过滤、过滤推荐和信息反馈等四个模块。

1)上下文确定。由于移动环境下,上下文信息会随着地理位置的变化而发生改变,因此,对于上下文确定,是本模型的一个重要工作。

2)上下文预过滤。上下文预过滤模块主要完成对相似度不高的数据进行过滤。模型中,定义了硬性上下文信息,需要对不符合硬性上下文的用户-项目评分数据进行过滤处理。

3)过滤推荐。过滤推荐模块是本模型的核心模块。其主要任务用于完成对用户相似度计算、邻居用户的确定、评分预测计算和上下文相似度计算等。

4)信息反馈。对于信息反馈模块,主要实现将用户实际选择对所选项目的评分加入到数据库中,为推荐积累数据,从而不断丰富推荐数据信息,确保推荐数据的完整性。

2.3 协同推荐算法模型及描述

在本文设计的协同过滤推荐模型中,需要重点解决的四个子问题为:1)上下文相似度计算;2)基于上下文的目标用户近邻形成;3)基于上下的项目评分预测;4)基于上下文的项目推荐生成;

根据模型设计的需要,对每个进行了相关算法设计。但由于篇幅原因,这里将不给出四个子算法具体实现过程,这里只给出四个子算法间的关系框架图,如图2所示。

其中,U-I-C模型表示用户-项目-评分模型;C表示移动上下文;[Ua]表示目标用户;H表示上下文相似度阙值;N表示与用户具有最高相似度的邻居用户集;[ru,c]表示处于上下文中的用户对所有项目的评分;[ra,c]表示上下文用户[Ua]对所有项目的评分;[simt(c,x,i)]表示C和x对项目i的相似度;而[sima,u,c]是指用户u与目标用户[Ua]在上下文C下的相似度。

3 实验模型设计及结果分析

3.1 实验模型设计

为了验证本文的上下文感知的协同过滤推荐模型推荐效率。本文分别考虑其中三种情况并为其设计了相应算法,他们分别为:不考虑上下文的协同过滤推荐算法模型(称之为NM);仅考虑上下文预过滤的协同推荐算法模型(称之为OM);结合预过滤和上下文建模的协同过滤推荐算法模型(称之为UM),也即本文设计的推荐模型。实验中,我们将这三者模型算法进行比较,验证推荐模型的性能情况。

3.2 实验环境介绍

1)实验环境。实验平台环境包括硬件环境和软件环境。其中,硬件环境:Intel(R)Core(TM)i3,2.53GHz的CPU、电脑内存2G;软件环境:PC操作系统为Windows7、数据库系统为Microsoft SQL Server 2008;集成开发平台:Eclipse4.2;开发语言:Java。

2)实验数据集。从目前来看,实验数据集主要分为真实数据集、模拟数据集和半模拟数据等三种类型。其中,真实数据集是用实验人员根据项目实际情况采集的数据,这类数据集能够较好反映真实情况;模拟数据集,是实验人员依据某种规则构造成的数据集,这类数据集具有较强灵活性但缺乏真实性;半模拟数据集则指由真实数据集和模拟数据集组合成的数据集。

由于用户处于移动环境下,用户的上下文信息会随着地理位置发生变化,它需要在真实场景下进行采集。因此,对于本实验中数据,我们采用真实数据集进行测试。本实验的数据集收集主要在南昌市昌北高校学生中展开。本次收集的数据集,包括180个用户对130个项目的3214条记录。

3.3 实验过程及结果分析

在实验中,我们将数据分成训练集和测试集进行测试,同时用随机方法抽取80%数据集为训练数据集,其标记为Dx;抽取20%数据集为测试集,标记为Dc。

本实验采用的邻居数目从6到18(间距为2),并选择上下文阙值H=0.4,权重调整系统K=0.6 ,通过上述三种不同推荐算法,测试对MAE和F1值的影响。NM、OM和UM三种推荐模型算法中MAE值的比较效果,如图3所示。

在比较MAE值的实验中,得出了三总不同推荐模型算法的效果,根据图3所示的MAE值,本文提出的面向移动环境上下文感知的协同过滤推荐模型在MAE表现方面,具有一定优势,这说明在移动环境下考虑上下文因素,能够提高推荐准确性;从F1值的表现来看,本文的协同过滤推荐模型也同样优于传统的协同过滤推荐模型,在推荐质量方面具有较好表现。

4 结束语

本文在协同过滤推荐系统和上下文推荐系统研究基础上,针对移动环境特点,提出将上下文因素融入到协同推荐模型,设计了一种适合对移动环境下用户的协同过滤推荐模型。该模型重点在解决上下文类型确定、上下文预过滤、上下文建模和反馈信息方面对进行相关处理。验证实验及分析表明,本文设计的协同推荐模型,能提高推荐结果的准确,实现较好的推荐效果。

参考文献:

[1] Zheng Y, Burke R, Mobasher B. Differential context relaxation for context-aware travel recommendation[J]. E-Commerce and Web Technologies: Springer, 2012.

[2] 邓爱林, 朱扬勇, 施伯乐. 基于项目评分预测的协同过滤推荐算法[J]. 软件学报, 2003,14(9).

[3] 王玉祥, 乔秀全, 李晓峰, 等. 上下文感知的移动社交网络服务选择机制研究[J]. 计算机学报, 2010,33(11).

[4] 徐风苓, 孟祥武, 王立才. 基于移动用户上下文相似度的协同过滤推荐算法[J]. 电子与信息学报,2011,33(11).

[5] 吴吉义, 林志洁, 龚祥国. 基于协同过滤的移动电子商务个性化推荐系统若干研究[J]. 电子技术应用, 2007(1).

[6] Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions[J]. Knowledge and Data Engineering, IEEE Transactions on. 2005, 17(6).

猜你喜欢

模型
一种去中心化的域名服务本地化模型
适用于BDS-3 PPP的随机模型
p150Glued在帕金森病模型中的表达及分布
函数模型及应用
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
AVB网络流量整形帧模型端到端延迟计算
考虑初始损伤的脆性疲劳损伤模型及验证
3D打印中的模型分割与打包
离散型随机变量分布列的两法则和三模型