APP下载

基于RippleNet的商品推荐研究

2021-08-16管文豪汪柏乐

科学技术创新 2021年22期
关键词:三元组波纹图谱

管文豪 张 爽 汪柏乐

(黑龙江大学数据科学与技术学院,黑龙江 哈尔滨 150000)

1 概述

随着信息化的快速发展,基于互联网的电子商务系统发展迅速,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品,这种浏览大量无关的产品和信息的过程会使消费者因信息过载问题而不断流失。因此,推荐系统应运而生。它们通过用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。

现有的电商推荐方法可分为三类:基于协同过滤[1]的推荐算法、基于内容的推荐[2]算法以及基于深度学习的推荐算法[3]。利用这些推荐算法都能够给用户推荐出商品。但这些经典的推荐算法向用户推荐商品的过程中,会引入例如稀疏性、冷启动以及“黑箱”等问题,并且推荐结果的解释性不足。为了解决目前推荐算法存在的问题,业界将知识图谱引入到推荐系统中,考虑到了用户和知识图谱的联系,以有效地利用知识图谱来增强推荐系统的性能和效率。知识图谱将现实世界中的实体和关系表达为结构化三元组的形式,三元组描述了一个特定领域中的事实,由头实体、尾实体和描述这两个实体之间的关系组成。为了从知识图谱中有效提取用户和实体之间的联系,更好地挖掘用户的潜在偏好,业界提出基于知识图谱的推荐框架RippleNet[4]。此框架将电商场景下的每个用户和商品,以及商品知识图谱中的实体和关系表示为向量或矩阵,以用户的历史访问记录为兴趣中心,模拟用户的兴趣传播在知识图谱上逐层向外扩散,并且不断衰减的过程,最终预测候选商品的访问概率。该框架能够推断在知识图谱上从用户历史商品到候选商品的链接路径,以刻画用户偏好在知识图谱中的传播过程,并且最终将该链接路径作为推荐结果的解释。

2 方法

2.1 相关定义

u={u1,u2…}和v={v1,v2…}分别表示电商推荐场景中的用户集合和商品集合,根据用户是否访问或购买过某个商品,我们定义一个用户-商品交互矩阵Y:

知识图谱G由大量的”实体-关系-实体”型的三元组构成,其中h,t∊ε,r∊R,ε和R分别代表着知识图谱中的实体集和关系集。我们的目标是预测用户u是否对其以前没有交互过的商品v有潜在的兴趣。

相关实体:给定知识图谱G和用户-商品交互矩阵Y,用户u的k阶相关实体集合定义为:

在波纹集之中,用户对商品的潜在兴趣偏好被用户的历史偏好激活,然后沿着知识图谱中的链接从历史记录中的实体到链接中的其他实体进行传播。

其中,F代表推荐函数,θ表示函数F中的模型参数。

2.2 RippleNet框架

RippleNet将每个候选商品嵌入表示为一个向量v。然后通过候选商品v,用户u的历史访问记录vu和一阶波纹集上的三元组(hi,ri,ti)计算一个相关性概率pi如下:

对于二阶波纹集的潜在兴趣偏好表示O2u,只需要用O1u替换候选商品v向量即可。对于更高阶的波纹集兴趣,重复上述迭代过程即可。将用户u的向量表示定义为该用户在各阶波纹集上兴趣偏好的累加值:

3 实验

3.1 实验数据集

本文通过项目构建100个用户的17002条访问记录作为推荐任务的实验数据集。为了避免冷启动的问题,我们清洗掉用户浏览商品的历史记录次数不足5次的商品。在实验过程中,将数据集按照7:1:2的比例划分为训练集、验证集和测试集。

3.2 知识图谱构建

手机商品知识图谱融合了来自中文维基百科、手机测评数据、手机新闻数据的产品信息如图1所示。采用自上而下的构建方法,即先搭建出手机知识图谱的模式层,在模式层的约束下填充数据层,最终形成结构化的手机知识图谱。采用性能稳定的Neo4j存储图谱数据,Neo4j的核心是节点、关系和属性,利用它存储手机知识图谱的本质是将图谱数据完整地转换为节点、关系和属性。

图1 小米10Pro知识图谱

3.3 评价

本文采用准确率(accuracy)评价该方法的性能表现,得到如下实验对比结果如图2所示。

图2 模型的准确率

4 结论

本文面向传统的电商场景,提出将知识图谱与基于用户偏好传播的推荐系统进行融合,实现了精准推荐和良好的可解释性。实验中,本文通过整合网络资源并重构,构建了一个手机商品知识图谱,并在用户-商品历史访问记录数据集上对各种推荐方法进行了充分的实验验证。实验结果表明了RippleNet推荐算法能够更好地对用户进行商品推荐,证明了基于知识图谱的用户偏好传播框架在电商场景中有更好的解释性和准确性。该算法不仅可以用于商品的推荐,同样适用于音乐视频、电影、书籍等网站中的实体推荐。

猜你喜欢

三元组波纹图谱
基于图对比注意力网络的知识图谱补全
TransP:一种基于WordNet中PartOf关系的知识图谱嵌入方法
时序知识图谱的增量构建
基于NACA0030的波纹状翼型气动特性探索
基于卷积神经网络的知识图谱补全方法研究
绘一张成长图谱
关于余挠三元组的periodic-模
图表
主动对接你思维的知识图谱