联合自监督学习强化的多行为多任务推荐算法
2023-10-18沈学利张荣凯
沈学利 张荣凯
摘 要:为解决多行为推荐研究存在的未能全面捕获多行为交互特征,忽略点击等隐式反馈数据存在的大量噪声标签等问题,提出了联合自监督学习强化的多行为多任务推荐算法。首先,从行为影响权重和行为隐含语义两方面感知多行为交互特征,并将特征融合到嵌入传播过程,增强节点嵌入的表达能力;然后,构建自监督学习辅助任务,通过多视图对比学习避免模型对噪声标签过拟合;最后,联合有监督的多行为推荐任务和自监督学习辅助任务,采用多目标损失优化策略进行多任务学习,获取更加准确的用户、项目嵌入。通过实验分析表明,该算法在HR和NDCG指标上较对比算法均有一定提升,证明了算法的有效性和优越性。
关键词:推荐系统; 多行为推荐; 自监督学习; 多任务优化
中图分类号:TP391.3 文献标志码:A
文章编号:1001-3695(2023)09-020-2688-06
doi:10.19734/j.issn.1001-3695.2023.02.0030
Multi-behavior multi-task recommendation algorithm integratingself-supervised learning enhancement
Shen Xueli, Zhang Rongkai
(College of Software, Liaoning Technical University, Huludao Liaoning 125105, China)
Abstract:To solve the problems of multi-behavior recommendation research such as failing to comprehensively capture multi-behavior interaction features and ignoring a large number of noise labels present in implicit feedback data such as clicks, this paper proposed a multi-behavior multi-task recommendation algorithm integrating self-supervised learning enhancement. Firstly, it sensed the multi-behavior interaction features from both behavior influence weights and behavior implicit semantics, and fused the features into the embedding propagation process to enhance the expressiveness of node embeddings. Then,it constructed the self-supervised learning assistance task to avoid model overfitting to noisy labels through multi-view comparison learning. Finally,it combined the supervised multi-behavior recommendation task the self-supervised learning assistance task and used a multi-objective loss optimization strategy for multi-task learning to obtain more accurate user and item embeddings. The experimental analysis shows that the algorithm has a certain improvement in both HR and NDCG indexes compared with the comparison algorithm, which proves the effectiveness and superiority of the algorithm.
Key words:recommender system; multi-behavior recommendation; self-supervised learning; multi-task optimization
0 引言
随着互联网技术的飞速发展,数据信息泛滥、过载问题日趋严重,为了在海量数据中挖掘用户可能感兴趣的内容,推荐系统被广泛应用于搜索引擎、电子商务网站等场景。基于图卷积神经网络的推荐模型凭借其强大的特征提取和表征学习能力,成为推荐系统研究的热门领域,但在实际应用中,存在以下问题制约其性能:a)数据稀疏性。用户与项目交互数据在整个数据集中占比过少,对于推荐监督任务而言,稀疏的交互矩阵不能提供足够的监督信号。b)冷启动。现有的仅关注购买行为的推荐系统无法预测没有购买交互历史用户的偏好,也无法将没有被任何用户购买过的项目推荐给可能对它感兴趣的用户。c)数据噪声。诸如点击等隐式反馈,可能存在用户误点击或点击后并不感兴趣,因而不可避免存在噪声,邻域聚合过程会进一步扩大噪声影响。近年来,研究者为了应对数据稀疏和冷启动问题,研究可以用于协助预测用户偏好的隐式反馈信息[1]。例如,Xu[2]利用社交网络构建用户关系来辅助推荐,这类算法认为具有社会关系的用户有相似的偏好,但用户的社会关系可能并不是因为共同偏好产生的,模型可解释性差;Wang等人[3]利用实体属性以及实体间关系构建知识图谱来辅助推荐任务,知识图谱数据的收集会增添额外的负担,并且知识图谱构建过程中可能会丢失某些实体或关系,进而导致用户的某些偏好被忽略。以上外部辅助信息虽在一定程度上补充了监督信号,但存在数据收集困难且成本高、可解释性差以及隐私泄露等问题。针对以上问题,考虑广泛存在于各大网站后台的多行为隐式反馈数据是一個可靠的研究思路,现有基于多行为的推荐模型[4~6]均取得了不错的性能,但该类模型也存在以下问题:a)以上模型仅考虑不同行为间的强度差异,不能深入挖掘用户行为隐含的语义,这使得多行为交互数据并没有被充分利用;b)多行为隐式反馈数据的引入虽然可以缓解数据稀疏性和冷启动问题,但数据中往往存在大量噪声,比如点击数据,可能存在用户误点击或点击后并不感兴趣的情况,这是现有大多数多行为推荐模型常常忽略的点,如何增强模型对交互噪声的鲁棒性对于多行为推荐模型至关重要。
综合以上分析,本文提出了一种融合自监督学习强化的多行为多任务推荐算法(multi-behavior multi-task recommendation algorithm integrating self-supervised learning enhancement,MBISE)。本文工作的主要贡献有以下三个方面:
a)现有的多行为推荐模型未能全面捕获多行为交互特征,导致对多行为交互数据利用并不充分。本文设计了多行为特征提取机制,联合行为重要性和稀疏性学习行为影响权重,再通过行为影响权重和项目类别属性感知行为隐含语义,同时提取行为影响权重、行为隐含语义更能充分利用多行为交互数据,增强节点嵌入的表达能力。
b)目前极少有推荐模型考虑多行为交互数据的噪声问题,拟合大量的噪声交互必然导致模型泛化性能不佳。本文构建了自监督学习辅助任务,通过多视图对比学习感知利于节点嵌入学习的局部结构,从而降低噪声交互的影响,有效提升了模型对噪声的鲁棒性。
c)分别在Tmall、Beibei数据集上进行大量的实验,实验结果表明,MBISE模型性能优于对比模型,证明了模型的有效性。
1 相关工作
1.1 图卷积神经网络
图卷积神经网络是一种从图结构数据中提取特征的神经网络架构,其能同时对节点的特征信息和结构信息进行端对端学习,并且适用于任何拓扑结构的节点和图[7],因而被广泛应用于自然语言处理、推荐系统等领域。公开数据集上大量实验表明,在节点分类、边预测等任务上,图卷积神经网络模型效果明显优于其他模型。图卷积神经网络将图像卷积原理及运算方法推广到图结构数据,其核心思路是学习到一个函数映射,使得图中节点可以通过该映射聚合自身节点特征和邻域节点特征来更新当前节点表示。与传统的协同过滤推荐模型不同,基于图卷积神经网络的推荐模型可以捕获交互图的高阶连通性,以此为用户挖掘更加多样化的项目,缓解以往推荐模型将相关性匹配任务与多样性任务分离的问题[8]。Wang等人[9]提出一种基于图卷积神经网络的协同过滤模型,解决了传统推荐模型无法将用户和项目间交互信息体现在节点嵌入的问题。Zhang等人[10]构建了多类型节点和边组成的异构图,用于捕获多类型交互边的依赖关系。He等人[11]对图卷积神经网络模型进行消融,通过实验验证了去掉模型中特征转换和非线性激活操作不仅提升了推荐性能,还大幅度降低了模型训练的难度,增强了模型的可扩展性。
1.2 行为特征提取
在实际推荐场景中,用户与项目间的多行为交互数据隐含了丰富的协同过滤信号。以往的推荐算法总是仅针对单一行为设计,如电商场景通常将购买行为作为目标行为,对于交互稀疏的用户,单纯通过匮乏的购买行为很难预测用户的偏好,此时其他类型的交互行为可能会发挥出重要的价值。用户多行为交互数据包含丰富的协同过滤信号,虽然无法根据这些行为推断出用户明确的偏好,但可以通过不同交互行为的权重加权计算出用户对项目的偏好程度。另外,用户行为隐含丰富的语义,这种语义可以理解为同一用户交互的项目间可能存在相似或互补的特性,例如用户选购电脑时,会浏览、加购或收藏多款电脑进行对比,在购买某款电脑后,可能会继续选购鼠标、键盘等互补的项目。上述关系同类别项目间更显著,例如用户在浏览电脑、鼠标等电子类项目的同时,可能会选购服饰类、食品类等其他类别项目,这些项目虽然都反映用户的偏好,但他们之间可能并不存在联系。本文模型利用用户项目间的多行为交互信息和项目的类别信息能够有效感知行为权重和项目相似关系,并将该信息融合到信息传播过程中以补充推荐。
1.3 自监督学习
图结构数据广泛存在于电子商务等场景中,应用于图结构的深度学习日渐成为人工智能研究的热门领域,但目前该类模型大多采用监督学习或半监督学习的方式进行训练,高度依赖人工标注的标签信息,导致了泛化能力差和鲁棒性弱等缺点[12],并且在实际应用中对于大规模数据集,人工标注标签成本极其昂贵且不切合实际[13]。针对上述问题,自监督学习是一种研究前景广阔的解决方案,其监督信息是从数据自身挖掘,有助于模型理解图数据的属性信息和结构信息,有效地避免对数据标签的依赖,与使用人工注释的监督或半监督学习相比,模型泛化性能显著提升[14]。现有一些研究将自监督学习应用于对抗噪声研究,self2self模型[15]利用伯努利分布对含有噪声的图像进行多次采样,获得多幅相似但不相同的含噪图像,然后将所得的训练图像对输入进行对比学习,保证图像内容的一致性,实验证明基于自监督学习模型去噪性能相较于其他基于非学习方法去噪模型有明显提升。本文引入自监督学习辅助任务出于以下两方面考虑:a)推荐监督学习的监督信号来自于用户和项目的交互记录,但交互矩阵是稀疏的,不能提供足够的监督信号;b)推荐模型获取的用户反馈大多是隐式的,但一些研究表明用户隐式反馈数据与其偏好之间存在一定差距,例如误点击或购买后但差评、退回等都会被模型误认为是正样本,这种用户与不感兴趣项目的假阳性交互是数据集噪声的主要来源[16~19],模型拟合假阳性交互必然会影响模型泛化性能,图卷积神经网络特殊的邻域聚合机制也会进一步扩大噪声数据对训练的影响。
2 MBISE推荐模型
MBISE模型架构如图1所示,具体实现过程如下:a)通过初始化嵌入层得到用户、项目节点的初始嵌入;b)构建基于多行为交互特征的监督任務,提取行为影响权重和行为隐含语义,与嵌入传播过程融合,以获得具有多行为交互特征的节点嵌入;c)构建自监督学习辅助任务,通过节点丢弃、边扰动增强方式构建对比视图,再通过最大化两个视图中相同节点嵌入的相似性,最小化两个视图中不同节点嵌入的相似性任务优化节点嵌入;d)联合基于多行为交互特征的监督任务、自监督学习辅助任务,采用多目标损失优化策略优化模型,获取更加准确的用户、项目嵌入用于预测。
2.1 问题描述
经典推荐场景中,假设存在用户集合U={u1,u2,…,uM}和项目集合I={i1,i2,…,iN}。用户与项目的多类型交互行为,如点击、加购物车、收藏、购买等,由集合Euclid Math OneKAp={1,2,…,K}表示,其中行为K表示目标行为,其余行为{1,2,…,K-1}则表示辅助行为。用户与项目间多行为交互矩阵集合为{A1,A2,…,AK},其中Ak={akui|u∈U,i∈I}(Ak∈Euclid ExtraaBpM×N)表示行为k下用户与项目交互的二进制矩阵,akui=1表示用户u和项目i间存在行为k下的交互,akui=0则反之。为了更加精确感知项目关系,引入项目类别s∈S。给定多行为交互集合{A1,A2,…,AK}以及项目从属集合{(i,s)|i∈I,s∈S},模型旨在预测在目标行为K下用户u与项目i交互的概率。
3.2 实验结果与分析
3.2.1 对比实验结果
本文模型MBISE与对比算法模型在Tmall和Beibei数据集上的实验结果如表3所示,对比模型中最佳结果用下画线标注。
从表3可以看出,MBISE在两个数据集上的表现均优于其他对比模型。其中,基于多行为的推荐模型NMTR 、EHCF、MATN、GHCF和MBISE在两个数据集上的表现整体都远远优于基于单一行为的经典推荐模型NGCF、LightGCN,这表明使用多行为交互数据建模能够明显提升推荐性能。MBISE相较于对比模型中最优的多行为推荐模型GHCF,在Tmall数据集上,HR@50、NDCG@50指标分别提升了4.6%、2.5%;在Beibei數据集上,HR@50、NDCG@50指标分别提升了1.1%、2.6%。这表明本文模型能够更充分地利用多行为推荐数据,有效提升推荐性能。
3.2.2 参数敏感性分析
为了验证用于调节辅助任务强度的超参数β1对实验结果的影响,在保持其余最优参数不变的前提下,通过在0.1~0.8内调节超参数β1,分析辅助任务强度对模型推荐性能的影响,实验结果如图2所示。
由图2可知,模型在Beibei数据集上β1取0.3效果较好,在Tmall数据集上β1取0.2效果较好。当β1值较大时,模型越来越趋向于辅助任务的训练,从而对模型产生不利的影响。
3.2.3 传播层数分析
为了研究Tmall、Beibei数据集上传播层数对推荐性能的影响,在保持其余最优参数不变的前提下,在1~6内调节图卷积层数,实验结果如图3所示。
由图3可见,随着图卷积层数的增加,模型在两个数据集上的NDCG@50值都有所提升。其中,模型在Beibei数据集上选择4层图卷积取得较好效果,在Tmall数据集上选择3层图卷积取得较好效果,但当图卷积层数继续增加,推荐性能不会继续提升,这是因为随着不断聚合高阶节点嵌入,使得节点的最终嵌入变得越来越相似,到达一定阈值就会影响推荐性能。
3.3 消融实验
为了验证行为聚合权重感知、项目相似属性挖掘这些设计对于模型推荐性能的影响,设计了MBISE的两种变体,分别为:a)不考虑同一用户交互下项目间的相似属性,仅通过行为权重聚合邻域节点更新节点嵌入,该变体被称为MBISEA;b)不学习行为聚合权重,通过统一行为权重进行信息聚合,该变体被称为MBISEB。接下来将两种变体与模型MBISE在两个数据集上进行对比实验,实验结果如图4所示。
由图4可知,本文模型MBISE在两个数据集上的表现均优于两个变体模型。两个数据集中点击、加购物车、收藏行为数量均远多于购买行为数量,但购买行为体现出更强的用户偏好,因此引入多行为交互数据时,通过统一的权重聚合邻居信息必然会影响推荐性能。另外,挖掘项目间的相似属性有利于缓解数据稀疏性问题,从而提升推荐性能。
3.4 自监督学习强化分析
为了验证自监督学习辅助任务对于模型的强化作用,本节将去掉辅助任务的变体模型MBISEMB与本文模型MBISE在抗噪能力、去流行偏差和训练效率上进行对比。保持共有参数相同,MBISE模型自监督学习辅助任务部分,在Beibei数据集上采用边扰动增强方式、扰动率设置为0.3,在Tmall数据集上采用边扰动增强方式、扰动率设置为0.4。
3.4.1 抗噪能力
为了模拟多行为推荐数据集中的噪声,本文将随机生成的用户项目交互记录,按照一定的比例添加至数据集中,然后进行抗噪能力对比实验,实验结果如图5所示。
由图5可知,随着噪声比例的增加两个模型的推荐性能都有所下降,但引入自监督学习辅助任务的MBISE性能波动明显小于MBISEMB,MBISE在噪声数据上依然可以取得较好的推荐性能,这表明自监督学习辅助任务的引入有效地提升模型的抗噪能力。自监督学习通过对比不同的增强视图,感知对节点表征学习有利的局部结构,可有效降低噪声交互对模型的影响,提升了模型的抗噪能力。
3.4.2 去流行度偏差
为了验证模型在引入自监督学习辅助任务前后受到流行度偏差的影响,本节引入新的评价指标非流行项目平均占比APUI@N,用于衡量长尾项目在top-n推荐列表中的平均推荐占比[23],公式如下:
APUI@N=1U∑u∈U{i|i∈(Ru@N∩Γ)}N(20)
其中:Ru@N表示用户u的top-n推荐列表;Γ表示非流行项目集合,按项目被交互次数排序,前20%为流行项目,后80%即为非流行项目。两个模型去流行度偏差实验结果如表4所示。
由表4可知,MBISE在两个数据集上均提升了非流行项目在用户推荐列表中的平均占比,这表明在保证推荐性能前提下,自监督学习辅助任务引入可以有效缓解流行度偏差。这受益于自监督学习边扰动设计,通过降低高度节点的度数,降低其对节点表征学习的影响,在一定程度上缩小了节点嵌入学习中流行项目和非流行项目之间的影响差别。
3.4.3 训练效率
将本文模型MBISE与变体模型MBISEMB在两个数据集上进行训练,记录最佳评价指标以及达到最佳指标的迭代次数,训练结果如表5所示。
由表5可知,引入自监督学习辅助任务的MBISE相较于MBISEMB在两个数据集上的评价指标都有所提升,并且在训练过程中MBISE均先于MBISEMB收敛,尤其是在数据更加稀疏的Tmall数据集上这种优势更明显。受益于自监督学习辅助任务的对比学习损失函数,MBISE可以从多个负样本中学习节点表征,有效地扩大了模型感知领域,并且在适当的温度系数下,自监督学习通过对困难负样本的挖掘,能够提供更有价值且更大的梯度,从而提升了模型的收敛效率。
4 结束语
本文提出了一个融合自监督学习强化的多行为推荐模型,该模型引入多行为交互数据,通过提取多行为交互特征来优化节点嵌入,并构建自监督学习辅助任务,在增强模型对于交互噪声鲁棒性能的同时,也在一定程度上提升了模型收敛速率、缓解了流行度偏差。在两个公开数据集Tmall和Beibei上的实验结果表明,本文模型性能均优于对比模型。未来的工作中,将研究如何设计其他形式的自监督任务,如通过自监督学习对数据集进行预训练,将微调后的数据集用于推荐任务。
参考文献:
[1]Guo Qingyu, Zhuang Fuzhen, Qin Chuan, et al. A survey on know-ledge graph-based recommender systems[J]. IEEE Trans on Knowledge and Data Engineering, 2022,34(8):3549-3568.
[2]Xu Chonghuan. A novel recommendation method based on social network using matrix factorization technique[J]. Information Proces-sing & Management, 2018,54(3): 463-474.
[3]Wang Hongwei, Zhang Fuzheng, Zhao Miao, et al. Multi-task feature learning for knowledge graph enhanced recommendation[C]//Proc of World Wide Web Conference. New York:ACM Press, 2019: 2000-2010.
[4]Loni B, Pagano R, Larson M, et al. Bayesian personalized ranking with multi-channel user feedback[C]//Proc of the 10th ACM Conference on Recommender Systems. New York:ACM Press, 2016: 361-364.
[5]Gao Chen, He Xiangnan, Gan Dahua, et al. Learning to recommend with multiple cascading behaviors[J]. IEEE Trans on Knowledge and Data Engineering, 2019,33(6): 2588-2601.
[6]Xia Lianghao, Huang Chao, Xu Yong, et al. Multiplex behavioral relation learning for recommendation via memory augmented Transformer network[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2020: 2397-2406.
[7]李社蕾, 周波, 楊博雄,等. 图卷积神经网络基础图结构影响研究[J]. 小型微型计算机系统, 2021,42(4): 891-896. (Li Shelei, Zhou Bo, Yang Boxiong, et al. A study on the influence of graph convolutional neural network underlying graph structure[J]. Journal of Chinese Computer Systems, 2021,42(4): 891-896.)
[8]刘杰, 尚学群, 宋凌云, 等. 图神经网络在复杂图挖掘上的研究进展[J]. 软件学报, 2022,33(10):3582-3618. (Liu Jie, Shang Xuequn, Song Lingyun, et al. Progress of graph neural networks on complex graph mining[J]. Journal of Software, 2022,33(10): 3582-3618.)
[9]Wang Xiang, He Xiangnan, Wang Meng, et al. Neural graph colla-borative filtering[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2019: 165-174.
[10]Zhang Chuxu, Song Dongjin, Huang Chao, et al. Heterogeneous graph neural network[C]//Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York:ACM Press, 2019: 793-803.
[11]He Xiangnan, Deng Kuan, Wang Xiang, et al. LightGCN: simpli-fying and powering graph convolution network for recommendation[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 639-648.
[12]Liu Yixin, Jin Ming, Pan Shirui, et al. Graph self-supervised lear-ning: a survey[J]. IEEE Trans on Knowledge and Data Engineering, 2023,35(6): 5879-5900.
[13]张重生, 陈杰, 李岐龙,等. 深度对比学习综述[J]. 自动化学报, 2023,49(1): 15-39. (Zhang Chongsheng, Chen Jie, Li Qilong, et al. A review of deep contrast learning[J]. Acta Automatica Sinica, 2023,49(1): 15-39.)
[14]Yu Junliang, Yin Hongzhi, Xia Xin, et al. Self-supervised learning for recommender systems: a survey[EB/OL]. (2023-06-02). https://arxiv.org/abs/2203.15876.
[15]Quan Yuhui, Chen Mingqin, Pang Tongyao, et al. self2self with dropout:learning self-supervised denoising from single image[C]//Proc of IEEE/CVF Conference on Computer Vision and Pattern Re-cognition. Piscataway, NJ: IEEE Press, 2020: 1887-1895.
[16]Bian Zhi, Zhou Shaojun, Fu Hao, et al. Denoising user-aware memory network for recommendation[C]//Proc of the 15th ACM Conference on Recommender Systems. New York:ACM Press,2021: 400-410.
[17]Hu Yifan, Koren Y, Volinsky C. Collaborative filtering for implicit feedback datasets[C]//Proc of the 8th IEEE International Conference on Data Mining. Piscataway, NJ: IEEE Press, 2008: 263-272.
[18]Lee D, Kang S K, Ju H, et al. Bootstrapping user and item representations for one-class collaborative filtering[C]// Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2021: 317-326.
[19]Wang Zitai, Xu Qianqian, Yang Zhiyong, et al. Implicit feedbacks are not always favorable: iterative relabeled one-class collaborative filtering against noisy interactions[C]//Proc of the 29th ACM International Conference on Multimedia. New York:ACM Press,2021: 3070-3078.
[20]Jovanovic' N, Meng Zhao, Faber L, et al. Towards robust graph con-trastive learning[EB/OL]. (2021-02-25). https://arxiv.org/abs/2102.13085.
[21]Chen Chong, Zhang Min, Zhang Yongfeng, et al. Efficient heterogeneous collaborative filtering without negative sampling for recommendation[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto ,CA: AAAI Press, 2020: 19-26.
[22]Chen Chong, Ma Weizhi , Zhang Min, et al. Graph heterogeneous multi-relational recommendation[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto ,CA: AAAI Press, 2021: 3958-3966.
[23]Abdollahpouri H, Burke R, Mobasher B. Managing popularity bias in recommender systems with personalized re-ranking[EB/OL]. (2019-08-12). https://arxiv.org/abs/1901.07555.
收稿日期:2023-02-08;修回日期:2023-04-03 基金項目:国家自然科学基金资助项目(62173171)
作者简介:沈学利(1969-),男,江苏连云港人,教授,硕导,硕士,主要研究方向为计算机网络及信息安全、推荐系统等;张荣凯(1998-),男(通信作者),河北沧州人,硕士研究生,主要研究方向为推荐系统等(1909298890@qq.com).