APP下载

基于类别图增强算法的融合异构数据会话推荐分析

2023-08-22李彩霞

电子产品世界 2023年8期

李彩霞

关键词:会话推荐;类别图增强算法;异构数据;全局表征

0 引言

从会话层面分析,在未掌握全面的用户身份信息并且不知道会话序列包含的物品个数条件下,如果只根据物品参数来建立ID 标签序列模型时,并无法准确捕获用户实际意图,某些情况下还会出现关于用户意图的错误理解结果。首先,当会话序列较短的情况下,无法通过有限交互行为准确反馈出用户实际意图。考虑到大部分时候都无法得到用户的身份信息,而且只有短时间中的用户交互记录才是有效的,这对大量处理方法造成了制约。

對人们日常使用的各大购物平台进行分析可知,拼多多、淘宝、京东等电子商务服务平台为提升搜索效率,通常都会针对各物品设置相应的类别标签。通过上述方式促使用户更加快速准确找寻他们所需的商品,同时平台还可通过推荐系统中显示的用户访问信息推送同一类产品。综合考虑物品与类别因素可以判断出用户的实际意图。根据文献[1] 报道可以发现,以图神经网络构建会话序列模型的时候,如果只针对单一物品结构进行建模,即只根据物品ID 序号构建模型时,将会造成部分概念层数据丢失的结果。当会话序列处于匿名状态下时,无法包含所有用户行为,如果只根据单一层面构建模型时将会在用户偏好方面产生较大偏差。本文对于上述分析结果,设计了一种通过类别图来实现增强效果的推荐算法。可以利用此算法为物品建立类别序列,再通过图神经网络为上述序列构建仿真模型,从而实现2 个层面的物品属性评价,对2 个层面的测试结果进行融合后确定会话用户的偏好结果。

1 类别图增强算法

在网络中输入各物品ID与类别序列再对其表征后,获得每种序列下的各节点表征结果。由于类别属于物品的特定属性,可将其作为物品ID 标签序列的补充数据。

CaSe4SR-W 方法是利用加权融合的过程来判断全局偏好:物品与类别序列都是按照相互独立的方式完成输入与表征过程,因此进行融合的时候先独立处理2 个序列,之后测试融合所得的结果。上述融合模式是计算物品图与类别图的注意力加权数据,之后再对其实施融合,结果见图1。

以下给出了具体处理步骤:

最后一步是对以上获得的物品与类别层面进行全局表征,融合物品与类别层面的信息后,可以更加全面描述物品特征,这使得各类ID 标签的物品因为类别标签一致,也表现出了一定程度的相似性。通过会话表示层拼接局部与全局表征,再利用线性转换方法确定最终会话表征。

2 实验

2.1 Cosmetics数据集及预处理

从Kaggle 平台上采集测试参数,选择中等化妆品在线商店在线用户行为进行分析。为确保数据处理过程更好地满足一般性,将长度不在2~50 范围的会话内容去除,同时不考虑出现次数在5 次以内的物品。表1 是统计得到的数据集参数。

2.2 对比方法介绍及实验设置

为了对算法进行可靠性验证,以SR-GNN[36] 模型作为基准对比条件。

将模型设定为以下所示的控制参数:采用TensorFlow框架对模型开展训练。将数据集中的表征向量维度设置在100。同时将模型各参数矩阵均值都设置为0,标准差等于1,按照高斯分布形态实施初始化。通过minibatchAdam优化器调整上述参数,设定最初学习率等于0.001。控制训练批次为100,L2 惩罚保持105 的恒定值。

2.3 实验结果及分析

为验证以类别图增强方法构建的模型满足有效性,本次利用2 个数据集分别测试了CaSe4SR、SR-GNN模型与CaSe4SR 变体模型,得到表2 参数。

根据表格参数可知,设计得到的CaSe4SR 模型对各类数据集都表现出了最优推荐性能。同时可以发现,其他3 类包含类别信息数据的模型都获得了比SRGNN模型更优的性能,考虑到各模型具有自身独特的建模过程,因此实际提升幅度也存在较大区别。Concat与CaSe4SR 虽然是以不同形式进行建模,但都在建模过程中融合了物品与类别信息,可以将物品类别与表征形成一一对应关系。CaSe4SR-W 则依次通过类别特征和物品实施建模,最后再对其实施融合。根据测试结果可知,CaSe4SR-W 模型表现出了比Concat 与CaSe4SR两种模型更差的性能,由此可以推断类别信息需结合物品信息共同建模,需根据物品参数才可以发挥信息补充功能。Concat 相对Case4SR 模型推荐性更弱,因此采用有向图表示类别序列,同时引入门控图神经网络建立模型的过程满足可靠性要求。

3 结束语

本文开展基于类别图增强算法的融合异构数据会话推荐分析,得到如下有益结果:

1)设计了一种包含5 层结构的CaSe4SR 仿真模型,在融合层内融合物品与类别表征结果,确保物品表征中包含类别数据;根据注意力机制建立全局表征,再通过局部表征建立最终表示;通过预测层计算各候选对象推荐参数。

2)设计得到的CaSe4SR 模型对各类数据集都表现出了最优推荐性能,CaSe4SR-W 模型表现出了比Concat 与CaSe4SR 两种模型更差的性能,推断类别信息需结合物品信息共同建模,需根据物品参数才可以发挥信息补充功能。