APP下载

基于人工智能的推荐算法模型及应用研究

2022-03-29熊文武张守震

客联 2022年1期

熊文武 张守震

摘 要:通过一种基于RNN神经网络模型的推荐方法,对该模型进行深入研究,该模型的目标就是通过对非线性网络的深层学习,从而创建一个网络结构,利用此网络结构去获取到用户和项目之间的深层次特征信息,进而预测其评分,进行用户的推荐。注意力交互网络在信息推荐中的作用。包括三个功能模块——注意力模型、交互中心模块和用户/项目中心模块。注意力模型主要是学习文本中上下文作用的重要性。交互中心模型这是注重上下文中每个文本和用户、项目之间的交互,同时去捕获上下对用户个项目的作用。最后,用户/项目中心模块的作用获得上下文感知的用户表示和项目表示。

关键词:智能推荐系统;贝叶斯网;深度神经网络

一、数据特征提取和预处理

在特征提取的阶段,不同物品的描述会被提取出来。尽管可以使用任意的一种表示,例如多维数据表示,但最常见的方法是从底层数据中提取关键词。做出这种选择是因为非结构化文本描述通常在各种领域中广泛使用,并且它们仍然是最自然的描述物品的方式。在很多情况下,可以用多个字段来描述物品的各个方面。特征表示和清洗此过程在使用非结构化表示时显得尤为重要。特征提取阶段能够从产品或者网页的非结构化的描述中得到一系列单词。

过从物品的描述中提取的大部分文本将包含许多与物品相关性不强的常用词,词干提取等步骤后,关键词被转换为向量空间表示。每个单词也称为项。在向量空间表示中,文档被表示为一组单词及它们出现的频率。尽管使用单词出现的原始频率可能是诱人的想法,但这通常不可取。因为经常出现的词通常在统计学上差异较小,所以这些词经常被降低权重。这与停用词的原理相似,只不过采用的是“软”的权重打折的方式,而不是完全剔除。

二、RNN神经网络的推荐模型

提出的架构部分受到最近在自动回答(QA)场景中提出的基于 LSTMs的模型的启发。选择基于一个简单的洞察力:在QA中,如果给出一个问题,基于可用事实提供答案,推荐系统可以根据用户的个人资料对可用项的描述提供建议。因此,我们决定利用在问题和用户配置文件之间进行类比设计以下架构。该体系结构实现了基于内容的推荐系统,其能够预测分数,并定义了用户和一个特定的项目。简而言之,本章的方法基于两个不同的模块,它们共同学习每个用户的连续矢量表示和产生偏好估计分类器的每个项目。

通过相关实验,我们评估了利用 MSE 和 RMSE 为评价指标的推荐任务中,上述深度神经网络架构相比几个基线的有效性。首先,我们将其与基于(浅层)神经网络的其他模型进行了比较,然后,我们根据最先进的技术,如矩阵分解算法、用户-用户和项目-项目协同过滤,对其进行了评估。针对数据集收集的方法描述如下图1所示。

对该表的快速分析显示,两个数据集之间差异很大。ML1M 数据集的规模不管是在用户、项目和评分的数量上都比Amazon数据集小很多,ML1M 数据集的稀疏性较小,因此更适合于基于协同过滤的算法。另一方面,Amazon 数据集更稀疏,这使得推荐任务非常具有挑战性。

深度神经网络DNN:利用深度神经网络去处理大规模数据问题,把深度网络应用到推荐模型中,用来训练大规模数据,利用训练结果去预估未来,从而做出推荐。递归推荐网络RRN:通过赋予用户和长短时记忆 LSTM 自回归模型实现,用来捕获动态,以及更传统的低秩分解。该模型不学习潜在状态,而只需要学习状态转换函数。从而提高预测精度。

三、基于CNN的深度建模推荐方法

一种融合CNN卷积神经网络和双层注意力机制的深度建模的推荐方法,该方法基于深度学习的多交互的推荐模型,使用词向量嵌入技术对评价文本进行表示,基于Attention注意力机制的方法进一步对输入信息进行优化。使用Attention注意力机制方式改进用户、项目和评价文本的嵌入,利用深度神经网络结构,充分挖掘评价文本中的隐含特征,并分别和用户、项目进行交互,得到交互的嵌入表示。

(一)基于文本的深度特征提取

深度神经网络自动学习特征的能力很强。同时,深度神经网络也能自动对非线性结构进行学习。并且针对各种复杂场景,深度神经网络能够从中学习更深层次的特征并实现深层次的数据特征表示。设计评论文本的深度特征提取的建模方法,该方法的基础是深度协作神经网络模型(DeepCoNN),在这基础上对其DeepCoNN模型进行了改进,并在把该模型作为本章对比实验模型,从而根据对比结果来验证本章设计模型的有效性。

(二)基于图卷积神经网络的神经协同推荐算法

基于图卷积神经协同推荐算法可以将用户的历史行为记录与候选物品的高阶隐藏信息挖掘出来,弥补了协同过滤推荐算法无法利用项目对用户的高阶隐藏有用信息,有效解决传统协同过滤算法面临的反馈数据稀疏和推荐结果解释性差的问题,提升推荐算法的性能。

传统的协同过滤算法是根据用户对物品的历史交互记录进行推荐,忽略了很多高阶有用的信息但是其具有方便快捷可快速部署的优点。图神经网络辅助的推荐算法可以通过链路预测的方式聚合本地化高阶信息,但却存在聚合效率慢和无法收敛的情况。图卷积神经网络辅助的推荐算法继承了图神经网络的优点,并改进了聚合方式,因其自身需要全图迭代的特性因此对于无监督任务的效果不佳。为了改善上述问题本文提出基于自适应图卷积注意力神经协同推荐算法,本算法通过添加自适应填充矩阵和注意力机制重新分配权重在一定程度上能缓解稀疏程度,并通过自适应聚合系数的迭代方式有效优化了圖卷积神经网络对于无监督任务的特征处理方式。

四、总结

深度学习可以从海量的数据集中挖掘出数据的本质特征,并且可以通过多源异构数据中进行自特征学习。将深度学习与推荐算法进行融合,并且利用多源异构数据,去缓解数据稀疏性的问题。在这个方向进行研究后发现,利用深度学习的方法去分析上下文信息,可以有效的缓解数据稀疏问题,并提高推荐的准确度。

参考文献:

[1]任悦,闫仁武.基于大数据的UserBased推荐算法的研究[J].计算机与数字工程,2022,50(01):75-79.

[2]杜雨晅,王巍,张闯,郑小丽,苏嘉涛,王杨洋.基于自适应图卷积注意力神经协同推荐算法[J/OL].计算机应用研究:1-9[2022-03-18]..

[3]李增晖. 融合深度学习与矩阵分解的推荐算法研究与应用[D].河北工程大学,2021.DOI:10.27104/d.cnki.ghbjy.2021.000547.

[4]王磊. 基于深度学习的推荐算法与系统研究[D].北京邮电大学,2021.DOI:10.26969/d.cnki.gbydu.2021.000946.