基于二部图的推荐算法研究综述
2021-11-27高迎刘正
高迎,刘正
(首都经济贸易大学,北京 100070)
当今时代是信息网络时代,因此不同行业产生的数据信息数量已经达到ZB 级别,这为企业带来了很多挑战。互联网用户数量以一种十分迅猛的趋势发展,对于各企业来说,庞大的信息数据量为其提出了难题,他们难以很快确定哪些信息与特定的用户是相关的,即产生了“信息过载”的问题。
各界学者逐渐开始研究个性化推荐这一先进的技术手段以改善这一问题,而其中协同过滤已被广泛应用在各种类型的企业中。由于该算法仅通过用户评分信息预测用户偏好,推荐效果有待提高。图是一种表达节点及其关系的基本结构,而二部图以直观的方式表达了用户及项目之间的关系,因此学者逐渐将复杂网络的方法与推荐算法进行结合。随者相关领域研究的不断发展,对于网络结构与推荐算法的研究仍存在许多挑战需要探索。因此,本文对相关领域的理论、研究现状和关键技术进行总结与分析,希望能帮助其他学者了解该领域的研究进展与发展方向。
1 传统推荐算法理论
推荐算法自出现以来受到各界学者的广泛关注,在当今学术界关于推荐算法已经有大量的研究。推荐系统利用用户与项目直接的购买或选择关系,根据用户的历史行为或用户间的相似关系为目标用户推荐其感兴趣的商品,本文主要对几种应用较为广泛的推荐算法进行简单概述。
1.1 协同过滤推荐算法
协同过滤推荐通常将评分矩阵作为算法输入,该算法通过检索相似用户或项目作为评级预测的基础。在该算法中,推荐系统以相似度作为衡量的指标找到相似的邻居,最终预测评分并推荐项目。众所周知,协同过滤在众多相关领域表现得很好,但它也有一定的缺陷,由于其主要处理评级矩阵,而评级信息是十分稀疏的,这很大程度上影响着推荐质量。
1.2 基于内容的推荐算法
基于内容的推荐算法通过收集购买信息,依据其中项目的相关信息选择内容上相似的项目,作为最终结果,其中项目特征信息主要包含其标签、评论、属性等。该算法一般只依赖于用户自身的特征与行为,不进行用户间相关关系的计算,因此评分数据稀疏对其没有影响,但该方法仅以项目特征作为基础,没有很好地挖掘出用户之间的关系,影响着推荐精度。
1.3 混合推荐算法
由于以上两种算法都有其应用的优势和局限性,因此,研究人员通过一定的方法将几种方法进行融合,避免其自身的不足,充分发挥其各自的优势。算法的融合主要通过合并各单一推荐算法的结果和以加权等方式融合几种推荐算法这两种形式。混合推荐算法能够有效改善独立算法运行时的不足,并将各自的优势集中起来,以获得更好的推荐效果。
2 国内外研究现状与发展历程
2.1 推荐算法现状
推荐算法最早由国外学者开始研究,GOLDBERG 等人(1992)在设计邮件过滤系统中第一次采用应用协同过滤推荐算法[1],随后国际上开始有学者对推荐算法进行深入研究。而国内直到21 世纪才逐渐开始有学者对协同过滤进行深入探索,黄创光等人(2010)的研究内容为数据稀疏对推荐质量的影响研究,所选用的方法是自适应选择目标用户的近邻对象,结果显示其改进是有效的[2]。近几年,越来越多的学者对于改进方法提出了自己的见解,邓存彬等人(2019)则通过将协同过滤和深度学习理论进行结合来扩充算法的特征,提出了一种混合的推荐算法改善了电影推荐系统的现有问题[3]。张紫嫣等人(2021)则综合余弦相似度和类别偏好的优势改进相似度的计算,从而使得最近邻计算更为合理[4]。
2.2 基于二部图的推荐算法
在学者对推荐算法进行改进的过程中仅依靠用户-项目的交互数据进行改进,没有结合符合其特点的图结构。研究表明相比传统的推荐算法,将图结构与推荐算法进行融合在推荐准确性、多样性和可扩展性等方面有更好的效果。AGGARWAL 等人(1999)在第五届数据挖掘及知识发现会议(KDD)上首次将图论的思想融入推荐算法,经过实证研究明确了图结构能够有效解决推荐系统现有的瓶颈[5]。HUANG 等人(2007)首先通过二部图结构来刻画用户与项目之间的关系,并从小世界效益来分析其退推荐系统的性能影响[6]。盛俊等人(2020)针对商品推荐问题,在图结构上进行基于社区数据挖掘和标签传递的推荐算法,并通过平均绝对差和准确率检验了算法的运算效果[7]。
3 基于二部图的推荐算法未来发展方向
在当前信息过载的时代,随着信息技术的不断发展,推动了基于二部图推荐算法的进一步的发展,并取得了一定的成果。但二者领域的融合在未来还有更多可尝试的地方,以下总结了该领域未来可能的研究方向。
3.1 机器学习与现有推荐算法的结合
机器学习能够通过以往经验从数据中学习最终作出决策,现有推荐算法具有可解释性强的优势,而这是机器学习在应用时的不足,通过利用机器学习算法构建预测模型能够更加准确地提取用户与项目的兴趣偏好。将现有二部图推荐算法与机器学习算法相结合,能够融合二者的优势,相关的研究方向在未来也是值得进一步深入研究的。
3.2 图神经网络与推荐算法的融合
在推荐系统领域,学术界越来越倾向于运用图结构解决相应问题,而现有的研究主要是通过网络中节点的关系进行兴趣偏好的扩展与改进,而对于图结构研究的不够透彻。图神经网络是处理二部图的方法之一。将二部图推结构作为原始的输入,通过图学习方法对原始的用户项目二部图进行处理,利用图中的同质或异质关系建模用户的偏好和意图是一个很新颖的研究方向。
3.3 多源异构信息的融合
近年来,互联网上的多源异构信息越来越丰富,用户进行评价项目的意图与用户关系、项目特征、用户评论等都有很大的关系。在二部图推荐算法中,研究人员通常根据用户和项目的选择关系进行用户兴趣的挖掘,而如何将互联网上的多源信息进行转换并更好地融入到用户-项目二部图中,从而进一步挖掘用户的兴趣偏好,解决推荐算法现有的问题,也是相关领域的重要研究问题。
4 结束语
随着互联网的普及以及互联网上用户对项目和信息的个性化需求日益膨胀,推荐系统在电子商务网购平台等各个领域发挥着很重要的作用,推荐系统是否能够更好地发挥它的作用,将是各个企业很大的竞争力。本文总结了传统推荐算法的问题,阐述了二部图推荐算法的研究进展,并提出了未来的研究方向,希望能够为未来的研究人员在相关领域的尝试提供帮助。