基于服务推荐的知识图谱应用文献综述
2021-11-24王棒钧
王棒钧
摘要:在互联网发展的大背景下,网络数据的爆发式增长使得人们越来越依赖推荐技术,而以知识图谱为基础的服务推荐近几年得到了充分的发展,本文通过收集、梳理,分析相关文献,对学术界近几年对此课题的研究进行了综述。
关键词:服务推荐;知识图谱
一、研究背景与意义
随着信息社会发展,网络信息数据增长迅速,让人们能够享受便利的同时也带来了较为严重的信息过载问题。信息过载问题指用户所能接触到的信息过多,已经超过了能够全部接受处理的程度,无法从巨量的信息中快速找到自己感兴趣的信息。
推荐技术就是为了解决上述问题而被提出。推荐技术的核心思想就是通过特定方式对用户、物品以及用户与物品之间的关系进行分析挖掘,找到用户可能感兴趣的信息,将网络上的大量信息从被动地展示给用户转变为主动地为用户提供信息,从而让用户获得更多的有效信息。
知识图谱的设计初衷是源于对搜索引擎优化提升需求。该技术通过将数据组织建立连接、定义实体属性标签、构建实体间关联关系等手段来实现搜索引擎的性能提升。
二、基于知识图谱推荐研究现状
知识图谱为处理互联网上大规模、异构、动态的数据提供了新的解决方案,提高了网络智能化水平,使得机器的行为能够符合人类的认知思维方式。大规模通用知识图谱突破了搜索引擎基于关键词:模糊检索的局限性,能够为用户提供准确的信息检索结果。目前,领域知识图谱广泛应用于领域知识的检索、推荐和问答。在金融领域,知识图谱应用相对成熟,例如利用知识图谱蕴含的语义信息进行分析推理可以实现反欺诈,基于知识图谱的图结构可以有效分析税务中潜在风险,可以通过分析知识图谱中客户行为信息实现个性化理财产品推荐。在医疗领域,借助知识图谱能够实现辅助诊断和决策。电子商务领域阿里巴巴利用知识图谱技术分析用户的购物偏好,实现精准的匹配用户的购买意愿和候选商品集合。
知识图谱中涵盖了大量实体之间的语义关联信息,从而使得推荐系统能够利用知识图谱潜在的关联信息解决推荐过程中数据稀疏和冷启动的问题。同时,借助知识图谱能够更深层次的挖掘用户喜好,提高推荐结果的准确性。知识图谱中关系类型的多样性,有效地防止了推荐结果的同质性。
知识图谱能够为问答系统提供有效且高质量的数据源,问答的结果可以是知识图谱存储的知识集合,也可以是基于知识图谱推理出的内容。基于知识图谱的问答系统,能够对用户提出的自然语言问题做出准确的回答。
陈涛等利用知识图谱中的语义信息,构建了更加精准的用户画像,提高了推荐结果的准确率、召回率等推荐性能的指标。Zuoxi Yang 等,提出了基于知识图的层次注意力图卷积网络的可解释性推荐方法,从异构知识图的高阶连通性结构中探索用户的潜在偏好,实验证明了该方法的最新性能和强大的可解释性。Dehai Zhang 等提出了一种基于知识图谱的邻域聚合协同过滤推荐方法,使用知识图谱将用户的潜在兴趣点进行提取和利用,以此提高了推荐结果的准确性,并在点击率方面得到了显著的提升。汤伟韬等提出将用户对商品的评论信息与知识图谱进行结合,将其中蕴含的情感词进行提取,根据情感词对商品特征打分,并根据随机游走机制,获得商品特征权重。从实验结果来看,该方法很好的获取到用户对商品的偏好程度,使推荐结果准确率有效提高。陈嘉颖等提出利用实体识别与连接技术对实体关系进行抽取,并提出了基于知识图谱的用户-项目低维化方法,该方法对于非结构化信息的处理提供了可靠有效的方案,并提高了推荐结果的准确率和召回率。
三、服务推荐研究现状
目前,Web服务推荐相关研究主要分为两类,基于用户历史行为信息以及基于服务本身的QoS信息,通过协同过滤技术对用户偏好服务进行预测来进行推荐。同时一些研究中考虑加入外部信息,作为解决数据稀疏以及冷启动问题的解决方案,以提高推荐性能。基于用户历史行为信息的推荐通过对用户的行为信息进行挖掘,将用户的隐式行为转化为用户的显示评分,然后通过协同过濾算法进行推荐。文献通过引入用户历史行为,在计算相似度时考虑用户的个性化影响,从而提高相似度计算的准确性。文献提出了一个融合基于用户的预测评分以及基于服务的预测评分的推荐系统,该系统通过用户、服务相似度分别对服务的评分进行预测,然后将两个预测值进行线性组合,从而提髙评分预测的精度。这些服务推荐研究的主要问题在于只考虑了历史行为所包含的隐式或显式信息,忽视了服务之间丰富的关联关系,而且数据的稀疏性也是一个无法忽视的问题。
QoS即服务质量,包含服务响应时间、吞吐量、可靠性等服务非功能属性。基于QoS的推荐首先要获得用户在进行服务调甩时所感知到的QoS数据,然后使用协同过滤算法进行相似度计算并预测QoS值,根据QoS预测值进行推荐。文献提出了一种利用服务质量(QoS)和体验质量(QoE)进行双向Web服务推荐的复合模型,该模型分析评价文本的正面或者负面性,更多的考虑了用户使用服务的情绪反馈,并将用户的情绪评分与满意度评分进行结合完成推荐。对于数据稀疏问题,文献通过矩阵分解技术对矩阵进行降维,来进行QoS预测。
一些文献为了提高QoS预测的准确率,将一些外部环境因素加入到算法中。文献提出一个考虑地理位置因素的服务推荐算法,该文献认为Web服务QoS因素(例如响应时间和吞吐量)受Web服务和用户的位置影响较大,因此引入用户和Web服务的位置信息对相似度计算进行优化。文献将时间信息集成到相似性度量和QoS预测中,为了减轻推荐中普遍面临的数据稀疏性问题,设计了一种混合的个性化随机游走算法对用户、服务相似性进行计算。目前Web服务研究主要存在以下不足:
(1)QoS值受外部影响过大,用户的网络情况、当前地理位置都会对QoS产生较大影响,因此对于用户真实的QoS值往往无法准确获得,而错误的QoS值对推荐结果会有很大影响。而且在用户使用服务时,QoS往往并不是用户最关注的属性。
(2)在真正使用中,服务的数量是及其巨大的,系统中存在大量的服务提供用户使用,历史行为信息中的服务维度会大大增加;同时用户的使用精力以及消费面相比于如此庞大的服务来说又是极小的,因此用户能够关注到的服务在系统的全部服务中所占比例极小,协同过滤推荐所使用的用户服务交互表会极其稀疏。从而影响了相似度的计算与冷门服务的推荐,进而影响了推荐系统的准确性和多样性。
参考文献
[1]张焱,肖涵,黄佳杰,朱从飞.基于知识图谱和微服务的智慧水利一张图系统实现[J].水利信息化,2021(04):17-21.
[2]陈涛,刘学军,张伯君.融合知识图谱语义信息的推荐方法[J].计算机工程与设计,2020,41(11):3047-3052.
[43]Zuoxi Yang,Shoubin Dong.HAGERec:Hierarchical Attention Graph Convolutional Network Incorporating Knowledge Graph for Explainable Recommendation-ScienceDirect[J].Knowledge-Based Systems,2020,204:418-436
[4]Dehai Zhang,Linan Liu,Qi Wei,et al.Neighborhood Aggregation Collaborative Filtering Based on Knowledge Graph[J].Applied Sciences,2020,10(11):3818.
[5]汤伟韬,余敦辉,魏世伟. 融合知识图谱与用户评论的商品推荐算法[J].计算机工程,2020,46(08):93-100.
[6]陈嘉颖,于炯,杨兴耀.一种融合语义分析特征提取的推薦算法[J].计算机研究与发展,2020,57(03):562-575.
[7]乔星皓.基于知识图谱的Web服务推荐技术研究[D].大连海事大学,2020.
[8]谭文杰.基于知识图谱的科技服务推荐方法[D].哈尔滨工业大学,2020.
[9]韩策.基于知识图谱的志愿服务推荐系统研究与实现[D].北京邮电大学,2020.
[10]李涛.基于排名的云服务推荐的研究与优化[D].北京交通大学,2018.
[11]李永红,周娜,赵国峰,刘瑞峰,金鹏.模糊TOPSIS时变权重二次量化云服务推荐[J].计算机应用与软件,2016,33(04):14-17+50.
[12]刘志中,吕克林,宋成,徐秀珍.基于QoS预测与约束层次模型的云服务推荐方法研究[J].计算机工程与应用,2015,51(10):47-52.