基于位置的社交网络的个性化兴趣点推荐算法研究
2020-07-04李丹霞
摘 要:目前随着科技的发展,通过一系列的探索可以发现,用户的兴趣会随着时间和地理位置的变化而产生一定变化,因而提出具有混合时空和流行度特征兴趣点的推荐算法是非常重要的。基于此,本文主要讨论了在位置基础上的社交网络个性化兴趣点推荐算法的探索策略。
关键词:位置;社交网络;个性化兴趣点;推荐算法
随着互联网的扩张,数据量也出现了大幅度的增加,人们已经摆脱了数据比较匮乏的时期,进入到一个大数据的时期,并顺应这个时代会产生两种角色,即数据的消费者和数据生产者。这两种角色目前面临的挑战是极大的,而对数据的消费者来说,怎样才能够在互联网当中准确搜索出自身需求的数据是非常困难的,而对于互联网数据生产者来说,怎样才能够让发布数据更为有效也是一件非常困难的事情。
一、推荐算法的相关技术
(一)协同过滤推荐
一般来说,协同过滤推荐可以分成两个步骤,首先就是帮助指定的用户a来发现自己所具备的一些类似喜好的临近用户b群体。其次就是向a推荐必选题所偏爱的且a并不了解的东西,协同过滤推荐中主要之处就是要寻找最近的一些b群体,但群体当中的个体和目标用户的距离主要就是通过个体及目标的相似程度来进行衡量的,相似程度越多,那么二者之间的距离就相对越近,则b群体对物品所有的打分就会更具参考性,用户对于物品的打分如果更高,那么就证明用户对于物品的兴趣程度也会更高,每一个用户对物品所进行的打分可以由一些维度向量以表示,而用户之间的相似程度可以由对应维度向量的相似程度来进行衡量。
协同过滤推荐中的基于物品的协同过滤算法,其主要原理就是向目标用户推荐之前所感兴趣的一些物品以及相似的物品,且物品之间相似度的计算主要通过对用户的分析和行为记录来获得,若a物品和b物品相互之间的相似度高,一般则体现在喜欢a物品的用户很有可能也会喜欢b物品,比如在亚马逊当中就是按照统计数据表来表明消费品移动用户的相关消费概率,在物品基础上的协同过滤算法,首先就是要按照喜欢物品的用戶数来估算出物品之间的相似程度,之后再结合上一个步骤,让用户偏好的行为给予用户来推荐其较感兴趣的物品。
(二)基于内容的推荐
基于内容的推荐主要就是来源于信息检索的领域,按照用户所感兴趣的一些项目,挑选出类似的项目予以推荐,首先需要提取被推荐的项目,根据其各自的内容特征和用户的偏好来进行相似度的计算,把一些相似度相对更高的项目推荐给用户,比如在进行电影推荐的过程当中,推荐系统则会分析出用户之前所看过的电影共性,之后从其他电影当中选择出与用户的偏好比较相似的电影推荐,并计算被推荐项目的特性以及用户喜好的特性,而相像程度的具体方法一般会使用相似度,且对于文本内容特性的提取方法相对而言也已经趋于成熟,比如新闻推荐。而对于多媒体数据内容的特性提取,仍然也需要大幅度的探索。
二、混合时空以及流行度特征的兴趣点推荐算法
(一)融合用户协同过滤和时间特征的兴趣点推荐
首先是预处理数据,其次就是对任意两个时间点的相似度来进行处理,再次就是平滑技术下的用户相似度,最后则基于平滑技术与时间感知的用户协同过滤。
(二)融合流行度和空间特征的兴趣点推荐
首先就是最近零候选兴趣点,用户倾向于访问一些曾经去过的地方,和目前的位置越接近则兴趣就会更高,反之,随着距离不断地增加,用户的兴趣点也会因此而得到下降。其次就是要基于时间因素兴趣点的流行度,每一个兴趣点在一天当中的不同时间点,用户的签到概率都是不一样的,也就是兴趣点的流行度是不一样的。不同的兴趣点在时间点不同的情况下,用户的签到概率也是有所区别的,使用后选兴趣点在某一个时间点签到的数量,以及这个候选兴趣点长期签到的数量,就能够选择出一些较为有效的评估方法。
通过深入分析,分析在用户历史行为数据基础上的计算方式,将时间、空间以及流行度的特征融在兴趣点推荐当中,而且分别能够提出一些在不同时间点用户签到比较相似的时间平滑技术以及基于时间因素兴趣点流行度的评价方法,能够设计一种有效的算法,这个算法的优点就在于不断能够让推荐系统的计算量降低,同时也可以提高一些系统性能,让其应用价值达到更高。
三、基于隐含语义分析模型的兴趣推荐算法
(一)兴趣点推荐流程框架
首先就是数据采集层,每一条用户的签到数据都包括用户的名称、签到的时间以及坐标位置和用户对兴趣点的评论信息等,可以选择公开的数据来避免网络数据带来的数据不规范性,并且可以避免后续处理数据所带来的一些复杂性。但是公开数据集也是具有一定缺点的,可用的有效信息相对比较少,因此如何才能使用有效的信息来进行新人推荐也是非常重要的。
其次就是数据分析层,数据采集层所提到公开数据的有效信息量是比较少的,因此从一些比较有限的信息量当中提取较为有用的信息特征,对设计较为高效的兴趣点推荐算法都是非常关键的。本文主要可以从用户的直观与隐藏这两个新区方面来分析用户签到的数据集,并了解到用户签到的行为特征主要包括有时间特征和空间特征,以及用户过往的喜好行为特征和文本评论的特征,通过统计和分析原理发掘所得到的时间与其差异性、连续性的特征,以及最近联合兴趣点流行度相互之间的特征等,这些特征是推荐算法生成的一个基本条件,也是社交网络个性化信息点推荐的一个最为实际的依据。
再次就是要按照用户签到数据所集中分析得到的信息特征、空间信息特征和用户的行为偏好特征,以及文本评论的信息特征等。本文主要讨论了融合用户的协同过滤和时间特征在信息点的推荐融合流行度与空间特征,并且在信息点的推荐方面从用户的直观兴趣与隐藏兴趣这两个方面来进行融合各种不同的推荐,最后能够得到在位置基础上社交网络个性化的兴趣点推荐的算法,并给出一定的推荐结果。
最后就是实验分析层,实验分析层主要就是从实验的环境、实验评估指标与参数的选取,以及对比实验这几个方面来展开,首先要选择配置相对较高的硬件环境以及推荐系统设计比较常用的软件语言,其次对设计出来的算法要选择效果最为优质的参数,之后分别从推荐的精确率与召回率这两个方面,来评估兴趣点并推荐算法。挑选目前推荐效果较优质的推荐算法进行相互对比,从而评估设计出算法的可能性。
(二)基于用户历史签到行为偏好兴趣点推荐算
用户的行为历史偏好是能够改善推荐的一个最重要因素,这种算法可以有效地把用户的兴趣点映射到一个相对较低的美图空间当中来进行解决,这种兴趣点模型能够在显性反馈的信息上更加有效地解决评分和预测问题,而隐性反馈信息其独特之处就是只有正样本没有负样本,而其次构造损失函数来寻找比较合适的用户隐含类别与兴趣点,之后再优化损失函数,最后就可以得到相关算法。
(三)基于文本信息的兴趣点推荐算法
用户的一些隐藏兴趣可以由用户点评兴趣点的文本信息所存呈现出来,和一些具有客观性文本相互之间的区别就是这些主观色彩相对较浓厚的评论信息,富含有用户对于兴趣点的根本看法。对用户来推荐一些比较新颖的兴趣点是具有一些参考价值的,本文的中心意思在得到挖掘的过程中,一般来说使用三层贝叶斯概率模型来进行,且其主题模型可以从文档和词语之间发现一些比较潜在的关系,从而提高人们对于文本信息的处理能力。
四、结语
综上所述,目前兴趣点推荐算法能够有效的评估不同用户在系统当中的兴趣点,本文主要讨论的一些较为经典的推荐算法,对其在社交网络当中的一些概念进行相关叙述,并估算用户在某一个时间当中,有可能会访问从未去过的位置概率,从而针对用户的兴趣点进行一定的推荐,使系统能够更加优化并且可以满足用户的个性化需求,尽量缓解信息过载的问题,而系统当中的推荐性能也可以获得全面发展。
参考文献:
[1]王丹妮,刘颖.基于位置的社交网络的个性化兴趣点推荐算法研究[J].无线互联科技,2018,15(15):32-33.
[2]刘全飞.基于位置的社交网络的个性化兴趣点推荐算法研究[J].无线互联科技,2018,15(11):145-146.
[3]季军.基于位置的社交网络的个性化兴趣点推荐算法研究[J].电脑知识与技术,2018,14(15):14-15+21.
[4]李粉杰.基于位置的社交网络的个性化兴趣点推荐算法研究[J].科学技术创新,2018(11):59-60.
作者简介:李丹霞,女,陕西延安人。