APP下载

个性化好友推荐系统在社交网站上的应用研究

2014-05-30郑杨谭玲

今传媒 2014年6期
关键词:新浪微博个性化推荐协同过滤

郑杨 谭玲?

摘 要:互联网用户可以在计算机前轻轻点击鼠标来完成相对于现实生活中复杂的互动交友活动,个性化好友推荐系统通过基于内容推荐、协同过滤推荐、聚类推荐三种策略来帮助用户建立网状复杂的人际关系,最终提高用户对于本类社交网站的忠诚度。本文将通过详细分析新浪微博、腾讯QQ和人人网三大社交网站来具体分析个性化好友推荐系统的优缺点。

关键词:个性化推荐;新浪微博;协同过滤

中图分类号:TP393 文献标识码:A 文章编号:1672-8122(2014)06-0117-03

随着信息技术的发展,人们不再仅仅局限于身边的社交网络,而是在互联网上继续拓展自己的交友圈。现在的用户可以在计算机前轻轻点击鼠标来完成相对于现实生活中复杂的互动交友活动,但是社交网络在给人带来方便与快捷的同时也产生了信息冗杂、难以辨别的问题,为此个性化好友推荐系统应运而生。现在个性化推荐系统主要应用于电子商务平台,如B2B网站(当当网)、B2C网站(淘宝)等等。在电子商务的虚拟环境前提之下,个性化推荐系统就像一个采购助手一样帮助用户来选购商品,通过搜集用户的个人信息,浏览记录,商品交易详情等来预测用户的喜好并向其推荐可能感兴趣的商品或者服务,从而提高产品的销售量。同样的,社交网站通过这种个性化好友推荐系统,帮助用户建立网状复杂的人际关系,最终提高用户对于本类社交网站的忠诚度。

为了清楚地了解我国社交网站的好友推荐功能的使用状况,我们选择国内与交友相关的三个著名网站,包括最火平台新浪微博、聊天软件腾讯QQ和SNS网站人人网,用以分析各网站的个性化好友推荐功能。

一、社交网站的好友推荐方法简介

早在1995年,卡耐基·梅隆大学的Robert Armstrong 和 斯坦福大学的Marko Balabanovic等人就在美国人工智能协会上提出了个性化推荐系统,该系统主要是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品,它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务[1]。目前,我国的社交网站在好友推荐方面所使用的主要是检索和非个性化推荐的技术。一般的社交网站会在注册或使用过程中要求用户输入相关的信息,如生日、所在地、爱好、学校、公司等,通过丰富用户的网络标签来增加用户被检索和推荐的方式。从广义上来说,由于检索是一种基于用户自主查找目标好友的方式,那么其实它也可以看作是系统给出的推荐结果。非个性化推荐是依据最近热门的信息或者用户来进行推荐,不同的被推荐者都会收到同样的推荐信息,这种方法并不考虑被推荐者的第一兴趣,就像商場促销时分发的商品推荐目录一样。

对于好友推荐,可以从以下三个方面来考察其性能:其一,个性化程度。推荐系统检索出的结果是否符合当前用户的兴趣爱好和需要。其二,实现难易程度。用户为得到推荐结果所需要付出的劳动量。其三,可拓展性。主要指随着用户信息和兴趣的变化,好友推荐能否能及时的获取相关数据以及新信息的推荐能否高效率的被推荐到用户面前。

二、社交网站的个性化好友推荐策略

推荐的本质是代替用户对他没有看过的资源对象进行评定,从而帮助用户找到他喜欢的东西[2]。推荐系统通过获取用户的信息,将与之类似内容进行关联,进而把用户喜欢和需要的东西推送至其面前。

(一)基于信息推荐

也称为基于内容的推荐,它是对信息过滤技术的延续和发展,必须建立在对用户个人信息进行总汇并对信息进行有效过滤的基础之上。根据用户的特征和目标要求预测并搜索与之匹配程度较高的其他好友,这个过程中一般不需要用户对内容的评价意见,只通过相关的特征和属性用机器检索的形式进行推荐。

1.人脉。人人网将自己定位为中国领先的实名制SNS社交网络,宣传语是“因为真实,所以精彩”。在一开始注册的时候,用户就被要求填写出生地、高中、入学时间、毕业院校、公司等个人信息,这就为个性化好友推荐提供了良好的信息来源。值得注意的是,现在的社交网站纷纷将推荐重点转移到人脉关系上。比如在人人网添加好友选项中有专门的按人脉筛选标签,选择已有的一位好友,推荐系统就会自动计算二度人脉中与用户本身相似度比较高的,从而完成个性推荐的过程。腾讯推出的朋友网更是致力于人脉推荐,不但将一度人脉、二度人脉细分独立出来,还将每个用户所贡献的人脉做排名比较,最大限度的调动用户的使用兴趣,真正的让用户由信息浏览者变成了信息使用者。除此之外,朋友网还兼顾非个性好友推荐的策略,在网页的侧边栏还提供各类形式多样的好友推荐,如“他们是你的高中学弟学妹”、“可能认识的人”,“人脉中有X人是你的本科同级校友”等,当用户把鼠标移到这些信息之上时,结果不只是显示单一的推荐列表,更能清晰的看到有几位共同好友,系统用这种方式向用户解释了为什么推荐这些资源,真正体现了个性化推荐系统的人性化。

2.IP。腾讯QQ查找好友选项中有开启位置信息的选项,只要开启用户自己的地理位置信息,推荐系统就可以显示附近的QQ用户信息。

(二)协同过滤推荐

协同过滤推荐一般采用最近邻技术,利用用户的历史记录信息计算用户之间的距离,然后利用目标用户的最近邻用户对某一内容信息评价的评价来预测目标用户对特定内容信息的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐[3]。

1.LBS。在网民急剧增长的今天,想要为社交网络用户找到真正感兴趣的好友,最好的办法就是首先找出与此用户有相似生活经历、娱乐活动或者兴趣爱好的其他用户。微博的宣传语是“随时随地分享身边的新鲜事”,用户发布微博的同时还可以进行地点定位,当微博用户点击相关地点时,就主动的进入了筛选好友的个性化系统。与腾讯网直接的IP好友推荐不同,新浪微博依据用户IP定位将其他用户所发的微博总汇起来,用“周边的人”、“周边热图”、“相关微博”、“周边热门”几个标签分别归类,当用户浏览这些信息时,便可以与自己在同一地点、发表相似感想或者相同兴趣爱好的网友进行互动。通过协同过滤推荐,用户不需要填写调查表格、个人信息,而是通过对社交网站的浏览行为,自动的获得好友推荐。值得一提的是,新浪微博还将电子商务融入进个性化推荐,提供用户定位地点附近的团购优惠信息,极大提供了便利。

2.标签。腾讯QQ的好友信息中特别设有标签一栏,通过这种近乎个人的知识体系,以个人的感性逻辑(个人知识、情感、意志、记忆、素养等等的综合反映)为线索,以个人所需信息的汇集、梳理和查询为目的,以个人经验为基础来实现个性化好友推荐[4]。用户通过自己的喜好,用更灵活的表达方式来组织和管理自己的信息,不同于传统的关键字检索方式,标签功能让用户更个性化的表达自己的兴趣爱好,是一种更智能化的分类。腾讯QQ用户选择系统自带的标签,也可以自己创作,随时修改并发布,好友推荐系统就会及时的呈现出有相同爱好的同道中人。

(三)聚类推荐

类似于电子商务系统中所运用的关联规则,把用户已经购买的商品作为规则的源头,将推荐对象看作规则目标体。关联规则挖掘的典型例子是购物篮分析,该过程通过发现顾客放入其购物篮中不同商品之间的联系,分析顾客的购买习惯[5]。比如买上衣的用户,一般還会继续购买裙子或者裤子,网站将这些频繁被同时购买的商品汇总,从而制定营销策略。

腾讯QQ推出一系列娱乐应用功能,比如QQ农场、捕鱼达人等,让同一社区进行相同游戏的用户进行相互推荐。在新浪微博中,微博小秘书会及时通知用户被关注的情况,以便用户互粉。微博中更有其他APP应用功能软件在用户体验过之后就会发布微博公开网址,用户可以通过浏览微博发现此信息点击进入后,拥有相似应用经历的用户就会呈现在网页上,这也是隐性好友推荐的一种方法。

三、国内社交网站个性化好友推荐的优点与存在的问题

通过以上分析,可以发现国内的社交网站将非个性化好友推荐与个性化好友推荐技术相结合,多种推荐策略的混合使用能更好的共同服务于用户。人人网有时间轴功能、腾讯网有圈子社区、腾讯微博开通微人脉应用,随着用户个性偏好与生活经历的改变,这些好友推荐系统能将随着时间而改变的资源记录下来,从而构造出用户的个性偏好随时间变化的模型。如今随着科技的飞速发展,普通用户想要从信息量繁杂的互联网世界中搜寻到自己可能感兴趣的内容,不但难度提高了很多,成本也是不可小觑的。再者社交网站与一般商业网站的长尾经营策略不同,如果用户不积极的提高自己的活跃度,那么就极有可能不再受到别人的关注。虽然社交网站采用了三种不同的推荐策略,在实际应用中也取得了喜人的效果,然而这些推荐系统或多或少的都面临着许多问题。

(一)基于信息推荐系统面临“游客”问题

基于信息推荐系统运作的前提是用户注册本网站并且填写基本个人信息,然后才能从用户已建立的人脉关系或者显示的IP地址中获得用户可能会偏好的信息,进而计算用户之间的相似度。当一个新用户以游客的身份进入网站时,会因为身份不明确而被拒之门外,这一点与国内一些知名的交友网站运作策略不同,比如世纪佳缘网、百合婚恋网等。非注册用户也许只是想打开网站链接对相关视频、音乐、文章一探究竟,但由于注册的步骤很繁琐,这种闭门造车的经营方法会导致潜在用户的流失。新注册用户在加入到网站伊始,由于基于信息推荐系统完全依靠用户自己输入的信息进行推荐,这种环环相扣的推荐方式如果其中某个链条出现空白将直接影响到整个推荐系统的运作,导致用户不能精准的找到自己的目标好友。而且面对日益增多的用户,对规模不断扩大的数据进行整合成为直接制约系统实现的重要因素。虽然基于内容系统推荐由于前期用户对自我信息的补充减少了建立模型花费的时间,但是用于识别“最相似”算法的计算量随着使用人数和信息的增加,将会面临严重的扩展性瓶颈问题,该问题会对算法的准确性产生直接影响。

(二)协同过滤推荐系统面临技术难题

协同过滤推荐系统受到信息获取技术、专业户程度过高等因素的制约[6]。一方面在协同过滤推荐系统中,用于标明用户特征的内容都必须能被计算机自动提取出来并进行统一的归纳,因此该类算法在搜集信息时对有关技术有很高的要求,比如在微博中,用户仅仅能够通过标签和IP定位来搜寻目标好友,如果用户发表一段语音,系统可以通过过滤其中的关键词来提取信息,那么目标好友的推荐的范围是不是可以更加开拓呢?同样的,用户发表一张图片,计算机系统对图片内容进行分类归纳,由此也可以把标记过相似内容的用户进行相互的推荐。另一方面,在用户标签的实际应用中,如果两个不同的词汇刚好用相同的特征词汇表示,那么这就容易造成彼此的混淆。特别是在衍生词和造字风潮的现代社会,这种情况尤其明显,例如最近比较热门的“土豪”一词,“土豪”原指在乡里凭借财势横行霸道的坏人,后在ACG界引申为无脑消费的人民币玩家,两个词写法一样意思却大相径庭,这样的话,系统只推荐相关度最高的好友给用户,就很难保证推荐的准确性与多样性。

(三)聚类推荐系统面临“新”问题的制约

聚类推荐系统受到新用户问题的制约,该系统最根本的就是要建立用户与产品的关联网络图,即用户下载了什么应用软件、使用的程度如何。新用户刚刚进入系统时没有任何选择或者被选择的信息,无法被其他用户发现并建立关联,所以也没有办法启动聚类推荐系统,只能僵硬的让非个性化推荐作为敲门砖,让用户自行选择偏好的好友。同时聚类推荐系统还受到时间进度的影响,用户的长期兴趣与短期兴趣都被考虑在关联算法之内,无法区分,从而使得推荐的准备读大大降低。

除此之外,国内的社交网站一般都需要用户先明确自己的需求,然后通过用户与系统的相互交流,表达出用户的兴趣爱好与要求,最后由系统给出推荐结果。整个过程所体现出的最大问题就是推荐的自动化程度低,用户要比较明确的知道自己的需求并且花费一定的时间来与计算机进行交互,最后才能得到结果。因此对于研究机构来说,要加大研究力度,将工作重心放在自动化推荐技术的研究上。

参考文献:

[1] 个性化推荐系统在电子商务网站中的应用研究[EB/OL].http:// www.doc88.com/p-148667184110.html.

[2] 陈敏.个性化推荐系统研究[D].南京邮电大学,2012.

[3] 曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002(10).

[4] 田莹颖.基于社会化标签系统的个性化推荐[J].图书情报工作,2010(1).

[5] 陈丽丽.个性化推荐系统在B2C教育网站上的应用[EB/OL]. http://www.doc88.com/p-795222687856.html.

[6] 刘建国.个性化推荐系统的研究进展[J].自然科学进展,2009(1).

猜你喜欢

新浪微博个性化推荐协同过滤
新浪微博热点事件的舆论传播与群体心理
基于链式存储结构的协同过滤推荐算法设计与实现
基于相似传播和情景聚类的网络协同过滤推荐算法研究
个性化推荐系统关键算法探讨
基于协同过滤算法的个性化图书推荐系统研究
新浪微博娱乐明星的社会网络分析
混合推荐算法在电影推荐中的研究与评述
社交媒体平台医患关系报道特点研究
微博的社会公信力现状探究及其未来构建研究