社交媒体中的信息推荐
2012-08-18黄立威李德毅
黄立威,李德毅
(1.解放军理工大学指挥自动化学院,江苏南京 210007;2.中国电子系统工程研究所,北京 100141)
社交媒体中的信息推荐
黄立威1,李德毅2
(1.解放军理工大学指挥自动化学院,江苏南京 210007;2.中国电子系统工程研究所,北京 100141)
近年来社交媒体越来越流行,可以从中获得大量丰富多彩的信息的同时,也带来了严重的“信息过载”问题.推荐系统作为缓解信息过载最有效的方法之一,在社交媒体中的作用日趋重要.区别于传统的推荐方法,社交媒体中包含大量的用户产生内容,因此在社交媒体中,通过结合传统的个性化的推荐方法,集成各类新的数据、元数据和清晰的用户关系,产生了各种新的推荐技术.总结了社交推荐系统中的几个关键研究领域,包括基于社会化标注的推荐、组推荐和基于信任的推荐,之后介绍了在信息推荐中考虑时间因素时的情况,最后对社交媒体中信息推荐有待深入研究的难点和发展趋势进行了展望.
信息推荐;信息过载;推荐系统;社交媒体
随着Web 2.0的应用以及各种类型的社交媒体的流行,在线用户的行为已经发生了巨大的变化,正如Rosa等[1]在其报告中描述的那样:“在线行为已经不能仅仅用搜索或浏览来概括,其正在演化为交互、迅速的内容创建和分享”,Web 2.0让任何人都可以通过互联网进行分享和交互,并最终涌现出群体智能[2].
新一代的Web应用不再仅仅是只读的,Web用户也不仅仅是信息的消费者,他们成为了信息的生产者.用户积极参与到社交网络中,上传个人照片,分享他们的书签,写博客,发微博,对他人提供的信息进行注释和评论.他们不仅提供信息,而且提供“自己”,在社交网站上建立详细的个人档案并分享这些信息,与成千上万的网络用户建立虚拟的朋友关系,大量的用户在这些社交媒体上每天花费大量的时间,并且产生了大量的信息;但与此同时也带来了一个巨大的挑战:信息过载,即过量信息同时呈现使得用户很难从中获取对自己有用的部分,信息使用效率反而降低.现有的很多网络应用,比如门户网站、搜索引擎和专业数据索引本质上都是帮助用户过滤信息.然而这些工具只满足主流需求,没有个性化的考虑,仍然无法很好地解决信息过载的问题.变被动搜索为主动推荐,社会推荐系统(social recommender system)作为解决信息过载问题的重要手段,是当前解决社交媒体中信息超载问题的最有效的方法之一.推荐系统由于能够提高服务的使用者数量,并且提升用户的满意度和忠诚度,可以更加理解用户的需求,因此越来越受到各种服务供应商的重视[3].
1 传统推荐方法
文献[4]给出了推荐系统的一般的形式化定义:设C是所有用户(user)的集合,S是所有可以推荐给用户的对象(item)的集合.在实际情况下,C和S集合的规模都非常大.用效用函数u计算对象s对用户c的推荐度,即u:C×S→R,R是一个全序集合(在一定范围内非负的整数或实数),推荐要研究的问题就是对每一个用户c∈C,找到推荐度u最大的对象s'∈S,如式(1):
用户和对象都可以通过一组不同的属性和特征来表示.推荐算法研究的核心问题在于效用度u通常并非定义在整个C×S空间上,而是在其中的一个子空间上,这就意味着必须对u外推(extrapolation)到整个空间上.例如,通常推荐度被定义为用户对对象的评分,因为用户只对部分对象进行了评分,所以在从所有对象中选择推荐度最高的对象推荐给用户之前,必须先基于已经评分的对象来预测用户对未评分对象的评分,从已知的评分到未知的评分的预测,就是外推的过程.对未评分对象的评分可以采用不同的方法进行预测,例如机器学习、近似理论和各种启发式的方法.对推荐方法的分类通常是依据预测方法的不同,传统的推荐方法基本包括以下几种:基于内容的推荐(content-based recommendation)[5]、协同过滤推荐(collaborative filtering recommendation)[6]、基于知识的推荐 (knowledgebased recommendation)[7]和混合推荐(hybrid recommendation)[8].
1)基于内容的推荐:是指根据用户已经选择的对象,推荐其他内容上类似的对象作为推荐,属于Schafer划分中[9]的 Item-to-Item Correlation 方法.该方法首先由系统隐式获取或者由用户显式给出用户对项目属性的偏好,然后通过计算已知用户偏好的对象和等待预测偏好的对象之间内容上的匹配度(或相似度),最后按照偏好排序结果向用户推荐其可能感兴趣的对象,可分为启发式方法和基于模型的方法[4].
2)协同过滤推荐:类似于现实世界中自动传播口碑(word-of-mouth)的过程,根据已知的用户偏好,计算用户之间的相似度,从而推荐相似用户的偏好给当前用户.其基本思想非常易于理解,在日常生活中,人们往往会利用好朋友的推荐来进行一些选择.协同过滤正是把这一思想运用到推荐系统中来,即基于其他用户对某一内容的评价向目标用户进行推荐.又可以分为启发式方法和基于模型的方法[4]:前者需要计算用户(或者推荐对象)之间的相似度,后者利用已知用户偏好学习一个模型为活动用户或者活动项目进行偏好预测.协同过滤主要包括2项主要技术[10]:邻域方法(neighborhood approach)和隐因子建模(latent factor models).
3)基于知识的推荐:在某种程度上可以看成是一种推理(inference)技术.它不是建立在用户需要和偏好的基础上推荐的,而是利用针对特定领域制定规则(rule)来进行基于规则和实例的推理(casebased reasoning).效用知识(functional knowledge)是一种关于一个对象如何满足某一特定用户的知识,能够解释需求和推荐的关系,因此用于推荐系统.效用知识在推荐系统中必须以机器可读的方式存在(ontology本体知识库).
4)混合推荐:混合推荐一个最重要原则就是通过组合后应能避免或弥补各自推荐技术的弱点,按照不同的混合策略(如加权、切换、混合呈现、特征组合、串联、特征扩充、元层次混合等)将不同推荐类型或推荐算法进行组合并生成推荐.
2 社交媒体中的信息推荐
社交媒体中,能够获得的用户数据不仅仅包含用户人口信息(user demographic information),用户生成的内容(user generated content)如评论(comments)、标签(tags)、微博(如 tweets)等,其内容也越来愈丰富,其中蕴含的巨大价值也越来越被大家认识到.通过数据挖掘和信任管理等技术对这些数据进行分析,可以得到更加准确和详细的用户数据(user profile),其不仅包含用户对特定对象的偏好信息,而且包含用户的主题兴趣和用户之间的信任关系等,可以将所有的这些用户信息称为增强的用户数据(enhanced user profile),基于这些数据,往往能够产生更加可靠和高质量的推荐.因此在社交媒体中,通过结合传统的个性化的推荐方法,集成社交媒体中新的数据、元数据和清晰的用户关系,产生了各种新的推荐技术[11].
由于在社交媒体中可以获得更加多样和丰富的数据,包括标签、用户的社交关系等,促使社交媒体中的推荐模式(recommendation mode)[12]不再单一,推荐的内容更加多样,除了包括一般的资源,如视频、新闻等,还包括标签和人的推荐;而且推荐的对象也更加多样,不仅仅对单个用户,还可能是一群用户,即组推荐(group recommendation).由于人们在现实生活中更容易听取来自于朋友的建议,因此基于信任的推荐(trust-based recommendation)也非常重要.此外在推荐过程中时间往往对推荐的效果会产生至关重要的影响,这是必须考虑的因素.因此本文将重点对目前社交媒体的信息推荐中以上几个重要研究领域进行介绍.
2.1 基于社会化标注的推荐
最近10年,社会化标注(social tagging)的出现,已经在产业界得到了广泛应用,出现了Delicious、Flickr、Youtube、LibraryThing、Last.fm、Connotea、CiteUlike、Technorati等众多新的应用与体验.由于允许任意用户可以对感兴趣的网络资源进行基于自身理解的无约束标注,并且所有用户的标注都互为可见,这种开放、共享的模式以及反映用户真实的理解和观点的标注为信息资源组织、检索和共享带来了一种全新理念,它是一种大众群体智慧的体现.标签与以往推荐系统所能获得的信息的本质区别是:标签作为用户所选择的关键词,体现了用户对资源的理解,并且成为了用户之间联系和交流的纽带.可以说,标签既表达了信息资源的主要特征,同时又涵盖了用户与资源之间、以及用户与用户之间的关系,兼具内容与关联的特征.将标签作为推荐技术的数据来源,便有可能开发出同时具备内容过滤和协同过滤优越性的推荐技术,形成基于社会化标注的推荐[13-14].
大众分类法(folksonomy)是社会化标注系统的
基本结构,在社会化标注系统中,大众分类法形式上可以由一个四元组表示,即F=(U,T,R,Y),U、T、R分别代表用户、标签和资源的集合,Y是它们之间的一个三元关系的集合,即Y⊆U×T×R,其中的每个元素称为标签分配关系(tag assignments)[15].大众分类法的数据一般可以通过2种方式表示:1)用A、A'、A″分别表示 user-item、user-tag 和 tag-item 关系的邻接矩阵;2) 用三维矩阵(third-order tensors)[16-17]或超图(hypergraphs)[18]表示,将Y分别用三维矩阵Z=(zu,t,r) ∈R|U|×|T|×|R|和三分无向超图G=(V,E),V=U∪T∪R,E={{u,t,r}|(u,t,r)∈Y}来表示.由于传统的推荐方法是基于user-item的二分关系,通过存在的值来预测缺失的值,而大众分类法的数据本质上却是一个三元关系,如果在社会化标注系统中进行推荐,要么将三元关系降维为二元关系,然后采用传统推荐方法进行推荐,这样在维度约减过程中必然会丢失一些信息,要么基于三维矩阵或超图采用新的方法来进行推荐.目前很多研究者在这2个方面都做了很多工作,下面将介绍比较重要的几类方法.
1)协同过滤方法:采用传统的协同推荐方法进行推荐.Marinho等[19]先将三维空间投影到2个二维空间,即用户-标签空间和用户-资源空间,然后使用传统的协同过滤推荐方法,进行标签推荐和资源推荐.Tso-Sutter等[20]同样是将三维空间降维到用户-资源空间,但他们通过将标签作为伪用户和伪资源得到2个不同的用户-资源矩阵,然后采用传统的协同过滤推荐方法进行资源推荐,得到了更好的结果.
2)基于排序的推荐:这种方法思想来源于web排序,这种方法的共同点是利用大众分类法数据结构的频谱特征来对推荐的资源等进行打分,依据分数高低进行推荐.该方法主要包括基于三维矩阵的因式分解进行排序的方法[16-17,21]以及 Hotho 等[22]基于pagerank的思想提出的folkrank算法.基于排序的推荐方法是对标签进行排序,其核心思想是重要的标签由重要的用户提供.
3)基于内容的推荐:前面2类方法都没有考虑推荐对象的内容,实际上推荐的内容在推荐过程中也可能发挥很大的作用,很多研究者研究了基于文本[23]、图 片[24]和音 频[25]内 容 的 推 荐 方 法.Illig等[26]对基于不同内容的标签推荐方法进行了比较.
事实上,虽然目前对基于社会化标注的推荐研究已经取得了不错的成果,但仍然还面临很大的挑战,如标签本身存在语义上的一词多意、同义、模糊性等,噪声标签问题,如何提供实时推荐的问题,以及如何结合社会网络进行推荐的问题等,这些问题的存在也为研究者提供了新的方向.
2.2 组推荐
目前大部分的推荐系统都是面向单个用户,而面向一组用户的推荐还较少.但事实上很多时候可能必须面对一组用户进行推荐,例如,向一群朋友推荐旅行安排,向一个家庭推荐电视节目,向一群同事推荐出差时的住宿地点等.目前也有一些组推荐系统,如MUSICFX[27]、POLYLENS[28]、INTRIGUE[29]等.
组推荐的目的是为每个要推荐的对象给出一个打分,打分必须反映组内各成员的兴趣和偏好,然后根据打分进行组推荐.组推荐区别于个人推荐的最大不同在于:通常组内各成员对同一对象的感兴趣程度是不同的,最后必须针对组内所有成员的偏好给出一个一致的推荐.目前对组推荐的研究主要是通过集成所有单个组成员来产生组推荐,主要包括2 种方法[30-32]:一种是集成模型(aggregated models),这种方法将所有用户的组看成一个虚拟用户,通过集成组内用户的信息得到虚拟用户的信息(包括偏好信息等),然后对虚拟用户进行个人的推荐;另一种是集成预测(aggregated predictions),这种方法通过研究单个用户的历史偏好数据,产生单个用户对推荐对象的预测分数,然后集成这些分数产生组推荐.由于集成预测方法更加灵活[33],本文主要介绍这种方法,另外对集成模型的相关研究可以参考文献[27,34-35].
Masthoff在文献[34]中给出了11种集成策略,包括主投票(plurality voting)、最小伤害(least misery)、公平性(fairness)、打分平均值(average)、乘法(multiplicative)、Borda计数(borda count)、Copeland规则(Copeland rule)、赞成投票(approval voting)、最开心(most pleasure)、不考虑伤害平均(average without misery)、最受尊敬的人(most respected person),还有研究者将个人模型线性组合为一个组模型(group modeling),文献[35]通过实验分析了各种集成策略的优劣,而事实上这些策略的好坏更多地可能决定于实际的应用需求,取决于人们的推荐想实现的目的.
组推荐是一个较新的领域,目前仍然存在很多挑战,需要进一步研究,Masthoff在文献[36]中总结了若干个方向,例如如何解决数据稀疏问题;如何根据用户的动态信息提供动态的推荐,为组提供连续推荐;如何处理信息中的不确定性,为组推荐提供更合理的解释;如何在推荐中加入协商机制等.
2.3 基于信任的推荐
在传统的推荐中,往往并没有考虑用户的社交关系,而事实上关联的用户之间更可能有相同或相似的兴趣,另外用户也容易被自己信任的朋友所影响,更容易接受朋友的推荐,因此当考虑用户社交关系进行推荐时会更加准确.有研究也已经指出当面对来自朋友的推荐和来自相似但陌生的用户的推荐时,用户更倾向于接受来自朋友的推荐[37].目前有很多比较典型的包含用户信任关系的社交媒体,如Epinions.com.
基于信任的推荐与传统的推荐技术最大的不同在于推荐时考虑了用户之间的信任关系,而这种信任关系可以用信任网络(trust network)来表示,除了考虑用户之间的信任关系,还有很多研究也同时考虑了用户之间的不信任关系.信任度量和推荐技术是基于信任的推荐的2个支撑技术[38].信任度量是基于信任网络来度量网络中任意2个用户之间的信任关系,通常这种信任关系是有向的,也就是非对称的.信任度量涉及到3个关键技术:1)信任模型(trust model):如何表示用户之间的信任和不信任;2)信任传播(trust propagation):如何通过网络路径计算不相邻用户之间信任的传递;3)信任集成:如何集成多条路径所传播的信任.本文主要对基于信任的推荐技术进行介绍,目前已经有很多关于信任度量的研究,具体参考文献[39-41].
文献[38]根据信任网络中用户之间的信任值获取的方式,将基于信任的推荐大致分为了2类:具有清晰的信任关系(explicit trust)的推荐和含蓄的信任关系(implicit trust)的推荐.前者的信任值通过让用户直接对其朋友进行信任值打分获得;后者的信任值不需要用户直接对朋友进行信任值打分,而是通过一些其他信息自动计算得来.
1)基于清晰的信任关系的推荐中,集成值得信任的用户对目标资源的打分,来给目标用户进行推荐,最普遍的方法主要有2种:加权平均和协同过滤.a)加权平均是通过信任值超过一定阈值的用户对目标资源打分,然后对这些评分进行加权平均,预测得到目标用户对目标资源的打分,依据打分高低对用户进行推荐,其中方法的关键在于如何度量用户之间的信任值.Golbeck等[42]提出的TidalTrust算法通过考虑用户之间最短和信任值最高的路径,度量不相邻用户之间的信任值.b)协同过滤的方法利用协同过滤机制,将信任值代替相似值,预测得到目标用户对目标资源的打分.Massa等[43]提出的Mole-Trust算法是另一个度量不相邻用户之间信任值的算法.
2)基于含蓄的信任关系的推荐中,最著名的是O’Donovan等在文献[44]提出的算法,从Profile和Item 2个方面度量用户之间的信任值,将信任值融入传统的协同过滤框架中,得到更高的准确度.另外在文献[45]中,Ma等还同时考虑了用户之间的信任关系和传统推荐中的相似关系,将信任网络的邻接矩阵和user-item矩阵进行概率矩阵因式分解,然后进行集成产生推荐,实验结果表明此方法具有很高的可扩展性,预测的准确度比当前流行的方法都要高.
基于信任的推荐在一定程度上可以缓解传统推荐中的数据稀疏和冷启动问题,但同时也面临很多其他的挑战,通过直接让用户打分或用户的个人和交互信息建立起始的信任网络,都不能保证得到准确或全面的信任关系,如何更好地建立起始的信任网络是一个重要的问题,而事实上目前还存在的最大的困难之一是可以获得的数据集太少,不利于研究的深入展开[38].
2.4 信息推荐中的时间因素
大部分的推荐系统都忽视了时间因素,用户和资源的信息会发生变化,新的用户和资源会加入,旧的用户和资源会退出,尤其是在像Twitter、Facebook这种社交媒体中,这种变化可以说是实时的,这些都会影响用户兴趣的变化,因此如何建模时间因素的影响来为用户提供更加准确的推荐成为了一个重要的研究课题.本文主要介绍2个时间因素:时间动力学(temporal dynamic)和时间多样性(temporal diversity).
推荐过程中最大的问题是预测用户当前的兴趣,而用于挖掘的数据则来源于不同的时间,因此所反映的用户兴趣如何尽量符合当前的事实,这是一个巨大的挑战.Koren[46]基于协同过滤的2种方法,在因子模型中建模用户偏差(user biases)、对象偏差(Item biases)和用户兴趣(User preferences)的时间变化,目的是从数据中提取一些影响用户偏好的长期因素,在邻域模型中也建模了用户偏差(user biases)、对象偏差(Item biases)的时间变化,还考虑了用户打分的时间不同的情况,目的是发现一些更加基本的对象关联关系,通过这2种模型在Netflix的数据中进行实验,得到的结果都比不考虑时间影响的情况有了显著提高.Dror等[47]利用Koren在文献[46]中提出的方法进行更细分辨率的时间动力学建模,在Yahoo音乐的数据集上实验,得到了更好的结果.Xiang等[48]分别对用户的长期和短期偏好进行建模,将用户某一时刻之前的选择作为长期偏好,将用户这一时刻的会话(session)选择作为短期偏好,集成长期和短期偏好形成推荐,实验结果表明此方法取得了更高的准确率.
另外在推荐过程中,往往还需要考虑是否对用户进行重复的推荐,因为重复推荐可能让用户对推荐系统失去兴趣.Lathia等[49]通过对Netflix数据进行分析,发现目前的CF推荐方法具有较低的多样性,即在时间上容易产生相同的推荐,他们还提出了3种不同方法,在没有降低推荐的准确性的前提下,显著提高了多样性.
目前关于在推荐的过程中考虑时间因素的研究还较少,如何更好地在时间上对用户兴趣进行建模,在推荐过程中考虑推荐的时间多样性,避免产生重复的推荐,都是值得研究的问题.
3 总结和展望
在互联网迅猛发展的今天,各类信息的日益膨胀,信息过载问题愈来愈严重,推荐系统被认为是缓解此难题的最有效的方法之一.然而,现有的推荐算法仍然存在传统推荐方法中的特征提取、冷启动、过拟合、数据稀疏等问题,需要不断完善和解决.同时随着社交媒体的兴起,用户产生的内容也越来越丰富,必然使得用户获得有用数据的难度也越来越大.将推荐系统应用于处理社交媒体中的信息过载,近年来已经成为学术界和工业界的一个研究热点,取得许多研究成果,同时由于社交媒体具有自身的特点,也使得人们面临一些新的挑战,但也为未来的研究指明了更多的方向:
1)可扩展性问题.如何将线下的推荐算法推广到线上,使其能够处理好这些大量的动态数据.
2)用户隐私的保护.大量的用户数据被获取,可能让用户担心隐私问题,必须确保用户的数据不会被恶意用户利用.
3)推荐的多样性和奇异性(serendipity).用户往往希望获取更多类型的推荐,而在每次会话中可以获得不同的推荐,同时也希望得到一些意想不到的推荐.
4)跨领域推荐.推荐过程中容易遇到数据稀疏的问题,通过集成不同领域的数据,可以同时为用户提供更多领域、更加准确的推荐.
5)基于移动计算的推荐.采用移动设备,可以更好地感知用户的情境,可以根据用户的位置、时间等情境信息,提供更加个性化的推荐.
社交媒体发展到今天,所能利用的数据是海量的,但目前研究者提出的众多方法中,实际上被应用到大型系统发挥作用的却不多,而被应用最多的往往是最简单的技术,诚然这有部分原因是由于算法的可扩展性不够,但事实上更多的原因可能是研究者们仅仅将注意力放在了算法上,而忽视了数据这部分的考虑和研究.目前很少有研究分析过是否推荐中需要用到所有的数据,笔者认为对于一个用户而言,往往关心的是自己所处的小众,可能对于需求极其个性化的单个用户而言,需要的数据只是能够获得的海量数据中的极少的一部分;因此利用刚好足够的数据来进行推荐,也许会为提高各种推荐技术的实用性提供一条新的思路.
伴随着这些问题的逐渐解决,推荐系统必将在社交媒体中发挥更大的作用.笔者将该领域的研究进展和趋势进行归纳总结,非常希望能够提供一些有用的信息,以鼓励学者继续在该领域中开拓更多更深的研究.
[1]ROSA C D,HAVENS J C A,HAWK J,et al.Sharing,privacy and trust in our networked world[R/OL]. [2012-01-05].http://www.oclc.org/reports/sharing/default.htm.
[2]LIU Yuchao,ZHANG Haisu,MA Yutao,et al.Collective intelligence and uncertain knowledge representation in cloud computing[J].China Communications,2011,8(6):58-66.
[3]RICCI F,ROKACH L,SHAPIRA B.Introduction to recommender systems handbook[M]//Recommender Systems Handbook.New York,USA:Springer,2011:1-35.
[4]ADOMAVICIUS G,TUZHILIN A.Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(6):734-749.
[5]MOONEY R J,ROY L.Content-based book recommending using learning for text categorization[C]//Proceedings of 5th ACM Conference on Digital Libraries.San Antonio,USA,2002:195-204.
[6]BREESE J S,HECKERMAN D,KADIE C.Empirical analysis of predictive algorithms for collaborative filtering[C]//Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence.San Francisco,USA,1998:43-52.
[7]BURKE R.Knowledge-based recommender systems[J].Encyclopedia of Library and Information Systems,2000,69(32):180-200.
[8]BALABANOVIC M,SHOHAM Y.Fab:content-based,collaborative recommendation[J].Communications of the ACM,1997,40(3):66-72.
[9]SCHAFER J B,KONSTAN J,RIEDL J.Recommender systems in e-commerce[C]//Proceedings of the 1st ACM Conference on Electronic Commerce.Denver,USA,1999:158-166.
[10]YEHUDA K,BELL R.Advances in collaborative filtering[M]//RICCI F,ROKACH L,SHAPIRA B.Recommender Systems Handbook.New York,USA:Springer,2011:145-186.
[11]GUY I,CARMEL D.WWW 2011 tutorial on social recommender systems[EB/OL]. [2012-01-05].http://sysrun.haifa.il.ibm.com/hrl/srs2011/index.html.
[12]MARINHO L B,NANOPOULOS A,SCHMIDT-THIEME L,et al.Social tagging recommender systems[M]//RICCI F,ROKACH L,SHAPIRA B.Recommender Systems Handbook.New York,USA:Springer,2011:615-644.
[13]ZHANG Zike,ZHOU Tao,ZHANG Yicheng.Tag-aware recommender systems:a state-of-the-art survey[J].Journal of Computer Science and Technology,2011,26(5):767-777.
[14]GUY I,ZWERDLING N,RONEN I,et al.Social media recommendation based on people and tags[C]//Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.Geneva,Switzerland,2010:194-201.
[15]DOUGLAS E,LAMERE P,BERTIN-MAHIEUX T,et al.Automatic generation of social tags for music recommendation[C]//Proceedings of the Twenty-First Annual Conference on Neural Information Processing Systems.Vancouver,Canada,2007:241-250.
[16]SYMEONIDIS P,NANOPOULOS A,MANOLOPOULOS Y.Tag recommendations based on tensor dimensionality reduction[C]//Proceedings of the 2008 ACM Conference on Recommender Systems.Lausanne,Switzerland,2008:43-50.
[17]RENDLE S,MARINHO L B,NANOPOULOS A,et al.Learning optimal ranking with tensor factorization for tag recommendation[C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Paris,France,2009:727-736.
[18]ZLATIC V,GHOSHAL G,CALDARELLI G.Hypergraph topological quantities for tagged social networks[J].Physical Review E:Statistical, Nonlinear, and Soft Matter Physics,2009,80(3):036118-036126.
[19]MARINHO L B,SCHMIDT-THIEME L.Collaborative tag recommendations[C]//Proceedings of the 31st Annual Conference of the Gesellschaft fur Klassifikation(GfKl).Freiburg,Germany,2007:533-540.
[20]TSO-SUTTER K H L,MARINHO L B,SCHMIDT-THIEME L.Tag-aware recommender systems by fusion of collaborative filtering algorithms[C]//Proceedings of the 2008 ACM Symposium on Applied Computing.Fortaleza,Brazil,2008:1995-1999.
[21]XU Yanfei,ZHANG Liang,LIU Wei.Cubic analysis of social bookmarking for personalized recommendation[C]//Frontiers of WWW Research and Development:APWeb 2006,8th Asia-Pacific Web Conference.Harbin,China,2006:733-738.
[22]HOTHO A,JASCHKE R,SCHMITZ C,et al.Information retrieval in folksonomies:search and ranking[C]//Proceedings of the 3rd European Conference on The Semantic Web:Research and Applications.Budva,Montenegro,2006:411-426.
[23]SONG Yang,ZHUANG Ziming,LI Huajing,et al.Realtime automatic tag recommendation[C]//Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.Singapore,2008:515-522.
[24]ABBASI R,GRZEGORZEK M,STAAB S.Using colors as tags in folksonomies to improve image classification[C]//Proceedings of the Third International Conference on Semantics and Digital Media Technologies.Koblenz,Germany,2008:13-34.
[25]CELMA O.Music recommendation and discovery in the long tail[D].Barcelona,Spain:Universitat Pompeu Fabra,2008:45-60.
[26]ILLIG J,HOTHO A,JASCHKE R,et al.A comparison of content-based tag recommendations in folksonomy systems[C]//Proceedings of the International Conference on Knowledge Processing in Practice.Paris,France,2009:56-78.
[27]MCCARTHY J,ANAGNOST T.MusicFX:an arbiter of group preferences for computer supported collaborative workouts[C]//Proceedings of the ACM Conference on Computer Supported Cooperative Work.Seattle,USA,1998:363-372.
[28]O’CONNER M,COSLEY D,KONSTAN J A,et al.PolyLens:a recommender system for groups of users[C]//Proceedings of the European Conference on Computer-Supported CooperativeWork. Bonn, Germany,2001:199-218.
[29]ARDISSONO L,GOY A,PETRONE G,et al.Tailoring the recommendation of tourist information to heterogeneous user groups[M].Berlin,Germany:Springer-Verlag,2002:280-295.
[30]BALTRUNAS L,MAKCINSKAS T,RICCI F.Group recommendations with rank aggregation and collaborative filtering[C]//Proceedings of the 4th ACM Conference on Recommender Systems.Barcelona,Spain,2010:119-126.
[31]CANTADOR I,CASTELLS P.Extracting multilayered communities of interest from semantic user profiles:application to group modeling and hybrid recommendations[J].Computers in Human Behavior,2011,27(4):1321-1336.
[32]SENOT C,KOSTADINOV D,BOUZID M,et al.Analysis of strategies for building group profiles[C]//Proceedings of the 18th International Conference on User Modeling,Adaptation,and Personalization.Big Island,USA,2010:40-51.
[33]JAMESON A,SMYTH B.Recommendation to groups[M]//BRUSILOVSKY P,KOBSA A,NEJDL W.The Adaptive Web:Methods and Strategies of Web Personalization.Berlin/Heidelberg, Germany:Springer-Verlag,2007:596-627.
[34]MASTHOFF J.Group modeling:selecting a sequence of television items to suit a group of viewers[J].User Modeling and User-Adapted Interaction,2004,14(1):37-85.
[35]YU Zhiwen,ZHOU Xingshe,HAO Yanbin,et al.TV program recommendation for multiple viewers based on user profile merging[J].User Modeling and User-Adapted Interaction,2006,16(1):63-82.
[36]MASTHOFF J.Group recommender systems:combining individual models[M]//RICCI F,ROKACH L,SHAPIRA B.Recommender Systems Handbook.New York,USA:Springer,2011:677-702.
[37]SINHA R,SWEARINGEN K.Comparing recommendations made by online systems and friends[C]//Proceedings of the DELOS-NSF Workshop on Personalization and Recommender Systems in Digital Libraries.Dublin,Ireland,2001:34-54.
[38]VICTOR P,DE COCK M,CORNELIS C.Trust and recommendations[M]//RICCI F,ROKACH L,SHAPIRA B.Recommender Systems Handbook.New York,USA:Springer,2011:645-676.
[39]ARTZ D,GIL Y.A survey of trust in computer science and the semantic web[J].Journal of Web Semantics,2007,5(2):58-71.
[40]GOLBECK J.Computing with social trust[M].London,UK:Springer,2009:259-285.
[41]MCEVILY B,TORTORIELLO M.Measuring trust in organizational research:review and recommendations[J].Journal of Trust Research,2011,1(1):23-63.
[42]GOLBECK J,MANNES A.Using trust and provenance for content filtering on the semantic web[C]//Proceedings of the Workshop on Models of Trust for the Web.Edinburgh,UK,2006:23-35.
[43]MASSA P,AVESANI P.Trust metrics on controversial users:balancing between tyranny of the majority and echo chambers[J].International Journal on Semantic Web and Information Systems,2007,3(1):39-64.
[44]O’DONOVAN J,SMYTH B.Trust in recommender systems[C]//Proceedings of the 10th International Conference on Intelligent User Interfaces.San Diego,USA,2005:167-174.
[45]MA Hao,KING I,LYU M R.Learning to recommend with explicit and implicit social relations[J].ACM Transactions on Intelligent Systems and Technology,2011,2(3):29-46.
[46]KOREN Y.Collaborative filtering with temporal dynamics[C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Paris,France,2009:447-456.
[47]DROR G,KOENIGSTEIN N,KOREN Y.Yahoo!Music recommendations:modeling music ratings with temporal dynamics and item taxonomy[C]//Proceedings of the Fifth ACM Conference on Recommender Systems.Chicago,USA,2011:19-26.
[48]XIANG Liang,YUAN Quan,ZHAO Shiwan,et al.Temporal recommendation on graphs via long- and short-term preference fusion[C]//Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Washington,DC,USA,2010:723-732.
[49]LATHIA N,HAILES S,CAPRA L,et al.Temporal diversity in recommender systems[C]//Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.Geneva,Switzerland,2010:210-217.
黄立威,男,1985年生,博士研究生,主要研究方向为社会网络分析、推荐系统等.
李德毅,男,1944年生,研究员,博士生导师,中国工程院院士,国际欧亚科学院院士,国家和全军信息化专家咨询委员会委员,中国人工智能学会理事长,中国电子学会副理事长,中国电子学会云计算专家委员会主任委员.主要研究方向为计算机工程、人工智能和指挥自动化.先后获得国家科技进步奖等奖项17项、国家发明专利7项,曾被授予国家首届优秀回国留学人员、国家有突出贡献的中青年专家,2005年获得何梁何利奖基金科学与技术进步奖,2006年获得中国人民解放军专业技术重大贡献奖.发表学术论文百余篇,出版专著5部、英文专著3部,主编技术丛书7种.
A review of information recommendation in social media
HUANG Liwei1,LI Deyi2
(1.Institute of Automatic Commanding,PLA University of Science and Technology,Nanjing 210007,China;2.Institute of Electronic System Equipment Engineering,Beijing 100141,China)
Social media has become tremendously popular in recent years,and much rich information can be derived from it.However,the massive amount results in a serious“information overload”problem.As one of the most effective methods to ease the“information overload”problem,recommender systems play an important role in social media.Social media contains a large amount of user-generated content.Through the aggregation of all types of new data,metadata,and clear relationships between users and by combining the traditional method of personalized recommendations,a variety of new technologies emerge in recommender systems.This paper summarizes several key research areas in social recommender systems,including recommendations based on social tagging and group recommendations,as well as the recommendations based on trust.It then introduces several temporal aspects that affect social recommender systems,and finally proposes that the research difficulty be tackled while laying out the expectations for future development trends in the information recommendation system in social media.
information recommendation;information overload;recommendation systems;social media
TP391
A
1673-4785(2012)01-0001-08
10.3969/j.issn.1673-4785.201201004
http://www.cnki.net/kcms/detail/23.1538.TP.20120218.1622.002.html
2012-01-10. 网络出版时间:2012-02-18.
国家自然科学基金资助项目(61035004).
黄立威.E-mail:huangliwei.1985@gmail.com.