APP下载

社交网络用户行为挖掘研究进展与展望

2016-07-20费洪晓伍泽全刘一环莫天池李靖

计算技术与自动化 2016年2期
关键词:用户行为社交网络数据挖掘

费洪晓 伍泽全 刘一环 莫天池 李靖

摘 要:随着信息技术飞速发展,社交网络逐渐占领了人们日常交往、娱乐和购物等主要平台。因此,大量围绕社交网络展开的研究也变得非常热门.现有的围绕社交网络用户行为展开的研究热点主要有:基于社交网络用户行为的用户影响力研究、基于用户行为的推荐系统研究、以及社交网络用户隐私方面的研究等。社交网络是互联网的主要组成模块之一,同时也是大数据时代的主要数据提供者之一,未来对于社交网络的研究会越来越受到学术界以及工业界的更多投入,本文对社交网络用户行为挖掘的研究现状、热点展开论述,并作出展望,提出一些目前尚缺深入研究的方向,以期对读者有所帮助。

关键词:社交网络;数据挖掘;用户行为

中图分类号:TP311.5 文献标识码:A

1 引 言

建立在英特网基础之上的社交网络自诞生之日发展至今,已经逐渐变成人们情感交流、关系维护和信息沟通的主要平台和方式。活跃在各社交网站上的用户每时每刻都在产生着大量的数据,在数据就是财富的今天,社交网络已经成为学术界工业界的重点研究对象,目前对社交网络的研究与利用已经非常火热,比如用户分析,关系分析,社交搜索,网络结构、用户隐私等等方面,其中对于用户的研究是非常重要的一个方向,探索人类的行为规律一直是科学家们执着的追求,发现人的规律的重要性也是不言而喻,对于社交网络中人的行为的研究当然也包括在那当中[1]。本文以社交网络中的用户行为基本出发点,对在此基础上进行的挖掘研究进行学习及分析,从而对挖掘研究进行综述和展望。

2 社交网络用户行为挖掘研究现状和研究热点

2.1 基于社交网络用户行为的用户影响力研究

跟现实生活中一样,领袖的发言权往往比常人大的多,社交网络对于舆论的影响力通常也有意见领袖,其可波及的力量不可轻视。怎样去挖掘意见领袖、对社交网络的用户影响强度和单独一个用户的影响力进行分析,使用意见领袖来积极地将社会舆论引出,将新形势下的那些舆情信息所具有的分析能力进行提高,同时,也可以很迅速且准确地掌握一些社会的舆情动态,成为了社交网络正在面临的一个严肃课题和严峻的挑战。在诸如:信息学、经济学、政治学和社会学各领域里面,影响力分析被认为是一种广泛应用的研究技术。例如:推广产品和选举政治时有着重要的作用。影响力的个体一般包含了以下四个主要的特性:①容易将在自己的观点传达给其他人;②代表大多数普通人的观点;③具有新颖的观点;④也被称为舆论领袖(opinion leaders)、扩散创新理论的革新者(innovators)、网络中心(hubs)、网络桥节点(connectors)、专家(mavens)等。社会影响力(social influence)指的是,个人行为可以直接或者间接地去影响到其他人的行为、思想和情感。在文献[2]中给出了社交网络影响力(influence)的定义,其大概地意义是指的用户的行为因受到其他用户的影响而发生了变化,在社交网络中影响力是一种常见的现象。

我们可以把影响力的强度看做是用户之间一种相互影响的能力大小,以往我们在度量影响力强度的时候往往仅将两个网络节点的共同邻居个数纳入考虑,然后,考虑到网络中个体行为与话题的各种特征,主要使用了统计学和机器学习的方法来计算个体的影响强度(各类别话题之间)。统计学和机器学习的方法主要是以用户之间的互相影响力为基础,假设用户之间的影响力是一个隐形变量,并且通过一些数学迭代方法来建立学习模型求解该隐形变量。但是该方法忽略了个体之间如果相隔的时间间隔等特性,如相似性高的不同个体之间一般是有较高的影响力,个体之间具有的时间间隔如果越短,那么影响强度就越大。以下是对个体影响力的计算技术研究进行了一个比较详细的介绍。

目前计算社交网络用户影响力强度的算法大多都是以PageRank算法思想为核心。PageRank算法是一种基于马尔科夫的思想模拟用户怎样浏览网页的各种行为,计算的式子如式2-1所示,其中,M是网络转移的矩阵,为网络中各节点影响力的得分向量,e为自重启的向量,α为跳转的一个因子 。

ε=αMTε+(1-α)1ne,e=(1,1,…,1)T(2-1)

PageRank算法主要还是考虑到节点传播的影响力,须要不断地进行迭代计算,但是,它却忽视了各节点所存在的自身的特征,用户的各行为在社交网络中往往相互交织,尤其是当用户的数量变得非常巨大的时候,这个时候整体的复杂度就变的相当之高,在对社交网络的各用户影响力的研究时,考虑到了用户个体之间的不同特征,于是便改进了公式2-1得到如下公式2-2:

ε=αMTε+(1-α)r(2-2)

经过改进,个性化向量r取代了自重启向量e,r的含义是用户对话题类型的各种偏好的程度、信息的敏感程度以及新颖程度等。Hui等人[5]在分析社交网络数据时考虑到用户自身的属性,认为信誉较高的用户其影响力相对而言较高。Cai等人在分析微博数据时将用户的不同兴趣领域纳入考虑,表示在不同的兴趣领域里面,用户所具有的影响力的强度也不一样[3]。Crandal等人通过分析用户的行为,研究了用户属性里面个体之间影响力的关系。 Agarwal等人在分析博客数据的时候主要考虑了四种不同的因素:知名度、活跃度、新颖度和表达能力来计算个体之间的影响力。

有研究者认为不同话题类型中的个体往往有着不同的影响力,他们从该点切入,结合PageRank算法思想,研究了各话题层面上的个体影响力,其中的典型代表是Weng[8]等人提出的TwitterRank算法,该算法也以Twitter网站的真实数据集为基础,根据网络关注情况以及用户之间的兴趣相似度来算出不同个体在各个话题之上所具有的影响力。Li[9]等人通过使用统计学习方法,将微博上的一些历史信息以及社交记录经过分析处理建立历史意见影响力模型,同时将话题因素以及社会影响力相结合。此外,部分研究者考虑到个体信息的网络结构以及新颖度,给出了基于新颖度发现个体影响力的算法,特别是Song[10]等人提出了InfluenceRank算法,该算法在处理微博数据集时,非常巧妙地将文章内容的新颖度对社交网络的贡献加入到分析考虑范围,来辨别博客中的那些意见领袖。Ding[11]等人就微博多交互的这种特性,提出了基于多重关系网络的一种随机模型来计算每个微博用户的影响力。endprint

个体特征与网络结构相综合后的计算技术提高了个体影响力度量的精准度,然而却忽略了一个比较重要的特性,那就是网络的多重关系,例如:微博上的用户之间的交互通常不是单一的,而是多重关系相互交织,网络的多关系性是个体影响力度量研究未来有待攻克的难点。

2.2 基于用户行为推荐系统研究

在如今的大数据时代,庞大的数据量使得数据的稀疏性加剧继而使得传统推荐系统决策过程的缺陷愈加明显,然而基于社交网络的推荐决策,其推荐邻居是社会信任网络的中的好友不再只是从用户-商品评分矩阵获取;社交网络中的信任关心能够体现出用户之间的兴趣相似度与影响能力,用户能够选择信任邻居,使得推荐过程不较传统推荐过程更为透明一些;基于社交网络的推荐鲁棒性更好,因为在社交推荐中假如用户的好友中没有恶意用户,那么推荐结果不会受恶意用户的虚假评价影响;基于社交网络的推荐系统中的用户好友都是用户主动选择的,这使得时间复杂度与系统用户数和项目数成正比的协同过滤算法可伸缩性变的更好。

基于用户行为的推荐系统大多是以协同过滤算法为基础,使用协同过滤算法向用户进行推荐的时候将用户的行为历史作为分析对象,得到用户的行为习惯,这样作出的推荐结果非常迎合用户的个性,因此非常受用户的欢迎。

用户的历史行为包括:评论,转发,浏览,收藏等。各行为都在某种程度上反映了用户对于不同信息的感兴趣度。例如:用户搜索某个产品对比在网站上浏览该产品所表现出来的感兴趣度要大的多。协同过滤算法正是从用户的行为历史中挖掘出所隐含的用户兴趣从而向用户推送提供个性化的推荐结果,到现在为止协同过滤算法是应用最为广泛的算法。现有的基于协同过滤的推荐技术主要有组合推荐技术,全局数值协同推荐技术以及基于模型的推荐技术[10]。

基于模型的推荐算法:该算法的主要通过建立一些基础模型来预测用户的喜好。经典的基于模型的推荐算法有:基于奇异值分解的推荐算法,基于聚类的推荐算法以及基于贝叶斯网络的推荐算法。基于模型的推荐算法最大的优点就是可以通过训练数据集来解决数据稀疏性问题。

组合推荐算法:组合推荐算法,顾名思义是组合了多种推荐算法,将各组合的算法的有点集中到一起,提高了推荐精准度,该算法解决了使用推荐算法单一问题。[15]。例如:将协同过滤算法跟基于内容的推荐算法的两个推荐结果按照一定股则组合,这样使得协同过滤算法中经常出弦的冷启动现象得到了很好的解决。

全局数值协同过滤推荐算法:该算法主要分为两大类别:基于项目相似度的item-based推荐算法与基于用户相似度的user-based推荐算法。在实际应用环境中,协同过滤算法由于推荐精准度较好,算法实现难度较小,受到了广泛应用。同所有其他推荐算法一样,协同过滤算法同样存在一些问题,如扩展性问题,稀疏性问题以及冷启动问题[10]。

下面对冷启动问题以及扩展性问题作出解释。

冷启动问题:推荐算法对于第一次使用系统或者新加到系统中的项目,新项目、新用户没有任何使用痕迹或者行为历史,推荐系统无法获得用户的兴趣从而无法向其进行推荐或者将新项目推荐给用户。解决此类问题最常用的方法是向新用户推荐top-N集合,对于新加入的项目则可以计算项目间的相似度,从而向用户推荐与其感兴趣项目最相似的项目集合[10]。

扩展性问题:随着系统中的用户数量和服务数量的增加,用户间相似度、服务间相似度的计算复杂度会变得非常大,以及用户对服务预测评分过程的计算复杂度也会随着用户数、五服务数增大而增大。推荐系统无法及时地计算出推荐结果。此类问题的最常用解决方法是并化改进推荐算法,同时利用服务器集群的运算与存储能力来减少算法训练时间[10]。

对于现有的推荐算法而言,提高算法的训练效率,降低对用户相似度的计算复杂度始终是难以攻克的研究点,未来相关研究可以围绕这些问题展开。

2.3 基于用户位置的社交网络研究

基于用户位置的社交网络(LBSN)的定义[13]为:将用户的位置信息添加到当前的社交网络中,使社会结构的所有人员都能够共享添加的位置信息,位置信息的添加能够引申出一种新型的社会结构,这种新型结构是建立在物理世界之上的,其能够从用户的位置中得到相关性。物理位置由某时的即时位置和某段时间内的历史位置轨迹组成。社交网络中的用户,其相关性从如理位置中得出,如用户同时共享同一物理位置信息;用户拥有同一历史位置;从历史位置信息或位置标识中挖掘中用户相同的爱好、活动等。

在基于用户位置的社交网络中有两个主要成员:用户和位置,这两者之间存在相关性。在物理世界中,当用户在社交网络中共享位置信息时就会留下历史位置和相对物理位置的标识,当将这些共享的历史位置按照时间的先后顺序进行一一连接,这样就能够得到用户的历史轨迹。基于这些轨迹,能够建立三个图:将用户的所有历史位置信息进行连接得到位置--位置图;将用户信息和用户共享的历史位置信息进行连接能够得到用户--位置图;将社交网络中的所有用户和其位置进行连接,通过用户和位置间的关系得到用户--用户图。基于用户位置的社交网络三种图形如图1所示,其是研究的主要依据[9]。

图1 LBSN研究原理

目前,LBSN的研究分为:基于LBSN的服务和基于LBSN的应用。

基于LBSN的服务主要分为三类[11]:

1.由媒体内容表示位置信息

在这类网络中,通过从用户上传到网络服务上带有地理位置标记的媒体内容中直接提取带位置信息,如从带有地理标记的图片获取位置信息。从用户的上传的媒体信息中能够得到用户的物理位置和时间信息,根据这两种信息可以推出用户的社会结构,从而为用户提供帮助,如添加好友。在媒体内容表示位置信息的网络中,媒体中所包含的位置信息仅仅是其内容的组成部分,用户间的相关性不能用其中的位置信息代表,而应该用媒体本身。endprint

2.由位置点表示位置信息

用户通过签到的方式在网络中向系统发送自己的物理位置。在社交网络中,通过用户在指定地点签到的实时物理位置信息,得到签到点周边的用户,通过周边的用户来进行一些列的社会活动。与此同时,用户对所签到地点的评价,一方面能够给其他访问该位置点的用户提供参考,另一方面,商家可以通过用户的评论得到市场的反馈情况从而改善自身经营。在用位置点表示位置信息的网络中,用户间的相关性的数据支持由签到信息中的位置和时间数据提供。

3.由轨迹表示位置信息。

在这类网络中,通过手机或其它智能终端获取用户的物理位置信息,将物理位置信息中的位置和时间数据进行连接来形成用户的轨迹,用户的历史轨迹能够很好的记录其活动的路径,在重视位置点的基础上,将位置点按时间进行连接得出重要的详细路径信息。用户的轨迹信息在记录其活动的详细路径的同时还记录了其它的重要信息,如活动的平均速度、完成时间、活动距离等;再者,通过用户的轨迹信息也可以得到用户的经验。在有轨迹表示位置信息的网络中,用户间的相关性由轨迹中的信息体现。

基于LBSN的应用主要分为两大类:

1.基于用户的应用

从用户的层面,在综合考虑用户的相似性、隐私和行为等因素后,基于用户的应用可以由以下5种组成:

1)好友推荐。通过对用户相似性的比较,相似性较高的用户间最可能存在共同的爱好,这样就能够给用户进行好友推荐。将用户的地理位置轨迹进行相应的整理,用层次结构对用户行为进行描述,其中,每个用户的层次结构都是唯一的。用户间相似性的高低通过用户的唯一层次图进行表示,通过不同用户的层次图来衡量用户之间的相似性高低。

2)专家发现。用户针对不同的地理位置拥有不同的熟悉程度,专家是针对特定的区域非常熟悉的用户,专家可根据其了解的知识为用户提供帮助。在HITS(Hypertext Induced Topic Search)模型中,先用特定的结构来表达用户的位置信息,然后将用户和位置一一对应为hub节点和authority节点,推算出用户经验值高低,经验值高者为专家,系统可向其他用户进行专家推荐[16]。

3)群体挖掘。用户的相似性通过其地理位置信进行比较,从而可以将相似性高的用户分为不同的团体,这样就能够将具有相同兴趣爱好的用户聚集到一起参加群体活动,如同一小区的用户参加社区活动[15]。

4)隐私保护。在基于位置的社交网络中,用户的个人信息和其上传的位置信息中包潜藏着很大的商机,然而潜在的商机会因为用户对隐私的保密的流失。商家在用户提供信息的同时,给出信息共享带来的综合评估分析,方便用户根据分析结果决定信息是否公开。

5)行为分析。用户行为具有规律性。生活模式能够代表用户日常生活方式和行动规律,用其标准范式定义能够被挖掘的生活规律,并根据用户的生活规律提出行为挖掘的工作框架,这个框架能够帮助用户从海量的原始数据中挖掘出用户的生活行为。

2.基于位置的应用

从位置的层面,在综合考虑用户相似性、位置相关性和位置的种类后,基于位置的应用可以由以下7种组成:

1)路径发现。考虑位置采集设备、环境等因素,相邻采集点间的轨迹是不确定的。从所有的可能轨迹的挖掘出相邻采集点间概率最大轨迹。根据“不确定性+不确定性=确定性”,根据用户的查询条件,从路由图中挖掘出最优的几条路径反馈给用户[18]。

2)商店位置选择。在基于位置信息的社交网络中,根据用户的位置信息能够得到用户相似度和位置的流行度。首先,将所有问题进行形式化的定义,然后,根据需要从各种角度对商店的位置进行合理的预测,如密度、竞争、区域及其流行性等。

3)区域功能发现。城市的主干道可以将其划分为不同的区域,不同的区域中的用户具有不同的位置轨迹和兴趣爱好,利用主题模型能够能够快速的得出区域的功能[19]。

4)位置和路径推荐。在指定的区域中,利用HITS模型能够推导出不同位置的流行度,然后将区域中流行度高的几个位置推荐给用户。在流程路径的推荐中,将位置流行度分配到相连的不同路径上,综合考虑每条路径上用户的访问数量和经验值,推导出路径流行度最高的路径,然后将其推荐给用户。

5)行程规划。首先,用户给出行程的起始位置和时间要求,然后在满足客户所有要求的前提下挖掘出有趣的位置路径,综合考虑有趣位置数量、有趣位置所需时间、整个行程所需时间和路径流行度等因素,最后挖掘出其最优的行程推荐给用户[18]。

6)个性化位置推荐。利用HITS模型挖掘出每种类型中经验值较高的专家。根据用户的兴趣向其推荐相对应专家评价较高的位置。

7)位置活动推荐。在用户的指定位置,为用户推荐相应位置上的流行活动;同样,当用户指定活动时,为用户推荐相应活动的流行位置以及到达该位置的最优路径[21]。建立在协同过滤基础上的协同矩阵分解能够完成此推荐,首先,根据位置和种类间的关系形成对应矩阵,根据活动间的关系形成对应矩阵,然后,根据通过完善位置-活动矩阵中的缺失项来完成位置活动的推荐。

现如今,市面上已经拥有了一部分路径推荐的应用,然而这些应用并没有考虑不同用户的个性化,其对所有的用户推荐的结果都是一致的。怎样将用户的个性化考虑到应用的推荐中,是应用能够根据用户的个性化挖掘出匹配用户个性化的最优路径,该研究方向必将是LBSN中的研究热点。

2.4 其他相关研究

随着中国的不断发展,人们对于个人网络隐私保护意识也变的越来越强,社交网站通过分析用户的行为来为用户提供更为贴切个性化的服务,但与此同时用户的一些隐私也不可避免的在无形之中被泄露了,对于社交网络用户隐私的研究也是一热门研究方向,并且未来会越来越得到人们的关注。基于社交网络的营销自社交网络诞生的那天起一直以来都是研究热点,随着大数据时代的到来,传统的网络营销模式已经跟不上时代的需求,未来社交平台的营销研究会一直是主流研究方向。此外,随着智能终端的快速,如今人们对于互联网的接触越来越容易,动动手指就能上网,对于心智尚未发育健全的儿童来说,社交平台上的很多信息是不利的甚至是有害的,未来如何管理好社交网络中的低龄用户是值得研究的。endprint

3 社交网络用户行为挖掘前景展望

针对社交网络用户行为挖掘的研究,经过众多国内外前辈的努力研究,已经取得了不菲的成果,但在理论方面,还有很多需要学习和突破的地方,可以从以下几个方面进行进一步的学习和研究。

1.用户行为监管。行为一致性研究,研究用户的线上线下行为;群体行为的研究,研究用户间行为的影响及其发生的“蝴蝶效应”;行为动机研究,以负面信息为出发点,研究恶意中伤、谣言等行为动机;政府监管政策的研究,从政府出台的法律法规和各项措施为出发点,研究其效果及其对社交网络的影响。

2.专业性、移动性社交网络的研究。目前,社交网络的研究以综合性的社交网络为主要研究对象,而专业性、移动性的社交网络研究却不太成熟,在未来的研究中应该以此为方向进行重点研究,如专业性、移动性社交网络与传统社交网络的区别;用户的使用动机;用户关注的焦点;用户的行为模式等。在研究的内容方面,现今较关注娱乐及舆论信息的研究,而对其服务和商业方面的研究缺很少,这也必将是未来研究的一个热点。

3.情感分析。情感分析,顾名思义,就是分析用户的情感,也常被称作观点挖掘。总结社交网络的特点是:使用的方便性,实时性,用户低门槛性,用户不需要有专门的写作技能就能发表博文,并且用户所发的内容通常都是一些生活的记录,非常真实地反应了用户的日常生活,用户大量的生活记录就能把社会状态反映出来,从而从海量的用户数据中分析用户情感挖掘有价值信息具有非常大的意义。比如,可以通过分析网名的情感进行舆情监控,为管理者引导舆论提供了非常有效的方法;通过分析网民所发博文预测当前热点事件,可以为政府的决策提供支持;对购物网站上的用户评论进行挖掘分析,能够为其他用户的决策提供帮助,为商家收集反馈信息、监督市场提供帮助。国内对于社交网络用户的情感分析研究起步比较晚以及资源的限制,系统的分析效率、精准度的提高还有待提高,未来还有许多研究工作要做。

4.社交网络事件预测。该研究对于媒体或者党政有关部门非常有帮助,可以加强对突发的一些需要得到控制的时间在第一时间得到控制、监管改变“事后处理”状态,针对可能出现的突发事件制定应急预案,增强事件的处理能力和主动性。微博事件预测在发展事件预测、管理等方面依然是当前的重点研究方向,尤其是预测的准确度以及预测结果的改善方面有待进一步提升。

5.社交搜索。搜索引擎的发展阶段大致可以分为三个大的阶段。第一个阶段:图书馆、站内搜索阶段,搜索方式为文字匹配,特点是速度慢、精确度低。第二个阶段:网页搜索阶段,搜索方式为网页间的关系,典型代表有Google、Baidu、Yahoo。如今,第三个阶段:社交搜索阶段,搜索方式在考虑网页间的关系的同时考虑人的因素,特点是搜索具有针对性、计算能力强、结果准确。对于以往的搜索,搜索引擎对于输入的相同关键字在不同浏览器上,不同的时间,反馈的搜索结果都是一样的,然而社交搜索中,搜索引擎能够根据搜索者的社交网络数据给出一个最合适的结果,就是说不同的人通过社交搜索引擎输入相同的关键字能够得到不一样的、最适合个人的搜索结果。在社交搜索中,用户的社交数据是搜索的数据支撑,但是当前的社交网络中的数据是保密的,最终导致搜索引擎和社交网络的隔离,信息孤岛的出现。在未来的发展中,由于技术的发展、用户的需要,社交网络的数据必将和搜索引擎数据必将相互融,量大技术的融合建立在互联网之上必将成为未来互联网的发展趋势。现阶段,基于社交网络的搜索引擎理论和技术都处于不成熟的阶段,还需要大量的学者去学习研究 [22]。

6.大数据环境下的用户行为挖掘:国内外研究单位开展了相当数量的大数据和社交网络应用系统的研究,但总体而言,很多算法由于不具有动态性而无法适应较大规模的数据量,怎样改进算法使之适应当前的大数据环境仍旧是一个重要任务。同时,缺少对社交数据进行科学管理和有效管理的使用系统也是我们面临的一个巨大问题。

5 结束语

本文从不同的角度对社交网络用户行为的用户影响力、推荐系统和不同用户位置的社交网络的研究进行学习并综述,提出了未来社交网络用户行为挖掘的研究方向。

社交网络用户行为的挖掘研究在理论和实践上都具有重大的意义,在未来的发展中不同学科、不同领域、不同组织和交叉研究以及应用必将是未来研究的热点和方向。

参考文献

[1] 杨善林; 王佳佳; 代宝,等.在线社交网络用户行为研究现状与展望[J].中国科学院,2015,(2):20-26.

[2] AGGARWAL C C.Social Network Data Analytics [M].New York:Springer,2012.

[3] CAI Y,CHEN Y.Minig influential bloggers:From general to domain specific [C]//Proc of the 13th International Conference on KnowledgeBased and Intelligence Information &Engineering Systems.Berlin:Springer,2009:447-454

[4] YAN Q,WU L, ZHENG L. Social network based microblog user behavior analysis[J].Physica A: Statistical Mechanics and Its Applications, 2013, 392(7): 1712-1723.

[5] HUI P,GREGORY M. Quantifying sentiment and influence in blogspaces[C]//Proc og the 1st Workshop on Social Media Analytics New York,NY:ACM,2010:53-61.endprint

[6] ZHOU T,LI H. Understanding mobile SNS continuance usage in China from the perspectives of social influence and privacy concern[J].Computers in Human Behavior, 2014, 37(3): 283-289.

[7] SHRIVER S K, NAIR H S, HOFSTETTER R. Social ties and usergenerated content: evidence from an online social network[J].Management Science, 2013, 59(6): 1425-1443.

[8] WENG J,LIM E P,JIANG JMET al.TitterRank:Finding topicsensitive influential twitters[C]//the 3rd ACM International Conference on Web Search and Data Mining(WSDM10).New York,USA,February 2010:261-270.

[9] LI D,SHUAI X,SUN G,et al.Mining topiclevel opinion influence in microblog [C]//the 21st ACM International Conference on Information and Knowledge Management(CIKM12).Maui,USA,October 2012:1562-1566.

[10]SONG X,YUN C,et al.Identifying opinion leaders in the blogosphere[C].the 16th ACM International Conference on Information and Knowledge Management(CIKM'07).LIsboa,Portugal,November,2007:971-974.

[11]DING Z Y,JIA Y,et al.An influence strength measurement viatimeaware probabilistic generative model for microblogs[C].the 15th AsiaPacific Web Conference.Sydney,Australia,April,2013.

[12]刘旭东,葛俊杰,陈德人.一种基于聚类和协同过滤的组合推荐算法[J].计算机科学与工程.2010.12:23-26.

[13]YU ZHENG.Locationbased social networks:Users[M].Springer press,2011

[14]ZHENG Y,ZHANG L,XIE X,et al. Mining interesting locations and travel sequences from gps trajectories [C]//Proceedings of the 18th International Conference on World wide web,WWW09,ACM,New York,NY,USA,2009,791-800.

[15]LIAO L,JIANG J,DING Y et al.Lifetime lexical variation in social media[C]//proceedings of the 28th AAAI conference on artificial intelligence,F, 2014.

[16]BAO J,ZHENG Y,MOKBEL M. Locationbased and preferenceaware recommendation using sparse geosocial networking data[C]// 20th ACM SIGSPATIAL International Conference on Advances in GIS.Redondo Beach,California,2012.

[17]HUNG C C,CHANG C W,PENG W C.Mining trajectory profiles for discovering user communities [C]//Proceedings of the 2009 International Workshop on Location Based Social Networks,LBSN09,ACM,New York,NY,USA,2009:1-8.

[18]LIU H,WEILY,ZHENG Y,et al.Route discovery form mining uncertain trajectories[C]//ICDM,2011.

[19]YUAN J,ZHENG Y,XING X.Discovery regions of different functions in a city using human mobility and pois[C]//KDD,2012.

[20]YOON H,ZHENG Y,XIE ,et al.Social itinerary recommendation from usergenerated digital trails[J]. Personal and Ubiquitous Computing,2011.

[21]ZHENG V W,ZHENG Y,XIE X,et al.Collaborative location and activity recommendations with gps history data [C]//Proceedings of the 19th International Conference on World wide web,WWW10,ACM,New York,NY,USA,2010:1029-1038.

[22]费洪晓,莫天池,秦启飞.社交网络相关机制应用于搜索引擎的研究综述[J]. 计算机技术与自动化.2014(01).endprint

猜你喜欢

用户行为社交网络数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
电力高校图书馆转型智库服务的研究
社会化媒体用户使用动机与行为探析
社交网络自拍文化的心理解读
基于R的医学大数据挖掘系统研究
基于用户行为分析的智能家居系统的研究与设计
一本面向中高级读者的数据挖掘好书