APP下载

微博用户及消息的影响力研究与建模

2016-07-02简国明李冬梅李少勇周碧江

关键词:影响因子微博权重

简国明,李冬梅,李少勇,周碧江

(韶关学院数学与统计学院,广东韶关512005)



微博用户及消息的影响力研究与建模

简国明,李冬梅,李少勇,周碧江

(韶关学院数学与统计学院,广东韶关512005)

摘要:考虑某微博群体中的微博用户及微博消息影响力问题,以微博用户为顶点,建立了用户关注关系的顶点赋权有向图模型;通过讨论用户的粉丝数、入邻点集的关注强度、发布或转发消息数等因素,定义了大V的各影响因子,并利用层次分析法中确定权向量的办法,得到了微博用户影响力模型;讨论了微博消息被转的用户总影响力、消息被发布或转发用户数和消息被浏览次数等影响因素,通过消息影响力权重向量的确定,得到了微博消息影响力模型;对南京师范大学2014年数学建模竞赛题的实例数据进行了验证与求解,得到了微博用户影响力最大的十个大V及最具影响力的前十则消息。

关键词:微博;影响因子;权重;用户影响力;消息影响力

1 问题提出

微博,作为一个新的传播交流平台,以其简单快捷的操作方式、随时随地发布信息的互动形式,在各类网络社交服务中独树一帜,在新闻传播、信息交流、用户行为分析等领域都具有广阔的应用前景。考虑某微博有N个(如N=10 000)用户群体,已知每个用户关注其他用户的关注数据;同时已知每个用户发布或转发的具体消息数据,消息总数为M个(如M=500)[1-3]。

在微博群体中,有些用户受到的关注度很高,被称为大V,这些大V发的微博受到的关注和转发远高于一般的微博,因此,大V的影响力很大。试对大V用户定义合适的影响因子,并且找出用户影响力最大的10个大V;某些微博消息,被大量的用户关注和转发,因而具有很大的影响,试找出前10个最具有影响力的消息。

2 微博用户及消息的图论模型

对于有N个用户的微博群体,以每个微博用户作为顶点,若微博用户A关注微博用户B,则A到B连一条有向边,得到一个有向图D(V,E),其中V是顶点集,E是有向边集。此有向图D(V,E)是微博用户群体的关注(关系)有向图。顶点A的出度d+(A)就是对应用户A的关注数,而顶点B的入度d-(B)就是对应用户B的被关注数[4]。将每个微博用户发布或转发消息数视为顶点的权,从而得到顶点赋权有向图,如图1所示。

图1 顶点赋权有向图D(V,E)

3 微博用户的影响因子及影响力模型

假设:s(i)为用户i发布或转发消息数;Q(i)为用户i的粉丝集合(即顶点的入邻点集)。由于微博用户i的影响力与该用户的粉丝数、入邻点集的关注强度、发布或转发消息数有关,则定义如下微博用户i的各影响因子(也是大V的影响因子)。

这里各影响因子均采取与该量的各用户之和进行比较,也就相当于各影响因子进行总量归一化,P1(i)≤1,P2(i)≤1,P3(i)≤1。

现定义微博用户i的影响力模型为

其中λ1≥0,λ2≥0,λ3≥0,λ1+λ2+λ3=1。权重因子λ1,λ2,λ3可采用层次分析法中确定权向量的办法进行。通过将用户的粉丝数、入邻点集的关注强度、发布或转发消息数等三个因素两两比较,得到如下成对比较矩阵A[5]

运用Matlab编程[6],求A的最大特征根及对应的特征向量,经计算此处成对比较矩阵A具有一致性,得到三个影响因素对用户i的影响力权重向量值为

4 微博消息的影响力模型

在微博群体中某些消息被大量的用户关注和转发,因而具有很大的影响,即消息被转发或关注越多,其影响力就越大,消息的影响力与转发数和消息被浏览的次数相关。其次,发布或者转发消息的用户的自身影响力也对消息的影响力存在一定的影响。微博消息的影响力与微博消息被转的用户总影响力、消息被发布或转发用户数和消息被浏览次数等有关。

其中η1≥0,η2≥0,η3≥0,η1+η2+η3=1。这里采用层次分析法中确定权向量的办法进行,通过将微博消息被转的用户总影响力、消息被发布或转发用户数和消息被浏览次数等三个因素两两比较,得到如下成对比较矩阵B

运用编程Matlab,求B的最大特征根及对应的特征向量,经计算此处成对比较矩阵B具有一致性,得到三个影响因素对微博消息i的影响力权重向量值为

5 实例验证与求解

5.1数据处理

本文采用南京师范大学2014年数学建模竞赛题的相关数据,数据文件data1.xls包含了10 000个用户的相互关注数据,每一行为该行号对应的用户对其他用户的关注信息;数据文件data2.xls为500条消息数据,每一行为用户发布或转发的消息编号。

5.2求解结果

在各个用户间短时间内没有添加新的关注和取消旧的关注以及用户间不存在虚假粉丝(指花钱就可以买到“关注”,有名无实的微博粉丝,它们通常是由系统自动产生的恶意注册用户)的情况下,分别利用多因素加权算法对收集到的各微博用户进行影响力计算,最终得到微博用户的影响力排名结果,如表1所示。

表1 影响力排名前十的用户

在不考虑多次转发情况以及一个用户发布或转发微博消息,其粉丝一定能看到的情况下,通过对收集到各微博消息进行处理,根据上述的公式,求解得到各消息的影响力,影响力排名前十的消息编号如表2所示。

表2 影响力排名前十的消息编号

由于本文所研究的问题涉及数据很大,数量级上有较大差异,因此在数据预处理方面,都先将数据进行了总量归一化、最大值归一化,从而尽可能减少数量级差异大对结果产生的影响,使数据更具可信性;本文定义了影响因子,在公众人物建立公众形象以及如何提升个人影响力方面起了一定的作用,对社会的稳定发展也起了一定的作用;针对微博用户影响力、消息影响力等问题,考虑了用户的粉丝数、微博发布或转发数以及用户关注数等,并在建立模型时采用了层次分析法中成对比较阵方法确定权向量。本研究在信息传播、电子商务、网络营销、网络代购等领域有一定的应用价值和借鉴作用。

参考文献:

[1]朱文俊,张宁,聂雨薇.基于图论的微博消息传播对微博影响力的研究[J].现代商业,2015(17)∶267-269.

[2]原福永,冯静,符茜茜.微博用户的影响力指数模型[J].情报分析与研究,2012,220(6)∶60-64.

[3]王琛,陈庶樵.一种改进的微博用户影响力评价算法[J].信息工程大学学报,2013,14(3)∶380-384.

[4]徐俊明.图论及其应用[M].合肥∶中国科学技术大学出版社,1998.

[5]韩中庚.数学建模及其应用[M].北京∶高等教育出版社,2005.

[6]薛山. MATLAB基础教程[M].北京∶清华大学出版社,2011.

【责任编辑:王桂珍foshanwgzh@163.com】

Impact study and modeling of micro-blog users and messages

JIAN Guo-ming,LI Dong-mei,LI Shao-yong,ZHOU Bi-jiang
(School of Mathematics and Information Science,Shaoguan University,Shaoguan 512005,China)

Abstract∶Considering the influence of micro-blog users and micro-blogging news of a micro-blogging group,with micro-blogging users as the vertex,the vertex weighted directed graph model of the relationship between user concerns is established;Through the discussion of the user number of fans,the neighbor set of attention intensity,published or forwarded message factors,the impact factor V is defined,then using the AHP method to determine weight vector method,the influence of micro blogging users model is obtained;the total influence of users of Twitter to be turned,news to be released or forwarding of the number of users and the news was browsing the number of influencing factors are discussed;By determining the weight vectors,the news influence of micro-blogging model is obtained;In addition,the instance data of Nanjing Normal University in 2014 of math modeling contest was verified and solved,and ten big V micro-blogging influential users and the top ten most influential news were obtained.

Key words∶micro-blog;impact factor;the weight;user influence;news influence

中图分类号:G206

文献标志码:A

文章编号:1008-0171(2016)03-0001-04

收稿日期:2016-03-11

基金项目:广东大学生科技创新培育专项资金(pdjh2015b0477);广东省本科高校教学质量与教学改革工程项目(〔2014〕97号)

作者简介:简国明(1958-),男,江西南昌人,韶关学院教授。

猜你喜欢

影响因子微博权重
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
基于个性化的协同过滤图书推荐算法研究
手机阅读平台用户体验影响因子分析
事实与流言的博弈
重大突发事件中微博之力不微
“影响因子”是用来赚大钱的
层次分析法权重的计算:基于Lingo的数学模型
神回复